Da Ski-Rental-Poblem (Voläufige Veion, 15. Mai 212) Pof. D. Hanno Lefmann Fakultät fü Infomatik, TU Chemnitz, D-917 Chemnitz, Gemany lefmann@infomatik.tu-chemnitz.de 1 Da Ski-Rental-Poblem Bei dem Ski-Rental-Poblem SR(1, ) geht e daum, zu einem geeigneten Zeitpunkt zu entcheiden, Ski zu kaufen ode zu leihen, wobei mit 1 de Pei fü da Kaufen von Ski und 1 de Pei fü jede Leihen von Ski it. Da Ziel it, die Geamtkoten, welche gleich de Summe de Einzelkoten ind, zu minimieen. In de online Situation teht man jede Mal bei gegebenen Anfodeungen Ski fahen vo de Entcheidung, die Ski zu leihen ode zu kaufen. Wi nehmen hiebei an, da bei Kauf die Haltbakeitdaue de Ski gleich unendlich it, und man dahe höchten einmal kauft. Die jeweiligen Entcheidungen können im nachhinein nicht meh geändet weden. Zukünftige Anfodeungen Ski fahen ind voab nicht bekannt und diee können jedezeit teminieen. Die Teminieung kann duch einen Gegne beliebig efolgen. In de offline Situation ind alle Anfodeungen Ski fahen voab bekannt. In dieem Fall können bei maligem Ski fahen leicht die optimalen Geamtkoten c opt () angegeben weden. Sei die Geamtzahl de Anfodeungen Ski fahen, o gilt fall c opt () = fall, denn im Fall it e güntige, die Ski imme zu leihen, wähend man im Fall die Ski beim eten Fahen ofot kauft. Da e ich hie um ein Minimieungpoblem handelt, it die Kompetitivität k A (ode auch Güte genannt) eine online Algoithmu A definiet al de maximale (ode Supemum) Quotient (übe alle Anfodeungen Ski fahen ) au den Geamtkoten c A von A und den optimalen Geamtkoten c opt im offline Fall. Wi betachten zunächt folgende online Algoithmen: (i) de Buy-eve-Algoithmu B kauft niemal Ski (ii) de Buy-Alway-Algoithmu BA kauft imme ofot Ski.
Die Kompetitivität k B () de Buy-eve-Algoithmu bei eine Geamtzahl von Anfodeungen Ski fahen efüllt = 1 fall k B () = c B() c opt () = Im chlechten Fall, wenn eh goß it, folgt fall. k B = up {k B ()} = lim =, und die Kompetitivität it dahe extem chlecht. De Buy-Alway-Algoithmu kauft beim eten Mal Ski fahen. Im chlechteten Fall wid danach nie meh Ski gefahen und man ehält fü die Kompetitivität k BA : k BA c BA(1) c opt (1) = 1 <. E wid nun eine untee Schanke fü die Kompetitivität k A jede deteminitichen online Algoithmu A angegeben. Theoem 1. Jede deteminitiche online Algoithmu A fü da Ski-Rental- Poblem SR(1, ) hat eine Kompetitivität von mindeten (2 1/). Bewei. Sei A ein beliebige, deteminitiche online Algoithmu fü da Ski- Rental-Poblem SR(1, ). Wenn de Algoithmu A bee al de Buy-eve- Algoithmu ein möchte, mu e igendwann Ski kaufen, etwa beim ten Mal Ski fahen. Im chlechteten Fall wid danach nie meh Ski gefahen. Fü die Geamtkoten c A () folgt c A () = + ( 1) 1. Fü die optimalen Geamtkoten c opt () im offline Fall gilt fall c opt () = fall und wi ehalten fü die Kompetitivität k A () de Algoithmu A: + 1 fall k A () = c A() c opt () = + 1 fall. Wi betachten die beiden Quotienten ( + 1)/ und ( + 1)/ jeweil al Funktion von. De ete Quotient ( + 1)/ it fü 1 monoton 2
fallend, alo minimal fü =. De zweite Quotient ( + 1)/ it monoton teigend und dahe minimal fü =, und e folgt k A = max {k A ()} + 1 wa nachgewieen weden ollte. = 2 1, Wi geben nun einen deteminitichen online Algoithmu fü da Ski-Rental- Poblem SR(1, ) an, de optimal it. Diee Algoithmu, SUM genannt, kauft genau beim ten Mal Ski fahen. Theoem 2. De Algoithmu SUM hat fü da Ski-Rental-Poblem SR(1, ) eine Kompetitivität von maximal (2 1/). Bewei. Sei die Geamtanzahl de Anfodeungen Ski fahen. Bei dem Algoithmu SUM wid im chlechteten Fall nach einem eventuellen Kauf nie meh Ski gefahen. Fü die Geamtkoten c SUM () von SUM gilt dann fall c SUM () = 2 1 fall. Fü die optimalen Geamtkoten c opt () im offline Fall gilt fall c opt () = fall, da fü beim eten Mal Ski fahen ofot Ski gekauft weden. Fü die Kompetitivität k SUM () de Algoithmu SUM ehalten wi damit = 1 fall k SUM () = c SUM() c opt () = und e folgt k SUM = 2 1/. 2 1 fall, 1.1 Ein andomiiete Algoithmu fü da Ski-Rental-Poblem Im Weiteen betachten wi da Ski-Rental-Poblem SR(1, ) unte Vewendung von Wüfeln fü den Kaufzeitpunkt. Die Entcheidung, Ski zu kaufen, hängt nu von de Summe de Koten voheige Skifahten ab. Wi machen wegen einfachee Beechnungen da Poblem kontinuielich. Ein andomiiete Algoithmu A kann dahe bechieben weden duch eine tetige, monoton teigende Funktion p A : [, ) [, 1] mit p A (x) 1, wobei p A (x) die Wahcheinlichkeit dafü it, da de Algoithmu A Ski gekauft hat, nachdem die Geamtkoten x eeicht haben. Weite wid angenommen, da die Geamtkoten eine monoton teigende Funktion in de Zeit ind. Dahe it eine Folge von Skifahten gegeben duch eine Zahl. 3
Lemma 1. Fü da Ski-Rental-Poblem SR(1, ) ei A ein andomiiete online Algoithmu mit Wahcheinlichkeit p A. Dann gilt fü die ewateten Koten E[c A ()] de Algoithmu A bei Geamtkoten : E[c A ()] = p A () + p A (x) dx. (1) Bewei. Die ewateten Kaufkoten de Ski ind gleich p A () bei Geamtkoten de Skifahten von. Hinzu kommen die ewateten Koten de Leihen = p A (x) dx + p A (x) dx, (1 p A (x)) dx welche (1) liefet. Beipiel: Fü p A (x) = fü alle x [, ) folgt E[c A ()] = und fü p A (x) = 1 fü alle x [, ) egibt ich E[c A ()] = + =. Fü p A (x) = 1/2 fü alle x [, ) folgt E[c A ()] = (/2) + (/2) = (/2) + (/2). Wi betachten nun den andomiieten Algoithmu RAD mit Wahcheinlichkeit e 1 fall e 1 p RAD () = 1 fall. Hiebei it e 2.718. Die Wahl de Wahcheinlichkeit von RAD fällt zunächt einmal vom Himmel. Wenn man ich abe vielleicht an den Phyikunteicht in de Schule einnet, o veucht man dot einen Anatz mit eine e-funktion de At f(x) = A e λx und kontanten (noch zu betimmenden) Weten A > und λ. Da cheint hie auch efolgeich geween zu ein. Theoem 3. Fü da Ski-Rental-Poblem SR(1, ) it die ewatete Kompetitivität E[k RAD ()] bei Geamtkoten de Algoithmu RAD kontant und gleich e e 1 1.58. Betont it hie, da die ewatete Kompetitivität E[k RAD ()] unabhängig von de Anfodeungequenz it. 4
Bewei. Sei R + eine Anfodeungequenz. Fü gilt fü die optimalen Koten c opt () =. ach Lemma 1 gilt fü die ewateten Koten von RAD: E[c RAD ()] = e 1 e 1 + e x 1 e 1 dx = e 1 e 1 + 1 e 1 ( ) e = + 1 e 1 e = e 1. (2) Im Fall gilt c opt () = owie fü die ewateten Koten von RAD nach Lemma 1: ( ccit e x 1 ) E[c RAD ()] = + (1 β) e 1 dx + 1 dx = + 1 ) (( e 1 e 2 ) + (e 1)( ) = + e 2 e 1 + = e. (3) e 1 Fü die ewatete Güte E[k RAD ()] ehalten wi fü : E[k RAD ()] = E[c RAD()] c opt () = e e 1 = e e 1 und fü : E[k RAD ()] = E[c RAD()] c opt () = e e 1 = e e 1. Alo gilt ingeamt E[k RAD ()] = e/(e 1) und dahe it E[k RAD ()] kontant. 5