Peter Garscha
Geschchte, Sherlock Holmes Spel (Defnton) Entelung und Egenschaften von Spelen Modellerungsformen Strategetypen (domnant, ren, gemscht) Nash-Glechgewcht (Defnton, Exstenz) Gefangenendlemma Identfzerung von Nash-Glechgewchten Braess-Paradoxon
John von Neumann, Oskar Morgenstern: 1944: The Theory of Games and Economc Behavor John Forbes Nash Jr.: 1950: Non-Cooperatve Games
Sherlock Holmes fährt mt dem Zug von London nach Dover Sherlock wrd von Prof. Morarty verfolgt Zwschenstopp n Canterbury Was soll Sherlock tun?
Wenn Sherlock n Dover ausstegt, wrd Morarty hn töten also doch n Canterbury ausstegen Das weß aber auch Morarty, der dann n Canterbury lauert also sollte Sherlock doch n Canterbury ausstegen Morarty weß, dass Sherlock weß, usw
Morarty Dover Canterbury Dover 0 1 Holmes Canterbury ½ 0
x Wahrschenlchket, dass Holmes n Dover ausstegt Überlebenschancen: Morarty stegt n DO aus: Morarty stegt n CB aus: y Wahrschenlchket, dass Morarty n Dover ausstegt Holmes Überlebenschance: 2 1 2 1 ) (1 0 x x x = + x x x = + 0 ) (1 1 y x y x x y x y + = + 2 3 2 ) (1 ) 2 1 (
Überlebenschance: U : x + 1 3 y 2 x = U 3 x y 2 = 1 3 2 3 y = U = 1 3
Wenn Sherlock abwecht und Morarty hn durchschaut, könnte sene Überlebenschance snken. Wenn Morarty abwecht, könnte Sherlock das ausnützen und sene Überlebenschance erhöhen. Es hat also kener enen Grund von sener Stratege abzuwechen.
Wrtschaftlche Entschedungen: Olgopole, Kartelle, Externaltäten (externe Effekte we Umweltverschmutzung, etc.) Poltsche Entschedungen: strategsche Entschedungen nnerhalb und zwschen Staaten Sozale Interaktonen: Vertelung öffentlcher Güter
Anzahl der Mtspeler Zu jedem Spelstand st bekannt: wer am Zug st, welche Zugmöglchketen bestehen, auf Bass welcher Informatonen der Speler sene Entschedungen zu treffen hat Für Endpostonen, wer we vel gewonnen hat Be Zufallszügen, we wahrschenlch de möglchen Ergebnsse snd.
Enersets: Spele m herkömmlchen Snn Anderersets: Modellerung von wrtschaftlchen Entschedungsstuatonen als Spel
Kooperatve Spele: De Speler handeln bndende Verträge aus, auf deren Bass se gemensame Strategen entwckeln können. Bespel: Käufer und Verkäufer handeln den Pres enes Gutes oder ener Denstlestung oder en Jont Venture beder Unternehmen aus Bndende Verträge snd möglch
Ncht kooperatve Spele: Aushandeln und Durchsetzen enes bndenden Vertrages snd ncht möglch Bespel: Zwe konkurrerende Unternehmen berückschtgen das wahrschenlche Verhalten der jewels anderen Parte, wenn se den Pres und de Werbestratege zur Eroberung enes Marktantels festsetzen Bndende Verträge snd ncht möglch
Nullsummen-Egenschaft: (Summe der Auszahlungen glech Null, Gewnn des ersten Spelers st der Verlust des zweten Spelers) Perfekte Informaton: (alle vorangegangenen Entschedungen und Stuatonen snd bekannt)
EXTENSIVFORM NORMALFORM
In enem Normalform-Spel entscheden de Agenten (Speler) smultan. En Normalform-Spel besteht aus: Ener Spelermenge Ener Strategemenge für jeden Speler Ene Funkton, de jeder Strategekombnaton enen Auszahlungsvektor zuordnet
Spele n Extensvform können zu Spelen n Normalform übergeführt werden. Möglch: Tc Tac Toe, Ver Gewnnt, etc. Ncht möglch: Schach, Go, etc.
255.168 Spelverläufe (131.181 77.904 46.080) Endeutg: 31.896 Spelverläufe (16.398 9.738 5.760) Erster Speler kann ncht bem ersten Zug verleren Setzt erster Speler n de Mtte, muss zweter Spele n ene Ecke setzen um en Unentscheden zu erzwngen.
Anzahl möglcher Stellungen: ~2,28 10 46 Nach zwe Zügen: 72.084 Stellungen Nach ver Zügen: ~88.869.284.875 (pseudolegal, 755 Sekunden, 117.597.036 nps) 40 Züge: ~10 115 bs 10 120 Spelverläufe (mt 30 möglchen Halbzügen pro Stellung) Aber: Endspeldatenbanken möglch 2012 Unverstät Moskau: Datenbank mt 7 Fguren fertggestellt (ca. 140 Terabyte) Anzahl Atome m Unversum: ~10 84 bs 10 89
De Stratege st en Plan, we sch der Speler n jeder Spelstuaton verhalten wrd. Arten: Domnante und Domnerte Strategen Rene Stratege Gemschte Stratege S möglche Strategen von Speler S - de möglchen Strategen sener Mtspeler
enes Spelers st streng domnant: enes Spelers st schwach domnant: und für mndestens en S s * S s * } \{ ),, ( ), ( * * s S s s s s s > } \{ ),, ( ), ( * * s S s s s s s ) ', ( ) ', ( * s s s s > S s '
Der Speler legt sch dabe auf ene Stratege fest und wendet dese wederholt an. Problemlos für enfache Spele ohne Wederholung (z.b. Münzwurf) Werden Spele wederholt, kann sch Gegenspeler anpassen um senen Gewnn zu maxmeren Daher: gemschte Stratege
Kene drekte Entschedung durch den Speler Wahl ener renen Stratege nach enem Zufallsmechansmus Schere, Sten, Paper jewels mt exakter Wahrschenlchket 1/3 (Erfolg maxmal) Statstsch: Schere mt 29,6 % am seltensten gewählt.
Strategepaar (oder N-Tupel), be dem es sch für kenen Speler auszahlt, ensetg (allene) von sener Stratege abzuwechen Ich mach das Beste, was ch kann, unter Berückschtgung dessen, was du tust. Du Machst, unter Berückschtgung dessen, was ch tue, das Beste, was du kannst.
... Menge der Strategen des -ten Spelers =... : 1 n * * * σ = ( σ1,..., σ n ) Strategeprofl st Nash-Glechgewcht, genau dann wenn: σ : u * * * * * ( σ1,..., σ,..., σ ) u ( σ1,..., σ,..., σ n n ), I
Zwe Gefangene werden verdächtgt, gemensam ene Straftat begangen zu haben bede werden getrennt verhört und können sch ncht beraten Höchststrafe: 6 Jahre Schwegen bede: jewels 2 Jahre (klenere Delkte) Gestehen bede: jewels 4 Jahre (Kooperaton mt Behörde) Gesteht nur ener: 1 Jahr (symbolsche Bewährungsstrafe), der andere de Höchststrafe
B schwegt B gesteht A schwegt (2,2) (6,1) A gesteht (1,6) (4,4)
B schwegt B gesteht A schwegt (2,2) (6,1) A gesteht (1,6) (4,4)
B schwegt B gesteht A schwegt (2,2) (6,1) A gesteht (1,6) (4,4)
B schwegt B gesteht A schwegt (2,2) (6,1) A gesteht (1,6) (4,4)
Ergebns jewels abhängg von der Entschedung des Mtspelers Indvduell: für bede vortelhafter zu gestehen Kollektv: für bede besser zu schwegen (jewels nur 2 Jahre Gefängns) Glechgewcht n domnanten Strategen (gestehen besser, unabhängg was der andere macht)
sehe: Sherlock Holmes 2 Speler mt jewels 2 Handlungsmöglchketen Glechgewcht mt gemschter Stratege be x=1/3 und y=2/3
Voraussetzungen: Auszahlungsfunktonen H ( σ,..., σ ) 1 n snd stetg n σ De Strategemengen 1,..., n snd konvex und kompakt Spel mt gemschten Strategen (mt endlch velen renen Strategen) Bewes: z.b. mt Fxpunktsatz von Kakutan
In renen Strategen: Markere maxmale Auszahlungen für Speler für alle Strategekombnatonen der anderen Speler. Führe vorhergen Schrtt für alle Speler durch. Jene Strategekombnatonen, be denen alle Auszahlungen markert snd, snd Nash- Glechgewchte.
A B C A (2,0) (4,2) (3,5) B (1,6) (5,2) (0,2) C (2,2) (1,4) (1,1)
A B C A (2,0) (4,2) (3,5) B (1,6) (5,2) (0,2) C (2,2) (1,4) (1,1)
4000 Auto Start-A-End: T/100+45 Start-B-End: 45+T/100 Nash-Glechgewcht be T=2000 (=2000/100+45=65)
Annahme: es exstert A-B mt t nahe Null START-A-B-END: T/100+T/100 4000/100+4000/100=80 START-A-END: 4000/100+45=85 START-B-END: 45+4000/100=85