Spieltheorie mit. sozialwissenschaftlichen Anwendungen

Friedel Bolle, Claudia Vogel Spieltheorie mit sozialwissenschaftlichen Anwendungen SS 2010 Simultane Spiele 1. Einführung: Spiele in Normalform Nash-Gleichgewicht Dominanz 2. Typen von Spielen Gefangenendilemma Koordinationsspiele Spiele ohne Gleichgewichte 3. Wege aus dem Gefangenendilemma Strafen Führerschaft 4. Lösungen für Koordinationsspiele Pareto-Verbesserung Risikodominanz Fokale Punkte 2 1

Simultane Spiele In simultanen Spielen wählen die Spieler ihre Strategien, ohne zu wissen, welche Strategie die anderen Spieler gewählt haben. Dies ist der Fall, falls die Spieler gleichzeitig entscheiden. die Spieler nacheinander entscheiden, aber die Züge der vorherigen Spieler nicht beobachten können. Beispiele: Produktentwicklung in der Industrie Wählerentscheidungen Elfmeter In simultanen Spielen kann ein Spieler seine Entscheidungen nicht davon abhängig machen, wie der vor ihm ziehende Spieler entschieden hat. Trotzdem kann er Schlussfolgerungen über die Entscheidungen seines Gegners treffen. 3 Elemente eines Spiels in Normalform Spieler (endlich viele Spieler) Strategien (endlich viele Strategien) Die dem Spieler zur Verfügung stehenden Handlungsalternativen. Da der Spieler nur einmal zieht ist die Auswahl eine Strategie auch ein vollständiger Verhaltensplan. Reine Strategien: Aktionen, die einem Spieler zur Verfügung stehen. Gemischte Strategien: eine Mischung der reinen Strategien. Jede reine Strategie wird mit einer gewissen Wahrscheinlichkeit gewählt. Nutzen der Spieler bei jeder möglichen Kombination von Strategien Darstellung von Spielen mit 2 Spielen als Matrix 4 2

Beispiel eines Spiels in Normalform Links Mitte Rechts Oben 3,1 2,3 10,2 Hoch 4,5 3,0 6,4 Tief 2,2 5,4 12,3 Unten 5,6 4,5 9,7 5 Beste Antworten und Nash-Gleichgewicht Für eine gegebene Strategiewahl seiner Gegner ist eine Strategie eines Spielers dann eine Beste Antwort, wenn es keine andere Strategie gibt, mit der er eine höher Auszahlung erreicht. Definition: Sind die Strategien S j aller m-1 Spieler (j i) festgelegt, dann heißt s j * eine beste Antwort auf s -j =(s 1,,sj -1,s j+1,,s m ), wenn uj(s j *,s-j) u j (s j,s -j ) für alle Strategien s i von Spieler j. Ein Nash-Gleichgewicht ist demnach eine Strategiekombination, die für jeden Spieler eine Strategie festlegt, die eine beste Antwort auf die Strategie seiner Mitspieler ist. Das heißt, eine Strategiekombination (s1*,s2*) ist ein Nash- Gleichgewicht, wenn s 1 * eine beste Antwort auf s 2 * ist und s 2 * eine beste Antwort auf s 1 *. 6 3

Bestimmen des Nash-Gleichgewichts Links Mitte Rechts Oben 3,1 2,3 10,2 Hoch 4,5 3,0 6,4 Tief 2,2 5,4 12,3 Unten 5,6 4,5 9,7 7 Dominante Strategien Eine Strategie X eines Spielers ist strikt dominant, wenn sie für jede mögliche Strategie seines Gegenspielers zu einer höheren Auszahlung führt als eine andere Strategie. Eine strikt dominante Strategie ist immer die beste Antwort für jede Strategiewahl des Gegenspielers. Besitzt in einem Spiel jeder Spieler eine strikt dominante Strategie, so ist das einzige Nash-Gleichgewicht des Spieles die Strategiekombination, in der jeder Spieler seine dominante Strategie wählt. 8 4

Das Gefangenendilemma Ehemann Ehefrau Gestehen Nicht gestehen Gestehen 10yr, 10yr 1yr, 25yr Nicht gestehen 25yr, 1yr 3yr, 3yr 9 Dominierte Strategien Eine Strategie Y eines Spielers ist strikt dominiert, wenn es eine andere Strategie X gibt, die immer zu einer höheren Auszahlung führt als Y. Eine strikt dominierte Strategie ist niemals eine Beste Antwort und kann damit auch niemals Bestandteil eines Nash-Gleichgewichtes sein. Strategien, die nur auf strikt dominierte Strategien eine Beste Antwort sind, können daher auch nicht Bestandteil eines Nash- Gleichgewichts sein. 10 5

Dominanz bei einem Spieler X Y A 3, 4 1, 3 B 4, 1 2, 2 11 Sukzessive Elimination dominierter Strategien Strikt dominierte Strategien können bei der Bestimmung von Nash- Gleichgewichten eliminiert werden. Ein solcher Prozess heißt sukzessive Elimination dominierter Strategien. Der Prozess der sukzessiven Elimination stoppt, wenn keine weiteren dominierten Strategien vorhanden sind. Bleibt dann nur eine einzige Strategiekombination übrig, so wird dieses Nash-Gleichgewicht Dominanzlösung genannt. Besitzt ein Spiel eine Dominanzlösung, so ist diese das einzige Nash-Gleichgewicht des Spiels. 12 6

Beispiel mit Dominanzlösung a b c x 0,1 9,0 2,3 y 5,9 7,3 1,7 z 7,6 10,10 3,5 13 Schwach dominierte Strategien Eine Strategie Y ist schwach dominiert, wenn es eine andere Strategie X gibt, die mindestens so gut ist wie Y, d.h. Strategie X führt zu höheren oder gleichen Auszahlungen wie Strategie Y. Eine Elimination schwach dominierter Strategien kann zu Problemen führen. a b c x 1,2 1,1 1,10 y 1,1 2,1 1,1 z 1,1 10,1 0,0 14 7

Typen von Spielen in Normalform Ein Nash-Gleichgewicht Gefangenendilemma Zwei Nash-Gleichgewichte Reine Koordinationsspiele Kampf der Geschlechter Chicken Spiele ohne Nash-Gleichgewicht 15 Das Gefangenendilemma Ehemann Ehefrau Gestehen Nicht gestehen Gestehen 10yr, 10yr 1yr, 25yr Nicht gestehen 25yr, 1yr 3yr, 3yr 16 8

Reine Koordinationsspiele Harry Sally Hemmingways Central Hemmingways 1,1 0,0 Central 0,0 1,1 Harry Sally Hemmingways Central Hemmingways 1,1 0,0 Central 0,0 2,2 17 Kampf der Geschlechter Harry Sally Hemmingways Central Hemmingways 2,1 0,0 Central 0,0 1,2 18 9

Chicken James ausweichen (Chicken) geradeaus (aggressiv) ausweichen (Chicken) Dean geradeaus (aggressiv) 0, 0-1, 1 1, -1-2, -2 19 Spiele ohne Nash-Gleichgewicht Torwart Schütze Links Rechts Links 1,-1-1,1 Rechts -1,1 1,-1 Besonders in Spielen, in denen die Spieler gegensätzliche Interessen haben, tritt die Nicht-Existenz von Nash-Gleichgewichten auf. Dies ist ein Nullsummenspiel. Die Spieler sollten sich bemühen, unvorhersehbar zu sein. Dies führt zu einer zufälligen Auswahl der Strategien und damit dem Nutzen gemischter Strategien (später!) 20 10

Wege aus dem Gefangenendilemma Betrügen (gestehen) Kooperieren (nicht gestehen) Betrügen (gestehen) 10yr, 10yr 25yr, 1yr Kooperieren (nicht gestehen) 1yr, 25yr 3yr, 3yr Wie kann aus Sicht der Spieler Kooperation sicher gestellt werden? Wiederholung Strafen Führerschaft 21 Strafen für einen Abweichler Wenn ein Spieler betrügt, während der andere kooperiert, kommt dieser früher aus dem Gefängnis frei. Möglicherweise warten aber Freunde des Kooperierenden vor dem Gefängnis... Betrügen (gestehen) Kooperieren (nicht gestehen) Betrügen (gestehen) 10yr, 10yr 25yr, 21yr Kooperieren (nicht gestehen) 21yr, 25yr 3yr, 3yr 22 11

Strafen für jede Abweichung Jedes Abweichen von der kooperativen Strategie wird bestraft. Dafür ist ein starker Dritter notwendig. Betrügen (gestehen) Kooperieren (nicht gestehen) Betrügen (gestehen) 30yr, 30yr 25yr, 21yr Kooperieren (nicht gestehen) 21yr, 25yr 3yr, 3yr 23 Probleme von Strafen Bei Entscheidungen unter Unsicherheit kann man nicht ohne Zweifel sagen, ob Betrügen oder nur Pech die Ursache für das schlechte Ergebnis war. Große Gruppen von Spielern erschwert das Identifizieren des Betrügers. Sozialer oder politischer Druck kann Strafen unterwandern. Anstatt Fehlverhalten zu Betrafen, kann man auch eine Belohnung für Kooperation einführen. Dies führt zu neuen Problemen. 24 12

Führerschaft Situation: Ein Spieler ist sehr groß, der andere ist klein. Durch die unterschiedliche Größe haben die Spieler unterschiedliche Auszahlungen. Bei Nicht-Kooperation entfällt ein großer Teil des Verlustes auf den großen Spieler. Beispiel: Saudi-Arabien in der OPEC Um den hohen Kartellpreis aufrecht zu erhalten, reduziert Saudi- Arabien die eigene Fördermenge, wenn kleine Länder betrügen 25 zwei Länder mit gleicher Bevölkerung Land 1 Beispiel Führerschaft Forschung Land 2 Keine Forschung Forschung -2,-2-2,0 Keine Forschung 0,-2-1,6,-1,6 Land 1 mit größerer Bevölkerung Land 1 Forschung Land 2 Keine Forschung Forschung -2,-2-2,0 Keine Forschung 0,-2-2,4,-0,8 26 13

Lösungen für reine Kooperationsspiele Wie können sich die Spieler auf ein Gleichgewicht koordinieren? Lösungsmöglichkeiten Kommunikation: Können sich Spieler vorher absprechen, so sollte es nicht schwer fallen, sich auf eine Aktion zu einigen und diese auch zu wählen. Evolution und Lernen: Sobald eine der Aktionen überdurchschnittlich populär ist wird sie sich aufgrund ihres Erfolges ausbreiten. Danach gelingt die Koordination besser, Pareto-Verbesserung Risikodominanz Trembling-Hand-Perfektion Focal Points 27 Pareto-Verbesserung Pareto-Verbesserung: Ein Spieler wird durch einen Wechsel besser gestellt, ohne dass der andere dabei schlechter gestellt wird. Pareto-Effizienz: Strategiekombinationen, von denen keine Pareto- Verbesserung mehr möglich ist. Lassen sich die Gleichgewichte in einem Spiel mit Hilfe des Pareto- Kriteriums ordnen, wird dieses Spiel auch geordnete Koordination (ranked coordination) genannt. Ein Nash-Gleichgewicht in dem beide Spieler am besten gestellt sind, heißt pareto-perfekt. 28 14

Beispiel für Pareto-Verbesserung Harry Sally Hemmingways Central Hemmingways 1,1 0,0 Central 0,0 2,2 Ausgehend von (H,H) ist der Übergang zu (C,C) für beide Spieler eine Verbesserung. (C,C) ist pareto-perfekt. 29 Pareto-Verbesserung im Chicken Game James Dean C D C 0, 0-1, 1 D 1, -1-2, -2 Streben beide Spieler das für sie beste Ergebnis an, ist davon auszugehen, dass das schlechteste (D,D) eintritt. Ausgehend von (D,D) ließe sich die Situation für beide verbessern (durch Absprachen oder Verhandlungen), wenn nur einer der beiden C wählt. Der Wechsel von (D,D) zu jeder anderen Kombination wäre eine Pareto-Verbesserung. Jede Kombination außer (D,D) ist pareto-effizient. Da ein Wechsel von diesen immer mindestens einen Spieler schlechter stellt, weichen Sie nach dem Pareto-Kriterium nicht von diesen Strategiekombinationen ab. 30 15

Einwände gegen Pareto-Verbesserung A B A 1,1-1,-1 B -1 000 000,-1 2,2 Die Struktur des obigen Spiels ist die gleiche wie vorher und das Gleichgewicht (B,B) ist pareto-perfekt. Aus psychologischer Sicht scheint es für jedoch zweifelhaft B zu wählen. 31 Risikodominanz A B A 9,9 0,8 B 8,0 7,7 Das Gleichgewicht (A,A) ist pareto-perfekt. Allerdings ist es für beide Spieler weniger gefährlich (B,B) zu spielen. Dieses Gleichgewicht ist gegenüber (A,A) risikodominant. 32 16

Trembling-Hand-Perfektion A B A 0,100 0,100 B -10,-10 40,40 Trembling-Hand-Perfektion zeigt, wie robust ein Gleichgewicht gegenüber Fehlern des anderen Spielers bei der Strategiewahl ist. Jede Strategie, die in einem Trembling-Hand-perfekten Gleichgewicht gespielt wird, ist nicht dominiert. Trembling-Hand-perfekte Gleichgewichte sind nicht grundsätzlich eindeutig. 33 Fokaler Punkt Harry Sally Hemmingways Central Hemmingways 1,1 0,0 Central 0,0 2,2 Konzept von Thomas Schelling (1960) in The Strategy of Conflict Ein fokaler Punkt (focal point) ist ein Gleichgewicht, dass allen Spielern natürlich oder logisch erscheint. Spieler mit gleichem gesellschaftlichen und kulturellem Hintergrund haben eine größere Chance einen gemeinsamen fokalen Punkt zu finden. Anwendungsbeispiele: das beste Ergebnis, das sicherste Ergebnis, das fairste Ergebnis 34 17