5 Wiederholte Spiele. 5.1 Einleitung. Literaturhinweise zu Kapitel 5:

Ähnliche Dokumente
4. Wiederholte Spiele

4. Wiederholte Spiele

Spieltheorie Übungsblatt 5

Spieltheorie Teil 6. Tone Arnold. Universität des Saarlandes. 25. März 2008

In vielen Situation interagieren Spieler wiederholt: Interaktion innerhalb von Organisationen und Gruppen

Wiederholte Spiele. Grundlegende Konzepte. Zwei wichtige Gründe, wiederholte Spiele zu betrachten: 1. Wiederholte Interaktionen in der Realität.

Kapitel 7: Multistufenspiele und Wiederholte Spiele. Literatur: Tadelis Chapters 9, 10 und 11

Verfeinerungen des Bayesianischen Nash Gleichgewichts

6. Dynamische Spiele mit unvollständiger Information

Klausur zur Vorlesung Spieltheorie Musterlösung

Mikroökonomik B 4.3 Wiederholte Spiele

Spieltheorie Teil 4. Tone Arnold. Universität des Saarlandes. 20. März 2008

Klausur zur Vorlesung Spieltheorie

Spieltheorie - Wiederholte Spiele

Industrieökonomik II Wintersemester 2007/08 1. Industrieökonomik II. Prof. Dr. Ulrich Schwalbe. Wintersemester 2007/ 2008

Kapitel 14: Wiederholte Spiele. Beispiel: Zweimal gespieltes GD Basisspiel: (C = Cooperate, D = Defect) GD C D C 2, 2 0, 3

Kapitel 11. Wiederholte Spiele. Einleitung. Übersicht 2. Einleitung 6

Spieltheorie. Winter 2013/14. Professor Dezsö Szalay. Dynamische Spiele werden sehr schnell zu komplex um sie zu analysieren.

6. Wiederholte Spiele

3.9 Wiederholte Spiele

Spiele mit simultanen und sequentiellen Spielzügen

Kapitel 6: Spiele mit simultanen und sequentiellen Spielzügen. Kapitel 6 1

Klausur zur Vorlesung Spieltheorie

AVWL I (Mikro) 5-31 Prof. Dr. K. Schmidt Spieler 1 Oben Unten Spieler 2 Links Rechts 1, 3 0, 1 2, 1 1, 0 Figur 5.4: Auszahlungsmatrix eines Spiels Wen

Klausur zur Spieltheorie Musterlösung

Perfekte und vollständige Information

KAP 10. Teilspiele und Teilspielperfektheit (vollk. Info)

4 Mengenwettbewerb und Kapazitätsschranken. 4.1 Simultaner Mengenwettbewerb. Augustin Cournot (1838)

Spieltheorie. Winter 2013/14. Professor Dezsö Szalay. 2. Dynamische Spiele mit vollständiger Information

Dynamische Spiele mit unvollständiger Information. Perfektes Bayesianisches Gleichgewicht

Klausur Mikroökonomik II. Wichtige Hinweise

Lösungshinweise zu den zusätzlichen Übungsaufgaben

3. Dynamische Spiele mit vollständiger Information

Statische Spiele mit unvollständiger Information: Bayesianische-Spiele

Anwendungen der Spieltheorie

3 Dynamische Spiele mit vollständiger Information. 3.1 Rückwärtsinduktion. Literaturhinweise zu Kapitel 3:

KAP 11. Teilspiele und Teilspielperfektheit (unvollk. Info)

5. Statische Spiele mit unvollständiger Information

Vorlesung: Nicht-kooperative Spieltheorie. Teil 2: Spiele in Normalform

Kleines Lexikon der Begriffe*

bzw. die Entscheidugen anderer Spieler (teilweise) beobachten Erweitert das Analysespektrum erheblich Beschreibung des Spiels (extensive Form)

Klausur Mikroökonomik II. Wichtige Hinweise

Teil 1: Statische Spiele mit vollständigen Informationen

Mikroökonomik B (Bachelor) Prüfung vom

Strategische Asymmetrien Stackelberg-Modelle und Markteintritt

Spieltheorie mit. sozialwissenschaftlichen Anwendungen

Grundlagen und Nash Gleichgewichte in reinen Strategien

Musterlösung zur Einsendearbeit zum Kurs Preisbildung auf unvollkommenen Märkten und allgemeines Gleichgewicht, Kurseinheit 1

7 Dynamische Spiele mit unvollständiger Information. 7.1 Einleitung. Literaturhinweise zu Kapitel 7:

Periode nicht (R, R) spielen. (40 Punkte)... (26 Punkte) (23 Punkte) 16a: (R; L) 16b: (L; R) 16d: (R; L, L) 16e: (L; R, L)

Probleme bei reinen Strategien. Nash Gleichgewichte in gemischten Strategien Kopf 1, 1 1, 1 Zahl 1, 1 1, 1. Gemischte Strategien

Aufgaben zur Veranstaltung Grundzüge der Spieltheorie von Prof. Dr. Stefan Winter, Ruhr-Universität Bochum.

Mikroökonomik B (Bachelor) Probeklausur

Stimmt das immer und in welchem Sinne?

Mikroökonomik B (Bachelor) Prüfung vom

In Spielen unter unvollkommener Information... Wir werden deshalb ein neues GG-Konzept einführen. Pefektes Bayesianisches Nash-Gleichgewicht

4. Oligopole. 4.1 Cournot-Oligopol

Kapitel 6: Glaubwürdigkeit und Sequentielle Rationalität

9.4Teilspiel-perfekteGleichgewichte

5. Wiederholte Interaktion (Wiederholte Spiele Superspiele)

Glaubwürdigkeit und Geldpolitik

Skript zur Vorlesung Mikroökonomik II (WS 2009) Teil 4

Genauer gesagt handelt es sich zum einen um Spiele mit einseitiger unvollständiger Information.

Kapitel 4: Gemischte Strategien. Literatur: Tadelis Chapter 6

Kapitel 13. Evolutionäre Spieltheorie. Einleitung. Evolutionäre Biologie. Übersicht 2. Alternative: Biologische Evolutionstheorie

Kapitel 13. Evolutionäre Spieltheorie. Einleitung. Evolutionäre Biologie. Übersicht 2. Alternative: Biologische Evolutionstheorie

D Spieltheorie und oligopolistische Märkte

9.3Nash-Gleichgewicht

Nicht-kooperative Spiele

Die Präferenzen der Konsumentin Kerstin über den Konsum zweier Güter (Gut 1 und Gut 2) sind durch folgende Nutzenfunktion darstellbar: U ( x 1, x 2

Mikroökonomik B (Bachelor) Prüfung vom

2. Grundzüge der Mikroökonomik Einführung in die Spieltheorie. Allgemeine Volkswirtschaftslehre. WiMa und andere (AVWL I) WS 2007/08

Seminar Algorithmische Spieltheorie

Spieltheorie mit. sozialwissenschaftlichen Anwendungen

Bisher angenommen: jeder Spieler kennt alle Teile des Spiels. - Diskontfaktor des Verhandlungspartners

Skript zur Vorlesung Mikroökonomik II (WS 2009) Teil 3

Beispiel für stabile Spielausgänge. Kapitel 5: Nash-Gleichgewicht. Anna Theater Fußball

Wie verhalte ich mich bei einem Verhör und einer Mutprobe richtig?

Seminararbeit zur Spieltheorie. Thema: Rationalisierbarkeit und Wissen

3. Sequentielle Spiele mit vollständiger Information: Die Extensivform

Algorithmische Spieltheorie. Martin Gairing

Statische Spiele mit vollständiger Information

3.5 Mehrstufige Spiele und Teilspiel-perfektes Gleichgewicht

Mikroökonomische Theorie

Ablauf. 1 Imitationsdynamik. 2 Monotone Auszahlung. 3 Entscheidung gegen iterativ dominierte Strategien. 4 Beste-Antwort-Dynamik 2 / 26

Kapitel 12. Kollektives Handeln. Einleitung. Übersicht 2. Einleitung 6

Wettbewerbstheorie und -politik 8-1 Dr. Florian Englmaier. 8 Preisabsprachen

Mikroökonomik B Teil II: Spieltheorie

Wörterbuch für Fremdsprachige Einfacher Taschenrechner

2. Statische Spiele mit vollständiger Information

2. Statische Spiele mit vollständiger Information

Fachbereich 10 Institut für Wirtschaftswissenschaften Professur für Volkswirtschaftslehre. Spieltheorie. Prof. Dr. Gernot Sieg.

Vermietendes versus verkaufendes Monopol

IÖ Übungsaufgaben: Lösungen

IV. Spieltheoretisches Repetitorium

Übersicht: 6.1 Einleitung 6.2 Klassische Theorie nichtkooperativer Spiele 6.3 Egoistisches Routing 6.4 Mechanismen-Entwurf 6.

KAP 1. Normalform Definition Ein Spiel G in Normalform (auch: Strategieform) besteht aus den folgenden 3 Elementen:

Transkript:

Spieltheorie (Winter 2009/10) 5-1 Prof. Dr. Ana B. Ania 5 Wiederholte Spiele Literaturhinweise zu Kapitel 5: Osborne (2004), Kapitel 14 Gibbons (1992), Kapitel 2 Fudenberg und Tirole (1991), Kapitel 5 5.1 Einleitung Sei G ein beliebiges endliches Spiel in Normalform oder in extensiver Form. Dann ist G T ein Spiel in extensiver Form, in dem das Stufenspiel G T -mal hintereinander gespielt wird, T IN { }, und in dem alle Spieler zu Beginn jeder Periode die gesamte bisherige Geschichte des Spiels kennen. Beispiele: Zwei Spieler spielen mehrfach hintereinander das Gefangenendilemma. N Oligopolisten stehen sich über viele Perioden in einem Cournot-Spiel gegenüber. Zentralbank setzt in jeder Periode die Geldmenge, etc. Klaus M. Schmidt 2007

Spieltheorie (Winter 2009/10) 5-2 Prof. Dr. Ana B. Ania Bemerkungen: 1) Wiederholte Spiele sind eigentlich nur ein Spezialfall von dynamischen Spielen. 2) Sie haben jedoch einige interessante Eigenschaften, die für allgemeine dynamische Spiele nicht gelten. 3) Wiederholte Spiele haben sowohl in der Theorie als auch in den Anwendungen sehr viel Aufmerksamkeit gefunden. 4) Vorsicht die folgenden Spiele sind keine wiederholten Spiele: Rubinsteins Verhandlungsspiel. Wiederholte Spiele mit sich verändernden Zustandsvariablen, z.b. Oligopolspiel mit Nachfrageträgheit, Ressourcen-Extrahierungsspiel, Investitionsspiele, etc. Solche Spiele werden auch stochastische Spiele genannt.

Spieltheorie (Winter 2009/10) 5-3 Prof. Dr. Ana B. Ania 5.2 Endlich oft wiederholte Spiele Angenommen, das Gefangenendilemma wird von 2 Spielern zweimal hintereinander gespielt. l Spieler 2 r Spieler 1 L R 1, 1 5, 0 0, 5 4, 4 Abb. 5.1: Das Gefangenendilemma Die Auszahlungen der Spieler sind einfach die Summe der Auszahlungen in den beiden Spielen. Analyse des Spiels Stufe 2: Egal was in der 1. Stufe passiert ist, das Gefangenendilemma der zweiten Stufe hat ein eindeutiges Nash- Gleichgewicht: (L, l) Daraus folgt: In jedem teilspielperfekten Nash-Gleichgewicht muss in der zweiten Stufe (L, l) gespielt werden.

Spieltheorie (Winter 2009/10) 5-4 Prof. Dr. Ana B. Ania Stufe 1: Was in dieser Stufe passiert, hat keinen Einfluss auf das Spiel in der zweiten Stufe. Wir können einfach die Auszahlung (1,1) aus der zweiten Stufe zu denen der ersten Stufe addieren. l Spieler 2 r Spieler 1 L R 2, 2 6, 1 1, 6 5, 5 Abb. 5.2: Reduzierte Normalform des wiederholten Gefangenendilemmas Fazit: Auf Stufe 1 sollten beide Spieler links spielen. Das einzige TPGG ist somit, dass beide Spieler in beiden Stufen links wählen: GG-Strategie von Spieler 1: (L 1,L 2 L 2 L 2 L 2 ) GG-Strategie von Spieler 2: (l 1,l 2 l 2 l 2 l 2 )

Spieltheorie (Winter 2009/10) 5-5 Prof. Dr. Ana B. Ania Satz 5.1 Wenn das Stufenspiel G ein eindeutiges Nash-Gleichgewicht hat, dann hat das endlich oft wiederholte Spiel G T, T<, ein eindeutiges teilspielperfektes Gleichgewicht, nämlich die T -fache Wiederholung des Nash-Gleichgewichts unabhängig von der Geschichte des Spiels. Beweis: Folgt unmittelbar aus den Prinzipien der Teilspielperfektheit und der Rückwärtsinduktion, ganz analog zum Gefangenendilemma oben. Q.E.D. Übungsaufgabe: Zeigen Sie, dass im zweimal wiederholten Gefangenendilemma auch das einzige Nash-Gleichgewicht darin besteht, dass beide Parteien in beiden Perioden links spielen.

Spieltheorie (Winter 2009/10) 5-6 Prof. Dr. Ana B. Ania Betrachte jetzt die zweifache Wiederholung des folgenden Spiels: 1 L 2 l m r 1, 1 5, 0 0, 0 M R 0, 5 4, 4 0, 0 0, 0 0, 0 3, 3 Abb. 5.3: Multiple Nash-Gleichgewichte im Stufenspiel Frage: Wieviele reine Strategien hat jeder Spieler im zweifach wiederholten Spiel? Dieses Stufenspiel hat zwei Nash-Gleichgewichte in reinen Strategien: (L, l) und (R, r). Satz 5.2 Wenn in jeder Periode unabhängig von der Geschichte des wiederholten Spiels dasselbe Nash- Gleichgewicht des Stufenspiels gespielt wird, liegt ein teilspielperfektes Gleichgewicht vor.

Spieltheorie (Winter 2009/10) 5-7 Prof. Dr. Ana B. Ania Beweis: Teilspielperfektheit verlangt, dass die Strategien für jedes Teilspiel ein Nash-Gleichgewicht bilden. In der letzten Stufe ist das bei den betrachteten Strategien offenbar der Fall. Da das Ergebnis der vorletzten Stufe keine Auswirkung auf das Spiel in der letzten Stufe hat, liegt auch im Teilspiel ab der vorletzten Periode ein Nash-GG vor, usw. Q.E.D. Fazit: Die Wiederholungen der Nash-Gleichgewichte (L, l) bzw. (R, r) sind TPGG. Aber: Es gibt noch weitere TPGG. Beispiel: Periode 1: Beide Spieler spielen (M,m). Periode 2: - Wenn beide Spieler diese Aktionen in Periode 1 gewählt haben, wird in Periode 2 (R, r) gespielt. - Wenn wenigstens einer der beiden Spieler von diesen Aktionen abgewichen ist, wird in Periode 2 (L, l) gespielt. Bemerkungen: Dieses Gleichgewicht führt zur Auszahlung (7, 7), die höher ist als die Auszahlung (6, 6) bei der zweifachen Wiederholung von (R, r).

Spieltheorie (Winter 2009/10) 5-8 Prof. Dr. Ana B. Ania In diesem Gleichgewicht wird Kooperation in der ersten Stufe durch die Drohung gestützt, nach einer Abweichung das schlechte Gleichgewicht (L, l) zu spielen. Die Drohung ist teilspielperfekt, aber ist sie wirklich glaubwürdig? Was würde passieren, wenn die Spieler zu Beginn jeder Runde kommunizieren könnten? Nachverhandlungen! Betrachte folgendes Spiel: 1 L M R P 2 l m r p q 1, 1 5, 0 0, 0 0, 0 0, 0 0, 5 4, 4 0, 0 0, 0 0, 0 0, 0 0, 0 3, 3 0, 0 0, 0 0, 0 0, 0 0, 0 4, 1 2 0, 0 Q 0, 0 0, 0 0, 0 0, 0 1 2,4 Abb. 5.4: Nachverhandlungssichere Bestrafungen Dieses Spiel hat vier Nash-Gleichgewichte: (L, l), (R, r), (P, p) und (Q, q).

Spieltheorie (Winter 2009/10) 5-9 Prof. Dr. Ana B. Ania Betrachte das folgende TPGG: Periode 1: Beide Spieler spielen (M,m). Periode 2: - Wenn in Periode 1 (M,m) gespielt wurde, wird (R, r) gespielt. - Wenn Spieler 1 in Periode 1 abgewichen ist, wird (Q, q) gespielt. - Wenn Spieler 2 in Periode 1 abgewichen ist, wird (P, p) gespielt. - Wenn beide Spieler in Periode 1 abgewichen sind, wird (R, r) gespielt. Bemerkungen: 1) Dieses Gleichgewicht ist nachverhandlungssicher, weil die Drohgleichgewichte in Periode 2 Pareto-effizient sind. 2) Für eine ausführliche Diskussion nachverhandlungssicherer Gleichgewichte siehe z.b. Fudenberg und Tirole (1991, S. 174ff). 3) Was gespielt wird, wenn beide Spieler abgewichen sind, ist ganz egal. Allgemein gilt: Wenn wir sehen wollen, ob ein TPGG vorliegt, müssen wir nur prüfen, ob unilaterale Abweichungen profitabel sind.

Spieltheorie (Winter 2009/10) 5-10 Prof. Dr. Ana B. Ania 5.3 Unendlich oft wiederholte Spiele In vielen endlich oft wiederholten Spielen spielt der last period effect eine wichtige Rolle. Wenn klar ist, was in der letzten Runde passiert, ist auch klar, was in der vorletzten Runde passiert, usw. Deshalb ist z.b. in jedem endlich oft wiederholten Gefangenendilemma das einzige Gleichgewicht, nie zu kooperieren, in jedem endlich oft wiederholten Bertrand-Spiel, Preis gleich Grenzkosten zu setzen, usw. Experimente haben gezeigt, dass last period effects in den letzten Perioden tatsächlich eine wichtige Rolle spielen, nicht aber in den ersten Perioden eines oft wiederholten Spiels. (Beispiel: Axelrod-Experimente) Am Anfang einer wiederholten Beziehung wird tatsächliches Verhalten besser durch ein unendlich oft wiederholtes Spiel beschrieben, auch wenn es im wörtlichen Sinne natürlich keine unendlich oft wiederholten Spiele gibt. Auszahlungen Es macht keinen Sinn, anzunehmen, dass jeder Spieler die Summe seiner Auszahlungen maximiert. Darum nehmen wir an, dass jeder Spieler den Gegenwartswert seiner abdiskontierten Auszahlungen maximiert. Außerdem werden wir die Auszahlungen durch Multiplikation mit (1 δ) so normalisieren, dass wir die Auszahlungen des wiederholten Spiels

Spieltheorie (Winter 2009/10) 5-11 Prof. Dr. Ana B. Ania direkt mit denen des Stufenspiels vergleichen können. Definition 5.1 Ein unendlich oft wiederholtes Stufenspiel G mit Diskontierungsfaktor δ wird G (δ) genannt. Die Auszahlung eines Spielers i in G (δ) ist gegeben durch v i = (1 δ) t=1 δt 1 u i (a t i,a t i). Beispiel: Wenn Spieler i in jeder Runde die Auszahlung 4 bekommt, ist seine Auszahlung im wiederholten Spiel v i =(1 δ) 1 t=1 δt 1 4=(1 δ) 1 δ 4=4. Satz 5.3 Wenn δ hinreichend groß ist, existiert im unendlich oft wiederholten Gefangenendilemma ein TPGG, in dem beide Spieler entlang des Gleichgewichtspfades in allen Perioden kooperieren. Beweis: Betrachte das folgende symmetrische Paar von Strategien für Spieler i und j: Spiele Kooperation in Periode 1 und in allen folgenden Perioden, solange beide Spieler in allen Vorperioden kooperiert haben. Sobald wenigstens einer der beiden Spieler einmal Verrat gespielt hat, spiele immer Verrat.

Spieltheorie (Winter 2009/10) 5-12 Prof. Dr. Ana B. Ania Wir nehmen zur Illustration die Auszahlungen aus Abb. 5.1: Wenn beide Spieler sich an diese Strategie halten, erhält jeder die Auszahlung (1 δ) 1 t=1 δt 1 4=(1 δ) 1 δ 4=4. Wenn ein Spieler in einer Runde als erster abweicht, ist seine Restauszahlung (einschließlich dieser Runde) maximal (1 δ) 5+ =(1 δ) 5+ δ =5 4δ. t=2 δt 1 1 1 δ Eine solche Abweichung lohnt sich also nur, falls 4 < 5 4δ δ< 1 4. Für δ 1 4 bilden die obigen Strategien daher ein Nash-GG. Wir müssen noch zeigen, dass dieses Gleichgewicht auch teilspielperfekt ist. Wir haben bereits gezeigt, dass eine Abweichung nach einer Geschichte, in der alle Spieler immer kooperiert haben, sich nicht lohnt, wenn δ 1 4. Eine einmalige Abweichung kann sich aber auch nicht lohnen, wenn wenigstens einer der Spieler in der Vergangenheit

Spieltheorie (Winter 2009/10) 5-13 Prof. Dr. Ana B. Ania schon einmal verraten hat, weil die obigen Strategien danach immer das statische Nash- Gleichgewicht vorschreiben. Also bilden diese Strategien ein TPGG. Bemerkungen: Q.E.D. 1) Diese Strategien heißen Grim Strategien oder Trigger Strategien. Sie haben den Nachteil, dass mögliche Fehler der Spieler eine Katastrophe auslösen ( doomsday machines ). 2) Kooperation kann aber auch mit anderen Bestrafungsstrategien als TPGG gestützt werden, z.b. mit Perfect Tit-for-tat ( Wie Du mir, so ich Dir ): Spiele Kooperation in Periode 1 und immer dann, wenn das Ergebnis in der etzten Periode ( Kooperation, Kooperation ) oder ( Verrat, Verrat ) war. Spiele Verrat, falls das Ergebnis in der letzten Periode ( Verrat, Kooperation ) oder ( Kooperation, Verrat ) war. Übungsaufgabe: Zeigen Sie, dass Perfect Tit-fortat von beiden Spielern tatsächlich ein TPGG ist, falls δ groß genug ist. Benutzen Sie das Einmal-Abweichungsprinzip. (Sie müssen 4 Fälle überprüfen.)

Spieltheorie (Winter 2009/10) 5-14 Prof. Dr. Ana B. Ania 5.4 Folk-Theoreme Folk-Theoreme sagen, dass fast alle Auszahlungsvektoren in einem wiederholten Spiel als Gleichgewichtsauszahlung gestützt werden können, wenn die Spieler hinreichend geduldig sind. Es gibt Folk-Theoreme für verschiedene Gleichgewichtskonzepte (Nash-Gleichgewichte, TPGG, Bayesianische Gleichgewichte, etc.) und für verschiedene Typen von Spielen (vollständige oder unvollständige Information, endlich oder unendlich oft wiederholt, etc.) Wir brauchen zunächst etwas Notation. Sei a i A i eine reine Strategie (Aktion) von Spieler i im Stufenspiel, a i A i ein Strategienprofil seiner Gegenspieler und a =(a 1,...,a n ) A = A 1... A n.entsprechend sei α i eine gemischte Strategie von Spieler i im Stufenspiel. Schließlich sei u i (a i,a i ) die Auszahlung von Spieler i im Stufenspiel, und u(a) das Auszahlungprofil. Definition 5.2 Ein Auszahlungsvektor x ist erreichbar (feasible), wenn es eine Wahrscheinlichkeitsverteilung p über die möglichen reinen Strategientupel des Stufenspiels gibt, die diesen Auszahlungsvektor

Spieltheorie (Winter 2009/10) 5-15 Prof. Dr. Ana B. Ania generiert: x = a A p(a) u(a). Beispiel: L R l r 2 1 0 0 0 0 1 2 g 2 2 1 1 2 g 1 Abb. 5.5: Erreichbare Payoffs im Kampf der Geschlechter Die Menge der erreichbaren Payoffs ist also einfach die konvexe Hülle der Auszahlungsvektoren aller reinen Strategienkombinationen des Stufenspiels. Es gibt zwei Möglichkeiten, wie ein erreichbarer Auszahlungsvektor tatsächlich erreicht werden kann. 1) Öffentliche Randomisierung: Die Spieler koordinieren ihr Verhalten mit einen öffentlichen Zufallsgenerator, der es ihnen erlaubt, jeden reinen Strategienvektor mit exakt der gewünschten Wahrscheinlichkeit zu spielen. 2) Die Spieler spielen die reinen Strategienvektoren abwechselnd entsprechend einer Frequenz, die die benötigte

Spieltheorie (Winter 2009/10) 5-16 Prof. Dr. Ana B. Ania Wahrscheinlichkeitsverteilung so gut wie möglich approximiert. Wenn die Spieler hinreichend geduldig sind, können sie sich so jedem erreichbaren Auszahlungsvektor beliebig nahe annähern. Damit wir uns mit diesen etwas umständlichen Methoden nicht weiter herumschlagen müssen, werden wir im folgenden zur Vereinfachung annehmen, dass für jeden beliebigen Auszahlungsvektor x ein Profil von(reinen)aktionen a im Stufenspiel existiert, das genau diesen Auszahlungsvektor x generiert: u(a) =x. Satz 5.4 (Friedman, 1971) Sei G ein endliches Spiel mit vollständiger Information. Sei a ein Nash- Gleichgewicht von G mit Auszahlungsvektor u, und ˆx ein erreichbarer Auszahlungsvektor mit der Eigenschaft, dass ˆx i >u i für alle i {1,...,n}. Falls δ nahe genug bei 1 liegt, existiert ein teilspielperfektes Gleichgewicht in G (δ) mit durchschnittlichem Auszahlungsvektor ˆx. Beispiele: Wiederholtes Gefangenendilemma, wiederholtes Cournot-Spiel.

Spieltheorie (Winter 2009/10) 5-17 Prof. Dr. Ana B. Ania Beweis: Wir argumentieren genau wie oben beim wiederholten Gefangenendilemma. Angenommen, es existiert ein Strategienvektor â, der den Auszahlungsvektor ˆx generiert. Betrachte die folgenden Strategien für Spieler i =1,...,n: Beginne mit â i in Periode 1. Spiele â i auch in allen folgenden Perioden, solange alle übrigen Spieler â i gespielt haben. Wenn in der Vergangenheit irgendein Spieler j {1,...,n} zu irgendeinem Zeitpunkt nicht â j gespielt hat, spiele a i für immer. Diese Strategien sind sicherlich teilspielperfekt, sobald ein Bestrafungspfad erreicht wurde. Sind sie auch optimal, solange noch kein Spieler abgewichen ist? Wenn Spieler i abweicht, macht er in der betreffenden Runde maximal einen Abweichungsgewinn in Höhe von d i =max{u a i (a i, â i )} u i (â i, â i )=max{u i a i (a i, â i } ˆx i. i In allen Folgeperioden erhält er u i. Also wird Spieler i keinen Anreiz zum Abweichen habenn, falls ˆx i (1 δ)(d i + x i )+δu i. Da ˆx i >u i,existierteinδ i < 1, so dass diese Ungleichung für δ δ i gilt. Damit liegt ein TPGG vor, wenn δ max i δ i. Q.E.D.

Spieltheorie (Winter 2009/10) 5-18 Prof. Dr. Ana B. Ania Interpretation des Folk-Theorems 1) Das Folk-Theorem zeigt, dass der empirische Gehalt der Theorie wiederholter Spiele sehr klein ist. Fast alles kann als Ergebnis eines TPGG erklärt werden. 2) Gleichgewichte eines wiederholten Spiels können als implizite (selbstdurchsetzende) Verträge interpretiert werden. Die Spieler können vor Beginn des Spiels darüber kommunizieren, welches Gleichgewicht sie spielen wollen. Folk-Theoreme zeigen, dass eine Fülle von Verhaltensweisen durch implizite Verträgegestützt werden können. Zusätzliche Annahmen sind erforderlich, um zu erklären, worauf sie sich einigen werden. 3) An den Folk-Theoremen sind vielmals die erreichbaren Auszahlungen selbst weniger interessant als das diese stützende Gerüst von Strafen und (bei teilspielperfekten Gleichgewichten im allgemeinen benötigten) Belohnungen. Wir wollen jetzt zeigen, dass das Folk-Theorem von Friedman noch weiter verallgemeinert werden kann. Dazu müssen wir zunächst die Minmax-Auszahlung von Spieler i definieren.

Spieltheorie (Winter 2009/10) 5-19 Prof. Dr. Ana B. Ania Definition 5.3 Die Minmax-Auszahlung von Spieler i ist definiert durch u i = min a max u i a i (a i,a i ). i In Worten: u i ist die niedrigste Auszahlung, die Spieler i erhalten kann, wenn er die gewählten Aktionen a i seiner Gegenspieler beobachten und optimal auf sie reagieren kann und alle anderen Spieler gemeinsam versuchen, seine Auszahlung zu minimieren. Kurz gesagt: Dies ist die niedrigste Auszahlung, auf die Spieler i von den anderen Spielern { i} herabgedrückt werden kann, wenn Spieler i eine beste Antwort spielt. Beispiele: Minmax-Auszahlungen im Gefangenendilemma, im Cournot-Spiel. Satz 5.5 In jedem Nash-Gleichgewicht des Stufenspiels wie auch des wiederholten Spiels muss Spieler i wenigstens seine Minmax-Auszahlung u i bekommen. Beweis: In einem Nash-GG des Stufenspiels weiß Spieler i, welches Strategientupel a i seine Gegenspieler spielen werden (konsistente Erwartungen). Da er eine beste Antwort dagegen spielt, muss er wenigsten u i bekommen.

Spieltheorie (Winter 2009/10) 5-20 Prof. Dr. Ana B. Ania Im wiederholten Spiel ist die Argumentation etwas komplizierter. Wieder kennt Spieler i in jeder Periode das Verhalten seiner Gegenüber. Eine mögliche (wenn auch nicht notwendigerweise optimale) Strategie ist, in jeder Periode eine kurzfristig beste Antwort gegen die Aktionen dieser Periode zu spielen. Das muss ihm wenigsten u i in jeder Periode garantieren. Also kann er nicht weniger bekommen, wenn er eine langfristig beste Antwort spielt. Q.E.D. Ein Auszahlungsvektor, der jedem Spieler echt mehr als seine Minmax-Auszahlung gibt, wird individuell rational (individually rational) genannt. Der folgende Satz ist das eigentliche Folk-Theorem aus den fünfziger Jahren, das keinem Autoren mehr eindeutig zugeordnet werden kann. Satz 5.6 (Folk-Theorem) SeiG ein endliches Spiel mit vollständiger Information. Sei ˆx ein erreichbarer und individuell rationaler Auszahlungsvektor. Wenn δ nahe genug bei 1 liegt, existiert ein Nash-Gleichgewicht in G (δ) mit Auszahlungsvektor ˆx. Beispiel: Wiederholtes Cournot-Spiel.

Spieltheorie (Winter 2009/10) 5-21 Prof. Dr. Ana B. Ania Beweis: Wir nehmen wieder an, dass ein Vektor von Aktionen a existiert, der den Auszahlungsvektor ˆx generiert. Betrachte die folgenden Strategien für Spieler i {1,...,n}: Spiele a i in Periode 1. Spiele a i auch in allen folgenden Perioden, so lange kein Spieler von dem Strategienvektor a abgewichen ist. Sollte ein Spieler j von a abweichen, wird dieser Spieler von allen übrigen Spielern für alle Zeiten geminmaxt. Spieler i hat keinen Anreiz abzuweichen, falls ˆx i (1 δ)(d i +ˆx i )+δu i. Da ˆx i >u i,existierteinδ i < 1, so dass diese Bedingung für alle δ δ i erfüllt ist. Für δ max i δ i liegt somit ein Nash-GG vor. Q.E.D. Beachten Sie, dass die minmax-drohung im allgemeinen unglaubwürdig ist, das obige Nash-GG also kein TPGG bildet. Umso überaschender ist das folgende Folk-Theorem: Satz 5.7 (Fudenberg-Maskin, 1986) Sei G ein endliches Zwei-Personen-Spiel mit vollständiger Information. Sei ˆx ein erreichbarer und individuell rationaler Auszahlungsvektor. Falls δ nahe genug bei 1 liegt, existiert ein teilspielperfektes Gleichgewicht in G (δ) mit Auszahlungsvektor ˆx. Beispiel: Wiederholtes Cournot-Spiel.

Spieltheorie (Winter 2009/10) 5-22 Prof. Dr. Ana B. Ania Bemerkungen: 1) Mit einer schwachen technischen Einschränkung gilt dieser Satz auch für Spiele mit mehr als zwei Spielern. 2) Der Beweis ist schwierig und wird hier daher weggelassen (für eine zugängliche Version siehe Fudenberg- Tirole, S. 150ff). 3) Beweisidee: Das Problem besteht darin, dass es nach einer Abweichung für die anderen Spieler nicht optimal ist, die Bestrafung auszuführen. Darum dauert die Bestrafung für Spieler i nicht für immer, sondern nur solange, dass sich für Spieler i eine Abweichung nicht lohnt. Gleichzeitig erhalten die anderen Spieler einen Anreiz, die Bestrafung auszuführen, indem sie nach Ende der Bestrafungsphase belohnt werden. Wenn sie dagegen von der Bestrafung abweichen, werden sie selbst für eine gewisse Zeit geminmaxt. Andere Folk-Theoreme Es gibt Folk-Theoreme für: Endlich oft wiederholte Spiele (Benoit-Krishna, 1985, 1987). Hier muss das Stufenspiel mehr als ein Gleichgewicht besitzen.

Spieltheorie (Winter 2009/10) 5-23 Prof. Dr. Ana B. Ania Wiederholte Spiele mit imperfect monitoring : Spiele mit imperfekter öffentlicher Information (Green- Porter, 1984, Fudenberg-Levine-Maskin, 1994). Spiele mit imperfekter privater Information (Kandori- Matsushima, 1994). Wiederholte Spiele mit wechselnden Gegenspielern: Ein langlebiger gegen eine Folge von kurzlebigen Spielern (Fudenberg-Kreps-Maskin, 1990). Kurzlebige Spieler müssen in jeder Periode eine beste Antwort spielen. Spiele mit überlappenden Generationen von Spielern (Kandori, 1989). Spiele mit einander zufällig zugeteilten Spielern (Kandori, 1989, Ellison, 1991). Wiederholte Spiele mit asymmetrischer Information (Fudenberg-Maskin, 1986). Für Spiele mit asymmetrischer Information gibt es aber auch Anti-Folk-Theoreme, die zeigen, dass unter bestimmten Bedingungen sehr präzise Vorhersagen in wiederholten Spielen möglich sind (Fudenberg-Levine, 1989, Schmidt, 1993, Cripps-Schmidt-Thomas, 1996).

Spieltheorie (Winter 2009/10) 5-24 Prof. Dr. Ana B. Ania 5.5 Kartelle: Wiederholtes Bertrand-Spiel Betrachten Sie ein wiederholtes Bertrand-Spiel: Zwei Duopolisten haben konstante und identische Grenzkosten c>0. In jeder Periode wählen beide simultan ihre Preise p t i. Es gibt T IN { }Perioden. Die Nachfrage für Unternehmen i in Periode t ist gegeben durch D(p t i) falls p t D i (p t i,p t i <p t j 1 j) = 2 D(pt i) falls p t i = p t j 0 falls p t i >p t j. Jedes Unternehmen maximiert Π i =(1 δ) T t=1 δt 1 (p t i c)d i (p t i,p t j). Endliche Wiederholung (T IN) Wenn T =1, existiert ein eindeutiges Nash-GG, in dem beide Unternehmen p i = p j = c wählen. Wenn 1 <T <, existiert nach Satz 5.1 ein eindeutiges TPGG, in dem beide Spieler in jeder Periode unabhängig von der Geschichte des Spiels Preis = Grenzkosten wählen.

Spieltheorie (Winter 2009/10) 5-25 Prof. Dr. Ana B. Ania Ist dieses TPGG überzeugend? Unendliche Wiederholung (T = ) Sei Π m der Monopolgewinn und p m der Monopolpreis. Wenn δ 1, dann existiert ein TPGG, in dem jeder 2 Duopolist entlang des Gleichgewichtspfades in jeder Periode den Monopolpreis setzt und den halben Monopolgewinn erhält. Durch welche Drohungen außerhalb des Gleichgewichtspfades kann dieses Ergebnis gestützt werden? 5.6 Kartelle: Wiederholtes Cournot-Spiel Der Cournot-Fall ist ein wenig komplizierter: Zwei Duopolisten haben konstante und identische Grenzkosten c>0. In jeder Periode wählen beide simultan ihre Mengen x t i. Es gibt T IN { }Perioden. Marktpreis: P (x 1 + x 2 )=a (x 1 + x 2 ). Π i =(1 δ) T Jedes Unternehmen maximiert t=1 δt 1 ( P (x t 1 + x t 2) c ) x t i.

Spieltheorie (Winter 2009/10) 5-26 Prof. Dr. Ana B. Ania Endliche Wiederholung (T IN) Wenn T =1, existiert ein eindeutiges Nash-GG, in dem beide Unternehmen x i = a c x c wählen und den 3 Cournotgewinn Π c = ( a c ) 2 3 machen. Wenn 1 <T <, existiert nach Satz 5.1 ein eindeutiges TPGG, in dem beide Spieler in jeder Periode un- abhängig von der Geschichte des Spiels x i = x c wählen. Unendliche Wiederholung (T = ) Sei x m = a c die Monopolmenge und Π m = ( a c ) 2 2 2 der Monopolgewinn. Existiert ein TPGG, in dem jeder Duopolist entlang des Gleichgewichtspfades in jeder Periode die halbe Monopolmenge produziert und den halben Monopolgewinn macht? Trigger-Strategien mit Nash-Drohung: Wähle xm in der ersten Periode. Produziere xm 2 2 in Periode t>1, wenn beide Firmen in allen vorangegangenen Perioden ebenfalls xm gewählt haben. Wenn ein Unternehmen jedoch in irgendeiner 2 vorangegangenen Periode von xm abgewichen ist, 2 wähle x c in allen Folgeperioden.

Spieltheorie (Winter 2009/10) 5-27 Prof. Dr. Ana B. Ania Bilden diese Strategien ein TPGG? Außerhalb des Gleichgewichtspfades: Offensichtlich ja, weil hier immer das Nash-Gleichgewicht des Stufenspiels gespielt wird. Entlang des Gleichgewichtspfades: Der Anreiz für Spieler i zur Abweichung ist am größten, wenn er in der Abweichungsperiode diejenige Menge wählt, die seine Auszahlung in dieser Periode maximiert, gegeben, dass Spieler j die halbe Monopolmenge wählt: x i =argmax{(a x i a c c) x i } 4 3(a c) x i = 8 Diese Abweichung gibt den Abweichungspayoff 9(a c)2. 64 Spieler i hat keinen Anreiz, vom Gleichgewichtspfad abzuweichen, falls 9(a c) 2 (1 δ) + 64 t=2 δt 1 Diese Bedingung ist erfüllt, falls δ 9 17. a c 2 1 3 2 a c 2. 2

Spieltheorie (Winter 2009/10) 5-28 Prof. Dr. Ana B. Ania Bemerkungen: 1) Das Resultat zeigt, wie zwei Oligopolisten ein Kartell durch einen impliziten Vertrag stützen können. 2) Ein ähnliches Resultat gilt für N > 2 Oligopolisten. Allerdings steigt der minimale Diskontfaktor, der notwendig ist, damit die Monopolmenge gestützt werden kann, mit N. Warum? 3) Interpretation des Diskontierungsfaktors: δ reflektiert die Länge einer Periode, die verstreichen muss, bis die Parteien auf abweichendes Verhalten reagieren können. Wenn die Abweichung unmittelbar beobachtbar und die Ausdehnung der Produktion sehr schnell möglich ist, ist δ sehr nahe bei 1. Wenn Abweichungen nur mit erheblichen Verzögerungen beobachtet werden können und/oder Bestrafungsreaktionen viel Zeit erfordern, dann kann δ deutlich kleiner werden. 4) Es gibt viele andere TPGG: Wenn δ sehr nahe bei 1 ist, können nach Satz 5.7 alle Auszahlungsvektoren (Π 1, Π 2 ) gestützt werden, für die gilt: Π i > 0 und Π 1 +Π 2 Π m. 5) Die Parteien könnten vorab ein (Rubinstein-)Verhandlungsspiel spielen, indem sie sich über das zu spielende Gleichgewicht einigen.

Spieltheorie (Winter 2009/10) 5-29 Prof. Dr. Ana B. Ania 5.8 Zeitkonsistente Geldpolitik Betrachte erneut das Spiel zwischen Zentralbank und privatem Sektor aus Kapitel 3.2.3, aber jetzt unendlich oft wiederholt: In jeder Periode t =1,..., bilden die Privaten Inflationserwartungen für die laufende Periode πe, t wählt die Zentralbank die tatsächliche Inflationsrate π t, bestimmt die Phillips-Kurve u t = u n α(π t πe) t die Arbeitslosigkeit in dieser Periode. Auszahlungen: Privater Sektor: U = (1 δ) t=1 δt 1 (π t πe) t 2 Zentralbank: L = (1 δ) t=1 δt 1 [ u t + γ (π t ) 2] Im einstufigen Spiel existiert ein eindeutiges TPGG, in dem die Zentralbank π = α wählt und der private Sektor 2γ π e = π erwartet.

Spieltheorie (Winter 2009/10) 5-30 Prof. Dr. Ana B. Ania Betrachte nun die folgenden Strategien im unendlich oft wiederholten Spiel: Die Privaten erwarten in Periode 1 πe 1 =0.InPeriode t, t 2, erwarten sie ebenfalls πe t =0, falls die Zentralbank in allen Vorperioden π =0gewählt hat. Ansonsten erwarten sie πe t = π. Wenn die Privaten in t =1πe 1 =0erwarten, wählt die Zentralbank π 1 =0. Sie bleibt bei dieser Politik in allen Folgeperioden, falls weder sie noch die Privaten vom Gleichgewichtspfad abgewichen sind. Ansonsten wählt sie immer π = π. Sind diese Strategien ein TPGG? Die Privaten können sich durch Abweichen nie beser stellen. Warum? Wenn die Zentralbank abweicht, sollte sie in der Abweichungsperiode π = π wählen. Unter welcher Bedin- gung an δ lohnt eine Abweichung nicht? Bemerkungen: 1) In der Literatur ist dieses Gleichgewicht als Reputations- Gleichgewicht interpretiert worden: Die Zentralbank baut eine Reputation dafür auf, nie zu inflationieren.

Spieltheorie (Winter 2009/10) 5-31 Prof. Dr. Ana B. Ania 2) Aber: Es handelt sich hier eher um einen impliziten Vertrag. Eine Reputation kann man nur für eine Eigenschaft erwerben, über die unvollständige Information herrscht. Siehe nächstes Kapitel. 5.9 Überlappende Generationen Das folgende Spiel ist auch ein wiederholtes Spiel, obwohl die Menge der Spieler ständig wechselt: In jeder Periode t =1,..., wird ein Spieler (indiziert mit t) geboren, der für zwei Perioden lebt. In der ersten Periode hat er eine Erstaustattung von 2 Einheiten eines nicht-haltbaren Gutes. In der zweiten Periode ist seine Ausstattung 0. Der Spieler möchte gerne in beiden Perioden konsumieren. Seine Präferenzen über Konsum heute und morgen sind monoton und konvex. Insbesondere gilt: (2, 1) (1, 1) (2, 0) (1, 0) Jeder Spieler hat in der ersten Periode seines Lebens die Möglichkeit, eine Einheit des Gutes an den alten Spieler abzugeben.

Spieltheorie (Winter 2009/10) 5-32 Prof. Dr. Ana B. Ania Autarkie Jeder Spieler verhält sich gemäß der folgenden Strategie: Konsumiere in der ersten Periode Deines Lebens 2 Einheiten und gib nichts ab. Hungere in der zweiten Periode. Zeigen Sie, dass das ein TPGG ist. Ein Generationenvertrag Die Spieler wählen die folgenden Strategien: Spieler 1 konsumiert beide Einheiten in Periode 1. Spieler 2 gibt eine Einheit an den alten Spieler 1 ab. Spieler t, t 3, gibt eine Einheit an Spieler t 1 ab, falls alle vorangegangenen Spieler (außer Spieler 1) ebenfalls eine Einheit abgegeben haben. Ansonsten konsumiert er beide Einheiten selbst. Zeigen Sie, dass das ein TPGG ist. Bemerkungen: 1) Dieses Resultat zeigt, dass intergenerationelle Transfers durch einen selbstdurchsetzenden impliziten Vertrag (d.h. als TPGG) gestützt werden können. 2) Problem: Wenn eine Generation abweicht, müssen alle folgenden Generationen darunter leiden, auch wenn sie selbst nicht abgewichen sind.

Spieltheorie (Winter 2009/10) 5-33 Prof. Dr. Ana B. Ania 3) Kann man dieses Ergebnis auch mit anderen Gleichgewichtsstrategien stützen, die nach einer gewissen Bestrafungsphase wieder zum alten Gleichgewichtspfad zurückkehren?