4. Wiederholte Spiele Klaus M. Schmidt LMU München Spieltheorie, Wintersemester 2014/15 Klaus M. Schmidt (LMU München) 4. Wiederholte Spiele Spieltheorie, Wintersemester 2014/15 1 / 43 Literaturhinweise zu Kapitel 4: Osborne (2004), Kapitel 14 Gibbons (1992), Kapitel 2 Fudenberg und Tirole (1991), Kapitel 5 c 2014 Klaus M. Schmidt Klaus M. Schmidt (LMU München) 4. Wiederholte Spiele Spieltheorie, Wintersemester 2014/15 2 / 43
4.1 Einleitung Sei G ein beliebiges endliches Spiel in Normalform oder in extensiver Form. Dann ist G T ein Spiel in extensiver Form, in dem das Stufenspiel G T -mal hintereinander gespielt wird, T IN { }, und in dem alle Spieler zu Beginn jeder Periode die gesamte bisherige Geschichte des Spiels kennen. Beispiele: Zwei Spieler spielen mehrfach hintereinander das Gefangenendilemma. N Oligopolisten stehen sich über viele Perioden in einem Cournot-Spiel gegenüber. Zentralbank setzt in jeder Periode die Geldmenge, etc. Klaus M. Schmidt (LMU München) 4. Wiederholte Spiele Spieltheorie, Wintersemester 2014/15 3 / 43 Bemerkungen: 1) Wiederholte Spiele sind eigentlich nur ein Spezialfall von dynamischen Spielen. 2) Sie haben jedoch einige interessante Eigenschaften, die für allgemeine dynamische Spiele nicht gelten. 3) Wiederholte Spiele haben sowohl in der Theorie als auch in den Anwendungen sehr viel Aufmerksamkeit gefunden. 4) Vorsicht die folgenden Spiele sind keine wiederholten Spiele: Verhandlungsspiele mit alternierenden Angeboten und offenem Zeithorizont. Dynamische Spiele mit sich verändernden Zustandsvariablen, z.b. Oligopolspiel mit Nachfrageträgheit, Ressourcen-Extrahierungsspiel, Investitionsspiele, etc. Solche Spiele werden auch stochastische Spiele genannt. Klaus M. Schmidt (LMU München) 4. Wiederholte Spiele Spieltheorie, Wintersemester 2014/15 4 / 43
4.2 Endlich oft wiederholte Spiele Angenommen, das Gefangenendilemma wird von 2 Spielern zweimal hintereinander gespielt. Spieler 2 l r L 1, 1 5, 0 Spieler 1 R 0, 5 4, 4 Abb. 4.1: Das Gefangenendilemma Klaus M. Schmidt (LMU München) 4. Wiederholte Spiele Spieltheorie, Wintersemester 2014/15 5 / 43 Die Auszahlungen der Spieler sind einfach die Summen der Auszahlungen in den beiden Spielen. Analyse des Spiels Stufe 2: Egal was in der 1. Stufe passiert ist, das Gefangenendilemma der zweiten Stufe hat ein eindeutiges Nash- Gleichgewicht: (L, l) Daraus folgt: In jedem teilspielperfekten Nash-Gleichgewicht muss in der zweiten Stufe (L, l) gespielt werden. Stufe 1: Was in dieser Stufe passiert, hat keinen Einfluss auf das Spiel in der zweiten Stufe. Wir können einfach die Auszahlung (1,1) aus der zweiten Stufe zu denen der ersten Stufe addieren. Klaus M. Schmidt (LMU München) 4. Wiederholte Spiele Spieltheorie, Wintersemester 2014/15 6 / 43
Spieler 2 l r L 2, 2 6, 1 Spieler 1 R 1, 6 5, 5 Abb. 4.2: Reduzierte Normalform des wiederholten Gefangenendilemmas Klaus M. Schmidt (LMU München) 4. Wiederholte Spiele Spieltheorie, Wintersemester 2014/15 7 / 43 Fazit: Das einzige TPGG ist, dass beide Spieler in beiden Stufen links wählen: GG-Strategie von Spieler 1: (L 1, L 2 L 2 L 2 L 2 ) GG-Strategie von Spieler 2: (l 1, l 2 l 2 l 2 l 2 ) Satz 4.1 Wenn das Stufenspiel G ein eindeutiges Nash-Gleichgewicht hat, dann hat das endlich oft wiederholte Spiel G T, T <, ein eindeutiges teilspielperfektes Gleichgewicht, nämlich die T -fache Wiederholung des Nash-Gleichgewichts unabhängig von der Geschichte des Spiels. Beweis von Satz 4.1: Klaus M. Schmidt (LMU München) 4. Wiederholte Spiele Spieltheorie, Wintersemester 2014/15 8 / 43
Übungsaufgabe: Zeigen Sie, dass im zweimal wiederholten Gefangenendilemma auch das einzige Nash-Gleichgewicht darin besteht, dass beide Parteien in beiden Perioden links spielen. Klaus M. Schmidt (LMU München) 4. Wiederholte Spiele Spieltheorie, Wintersemester 2014/15 9 / 43 Betrachten Sie jetzt die zweifache Wiederholung des folgenden Spiels: 2 1 l m r L 1, 1 5, 0 0, 0 M 0, 5 4, 4 0, 0 R 0, 0 0, 0 3, 3 Abb. 4.3: Multiple Nash-Gleichgewichte im Stufenspiel Klaus M. Schmidt (LMU München) 4. Wiederholte Spiele Spieltheorie, Wintersemester 2014/15 10 / 43
Frage: Wieviele reine Strategien hat jeder Spieler im zweifach wiederholten Spiel? Beachten Sie: Dieses Stufenspiel hat zwei Nash-Gleichgewichte in reinen Strategien: (L, l) und (R, r). Satz 4.2 Wenn in jeder Periode unabhängig von der Geschichte des wiederholten Spiels dasselbe Nash-Gleichgewicht des Stufenspiels gespielt wird, liegt ein teilspielperfektes Gleichgewicht vor. Beweis von Satz 4.2: Klaus M. Schmidt (LMU München) 4. Wiederholte Spiele Spieltheorie, Wintersemester 2014/15 11 / 43 Fazit: Die Wiederholungen der Nash-Gleichgewichte (L, l) bzw. (R, r) sind TPGG. Aber: Es gibt noch weitere TPGG. Beispiel: Periode 1: Beide Spieler spielen (M, m). Periode 2: - Wenn beide Spieler diese Aktionen in Periode 1 gewählt haben, wird in Periode 2 (R, r) gespielt. - Wenn wenigstens einer der beiden Spieler von diesen Aktionen abgewichen ist, wird in Periode 2 (L, l) gespielt. Klaus M. Schmidt (LMU München) 4. Wiederholte Spiele Spieltheorie, Wintersemester 2014/15 12 / 43
Bemerkungen: Dieses Gleichgewicht führt zur Auszahlung (7, 7), die höher ist als die Auszahlung (6, 6) bei der zweifachen Wiederholung von (R, r). In diesem Gleichgewicht wird Kooperation in der ersten Stufe durch die Drohung gestützt, nach einer Abweichung das schlechte Gleichgewicht (L, l) zu spielen. Die Drohung ist teilspielperfekt, aber ist sie wirklich glaubwürdig? Was würde passieren, wenn die Spieler zu Beginn jeder Runde kommunizieren könnten? Klaus M. Schmidt (LMU München) 4. Wiederholte Spiele Spieltheorie, Wintersemester 2014/15 13 / 43 4.3 Unendlich oft wiederholte Spiele In vielen endlich oft wiederholten Spielen spielt der last period effect eine wichtige Rolle. Wenn klar ist, was in der letzten Runde passiert, ist auch klar, was in der vorletzten Runde passiert, usw. Deshalb ist z.b. in jedem endlich oft wiederholten Gefangenendilemma das einzige Gleichgewicht, nie zu kooperieren, in jedem endlich oft wiederholten Bertrand-Spiel, Preis gleich Grenzkosten zu setzen, usw. Experimente haben gezeigt, dass last period effects in den letzten Perioden tatsächlich eine wichtige Rolle spielen, nicht aber in den ersten Perioden eines oft wiederholten Spiels (Beispiel: Axelrod-Experimente). Am Anfang einer wiederholten Beziehung wird tatsächliches Verhalten besser durch ein unendlich oft wiederholtes Spiel beschrieben, auch wenn es im wörtlichen Sinne natürlich keine unendlich oft wiederholten Spiele gibt. Klaus M. Schmidt (LMU München) 4. Wiederholte Spiele Spieltheorie, Wintersemester 2014/15 14 / 43
Auszahlungen Es ergibt keinen Sinn, anzunehmen, dass jeder Spieler die Summe seiner Auszahlungen maximiert. Warum nicht? Darum nehmen wir an, dass jeder Spieler den Gegenwartswert seiner diskontierten Auszahlungen maximiert. Interpretation: 1. Zukünftige Auszahlungen werden mit dem Zinssatz (der Zeitpräferenzrate) r abgezinst (δ = 1 1+r ). 2. Mit Wahrscheinlichkeit (1 δ) endet das Spiel nach jeder Periode, mit Wahrscheinlichkeit δ wird es fortgesetzt. Beachte: δ t 1 = 1 + δ + δ 2 +... = 1 + δ t=1 = t=1 δ t 1 = 1 1 δ t=1 δ t 1 Klaus M. Schmidt (LMU München) 4. Wiederholte Spiele Spieltheorie, Wintersemester 2014/15 15 / 43 Definition 4.1 Ein unendlich oft wiederholtes Stufenspiel G mit Diskontierungsfaktor δ wird G (δ) genannt. Die Auszahlung eines Spielers i in G (δ) ist gegeben durch v i = (1 δ) δ t 1 u i (ai t, at i ). t=1 Wir haben die Auszahlungen durch Multiplikation mit (1 δ) so normalisiert, dass die Auszahlungen des wiederholten Spiels direkt mit denen des Stufenspiels vergleichbar sind. Warum verändert sich das Spiel dadurch nicht? Beispiel: Wenn Spieler i in jeder Runde die Auszahlung 4 bekommt, ist seine Auszahlung im wiederholten Spiel v i = (1 δ) δ t 1 1 4 = (1 δ) 1 δ 4 = 4. t=1 Klaus M. Schmidt (LMU München) 4. Wiederholte Spiele Spieltheorie, Wintersemester 2014/15 16 / 43
Satz 4.3 Wenn δ hinreichend groß ist, existiert im unendlich oft wiederholten Gefangenendilemma ein TPGG, in dem beide Spieler entlang des Gleichgewichtspfades in allen Perioden kooperieren. Beweis von Satz 4.3: Klaus M. Schmidt (LMU München) 4. Wiederholte Spiele Spieltheorie, Wintersemester 2014/15 17 / 43 Beweis von Satz 4.3: Klaus M. Schmidt (LMU München) 4. Wiederholte Spiele Spieltheorie, Wintersemester 2014/15 18 / 43
Bemerkungen: 1) Diese Strategien heißen Grim Strategien oder Trigger Strategien. Sie haben den Nachteil, dass mögliche Fehler der Spieler eine Katastrophe auslösen ( doomsday machines ). 2) Kooperation kann aber auch mit anderen Bestrafungsstrategien als TPGG gestützt werden, z.b. mit Perfect Tit-for-tat ( Wie Du mir, so ich Dir ): Spiele Kooperation in Periode 1 und immer dann, wenn das Ergebnis in der letzten Periode ( Kooperation, Kooperation ) oder ( Verrat, Verrat ) war. Spiele Verrat, falls das Ergebnis in der letzten Periode ( Verrat, Kooperation ) oder ( Kooperation, Verrat ) war. Übungsaufgabe: Zeigen Sie, dass Perfect Tit-for-tat von beiden Spielern tatsächlich ein TPGG ist, falls δ groß genug ist. Benutzen Sie das Einmal-Abweichungsprinzip. (Sie müssen 4 Fälle überprüfen.) Klaus M. Schmidt (LMU München) 4. Wiederholte Spiele Spieltheorie, Wintersemester 2014/15 19 / 43 4.4 Kartelle: Wiederholtes Bertrand-Spiel Betrachten Sie ein wiederholtes Bertrand-Spiel: Zwei Duopolisten haben konstante und identische Grenzkosten c > 0. In jeder Periode wählen beide simultan ihre Preise pi t. Es gibt T IN { } Perioden. Die Nachfrage für Unternehmen i in Periode t ist gegeben durch D(pi t) falls pt i < pj t D i (pi t, pt j ) = 1 2 D(pt i ) falls pt i = pj t 0 falls pi t > pj t. Jedes Unternehmen maximiert T Π i = (1 δ) δ t 1 (pi t c)d i (pi t, pt j ). t=1 Klaus M. Schmidt (LMU München) 4. Wiederholte Spiele Spieltheorie, Wintersemester 2014/15 20 / 43
Endliche Wiederholung (T IN) Wenn T = 1, existiert ein eindeutiges Nash-GG, in dem beide Unternehmen p i = p j = c wählen. Wenn 1 < T <, existiert nach Satz 4.1 ein eindeutiges TPGG, in dem beide Spieler in jeder Periode unabhängig von der Geschichte des Spiels Preis = Grenzkosten wählen. Ist dieses TPGG überzeugend? Klaus M. Schmidt (LMU München) 4. Wiederholte Spiele Spieltheorie, Wintersemester 2014/15 21 / 43 Unendliche Wiederholung (T = ) Sei Π m der Monopolgewinn und p m der Monopolpreis. Wenn δ 1 2, dann existiert ein TPGG, in dem jeder Duopolist entlang des Gleichgewichtspfades in jeder Periode den Monopolpreis setzt und den halben Monopolgewinn erhält. Durch welche Drohungen außerhalb des Gleichgewichtspfades kann dieses Ergebnis gestützt werden? Klaus M. Schmidt (LMU München) 4. Wiederholte Spiele Spieltheorie, Wintersemester 2014/15 22 / 43
4.5 Kartelle: Wiederholtes Cournot-Spiel Der Cournot-Fall ist ein wenig komplizierter: Zwei Duopolisten haben konstante und identische Grenzkosten c > 0. In jeder Periode wählen beide simultan ihre Mengen x t i. Es gibt T IN { } Perioden. Marktpreis: P(x 1 + x 2 ) = a (x 1 + x 2 ). Jedes Unternehmen maximiert Π i = (1 δ) T t=1 δ t 1 ( P(x t 1 + x t 2 ) c) x t i. Klaus M. Schmidt (LMU München) 4. Wiederholte Spiele Spieltheorie, Wintersemester 2014/15 23 / 43 Endliche Wiederholung (T IN) Wenn T = 1, existiert ein eindeutiges Nash-GG, in dem beide Unternehmen x i = a c 3 x c wählen und den Cournotgewinn Π c = ( ) a c 2 3 machen. Wenn 1 < T <, existiert nach Satz 4.1 ein eindeutiges TPGG, in dem beide Spieler in jeder Periode unabhängig von der Geschichte des Spiels x i = x c wählen. Klaus M. Schmidt (LMU München) 4. Wiederholte Spiele Spieltheorie, Wintersemester 2014/15 24 / 43
Unendliche Wiederholung (T = ) Sei x m = a c 2 die Monopolmenge und Π m = ( ) a c 2 2 der Monopolgewinn. Existiert ein TPGG, in dem jeder Duopolist entlang des Gleichgewichtspfades in jeder Periode die halbe Monopolmenge produziert und den halben Monopolgewinn macht? Trigger-Strategien mit Nash-Drohung: Wähle x m 2 in der ersten Periode. Produziere x m 2 in Periode t > 1, wenn beide Firmen in allen vorangegangenen Perioden ebenfalls x m 2 gewählt haben. Wenn ein Unternehmen jedoch in irgendeiner vorangegangenen Periode von x m 2 abgewichen ist, wähle x c in allen Folgeperioden. Bilden diese Strategien ein TPGG? Außerhalb des Gleichgewichtspfades: Offensichtlich ja, weil hier immer das Nash-Gleichgewicht des Stufenspiels gespielt wird. Klaus M. Schmidt (LMU München) 4. Wiederholte Spiele Spieltheorie, Wintersemester 2014/15 25 / 43 Entlang des Gleichgewichtspfades: Der Anreiz für Spieler i zur Abweichung ist am größten, wenn er in der Abweichungsperiode diejenige Menge wählt, die seine Auszahlung in dieser Periode maximiert, gegeben, dass Spieler j die halbe Monopolmenge wählt: x i = arg max{(a x i a c 4 x i = 3(a c) 8 c) x i } Diese Abweichung gibt den Abweichungspayoff 9(a c)2 Spieler i hat keinen Anreiz, vom Gleichgewichtspfad abzuweichen, falls [ 9(a c) 2 ( ] (1 δ) + δ t 1 a c ) 2 1 ( a c ) 2. 64 3 2 2 t=2 64. Diese Bedingung ist erfüllt, falls δ 9 17. Klaus M. Schmidt (LMU München) 4. Wiederholte Spiele Spieltheorie, Wintersemester 2014/15 26 / 43
Bemerkungen: 1) Das Resultat zeigt, wie zwei Oligopolisten ein Kartell durch einen impliziten Vertrag stützen können. 2) Ein ähnliches Resultat gilt für N > 2 Oligopolisten. Allerdings steigt der minimale Diskontfaktor, der notwendig ist damit die Monopolmenge gestützt werden kann, mit N. Warum? 3) Interpretation des Diskontierungsfaktors: δ reflektiert die Länge einer Periode, die verstreichen muss, bis die Parteien auf abweichendes Verhalten reagieren können. Wenn die Abweichung unmittelbar beobachtbar und die Ausdehnung der Produktion sehr schnell möglich ist, ist δ sehr nahe bei 1. Wenn Abweichungen nur mit erheblichen Verzögerungen beobachtet werden können und/oder Bestrafungsreaktionen viel Zeit erfordern, dann kann δ deutlich kleiner werden. Klaus M. Schmidt (LMU München) 4. Wiederholte Spiele Spieltheorie, Wintersemester 2014/15 27 / 43 4.6 Zeitkonsistente Geldpolitik Betrachten Sie erneut das Spiel zwischen Zentralbank und privatem Sektor aus Kapitel 3.2.3, aber jetzt unendlich oft wiederholt: In jeder Periode t = 1,..., bilden die Privaten Inflationserwartungen für die laufende Periode π t e, wählt die Zentralbank die tatsächliche Inflationsrate π t, bestimmt die Phillips-Kurve u t = u n α(π t π t e) die Arbeitslosigkeit in dieser Periode. Klaus M. Schmidt (LMU München) 4. Wiederholte Spiele Spieltheorie, Wintersemester 2014/15 28 / 43
Auszahlungen: Privater Sektor: Zentralbank: U = (1 δ) L = (1 δ) δ t 1 (π t πe) t 2 t=1 δ t 1 [ u t + γ (π t ) 2] Im einstufigen Spiel existiert ein eindeutiges TPGG, in dem die Zentralbank π = α 2γ wählt und der private Sektor π e = π erwartet. t=1 Klaus M. Schmidt (LMU München) 4. Wiederholte Spiele Spieltheorie, Wintersemester 2014/15 29 / 43 Betrachten Sie nun die folgenden Strategien im unendlich oft wiederholten Spiel: Die Privaten erwarten in Periode 1 π 1 e = 0. In Periode t, t 2, erwarten sie ebenfalls π t e = 0, falls die Zentralbank in allen Vorperioden π = 0 gewählt hat. Ansonsten erwarten sie π t e = π. Wenn die Privaten in t = 1 π 1 e = 0 erwarten, wählt die Zentralbank π 1 = 0. Sie bleibt bei dieser Politik in allen Folgeperioden, falls weder sie noch die Privaten vom Gleichgewichtspfad abgewichen sind. Ansonsten wählt sie immer π = π. Sind diese Strategien ein TPGG? Die Privaten können sich durch Abweichen nie beser stellen. Warum? Wenn die Zentralbank abweicht, sollte sie in der Abweichungsperiode π = π wählen. Unter welcher Bedingung an δ lohnt eine Abweichung nicht? Klaus M. Schmidt (LMU München) 4. Wiederholte Spiele Spieltheorie, Wintersemester 2014/15 30 / 43
Bemerkungen: 1) In der Literatur ist dieses Gleichgewicht als Reputations-Gleichgewicht interpretiert worden: Die Zentralbank baut eine Reputation dafür auf, nie zu inflationieren. 2) Aber: Es handelt sich hier eher um einen impliziten Vertrag. Eine Reputation kann man nur für eine Eigenschaft erwerben, über die unvollständige Information herrscht. Siehe nächstes Kapitel. Klaus M. Schmidt (LMU München) 4. Wiederholte Spiele Spieltheorie, Wintersemester 2014/15 31 / 43 4.7 Überlappende Generationen Das folgende Spiel ist auch ein wiederholtes Spiel, obwohl die Menge der Spieler ständig wechselt: In jeder Periode t = 1,..., wird ein Spieler (indiziert mit t) geboren, der für zwei Perioden lebt. In der ersten Periode hat er eine Erstaustattung von 2 Einheiten eines nicht-haltbaren Gutes. In der zweiten Periode ist seine Ausstattung 0. Der Spieler möchte gerne in beiden Perioden konsumieren. Seine Präferenzen über Konsum heute und morgen sind monoton und konvex. Insbesondere gilt: (2, 1) (1, 1) (2, 0) (1, 0) Jeder Spieler hat in der ersten Periode seines Lebens die Möglichkeit, eine Einheit des Gutes an den alten Spieler abzugeben. Klaus M. Schmidt (LMU München) 4. Wiederholte Spiele Spieltheorie, Wintersemester 2014/15 32 / 43
Autarkie Jeder Spieler verhält sich gemäß der folgenden Strategie: Konsumiere in der ersten Periode Deines Lebens 2 Einheiten und gib nichts ab. Hungere in der zweiten Periode. Zeigen Sie, dass das ein TPGG ist. Klaus M. Schmidt (LMU München) 4. Wiederholte Spiele Spieltheorie, Wintersemester 2014/15 33 / 43 Ein Generationenvertrag Die Spieler wählen die folgenden Strategien: Spieler 1 konsumiert beide Einheiten in Periode 1. Spieler 2 gibt eine Einheit an den alten Spieler 1 ab. Spieler t, t 3, gibt eine Einheit an Spieler t 1 ab, falls alle vorangegangenen Spieler (außer Spieler 1) ebenfalls eine Einheit abgegeben haben. Ansonsten konsumiert er beide Einheiten selbst. Zeigen Sie, dass das ein TPGG ist. Klaus M. Schmidt (LMU München) 4. Wiederholte Spiele Spieltheorie, Wintersemester 2014/15 34 / 43
Bemerkungen: 1) Dieses Resultat zeigt, dass intergenerationelle Transfers durch einen selbstdurchsetzenden impliziten Vertrag (d.h. als TPGG) gestützt werden können. 2) Problem: Wenn eine Generation abweicht, müssen alle folgenden Generationen darunter leiden, auch wenn sie selbst nicht abgewichen sind. 3) Kann man dieses Ergebnis auch mit anderen Gleichgewichtsstrategien stützen, die nach einer gewissen Bestrafungsphase wieder zum alten Gleichgewichtspfad zurückkehren? Klaus M. Schmidt (LMU München) 4. Wiederholte Spiele Spieltheorie, Wintersemester 2014/15 35 / 43 4.8 Folk-Theoreme Folk-Theoreme sagen, dass fast alle Auszahlungsvektoren in einem wiederholten Spiel als Gleichgewichtsauszahlung gestützt werden können, wenn die Spieler hinreichend geduldig sind. Wir brauchen zunächst etwas Notation. Sei a i A i eine reine Strategie (Aktion) von Spieler i im Stufenspiel, a i A i ein Strategienprofil seiner Gegenspieler und a = (a 1,..., a n ) A = A 1... A n. Entsprechend sei α i eine gemischte Strategie von Spieler i im Stufenspiel. Schließlich sei u i (a i, a i ) die Auszahlung von Spieler i im Stufenspiel und u(a) das Auszahlungprofil. Klaus M. Schmidt (LMU München) 4. Wiederholte Spiele Spieltheorie, Wintersemester 2014/15 36 / 43
Definition 4.2 Ein Auszahlungsvektor x ist erreichbar (feasible), wenn es eine Wahrscheinlichkeitsverteilung p über die möglichen reinen Strategientupel des Stufenspiels gibt, die diesen Auszahlungsvektor generiert: x = a A p(a) u(a). Klaus M. Schmidt (LMU München) 4. Wiederholte Spiele Spieltheorie, Wintersemester 2014/15 37 / 43 Beispiel: l r 2 L 2 0 1 0 1 R 0 1 0 2 1 2 g 1 Abb. 4.4: Erreichbare Payoffs im Kampf der Geschlechter g 2 Klaus M. Schmidt (LMU München) 4. Wiederholte Spiele Spieltheorie, Wintersemester 2014/15 38 / 43
Die Menge der erreichbaren Payoffs ist also einfach die konvexe Hülle der Auszahlungsvektoren aller reinen Strategienkombinationen des Stufenspiels. Es gibt zwei Möglichkeiten, wie ein erreichbarer Auszahlungsvektor tatsächlich erreicht werden kann. 1) Öffentliche Randomisierung: Die Spieler koordinieren ihr Verhalten mit einem öffentlichen Zufallsgenerator, der es ihnen erlaubt, jeden reinen Strategienvektor mit exakt der gewünschten Wahrscheinlichkeit zu spielen. 2) Die Spieler spielen die reinen Strategienvektoren abwechselnd entsprechend einer Frequenz, die die benötigte Wahrscheinlichkeitsverteilung so gut wie möglich approximiert. Wenn die Spieler hinreichend geduldig sind, können sie sich so jedem erreichbaren Auszahlungsvektor beliebig nahe annähern. Damit wir uns mit diesen etwas umständlichen Methoden nicht weiter herumschlagen müssen, werden wir im Folgenden zur Vereinfachung annehmen, dass für jeden beliebigen Auszahlungsvektor x ein Profil von (reinen) Aktionen a im Stufenspiel existiert, das genau diesen Auszahlungsvektor x generiert: u(a) = x. Klaus M. Schmidt (LMU München) 4. Wiederholte Spiele Spieltheorie, Wintersemester 2014/15 39 / 43 Satz 4.4 (Friedman, 1971) Sei G ein endliches Spiel mit vollständiger Information. Sei a ein Nash-Gleichgewicht von G mit Auszahlungsvektor u, und ˆx ein erreichbarer Auszahlungsvektor mit der Eigenschaft, dass ˆx i > ui für alle i {1,..., n}. Falls δ nahe genug bei 1 liegt, existiert ein teilspielperfektes Gleichgewicht in G (δ) mit durchschnittlichem Auszahlungsvektor ˆx. Beispiele: Wiederholtes Gefangenendilemma, wiederholtes Cournot-Spiel. Beweis von Satz 4.4: Klaus M. Schmidt (LMU München) 4. Wiederholte Spiele Spieltheorie, Wintersemester 2014/15 40 / 43
Beweis von Satz 4.4: Klaus M. Schmidt (LMU München) 4. Wiederholte Spiele Spieltheorie, Wintersemester 2014/15 41 / 43 Interpretation des Folk-Theorems 1) Das Folk-Theorem zeigt, dass der empirische Gehalt der Theorie wiederholter Spiele sehr klein ist. Fast alles kann als Ergebnis eines TPGG erklärt werden. 2) Gleichgewichte eines wiederholten Spiels können als implizite (selbstdurchsetzende) Verträge interpretiert werden. Die Spieler können vor Beginn des Spiels darüber kommunizieren, welches Gleichgewicht sie spielen wollen. Folk-Theoreme zeigen, dass eine Fülle von Verhaltensweisen durch implizite Verträge gestützt werden können. Zusätzliche Annahmen sind erforderlich, um zu erklären, worauf sie sich einigen werden. 3) An den Folk-Theoremen sind vielmals die erreichbaren Auszahlungen selbst weniger interessant als das diese stützende Gerüst von Strafen und (bei teilspielperfekten Gleichgewichten im allgemeinen benötigten) Belohnungen. Klaus M. Schmidt (LMU München) 4. Wiederholte Spiele Spieltheorie, Wintersemester 2014/15 42 / 43
Bemerkungen: 1. Das Folk-Theorem von Friedman kann noch weiter verallgemeinert werden: Jeder erreichbare Auszahlungsvektor, der jedem Spieler wenigstens seine Minmax-Auszahlung gibt, kann als TPGG gestützt werden, wenn die Spieler hinreichend geduldig sind. 2. Es gibt Folk-Theoreme für verschiedene Gleichgewichtskonzepte (Nash-Gleichgewichte, TPGG, Bayesianische Gleichgewichte etc.) und für verschiedene Typen von Spielen (vollständige oder unvollständige Information, endlich oder unendlich oft wiederholt etc.). Klaus M. Schmidt (LMU München) 4. Wiederholte Spiele Spieltheorie, Wintersemester 2014/15 43 / 43