1 Teil IV Spiel- und Oligopoltheorie 15. Einführung in die Spieltheorie Literatur Holler, M.J., G. Illing (1991): a.a.o. Kreps, D.M. (1990), a.a.o. Rauhut, urkhard, N. Schmitz, E.-W. Zachow (1979): Spieltheorie - Eine Einführung in die mathematische Theorie strategischer Spiele, Stuttgart: Teubner Sieg, G. (2000), a.a.o. v. Neumann, J., O. Morgenstern (1961): a.a.o. 15.1 Problemstruktur 15.1.1 Grundbegriffe Spieltheorie n Entscheidende n Zielfunktionen Vektormaximumproblem 1 Entscheidender n Zielfunktionen Teamtheorie n Entscheidende 1 Zielfunktion Mathematische Optimierung 1 Entscheidender 1 Zielfunktion Ein Spiel besteht aus (1) den n Spielern selbst, n 2 (2) einer Menge von Regeln (3) Auszahlungen an die Spieler; diese können positiv/negativ sein. (4) Informationen der Spieler eispiele Schach: vollständige Information, kein Zufall. Mensch ärger Dich nicht: perfekte Information, Zufall. Skat: unvollständige Information, Zufall.
2 Ähnlich strukturierte Entscheidungssituationen findet man z.. in (1) Wirtschaft - Oligopole - Außenhandel (2) Militär Allgemein: Das Ergebnis hängt von dem ab, was man selbst und was der andere/die anderen macht/machen. Partie: Realisierung (Durchführung) eines Spiels Zug: eine Entscheidung Information: Information über Entscheidungen eines Gegenspielers über Eigenschaften (Nutzenfunktion, Erstausstattung etc.) eines Gegenspielers perfekte Information imperfekte Information vollständige Information unvollständige Information "hidden action" "hidden information" moral hazard adverse Selektion Strategie: Vollständiger Verhaltensplan für einen Spieler, der für jede Entscheidung unter eachtung der Spielregeln eine Verhaltensanweisung gibt.
3 Einteilung der Spiele: (1) nach Anzahl der Spieler Zwei-Personen-Spiele n-personen-spiele (2) nach Eigenschaften der Auszahlungen Nullsummenspiele Nicht-Nullsummenspiele Konstantsummenspiele (3) nach Kooperationsmöglichkeiten der Spieler kooperative Spiele nicht-kooperative Spiele 15.1.2 Spiele in extensiver Form und in Normalform Ein Spiel ist durch die Gesamtheit aller möglichen Züge und aller möglichen Auszahlungen (Endgewinne) darstellbar. eispiel: Hölzchenspiel (Rauhut, a.a.o., S. 16) "Von einem Haufen von ursprünglich 6 Hölzchen nehmen zwei Spieler abwechselnd Hölzchen weg, und zwar haben sie die Wahl zwischen einem oder zwei Hölzchen. Wer das letzte Hölzchen nimmt, ist Sieger." Es können auch die beiden letzten Hölzchen genommen werden. Dieses Spiel kann in Form eines Spielbaums dargestellt werden:
4 Gewinner ist also derjenige, der durch einen, d.h. den letzten Zug die Partie beendet; er erreicht die Markierung. Dies ist die extensive Darstellung des Hölzchenspiels. Jedem Endpunkt entspricht genau eine Partie; es sind also 13 verschiedene Partien möglich. Eine Partie ist eine "Kette" (Rauhut) durch den Spielbaum. Für dieses Spiel sollen beispielhaft zwei Strategien dargestellt werden.
5 (1) Strategie für den Spieler A (2) Strategie für den Spieler
6 Wir setzen im folgenden voraus, dass es endlich viele Spieler und für jeden Spieler endlich viele Strategien gibt. Dann lässt sich ein Spiel vollständig durch die Menge aller Strategien beschreiben. eispiel Zwei Dyopolisten A und wollen jeweils ein neues Produkt auf dem Markt einführen. Ihr Entscheidungs- oder Spielbaum sieht in der folgenden Weise aus: Normalform einführen nicht einführen A einführen nicht einführen -2; -2 0; 5 5; 0 0;0
7 Allgemein: b 1 b 2... b j... b n a 1 x11; y11...... x ; y... x n; y 1j 1j 1 1n a 2 A : a i : x ; y ij ij a m x ; y... x ; y m1 m1 mn mn {a i } Menge der Strategien von A {b j } Menge der Strategien von xij, yij Auszahlungen an A bzw. für a i und b j Spielen einer Partie: A und kennen alle a i und b j sowie x ij und y ij. Sie wählen jeweils ihre eigene Strategie a i und b j unabhängig voneinander. Problem: Gibt es für die Spieler optimale Strategien? 15.2 Nicht-kooperative Spiele 15.2.1 2-Personen-Nullsummenspiele A Reine Strategien Hier ist x + y = 0, i, j. Da immer y = x ist, reicht es, als Auszahlung ij ij nur x ij zu betrachten mit folgender Konvention: ij ij > 0 x ij < 0 A zahlt an zahlt an A Wir betrachten folgendes Spiel in Normalform.
8 b 1... b j... b n min j max min i j A a 1 a i x 11 x 1 min x i min x max i min j a m x mn max x max 1... xmax j... xmax n i min max xmin max j i j i x m min Hier herrscht ein vollständiger Interessengegensatz. Deswegen rechnet jeder Spieler mit der für ihn schlechtesten Strategiewahl des anderen Spielers. Dieses Verhalten ist extrem pessimistisch. Spieler A rechnet mit dem Minimum einer Zeile und will dieses maximieren. Spieler rechnet mit dem Maximum einer Spalte und will dieses minimieren. Also: A wählt das Maximum der Zeilenminima. wählt das Minimum der Spaltenmaxima. Dieses ist Verhalten nach dem Maximin-Kriterium. Falls x = x max min min max i j j i ist, heißt das hierzugehörige Strategienpaar a *, b * Sattelpunktlösung des Spiels.
9 eispiel a 1 b 1 b 2 b 3 b 4 min j 2 1 10 11 A a 2-2 -1 1-3 a 3-3 -5-1 12 max i 2 1 10 12 min max j i 1 1-3 -5 max min i j 1 Durch die Wahl der Strategie b 2 kann Spieler verhindern, dass er mehr als 1 an A zahlen muss; andererseits kann Spieler A durch Wahl der Strategie a 1 sicherstellen, dass er mindestens die Auszahlung 1 erhält. Im obigen eispiel ist a 1 eine dominante Strategie für A gegenüber a 2, denn für jede Strategie des ist die zugehörige Auszahlung in a 1 größer als in a 2 : a 1 (2,1,10,11) a 2 ( 2, 1,1, 3). Also wird bei einem Vergleich der beiden Strategien a 1 und a 2 der Spieler A immer die Strategie a 1 vorziehen; denn welche Strategie auch wählen mag, A steht sich bei a 1 immer besser als bei a 2. Analoge Überlegungen gelten bei einem Vergleich der beiden Strategien b 2 und b 3 des Spielers. Hier sind alle Auszahlungen des an A bei Wahl der Strategie b 2 kleiner als bei Wahl der Strategie b 3 bzw. erhielte jeweils mehr von A: b 2 b 3 1 1 5 10 1 1
10 Spieler A wird also niemals die Strategie a 2 und Spieler niemals die Strategie b 3 wählen. Streicht man deswegen in dem obigen eispiel diese beiden dominierten Strategien, so erhält man: b 1 b 2 b 3 a 1 2 1 11 A a 2-3 -5 12 max i 2 1 12 min max j i 1 min j 1-5 max min i j 1 Der egriff des Sattelpunktes ist für die Funktion f(x,y) in Abbildung 15.2.1.1 graphisch veranschaulicht. Abbildung 15.2.1.1 - Sattelpunkt Am Punkt S in der obigen Abbildung gilt max min f ( x, y) = min max f ( x, y), y x x y d.h., der Punkt S stellt einen Sattelpunkt dar. Die Maximin-Lösung stellt eine ganz besondere Lösung nicht-kooperativer Spiele dar. Sie ist gewissermaßen sehr pessimistisch, da die Spieler jeweils davon ausgehen, dass das für sie schlechteste Ereignis eintritt. In Konfliktsituationen, die nicht durch ein 2-
11 Personen-Nullsummenspiel beschrieben werden können, wird man andere Kriterien zur Strategieauswahl anwenden. Problematisch ist die Existenz und Eindeutigkeit von Sattelpunktlösungen. eispiele a 1 b 1 b 2 b 3 b 4 2-5 10-11 A a 2 0-1 1 2 a 3-3 1-6 1 max i 2 1 10 2 min max j i 1 In diesem eispiel existiert keine Sattelpunktlösung. min j -11-1 -6 max min i j -1 b 1 b 2 b 3 b 4 b 5 a 1 2 1 10 1 11 A a 2 3-1 -3-2 -3 a 3 2 1 15 1 3 a 4-3 -2 3-1 12 max i 3 1 15 1 12 min max j i 1 1 min j 1-3 1-3 max min i j 1 1 In diesem eispiel existieren vier Sattelpunktlösungen für die Strategien a a, b a, b 1 2 1 4, b a, b 3 2 3 4
12 Für ein 2-Personen-Nullsummenspiel gilt allgemein folgendes Theorem: max minf i j i j 144244 3 Maximum der Zeilenminima ( a,b ) min max f ( a,b ) j i 144244 3 Minimum der Spaltenmaxima i Folgende Interpretationen für f() > 0 sind möglich: Maximum der Zeilenminima: Spieler A kann sich mindestens den etrag max min f a i, b j i j von sichern. Minimum der Spaltenmaxima: Spieler braucht höchstens den etrag min max f ai, b j j i an A zu zahlen. Also: Das, was A sich von mindestens sichern kann, ist höchstens so groß wie das, was höchstens an A zu zahlen hat. eweis Es seien a i und b j zwei beliebige Strategien. Dann gilt j min f ai, b j j f ai, b j und f ai, b j max f ai, b j. i
13 Also gilt auch min f ai, b j max f ai, b j. j i Da a i und b j beliebig sind, muss dann auch gelten: max min f ai, b j min max f ai, b j. i j j i Probleme der "Rationalität" des Sattelpunktes als Lösung eines 2-Personen- Nullsummenspiels: 1) Ohne weitere Kenntnis über das Verhalten des Gegenspielers und unter erücksichtigung des vollständigen Interessengegensatzes ist es vernünftig, die Sattelpunktlösung zu wählen. 2) Weiß man, dass der Gegenspieler eine andere als seine Sattelpunktstrategie wählt, so wird man ebenfalls (im allgemeinen) eine andere Strategie wählen. eispiel Weiß A, dass im letzten Spiel die Strategie b 5 wählt, dann wird er selbst a 4 wählen und von eine Auszahlung in Höhe von 12 erhalten. 3) Selbst wenn man weiß, dass der Gegenspieler seine Sattelpunktstrategie wählt, ist es immer noch vernünftig, auch die eigene Sattelpunktstrategie zu wählen. Anschaulich gesprochen heißt dies, dass die eigene Sattelpunktstrategie die beste "Antwort" auf die Sattelpunktstrategie des anderen ist. Da dies simultan für beide Spieler gilt, bezeichnet man die Sattelpunktlösung auch als die Gleichgewichtslösung eines 2-Personen-Nullsummenspiels. Dieser Gleichgewichtsbegriff lässt sich verallgemeinern. Man versteht unter einem nichtkooperativen Gleichgewicht ein Strategienpaar * * a i, b j, dessen Strategien unabhängig voneinander gewählt wurden und auch von beiden Spielern so lange beibehalten werden, wie jeder Spieler bei seiner Gleichgewichtsstrategie bleibt.
14 Gemischte Strategien Problem: Welche Strategien sollen von beiden Spielern für das folgende Spiel ausgewählt werden? b 1 b 2 A a 1 1-1 a 2-1 1 Falls einer der beiden Spieler die Strategiewahl des anderen kennt, kann er diesen "reinlegen". Deshalb wäre Folgendes sinnvoll. Jeder Spieler wählt seine Strategie nach einem bestimmten Zufallsmechanismus aus; dann weiß noch nicht einmal er selbst, welche Strategie er wählen wird. Erst recht weiß es dann der Gegenspieler nicht. Diese Überlegungen lassen sich so für das obige eispiel konkretisieren. Spieler A wählt mit der Wahrscheinlichkeit α i die Strategie a i, mit 2 αi = 1, αi 0 i i = 1 und mit der Wahrscheinlichkeit β j die Strategie b j mit 2 βj = 1, βj 0 j j = 1 Im Folgenden ist r = α1, α α 2 ; es sei z.. α1 = α2 = 05,. 1. Fall: wählt die Strategie b 1 Der Erwartungswert der Auszahlungen für A ist dann r E α, b1 = 0,51 + 0,5( 1) = 0
15 2. Fall: wählt die Strategie b 2 Jetzt gilt r E α, b2 = 0,5( 1) + 0,51 = 0 Ergebnis: Unabhängig von der Strategiewahl des Spielers ist der Erwartungswert der Auszahlungen für den Spieler A null. Aus Symmetriegründen gelten dieselben Überlegungen für den Fall, dass β = β =, ist. 1 2 05 Eine Strategie, die mit einer Wahrscheinlichkeit < 1 gewählt wird, heißt gemischte Strategie; eine Strategie, die mit Sicherheit gewählt wird, heißt reine Strategie. eispiel A α 1 α β ( 1 β) 1 3 4 2 Der Erwartungswert der Auszahlungen für dieses Spiel ist: E α, β = αβ1 + α 1 β 3 + 1 α β4 + 1 α 1 β 2 Durch geschicktes Umformen erhält man hieraus: 1 1 E, 4 α β = α + 2 β 4 Interpretation 5 2 Spieler A kann durch die Wahl von α = 0,5 einen Gewinn von 5/2 erwarten; Spieler kann durch die Wahl von β = 1/4 verhindern, dass sein erwarteter Verlust größer als 5/2 ist. Die Lösung dieses Spiels besteht also in der Wahl der Wahrscheinlichkeiten α = 05, 1 α = 0, 5 β = 025, 1 β = 0, 75 Der Erwartungswert der Auszahlungen für diese Wahrscheinlichkeiten heißt Wert des Spiels.
16 Es gilt Folgendes Minimax-Theorem: Jedes endliche 2-Personen-Nullsummenspiel besitzt einen Sattelpunkt in reinen oder gemischten Strategien, d.h., es gilt mit r r E α, β * r r r * * r * E α, β E α, β r α = α1,..., αm a 1,..., a m r β = β1,..., βn r α - Vektor der Wahrscheinlichkeiten für die Strategien - Vektor der Wahrscheinlichkeiten für die Strategien b 1..., b n r r m n E α, β = a ij αiβ j - Erwartungswert der Auszahlung i = 1 j= 1 r, β - optimale Vektoren der Wahrscheinlichkeiten * * Das Vektorenpaar r E α *, α r *, β r * r * β ist der Wert des Spiels. heißt Lösung des Spiels oder strategischer Sattelpunkt. Das Minimax-Theorem wird auch Fundamentaltheorem für 2-Personen- Nullsummenspiele genannt. 15.2.2 2-Personen-Nicht-Nullsummenspiele A Nash-Gleichgewicht Literatur: Kreps, engl. Ausgabe, S. 402 ff. Diese Spiele unterscheiden sich von den bisherigen dadurch, dass im allgemeinen a + b 0 ist, d.h., der Gewinn des einen Spielers ist nicht notwendig gleich dem ij ij Verlust des anderen. Eine Kooperation zwischen beiden Spielern wäre hier im Grundsatz sinnvoll, ist aber entweder nicht möglich oder nicht erlaubt (Kartellgesetz!). Gibt es in den folgenden Spielen eine "offenkundige Strategiewahl"? > Wäre evtl. als Lösung zu akzeptieren.
17 (a) Hier: a b 1 b 2 a 1 10; 10 0; 0 A a 2 0; 0 1; 1 b ist "Lösung" kein Interessengegensatz 1 1 (b) b 1 b 2 a 1 0; 0 90; 91 A a 2 91; 90 0; 0 Hier: keine "Lösung" (c) a 1 A a 2 a 3 a 4 b 1 b 2 b 3 b 4 0; 0 0; 0 100; 100 0; 0 0; 0 0; 0 0; 0 99; 99 100; 100 0; 0 0; 0 0; 0 0; 0 100; 100 0; 0 0; 0 (i) Studentenexperiment Figur 15.2.2.1 a - c (ii) vielleicht "Lösung": a2 b4 wegen "Eindeutigkeit"; hier ist eine Koordination der Entscheidungen am einfachsten zu erreichen. Die Entscheidungssituation wird durch die folgende Auszahlungsmatrix beispielhaft dargestellt (Gefangenendilemma): A a 1 (leugnen) a 2 (gestehen) b 1 b 2 (leugnen) (gestehen) 1; 1 15; 0 0; 15 10; 10 In diesem eispiel bedeuten die Auszahlungen Gefängnisstrafe in Jahren. Ein eispiel für "positive" Auszahlungen: A a 1 a 2 b 1 b 2 9; 9 0; 10 10; 0 1; 1
18 Das Problem dieser Entscheidungssituation besteht darin, dass für Spieler A die Strategie a 2 die Strategie a 1 und für Spieler die Strategie b 2 die Strategie b 1 dominiert. eide Spieler "müssen" die jeweils dominante Strategie wählen und stehen sich damit beide schlechter als bei Wahl der dominierten Strategie. ei einem NASH-Gleichgewicht besteht ein Konflikt zwischen individuellem und sozialem Interesse. Jeder Spieler wählt aus individuellem Interesse die dominante Strategie; diese unabhängige Verfolgung des Eigeninteresses ist jedoch nicht zum Vorteil des Gruppeninteresses: beide erhalten im NASH-Gleichgewicht weniger als bei Wahl der dominierten Strategie. Würde jeder darauf vertrauen, dass der andere "nett" ist und seine dominierte Strategie wählt, dann könnte er auch "nett" sein. Nur besteht dann wieder für beide die Gefahr, dass er wieder vom Gegenspieler "reingelegt" wird. Das Strategienpaar a 2, b 2 stellt im obigen Spiel ein NASH-Gleichgewicht dar. Dieses lässt sich in der folgenden Weise allgemein definieren: Unter einem NASH-Gleichgewicht versteht man eine Strategiewahl, bei der kein Spieler einen Anreiz hat, von seiner Strategie abzuweichen, solange der andere Spieler ebenfalls seine Strategie beibehält. Lit.: Kreps, a.a.o. ezeichnungen i = 1,..., I Menge der Spieler S i - Strategienmenge des i-ten Spielers s = s1,..., si - Strategienprofil u i s S, i i i ( s) - Auszahlung des i-ten Spielers beim Strategienprofil s Definition Ein Strategienprofil ŝ = ŝ1,..., ŝi ist ein Nash-Gleichgewicht, falls für jeden Spieler i und s S gilt i u i ŝ ui ŝ1,..., ŝi 1, si, ŝi + 1,..., ŝi i Mit dieser Definition ist Folgendes festzustellen: (Hinweis: Ein Strategienprofil wird auch mit a b bezeichnet.) (1) In Figur 15.2.2.1 a gibt es zwei Nash-Gleichgewichte: a1 b1und a2 b2. i j
19 (2) In Figur 15.2.2.1 b gibt es zwei Nash-Gleichgewichte: a1 b2 und a2 b1. (3) In Figur 15.2.2.1 c gibt es vier Nash-Gleichgewichte: a1 b3, a2 b4, a b und a b. Ergebnis: 3 1 4 1 (1) Die Eigenschaft des Nash-Gleichgewichts ist eine notwendige edingung für eine "Lösung". (2) Diese Eigenschaft ist allerdings nicht hinreichend, vgl. oben (1) mit a2 b2. (3) Es mag überhaupt keine "Lösung" geben, selbst wenn Nash-Gleichgewichte existieren, vgl. oben (2). Verfeinerungen des Nash-Gleichgewichts Strikte Dominanz Ausgangspunkt: Manche Spiele sind lösbar über strikte Dominanz. eispiel: A a 1 a 2 b 1 b 2 b 3 4; 3 2; 7 0; 4 5; 5 5; -1-4; -2
20 Lösung durch strikte Dominanz. 7 > (1) b 2 dominiert b 3 strikt: 1 > 4 2 also: spielt nicht b 3 (2) ohne b 3 dominiert a2 a1 : 5 5 > > 4 2 also: A wählt a 2 (3) Wenn das alles überblickt, muss er b 1 wählen: 5 > -1 Ergebnis (Lösung): a b 2 1 Lösungskriterium: sukzessive strikte Dominanz. Das Spiel ist dominanzlösbar. Schwache Dominanz ei schwacher Dominanz wird dies problematisch: A a 1 a 2 b 1 b 2 10; 0 5; 2 10; 11 2; 0 Feststellung: a 1 dominiert a 2 schwach: die Auszahlungen sind niemals kleiner für A, aber mindestens einmal größer. (1) A spielt deswegen nicht a 2, sondern a 1. (2) spielt daraufhin b 2. (3) "Lösung": a b ; dieser Punkt ist ein Nash-Gleichgewicht. 1 2 Aber a2 b1 ist auch ein Nash-Gleichgewicht! Und: dies ist für beide besser als a b. 1 2 Aber: diese "Lösung" erfordert das Spielen einer schwach dominierten Strategie, nämlich a 2. Die hier vorzutragende Verfeinerung lautet jedoch: Nur solche Nash- Gleichgewichte kommen in etracht, die das Spielen von schwach dominierten Strategien ausschließen. egründung.
21 (1) Man muss unterscheiden zwischen absoluter Gewissheit und großer Sicherheit. (2) Ist A absolut gewiss, dass b 1 spielt, dann kann er a 2 spielen: a2 b1 ist eine "Lösung". (3) Ist A aber nur sehr sicher, dass b 1 spielt, dann besteht die Möglichkeit, dass b 2 spielt; die Wahrscheinlichkeit hierfür ist positiv. Dann gibt die Strategie a 1 für A einen höheren Erwartungswert als a 2. (4) In diesem Fall muss A die Strategie a 1 spielen, denn für jede Wahrscheinlichkeit, mit der b 2 spielt, ist E a2 > E a 1. Kern der Argumentation: Für Situationen, die man mit Hilfe der Spieltheorie modelliert, hat man niemals absolute Gewissheit. Man kann niemals irgendeine Strategiewahl des Gegenspielers absolut sicher ausschließen. Deshalb werden nur Nash-Gleichgewichte akzeptiert, in denen keine schwach dominierten Strategien gespielt werden. Teilspielperfektes Nash-Gleichgewicht Literatur Selten, R. (1965): Spieltheoretische ehandlung eines Oligopolmodells mit Nachfrageträgheit. Z. f. d. ges. St., 121, 301-324. Grundlage: Spiele in extensiver Form. Teilspiel: beginnt an einem beliebigen Knoten des Spiels in extensiver Form und hat keine Verbindung zu einem anderen Teil des (Rest-)Spiels. Idee: Nur solche Nash-Gleichgewichte werden als "Lösung" akzeptiert, wenn es für keinen Spieler optimal ist, bei irgendeinem Teilspiel, das an einem beliebigen Knoten beginnt, von seiner Strategie abzuweichen. Solche Nash-Gleichgewichte heißen teilspielperfekt. Inhaltliche egründung: Sind Drohungen glaubhaft? Markteintrittsspiel: (Holler/Illing, S. 17) Spieler : Monopolist Spieler A: potentieller Konkurrent a 1 : nicht in den Markt eintreten a 2 : eintreten b 1 : Vernichtungskampf (Drohung) b 2 : Marktteilung (wirtschaftsfriedliches Verhalten)
22 extensive Form: Abbildung 15.2.2.1 Normalform: A a 1 a 2 b 1 b 2 0; 100 0; 100-10; -10 40; 40 Es existieren zwei Nash-Gleichgewichte. Problem: Ist a Dazu: b aufrechtzuerhalten? 1 1 A weicht einseitig von a b ab a 2 1 1 (i) "Eigentlich" muss er nun mit -10 rechnen (ii) aber: im Entscheidungsknoten des wird b 1 durch b 2 dominiert; dort beginnt ein neues Teilspiel. (iii) Die Drohung ist nicht glaubwürdig. Ergebnis: Das Nash-Gleichgewicht ist nicht teilspielperfekt. Es kommt daher als "Lösung" nicht in etracht. Endergebnis: Nur teilspielperfekte Nash-Gleichgewichte werden als "Lösung" akzeptiert.