Übersicht Teil 2 Kaitel 7 und Kaitel 8: Gleichgewichte in gemischten Strategien Übersicht Teil 2 2 Übersicht Einleitung Was ist eine gemischte Strategie? Nutzen aus gemischten Strategien Reaktionsfunktionen Nashgleichgewicht in gemischten Strategien Anwendungen Mischen wenn ein Sieler drei oder mehr reine Strategien hat Einleitung Übersicht 3 Einleitung 4 Am Ende des Kaitels 4 wurde bereits eine Sielsituation beschrieben welche mit den bisherigen Ansätzen nicht lösbar war. RONALDO Fussballsiel Links Rechts Links KAHN Rechts -,, -, - -, Um Prognosen und Ratschläge für solche Sielsituationen bereitzustellen müssen die bisherigen Strategie- und Gleichgewichtskonzete erweitert werden. Dies wird durch das Randomisieren der Sielzüge erreicht. Es existiert kein Gleichgewicht in reinen Strategien. Einleitung 5 Einleitung 6
Modellrahmen Was ist eine gemischte Strategie? Wir betrachten Siele mit simultanen Zügen, beschrieben durch die Sieler die Menge der Aktionen, zwischen denen jeder Sieler wählen kann. die Auszahlungsfunktionen der Sieler. Was ist eine gemischte Strategie? 7 Was ist eine gemischte Strategie? 8 In unserer bisherigen Analyse haben wir in einem solchen Siel die Menge der Aktionen eines Sielers mit der Menge seiner Strategien identifiziert. Eine Strategie für einen Sieler bestand also bisher darin, dass er eine seiner Aktionen mit Sicherheit wählt. Nun erweitern wir die Menge der möglichen Strategien eines Sielers und nehmen an, dass eine Strategie jeder seiner Aktionen eine Wahrscheinlichkeit zuordnet, mit der er sie wählen wird. Was ist eine gemischte Strategie? 9 Was ist eine gemischte Strategie? 0 Eine solche gemischte Strategie eines Sielers besteht also aus einer Liste von Wahrscheinlichkeiten, die so viele Einträge umfasst, wie der Sieler Aktionen besitzt. In einem Siel mit gemischten Strategien ist die Strategiemenge eines jeden Sielers durch die Menge aller solchen gemischten Strategien gegeben. Reine Strategie: Eine bestimmte Handlung wird mit Sicherheit gewählt. Gemischte Strategie: Die Handlung wird zufällig gewählt (der Sieler würfelt bevor er eine Handlung wählt). Bs. Schere-Stein-Paier Bs. Elfmeter Was ist eine gemischte Strategie? Was ist eine gemischte Strategie? 2
Erwartete Auszahlung In einem Siel mit gemischten Strategien können die Sieler auch reine Strategien wählen Eine reine Strategie entsricht einer gemischten Strategie, in der eine der Aktionen die Wahrscheinlichkeit erhält... und alle anderen Aktionen die Wahrscheinlichkeit 0. Die Auszahlungsfunktionen der Sieler beschreiben in unserer bisherigen Interretation nur, wie die Sieler die Ergebnisse aus reinen Strategienkombinationen bewerten. Um ein Siel mit gemischten Strategien zu analysieren, braucht es aber auch eine Bewertung von gemischten Strategienkombinationen. Was ist eine gemischte Strategie? 3 Was ist eine gemischte Strategie? 4 Per Annahme ist diese durch die erwartete Auszahlung einer gemischten Strategienkombination gegeben. Die erwartete Auszahlung einer gemischten Strategienkombination entsricht dem mathematischen Erwartungswert der Auszahlungen. Erhält man z.b. mit Wahrscheinlichkeit 0.7 die Auszahlung 2 und mit Wahrscheinlichkeit 0.3 die Auszahlung 6, so ist die erwartete Auszahlung 0.7 2 + 0.3 6 = 0.2. Was ist eine gemischte Strategie? 5 Was ist eine gemischte Strategie? 6 RONALDO Fussballsiel Links 50% Rechts 50% KAHN Links 50% Rechts 50% -,, -, - -, Strategiekombination: Beide Sieler werfen eine Münze. Erwartete Auszahlung: 0.25 (-) + 0.25 () + 0.25 () + 0.25 (-) = 0 - Allgemein 2-50, 50 80, 20 90, 0 20, 80 Erwartete Auszahlung : u(, ) = 50 + 80( ) + 90( ) + 20( )( ) Erwartete Auszahlung 2: v(, ) = 50 + 20( ) + 0( ) + 80( )( ) Was ist eine gemischte Strategie? 7 Was ist eine gemischte Strategie? 8
Tennissiel: Roddick gegen Federer Nutzen aus gemischten Strategien DL: Down the line CC: Cross court RODDICK DL CC FEDERER DL CC 50, 50 80, 20 90, 0 20, 80 Nutzen aus gemischten Strategien 9 Nutzen aus gemischten Strategien 20 Angenommen Roddick muss sich für eine reine Strategie entscheiden und Federer kann diese erfekt vorhersagen. In diesem Fall ist DL für Roddick die bessere Wahl. Sie gibt ihm eine Auszahlung von 50. (Auch Federer sielt DL und hat eine Auszahlung von 50) Angenommen Roddick kann sich nun auch für gemischte Strategien entscheiden und wählt beisielweise 90% DL und 0% CC. Die erwartete Auszahlung für Federer beträgt: DL: 0.9*50 + 0.*0 = 46 CC: 0.9*20 + 0.*80 = 26 => Federer Sielt weiterhin DL Roddick kann somit seine erwartete Auszahlung durch diese gemischte Strategie auf 54 erhöhen und es gibt vielleicht noch bessere gemischte Strategien Nutzen aus gemischten Strategien 2 Nutzen aus gemischten Strategien 22 Federer kennt zwar noch immer die Strategie von Roddick, er weiss aber nicht mit Sicherheit ob der nächste Schlag DL oder CC ist. Welche gemischte Strategie die erwartete Auszahlung von Roddick maximiert ist noch nicht bekannt. Reaktionsfunktionen Die Methode diese zu ermitteln wird auf den nächsten Folien erläutert. Nutzen aus gemischten Strategien 23 Reaktionsfunktionen 24
DL: Down the line CC: Cross court RODDICK Tennissiel FEDERER DL CC DL () 50, 50 80, 20 CC (-) 90, 0 20, 80 Reaktionsfunktion: Federer FEDERER DL () CC (-) DL () 50, 50 80, 20 RODDICK CC (-) 90, 0 20, 80 Nehmen wir an, dass Roddick DL mit Wahrscheinlichkeit sielt und Federer das erfekt voraussieht. Mit welchem Schlag sollte Federer antworten? -Mischung 50 + 0( - ) 20 + 80( - ) Federers erwartete Auszahlung falls er DL sielt Federers erwartete Auszahlung falls er CC sielt Reaktionsfunktionen Reaktionsfunktion: Federer 25 Reaktionsfunktionen Reaktionsfunktion: Federer 26 Wir berechnen nun Federers Kurve bester Antworten (Reaktionsfunktion) wenn Roddick DL mit Wahrscheinlichkeit sielt. Wenn Federer die reine Strategie DL sielt, erhält er die Auszahlung 50 + 0( ). Wenn er CC sielt, erhält er 20 + 80( ). Falls 50 + 0( ) > 20 + 80( ) ist die beste Antwort DL. Falls 50 + 0( ) < 20 + 80( ) ist die beste Antwort CC. Falls 50 + 0( ) = 20 + 80( ) ist Federer indifferent zwischen DL und CC. Kritischer Wert: 50 + 0( ) = 20 + 80( ) = 0.7 Reaktionsfunktionen Reaktionsfunktion: Federer 27 Reaktionsfunktionen Reaktionsfunktion: Federer 28 Erfolg (%) von Federer 80 Auszahlung Federers falls er beste Antwort gegen sielt. Beste Antwort Federers: CC mit Sicherheit (d.h. = 0) falls < 0.7 Beste Antwort Federers: DL mit Sicherheit (d.h. = ) falls > 0.7 Auszahlung Federers falls er DL sielt: 50 + 0( ) 50 Beste Antwort Federers: Er ist indifferent, jedes ist gleich gut falls = 0.7 0 0 Auszahlung Federers falls er CC sielt: 20 + 80( ) 0.7 20 0.7 Reaktionsfunktionen Reaktionsfunktion: Federer 29 Reaktionsfunktionen Reaktionsfunktion: Federer 30
RODDICK Reaktionsfunktion: Roddick DL () FEDERER CC (-) -Mischung DL 50, 50 80, 20 50 + 80( - ) CC 90, 0 20, 80 90 + 20( - ) Wir berechnen nun Roddicks Kurve bester Antworten, wenn Federer DL mit Wahrscheinlichkeit sielt. Wenn Roddick die reine Strategie DL sielt, erhält er die Auszahlung 50 + 80( ). Roddicks erwartete Auszahlung falls er DL sielt. Roddicks erwartete Auszahlung falls er CC sielt. Wenn er CC sielt, erhält er 90 + 20( ). Reaktionsfunktionen Reaktionsfunktion: Roddick 3 Reaktionsfunktionen Reaktionsfunktion: Roddick 32 Falls 50 + 80( ) > 90 + 20( ) ist die beste Antwort DL. Falls 50 + 80( ) < 90 + 20( ) ist die beste Antwort CC. Falls 50 + 80( ) = 90 + 20( ) ist Roddick indifferent zwischen DL und CC. Kritischer Wert: 50 + 80( ) = 90 + 20( ) = 0.6 Erfolg (%) von Roddick 80 20 Auszahlung Roddicks falls er CC sielt: 90 + 20( ) Auszahlung Roddicks falls er beste Antwort gegen sielt. 90 50 Auszahlung Roddicks falls er DL sielt: 50 + 80( ) 0 0.6 Reaktionsfunktionen Reaktionsfunktion: Roddick 33 Reaktionsfunktionen Reaktionsfunktion: Roddick 34 Beste Antwort Roddicks: DL mit Sicherheit (d.h. = ) falls < 0.6 Beste Antwort Roddicks: Er ist indifferent, jedes ist gleich gut falls = 0.6 Beste Antwort Roddicks: CC mit Sicherheit (d.h. = 0) falls > 0.6 Nashgleichgewicht in gemischten Strategien 0.6 Reaktionsfunktionen Reaktionsfunktion: Roddick 35 Gleichgewicht 36
Ein Nashgleichgewicht in gemischten Strategien ist nur ein anderer Name für ein Nashgleichgewicht in einem Siel mit gemischten Strategien. Ein Nashgleichgewicht in gemischten Strategien besteht also aus einer gemischten Strategie für jeden Sieler mit der Eigenschaft, dass die gemischte Strategie eines jeden Sielers eine beste Antwort auf die gemischten Strategien der anderen Sieler bildet. Theorem Jedes endliche Siel mit simultanen Zügen besitzt mindestens ein Nashgleichgewicht in gemischten Strategien. Gleichgewicht 37 Gleichgewicht 38 Anmerkungen: Endlich bedeutet, dass es eine endliche Anzahl von Sielern gibt, die jeweils über eine endliche Anzahl von Aktionen verfügen. Auch ein Nashgleichgewicht in reinen Strategien ist ein Nashgleichgewicht in gemischten Strategien. Kein Sieler kann sich verbessern gegeben der gemischten Strategie des anderen Sielers. Die Strategien sind gegenseitig beste Antworten. Gleichgewicht 39 Nash Gleichgewicht 40 Eigenschaften eines Nash Gleichgewichts in gemischten Strategien: Jeder Sieler ist zwischen seinen Handlungen indifferent (er kann sich aber nicht strikt verbessern). Federers Reaktionsfunktion (Kurve bester Antworten) Die Sieler wählen eine Strategie, welche den Gegner indifferent macht zwischen seinen Handlungen. 0.7 Nash Gleichgewicht 4 Nash Gleichgewicht 42
Roddicks Reaktionsfunktion (Kurve bester Antworten) Roddicks Reaktionsfunktion (auf den Kof gestellt) Federers Reaktionsfunktion (Kurve bester Antworten) Roddicks Reaktionsfunktion (Kurve bester Antworten) 0.6 0.6 0.6 0.7 Nash Gleichgewicht 43 Nash Gleichgewicht 44 : Nash Gleichgewicht Erwartete Auszahlungen im Nash Gleichgewicht 0.6 DL FEDERER CC RODDICK DL CC 50() 80()( ) 90( )() 20( )( ) 0.7 Nash Gleichgewicht 45 Nash Gleichgewicht 46 Ro: 50() + 80(-) + 90(-) + 20(-)(-) = -00 + 60 + 70 + 20 Fe: 50() + 20(-) + 0(-) + 80(-)(-) = 00-60 - 70 + 80 Anwendung: Chicken-Siel Auszahlung im GG Federer =0.6 und Roddick =0.7 Roddick: 62% Federer: 38% Nash Gleichgewicht 47 Anwendung: Chicken-Siel 48
JAMES ausweichen geradeaus ausweichen 0, 0 -, geradeaus DEAN, - -2, -2 JAMES Reaktionsfunktion: Dean DEAN ausweichen geradeaus ausweichen 0, 0 -, geradeaus, - -2, -2 Zwei Gleichgewichte in reinen Strategien. Gibt es ein weiteres Gleichgewicht in gemischten Strategien? x ausweichen + (-) ) x geradeaus -(-) -2(-) Anwendung: Chicken-Siel 49 Anwendung: Chicken-Siel 50 James wählt ausweichen mit Wahrscheinlichkeit. Wenn Dean ausweichen wählt, ist seine erwartete Auszahlung ( ) = ( ). Wenn Dean geradeaus wählt ist seine Auszahlung 2( ) = 3 2. Falls > 3 2 ist die beste Antwort ausweichen. Falls < 3 2 ist die beste Antwort geradeaus. Falls = 3 2 ist Dean indifferent zwischen ausweichen und geradeaus. Kritischer Wert: = 3 2 = 0.5 Anwendung: Chicken-Siel 5 Anwendung: Chicken-Siel 52 Auszahlung von Dean Auszahlung wenn Dean beste Antwort wählt. : Wahrscheinlichkeit mit der Dean ausweichen wählt 0-0.5 - - 2 0.5 Wenn Dean geradeaus fährt Wenn Dean ausweicht Dean wählt ausweichen 0.5 Dean ist indifferent Dean wählt geradeaus Coyright 2000 by W.W. Norton & Comany Anwendung: Chicken-Siel 53 Anwendung: Chicken-Siel 54
JAMES Reaktionsfunktion: James ausweichen () geradeaus (-) x ausweichen + (-) x geradeaus ausweichen 0, 0 -, ( ) geradeaus DEAN, - -2, -2 2( ) Nehme an Dean wählt ausweichen mit Wahrscheinlichkeit. Wenn James ausweichen wählt, ist seine erwartete Auszahlung ( ) = ( ). Wenn Dean geradeaus wählt ist seine Auszahlung 2( ) = 3 2. Anwendung: Chicken-Siel 55 Anwendung: Chicken-Siel 56 Falls > 3 2 ist die beste Antwort ausweichen. Falls < 3 2 ist die beste Antwort geradeaus. Falls = 3 2 ist Dean indifferent zwischen ausweichen und geradeaus. Kritischer Wert: = 3 2 = 0.5 Auszahlung von James 0-0.5 - - 2 Auszahlung, wenn James beste Antwort wählt. 0.5 Wenn James geradeaus fährt Wenn James ausweicht Coyright 2000 by W.W. Norton & Comany Anwendung: Chicken-Siel 57 Anwendung: Chicken-Siel 58 Nash Gleichgewichte James Kurve der besten Antwort James Kurve der besten Antwort Deans Kurve der besten Antwort 0.5 0.5 Anwendung: Chicken-Siel 59 Anwendung: Chicken-Siel 60
: Nash Gleichgewichte Anwendung: Kamf der Geschlechter 0.5 Anwendung: Chicken-Siel 6 Anwendung: Kamf der Geschlechter 62 Reaktionsfunktion: Evelyn EVELYN Fussball Ballet EVELYN Fussball Ballet Fussball 2, 0, 0 HANNES Fussball 2, 0, 0 HANNES Ballet 0, 0, 2 Ballet 0, 0, 2 x Fussball + (-) x Ballet 2 x (-) Anwendung: Kamf der Geschlechter 63 Anwendung: Kamf der Geschlechter 64 Evelyns Auszahlung 2 Auszahlung falls Evelyn beste Antwort wählt : Wahrscheinlichkeit mit der Evelyn Fussball wählt. Ehefrau wählt Fussball Evelyn wählt Ballet 0 2/3 Coyright 2000 by W.W. Norton & Comany 2/3 Anwendung: Kamf der Geschlechter 65 Anwendung: Kamf der Geschlechter 66
Reaktionsfunktion: Hannes EVELYN Fussball Ballet x Fussball + (-) ) x Ballet Auszahlung Hannes Auszahlung falls beste Antwort 2 Hannes wählt Fussball HANNES Fussball 2, 0, 0 2 Hannes wählt Ballet Ballet 0, 0, 2-0 /3 Coyright 2000 by W.W. Norton & Comany Anwendung: Kamf der Geschlechter 67 Anwendung: Kamf der Geschlechter 68 Nash Gleichgewichte 2/3 /3 /3 Anwendung: Kamf der Geschlechter 69 Anwendung: Kamf der Geschlechter 70 : Nash Gleichgewichte 2/3 /3 Anwendung: Kamf der Geschlechter 7