Ablauf. 1 Imitationsdynamik. 2 Monotone Auszahlung. 3 Entscheidung gegen iterativ dominierte Strategien. 4 Beste-Antwort-Dynamik 2 / 26

Ähnliche Dokumente
Bimatrix-Spiele. Sarah Hidlmayer

Asymmetrische Spiele. Eric Barré. 13. Dezember 2011

Lotka-Volterra-Gleichungen für mehr als zwei Populationen

Geometrie in der Spieltheorie

Kapitel 13. Evolutionäre Spieltheorie. Einleitung. Evolutionäre Biologie. Übersicht 2. Alternative: Biologische Evolutionstheorie

1 Lektion 7: Evolutorische Spieltheorie. Evolution?r stabile Strategien und Replikatordynamik als Beitrag aus der Biologie

Evolutionär stabile Strategien

Der Begriff der konvexen Menge ist bereits aus Definition 1.4, Teil I, bekannt.

Beispiel: Evolution infizierter Individuen

18 Höhere Ableitungen und Taylorformel

MAA = MAB + B AA = B CA + CAA BA A Nun sehen wir mit Proposition 10.7 aus dem Skript, dass A M AB gelten muss.

TEILWEISE ASYNCHRONE ALGORITHMEN

Dynamische Systeme eine Einführung

Lösungen zu den Hausaufgaben zur Analysis II

Abbildung 5.1: stabile und instabile Ruhelagen

01. Gruppen, Ringe, Körper

Klausur zur Vorlesung Spieltheorie Musterlösung

11 Logarithmus und allgemeine Potenzen

10 Untermannigfaltigkeiten

Analysis I - Stetige Funktionen

Kapitel 16 : Differentialrechnung

2. Vorlesung. 1.3 Beste-Antwort Funktion. Vorlesung: Einführung in die Spieltheorie WS 2006/ Oktober 2006 Guido Schäfer

Seminararbeit zur Spieltheorie. Thema: Rationalisierbarkeit und Wissen

Unabhängigkeit KAPITEL 4

Katalytische Hyperzyklen

12. Vorlesung. 19. Dezember 2006 Guido Schäfer

Spieltheorie - Wiederholte Spiele

Regularitätsresultate für parabolische Gleichungen mit nichtlokalem Operator

Darstellungsformeln für die Lösung von parabolischen Differentialgleichungen

Universität des Saarlandes Seminar der Fachrichtung Mathematik Rudolf Umla

Seminar stabile Zufallsprozesse

Wiederholte Spiele. Grundlegende Konzepte. Zwei wichtige Gründe, wiederholte Spiele zu betrachten: 1. Wiederholte Interaktionen in der Realität.

7. Die Brownsche Bewegung

Konstruktion der reellen Zahlen

Mathematik für Wirtschaftswissenschaftler. gehalten von Claus Diem

Proseminar Konvexe Mengen: Der Satz von Carathéodory

Räuber-Beute-Modelle, Auslese/Schwellensatz

:50:11 REZ: Spieltheorie SoSe Sitzung 7

Übungen zu Einführung in die Numerische Mathematik (V2E2) Sommersemester 2016

MATHEMATIK FÜR WIRTSCHAFTSWISSENSCHAFTLER MUSTERLÖSUNG 3. TEST

Kapitel 5: Spiele mit simultanen Spielzügen und reinen Strategien: Kontinuierliche Strategien

Mathematik II für Studierende der Informatik. Wirtschaftsinformatik (Analysis und lineare Algebra) im Sommersemester 2016

Kurze Einführung zu Stabilität bei Differentialgleichungen und Einschrittverfahren

Übungsaufgaben zur Vorlesung ANALYSIS I (WS 12/13) Lösungsvorschlag Serie 12

Evolutionäre Spiele. Wolfgang Mulzer, Yannik Stein

Verfeinerungen des Bayesianischen Nash Gleichgewichts

Kapitel 1. Grundlegendes

Stabilität von n-spezies Gemeinschaften

Markov-Prozesse. Markov-Prozesse. Franziskus Diwo. Literatur: Ronald A. Howard: Dynamic Programming and Markov Processes

Die Gamma-Funktion, das Produkt von Wallis und die Stirling sche Formel. dt = lim. = lim = Weiters erhalten wir durch partielle Integration, dass

Asymptotische Stochastik (SS 2010)

4 Fehlerabschätzungen und Konvergenz der FEM

Kapitel XII - Kennzahlen mehrdimensionaler Zufallsvariablen

Spieltheorie mit. sozialwissenschaftlichen Anwendungen

Einführung in die Stochastik 6. Übungsblatt

Partielle Informationen in Währungskrisenmodellen

3 Lineare Differentialgleichungen

Analysis und Lineare Algebra mit MuPAD

5 Stetigkeit und Differenzierbarkeit

2 Die Dimension eines Vektorraums

13. Funktionen in einer Variablen

SBP Mathe Aufbaukurs 3. Imaginäre und komplexe Zahlen. Komplexe Zahlen in der Gaußschen Zahlenebene. Darstellungen komplexer Zahlen.

3. Das Reinforcement Lernproblem

Definition: Die Menge der Imputationen ist die Menge I aller Nutzenallokationen, die erreichbar und individuell rational sind.

Folgen, Reihen, Grenzwerte u. Stetigkeit

Statistik und Wahrscheinlichkeitsrechnung

Einführung in die Spieltheorie und Nash-Gleichgewichte

Flüsse, Fixpunkte, Stabilität

ε δ Definition der Stetigkeit.

Formale Methoden 1. Gerhard Jäger 9. Januar Uni Bielefeld, WS 2007/2008 1/23

Theorie der Wärme Musterlösung 11.

Einwegfunktionen. Problemseminar. Komplexitätstheorie und Kryptographie. Martin Huschenbett. 30. Oktober 2008

Vorlesung: Nicht-kooperative Spieltheorie. Teil 4: 2-Personen-Nullsummenspiele

1 Der Simplex Algorithmus I

Vergleich von Entscheidungsträgern bzgl. ihrer Risikoaversion:

3.3 Skalarprodukte 3.3. SKALARPRODUKTE 153

Analysis I für Studierende der Ingenieurwissenschaften

Differential- und Integralrechnung

Übungsskript Regelungstechnik 2

r i w i (siehe (3.7)). r i v, w i = 0.

[5], [0] v 4 = + λ 3

4 Fehlerabschätzungen und Konvergenz der FEM

x, y 2 f(x)g(x) dµ(x). Es ist leicht nachzuprüfen, dass die x 2 setzen. Dann liefert (5.1) n=1 x ny n bzw. f, g = Ω

2 Folgen und Reihen. 2.1 Folgen in C Konvergenz von Folgen. := f(n)

KAPITEL 1: ENDLICHE KÖRPER 1 ALLGEMEINES 2 GLEICHUNGEN ÜBER EINEM ENDLICHEN KÖRPER

Übungsaufgaben Lösungen

8 Der Kompaktheitssatz und der Satz von Löwenheim und Skolem

Die Schreibweise x M bedeutet, dass das Objekt x in der Menge M liegt. Ist dies nicht der Fall, dann schreibt man

2.3 Kriterien der Entscheidungsfindung: Präferenzen

3. Prozesse mit kontinuierlicher Zeit

Newton-Verfahren zur gleichungsbeschränkten Optimierung. 1 Gleichungsbeschränkte Optimierungsprobleme

Topologische Grundbegriffe I. 1 Offene und Abgeschlossene Mengen

35 Stetige lineare Abbildungen

Mathematische Ökologie

ANALYSIS I FÜR TPH WS 2016/17 3. Übung Übersicht

Übungen zu Kurvenintegralen Lösungen zu Übung 12

f(x, y) = 0 Anschaulich bedeutet das, dass der im Rechteck I J = {(x, y) x I, y J}

Inexakte Newton Verfahren

Konvexe Funktionen und Legendre-Transformation

cos(kx) sin(nx)dx =?

Transkript:

Spieldynamik Josef Hofbauer and Karl Sigmund: Evolutionary Games and Population Dynamics, Cambridge, Kap. 8 Simon Maurer Saarbrücken, den 13.12.2011 1 / 26

Ablauf 1 Imitationsdynamik 2 Monotone Auszahlung 3 Entscheidung gegen iterativ dominierte Strategien 4 Beste-Antwort-Dynamik 2 / 26

Imitationsdynamik Voraussetzungen: Symmetrische Spiele mit (n x n) - Auszahlungsmatrix eine (große) Population von Spielern reine Strategien R 1 bis R n werden mit einer Wiederholungsrate x i (t) gewählt 3 / 26

Imitationsdynamik Voraussetzungen: Symmetrische Spiele mit (n x n) - Auszahlungsmatrix eine (große) Population von Spielern reine Strategien R 1 bis R n werden mit einer Wiederholungsrate x i (t) gewählt Zustand ist zu jedem Zeitpunkt durch einen Punkt x S n gegeben 3 / 26

Imitationsdynamik Voraussetzungen: Symmetrische Spiele mit (n x n) - Auszahlungsmatrix eine (große) Population von Spielern reine Strategien R 1 bis R n werden mit einer Wiederholungsrate x i (t) gewählt Zustand ist zu jedem Zeitpunkt durch einen Punkt x S n gegeben Auszahlung: Strategie R i erhält dann (Ax) i = a ij x j pro Spiel die durchschnittliche Auszahlung der Population ist x A x 3 / 26

Imitationsdynamik Gelegentliche Auswahl eines Spielers der Population, Möglichkeit, die Strategie zu wechseln, Wahlprozess zufällig, übernimmt mit einer gewissen Wahrscheinlichkeit dessen Strategie. 4 / 26

Imitationsdynamik Gelegentliche Auswahl eines Spielers der Population, Möglichkeit, die Strategie zu wechseln, Wahlprozess zufällig, übernimmt mit einer gewissen Wahrscheinlichkeit dessen Strategie. Ein genereller Ansatz wird durch das Input-Output-Modell repräsentiert: Input-Output-Modell ẋ i = x i ( fij (x) f ji (x) ) x j. j 4 / 26

Imitationsdynamik Gelegentliche Auswahl eines Spielers der Population, Möglichkeit, die Strategie zu wechseln, Wahlprozess zufällig, übernimmt mit einer gewissen Wahrscheinlichkeit dessen Strategie. Ein genereller Ansatz wird durch das Input-Output-Modell repräsentiert: Input-Output-Modell ẋ i = x i ( fij (x) f ji (x) ) x j. j Klar: Ist ẋ i = 0, so ist S n invariant unter obiger Formel. 4 / 26

Imitationsdynamik Die Änderungsrate von R j zu R i ist gegeben durch x i x j f ij t mit x i x j = Wahrscheinlichkeit für das Auswählen eines Spielers mit Strategie R j bzw. R i, f ij = Rate mit der ein R j -Spieler zu R i umschwenkt 5 / 26

Imitationsdynamik Die Änderungsrate von R j zu R i ist gegeben durch x i x j f ij t mit x i x j = Wahrscheinlichkeit für das Auswählen eines Spielers mit Strategie R j bzw. R i, f ij = Rate mit der ein R j -Spieler zu R i umschwenkt Diese Rate hängt natürlich von der momentanen Auszahlung (Ax) i und (Ax) j ab. f ij (x) = f ( (Ax) i, Ax) j ) mit f = f(u, v) Funktion, welche die Imitationsvorschrift angibt. 5 / 26

Imitationsdynamik Imitiere den Besseren Erste Idee: 0, wenn u < v f(u, v) = 1, wenn u > v 6 / 26

Imitationsdynamik Imitiere den Besseren Erste Idee: 0, wenn u < v f(u, v) = 1, wenn u > v Problem: Diese Funktion ist unstetig. 6 / 26

Imitationsdynamik Imitiere den Besseren Erste Idee: 0, wenn u < v f(u, v) = 1, wenn u > v Problem: Diese Funktion ist unstetig. Ausweg: Man definiert sich eine Funktion, die von der Auszahlungsdifferenz abhängig ist. 6 / 26

Imitationsdynamik Definiere z.b. f(u, v) als f(u, v) = φ(u v) mit φ monoton wachsend. 7 / 26

Imitationsdynamik Definiere z.b. f(u, v) als f(u, v) = φ(u v) mit φ monoton wachsend. Das Input-Output-Modell kann dann mit ψ(u) = φ(u) φ( u) (ungerade, monoton wachsend) geschrieben werden als: ẋ i = x i x j ψ ( ) (Ax) i Ax) j j 7 / 26

Imitationsdynamik Beispiel Setze φ(u) u α +, α 0 und ψ(u) u α + sgn(u). Für α = 1 ergibt sich ψ(u) = u. Diese Imitationsvorschrift ist proportional und bedeutet im Endeffekt imitiere Verhalten mit höherem Profit, gewichtet mit einer Wahrscheinlichkeit, die proportional zum erwarteten Gewinn ist. Das Input-Output-Modell reduziert sich dann zur gewohnten Replikatordynamik: ẋ i = x i ( (Ax)i x Ax ). Im Grenzfall α 0 entsteht nun aus dem Input-Output-Modell die zuvor angesprochene Imitiere den Besseren-Strategie. 8 / 26

Imitationsdynamik Das Input-Output-Modell lässt sich auch wie folgt darstellen: ( ( ) ) ẋ i = x i f (Ax)i f mit f = ( ) x i f (Ax) i Dieser Fall tritt dann auf, wenn ein Spieler zu einer besseren Strategie wechselt, die proportional zur Differenz [f((ax) i ) f((ax) j )] + ist, wenn f ij = f((ax) i ), d.h. der Wechsel ist nur vom imitierten Spieler abhängig, wenn f ij = f((ax) j ), d.h. der Wechsel ist nur von der Auszahlung an der imitierenden Spieler abhängig (Imitation aufgrund Unzufriedenheit, mit der Annahme, dass unerfolgreiche Spieler öfters und blind imitieren). 9 / 26

Monotone Auszahlung Nun interessieren uns Spieldynamiken der Form ẋ i = x i g i (x) mit g i C 1 und x i g i (x) = 0 x S n. 10 / 26

Monotone Auszahlung Nun interessieren uns Spieldynamiken der Form ẋ i = x i g i (x) mit g i C 1 und x i g i (x) = 0 x S n. Definition: Auszahlungsmonoton Eine Spieldynamik wird als auszahlungsmonoton bezeichent, falls sich die Wachstumsrate der verschiedenen Strategien direkt proportional zur erwarteten Auszahlung verhält: g i (x) > g j (x) (Ax) i > (Ax) j 10 / 26

Monotone Auszahlung Informationen zur monotonen Auszahlung: Die Replikatordynamik ist auszahlungsmonoton. Auszahlungsmonotone Spiele haben die gleichen stationären Punkte, wie die Replikatordynamik. Für auszahlungsmonotone Spiele sind die Lyapunov-stabilen Gleichgewichte Nash-Gleichgewichte. Die strikten Nash-Gleichgewichte sind asymptotisch stabil. 11 / 26

Monotone Auszahlung Schwach auszahlungspositiv: Reine Strategie mit einer höheren Auszahlung als der Durchschnitt der Population. Die Strategie hat eine streng monoton wachsende Wachstumsrate. B(x) ( i : (Ax) i > x Ax ) g i (x) > 0 12 / 26

Entscheidung gegen iterativ dominierte Strategien Definition: strikt dominiert Die reine Strategie R i wird als strikt dominiert bezeichnet, wenn es eine Strategie y S n gibt, sodass x S n gilt: (Ax) i < y Ax. 13 / 26

Entscheidung gegen iterativ dominierte Strategien Spiel wird von rational denkenden Menschen gespielt, die Strategie R i wird nicht benutzt, alle strikt dominierten Strategien verschwinden aus dem Spiel, es bleiben reine Strategien übrig, die im nächsten Spiel strikt dominiert werden. 14 / 26

Entscheidung gegen iterativ dominierte Strategien Beispiel Es sei die Auszahlungsmatrix A gegeben durch 5 2 7 A = 0 0 4 1 5 5 R 2 ist strikt dominiert, im nächsten Spiel ist R 3 strikt dominiert, man erhält also eine nichtleere Menge von reinen Strategien, diese Menge hängt nicht vom Eliminationsprozess selbst ab. 15 / 26

Entscheidung gegen iterativ dominierte Strategien Definition: konvex monoton Eine auszahlungsmonotone Spieldynamik wird als konvex monoton bezeichnet, falls i und y, x S n gilt: y Ax > (Ax) i y i g j (x) > g i (x) 16 / 26

Entscheidung gegen iterativ dominierte Strategien Definition: konvex monoton Eine auszahlungsmonotone Spieldynamik wird als konvex monoton bezeichnet, falls i und y, x S n gilt: y Ax > (Ax) i y i g j (x) > g i (x) Satz 1 Ist eine monotone Spieldynamik konvex monoton und ist die reine Strategie R i iterativ strikt dominiert, so konvergiert die Frequenz x i (t) gegen 0. (Beweis siehe Anhang.) 16 / 26

Entscheidung gegen iterativ dominierte Strategien Beispiel Folgende Auszahlungsmatrix soll betrachtet werden: a c b γ b a c γ A = c b a γ α + β α + β α + β 0 mit c < a < b, 0 < β < b a und γ > 0. 17 / 26

Entscheidung gegen iterativ dominierte Strategien J. Hofbauer, K. Sigmund: Evolutionary Games and Population Dynamics, Cambridge, Seite 90 18 / 26

Beste-Antwort-Dynamik d.h. Diskrete Generationen von Spielern, in jeder Runde soll ein Spieler zur Generation hinzustoßen, dieser Spieler nimmt eine Strategie der besten Antwort auf den bestehenden Strategien-Mix ein, dieser Spieler muss seine Strategie für das gesamte Spiel beibehalten, in der Generation k + 1 nimmt dieser Spieler eine Strategie r k+1 {R 1,..., R n } ein r k+1 maximiert die erwartete Auszahlung gegenüber s k = 1 k k r k i=1 19 / 26

Beste-Antwort-Dynamik Die Änderung in der Durchschnittsstrategie kann mit Hilfe der Differenzengleichung s k+1 s k = r k+1 s k k+1 berechnet werden. Dabei ist r k+1 β(s k ), wobei β(s k ) die Menge der besten Antworten auf x S n repräsentiert. 20 / 26

Beste-Antwort-Dynamik Übergang zu einer kontinuierlichen Betrachtungsweise: ( ) ṡ(t) = 1 t r(t) s(t) mit r(t) β(s(t)) bzw. in integraler Form: t s(t) = t 1 r(τ) dτ. Die Betrachtung von stückweise linearen Lösungen führt zur Beste-Antwort-Dynamik: 0 ẋ = β(x) x 21 / 26

Beste-Antwort-Dynamik Beispiel Folgende Auszahlungsmatrix soll betrachtet werden: 0 1 1 A = 1 0 1 1 1 0 J. Hofbauer, K. Sigmund: Evolutionary Games and Population Dynamics, Cambridge, Seite 92 22 / 26

Beste-Antwort-Dynamik Allgemeine Konstruktion der stückweise linearen Lösungen der Beste-Antwort-Dynamik Anfangspunkt x, die Strategie b β((1 ɛ)x ɛb) fungiert als beste Antwort (ɛ 0), Iteration führt auf eine stückweise lineare Lösung für alle Zeiten t > 0. 23 / 26

Beste-Antwort-Dynamik Allgemeine Konstruktion der stückweise linearen Lösungen der Beste-Antwort-Dynamik Anfangspunkt x, die Strategie b β((1 ɛ)x ɛb) fungiert als beste Antwort (ɛ 0), Iteration führt auf eine stückweise lineare Lösung für alle Zeiten t > 0. Satz 2 Sei p eine innere ESS für ein Spiel mit Auszahlungsmatrix A. Dann ist p für die Beste-Antwort-Dynamik global asymptotisch stabil. Alle stückweise linearen Pfade erreichen p in einer endlichen Zeit. (Beweis siehe Anhang.) 23 / 26

Fazit Wir haben: 24 / 26

Fazit Wir haben: gelernt den Imitationsprozess mathematisch zu modellieren, 24 / 26

Fazit Wir haben: gelernt den Imitationsprozess mathematisch zu modellieren, die Auswirkungen der Dominanz auf statische Spiele untersucht, 24 / 26

Fazit Wir haben: gelernt den Imitationsprozess mathematisch zu modellieren, die Auswirkungen der Dominanz auf statische Spiele untersucht, die Möglichkeit einer besten Antwort auf bestehende Strategien besprochen. 24 / 26

Anhang Beweis zu Satz 1 Sei R i strikt dominiert von einem y S n. Aufgrund der Stetigkeit existiert ein δ > 0, sodass g i (x) y i g j (x) < δ x S n. Mit P(x) x i erreichen wir für jede innere Lösung mit t x(t), dass j x y j j Ṗ(x) = P(x) x j ẋ j = P(x) ( g i (x) y i g j (x) ). Daher ist Ṗ(x) < δ P(x). Daraus folgt, dass x i (t), welches kleiner als P(x(t)) ist, exponentiell abnimmt. Es reicht nun, dieses Argument zu wiederholen: ist das x i klein genug, so gibt es eine Ungleichung, die analog zur konvexen Monotonität für alle Strategien gilt, die in der nächsten Runde eliminiert werden, usw.. Also konvergiert die Frequenz x i (t) für die reinen Strategien R i, welche strikt dominiert sind, gegen 0. 25 / 26

Anhang Beweis zu Satz 2 Betrachte die Funktion V(x) = max i (Ax) i x Ax mit V(x) 0 und V(x) = 0, falls x = p. Entlang eines geraden Stückes ẋ = b-x ist dann V = (b-x) x Ax und V = ẋ Ax + (b-x) Aẋ = (b-x) Ax + (b-x) A(b-x). Für x p ist der erste Term nach Def. negativ und der zweite Term ist aufgrund Gleichung (6.19) und sogar nach unten durch 0 begrenzt. Also fällt V(x(t)) und erreichet den Wert 0 in einer endlichen Zeit. 26 / 26