Kommunikation als Spiel zwischen rationalen Agenten

Ähnliche Dokumente
Kommunikation als Spiel zwischen rationalen Agenten

Grundlagen und Nash Gleichgewichte in reinen Strategien

VWL Grundzüge Mikroökonomie

Spieltheorie Vortrag im Rahmen eines Treffens der Grazer Pro Scientia Geförderten

KAPITEL 2. Einführung in die Spieltheorie. Mit Anlehnungen an Folien von Andreas Diekmann und Katrin Auspurg

Existenz eines Nash Gleichgewichts

Spieltheorie in der Ökonomie

Grice sche Maximen und Gleichgewichte in Spielen

Spieltheorie Teil 4. Tone Arnold. Universität des Saarlandes. 20. März 2008

KAP 1. Normalform Definition Ein Spiel G in Normalform (auch: Strategieform) besteht aus den folgenden 3 Elementen:

Das Gefangenendilemma (Prisoner s Dilemma)

Nicht-kooperative Spiele

Kapitel 4: Gemischte Strategien

Seminararbeit zur Spieltheorie. Thema: Rationalisierbarkeit und Wissen

Mikroökonomik B Teil II: Spieltheorie

von Dennis Aumiller Proseminar Technische Informatik Sommersemester 2014 Datum:

VERHALTENSORIENTIERTE SPIELTHEORIE SS 2012

Kleines Lexikon der Begriffe*

Mikroökonomik B Teil II: Spieltheorie

Klausur zur Vorlesung Spieltheorie Musterlösung

Anwendungen der Spieltheorie

Kapitel 4: Gemischte Strategien. Literatur: Tadelis Chapter 6

Spieltheorie mit. sozialwissenschaftlichen Anwendungen

3. Sequentielle Spiele mit vollständiger Information: Die Extensivform

Statische Spiele mit unvollständiger Information: Bayesianische-Spiele

Exkurs zur Spieltheorie. 1 Statische Spiele mit unvollständiger Information

Algorithmische Spieltheorie. Martin Gairing

Dominanzüberlegungen in einfachen Matrix Spielen (Reine Strategien)

Kapitel 13. Evolutionäre Spieltheorie. Einleitung. Evolutionäre Biologie. Übersicht 2. Alternative: Biologische Evolutionstheorie

Kapitel 13. Evolutionäre Spieltheorie. Einleitung. Evolutionäre Biologie. Übersicht 2. Alternative: Biologische Evolutionstheorie

Partielle Informationen in Währungskrisenmodellen

Operations Research II: Fortgeschrittene Methoden der Wirtschaftsinformatik

Wie verhalte ich mich bei einem Verhör und einer Mutprobe richtig?

Spiele mit simultanen Spielzügen und reinen Strategien: Diskrete Strategien

Verfeinerungen des Bayesianischen Nash Gleichgewichts

Spiele mit simultanen und sequentiellen Spielzügen

Dynamische Spiele mit unvollständiger Information. Perfektes Bayesianisches Gleichgewicht

Teil 1: Statische Spiele mit vollständigen Informationen

Teil 2: Dynamische Spiele mit vollständigen Informationen

Spieltheorie in der Ökonomie

i.d.s. erfasst Dominanz den Kern strategischen Denkens - Spieler nutzen ihr Wissen über ihre Gegenspieler...

Menschliche Entscheidungen und Rationalität

9.4Teilspiel-perfekteGleichgewichte

1. EINFÜHRUNG INS STATE-PRICING 1

Teil 1: Statische Spiele mit vollständigen Informationen

9.3Nash-Gleichgewicht

Spieltheorie. Christian Rieck Verlag. Eine Einführung. Von Christian Rieck

D Spieltheorie und oligopolistische Märkte

Algorithmen. Spieltheorie. Nash-Gleichgewichte in endlichen Nullsummenspielen. Kodierung als Lineares Programm. Nash-Gleichgewichts-Berechnung

Kapitel 3. Matrix Spiele. 3.1 Matrix-Spiele

Spieltheorie. Nash-Gleichgewichts-Berechnung. Bernhard Nebel und Robert Mattmüller. Arbeitsgruppe Grundlagen der Künstlichen Intelligenz 14.

Multiagent Interactions

ADS: Algorithmen und Datenstrukturen 2

Geometrie in der Spieltheorie

Mikroökonomik B 7. Kooperative Spiele

Kapitel 6: Spiele mit simultanen und sequentiellen Spielzügen. Kapitel 6 1

3.4 von Neumannsche Theorie kooperativer Spiele

Rational Choice Theory

KAP 10. Teilspiele und Teilspielperfektheit (vollk. Info)

10. Vorlesung. 12. Dezember 2006 Guido Schäfer

AVWL I (Mikro) 5-31 Prof. Dr. K. Schmidt Spieler 1 Oben Unten Spieler 2 Links Rechts 1, 3 0, 1 2, 1 1, 0 Figur 5.4: Auszahlungsmatrix eines Spiels Wen

Kapitel 6: Glaubwürdigkeit und Sequentielle Rationalität

Einführung in die Spieltheorie und Nash-Gleichgewichte

Anmerkung: Gescannte Objekte entstammen: Christian Rieck (2006); Spieltheorie Eine Einführung; Christian Rieck Verlag; Eschborn

Graduiertenseminar Spieltheorie

Kapitel 3: Das Gleichgewichtskonzept von Nash. Literatur: Tadelis Chapter 5

Einführung in die Spieltheorie

Spieltheorie. Teil 1: Statische Spiele mit vollständiger Information. Folienskriptum Spieltheorie (U. Berger, 2015) 1

Informatik I: Einführung in die Programmierung

Informatik I: Einführung in die Programmierung

Spieltheorie. Winter 2013/14. Professor Dezsö Szalay. 2. Dynamische Spiele mit vollständiger Information

Klausur zur Vorlesung Spieltheorie

Grundlagen der Logik

Inhaltsverzeichnis 1 Einleitung 1 2 Nash-Gleichgewicht in strategischen Spielen Nash-Gleichgewicht Beste-Ant

Spieltheorie. Prof. Dr. Philipp Weinschenk. TU Kaiserslautern

Bisher angenommen: jeder Spieler kennt alle Teile des Spiels. - Diskontfaktor des Verhandlungspartners

Skript zur Vorlesung Mikroökonomik II (WS 2009) Teil 4

Netzwerkverbindungsspiele

12. Vorlesung. 19. Dezember 2006 Guido Schäfer

Kommunikation mit/ohne Annahme geteilten Wissens

Kapitel 5: Spiele mit simultanen Spielzügen und reinen Strategien: Kontinuierliche Strategien

Vorkurs Mikroökonomik

Christian Rieck. Spieltheorie. Einführung für Wirtschaftsund SozialwissenschaftIer GABLER

1 Einleitung Spiele in Normalforrn

Beispiel für stabile Spielausgänge. Kapitel 5: Nash-Gleichgewicht. Anna Theater Fußball

Definition: Die Menge der Imputationen ist die Menge I aller Nutzenallokationen, die erreichbar und individuell rational sind.

Spieltheorie. Prof. Dr. Bernhard Nebel. Assistent: Dipl.-Inf. Malte Helmert L A TEX-Umsetzung: Ingo Thon

Spieltheorie - Wiederholte Spiele

Einführung in die Spieltheorie

6. Dynamische Spiele mit unvollständiger Information

bzw. die Entscheidugen anderer Spieler (teilweise) beobachten Erweitert das Analysespektrum erheblich Beschreibung des Spiels (extensive Form)

Statistische Tests. Kapitel Grundbegriffe. Wir betrachten wieder ein parametrisches Modell {P θ : θ Θ} und eine zugehörige Zufallsstichprobe

Strategische Spiele in Normalform; Schwache Dominanz. Strategienprofil der Gegenspieler (s i ) Kapitel 3: Spiele in Normalform

Spieltheorie Übungsblatt 5

Einführung in die Spieltheorie

Vorlesung: Nicht-kooperative Spieltheorie. Teil 4: 2-Personen-Nullsummenspiele

Klausur zur Vorlesung Spieltheorie

Klausur Mikroökonomik II. Wichtige Hinweise

Transkript:

Kommunikation als Spiel zwischen rationalen Agenten Stefan Partusch Hauptseminar Logik des geteilten Wissens, Centrum für Informations- und Sprachverarbeitung, Ludwig-Maximilians-Universität München 18. Juni 2008

Spieltheorie In einem spieltheoretischen Spiel agieren zwei oder mehr rationale Agenten gleichzeitig oder der Reihe nach und versuchen unter Berücksichtigung der möglichen Aktionen der anderen Agenten, die für sie beste Aktion zu finden. Motivation: Kommunikation als Spiel Auch Kommunikation lässt sich als ein solches Spiel auffassen. Denn bei erfolgreicher sprachlicher Kommunikation berücksichtigt ein Sprecher bei der Wahl seiner Worte die Interpretationsfähigkeit des Zuhörers. Der Zuhörer wiederum berücksichtigt bei seiner Interpretation des Gesagten die Möglichkeiten des Sprechers. Die besten Aktionen sind für beide die, die zu erfolgreicher, effizienter Kommunikation führen.

Spieltheorie Ein Spiel besteht allgemein aus Spielern und Spielregeln. Im Modell also aus... einer Menge von Spielern einer Menge von Spielzügen/Spielzuständen einer Ordnungsrelationen der Spielzustände einer Funktion von Spielzuständen auf Spieler einer Menge von möglichen Aktionen der Spieler einer Funktion von Spielzuständen auf Aktionen einer Auszahlungsfunktion, dem Ergebnis des Spiels Ein Spiel ist eine Struktur über die alle Agenten Common Knowledge besitzen. Spiele werden häufig in einer (Auszahlungs-)Matrix, der Normalform, dargestellt.

Beispiel: Gefangenendilemma Das bekannteste Beispiel für ein spieltheoretisches Spiel ist das Gefangenendilemma. Zwei Gefangene können gegenüber der Polizei zusammenhalten (kooperieren) oder sich gegenseitig verraten. Je nachdem wie sich beide Verhalten, ergeben sich unterschiedliche Haftstrafen: Fat Tony Louie Kooperieren Verraten Kooperieren 2, 2 10, 0 Verraten 0, 10 8, 8 Was ist rationales Verhalten aus Sicht des einzelnen Gefangenen? Strategie, Nutzenmaximierung,...

Extensivform Neben der Normalform können Spiele auch als Bäume dargestellt werden. Diese Darstellung wird als Extensivform bezeichnet. Das Gefangenendilemma in Extensivform: F K K V V K V L (-2, -2) (-10, 0) (0, -10) (-8, -8) Für Kommunikation als Spiel ist die Extensivform am besten geeignet.

Was ist Kommunikation? Ein Agent A intendiert die Übermittlung einer Proposition p durch die Äußerung ϕ an einen anderen Agenten B. B muss aufgrund von ϕ auf p schließen. ϕ jedoch ist in der Regel ambig, also mehrdeutig. Z. B.: Bank (Sitzgelegenheit) vs Bank (Geldinstitut); A sagt zu B, dass er heute vorbeikommen kann; Die Katze frisst die Maus; Die Maus frisst die Katze; Propositionen für ϕ = Alle Männer lieben eine Frau : p : x(mann(x) y(frau(y) liebt(x, y))) p : y(frau(y) x(mann(x) liebt(x, y)))

Strategische Inferenz Die Problematik ist A und B bekannt. Daher versuchen sie über strategische Inferenz ϕ und dessen Interpretation so zu wählen, dass die Kommunikation dennoch erfolgreich ist. Sie spielen ein Spiel. Wie wahrscheinlich eine Proposition gegeben ϕ ist, hängt bedeutend von der Situation ab, in der ϕ geäußert wird. Ein großer Unterschied zum Gefangenendilemma ist aber, dass die Agenten zusammenarbeiten! Beide haben also denselben Nutzen.

Hintergrund-Annahmen 1. A und B sind rational. 2. L ist eine gemeinsame Sprache. 3. Die Funktion m ordnet jedem Satz aus L eine Menge von Propositionen zu. m : L P(Prop) mit Prop als Menge aller Propositionen. 4. Diese Annahmen sind Common Knowledge: C1, C2, C3, C4.

Situations-Annahmen 1. A intendiert p an B zu übermitteln. 2. A äußert ϕ. 3. B intendiert ϕ zu interpretieren. 4. B nimmt ϕ wahr und interpretiert es. 5. m(ϕ) = {p, p }. 6. p ist wahrscheinlicher als p (ρ < ρ). 7. p und p eindeutig auszudrücken ist aufwendiger als es mehrdeutig zu tun. 8. K A 1, C2, K B 3, C4, C5, C6, C7... C6?

Das Spiel beginnt A möchte p = x(mann(x) y(frau(y) liebt(x, y))) an B übermitteln. Er hat dazu mehrere Möglichkeiten. Nehmen wir zwei an: ϕ = Jeder Mann liebt eine Frau ; µ = Jeder Mann liebt eine Frau. Dabei muss es sich nicht immer um dieselbe Frau handeln ; A hat also zwei Möglichkeiten in seinem Choice set : CS(p) = {ϕ, µ}; Allgemein: CS(p) = {ϕ L p m(ϕ)}; Wähle A zunächst ϕ. Dies ergibt das lokale Spiel g(ϕ); Man beachte, dass im Beispiel m(ϕ) = {p, p }!

Das lokale Spiel g(ϕ) s ϕ ρ t s ρ ϕ t A kann sich in s befinden und p meinen oder in s und p meinen. ρ und ρ sind die Wahrscheinlichkeiten dafür. Nachdem A dann ϕ geäußert hat, versucht B zwischen t und t zu entscheiden. Da ϕ ambig ist, kann B dies nicht eindeutig.

Das lokale Spiel g(ϕ) s ρ ϕ p t 3 p +10 10 s ρ ϕ p t p 3 10 +10 B muss die Proposition p oder p als Interpretation von ϕ wählen. Davon hängt der Erfolg der Kommunikation ab.

Die Bewertungsfunktion Die Bewertungsfunktion v ist angemessen zu wählen. Da A und B am Erfolg gleichermaßen interessiert sind, soll v A = v B = v gelten. Eine erfolgreiche Kommunikation liefert den höchsten Wert: v(pfad von s mit ϕ und p) = +10 v(pfad von s mit ϕ und p ) = +10 Eine fehlgeschlagene Kommunikation den geringsten: v(pfad von s mit ϕ und p ) = 10 v(pfad von s mit ϕ und p) = 10 Die Agenten sind gemäß Annahme rational und damit der Spieltheorie nach Nutzenmaximierer. A und B versuchen also den höchsten Wert zu erreichen.

Die Bewertungsfunktion Problem: v(s mit ϕ und p) = v(s mit ϕ und p ) = +10. Wie kann B hier die richtige Wahl treffen? Gemäß der Annahmen gilt ρ < ρ. Es ist für B also rationaler gegeben ϕ auf p zu schließen. Da Cg(ϕ) kann A daher aus CS(p) zuversichtlich ϕ wählen. Doch ist dann p nicht mehr durch ϕ kommunizierbar. Allerdings ist auch µ CS(p )! Jedoch ist µ auch aufwendiger, daher: v(s mit µ und p ) < v(s mit ϕ und p). Da erfolgreiche Kommunikation immer besser sein soll als fehlgeschlagene, gilt z. B. außerdem: v(pfad von s mit µ und p ) > v(pfad von s mit ϕ und p ).

Das lokale Spiel g(ϕ) +7 e p µ p s ϕ +10 ρ t p 3 10 p s ϕ 10 ρ t p 3 +10 µ e p +7

Strategien Eine Strategie ist eine Funktion von Entscheidungsknoten zu Aktionen. Zum Beispiel {(s, ϕ), (s, ϕ)}. A hat in g(ϕ) folgende Strategien zur Auswahl: 1. s ϕ, s µ = ϕ, µ 2. s ϕ, s ϕ = ϕ, ϕ 3. s µ, s µ = µ, µ 4. s µ, s ϕ = µ, ϕ B dagegen hat in g(ϕ) folgende Strategien zur Auswahl: 1. e p, t, t p, e p = p 2. e p, t, t p, e p = p

Strategien Ein Paar (a, b), bei dem a eine Strategie von A und b eine Strategie von B ist, heißt gemeinsame Strategie oder Strategieprofil. Die Gesamtheit aller Strategieprofile nennt man Strategieraum. Die Lösung eines lokalen Spiels ist eine gemeinsame Strategie. Intuitiv haben wir uns bereits ( ϕ, µ, p ) als optimale Lösung für g(ϕ) überlegt.

Nash-Gleichgewicht Das Nash-Gleichgewicht ist ein Lösungskonzept, um optimale Strategieprofile im Strategieraum zu finden. Sei N die Menge der Agenten und z z k mit k N das Strategieprofil z, in dem z k durch z k ersetzt wurde. Definition Sei Z k die Menge der Strategien eines Agenten k und A, B N, dann ist z = (z A, z B ) ein Nash-Gleichgewicht, wenn k N und z k Z k gilt, dass v k (z) v k (z z k ).

Nash-Gleichgewicht Die Plausibilität des Nash-Gleichgewichts liegt in der Rationalität eines Nutzenmaximierers. Nur wenn kein Agent durch einseitige Abweichung einen Vorteil erreichen kann, befindet sich ein Strategieprofil im Nash-Gleichgewicht. Beispiel: ( µ, µ, p ) in g(ϕ). Nash-Gleichgewichte in g(ϕ): ( ϕ, µ, p ), ( µ, ϕ, p ).

Das lokale Spiel g(ϕ) +7 e p µ p s ϕ +10 ρ t p 3 10 p s ϕ 10 ρ t p 3 +10 µ e p +7

Pareto-Dominanz Problem: Für das Beispiel g(ϕ) gibt es offensichtlich zwei Nash-Gleichgewichte. Lösungsmöglichkeit: Ergibt ein Strategieprofil für mindestens einen Agenten eine höhere Auszahlung und für keinen Agenten eine geringere, ist dieses eine Lösung des Spiels. Definition Eine Strategie z Pareto-dominiert eine andere Strategie z, wenn gilt, dass v k (z) > v k (z ) für k N. Definition Eine Strategie ist ein Pareto-Nash-Gleichgewicht, wenn sie ein Nash-Gleichgewicht ist und von keinem anderem Nash-Gleichgewicht Pareto-dominiert wird.

Erwartete Auszahlungswerte Die Auszahlungsfunktion soll nun unter Beachtung der Wahrscheinlichkeiten der Propositionen definiert werden. Sie kann dadurch als Heuristik für die Bewertung von Strategien dienen. Die so berechneten Werte heißen erwartete Auszahlungswerte (expected payoff ). Definition Für ein Wahrscheinlichkeitsmaß ρ: Anfangszustände [0, 1] und ein Strategieprofil str ist: v e (str) := ρ(s) v(str(s)). s Anf.zust. Dabei sei v(str(s)) der Wert der durch den Anfangszustand s und die Strategie str bestimmten Auszahlung.

Pareto-Nash-Gleichgewicht von g(ϕ) Seien ρ(s) = ρ = 0, 9 und ρ(s ) = ρ = 0, 1, dann ergeben sich folgende erwartete Auszahlungswerte für die Nash-Gleichgewichte: v e (( ϕ, µ, p )) = ρ 10 + ρ 7 = 0, 9 10 + 0, 1 7 = 9, 7 v e (( µ, ϕ, p )) = ρ 7 + ρ 10 = 0, 9 7 + 0, 1 10 = 7, 3 Das Pareto-Nash-Gleichgewicht von g(ϕ) ist also das Strategieprofil ( ϕ, µ, p ).

Das globale Spiel G(p) Das lokale Spiel g(ϕ) hängt offensichtlich von der Wahl von ϕ durch A ab. Wie trifft A diese Wahl? A konstruiert zu jedem ψ CS(p) ein lokales Spiel g(ψ) und bewertet es: Definition Sei str ein Pareto-Nash-Gleichgewicht von g(ψ), dann sei v[g(ψ)] := v(str) Dabei muss sich A nicht auf v e als Heuristik verlassen, da er die von ihm beabsichtigte Proposition kennt.

Das globale Spiel G(p) A muss nun nur noch die Äußerung ϕ mit der höchsten Auszahlung wählen und äußern: s ϕ v[g(ϕ)] = +10 ψ v[g(ψ)] µ v[g(µ)] = +7 Daraufhin muss B seinerseits g(ϕ) konstruieren und die beste Interpretation nach v e wählen. Existieren mehrere Pareto-Nash-Gleichgewichte, muss B raten.

Literatur Parikh, P. (2001). Use of Language. CSLI Publications, Stanford. Benz, A. et al (2006). An Introduction to Game Theory for Linguists. In Benz, A. et al, eds., Game Theory and Pragmatics, Palgrave Macmillan, Hampshire.