Seminar Algorithmische Spieltheorie

Ähnliche Dokumente
10. Vorlesung Spieltheorie in der Nachrichtentechnik

Spieltheorie. Prof. Dr. Bernhard Nebel. Sommersemester 2009

Kapitel 7 und Kapitel 8: Gleichgewichte in gemischten Strategien. Einleitung. Übersicht Teil 2 2. Übersicht 3

2. Nash Equilibria. Das Spiel kann dann beschrieben werden durch

Mechanismus Design Auktionen

Kapitel 12 Spieltheorie

5. Wiederholte Interaktion (Wiederholte Spiele Superspiele)

Spieltheorie Kapitel 7, 8 Evolutionary Game Theory Modelling Network Traffic using Game Theory

Spieltheorie. Thomas Riechmann. Verlag Franz Vahlen München. 3., vollständig überarbeitete Auflage. von

Bisher angenommen: jeder Spieler kennt alle Teile des Spiels. - Diskontfaktor des Verhandlungspartners

Mikroökonomik B (Bachelor)

Seminar A - Spieltheorie und Multiagent Reinforcement Learning in Team Spielen

Proseminar. Spieltheorie. Sommersemester 2015

12. Vorlesung Spieltheorie in der Nachrichtentechnik

Informationsökonomik: Anwendung Versicherungsmarkt

Übersicht. 1 Unsicherheit und Klimawandel. 2 Umgang mit Unsicherheit in IAMs. 3 Strukturelle Unsicherheit: Weitzmans Dismal Theorem

11. Rent-Seeking 117

Spieltheoretischer Ansatz für selbstorganisierende Systeme

Logik für Informatiker

Spieltheorie mit. sozialwissenschaftlichen Anwendungen

Informatik II Greedy-Algorithmen

Überblick: Entscheidungstheoretische Konzepte Seminar Online-Optimierung Diana Balbus

Nachfrage, Angebot, Gleichgewicht, Effizienz auf perfekt kompetitivem Markt Aber: Marktversagen (Part 3)

Kooperative Spieltheorie

III. Theorie und Politik der Öffentlichen Ausgaben. A. Wohlfahrtsstaat B. Öffentlich angebotene private Güter

Black Jack - Kartenzählen

Wie löst man Mathematikaufgaben?

Verkehrsstauspiel: Wieviel Prozent der Autos fahren über blau/grün? Jörg Rambau

w a is die Anzahl der Vorkommen von a in w Beispiel: abba a = 2

I. Aussagenlogik. Aussagenlogik untersucht Verknüpfungen wie "und", "oder", "nicht", "wenn... dann" zwischen atomaren und komplexen Sätzen.

S=[n] Menge von Veranstaltungen J S kompatibel mit maximaler Größe J

Literatur. Dominating Set (DS) Dominating Sets in Sensornetzen. Problem Minimum Dominating Set (MDS)

Erfüllbarkeit und Allgemeingültigkeit

Optimierung. Optimierung. Vorlesung 7 Lineare Programmierung II Thomas Brox, Fabian Kuhn

Kapitel 9. Unsicherheit und Information. Einleitung. Teil 3: Einige generelle Klassen von Spielen und Strategien. Teil 3.

Grundlagen der Theoretischen Informatik

Betrachten Sie im folgenden einen Monopolmarkt. Die Preis-Absatz-Funktion verlaufe

Beispiel. Bsp.: Betrachte Schlussweise in: (3) folgt aus (1) und (2), siehe z.b. Resolutionsregel. was ist mit folgender Schlußweise:

Unvollständige Verträge

Wissensrepräsentation und -verarbeitung in Logiken. bereinigt Pränex Skolem ( -Eliminierung) Klausel (Menge von Klauseln, Notation ohne Quantoren)

Nash-GG als gegenseitige beste Antworten. Man kann Nash-GG einfach charakterisieren in termini bester Antworten

Lösungen zum Übungsblatt 1

Ausarbeitung zum Seminar Spieltheorie Gemischtes und korreliertes Gleichgewicht. Friederike Runge

Pratts Primzahlzertifikate

Ein Transfer-Paradoxon bei besteuerten Matrixspielen

Absolute Stetigkeit von Maßen

Die Pareto Verteilung wird benutzt, um Einkommensverteilungen zu modellieren. Die Verteilungsfunktion ist

Extrema von Funktionen in zwei Variablen

Vorlesung. Informationsökonomik und die Theorie der Firma

Uhrensynchronisation. Dipl.-Inf. J. Richling Wintersemester 2003/2004

5. Spiele mit unvollständiger Information

Definition eines Spiels

Service Transition. Martin Beims. WKV SS13 Karsten Nolte. Mittwoch, 19. Juni 13

Formale Methoden II. Gerhard Jäger. SS 2008 Universität Bielefeld. Teil 8, 11. Juni Formale Methoden II p.1/30

Informatik II Bäume. Beispiele. G. Zachmann Clausthal University, Germany Stammbaum. Stammbaum. Stammbaum

Grammatiken. Einführung

Elektronische Märkte. Mechanismusdesign und Auktionstheorie

2. Universelle Algebra

Induktive Limiten. Arpad Pinter, Tobias Wöhrer. 30. Jänner 2010

9.2. DER SATZ ÜBER IMPLIZITE FUNKTIONEN 83

Eine Spieltheoretische Analyse von Internetaukionen

IV. Spieltheorie. H. Weber, FHW, OR SS07, Teil 7, Seite 1

Meetings typgerecht organisieren

Fiktives Spiel und Verlustminimierung. Seminarvortrag von Alexander Marinc zur TUD Computer Poker Challenge 2008

Koordination des Mehrbenutzerbetriebs 9. Koordination des Mehrbenutzerbetriebs

Vorlesung Sicherheit

PHOTOSAFE MUNKTELL- Papier-Produkte für die Foto-Archivierung

Geometrische Mannigfaltigkeiten

Modul-Abschlussklausur zum. C-Modul Nr Supply Chain Management. Datum: Unterschrift des Prüfers

Mikroökonomik B (Bachelor)

Graphenalgorithmen und lineare Algebra Hand in Hand Vorlesung für den Bereich Diplom/Master Informatik

Einführung in die Computerlinguistik Statistische Grundlagen

Kapitel 15: Differentialgleichungen

Was bisher geschah: Formale Sprachen

Deterministische Turing-Maschinen (DTM) F3 03/04 p.46/395

Aspektorientierte Programmierung. Modellierung und Programmierung 2

Seminar Text- und Datamining Datamining-Grundlagen

Intelligente Agenten

inkasso mit fairness. dohr baut brücken.

Übungsblatt 5. Für die Abgabe dieses Übungsblattes müssen auch die Nebenrechnungen durchgeführt werden. Sonst wird dieses Übungsblatt nicht gewertet.

Grundlagen der Künstlichen Intelligenz

I. DIE ROLLE DES ÖFFENTLICHEN SEKTORS IN EINER MARKTWIRTSCHAFT: ANALYTISCHE GRUNDLAGEN

Condorcet-Paradox (der sozialen Entscheidung mit einfacher Mehrheit)

Studiengang (Zutreffendes bitte ankreuzen):

Wirtschaftsphilologentagung am 27./ in Passau

Dokumentation QQ2 Projekt HMD

Transkript:

Seminar Algorithmische Spieltheorie Einführung in die klassische Spiel- und Mechanismentheorie Hagen Völzer Universität zu Lübeck 10. November 2004 0

Überblick 1. Spiele 2. Auktionen 3. Mechanismen 1

Gefangenendilemma Bob schweigt Bob gesteht Alice schweigt Alice: 1, Bob: 1 Alice: 4, Bob: 0 Alice gesteht Alice: 0, Bob: 4 Alice: 3, Bob: 3 lokaler Anreiz zum Gestehen, globaler Anreiz zum Schweigen Was werden die Gefangenen tun? 2

Spiel (P, A, u) P endliche Menge von Spielern A Menge von Aktionen (Strategien) x : P A heißt Profil (Notation: x A P ) u : A P R P ist Nutzenfunktion u p (x) := u(x)(p) ist der Nutzen von x für p Spiel ist endlich, falls A endlich ist p präferiert x gegenüber x, falls u p (x) > u p (x ) 3

Annahmen Aktionen werden simultan gewählt (unabhängig voneinander) Spiel besteht nur aus einer Aktion für jeden Spieler Präferenzen bilden Halbordnung (dabei ist Indifferenz eine Äquivalenz) tatsächlich sind nur Präferenzen relevant, nicht absoluter Nutzen 4

Beste Antwort (eines Spielers) Für x : P A oder x : P \ {p} A sei (x p a) : P A def. durch: (x p a)(q) = a falls p = q, x(q) sonst. a A ist beste Antwort für p auf x : P \ {p} A, falls für alle a : u p (x p a) u p (x p a ) 5

Dominantes Gleichgewicht a dominiert a bezüglich p, falls für alle x: u p (x p a) u p (x p a ) x A P ist ein dominantes Gleichgewicht, falls für alle p, x(p) alle Aktionen bezüglich p dominiert, d.h. x(p) ist beste Antwort auf alle y : P \ {p} A 6

Also Wenn Spieler nur ihren eigenen Nutzen optimieren, also rational und egoistisch sind, dann spielen sie ein dominantes Gleichgewicht, sofern eins existiert 7

Gefangenendilemma Bob schweigt Bob gesteht Alice schweigt Alice: 1, Bob: 1 Alice: 4, Bob: 0 Alice gesteht Alice: 0, Bob: 4 Alice: 3, Bob: 3 Gibt es ein dominantes Gleichgewicht? 8

Kampf der Geschlechter Bob Klavier Bob Orgel Alice Klavier Alice:2, Bob:1 Alice:0, Bob:0 Alice Orgel Alice:0, Bob:0 Alice:1, Bob:2 Gibt es ein dominantes Gleichgewicht? 9

Nash Gleichgewicht x A P heißt Nash-Gleichgewicht, falls für alle p und a: u p (x) u p (x p a) d.h. für alle p ist x(p) ist beste Antwort auf x P \{p} Soziale Norm: falls alle anderen sich daran halten, werde ich nicht davon abweichen Jedes dominante Gleichgewicht ist Nash-Gleichgewicht 10

Kampf der Geschlechter Bob Klavier Bob Orgel Alice Klavier Alice:2, Bob:1 Alice:0, Bob:0 Alice Orgel Alice:0, Bob:0 Alice:1, Bob:2 Gibt es ein Nash-Gleichgewicht? 11

Kampf der Geschlechter II Bob Klavier Bob Orgel Alice Klavier Alice:2, Bob:2 Alice:0, Bob:0 Alice Orgel Alice:0, Bob:0 Alice:1, Bob:1 Sind verschiedene Gleichgewichte gleich plausibel? 12

Hirschjagd Bob Hirsch Bob Hase Alice Hirsch Alice:2, Bob:2 Alice:0, Bob:1 Alice Hase Alice:1, Bob:0 Alice:1, Bob:1 Sind verschiedene Gleichgewichte gleich plausibel? 13

Aufeinander zugehende Fußgänger Bob links Bob rechts Alice links Alice:1, Bob:1 Alice:0, Bob:0 Alice rechts Alice:0, Bob:0 Alice:1, Bob:1 Was würden Sie tun? 14

Bemerkungen Erfahrung führt zu korrektem Glauben darüber, was Mitspieler spielen d.h. Nash-Gleichgewichte werden nur bei hinreichend starkem Wissen über die Mitspieler garantiert Bei dominanten Gleichgewichten ist dies nicht nötig Profile die kein Nash GG sind, sind instabil Nash GG ist Mindestanforderung an egoistisches Verhalten Koalitionen spielen keine Rolle 15

Wiederholtes Entfernen streng dominierter Aktionen Halte eine Menge R p A von entfernten Aktionen, für jedes p; Initial: R p = Wähle p P und streng dominierte Aktion a A \ R p, d.h. a A \ R p : u p (x p a) < u p (x p a ) für alle x so daß q : x(q) R q Füge a zu R p hinzu Iteriere Theorem: Überlebt genau ein Profil, so ist es das einzige Nash Gleichgewicht. Theorem: Jedes Nash Gleichgewicht überlebt. 16

Berechnen von Nash-Gleichgewichten zuerst wiederholt streng dominierte Aktionen entfernen Berechne alle besten Antworten suche nach Nash-Gleichgewichten Spezialfall 2 Spieler und beste Antwort ist eindeutig a, a mit b p (a) = a und b q (a ) = a 17

Passende Münzen Bob Kopf Bob Zahl Alice Kopf Alice:1, Bob: 1 Alice: 1, Bob:1 Alice Zahl Alice: 1, Bob:1 Alice:1, Bob: 1 Wieviel Nash-Gleichgewichte gibt es? 18

Gemischte Strategie ist Wahrscheinlichkeitsverteilung σ über A (Notation: σ A) gemischtes Profil γ ( A) P induziert Wahrscheinlichkeitsverteilung über A P (Produktmaß) u p (γ) bezeichne den erwarteten Nutzen von p für γ ( A) P ein gemischtes Profil γ ( A) P ist ein Nash-Gleichgewicht, falls für alle p und σ: u p (γ) u p (γ p σ) 19

Existenz von Gleichgewichten Theorem: (Nash 1960): Für jedes endliche Spiel mit gemischten Strategien existiert ein Nash-Gleichgewicht. 20

Passende Münzen Bob Kopf Bob Zahl Alice Kopf Alice:1, Bob: 1 Alice: 1, Bob:1 Alice Zahl Alice: 1, Bob:1 Alice:1, Bob: 1 γ mit γ(alice) = γ(bob) = σ wobei σ(kopf) = σ(zahl) = 1 2 ist (einziges) Nash-Gleichgewicht u Alice (γ) = u Bob (γ) = 1 4 1 + 1 4 1 + 1 4 1 + 1 4 1 = 0 21

Was fehlt Auflösen mehrfacher Nash-Gleichgewichte (focal points, Erfahrung, Pareto-dominanz) Koalitionen von Spielern Zusammenhang von Gleichgewichten und Lernprozessen Robustheit von Gleichgewichten Verfeinerung der Gleichgewichtsbegriffe Spiele in extensiver Form (dynamisch) Wiederholte Spiele ( Evolution der Kooperation) 22

Überblick 1. Spiele 2. Auktionen 3. Mechanismen 23

Zweitpreisauktion mit versiegeltem Umschlag Spieler: n Bieter Aktionen: Gebote aus N Bewertungen v p N Nutzenfunktion u p (x) = v p max q p x(q) 0 sonst. falls x(p) > max q p x(q), u p hängt neben x auch von v p ab falls p Objekt bekommt und v p dafür zahlt, ist Nutzen 0 24

Gleichgewichte x(p) = v p ist dominantes Gleichgewicht sei b p = max q p x(q) wenn b p < v p dann ist jedes Gebot x(p) > b p optimal wenn b p v p dann ist jedes Gebot x(p) b p optimal x(p) = v p löst beide Fälle Nash-Gleichgewichte sind zahlreich, z.b.: x(p) = v p falls v p > max q p v q, 0 sonst. 25

Erstpreisauktion mit versiegeltem Umschlag u p (x) = v p x(p) 0 sonst. falls x(p) > max q p x(q), es gibt i.a. kein dominantes Gleichgewicht Warum? 26

Gleichgewichte x(p) = max q p v q falls v p > max q p v q, v p sonst. ist Nash-Gleichgewicht in allen Gleichgewichten gewinnt Spieler mit maximalem v p x ist Nash GG gdw. die zwei höchsten Gebote gleich sind, eins davon vom Spieler mit maximalem v p abgegeben wird und das höchste Gebot zwischen den beiden höchsten Bewertungen liegt 27

jedes Gebot x(p) v p wird stark dominiert jedes Gebot x(p) < v p wird nicht stark dominiert jedes Gleichgewicht, das nicht dominiert wird erfüllt: Spieler mit zweithöchster Bewertung v 2 bietet v 2 1 Spieler mit höchster Bewertung bietet v 2 1 Spieler mit k-höchster Bewertung v k bietet v k 1 ausgezeichnete Gleichgewichte in beiden Auktionstypen führen fast zum selben Ergebnis (Sieger und erzielter Preis) 27

Theorem In allen effizienten Auktionen mit gemischten Aktionen ist der erwartete Nutzen jedes Bieters und Verkäufers derselbe. effizient später 28

Was fehlt ungenaue Bewertungen gemeinsame Bewertungen Mehrfachauktion kombinatorische Auktion 29

Überblick 1. Spiele 2. Auktionen 3. Mechanismen 30

Öffentliches Projekt (z.b. Bibliothek) P = alle Einwohner der Stadt, P = n θ p R individueller Wert der Bibliothek für p (ggf. negativ) d {0, 1} Entscheidung v p (d, θ p ) = d θ p Bewertung Modellierung mit Kosten c R 1. P = P { }, v = d c 2. v p (d, θ p ) = d (θ p c n ) Wie kommt man zu einer guten Entscheidung? 31

Setting Spielermenge P D Menge von Entscheidungen (Ausgängen) θ : P Θ; θ p := θ(p) ist private Information (Typ) von p v p : D Θ R Bewertung (oder: persönliche Wohlfahrt) (valuation); hängt nur von θ p ab (daher: privat) 32

Entscheidungsfunktion Welche Entscheidungen sind gut? Entscheidungsfunktion f : Θ P D f ist effizient, falls für alle θ Θ P und alle d D: p v p (f(θ), θ p ) p v p (d, θ p ) d.h. soziale Wohlfahrt wird durch f maximiert Bibliothek: f mit f(θ) = 1 falls p θ p > c, 0 sonst. ist effizient 33

Weitere wünschenswerte Eigenschaften von Entscheidungsfunktionen Fairness: minimiere Varianz im Nutzen Profit: Nutzen eines bestimmten Spielers maximieren Pareto optimal: alle anderen Entscheidungen bringen allen gleichen Nutzen oder mindestens einem schlechteren Nutzen 34

Transferfunktion Idee: Frage Spieler nach Ihren privaten Werten ϑ Θ P sei Berichtsprofil Problem: Spieler p hat i.a. Anreiz zu lügen, im Beispiel: ϑ p < θ p für v p (1, θ p ) < 0 ϑ p > θ p für v p (1, θ p ) > 0 Ansatz: Transferfunktion t : Θ P R P t p (ϑ) := t(ϑ)(p) ist Transferzahlung, die p erhält (ggf. negativ), falls ϑ berichtet wurde t ist durchführbar : p t p (ϑ) 0 für alle ϑ (feasibility) t ist ausgeglichen: p t p (ϑ) = 0 für alle ϑ (budget balance) 35

Soziale Auswahl = ein Paar (f, t) quasilineare Nutzenfunktion: (utility ) u p (ϑ, θ p, f, t p ) = v p (f(ϑ), θ p ) + t p (ϑ) 36

Auktion (eines einzelnen Objekts) P alle Bieter θ p Θ = R individueller Wert für p D = P, f : R P P bildet Gebotsprofil auf Sieger ab t p : R P R Transfer (hier: negativ) v p (q, θ p ) = u p (ϑ, θ p, f, t p ) = θ p falls q = p, 0 sonst. θ p + t p (ϑ) t p (ϑ) falls p = f(ϑ), sonst. 37

Mechanismus M = (A, g), wobei A ist Menge von Aktionen und g : A P D R P (Notation: g = (f g, t g )) jedes θ Θ P induziert ein Spiel (P, A, u), wobei u p (x) = v p (f g (x), θ p ) + t g,p (x) M implementiert (f, t), falls für jedes p ein x p : Θ A existiert, so daß für jedes θ Θ P x θ dominantes Gleichgewicht (im von θ induzierten Spiel) ist, so daß g(x θ ) = (f(θ), t(θ)), wobei x θ (p) = x p (θ) Alternative: andere Gleichgewichte verwenden Bild 38

Direkter Mechanismus und Offenbarungssprinzip M = (A, g) ist direkt, falls A = Θ g = (f g, t g ) ist dann eine soziale Auswahl g ist strategiesicher (strategyproof ), falls jedes θ Θ P ein dominantes Gleichgewicht bzgl. θ ist Ist g = (f g, t g ) strategiesicher, so implementiert (Θ, g) die soziale Auswahl (f g, t g ). Theorem (Offenbarungsprinzip): Wenn M = (A, g) eine soziale Auswahl (f, t) implementiert, so ist (f, t) strategiesicher. Beweis: Folgt direkt aus (f(θ), t(θ)) = g(x θ ). 39

Braucht man Transferfunktionen? Entscheidungsfunktion f ist diktatorisch, falls ein p existiert, so daß für alle θ: f(θ) argmax d ranf v p (d, θ p ) Theorem (Gibbard-Satterthwaite): D sei endlich und Θ enthalte alle strikten Ordnungen. Dann ist für ein f mit ranf > 2 die soziale Auswahl (f, 0) genau dann strategiesicher, falls f diktatorisch ist. Für alle surjektiven h : D {1,..., D } und alle p P existiert ein θ p Θ so daß h(d) < h(d ) v p (d, θ p ) < v p (d, θ p ). 40

Groves Mechanismen (VCG Mechanismen) Gegeben: effiziente Entscheidungsfunktion f; mit welcher Transferfunktion t ist (f, t) strategiesicher? Theorem: (Groves) Ist f effizient und existiert für jedes p ein w p : Θ P \{p} R, so daß t p (ϑ) = w p (ϑ P \{p} ) + q p dann ist (f, t) strategiesicher. v q (f(ϑ), ϑ q ) (1) 41

Beispiel: Bibliothek ohne Kosten setzen w p (ϑ P \{p} ) = 0 f(ϑ), t p (ϑ), u p (ϑ, θ p ) = 1, q p ϑ q, θ p + q p ϑ q falls q ϑ q > 0, 0, 0, 0 sonst. θ p + q p ϑ q > 0 berichte θ p ist dominant θ p + q p ϑ q < 0 berichte θ p ist dominant Transfers sind nicht ausgeglichen, nicht einmal durchführbar! 42

Unverträglichkeit von Ausgeglichenheit und Effizienz Theorem: (Green, Laffont) Ist f effizient und (f, t) strategiesicher dann hat t die Form (1) (unter milden technischen Annahmen). Theorem: (Green, Laffont) Unter milden Annahmen sind Effizienz der Entscheidungsfunktion, Ausgeglichenheit der Transferfunktion und Strategiesicherheit unvereinbar. 43

Clarke Mechanismus (Pivot Mechanismus) Wähle w p (ϑ) = max d D q p v q (d, ϑ q ). t p (ϑ) = q p v q (f(ϑ), ϑ q ) max d D q p v q (d, ϑ q ) falls Anwesenheit von p sich nicht auf Entscheidung auswirkt t p = 0 sonst repräsentiert t p den Wohlfahrtsverlust für andere durch Präsenz von p (p ist Pivot) Gleichgewichtsnutzen = p s Beitrag zur sozialen Wohlfahrt u p (θ, θ p ) = q v q (f(θ), θ q ) q p v q (f(θ P p ), θ q ) 44

Beispiel: Bibliothek ohne Kosten u p (ϑ, θ p ) = θ p falls q ϑ q 0 und q p ϑ q 0, θ p + q p ϑ q falls q ϑ q 0 und q p ϑ q < 0, q p ϑ q falls q ϑ q < 0 und q p ϑ q 0, 0 falls q ϑ q < 0 und q p ϑ q < 0. Transfers sind nicht ausgeglichen, aber durchführbar! 45

Vickrey Auktion Beispiel für Clarke Mechanismus effiziente Entscheidung: f(ϑ) argmax p ϑ p t p (ϑ) = max q p ϑ q falls f(ϑ) = p, 0 sonst. also Zweitpreisauktion läßt sich auch leicht auf Mehrfachauktion anwenden 46

Bemerkungen zu Clarke und Groves Mechanismen bei Clarke: Transfers sind nie positiv durchführbar können Prinzip der freiwilligen Teilnahme verletzen, d.h. v p (f(θ), θ p ) + t p (θ) 0 Koalitionen können Mechanismus manipulieren (nicht koalitionssicher (coalitionproof, group-strategyproof )) 47