Dynamische Spiele mit unvollständiger Information. Perfektes Bayesianisches Gleichgewicht

Ähnliche Dokumente
Spieltheorie mit. sozialwissenschaftlichen Anwendungen

Spieltheorie. Thomas Riechmann. Verlag Franz Vahlen München. 3., vollständig überarbeitete Auflage. von

Bisher angenommen: jeder Spieler kennt alle Teile des Spiels. - Diskontfaktor des Verhandlungspartners

5. Spiele mit unvollständiger Information

Kapitel 12 Spieltheorie

Lösungen zum Übungsblatt 1

Nash-GG als gegenseitige beste Antworten. Man kann Nash-GG einfach charakterisieren in termini bester Antworten

Spieltheoretischer Ansatz für selbstorganisierende Systeme

5. Wiederholte Interaktion (Wiederholte Spiele Superspiele)

Definition eines Spiels

Ein einfaches Modell zur Fehlerfortpflanzung

Kapitel 7 und Kapitel 8: Gleichgewichte in gemischten Strategien. Einleitung. Übersicht Teil 2 2. Übersicht 3

Verkehrsstauspiel: Wieviel Prozent der Autos fahren über blau/grün? Jörg Rambau

Spieltheorie Kapitel 7, 8 Evolutionary Game Theory Modelling Network Traffic using Game Theory

Grundlagen verteilter Systeme

Fiktives Spiel und Verlustminimierung. Seminarvortrag von Alexander Marinc zur TUD Computer Poker Challenge 2008

Principal-Agent-Theorie

Mikroökonomik B (Bachelor)

Seminar A - Spieltheorie und Multiagent Reinforcement Learning in Team Spielen

Übung 2: Multiplexverfahren (2)

SMS Marketing. Broschüre

12. Vorlesung Spieltheorie in der Nachrichtentechnik

Sequentielle Spiele, Glaubwürdigkeit von Drohungen und Teilspielperfektheit

Mikroökonomik B (Bachelor)

Betrachten Sie im folgenden einen Monopolmarkt. Die Preis-Absatz-Funktion verlaufe

6. Bayes-Klassifikation. (Schukat-Talamazzini 2002)

Mikroökonomik B (Bachelor)

Proseminar. Spieltheorie. Sommersemester 2015

1. Was sind Nullsummenspiele? 2. Dominante Strategien 3. Sattelpunkt 4. Spiele ohne Sattelpunkt: Gemischte Strategien 5. Beispiele 6.

Seminarvortag zum Thema Virtual Private Network Design im Rahmen des Seminars Network Design an der Universität Paderborn

Lange Nacht der Wissenschaft. Ein Klassiker. Die Mathematik der Kürzesten Wege

Regeln. für das Gespräch in Sucht- Selbsthilfe gruppen. Freundeskreise für Suchtkranktnhilf*

2. Nash Equilibria. Das Spiel kann dann beschrieben werden durch

Vier Gewinnt Nicolas Schmidt Matthias Dietsche Bernhard Weiß Benjamin Ruile Datum: Tutor: Prof. Schottenloher Spieltheorie

Grundlegendes. Definition Principal-Agent-Modell nach Pratt/Zeckhauser(1985):

Ein Transfer-Paradoxon bei besteuerten Matrixspielen

Diplomprüfung. Operations Research I WS 2007/2008 (4 Punkte)

Platons Höhle. Zur Vorbereitung: Arbeitsblätter für 4. bis 6. Klasse. von Tim Krohn Illustriert von Lika Nüssli SJW Nr. 2320

Ausarbeitung zum Seminar Spieltheorie Gemischtes und korreliertes Gleichgewicht. Friederike Runge

Das Zahlenwahlspiel. Inhaltsverzeichnis. 1. Einleitung: Vorstellung des Spiels und Aufbau der Arbeit..S. 3

Grundlagen verteilter Systeme

Was taugen dynamische Dutch-Book-Argumente? *

Newsletter. 1 Erzbistum Köln Newsletter

Multiagent Interactions

Motivation. Motivation

5.1 Adverse Selektion

Spieltheorie. Prof. Dr. Bernhard Nebel. Sommersemester 2009

Mathe Leuchtturm TI N spire-leuchtturm

Zur Sicherheit von RSA

Benutzungshinweise für den Faxserver Ferrari

Mit KI gegen SPAM. Proseminar Künstliche Intelligenz

Wirtschaftsphilologentagung am 27./ in Passau

KIP Druckerstatus Benutzerhandbuch KIP Druckerstatus Installations- und Benutzerhandbuch

Homomorphe Verschlüsselung

Senden von Faxen. Senden von einfachen Faxen Beispiele typischer Faxaufträge Anfertigen von Kopien. Senden von Faxen

Dynamische Optimierung. Kapitel 4. Dynamische Optimierung. Peter Becker (H-BRS) Operations Research II Wintersemester 2014/ / 206

Zur Konfiguration werden hierbei das Setup-Tool und die Shell verwendet.

Literatur. Dominating Set (DS) Dominating Sets in Sensornetzen. Problem Minimum Dominating Set (MDS)

Startanleitung Zipabox + Geräte

Funkanalyse Bayern Programmkompetenzen. TNS Infratest MediaResearch

Algorithmic Balancing of Symmetric Strategy Games Using Methods of Game Theory

3. Das Auslastungsspiel

Einführung. Spieltheorie

Internet Kapitel 4 Lektion 2 s senden und empfangen

Anmeldung neues Webmail- und Administrationsinterface. Die Administrations- und Webmailinterfaceanmeldung erfolgt über folgende Adresse:

BPMN Kategorien und Elementgruppen. Flussobjekte

Registrierung am Elterninformationssysytem: ClaXss Infoline

1 Kryptosysteme 1 KRYPTOSYSTEME. Definition 1.1 Eine Kryptosystem (P(A), C(B), K, E, D) besteht aus

/ : Seminar: Spieltheorie in der BWL Prof. Aleksander Berentsen Syllabus

bla bla Open-Xchange Server VoipNow Benutzeranleitung

Mathematik und Logik

Zugelassenes Hilfsmittel: nicht programmierbarer Taschenrechner.

-Verschlüsselung mit Geschäftspartnern

YELLOWFOX FLOTTENAPPLIKATIONTION BEDIENUNGSHANDBUCH GARMIN: NAVMAN MDT860 + C-BOX

Diplom BWL/VWL / B-BAE / B-SW / LA RS / LA GY

Übungen für Woche 10

Grundlegende Protokolle

BEHAVIORAL GAME THEORY

Spieltheorie II: Bargaining - Verhandlungstheorien

Erstellen einer in OWA (Outlook Web App)

Automatisches Beantworten von - Nachrichten mit einem Exchange Server-Konto

Informationsökonomik: Anwendung Versicherungsmarkt

Lernmaterial für die Fernuni Hagen effizient und prüfungsnah

Theoretische Grundlagen des Software Engineering

Periodische Fahrpläne und Kreise in Graphen

-Verschlüsselung mit Geschäftspartnern

1. Motivation / Grundlagen 2. Sortierverfahren 3. Elementare Datenstrukturen / Anwendungen 4. Bäume / Graphen 5. Hashing 6. Algorithmische Geometrie

Die Fehlermeldung lautet so oder ähnlich:

4. Auflage. Kapitel IX: Bubbles

Tipps und Tricks zu Netop Vision und Vision Pro

Spielregeln (die Vollversion mit den Optionen)

Transkript:

Dynamische Spiele mit unvollständiger Information Perfektes Bayesianisches Gleichgewicht Spieltheorie University of Bonn Dezsö Szalay Dieser Teil basiert auf Kapitel 4 "Gibbons (1992), A primer in Game theory", Harvester Wheatsheaf. Bitte benutzen Sie das Buch, um die fehlenden Graphen einzutragen (oder fügen Sie diese während der Vorlesung ein).

In einigen Spielen ist das Bayes-Nash Gleichgewicht zu schwach als GG-Konzept. Erinnern Sie sich an die Analyse bei Spielen mit vollständiger Information: Teilspielperfektheit kann eine schärfere Prognose liefern, wenn es mehrere Nashgleichgewichte gibt. Aber Teilspielperfektheit kann nicht direkt angewendet werden bei Bayes Spielen, weil unvollständige Information oft impliziert, dass es keine Teilspiele gibt. Das Ziel dieser Vorlesung ist es, ein Gleichgewichtskonzept zu motivieren, welches schärferere Prognosen liefert als das Bayes NGG und welches auf dynamische Spiele mit unvollständiger Information angewendet werden kann. Einfacher gesagt: Gib eine Prognose darüber, welches Verhalten bei unvollständiger Information beobachtet wird und wende diese Logik auf eine bestimmte Sorte solcher Spiele - Signalling Games - an.

Ein Beispiel: Betrachten wir das folgende dynamische Spiel mit unvollkommener aber vollständiger Information. Zunächst wählt Spieler 1 eine seiner drei Aktionen L, M und R. Falls Spieler 1 R wählt, dann endet das Spiel. Falls Spieler 1 entweder L oder M wählt, dann weißspieler 2 nur, dass R nicht gewählt wurde, sonst weißer nichts weiter. Dann kann Spieler 2 zwischen L und R wählen.

Um das NGG des Spiels zu nden, transformieren wir dieses in Normalform: L R L 2,1 0,0 M 0,2 0,1 R 1,3 1,3 Es gibt zwei NGG L; L 0 und R; R 0 : Das Spiel hat keine Teilspiele, daher sind beide GG teilspielperfekt.

Macht das Gleichgewicht R; R 0 Sinn? Wenn man sich das folgende Spiel anschaut L R L 2,1 0,0 M 0,2 0,1 Dann ist R dominiert durch L Warum sollte also Spieler 2 R spielen?

Um unsere Bedenken mit dem Gleichgewicht R; R 0 zu formalisieren, betrachten wir folgende zusätzliche Anforderung, die ein Gleichgewicht zu erfüllen hat: Anforderung 1: An jeder Informationsmenge muss der Spieler, der an der Reihe ist, einen belief haben, welcher Knoten erreicht wurde, wobei ein belief die Wahrscheinlichtkeitsverteilung über die Knoten in der Informationsmenge ist. Anforderung 2: Gegeben ihre beliefs, müssen die Strategien der Spieler sequentiell rational sein; d.h. optimal gegeben die beliefs und die Strategien im Fortsetzungsspiel.

Diese beiden Anforderungen schließen das GG R; R 0 aus. Sei p die Wahrscheinlichkeit die Spieler 2 dem Ereignis beimißt, dass Spieler 1 L gespielt hat und 1 p die Wahrscheinlichkeit dass Spieler 1 M gespielt hat: Dann sind die payo s von Spieler 2 für beliebige p L R p 1 0 1 p 2 1 Total 2-p 1-p Für beliebige p ist R dominiert.

Wie werden die beliefs bestimmt? Rationale Spieler sollten jede Information nutzen, die ihnen gegeben ist. Um besser zu erklären, was damit gemeint ist, benötigen wir weitere Unterscheidungen: De nition: Für ein gegebenes Gleichgewicht in einem Spiel in extensiver Form, be ndet sich eine Informationsmenge auf dem Gleichgewichtspfad, falls die Informationsmenge mit einer positiven Wahrscheinlichkeit erreicht wird wenn die Spieler ihre Gleichgewichtsstrategien verwenden.

Anforderung 3: Innerhalb einer Informationsmenge auf dem Gleichgewichtspfad werden beliefs bestimmt durch die Bayes sche Regel (für bedingte Wahrscheinlichkeiten) und die Gleichgewichtsstrategien der Spieler. Illustration: angenommen Spieler 1 spielt eine gemischte Strategie fq 1 ; q 2 ; 1 q 1 q 2 g : Dann folgt aus der Bayes Regel, dass p = q 1 q 1 + q 2

Um das Spiel vollständig zu beschreiben, müssen wir auch beliefs abseits des Gleichgewichtspfads spezi zieren. Warum? Anforderung 4: In Informationsmengen abseits des Gleichgewichtspfads sind beliefs bestimmt durch die Bayes sche Regel und die Gleichgewichtsstrategien der Spieler, wann immer möglich. Um dies zu zeigen, betrachten wir folgendes Beispiel:

Dieses Spiel hat zwei Nashgleichgewichte: D; L; R 0 zusammen mit einem belief p = 1: A; L; L 0 zusammen mit einem belief p = 0: Das erste Gleichgewicht genügt allen vier Anforderungen. Das zweite Gleichgewicht genügt den Anforderungen 1 bis 3, aber nicht 4.

Als ein Beispiel für eine Situation, in der Anforderung 4 die beliefs nicht vollständig bestimmt, betrachten wir die folgende Erweiterung unseres Beispiels:

Anwendung: Signalling Games Es gibt zwei Spieler, einen Sender S und einen Empfänger R. Folgender zeitlicher Ablauf: 1. Die Natur zieht einen Typ t i des Senders aus einer Menge an möglichen Typen T = ft 1 ; t 2 ; :::; t I g ; gemäß einer Wahrscheinlichkeitsverteilung sodass p (t i ) > 0: 2. Der Sender beobachtet t i und wählt dann eine Aktion m j (eine Mitteilung) aus einem Set mit Aktionen M = fm 1 ; m 2 ; :::; m J g : 3. Der Empfänger beobachtet m j (aber nicht t i ) und wählt dann eine Aktion a k aus einem Set mit Aktionen A = fa 1 ; :::; a K g 4. Payo s sind gegeben durch U S ti ; m j ; a k und UR ti ; m j ; a k

Ein typisches Sender-Empfänger Spiel Was sind die Strategie-Sets von Sender und Empfänger?

I) Beliefs in Signaling Games: Nachdem eine Nachricht m j aus M beobachtet wurde, muss der Empfänger einen belief darüber haben, welcher Typ m j gesendet wurde; ein belief genügt den Anforderungen t i j m j 0 und X t i 2T t i j m j = 1: II) Sequentielle Rationalität des Empfängers: Für jedes m j aus M; muss die Aktion des Empfängers a m j seinen Nutzen maximieren, gegeben seinen belief; a m j löst das Problem X max t i j m j UR ti ; m j ; a k a k 2A t i 2T

III) Rationalität des Senders: Für jedes t i 2 T muss die Nachricht des Senders seinen Nutzen maximieren, gegeben die Strategie des Empfängers; m (t i ) löst das Problem max U S ti ; m j ; a m j m j 2M

IV) Konsistenz von beliefs: für jedes m j in M, falls es einen Typen t i in T gibt, der im Gleichgewicht Nachricht m j sendet (m j (t i) = m j ); dann muss der belief des Empfängers am Informationset m j durch die Bayes sche Regel und die Gleichgewichtsstrategie des Senders bestimmt sein. Sei ^T die Menge von Typen, die eine Nachricht m j gesendet haben. Dann gilt für alle t i 2 ^T : p (t t i j m j = i ) X p (t i ) t i 2 ^T

De nition: Ein perfekt Bayesianisches Gleichgewicht in reinen Strategien ist ein Paar von Strategien m (t i ) und a m j und ein belief-system ti j m j, welche den Bedingungen I bis IV entsprechen. Zwei Typen von Gleichgewichten: Pooling versus Separating Gleichgewichte. In einem Poolinggleichgewicht wählen alle Sender die gleiche Nachricht. In einem Seperatinggleichgewicht wählen die Sender eine Nachricht, die ihren Typ o enbart (das bedeutet, dass alle unterschiedliche Nachrichten wählen).

Betrachten Sie das folgende Spiel: