Spieltheorie Gemischte Strategien

Ähnliche Dokumente
2. Vorlesung. 1.3 Beste-Antwort Funktion. Vorlesung: Einführung in die Spieltheorie WS 2006/ Oktober 2006 Guido Schäfer

NICHTKOOPERATIVE SPIELTHEORIE EINFÜHRUNG. Minimaxlösungen & Gleichgewichte

Der Alpha-Beta-Algorithmus

Geraden. Somit scheiden die Gerade im Punkt N(-b/m; 0) die x-achse.

Der Bestimmtheitssatz

Spieltheorie Teil 4. Tone Arnold. Universität des Saarlandes. 20. März 2008

Natürliche Bäume. (Algorithmen und Datenstrukturen I) Prof. Dr. Oliver Braun. Letzte Änderung: :16. Natürliche Bäume 1/16

MATHEMATIK G10. (1) Bestimme die Gleichung der Geraden durch die beiden Punkte

Vorlesung Datenstrukturen

Kombinatorische Spiele mit Zufallselementen

Algorithmische Geometrie: Delaunay Triangulierung (Teil 1)

Lösungen von Übungsblatt 12

Matrixspiele: Alle Spieler ziehen gleichzeitig:

Übersicht: 6.1 Einleitung 6.2 Klassische Theorie nichtkooperativer Spiele 6.3 Egoistisches Routing 6.4 Mechanismen-Entwurf 6.

Seminar: Randomisierte Algorithmen Auswerten von Spielbäumen Nele Küsener

Layout-Synthese - Globale Verdrahtung Peter Marwedel

Vorlesung: Nicht-kooperative Spieltheorie. Teil 4: 2-Personen-Nullsummenspiele

Zwei-Spieler-Spiele. Einführung in die Methoden der Künstlichen Intelligenz. Suche bei Spielen. Schach. Schach (2)

Datenstrukturen und Algorithmen (SS 2013)

Lernmodul 7 Algorithmus von Dijkstra

Technische Universität Wien Institut für Computergraphik und Algorithmen Arbeitsbereich für Algorithmen und Datenstrukturen

Maschinelles Lernen: Symbolische Ansätze

General Video Game AI Competition 2016

ADS: Algorithmen und Datenstrukturen 2

Suche in Spielbäumen Spielbäume Minimax Algorithmus Alpha-Beta Suche. Suche in Spielbäumen. KI SS2011: Suche in Spielbäumen 1/20

Einführung in die Methoden der Künstlichen Intelligenz. Suche bei Spielen

12. Vorlesung. 19. Dezember 2006 Guido Schäfer

Eigentlich löst man n Gleichungen mit n Unbekannten (die. normalerweise eindeutig lösbar sind) am besten mit Hilfe der

Skript zur Vorlesung Mikroökonomik II (WS 2009) Teil 4

10. Vorlesung. 12. Dezember 2006 Guido Schäfer

Sequentielle Entscheidungsprobleme. Übersicht. MDP (Markov Decision Process) MDP und POMDP. Beispiel für sequentielles Planungsproblem

5. Geraden und Ebenen im Raum 5.1. Lineare Abhängigkeit und Unabhängigkeit von Vektoren

Fortgeschrittene Netzwerk- und Graph-Algorithmen

I y = ai + bx + c. 13. Die quadratische Funktion Normalparabel

Algorithmen für schwierige Probleme

Übungen zur Linearen und zur Quadratischen Funktion

Kapitel 1: Motivation / Grundlagen Gliederung

Vorkurs Mathematik für Ingenieure WS 2015/2016 Übung 4. (iii) = 33. (iv)

Vorkurs Mathematik für Ingenieur Innen WS 2017/2018 Übung 4

Zwei-Spieler-Spiele. Einführung in die Methoden der Künstlichen Intelligenz. Suche bei Spielen. Schach. Schach (2)

1 Kürzeste Pfade in Graphen

Baum-Matching in einer Anwendung auf Gefäßsysteme im menschlichen Körper (Andre Bläul)

2. Woche Eindeutige Entschlüsselbarleit, Sätze von Kraft und McMillan, Huffmancodierung

TU München. Hauptseminar: WS 2002 / Einführung in Suffix - Bäume

Übungsblatt 7 - Voronoi Diagramme

Ganzrationale Funktionen

Fortgeschrittene Netzwerk- und Graph-Algorithmen

der Künstlichen Intelligenz

Teil 2: Dynamische Spiele mit vollständigen Informationen

Graphen und Bäume. A.1 Graphen

Beweis: Annahme: T (n) c n, wobei c = c(m) konstant ist. Die Annahme ist ok, falls T (n)

Skript Lineare Algebra

Bayes-Netze (1) Lehrstuhl für Künstliche Intelligenz Institut für Informatik Friedrich-Alexander-Universität Erlangen-Nürnberg

VERHALTENSORIENTIERTE SPIELTHEORIE SS 2012

Übungen zur Ingenieur-Mathematik I WS 2017/2018 Blatt Aufgabe 33: Zeigen Sie, dass für die Funktionen

Lineare Funktion. Wolfgang Kippels 21. März 2011

Dynamische Spiele mit unvollständiger Information. Perfektes Bayesianisches Gleichgewicht

Einführung in die Methoden der Künstlichen Intelligenz. Suche bei Spielen

Hackenbusch und Spieltheorie

Kapitel 3: Ehrenfeucht-Fraïssé Spiele

Algorithmische Geometrie: Delaunay Triangulierung (Teil 2)

Gleichsetzungsverfahren

2. Grundzüge der Mikroökonomik Einführung in die Spieltheorie. Allgemeine Volkswirtschaftslehre. WiMa und andere (AVWL I) WS 2007/08

Geometrische Algorithmen Segmentschnitt

Geometrische Algorithmen Segmentschnitt

Thema 1: Geraden zeichnen Punkte berechnen. Ein Lese- und Übungsheft. 7 Seiten Einführung und Theorie. 22 Seiten Aufgaben mit Lösungen

Kapitel 8: Bipartite Graphen Gliederung der Vorlesung

Definition 77 Sei n N. Der Median (das mittlere Element) einer total geordneten Menge von n Elementen ist deren i-kleinstes Element, wobei n i =.

1 Gegeben sind die Ebene E: x= 1 0

fuzzy-entscheidungsbäume

Aufgaben zur Veranstaltung Grundzüge der Spieltheorie von Prof. Dr. Stefan Winter, Ruhr-Universität Bochum.

Künstliche Intelligenz - Optimierungsprobleme - Suche in Spielbäumen

Algorithmische Bioinformatik 1

Regel Die Steigung einer Funktion kann rechnerisch ermittelt werden, wenn mindestens zwei Punkte gegeben sind.

Local Search Algorithmen 1

Lineare Funktion. Wolfgang Kippels 3. November Inhaltsverzeichnis

5 Zwei spieltheoretische Aspekte

Lineare Gleichungssysteme mit 2 Variablen

Euler und Hamiltonkreise

Geometrische Algorithmen Einige einfache Definitionen: Ist ein Punkt in einem Polygon? Punkt-in-Polygon-Problem. Das Punkt-in-Polygon-Problem

WS 2013/14. Diskrete Strukturen

Übungsblatt 5 Lösungsvorschläge

Lösungen G1. c) Die Steigung m wird als Bruch angegeben: m Å. Der y-achsenabschnitt ist der Wert auf der y-achse, bei dem die Gerade durchgeht.

Lineare Funktionen. Die lineare Funktion

Praktikum Algorithmen-Entwurf (Teil 7)

2. Spiele. Arten von Spielen. Kombinatorik. Spieler haben festgelegte Handlungsmöglichkeiten, die durch die Spielregeln definiert werden.

Distanzprobleme in der Ebene

Nash-Gleichgewichte in 2-Spieler Systemen. Katharina Klost Freie Universität Berlin

Binärbäume: Beispiel

Maturitätsprüfung 2012 Mathematik Teil 1

Randomisierte Algorithmen

Wiederholte Spiele. Grundlegende Konzepte. Zwei wichtige Gründe, wiederholte Spiele zu betrachten: 1. Wiederholte Interaktionen in der Realität.

Durch Eliminieren der Wurzel erhalten wir die bekannte Kreisgleichung:

Bäume und Wälder. Definition 1

Die Steigung m ist ein Quotient zweier Differenzen und heißt daher Differenzenquotient.

Operations Research II: Fortgeschrittene Methoden der Wirtschaftsinformatik

Übungen zur Linearen und zur Quadratischen Funktion

4. Lernen von Entscheidungsbäumen

Transkript:

Spieltheorie Gemischte Strategien Emanuel Kitzelmann Kognitive Systeme Universität Bamberg Übung KogSys I, WS 06/07 E. Kitzelmann (Universität Bamberg) Gemischte Strategien Übung KogSys I, WS 06/07 1 / 15

Gliederung 1 Game Trees Game Trees 2 Gemischte Strategien Gemischte Strategien E. Kitzelmann (Universität Bamberg) Gemischte Strategien Übung KogSys I, WS 06/07 2 / 15

Problemstellung Nullsummenspiel mit zwei Spielern Spieler ziehen abwechselnd der zuerst ziehende Spieler heißt MAX, der Gegner MIN indem der Payoff/Nutzen für MIN durch den von MAX determiniert ist (Nullsummenspiel) genügt es, den Nutzen von MAX zu betrachten Problem: besten Zug/beste Strategie für MAX finden unter der Annahme, dass MIN optimal spielt E. Kitzelmann (Universität Bamberg) Gemischte Strategien Übung KogSys I, WS 06/07 3 / 15

Game Trees Spielzustände und Züge der Spieler werden im Game Tree folgendermaßen repräsentiert: Level 0 Wurzelknoten: Initialzustand; ausgehende Kanten: mögliche Züge von MAX Level 1 Knoten: Resultierende Zustände der im Initialzustand möglichen Züge von MAX ; ausgehende Kanten: die jeweils möglichen Züge von MIN Level 2 Knoten: Resultierende Zustände der möglichen Züge von MIN in Level 1; ausgehende Kanten: die jeweils möglichen Züge von MAX Level... usw. Blätter Endzustände E. Kitzelmann (Universität Bamberg) Gemischte Strategien Übung KogSys I, WS 06/07 4 / 15

Berechnen der Minimax-Werte MAX nutzt den Game Tree, um seinen besten Zug zu wählen. Dazu wird jeder Knoten mit dem Payoff/Nutzen annotiert, den MAX sich ausgehend vom jeweiligen Knoten nach Spielende maximal erwarten kann (also den Nutzen, den MAX nach Spielende hat, falls er selbst und auch MIN ab dem jeweiligen Zustand optimal spielen) Minimax-Wert. Berechnung der Minimax-Werte Die Minimax-Werte werden ausgehend von den Blättern durch den Baum bis zur Wurzel hochpropagiert: Blätter: Nutzen, den MAX im jeweiligen Endzustand hat Knoten/Zustand, in dem MAX zieht: maximaler Nutzenwert der Nachfolgeknoten (denn MAX spielt den Zug, der seinen möglichen Nutzen maximiert) Knoten/Zustand, in dem MIN zieht: minimaler Nutzenwert der Nachfolgeknoten (denn MIN spielt den Zug, der den möglichen Nutzen von MAX minimiert Nullsummenspiel) E. Kitzelmann (Universität Bamberg) Gemischte Strategien Übung KogSys I, WS 06/07 5 / 15

Beispiel: Game Tree Example (Game Tree) MAX 3 A a 1 a 2 a 3 MIN 3 B 2 C 2 D b1 b2 b3 c1 c2 c3 d 1 2 d 3 d 3 12 8 2 4 6 14 5 2 Game Tree eines Ein-Zug (d.h., jeder Spieler zieht einmal)-spiels: Die Blätter zeigen den Nutzen für MAX, die anderen Knoten sind mit ihren Minimax-Werten annotiert. MAX spielt a 1, da dieser Zug zum Nachfolgezustand mit dem höchsten Minimax-Wert führt. E. Kitzelmann (Universität Bamberg) Gemischte Strategien Übung KogSys I, WS 06/07 6 / 15

Gliederung 1 Game Trees Game Trees 2 Gemischte Strategien Gemischte Strategien E. Kitzelmann (Universität Bamberg) Gemischte Strategien Übung KogSys I, WS 06/07 7 / 15

Motivation Es gibt Fälle, wo ein Spiel, das durch eine Payoff-Matrix definiert ist, kein Nash-Equilibrium mit puren Strategien (also Strategien, die eine feste Aktion wählen) hat. Wenn man allerdings gemischte Strategien (engl. mixed strategies) (das sind Strategien, die verschiedene Aktionen mit bestimmten Wahrscheinlichkeiten wählen) zulässt, dann gibt es immer ein Nash-Equilibrium. E. Kitzelmann (Universität Bamberg) Gemischte Strategien Übung KogSys I, WS 06/07 8 / 15

Zwei-Finger Morra Beim Spiel Zwei-Finger Morra zeigen beide Spieler (Even und Odd) gleichzeitig jeweils ein oder zwei Finger. Ist die Gesamtanzahl der Finger gerade, dann ist der Payoff für Even diese Anzahl und für Odd das Negative. Ist die Gesamtanzahl ungerade, dann ist der Payoff für Odd diese Anzahl und für Even das Negative. Zwei-Finger Morra ist ein Zwei-Spieler Nullsummenspiel. Payoff-Matrix für Zwei-Finger Morra Odd: one Odd: two Even: one Even = 2, Odd = 2 Even = 3, Odd = 3 Even: two Even = 3, Odd = 3 Even = 4, Odd = 4 Zwei Finger-Morra hat kein Nash-Equilibrium mit puren Strategien. E. Kitzelmann (Universität Bamberg) Gemischte Strategien Übung KogSys I, WS 06/07 9 / 15

Gemischte Strategie Definition (Gemischte Strategie) Eine gemischte Strategie ist eine Strategie, die nicht eine bestimmte Aktion auswählt, sondern verschiedene Aktionen mit verschiedenen Wahrscheinlichkeiten. Example (Gemischte Strategie) Beim Zwei Finger-Morra wäre eine mögliche gemischte Strategie: Even : [0.3 : one, 0.7 : two] D.h. Spieler Even wählt mit Wahrscheinlichkeit 0.3 die Aktion one und mit Wahrscheinlichkeit 0.7 die Aktion two. E. Kitzelmann (Universität Bamberg) Gemischte Strategien Übung KogSys I, WS 06/07 10 / 15

Game Tree für Zwei Finger-Morra Die folgende Folie zeigt den Game Tree für den Fall, dass Even (E) zuerst zieht. Even kann eine gemischte Strategie spielen, d.h. der Game Tree hat unendlich viele von der Wurzel ausgehende Kanten (weil es unendlich viele mögliche Wahrscheinlichkeiten für die Aktionen one und two gibt). Diese werden repräsentiert durch eine mit der Wahrscheinlichkeit p für one parametrisierten Kante (die Wahrscheinlichkeit für two ergibt sich dann als 1 p). Odd spielt anschließend eine pure Strategie, da keine gemischte Strategie einen höheren Payoff liefern kann als eine pure, sofern die (gemischte) Strategie von Even bekannt ist. Die sich an den beiden Blättern ergebenden Payoffs für Even sind auch parametrisiert mit der Wahrscheinlichkeit p. Die beiden Payoffs sind als Geraden in ein Koordinatenfeld eingetragen, wobei die x-achse die Wahrscheinlichkeit p repräsentiert und die y-achse den entsprechenden Payoff. Odd wird one oder two spielen, je nachdem, welcher Payoff bei gegebenem p niedriger ist (die entsprechenden Geradenabschnitte sind fett eingezeichnet). E. Kitzelmann (Universität Bamberg) Gemischte Strategien Übung KogSys I, WS 06/07 11 / 15

Game Tree und Payoff-Geraden für Zwei Finger-Morra E. Kitzelmann (Universität Bamberg) Gemischte Strategien Übung KogSys I, WS 06/07 12 / 15

Optimale gemischte Strategie für Even Das beste, was Even an der Wurzel machen kann, ist, dasjenige p zu wählen, das die von Odd minimierten Payoffs maximiert, also genau den Schnittpunkt der beiden Geraden. Dazu werden die beiden Payoffs gleichgesetzt und nach p aufgelöst: 2p 3(1 p) = 3p + 4(1 p) 5p 3 = 7p + 4 12p = 7 p = 7 12 Die optimale gemischte Strategie für Even ist also [ ] 7 12 : one, 5 12 : two E. Kitzelmann (Universität Bamberg) Gemischte Strategien Übung KogSys I, WS 06/07 13 / 15

Erwarteter Payoff für Even Den erwarteten Payoff (also den Wert des Schnittpunkts der beiden Geraden) erhält man, indem man das gefundene p in eine der beiden Geradengleichungen einsetzt: 5p 3 einsetzen: p = 7 12 = 5 7 12 3 = 1 12 E. Kitzelmann (Universität Bamberg) Gemischte Strategien Übung KogSys I, WS 06/07 14 / 15

Verallgemeinerung auf beliebig viele Aktionen Bei Spielen mit mehr als zwei (k) möglichen Aktionen ist die Kante an der Wurzel des Game Trees nicht mehr nur mit einer Wahrscheinlichkeit p parametrisiert, sondern mit k 1 Wahrscheinlichkeiten p 1,..., p k 1. Die Ausdrücke an den Blättern repräsentieren dann Hyperebenen und man hat nicht zwei Geraden, die man schneidet, sondern k Hyperebenen, die man schneidet. E. Kitzelmann (Universität Bamberg) Gemischte Strategien Übung KogSys I, WS 06/07 15 / 15