von Dennis Aumiller Proseminar Technische Informatik Sommersemester 2014 Datum:09.07.2014 Lehrstuhl für Automation Prof. Dr. sc. techn. Essameddin Badreddin Betreuer: Alexander Alexopoulos 1
1. Motivation 2. Problemstellung und Lösungsansatz 3. Konzepte zum Lösen kooperativer Spiele 4. Anwendungsbeispiel 5. Zusammenfassung und Kritik 6. Ausblick 2
3
Problemsituation mit N Spielern (mindestens 2) Ergebnis abhängig von Entscheidung aller Spieler kooperativ : Spieler können verbindliche Abmachungen Treffen Modelle zur Darstellung des Problems Optimale Strategien, welche Auszahlungen für alle Spieler maximieren/minimieren [1], [2] 4
Darstellung des Problems als Matrix oder extensives Spiel Lösen des Spiels durch: Bestimmung der Nash-Gleichgewichtslagen Bestimmung des Pareto-Optima 5
Matrixform Spieler 2 Spieler 1 Strategie 1 Strategie 2 Strategie 1 (x11, y11) (x12, y12) Strategie 2 (x21, y21) (x22, y22) Extensive Form Strategie 1 Strategie 1 a Strategie 2 Spieler 1 a Strategie 1 Strategie 2 Spieler 2 Spieler 2 a Strategie 2 (x11, y11) (x12, y12) (x21, y21) (x22, y22) 6
Wir unterscheiden u.a.: Perfekte Information Alle vorausgehenden Züge und Zustände aller Spieler sind zu jedem Zeitpunkt bekannt Imperfekte Information Nicht jeder Zug bzw. Zustand anderer Spieler kann zu jedem Zeitpunkt beobachtet werden 7
Vollständige Information relevante Charakteristika bekannt: Auszahlungsfunktional Dynamisches Modell (dynamische Spiele) Strategien Unvollständige Information Nicht alle oder keine der oben genannten Charakteristika sind bekannt 8
Für jeden Spieler gibt es eine beste Antwort zu einer Strategie des anderen Eine Nash-Gleichgewichtslage ist ein Strategiepaar mit wechselseitig besten Antworten Setzt rational handelnde Spielteilnehmer voraus! Spieler 2 Spieler 1 S21 S22 S23 S11 (8,0) (0,0) (0,8) S12 (0,0) (2,2) (0,0) S13 (0,8) (0,0) (8,0) Einfaches Beispiel mit Nash-Gleichgewichtslage s* = (s12, s22),wenn beide Spieler versuchen, ihre Auszahlung zu maximieren [1] 9
Lösung in reinen Strategien nicht immer vorhanden Die Nash-Gleichgewichtslage in gemischten Strategien liefert eine Wahrscheinlichkeitsverteilung über den gesamten Strategieraum (es existiert immer eine Lösung [1]) Lösung nach Nash ist sowohl für kooperative als auch nicht-kooperative Spiele anwendbar 10
Eine Strategiekombination s* ist Pareto-optimal, wenn es keine andere Pareto-dominante Strategie gibt Es gibt keine bessere Lösung ohne einen Spielteilnehmer schlechter zu stellen mindestens ein Pareto- Optimum in jedem Spiel [2],[3] 11
2 Gefangene Separate Befragung Imperfekte und vollständige Information Spieler 2 Spieler 1 Gestehen 2 Strategien: gestehen oder schweigen Auszahlung : entsprechende Haftstrafe Schweigen Gestehen (-5, -5) (-1, -10) Schweigen (-10, -1) (-2, -2) 12
Spieler 2 Spieler 1 Gestehen Schweigen Gestehen (-5, -5) (-1, -10) Schweigen (-10, -1) (-2, -2) Beide Spieler wollen ihre Auszahlung maximieren Können nicht kommunizieren Beide Gestehen ist die Lösung 13
Bestmögliche Lösung für beide Spieler Hier ist beide Schweigen die Lösung Setzt voraus, dass Spieler 2 Spieler 1 Lösungsansatz (kooperativ) des anderen Spielers bekannt Gestehen Schweigen Gestehen (-5, -5) (-1, -10) Schweigen (-10, -1) (-2, -2) 14
Bei kooperativen Spielen üblicherweise Pareto-Optimum gesucht Lösung mit Nash-Gleichgewicht erlaubt egoistische Optimierung Pareto-Lösung für die Koalition der Spieler Stark von Informationsstruktur abhängig Vergleiche Ergebnis Gefangenendilemma 15
Multi-Robot Searching using Game-Theory Based Approach [4] Gegeben: Cluster von Suchrobotern Unterteilte Karte der Suchregion mit grober Priority- Zuordnung Gesucht: Schnellstmögliches/effizientestes Auffinden der Ziele 16
2 Zustände der Roboter: busy and free Update der bearbeiteten Suchfelder Kooperation: Relativierung von höchster Priorität (=höchste Auszahlung) zu aktueller Entfernung und Robotern in der Umgebung Lösung mithilfe von Nash-Gleichgewicht in gemischten Strategien 17
grafik 18
Kooperation erzielt bessere Ergebnisse Sehr schnell wachsende Komplexität bei mehreren Spielern In der Realität oft dynamische Spiele Problem der Echtzeitfähigkeit Lösung ohne perfekte Information schwierig 19
Dank schnellerer Datenverarbeitung weniger Nachteil durch Komplexität/Verarbeitungsdauer Wachsender Einsatz von Robotern und zunehmende Automation begünstigt Einsatz spieltheoretischer Ansätze 20
Bildquellen: http://www.naturwissenschaftundtechnik.de/uploads/pics/robocup-2013- Pressefoto_007 Foto_Andreas_Lander_.jpg http://greycoder.com/wp-content/uploads/2012/10/quadrocopters.jpg http://photos3.meetupstatic.com/photos/event/1/5/4/2/highres_254945442.jpeg http://blog.beachford.com/wp-content/uploads/2011/03/cars-communicating-with-intersection.jpg http://upload.wikimedia.org/wikipedia/commons/e/e2/pareoefficientfrontier1024x1024.png Texte: [1]: Andrea Wellenreither, Vorlesungsskript Spieltheorie Frühjahrssemester 2008 [2]: Manfred J. Holler Gerhard Illing, Einführung in die Spieltheorie, Springer Verlag [3]: https://class.coursera.org/gametheory-003/lecture/21 [4]: Yan Meng, Multi-Robot Searching using Game-Theory Based Approach, International Journal of Advanced Robotic Systems, Vol. 5, No. 4 (2008), ISSN 1729-8806, pp. 341-350 21