Der Preis der Anarchie Egoismus versus Systemoptimium

Der Preis der Anarchie Egoismus versus Systemoptimium Münchner Wissenschaftstage im Jahr der Mathematik 19. Oktober 2008 groetschel@zib.de Institut für Mathematik, Technische Universität Berlin (TUB) DFG-Forschungszentrum Mathematik für Schlüsseltechnologien (FZT 86) Konrad-Zuse-Zentrum für Informationstechnik Berlin (ZIB) http://www.zib.de/groetschel

2 Inhalt Spieltheorie Das Nash-Gleichgewicht Preis der Anarchie Fairness Anwendungen

4 Spieltheorie Im einem Spiel versucht jeder schlauer (oder besser oder erfolgreicher) zu sein als die anderen Mitspieler. Die Spieltheorie untersucht, was herauskommt, wenn alle Spieler versuchen, das Beste für sich herauszuholen. Damit ein Spiel ein Spiel ist, braucht es Regeln. Diese Regeln sagen, was jeder einzelne Spieler tun kann und was nicht was jeder Spieler wissen darf und was nicht und was das Ziel des Spiels ist. Beispiel: Beim Schach sagen die Regeln, wie sich die Figuren bewegen können, dass man sie alle immer sehen darf und dass das Ziel ist, den König matt zu setzen. Die Spieltheorie beschäftigt sich jedoch immer stärker mit sozialwissenschaftlichen Sachverhalten. Und hier ist es schwerer zu sehen, welche Regeln nun wirklich gelten und woher die Regeln kommen. Insbesondere sind gesellschaftliche Regeln nicht fest. Sie unterliegen Entwicklungen (z. B. durch die Gesetzgebung).

5 Spieltheorie: Definitionen Die Spieltheorie ist eine Theorie zur mathematischen Analyse von Konflikten. Die Spieltheorie ist eine Entscheidungstheorie, die Situationen untersucht, in denen das Ergebnis nicht von einem Entscheider allein bestimmt werden kann. Das Ergebnis hängt von den individuellen Entscheidungen aller Beteiligten ab. Hierbei gibt es Situationen, wo jeder für sich allein (ohne Rücksicht auf andere) entscheidet, die Spieler können aber auch gemeinsam (kooperativ) agieren.

6 Stein, Schere, Papier Wie soll man spielen? Stein Schere Papier B Stein 0 +1-1 A Schere -1 0 +1 Papier +1-1 0 Reine Strategie Gemischte Strategie

7 Stein, Schere, Papier, Brunnen Dominierte Strategie B Stein Schere Papier Brunnen Stein 0 +1-1 -1 Schere -1 0 +1-1 A Papier +1-1 0 +1 Brunnen +1 +1-1 0

8 Der Sinn gemischter Strategien Praxis: Schutz gegen psychologisch überlegene Gegner: Randomisierung

Spiele: einmalig, wiederholt? Einmalige vs. Wiederholte Spiele Einmaliges Spiel one-shot-game Eine Durchführung Danach Auszahlung Wieland Rhenau, rhenau@i nf.fuberlin.de Wiederholte Spiele Durchführung mehrmals hintereinander Auszahlungen werden summiert Strategisch relevant: Spieler kennen Rundenzahl? Ist Wiederholung unendlich Superspiel 9

10 Nullsummenspiel Ein Spiel heisst Nullsummenspiel, wenn die Summe der Auszahlungen an alle beteiligten Spieler gleich Null ist. Fast alle Gesellschaftsspiele sind Nullsummenspiele: Schach, Mühle, Dame, Go Poker, Skat Stein, Schere, Papier Schiffe versenken Ein Spiel mit vollständiger Information ist ein Spiel, bei dem keine versteckten Elemente vorkommen. Versteckte Elemente sind z. B. unbekannte Karten der Gegner (Poker, Skat), Zufallszüge (zufällige Kartenverteilung zu Beginn des Spiels) oder gleichzeitige Züge aller Spieler. Spiele mit vollständiger Information sind z. B. Schach, Mühle, Dame, Go Die anderen oben genannten jedoch nicht.

11 Gewinnstrategien Streicholzspiel Nicht jedes Spiel besitzt eine Lösung in reinen Strategien. Minimax-Theorem: Für jedes Zwei-Personen- Nullsummenspiel mit endlich vielen reinen Strategien gibt es eine gemischte Strategie x für Spieler 1, eine gemischte Strategie y für Spieler 2 und einen Wert V, so dass, wenn Spieler 1 die Strategie x spielt, er immer mindestens V gewinnt, und wenn Spieler 2 die Strategie y spielt, er immer höchstens V verliert. Stein, Schere, Papier: Würfeln!

12 Gewinnstrategien Spiele mit vollständiger Information besitzen eine reine Gewinnstrategie! Schach: Es gibt eine Gewinnstrategie, aber keiner kennt sie. Streichholzspiel: einfache Regel für Gewinnstrategie. Tic Tac Toe: immer unentschieden Mühle: immer unentschieden, d.h. ein guter Spieler verliert nie. (Hierzu wurden rund 10 Billionen Positionen auf einem Computer analysiert.)

13 Kooperativ vs nicht-kooperativ Das Gefangenendillemma

15 Nash Gleichgewicht Das Nash-Gleichgewicht, auch Nash-Equilibrium genannt, ist ein zentraler Begriff der mathematischen Spieltheorie. Es beschreibt in nicht-kooperativen Spielen einen Zustand eines strategischen Gleichgewichts, von dem ausgehend kein einzelner Spieler für sich einen Vorteil erzielen kann, indem er einseitig von seiner Strategie abweicht. Es ist ein grundlegendes Lösungskonzept der Spieltheorie. Definition und Existenzbeweis des Nash-Gleichgewichts gehen auf die 1950 veröffentlichte Dissertation des Mathematikers John Forbes Nash Jr. zurück. Im Jahr 1994 erhielt Nash für diese Leistung (zusammen mit Reinhard Selten und John Harsanyi) den Nobelpreis für Wirtschaftswissenschaften.

John Nash 2002 in Beijing

Beautiful Mind (über John Nash) Film über John Nash gelöscht

18 Was war in dem Film los? Harold Kuhn: Was der Film zeigt, ist gar kein Nash-Gleichgewicht, sondern eine kooperative Lösung.

19 Formale Definition Ein Spiel sei durch die Menge der Spieler N, den Strategienraum S = S 1 x xs n der Spieler und den Vektor U = (u 1,, u n ) der Auszahlungsfunktionen gegeben. Eine Strategienkombination S = (s 1,, s n ) ist ein Nash- Gleichgewicht, wenn u i (s 1,, s i,, s n ) u i (s 1,, t i,, s n ) für alle i und alle t i. Es gibt Spiele, die mehrere Nash-Gleichgewichte haben und solche, die überhaupt keines in reinen Strategien haben. Satz von Nash: Jedes Spiel mit endlichem Strategienraum hat ein Nash-Gleichgewicht in gemischten Strategien.

20 Kooperativ vs nicht-kooperativ Das Gefangenendillemma Nash-Gleichgewicht

Spiel ohne Nash-Gleichgewicht in reinen Strategien Einfaches Beispiel: Torschuss Ein Schütze, ein Torwart Vereinfacht: nach links/rechts schießen links/rechts springen Es existiert kein Nash-Gleichgewicht Der Verlierer kann immer Strategie ändern und damit gewinnen! Wieland Rhenau, rhenau@inf.fu-berlin.de 21

Mehrere Nash-Gleichgewichte Spiel mit dem Untergang Zwei Autos fahren aufeinander zu Wer ausweicht ist der Angsthase Zwei Nash Gleichgewichte in reiner Strategie: Fahrer1 ausweichen/fahrer2 weiterfahren und Fahrer1 weiterfahren/fahrer2 ausweichen Ein Nash Gleichgewicht in gemischten Strategien ausweichen/ausweichen Weil: beide weichen mit Wahrscheinlichkeit von ½ aus Wieland Rhenau, rhenau@inf.fu-berlin.de 22

24 Preis der Anarchie Dieses Konzept wurde im Jahre 1999 von Elias Koutsoupias, Christos Papadimitriou in ihrem Artikel Worst-case Equilibria im Rahmen von Untersuchungen von Nutzerverhalte auf Netzwerken vorgeschlagen. Frage: Wie schlecht kann eine stabile Lösung sein, die sich bei egoistischem Verhalten der Nutzer einstellt? Egoistisches Verhalten führt zu Nash-Gleichgewichten. Es kann viele solcher Gleichgewichte geben. Etwas salopp: Der Preis der Anarchie ist das Verhältnis von Wert des schlechtesten Nash-Gleichgewichts zum Systemoptimum.

25 Preis der Anarchie Genauer: Jeder Strategiekombination S = (s 1,, s n ) wird ein Wert C(S)zugeordnet. (Wir wollen hier minimieren.) Der Preis der Anarchie ist dann definiert als: p = max { CS ( ) :Strategiekombination Sist Nash-Gleichgewicht} min { CS ( ) :Sbeliebige Strategiekombination} Interpretation: Beispiel Gefangenendillemma: Nash-Gleichgewicht (4, 4), d.h. 8 Jahre Gefängnis. Minimum (1, 1), also 2 Jahre Gefägnis. Der Preis der Anarchie beim Gefangenendillemma ist gleich 4. Folgerung: Kooperation (bzw. zentrale Planung) ist viermal so gut wie egoistisches Verhalten

26 MATHEON-Projekte im Verkehr und Netzwerken, Rolf Möhring

27 MATHEON-Projekte im Verkehr und Netzwerken, Rolf Möhring

28 MATHEON-Projekte im Verkehr und Netzwerken, M. (ZIB)

31 Steuerung des Individualverkehrs Das Braess-Paradox: Erweitert man ein Straßennetz um eine weitere Straße, so kann sich für jeden Fahrer die Fahrzeit verlängern. (Dietrich Braess, Über ein Paradoxon aus der Verkehrsplanung, 1968). Es gibt hunderte von Artikeln hierzu, aus der Tagespresse: (G. Szpiro), Irrationales bei Airlines und Passagieren. Das Braess- Paradoxon am Beispiel der Flugroutenwahl. Neue Zürcher Zeitung 9. Jan. 2006, S. 5 W. Blum, Ewig lockt die Schnellstraße. Psychologen bestätigen ein mathematisches Paradoxon: Manchmal lösen zusätzliche Strecken den Stau erst aus. Süddeutsche Zeitung 24. Jan. 2006, S. 9 A. Rooch. Auf Umwegen schneller zum Ziel. 6. Folge der WAZ-Serie "Was ist Mathematik?" - Das Braess-Paradoxon. Westdeutsche Allgemeine Zeitung 5. August 2006.

32 Das Braess-Paradox Alle Fahrer wollen von A nach D. Verkehrsdichte x = 1000 Autos/h t AC (x) = t BD (x) = 50 + x Minuten t AB (x) = t CD (x) = 0 + 10x Minuten Stündlich 6000 Autofahrer. Nash-Gleichgewicht: Auf jeder Strecke fahren 3000 Autos, Fahrzeit: 83 min/auto Neue Strecke BC t BC (x) = (10 + x) Minuten Nash-Gleichgewicht: 2000 Autos auf ABD 2000 Autos auf ACD 2000 Autos auf ABCD Fahrzeit: 92 min/auto

33 Auftreten von Braess-Paradoxen in der realen Welt Es gibt reale Beispiele dafür, dass das Braess-Paradoxon nicht nur ein theoretisches Konstrukt ist. 1969 führte in Stuttgart die Eröffnung einer neuen Straße dazu, dass sich in der Umgebung des Schlossplatzes der Verkehrsfluss verschlechterte. Auch in New York konnte das umgekehrte Phänomen 1990 beobachtet werden. Eine Sperrung der 42. Straße sorgte für weniger Staus in der Umgebung. Weitere empirische Berichte gibt es über Auftreten auf den Straßen Winnipegs.

34 Weiteres Beispiel 2 parallele Straßen x 100 Fahrzeit oben: x = Anzahl der Fahrzeuge Fahrzeit unten: 100 100 Fahrzeuge wollen von links nach rechts. Alle werden oben fahren, jeweils mit der Fahrzeit 100. Beste Lösung: 50 oben, 50 unten Preis der Anarchie: 10.000/7.500 = 4/3

36 Selfish Routing (egoistische Routenwahl) Fahrer wählen die Route, die Ihnen am günstigsten erscheint. Es ist natürlich nicht ganz klar, was das in der Praxis heisst. Navigationssysteme und Psychologie

37 Zentrales Verkehrsmanagement Technologische Anforderungen Exakte Kenntnis aller Fahrzeugpositionen und ziele Zweiseitige Verbindung zu zentralem Server Server kennt gegenwärtigen Zustand vollständig. Systemoptimum kann berechnet werden. Aber: Einige Routen können viel zu lang sein.

38 Zentrales Verkehrsmanagement Systemoptimum ohne Fairnessbedingungen Systemoptimum mit Fairnessbedingungen

39 Zentrales Verkehrsmanagement Systemoptimum ohne Fairnessbedingungen Systemoptimum mit Fairnessbedingungen

40 Was ist Fairness? Unfairness einer Routenplanungspolitik im Bezug auf ein Nutzergleichgewicht max ( uv, )OD-Paar Reisezeit für OD-Paar ( uv, ) im Routenplan Reisezeit für OD-Paar ( uv, ) im Nutzergleichgewicht Unfairness = 1 im Nutzergleichgewicht Unfairness kann beliebig groß werden (in der Theorie)

41 Fairness-Analyse

42 Fairness-Analyse für einige Städte

44 Herlitz in Falkensee Büroartikel, Glückwunschkarten, etc.

45 Integrierter innerbetrieblicher Transport

46 Logistik Logistik-Film gelöscht

47 Aufzug-Optimierung Aufzug-Film gelöscht

48 Anwendungen in der Telekommunikation Dissertation, TU Berlin 2007

49 Zelluläre Funknetze Funkschnittstelle

Ein UMTS-Funknetz Zelle Antenne

Zelluläres Netz

Der Preis der Anarchie Egoismus versus Systemoptimium Vielen Dank für Münchner Wissenschaftstage im Jahr der Mathematik Ihre Aufmerksamkeit 19. Oktober 2008 groetschel@zib.de Institut für Mathematik, Technische Universität Berlin (TUB) DFG-Forschungszentrum Mathematik für Schlüsseltechnologien (FZT 86) Konrad-Zuse-Zentrum für Informationstechnik Berlin (ZIB) http://www.zib.de/groetschel