Rational Choice Theory Rational Choice and Rationale Entscheidung ist eine Sammelbezeichnung für verschiedene Ansätze in den Wirtschafts- und Sozialwissenschaften. Generell schreiben diese Ansätze handelnden Subjekten rationales Verhalten zu, wobei diese Subjekte aufgrund gewisser Präferenzen ein nutzenmaximierendes (oder kostenminimierendes) Verhalten zeigen. Ziel und Methode Historisch orientieren sich die Theorien der Rationalen Entscheidung an der klassischen Ökonomie Adam Smiths und der erklärenden Soziologie Max Webers. Sie versuchen, komplexe soziale Handlungen mit Hilfe möglichst einfacher Modellannahmen zu fassen. Das angestrebte Ziel der Theoretiker liegt darin, soziale Gesetze zu finden, die einfach und klar wie die der Newtonschen Physik sind. Darüber, wie dieses Ziel zu erreichen ist, herrscht Uneinigkeit. Menschenbilder der Rationalen Entscheidung reichen vom klassischen Homo oeconomicus bis zum PREEM (Restricted Rational Expecting Evaluating Maximising Man) der modernen Soziologie. Über den Rationalitätsbegriff des rationalen Entscheiders gibt es ebenso wie über die Gewichtung und Entstehung der Präferenzen keine Einigkeit. Universität Paderborn Algorithmische Spieltheorie 1.3
Umstrittene Punkte Während Rationale Entscheidung in den Wirtschaftswissenschaften das dominante Paradigma ist, ist sie in Soziologie und Politikwissenschaft stärker umstritten. Einer der Hauptstreitpunkte ist der verwendete methodologische Individualisimus; es ist in der Debatte, ob sich soziales Verhalten und soziale Gesetze wirklich durch das Verhalten vieler einzelner Individuen bestimmen lässt, oder ob das soziale eigene Gesetzmäßigkeiten vorweist. Eine schwächere Version dieser Kritik wirft dem Ansatz der Rationalen Entscheidung vor, soziale Probleme strukturell bedingt unterkomplex zu fassen. Zum anderen steht die starke Modellhaftigkeit des Ansatzes in der Kritik: es lässt sich empirisch einfach beweisen, dass Menschen nur begrenzt rational handeln. Die meisten Theoretiker der Rationalen Entscheidung räumen das ein, machen aber geltend, dass rationale Nutzenmaximierung eine plausible Grundannahme darstellt, von der aus die Modelle bestimmten Situationen angepasst werden können. Trotz den teilweise sehr heftigen Diskussionen ist aber unübersehbar, dass Ansätze, die auf Rationaler Entscheidung basieren, einen immer stärkeren Einfluss sowohl auf die globalen als auch auf die deutschen Sozialwissenschaften haben. Universität Paderborn Algorithmische Spieltheorie 1.4
Darstellung eines Spiels in Normalform G = (n, S, U) n Anzahl der Spieler s i Strategie von Spieler i, i {1,..., n} s Strategietupel: s = (s 1,..., s n ) s i Strategientupel der Gegenspieler von i, s i = (s 1,..., s i 1, s i+1,..., s n ) Wir schreiben: s = (s i, s i ) S i Strategieraum (Menge der möglichen Strategien) für Spieler i S = S 1... S n, s S S i = S 1... S i 1 S i+1 S n, s i S i u i Nutzenfunktion von Spieler i u i : S IR U = (u 1,..., u n ) (S i ) = Menge der gemischten Strategien des Spielers i Universität Paderborn Algorithmische Spieltheorie 1.18
. Nash Equilibria Situation: n Spieler 1,..., n spielen ein (einzügiges) Spiel. S i 1 i n ist die Menge der Strategien (= Aktionen) von Spieler i. u i : S 1... S n IR ist die Nutzenfunktion für Spieler i. Das Spiel kann dann beschrieben werden durch G = (n, S 1,... S n, u 1,..., u n ). Definition.1: Es sei G = (n, S 1,..., S n, u 1,..., u n ) ein Spiel. Ein n-tupel (s 1,..., s n ) S 1... S n ist im Nash Equilibrium, falls für alle i {1,..., n} gilt: s i S i : u i (s 1,..., s i 1, s i, s i+1,..., s n ) u i (s 1,..., s i 1, s i, s i+1,..., s n ) Im Nash Equilibrium will kein Spieler seine Strategie ändern, solange die anderen Spieler bei ihrer gewählten Strategie bleiben stabiler Zustand Universität Paderborn Algorithmische Spieltheorie.1
Beispiele: (Bi-)Matrixspiele Bach-Stravinsky Mozart-Mahler Gefangenendilemma Münzseiten s 1 s 1 s 11,1 0,0 s 1 0,0 1, s 1 s 1 s 11, 0,0 s 1 0,0 1,1 L G L 1,1 5,0 G 0,5 4,4 K Z K 1,-1-1,1 Z -1,1 1,-1 Nash-Equilibria Minderwertiges Nash-Equilibrium eindeutiges Nash-Equilibrium kein Nash-Equilibrium Stein-Schere-Papier St Sch P St 0,0 1,-1-1,1 Sch -1,1 0,0 1,-1 P 1,-1-1,1 0,0 kein Nash-Equilibrium Universität Paderborn Algorithmische Spieltheorie.
Gemischte Strategien Die Menge der gemischten Strategien für einen Spieler mit zwei reinen Strategien ist S := {π IR π 1 + π = 1, π i 0} Die Menge der gemischten Strategien für einen Spieler mit drei reinen Strategien ist S 3 := {π IR 3 π 1 + π + π 3 = 1, π i 0} y x 3 X Y x 1 S ist Strecke von (1, 0) nach (0, 1). y 1 S 3 ist Fläche zwischen (0, 0, 1), (0, 1, 0), (1, 0, 0) x Der (n 1)-dimensionale (Standard-) Simplex S n ist definiert als S n := {x IR n n i=1 x i = 1, x i 0} = {x IR n 1 T x = 1, x i 0}. Universität Paderborn Algorithmische Spieltheorie.3
Gemischte Nash Equilibria Für einen Spieler i sei S i := {s i1,..., s ik } Dann definiert π i = (π i1,..., π ik ) S k eine gemischte Strategie für Spieler i, in der er die Strategie s ij mit Wahrscheinlichkeit π ij wählt. Der erwartete Nutzen von Spieler i, wenn die gemischten Strategien aller Spieler durch (π 1,..., π n ) definiert sind, ist dann: u i (Π 1,..., Π n ) = (s 1,...,sn) S 1... Sn n k=1 Π k (s k ) u i (s 1,..., s n ) Definition.: Es sei G = (n, S 1,..., S n, u 1,..., u n ) ein Spiel. Ein n-tupel (Π 1,..., Π n ) ist im gemischten Nash-Equilibrium, falls für alle i {1,..., n} gilt: Π i (S i) : u i (Π 1,..., Π i 1, Π i, Π i+1,..., Π n ) u i (Π 1,..., Π i 1, Π i, Π i+1,..., Π n ) Universität Paderborn Algorithmische Spieltheorie.4
Beispiel Gemischtes Nash Equilibrium S 1 = {s 11, s 1 }, S = {s 1, s } A = 1 3 0, B = 4 0 1 4 (π 1, π ) mit π 1 = (3/7, 4/7) und π = (1/, 1/) ist ein gemischtes Nash Equilibrium. Universität Paderborn Algorithmische Spieltheorie.5
.1 Existenz von Nash Equilibria Satz.1: (J. Nash, 1951) Es existiert immer ein gemischtes Nash-Equilibrium. Sperner s Lemma Brouwer s Fixpunksatz Kakutani s Fixpunktsatz Nash s Theorem Brouwer s Fixpunktsatz: Es sei f : S n S n eine stetige Funktion. Dann existiert ein Punkt x S n mit f(x ) = x, ein sogenannter Fixpunkt. Universität Paderborn Algorithmische Spieltheorie.6
. Aufwand zur Bestimmung von Nash-Equilibrien Der Satz von Nash garantiert die Existenz eines gemischten Nash-Equilibriums. Aber: Betrachte das folgende Problem: MIXED--NE: geg.: Ein Spiel G = (, S 1, S, u 1, u ), S 1, S endlich. ges.: Ein gemischtes Nash-Equilibrium (Π 1 (S 1 ), Π (S )) für G. Es ist bis heute offen, ob MIXED--NE in P ist. MIXED--NE is PPAD-vollständig (Chen, Deng: Settling the Complexity of -Player Nash- Equilibrium. Electronic Colloquium on Computational Complexity, 005). Universität Paderborn Algorithmische Spieltheorie.7
.3 -Personen Matrix Spiele -Personen Matrix Spiele sind Spiele der Form G = (, (S 1, S ), (u 1, u )) mit S 1 = {s 11,..., s 1m }, S = {s 1,..., s n }. u 1, u sind gegeben als Matrizen A ZZ m n und B ZZ m n, mit u 1 (s 1i, s j ) = A i,j und u (s i, s j ) = B i,j, für 1 i m, 1 j n. Jeder Spieler maximiert seinen Nutzen. Universität Paderborn Algorithmische Spieltheorie.8
Bemerkung.1: Es sei x X = (S 1 ) eine gemischte Strategie für Spieler 1, y Y = (S ) eine gemischte Strategie für Spieler. Dann ist der erwartete Nutzen u 1 (x, y) = x T Ay und u (x, y) = x T By. Definition.3: a) Es sei y Y fest. x X heißt beste Antwort auf y x T (Ay) ist maximal über X. b) Es sei x X fest. y Y heißt beste Antwort auf x (x T B)y ist maximal über Y. Bemerkung.: a) Eine beste Antwort x (y) ist eine gemischte Strategie mit dem größten erwarteten Nutzen für Spieler 1 (), wenn Spieler (1) die gemischte Strategie y (x) spielt. b) Ein Nash Equilibrium (x, y) ist dann ein Paar von wechselseitig besten Antworten x und y. Satz.: Es sei y eine gemischte Strategie von Spieler. Eine gemischte Strategie x ist beste Antwort auf y genau dann, wenn Spieler 1 nur reine Strategien s i mit positiver Wahrscheinlichkeit spielt, die beste Antworten sind. Universität Paderborn Algorithmische Spieltheorie.9
Beispiele: (Bi-)Matrixspiele S 1 = {1,, 3}, S = {4, 5} A = 0 6 5 3 3, B = 1 0 0 4 3 4 5 1 0,1 6,0,0 5, 3 3,4 3,3 G hat reines Nash-Equilibrium (3, 4) (Spaltenmaximum in A und Zeilenmaximum in B) s 1 s Bemerkung 1 4 Spieler 1 3 1 5 Spieler 4 4 Spieler 1 3 5 Spieler 1 1 3 4 Nash Equilibrium mit Nutzen u 1 (3, 4) = A 3,1 = 3, u (3, 4) = B 3,1 = 4 3 5 Spieler 1 1 Universität Paderborn Algorithmische Spieltheorie.10
Nash Equilibria S 1 = {s 1 1,..., s1 m }, S = {s 1,..., s n } x = (x 1,..., x m ), x i [0, 1] y = (y 1,..., y n ), y i [0, 1] m i=1 x i = 1, n i=1 y i = 1 T 1 = {i {1,..., m} ; x i > 0} T = {j {1,..., n} ; y j > 0} Universität Paderborn Algorithmische Spieltheorie.11
Linear Complementary Problem (LCP) (x, y) ist NE α, β IR mit x S m, y S n n j=1 n j=1 m i=1 m i=1 A ij y j = α i T 1 A ij y j α i {1,..., m} B ij x i = β j T B ij x i β j {1,..., n} (x, y) ist NE α, β IR mit x, y 0 1 T x = 1 1 T y = 1 A y 1 α B T x 1 β x T ( 1 α A y) = 0 y T ( 1 β B T x) = 0 Universität Paderborn Algorithmische Spieltheorie.1
Eigennützige Schritte Definition: Sei (s 1,..., s n ) S = S 1... S n, i [1, n], s i S i. Ein Übergang (s 1,..., s n ) (s 1,..., s i 1, s i, s i+1,..., s n ) heißt eigennütziger Schritt falls u i (s 1,..., s n ) < u i (s 1,..., s i 1, s i, s i+1,..., s n ). Selfish Step Algorithmus: while (s 1,..., s n ) ist kein Nash Equilibrium perform eigennützigen Schritt Definition: G S = (S, E S ) mit E S = {(s, s); s, s S, s Nash-Graph. s ist eigennütziger Schritt} heißt Beachte: (a) Ein reines Nash Equilibrium entspricht einem Knoten in G S mit Ausgangsgrad 0. (b) Hat G S keine gerichteten Kreise so existiert ein reines Nash Equilibrium. (c) G S kann Pfade exponentieller Länge enthalten. Universität Paderborn Algorithmische Spieltheorie.13
Beispiel: Routing Spiel 7 Spieler, 3 Kanten, Spieler i hat Gewicht w i s i = {1,, 3} i = 1,..., 7 u i (s 1,..., s 7 ) = sj =s i w j 1 4 1 1 1 4 3 4 3 4 4 4 3 4 3 4 Universität Paderborn Algorithmische Spieltheorie.14