Überblick. Mathematik und Spiel. Ohne Glück zum Sieg. Bedeutung der Strategie. Zwei Hauptaspekte

Ähnliche Dokumente
Der Alpha-Beta-Algorithmus

Praktikum Algorithmen-Entwurf (Teil 7)

Suche in Spielbäumen Spielbäume Minimax Algorithmus Alpha-Beta Suche. Suche in Spielbäumen. KI SS2011: Suche in Spielbäumen 1/20

KI und Sprachanalyse (KISA)

Hackenbusch und Spieltheorie

Einführung in Heuristische Suche

Masterarbeit. Alpha-Beta-Pruning. Oliver Kock. Bochum, Februar Fakultät für Mathematik Ruhr-Universität Bochum

2. Spiele. Arten von Spielen. Kombinatorik. Spieler haben festgelegte Handlungsmöglichkeiten, die durch die Spielregeln definiert werden.

Zug Bart Borg Bart Borg Bart Borg Bart. Bart Borg verloren. Stand Zug Bart Borg Bart Borg Bart Borg

Künstliche Intelligenz - Optimierungsprobleme - Suche in Spielbäumen

Wissensbasierte Suche

Spiele aus mathematischer Sicht

2. Spielbäume und Intelligente Spiele

Spieltheorie. Fabian Schmidt Fabian Schmidt Spieltheorie / 46

Vier Gewinnt Nicolas Schmidt Matthias Dietsche Bernhard Weiß Benjamin Ruile Datum: Tutor: Prof. Schottenloher Spieltheorie

Kombinatorische Spiele mit Zufallselementen

39.1 Alpha-Beta-Suche

Spieltheorie. Sebastian Wankerl. 16. Juli 2010

Algorithmen und Datenstrukturen

Spiele als Suchproblem

Guten Morgen und Willkommen zur Saalübung!

Grundlagen der Künstlichen Intelligenz Einführung Minimax-Suche Bewertungsfunktionen Zusammenfassung. Brettspiele: Überblick

Backtracking mit Heuristiken

Intelligente Spiele. Prof. Rolf Haenni. Master-Vorlesung SS run/teachss06.html

Einstieg in die Informatik mit Java

General Game Playing

Rekursion. Annabelle Klarl. Einführung in die Informatik Programmierung und Softwareentwicklung

Übersicht. 5. Spiele. I Künstliche Intelligenz II Problemlösen 3. Problemlösen durch Suche 4. Informierte Suchmethoden

Grundlagen der Künstlichen Intelligenz

Spiele (antagonistische Suche) Übersicht. Typen von Spielen. Spielbaum. Spiele mit vollständiger Information

Wissensbasierte Systeme 5. Brettspiele

Teil 14: Rekursive Programmierung. Prof. Dr. Herbert Fischer Fachhochschule Deggendorf Prof. Dr. Manfred Beham Fachhochschule Amberg-Weiden

Informatik II. PVK Part1 Severin Wischmann n.ethz.ch/~wiseveri

Neutrale kombinatorische Spiele

6in1 Deluxe Spiele-Koffer. Spielanleitung

Informatik I - Programmierung Globalübung Hoare-Kalkül. Thomas Weiler. Fachgruppe Informatik RWTH Aachen. T. Weiler, RWTH Aachen - 1 -

Informatik I: Einführung in die Programmierung

Vom Amateur zum Großmeister

bzw. die Entscheidugen anderer Spieler (teilweise) beobachten Erweitert das Analysespektrum erheblich Beschreibung des Spiels (extensive Form)

5. Spiele. offensichtlich eine Form von Intelligenz. Realisierung des Spielens als Suchproblem

Mühle Spielanleitung/Spielregeln. Brettspielnetz.de Team Copyright 2017 Brettspielnetz.de

Grundlagen der Theoretischen Informatik Musterlösungen zu ausgewählten Übungsaufgaben

Datenstrukturen & Algorithmen

Glück im Spiel. Warum lande ich bei Monopoly häufiger auf dem Opernplatz als auf der Schlossallee?

Binärbäume: Beispiel

Vorlesung: Nicht-kooperative Spieltheorie. Teil 4: 2-Personen-Nullsummenspiele

Die Thue-Morse Folge und wie man unendlich lange Schach spielt

14. Algorithmus der Woche Gewinnstrategie für ein Streichholzspiel

Operations Research II: Fortgeschrittene Methoden der Wirtschaftsinformatik

Bericht vom 1. Leipziger Seminar am 25. November 2006

Handlungsplanung und Allgemeines Spiel Ausblick: GDL-II. Peter Kissmann

Die Mathematik der Gesellschaftsspiele

Dynamische Programmierung. Problemlösungsstrategie der Informatik

D Spieltheorie und oligopolistische Märkte

Theorie der Informatik

Satz 90 Sei A = (Q, Σ, δ, q 0, F ) ein DFA. Der Zeitaufwand des obigen Minimalisierungsalgorithmus ist O( Q 2 Σ ).

Grundlagen des Spiels

Grundlagen der Künstlichen Intelligenz

Branch-and-Bound. Wir betrachten allgemein Probleme, deren Suchraum durch Bäume dargestellt werden kann. Innerhalb des Suchraums suchen wir

Stochastik I. Vorlesungsmitschrift

Ludwig-Maximilians-Universität München SoSe 2009 Institut für Informatik PD Dr. Martin Lange Dipl.-Inf. Markus Latte 25. Juni 2009

Mathematik und Spiele

Spielregeln für Schach

Spieltheorie. A. Chocholaty und P. Hitzler

Lösungen zu Aufgabe 3 Mathematik

Praktikum Wissensbasierte Systeme Übung 1 Vier Gewinnt als Strategiespiel in Java

von Heinrich Glumpler und Matthias Schmitt

Go Spielanleitung/Spielregeln. Brettspielnetz.de Team Copyright 2016 Brettspielnetz.de

Spieltheorie Gemischte Strategien

Kombinatorik. Jörn Loviscach. Versionsstand: 31. Oktober 2009, 17:22. 1 Begriff Kombinatorik; Zahl aller Teilmengen

Spieltheorie. Miriam Polzer Miriam Polzer Spieltheorie / 40

Übungen zum Vortrag Backtracking mit Heuristiken

Intelligente Systeme

Thomas Behr. 17. November 2011

Bäume und Wälder. Bäume und Wälder 1 / 37

Kasparov versus Deep Blue. Till Tantau. Institut für Theoretische Informatik Universität zu Lübeck

1 Begriff Kombinatorik; Zahl aller Teilmengen

Rekursive Algorithmen

Tableaukalkül für Aussagenlogik

JAVA - Rekursion

Kapitel 2. Suche nach endlich vielen Wörtern. R. Stiebe: Textalgorithmen, Winter 2005/06 113

Algorithmen und Datenstrukturen VO 3.0 Vorlesungsprüfung 19. Oktober 2007

Spieltheorie - Wiederholte Spiele

Einschub: Anweisungen und Bedingungen für PAP und Struktogramme (1)

Schach Spielanleitung/Spielregeln. Brettspielnetz.de Team Copyright 2017 Brettspielnetz.de

Algorithmen und Datenstrukturen (Th. Ottmann und P. Widmayer) Folien: Suchverfahren Autor: Stefan Edelkamp / Sven Schuierer

VORLESUNG 14 Lineare Optimierung, Dualität (Viele Folien nach Ulf Lorenz, jetzt TU Darmstadt)

Abschnitt: Algorithmendesign und Laufzeitanalyse

Eine kleine Schachfibel

11.1 Grundlagen - Denitionen

14. Rot-Schwarz-Bäume

II.3.1 Rekursive Algorithmen - 1 -

Einführung. Künstliche Intelligenz. Steuerungs- und Regelungstechnik. Psychologie. Reinforcement Learning (RL)

DLP. Adolphe Kankeu Tamghe ALZAGK SEMINAR. Bremen, den 18. Januar Fachbereich Mathematik und Informatik 1 / 27

WS 2009/10. Diskrete Strukturen

Kap. 4.2: Binäre Suchbäume

Nichtlineare Gleichungssysteme

Spieltheorie. Nash-Gleichgewichts-Berechnung. Bernhard Nebel und Robert Mattmüller. Arbeitsgruppe Grundlagen der Künstlichen Intelligenz 14.

Folgen und Reihen. Folgen. Inhalt. Mathematik für Chemiker Teil 1: Analysis. Folgen und Reihen. Reelle Funktionen. Vorlesung im Wintersemester 2014

Babeș-Bolyai Universität Cluj Napoca Fakultät für Mathematik und Informatik Grundlagen der Programmierung MLG5005. Rekursion

Transkript:

Überblick Ohne Glück zum Sieg R. Verfürth Fakultät für Mathematik Ruhr-Universität Bochum Bochum / 8. Oktober 2009 Kategorisierung Strategische Spiele Bewertung einer Stellung Aufwand Epilog Literatur 1/ 27 2/ 27 Kategorisierung Kategorisierung Zwei Hauptaspekte Bedeutung der Strategie Zufall Strategie Gering: Knobeln, Lotto,... Mittel: Kniffel, Poker, Skat, Monopoly,... Entscheidend: Othello, Mühle, Dame, Schach, Go,... 3/ 27 4/ 27

Strategische Spiele Strategische Spiele Struktur Fragen Zwei Spieler ziehen abwechselnd. Zu jeder Stellung gibt es eine endliche Zahl möglicher Züge. Das Spiel hat endlich viele Endzustände (Sieg, Verlust, Unentschieden). Der Gewinn des einen Spielers ist der Verlust des anderen (Nullsummenspiel). Es gibt keine unendliche Sequenz von Stellungen. Der Zufall ist ausgeschlossen. Was ist der Wert einer gegebenen Stellung? Wie findet man einen optimalen Zug? Gibt es eine Gewinnstrategie? Ist das Spiel entscheidbar? 5/ 27 6/ 27 Bewertung einer Stellung Wert einer Endstellung Suchbaum F (p) beschreibe den Wert einer Stellung p aus Sicht des Spielers, der am Zug ist. F (p) ist dann der Wert aus Sicht des anderen Spielers. bei Sieg F (p) = bei Niederlage 0 bei Unentschieden 5-1 -5 1 5 5 7-1 -1-5 -2-3 -5-7 -3 3 1 4 1 5 9 2 6 5 3 5 8 9 7 9 3 7/ 27 8/ 27

Wert einer beliebigen Stellung Naive Realisierung Stellung p erlaube d zulässige Züge, die zu den Stellungen p 1,..., p d führen. Wert von p soll durch F (p) beschrieben werden. F (p) = max{ F (p 1 ),..., F (p d )} Rekursive Definition! Neg-Max Suche Durchsuche den gesamten Suchbaum und werte F rekursiv aus. Ist nicht praktikabel wegen des zu großen Aufwandes. Verwende eine feste Suchtiefe oder einen Zeitmonitor. Liefert nur eine Näherung für F. 9/ 27 10/ 27 Naives Programm Ziel int value(position p) { if( endposition(p) ) return F(p); int v = - INF; while( nextchild(p, q) ) v = max( v, -value(q) ); return v; } Versuche frühzeitig zu erkennen, ob ein Zweig des Suchbaumes zu keinem besseren als dem bisherigen Ergebnis führt. Versuche, ineffektive Zweige möglichst nahe an der Wurzel (= aktuelle Stellung) abzuschneiden. Ziel ist eine größere Suchtiefe bei geringerer Rechenzeit. 11/ 27 12/ 27

α-β-pruning (Donald N. Knuth) Realisierung to prune = beschneiden, ausdünnen, entlauben Suche eine Funktion G(p, α, β) mit: α falls F (p) α, G(p, α, β) = F (p) falls α F (p) β, β falls β F (p). Initialisiere den Wert mit v = α. Breche die Maximierung ab, so bald v β ist. Setze auf dem nächsten Suchlevel α neu = β alt, β neu = v. Aufruf an der Wurzel: G(p,, ) 13/ 27 14/ 27 Verbessertes Programm Suchbaum mit pruning int value(position p, int alpha, int beta) { if( endposition(p) ) return F(p); int v = alpha; while( nextchild(p, q) && v < beta ) v = max( v, -value(q, -beta, -v) ); return v; } -1-5 1 5 5 5-1 -1-5 -3-5 -5 3 1 4 1 5 9 5 3 5 8 9 7 15/ 27 16/ 27

Aufwand Aufwand Spielunabhängige Ergebnisse Spielabhängige Modifikationen Jeder andere Algorithmus benötigt mindestens den gleichen Aufwand. Bester Fall: Für jede Stellung führe der erste mögliche Zug zu einem Optimum, dann werden nur die optimalen Stellungen durchsucht. Schlechtester Fall: Es gibt immer eine Permutation der Stellungen, so dass alle Stellungen durchsucht werden. Typischer Fall: Aufwand ist ( d 1 ln d) h mit h Zahl der Niveaus und d Zahl der möglichen Züge pro Stellung. Ad hoc Bewertung von Stellungen (ohne weitere Suche) Ausnutzen von Symmetrien Bibliotheken (Hash-Tabellen) bereits analysierter Stellungen Eröffnungsbibliotheken Endspielbibliotheken 17/ 27 18/ 27 Gewinnstrategien Remisstrategien Spieler A hat eine Gewinnstrategie, wenn Spieler B auch bei optimalem Spiel einen Sieg von A nicht verhindern kann. Spieler A und B können nicht gleichzeitig eine Gewinnstrategie haben. Spieler A hat eine Remisstrategie, wenn Spieler B auch bei optimalem Spiel ein Remis nicht verhindern kann. Spieler A und B können gleichzeitig eine Remisstrategie haben. 19/ 27 20/ 27

Entscheidbarkeit Vermutlich faire Spiele Ein Spiel ist entscheidbar, wenn ein Spieler eine Gewinnstrategie hat oder beide Spieler eine Remisstrategie haben. Ein Spiel ist fair, wenn beide Spieler eine Remisstrategie haben. 8 8 Othello (Verifikation würde das Durchsuchen von ca. 10 37 Stellungen erfordern.) Schach (Verifikation würde das Durchsuchen von ca. 10 43 Stellungen erfordern.) 21/ 27 22/ 27 Bekannte Ergebnisse 4 4 Othello: schwarz gewinnt. 6 6 Othello: schwarz gewinnt. (Feinstein 1993, 5 Wochen Workstation, 10 10 Stellungen) Mühle ist fair. (Gasser-Nievergelt 1994, 3 Jahre PC-Cluster, Vorwärts-Rückwärts-Suche, 49 Zustandsräume à 10 6 10 10 Stellungen, Ausnutzen von Symmetrien) Dame (Checkers Variante) ist fair. (Schaeffer et al 2007, Programm Chinook, Vorwärts-Rückwärts-Suche, ca. 5 10 20 Stellungen) High Noon Wer zuerst zieht, verliert. Rot verliert nach 37 Zügen. Schwarz verliert nach 30 Zügen. 23/ 27 24/ 27

Epilog Epilog Grenzen: Go A quoi bon? Zahl der Positionen 10 170 (Schach: 10 43 ) Keine ad hoc Bewertung von Stellungen möglich Suchbaumansatz selbst mit α-β-pruning unmöglich Alternative Ansätze: Monte-Carlo Methoden Kombinatorische Optimierung Mustererkennung Analyse großer Datenmengen Bewertung wirtschaftlicher Situationen (Nash-Gleichgewicht) Effiziente numerische Lösung partieller Differentialgleichungen 25/ 27 26/ 27 Literatur Literatur J. Bewersdorff Glück, Logik und Bluff Vieweg, 2001 Handout dieses Vortrages www.rub.de/num1 Link: Berichte Bachelorarbeiten um Thema www.rub.de/num1 Link: Abschlussarbeiten 27/ 27