Lernen unterschiedlich starker Bewertungsfunktionen aus Schach-Spielprotokollen

Ähnliche Dokumente
Knowledge Engeneering und Lernen in Spielen

Lernen unterschiedlich starker

Learning To Play Chess Using Temporal Differences

Ridge Regression und Kernalized Support Vector Machines : Einführung und Vergleich an einem Anwendungsbeispiel

Deep Blue. Hendrik Baier

Support Vector Machines und Kernel-Methoden

Domain Driven Design damals und heute

Knowledge Engineering und Lernen in Spielen. Thema: Opening Book Learning von: Thomas Widjaja

Proseminar: Geschichte des Computers Schachprogrammierung Die Digitale Revolution

Lernziel: DWZ 1300 Lektion 1

Learning to Rank Sven Münnich

Schachaufgabe 05: Ma-Übung Chess Problem 05: Mate training

KAPITEL 2 ERSTE PARTIE

Partien Lektion 1 Nachspielen, Verstehen & Anwenden Folge 3

Ein Vergleich von Methoden für Multi-klassen Support Vector Maschinen

Samuel's Checkers Program

Einführung in Support Vector Machines (SVMs)

Vergleich von SVM und Regel- und Entscheidungsbaum-Lernern

Taktiv vom 16. November 2017 / JH

Der Bestimmtheitssatz

TD-Gammon. Michael Zilske

Backgammon. Tobias Krönke. Technische Universität Darmstadt Fachbereich Informatik Fachgebiet Knowledge Engineering

Learning Search Control

Einführung in die Bioinformatik: Lernen mit Kernen

Nutzung maschinellen Lernens zur Extraktion von Paragraphen aus PDF-Dokumenten

Industrial Data Intelligence Datenbasierte Produktionsoptimierung. Hannover, HMI Peter Seeberg

Fesselung von Michael Reiter 2011

Semiüberwachte Paarweise Klassifikation

Parallele Rechenmodelle

Grundlagen der Künstlichen Intelligenz Einführung Minimax-Suche Bewertungsfunktionen Zusammenfassung. Brettspiele: Überblick

39.1 Alpha-Beta-Suche

Malte Colpe 2349 Miroslaw Grabarczyk 2436 VMCG (2), Lüneburg D56 Damengambit. 1.d4 d5 2.c4 e6 3. c3 f6 4. g5 e7

Schachaufgabe 17: Pa-Übung. Chess Problem 17: Stalemate training. Stufe / Level: 2

Skript zur Vorlesung Mikroökonomik II (WS 2009) Teil 4

so sehen Sieger aus (Vera und Alexander waren schon am Weg nach Hause)

CHESS NEWS 1 / Inhalt: GV 2017 IGM Weihnachtsturniere Seniorenschach SGM Jugendschach Rätselecke

Seminar A - Spieltheorie und Multiagent Reinforcement Learning in Team Spielen

Chapter 1 : þÿ b e t a t h o m e P o k e r A p p a p k c h a p t e r

Kudischewitsch Gambit

Lernziel: DWZ 1100 Lektion 1

Vorlesung Maschinelles Lernen

Stufe 2 Vorausdenken 3: Greife sicher an! 3: Angriff ausdenken 5: Material / Material gewinnen: A

Deep Blue. Knowledge Engineering & Machine Learning in Games. Vortrag von Olexandr Savchuk

Intelligente Systeme

Comput er- WM Amst erdam (2)

KAPITEL 4 DIE PARTIEN DES SIEGERTURNIERS

dlib - A toolkit for making real world machine learning and data analysis applications in C++

Textmining Klassifikation von Texten Teil 2: Im Vektorraummodell

Projekt-INF Folie 1

Geometrie in der Spieltheorie

Martin Stetter WS 03/04, 2 SWS. VL: Dienstags 8:30-10 Uhr

Stufe 2 Vorausdenken 3: Greife sicher an! 3: Angriff ausdenken 4: Mache einen sicheren Zug!

Schachdatenbanken. Schachdatenbanken als Trainingsutensil für Vereinsspieler. Dr. Sven Hermann Karlsruhe

Support Vector Machines (SVM)

"Der Minoritätsangriff"

Praktikum Algorithmen-Entwurf (Teil 7)

Chapter 1 : þÿ b e t - a t - h o m e s p a m m a i l c h a p t e r

Quantenrechner. Ideen der Informatik Kurt Mehlhorn

/-010 2% 3%.-&"(2#( 4#5% 6077## 7 8$$04%27.0& 905$0& :0;+

Chapter 1 : þÿ b w i n l a u f e n c h a p t e r

GS5 - DWZ 1300 Lektion 1

Entwicklung einer KI für Skat. Hauptseminar Erwin Lang

Chapter 1 : þÿ b e t a t h o m e P f e r d u k R e n n e n c h a p t e r

Q +

Anregende, ergänzende Literatur:

Chapter 1 : þÿ b e t a t h o m e a p l i k a c j a n a t e l e f o n c h a p t e r

Die kleine Schachschule

Der Turm auf der offenen Linie I

Basiswissen Endspiele

1928 John von Neumann Zur Theorie der Gesellschaftsspiele, Mathematische Annalen 100:

Vorlesung Maschinelles Lernen

1/19. Kern-Methoden zur Extraktion von Informationen. Sebastian Marius Kirsch Back Close

Matt in drei Iterationen. Lebendiger Architekturentwurf am Beispiel einer Schach-Engine. Stefan Zörner

Martin Gittel: Das Porträt David Kittinger und sein Schachprogramm Mychess (Quelle: Nr. 229 August 1983) (photo copyright

Gleiche Daten, unterschiedliche Erkenntnisziele?

Grundlagen von Support Vector Maschinen und Anwendungen in der Bildverarbeitung

Turmendspiele (Türme und Bauern)

Lernziel: DWZ 1300 Lektion 1

8. Runde Nordhessenliga Vellmar 2 Bad Emstal/Wolfhagen 2

Chapter 1 : þÿ g i o c h i b e t a c h a p t e r

Chapter 1 : þÿ b e t a t h o m e H a n d y i m S p i e l c h a p t e r

Pareto optimale lineare Klassifikation

Matt in drei Iterationen. Lebendiger Architekturentwurf am Beispiel einer Schach-Engine. Stefan Zörner

Partien Lektion 1 Nachspielen, Verstehen & Anwenden Folge 6

Chapter 1 : þÿ b e t a g r a t u i t e c h a p t e r

DER SCHLÜSSEL IN DER STRATEGIE

Schwerfiguren 1: Angriffspotential

Support Vector Machines, Kernels

Chapter 1 : þÿ H a u s b e t a t h o m e c h a p t e r

Matt in drei Iterationen. Stefan Zörner oose Innovative Informatik GmbH

Chapter 1 : þÿ b e t a t h o m e P f e r d e r e n n e n - W e t t e n c h a p t e r

Chapter 1 : þÿ C h a m p i o n s L e a g u e b e t a t h o m e c h a p t e r

Text Mining for Second Screen

Reinforcement Learning

Spieltheorie. oder wie man interdependente Entscheidungen analysieren kann. HHL Leipzig Graduate School of Management

Grundlagen zu neuronalen Netzen. Kristina Tesch

Spielanalysen mit Lerneffekt So verbessern Sie Ihre taktische und psychologische Spielstärke. Die große Schachschule: Wie Sie aus Fehlern der

Läufer gegen Springer. 1 XABCDEFGHY l+( ' & 5+k+-+-+-% $ 3+PzP-+-+-# 2-+-mK-+-+" 1+-sN-+-+-!

Transkript:

Lernen unterschiedlich starker Bewertungsfunktionen aus Schach-Spielprotokollen Philip Paulsen Diplomarbeit

Übersicht Spielstärke im Schach MiniMax-Algorithmus Details zur Bewertungsfunktion Erzeugen der Trainingsdaten Ranking SVM Ergebnisse Evaluierung Zusammenfassung und Ausblick

Spielstärke ELO-Zahl 2600+ 2400 2200 2000 1800 1600 1400 1200 1000 Großmeister Internationale Meister Nationale Meister Meisteranwärter Experten starke Vereinsspieler Vereinsspieler Hobbyspieler Gelegenheitsspieler

Spielstärke ELO-Zahl 2600+ 2400 2200 2000 1800 1600 1400 1200 1000 Großmeister Internationale Meister Nationale Meister Meisteranwärter Experten starke Vereinsspieler Vereinsspieler Hobbyspieler Gelegenheitsspieler

Spielstärke Bedeutung der ELO Differenz Gewinnerwartung 200 Punkte Differenz = 0.76 Erwartungswert Beispiel mit diesen Zahlen Nach 100 Spielen also ~ 76/24

Spielstärke Bedeutung der ELO Differenz Gewinnerwartung 200 Punkte Differenz = 0.76 Erwartungswert Beispiel mit diesen Zahlen Nach 100 Spielen also ~ 76/24

Spielstärke Bedeutung der ELO Differenz Gewinnerwartung 200 Punkte Differenz = 0.76 Erwartungswert Beispiel mit diesen Zahlen Nach 100 Spielen also ~ 76/24

MiniMax-Algorithmus

MiniMax-Algorithmus optimale Lösung (Spieltheorie) Jeder macht den für sich bestmöglichen Zug Aber

MiniMax-Algorithmus optimale Lösung (Spieltheorie) Jeder macht den für sich bestmöglichen Zug Aber Baumsuche nicht vollständig möglich Verzweigungsgrad ~ 30 590 490 000 000 000 nach 10 Halbzügen Bewertungsfunktion zum Schätzen der Blätter

Details zur Bewertungsfunktion

Details zur Bewertungsfunktion Figurenwerte Dame = 1x 900

Details zur Bewertungsfunktion Figurenwerte Dame = 1x 900 Turm = 2x 500

Details zur Bewertungsfunktion Figurenwerte Dame = 1x 900 Turm = 2x 500 Springer = 1x 300

Details zur Bewertungsfunktion Figurenwerte Dame = 1x 900 Turm = 2x 500 Springer = 1x 300 Bauer = 6x 100

Details zur Bewertungsfunktion Sonderwerte Isolierter Bauer = -10

Details zur Bewertungsfunktion Sonderwerte Isolierter Bauer = -10 Freibauer = +20

Details zur Bewertungsfunktion Sonderwerte Isolierter Bauer = -10 Freibauer = +20 Offene Linie = +15

Details zur Bewertungsfunktion Sonderwerte Isolierter Bauer = -10 Freibauer = +20 Offene Linie = +15 Halboffene Linie = +10

Details zur Bewertungsfunktion Piece Square Table Gewichtsmatrix positive/negative Bewertung einzelner Felder für verschiedene Spielsteine

Details zur Bewertungsfunktion Piece Square Table 0 0 0 0 0 0 0 0 5 10 15 20 20 15 10 5 4 8 12 16 16 12 8 4 3 6 9 12 12 9 6 3 2 4 6 8 8 6 4 2 1 2 3-10 -10 3 2 1 0 0 0-40 -40 0 0 0 0 0 0 0 0 0 0 0

Erzeugen der Trainingsdaten Birkerod Club, Birkerod 14.03.1999, Runde: 4 Petersen, Jonathan Roed (1380) - Hamann, Heinrich (1379) 0-1 1.d2-d4 Ng8-f6 2.c2-c4 c7-c5 3.e2-e3 e7-e6 4.Nb1-c3 c5xd4 5.e3xd4 d7-d5 6.c4-c5 Nb8-c6 7.Ng1-f3 b7-b6 8.Bf1-b5 Bc8-d7 9.Bb5xc6 Bd7xc6 10.Nf3-e5 Qd8-c8 11.c5xb6 a7xb6 12.Bc1-f4 Bf8-e7 13.Ra1- c1 Qc8-b7 14.O-O O-O 15.a2-a3 Ra8-c8 16.Ne5-g4 Nf6-e4 17.Ng4-h6+ g7xh6 18.Bf4xh6 Kg8-h8 19.Nc3xe4 d5xe4 20.d4-d5 Bc6xd5 21.Rc1xc8 Rf8xc8 22.Qd1-h5 Be7-f6 23.Rf1-c1 Rc8-g8 24.Bh6-e3 Rg8-g6 0-1

Erzeugen der Trainingsdaten Datensätze beschrieben durch Label (1,-1) y ID (1...n) q Feature Vektor x Bestimmen der resultierenden Stellung durch Ruhesuche (Schlagfolgeanalyse)

Erzeugen der Trainingsdaten b4a6, g6a6

Erzeugen der Trainingsdaten c1c7

Ranking SVM Label (1,-1) ID (1...n) Feature Vektor Ordnung Gewichtsvektor y q x R w Für Einträge mit derselben ID soll gelten wenn

Ranking SVM Schlupfvariablen erlauben Fehlklassifikation SVM bestimmt den Gewichtsvektor w

Ergebnisse Sonderwerte (Turm)

Ergebnisse Relevanzskalierte Gewichtsdarstellung 1.) Errechnete Piece Square Table (König)

Ergebnisse Relevanzskalierte Gewichtsdarstellung 2.) Häufigkeit mit der der König ein Feld besetzt

Ergebnisse Relevanzskalierte Gewichtsdarstellung 3.) Filtern unzuverlässiger Werte durch Multiplikation

Ergebnisse - Bauer 1000 1200 1400 1600

Ergebnisse - Springer 1000 1200 1400 1600

Evaluierung - Turnier

Evaluierung - FICS

Zusammenfassung und Ausblick Lernen von Bewertungsfunktionen mit Ranking-SVM möglich Aber Lernen unterschiedlicher Spielstärken nicht erfolgreich! Daten in diesem ELO-Bereich unzuverlässig! Bewertungsfunktion zu simpel? Keine typischen Fehler modellierbar?! Einfluss der Bewertungsfunktion wahrscheinlich zu schwach!?

Quellen (Auszug) D.F. Beal and M.C. Smith. Learning piece-square values using temporal dierences. 22(4):223{235, December 1999. Monty Newborn David Levy. How Computers play chess. Computer Science Press, 1990. T. Joachims. Making large-scale SVM learning practical. In B. Schölkopf, C. Burges, and A. Smola, editors, Advances in Kernel Methods - Support Vector Learning, chapter 11, pages 169{184. MIT Press, Cambridge, MA, 1999. John Von Neumann and Oskar Morgenstern. Theory of Games and Economic Behavior. Princeton University Press, 1944. Claude E. Shannon. Programming a computer for playing chess. In Philosophical Magazine, Ser.7, volume 41, March 1950. Gerald Tesauro. Comparison training of chess evaluation functions. In Machines that learn to play games, pages 117{130. Nova Science Publishers, Inc., Commack, NY, USA, 2001.

Danke für ihre Aufmerksamkeit