Samuel's Checkers Program

Ähnliche Dokumente
Praktikum Algorithmen-Entwurf (Teil 7)

Sokoban. Knowledge Engineering und Lernen in Spielen. Mark Sollweck Fachbereich 20 Seminar Knowledge Engineering Mark Sollweck 1

Semesterprojekt Implementierung eines Brettspiels (inklusive computergesteuerter Spieler)

Übersicht. 5. Spiele. I Künstliche Intelligenz II Problemlösen 3. Problemlösen durch Suche 4. Informierte Suchmethoden

Seminarvortrag zum Thema maschinelles Lernen I - Entscheidungsbäume. von Lars-Peter Meyer. im Seminar Methoden wissensbasierter Systeme

Übersicht. Künstliche Intelligenz: 6. Spiele Frank Puppe 1

Backgammon. Tobias Krönke. Technische Universität Darmstadt Fachbereich Informatik Fachgebiet Knowledge Engineering

Konzepte der AI: Maschinelles Lernen

6. Spiele Arten von Spielen. 6. Spiele. Effizienzverbesserung durch Beschneidung des Suchraums

Der Bestimmtheitssatz

Spiele als Suchproblem

Intelligente Systeme

TD-Gammon. Michael Zilske

Kombinatorische Spiele mit Zufallselementen

Projekt Schach. Informatik LK Q4. Jahrgang Projekt Schach. Marc Oertel, Dennis Fröhlich

Data Mining und Maschinelles Lernen Lösungsvorschlag für das 7. Übungsblatt

Lernen unterschiedlich starker Bewertungsfunktionen aus Schach-Spielprotokollen

Abschlusspräsentation. Marcel Maier Marius Fabian Sebastian Abele Konstantin Meyer

Der Alpha-Beta-Algorithmus

Entwicklung einer KI für Skat. Hauptseminar Erwin Lang

Monte Carlo Methoden

1. Lernen von Konzepten

Berühmte Informatiker

2. Spiele. Arten von Spielen. Kombinatorik. Spieler haben festgelegte Handlungsmöglichkeiten, die durch die Spielregeln definiert werden.

Hackenbusch und Spieltheorie

Bachelorarbeit. Miriam Tödten. Einsatz eines maschinellen Lernverfahrens in einem Othello-Spielprogramm

Grundlagen der Künstlichen Intelligenz

Informatik II Übung 9

Programmierkurs Prolog, SS 2000

Der χ 2 -Test. Überblick. Beispiel 1 (χ 2 -Anpassungstest)

Der χ2-test Der χ2-test

Grundlagen der Künstlichen Intelligenz Einführung Minimax-Suche Bewertungsfunktionen Zusammenfassung. Brettspiele: Überblick

Entscheidungsbäume. Minh-Khanh Do Erlangen,

Vergleich von SVM und Regel- und Entscheidungsbaum-Lernern

Herzlich Willkommen. Spielstrategien. gehalten von Nils Böckmann

Maschinelles Lernen: Symbolische Ansätze

Neuronale Netze. Gehirn: ca Neuronen. stark vernetzt. Schaltzeit ca. 1 ms (relativ langsam, vgl. Prozessor)

Deep Blue. Hendrik Baier

Symbolisches Lernen in Go

Überblick. Mathematik und Spiel. Ohne Glück zum Sieg. Bedeutung der Strategie. Zwei Hauptaspekte

Ganzrationale Funktionen

Data Mining und Maschinelles Lernen

Einführung in die Methoden der Künstlichen Intelligenz. Suche bei Spielen

Erste Schritte um Schach zu lernen

Erweitern von Aqqu durch AutoSklearn

KALAHA. Erfahrungen bei der Implementation von neuronalen Netzen in APL. Dipl.Math. Ralf Herminghaus, April 2018

Maschinelles Lernen: Symbolische Ansätze

Beschränktheit, Monotonie & Symmetrie

Game of life. Projektaufgabe. Inhaltsverzeichnis. Begriffe. 1 Grundlagen 3

Deformierbares Teil. 1 Erstellung von einem Deformierbaren Teil. Werkzeuge > Deformierbares Teil definieren Tools > Define Deformable Part

Über die Bedeutung der zwei Zahlen m und x 1 für das Aussehen des Graphen wird an anderer Stelle informiert.

Testing in Microarray Experiments, StatisticalScience(18), Seiten

SciCa - Scientific Calculator

Informatik II - Übung 10

Maschinelles Lernen: Symbolische Ansätze. Wintersemester 2013/2014 Musterlösung für das 7. Übungsblatt

Projektgruppe. Clustering und Fingerprinting zur Erkennung von Ähnlichkeiten

66 Das Kartenspiel. Inhaltsverzeichnis

Künstliche Intelligenz am Zug: Können Programme gegen menschliche Spieler gewinnen?

Summy Spielanleitung/Spielregeln. Brettspielnetz.de Team Copyright 2017 Corné van Moorsel

Polynominterpolation. Allgemeines Problem: Beispiel 1 (Teil 1):

Konzepte der AI. Maschinelles Lernen

Statistik II Übung 4: Skalierung und asymptotische Eigenschaften

Abstand Punkt/Ebene. x 50 = 0

Spiele (antagonistische Suche) Übersicht. Typen von Spielen. Spielbaum. Spiele mit vollständiger Information

Neuronales Lernen in Go Kai Brodmann

Einführung in die linearen Funktionen. Autor: Benedikt Menne

Einführung in die Methoden der Künstlichen Intelligenz. Suche bei Spielen

Tutorium: Diskrete Mathematik

1 x 1 y 1 2 x 2 y 2 3 x 3 y 3... n x n y n

Grenzen der Regularität

Anhang C Vorgabenzuteilung in Wettspielen

Seminar. Knowledge Engineering und Lernen in Spielen. Reinforcement Learning to Play Tetris. TU - Darmstadt Mustafa Gökhan Sögüt, Harald Matussek 1

TUD Computer Poker Challenge

Sätze über ganzrationale Funktionen

RapidMiner als Werkzeug für die textorientierten Geisteswissenschaften Katharina Morik

Terme und Gleichungen

Domain-independent. independent Duplicate Detection. Vortrag von Marko Pilop & Jens Kleine. SE Data Cleansing

Monte Carlo Methoden

Maschinelles Lernen: Symbolische Ansätze

Mathematik 1 Probeprüfung 1

Seminar: Multi-Core Architectures and Programming. Viola-Jones Gesichtsdetektor

Transkript:

Samuel's Checkers Program Seminar: Knowledge Engineering und Lernen in Spielen 29.06.2004 Ge Hyun Nam

Überblick Einleitung Basis Dame-Programm Maschinelles Lernen Auswendiglernen Verallgemeinerndes Lernen Vergleich 29.06.2004 Knowledge Engineering und Lernen in Spielen 2

Einleitung Maschinelles Lernen angewandt auf Spiele Wieso Dame? Einfachheit der Regeln ermöglicht Konzentration auf Lerntechniken Erfüllt Grundeigenschaften einer intellektuellen Aktivität Aktivität darf nicht deterministisch sein Bestimmtes Ziel muss existieren Regeln der Aktivität müssen exakt sein Hintergrundwissen bzgl. Aktivität, gegen diese der Lernprozess getestet werden kann Aktivität sollte Gruppe von Menschen bekannt sein 29.06.2004 Knowledge Engineering und Lernen in Spielen 3

Basis Dame-Programm Zuerst muss Computer programmiert werden gültiges Dame zu spielen Regeln des Spiels in Maschinensprache ausdrücken Gegnerischen Zug akzeptieren Zug des Computers melden Basis Dame-Programm Computer spielt indem er ein paar Züge voraus schaut und resultierende Spielpositionen bewertet 29.06.2004 Knowledge Engineering und Lernen in Spielen 4

Basis Dame-Programm (2) Parameter der Evaluationsfunktion werden entweder festgesetzt oder das Programm kann diese auswählen Minimax-Suche (in späteren Versionen auch alpha-beta pruning) Beschränkung der Suchtiefe 29.06.2004 Knowledge Engineering und Lernen in Spielen 5

Auswendiglernen Einfachste Art von Lernen Alle während des Spiels auftauchende Positionen werden mit ihrer Bewertung gespeichert Einsparen von Berechnungszeit 29.06.2004 Knowledge Engineering und Lernen in Spielen 6

Auswendiglernen (2) Weitere Eigenschaften: Sense of direction Sieg erzwingen Tiefere Spielzüge Katalogisierung von Spielpositionen Standardisierung: Weiss ist am Zug bei Damespielen Spielfeld spiegeln Gruppierung in Datensätze Redundanz vermeiden Verwerfen von Spielzügen Häufigkeit der Benutzung mittels Alter-Attribut Auffrischen: bei Verweis Alter halbieren Vergessen: bei Erreichen eines Maximum-Wertes löschen Bewertungsfunktion: (1) piece advantage, (2) denial of occupancy, (3) Mobilität, (4) Hybird Term: Zentrumskontrolle + piece advantage 29.06.2004 Knowledge Engineering und Lernen in Spielen 7

Auswendiglernen (3) Tests Spiel gegen sich selbst Spiel gegen verschiede Menschen (teilweise Damemeister) Book Games Resultat Programm lernt sehr gutes Eröffnungs- und Endspiel Keine grosse Verbesserung im Mittelspiel Besser als überdurchschnittlicher Anfänger 29.06.2004 Knowledge Engineering und Lernen in Spielen 8

Verallgemeinerndes Lernen Auswendiglernen ist durch Speicherkapazität beschränkt Effektivere Lernmethode: gemachte Erfahrungen verallgemeinern und nur diese Verallgemeinerungen speichern Beinhaltet folgende Abstraktion: Programm ist in der Lage die Terme des Bewertungspolynoms selbst auszuwählen und das Vorzeichen und die Größe der Koeffizienten anhand des Spielerfolgs zu bestimmen 29.06.2004 Knowledge Engineering und Lernen in Spielen 9

Verallgemeinerndes Lernen (2) Bewertungspolynom: V(board) = c1*f1+c2*f2+c3*f3+..+cn*fn Programm übernimmt Rolle beider Spieler Alpha verallgemeinert seine Erfahrung nach jeden Zug, indem die Koeffizienten angepasst werden Beta benutzt das ganze Spiel lang das gleiche Bewertungspolynom Alpha im Spiel gegen Menschen, Alpha vs. Beta im Selbstspiel Bei Sieg von Alpha, erhält Beta sein Bewertungssystem Liegt hingegen Beta in Führung -> black mark Bei drei black marks -> auf den falscher Weg; führender Koeffizient wird auf Null gesetzt 29.06.2004 Knowledge Engineering und Lernen in Spielen 10

Verallgemeinerndes Lernen (3) Modifikation der Termkoeffizienten anhand des Spielerfolges beinhaltet folgende Schwierigkeit: Nicht immer sicher, welcher Spielzug zum Gewinn oder Verlust geführt hat Also nicht sicher, welcher Term neu gewichtet werden sollte Lösung: Während des Spiels nach jedem Zug Bewertungspolynom bewerten Vergleich der Bewertungen für die Stellungen, die sich ergeben, einmal mit dem Polynom und zum anderen nach der Minimax Methode 29.06.2004 Knowledge Engineering und Lernen in Spielen 11

Verallgemeinerndes Lernen (4) Differenz ist Delta, Maß für die Güte des Bewertungspolynoms Wenn Delta positiv, Polynom zu pessimistisch Alle positiven Terme stärker bewerten Wenn Delta negativ, Polynom zu optimistisch Alle negativen Terme stärker bewerten Nach Beendigung des Spiels werden die für jeden Zug ermittelten Delta-Werte mit dem Vorzeichen der verschiedener Terme während eines ganzen Spiels korreliert Koeffizienten werden je nach berechneter Korrelation für das nächste Spiel verändert 29.06.2004 Knowledge Engineering und Lernen in Spielen 12

Auswendiglernen vs. Verallgemeinerndes Lernen Auswendiglernen führte sehr schnell zu einer guten Eröffnung Aber schlechtes Mittelspiel Verallgemeinerndes Lernen hingegen nicht so gutes Eröffnungsspiel Aber drastische Verbesserung des Mittelspiels Einmal in Steinvorteil, hatte der Gegner meist keine Chance mehr Meisterliches Spiel bei Kombination beider Lernmodi 29.06.2004 Knowledge Engineering und Lernen in Spielen 13

Quellenangaben A. L. Samuel: Some Studies in Machine Learning Using the Game of Checkers A. L. Samuel: Some Studies in Machine Learning Using the Game of Checkers. II Recent Progress S. Russel, P. Norvig: Artificial Intelligence A Modern Approach R. Sutton, A. Barto: Reinforcement Learning: An Introduction 29.06.2004 Knowledge Engineering und Lernen in Spielen 14