Deep Blue. Hendrik Baier

Ähnliche Dokumente
Knowledge Engineering und Lernen in Spielen. Thema: Opening Book Learning von: Thomas Widjaja

Deep Blue. Knowledge Engineering & Machine Learning in Games. Vortrag von Olexandr Savchuk

Beating Humans in complex Boardgames

Lernen unterschiedlich starker Bewertungsfunktionen aus Schach-Spielprotokollen

Learning To Play Chess Using Temporal Differences

Schachaufgabe 05: Ma-Übung Chess Problem 05: Mate training

TSM 5.2 Experiences Lothar Wollschläger Zentralinstitut für Angewandte Mathematik Forschungszentrum Jülich

Durametric. Installations Anleitung Quick Installation Guide. Deutsch: Seite 2 bis 3. English: Page 4 to 5. ww.fvd.de

Ein Stern in dunkler Nacht Die schoensten Weihnachtsgeschichten. Click here if your download doesn"t start automatically

Knowledge Engeneering und Lernen in Spielen

Schachaufgabe 37: Schachma in 2 Zügen Chess Problem 37: Checkmate in 2 Moves. Stufe / Level: 5

Learning Search Control

Proseminar: Geschichte des Computers Schachprogrammierung Die Digitale Revolution

Handbuch der therapeutischen Seelsorge: Die Seelsorge-Praxis / Gesprächsführung in der Seelsorge (German Edition)

Wie man heute die Liebe fürs Leben findet

CNC ZUR STEUERUNG VON WERKZEUGMASCHINEN (GERMAN EDITION) BY TIM ROHR

Kursbuch Naturheilverfahren: Curriculum der Weiterbildung zur Erlangung der Zusatzbezeichnung Naturheilverfahren (German Edition)

Grundlagen der Künstlichen Intelligenz

Solving Checkers 18 Jahre Rechnen für ein Unentschieden Niklas Büscher

39.1 Alpha-Beta-Suche

Relevante(r) Deskriptor(en) Deskriptor 5: Kann einfachen Interviews, Berichten, Hörspielen und Sketches zu vertrauten Themen folgen.

Die einfachste Diät der Welt: Das Plus-Minus- Prinzip (GU Reihe Einzeltitel)

Entwicklung einer KI für Skat. Hauptseminar Erwin Lang

Grundlagen der Künstlichen Intelligenz Einführung Minimax-Suche Bewertungsfunktionen Zusammenfassung. Brettspiele: Überblick

Killy Literaturlexikon: Autoren Und Werke Des Deutschsprachigen Kulturraumes 2., Vollstandig Uberarbeitete Auflage (German Edition)

Was heißt Denken?: Vorlesung Wintersemester 1951/52. [Was bedeutet das alles?] (Reclams Universal-Bibliothek) (German Edition)

Im Fluss der Zeit: Gedanken beim Älterwerden (HERDER spektrum) (German Edition)

Symbio system requirements. Version 5.1

Das neue PL/I:... für PC, Workstation und Mainframe (German Edition)

Konkret - der Ratgeber: Die besten Tipps zu Internet, Handy und Co. (German Edition)

Reparaturen kompakt - Küche + Bad: Waschbecken, Fliesen, Spüle, Armaturen, Dunstabzugshaube... (German Edition)

Maschinelles Lernen. mit und. Effizienz steigern in Massenprozessen. Jan Schinnerling. eworld 2019 Maschinelles Lernen

v+s Output Quelle: Schotter, Microeconomics, , S. 412f

zu wem? Also, ich Einen, der mich Und ich wünsche zum der zufällig mal kann. was ich alles schon für mich wärmt, wenn s wünsch

Diabetes zu heilen natürlich: German Edition( Best Seller)

Kapitel 6: Dynamic Shortest Path

Killy Literaturlexikon: Autoren Und Werke Des Deutschsprachigen Kulturraumes 2., Vollstandig Uberarbeitete Auflage (German Edition)

Englisch-Grundwortschatz

Martin Luther. Click here if your download doesn"t start automatically

Schachaufgabe 17: Pa-Übung. Chess Problem 17: Stalemate training. Stufe / Level: 2

Ab 40 reif für den Traumjob!: Selbstbewusstseins- Training Für Frauen, Die Es Noch Mal Wissen Wollen (German Edition)

Der Sprung in die Zukunft! Einführung in neuronale Netzwerke

Mercedes OM 636: Handbuch und Ersatzteilkatalog (German Edition)

DIE NEUORGANISATION IM BEREICH DES SGB II AUSWIRKUNGEN AUF DIE ZUSAMMENARBEIT VON BUND LNDERN UND KOMMUNEN

Causal Analysis in Population Studies

Rough copy for the art project >hardware/software< of the imbenge-dreamhouse artist Nele Ströbel.

Artificial Intelligence. Was ist das? Was kann das?

Tschernobyl: Auswirkungen des Reaktorunfalls auf die Bundesrepublik Deutschland und die DDR (German Edition)

Wer bin ich - und wenn ja wie viele?: Eine philosophische Reise. Click here if your download doesn"t start automatically

Industrial Data Intelligence Datenbasierte Produktionsoptimierung. Hannover, HMI Peter Seeberg

Workshop Quality Assurance Forum 2014

Reinforcement Learning

PONS DIE DREI??? FRAGEZEICHEN, ARCTIC ADVENTURE: ENGLISCH LERNEN MIT JUSTUS, PETER UND BOB

Geschichte der Philosophie im Überblick: Band 3: Neuzeit (German Edition)

Sagen und Geschichten aus dem oberen Flöhatal im Erzgebirge: Pfaffroda - Neuhausen - Olbernhau - Seiffen (German Edition)

Nürnberg und der Christkindlesmarkt: Ein erlebnisreicher Tag in Nürnberg (German Edition)

Tote Hose: Worüber Männer schweigen. Ein Tagebuch (German Edition)

IBM Netezza Data Warehouse Appliances - schnelle Analysen mit hohen Datenmengen

Elektrosmog im Büro: Optimierung von Büro- Arbeitsplätzen (German Edition)

Cameraserver mini. commissioning. Ihre Vision ist unsere Aufgabe

Franz Joseph. Ennemoser. Click here if your download doesn"t start automatically

Vasco Tonack Network and Communication, ZEDAT. Cisco UC Licensing. Und die Nachteile von Extension Mobility

DAS HUMANISTISCHE MENSCHENBILD AM BEISPIEL CARL ROGERS (GERMAN EDITION) BY ANNA-MARIA SKORA

Power Laws And Rich Get Richer Phenomena Seminar Machinelles Lernen , Tomek Grubba

Wir haben in den vorherigen Kapiteln verschiedene Verfahren zur Regression und Klassifikation kennengelernt (z.b. lineare Regression, SVMs)

Seminar: Maschinelles Lernen und Deep Learning

Die Beziehung zwischen Mensch und Maschine wird neu definiert

Tschernobyl: Auswirkungen des Reaktorunfalls auf die Bundesrepublik Deutschland und die DDR (German Edition)

Von der Entscheidungsunterstützung zur Entscheidungsautomatisierung mit Big Data und Künstlicher Intelligenz

HUMANGENETIK IN DER WELT VON HEUTE: 12 SALZBURGER VORLESUNGEN (GERMAN EDITION) BY FRIEDRICH VOGEL

SOKO Ponyhof - Erster Roman: Gefahr in den Ferien (German Edition)

Mein Weg aus der Depression:: Wieso ein erfolgreicher Familienvater, Sportler und Banker plötzlich an Selbstmord dachte (German Edition)

Funktion der Mindestreserve im Bezug auf die Schlüsselzinssätze der EZB (German Edition)

Teil 2.2: Lernen formaler Sprachen: Hypothesenräume

1. Hello, I m Francis Docherty. a. No, sorry. I m not. 2. I m sorry. What was your b. I don t think he

Weihnachten anno Domini 2014: Geschichten, Sprüche und anderes (German Edition)

Wortdekodierung. Vorlesungsunterlagen Speech Communication 2, SS Franz Pernkopf/Erhard Rank

Geboren im Zeichen der Jungfrau: Was das Sternzeichen über den Menschen verrät (German Edition)

Schöpfung als Thema des Religionsunterrichts in der Sekundarstufe II (German Edition)

Aus FanLiebe zu Tokio Hotel: von Fans fã¼r Fans und ihre Band

Die Kunst der Gotik: Eine Einführung (German Edition)

~` Read Chronisch entzndliche Darmerkrankungen (CED) und der Einfluss von Sport und Bewegung (German Edition) digital books free download ID:yeixve

Reinforcement Learning

Backgammon. Tobias Krönke. Technische Universität Darmstadt Fachbereich Informatik Fachgebiet Knowledge Engineering

Dialogue: Herr Kruse talks to Herr Meyer about his regular trips to Berlin: Das geht sehr schnell! Es dauert nur etwa 3 Stunden.

Prepositions are words that give information to the reader. Vorwörter geben dem Leser Informationen.

Grundlagen zu neuronalen Netzen. Kristina Tesch

Renten wegen Erwerbsminderung: Die wichtigsten Regeln (German Edition) Click here if your download doesn"t start automatically

Machinelles Lernen. «Eine kleine Einführung» BSI Business Systems Integration AG

Aus FanLiebe zu Tokio Hotel: von Fans fã¼r Fans und ihre Band

Reinforcement learning

Pluralisierung von Lebensformen - Veränderung familiärer Strukturen und innergesellschaftlicher Wandel (German Edition)

Bio-Inspired Credit Risk Analysis

Intelligente Algorithmen Einführung in die Technologie

Evaluation von Arbeitsbeschaffungsmaßnahmen unter Berücksichtigung der Zusammenlegung mit Strukturanpassungsmaßnahmen (German Edition)

General Game Playing

Ausführliche Unterrichtsvorbereitung: Der tropische Regenwald und seine Bedeutung als wichtiger Natur- und Lebensraum (German Edition)

JTAGMaps Quick Installation Guide

Herders sämmtliche Werke: Band 13. Ideen zur Philosophie der Geschichte der Menschheit. Teile 1, 2 (German Edition)

Die Unterschiede der Goodwill-Bewertung nach HGB, IAS und US-GAAP (German Edition)

Transkript:

Deep Blue Hendrik Baier

Themen Matches Deep Blue Kasparov 1996/97 Faktoren von Deep Blues Erfolg Systemarchitektur Search Extensions Evaluationsfunktion Extended Book Vergleichstraining der Evaluationsfunktion

Teil eins Beating the World Champion

Man vs. Machine Februar 1996 Garry Kasparov vs. Deep Blue (I) 4 : 2 Mai 1997 Garry Kasparov vs. Deep Blue (II) 2,5 : 3,5 Zweifel Ausblick

Kasparov Vor dem Match "I made a firm decision for myself to take any challenge. And even if one day I'm doomed to lose, I thought it would be absolutely vital for us to play and to fight as long as we can." Nach dem Match I m only a human being. I get scared when I see something beyond my comprehension.

Team Blue

Teil zwei Inside Deep Blue

Deep Blue Die Geschichte des Projekts Systemüberblick Der Chess Chip Die Hardware-Suche Die Software-Suche Parallelität Die Evaluationsfunktion Verschiedenes

Die Geschichte

Systemüberblick 30-processor IBM RS/6000 SP Computer 480 single-chip chess search engines (16 p.p.) Nodes sind P2SC-Prozessoren 120 / 135 MHz mit je 1 GB RAM, 4 GB Disk Betriebssystem: AIX 4.2 Drei-Schichten-Organisation Grundideen Systemgeschwindigkeit ~ 126 Mio. Pos./Sek.

Der Chess Chip Zuggenerierung Evaluationsfunktion Suchkontrolle Erweiterbarkeit

Hardware-Suche Null-Window Search 4 5-ply tief plus Quiescence binäre Suche möglich

Software-Suche hochselektives Suchverfahren: dual credit with delayed extensions Mechanismen der Crediterzeugung Beispielverhalten

Parallelität Algorithmen der parallelen Suche Implementierung der parallelen Suche Performance der parallelen Suche

Die Evaluationsfunktion Überblick Beispiel: Türme auf Linien (Rooks on files) automatische Analyse der Evaluationsfunktion

Verschiedenes Opening Book Extended Book Endspiel-Datenbank Zeitkontrolle

Teil drei Tuning the Evaluation Function

Grundideen Methoden des Trainings Neuraler Netze: Supervised Learning Comparison Training Reinforcement Learning Häufiges Problem: Overfitting Abhilfe: z.b. Early Stopping

Tesauros Arbeit Verallgemeinerung des Vergleichstrainings auf Suchtiefen > 1 ply (angewendet auf das Training der Gewichte einer linearen Evaluationsfunktion) Experimente mit SCP Erfolgreiche Anwendung bei Deep Blue Ausblick

Problemstellung Schach benötigt einen Suchmechanismus, der viele Züge vorausrechnet Interaktion zwischen Suche und Evaluation ist nichttrivial Trainingssuchtiefe geringer als Performancesuchtiefe Zwei Arten von Verallgemeinerung erwartet

Verallgemeinerung Trainingsidee: multiple PVs Problem: keine Konvergenz? Lösungsidee: learning rate verringern, keine cutoffs

Experimente mit SCP Einfaches 1-ply-Training

Experimente mit SCP 1-ply-Training mit Erweiterungen mit zufälligen Gewichten gestartet

Experimente mit SCP 1-ply-Training mit Erweiterungen mit voreingestellten Gewichten gestartet

Anwendung bei Deep Blue Entscheidung für eine kleine Untermenge von Features (king safety) Anpassungen des Tuning-Algorithmus Auswirkungen auf das Match gegen Kasparov

Auswirkungen Beispiel aus Spiel zwei

Auswirkungen Beispiel aus Spiel sechs

Ausblick GM-Imitation = gutes Spiel? andere algorithmische Formulierungen Othello, Go, Dame, Shogi multi-layer network evaluators (gewinnen an Bedeutung, sobald Suchstrategien keine Fortschritte mehr machen)

Quellen Murray Campbell, A. Joseph Hoane Jr., Feng-hsiung Hsu: Deep Blue. Volume 134, Number 1-2, January 2002, pp. 57-83. Gerald Tesauro: Comparison Training of Chess Evaluation Functions. In Fürnkranz & Kubat: Machines That Learn To Play Games, Nova Science Publishers 2001. Murray Campbell: Knowledge Discovery in Deep Blue. Communications of the ACM 42(11): 65-67, 1999. Google Google Google