General Video Game AI Competition 2016

Ähnliche Dokumente
Real-time MCTS (4.7) Seminar aus maschinellem Lernen

Seminar aus maschinellem Lernen MCTS und UCT

General Game Playing

Abbildung eines 2-Spieler Computerspielers auf 3-Spieler Limit- Poker Peter Glöckner

AutoSPARQL. Let Users Query Your Knowledge Base

Der Mensch als Vorbild für intelligente Assistenz -Transfer von Fertigkeiten -

Strategien bei der Entwicklung und Modellierung von Poker-Agenten

System Administration Training. in the Virtual Unix Lab

Gamification vs. Ludefaction

INSTALLATIONSANLEITUNG INSTALLATION GUIDE. Deutsch / English

Besuchen Sie ifit.com und movetolive.de

PREMIS Aktuelle Entwicklungen und Perspektiven

Introduction to the diploma and master seminar in FSS Prof. Dr. Armin Heinzl. Sven Scheibmayr

Rationale Agenten Rationalität

Featuremodellbasiertes und kombinatorisches Testen von Software-Produktlinien

Conjoint Measurement:

Proposal zur Masterarbeit. Kombination der neuroevolutionären Methoden EANT mit Q-Learning und CMA-ES

Übersicht über den Studiengang

Jan Parthey, Christin Seifert. 22. Mai 2003

Mit In-Memory Technologie zu neuen Business Innovationen. Stephan Brand, VP HANA P&D, SAP AG May, 2014

CBLOCK: An Automatic Blocking Mechanism for Large-Scale De-duplication Tasks. Cathleen Ramson, Stefan Lehmann LSDD SS

Thema. Intelligente Agenten im Web

Durch Zufall zum Dan? Die Monte-Carlo-Baumsuche

Monte Carlo Methoden

Planung und Entwicklung von. Online-Rallyes. Dr. Sabine Hemsing

Unterscheidung: Workflowsystem vs. Informationssystem

5.14 Generics. Xiaoyi Jiang Informatik I Grundlagen der Programmierung

SAP Simple Service Request. Add-on for SAP Solution Manager by SAP Consulting SAP Deutschland SE & Co. KG

Optimale Produktliniengestaltung mit Genetischen Algorithmen

Testkonzept eines UAV Missionsplaners

Bielefeld Graphics & Geometry Group. Brain Machine Interfaces Reaching and Grasping by Primates

SHAREPOINT ERFOLGREICH EINFÜHREN

Sports Data Mining Data Sources for Sports - Daten und Datenquellen zur Nutzung für DataMining - Michael Gleser


Industrie 4.0 Berufliche und akademische Aus- und Weiterbildung vor neuen Herausforderungen?

Monte-Carlo Simulation

Mobil, Multimodal oder Augmentiert? Wohin geht die Reise?

Gamification funktioniert So macht arbeiten nachweislich Spaß

Einsatz von Reinforcement Learning in der Modellfahrzeugnavigation

Algorithmische Methoden zur Netzwerkanalyse

UI-Redressing-Angriffe auf Android. OWASP 07. November The OWASP Foundation Marcus Niemietz Ruhr-Universität Bochum

Vortrag. Suchverfahren der Künstlichen Intelligenz. Sven Schmidt (Technische Informatik)

Tutorium Algorithmen & Datenstrukturen

Skills 2020 Wie heutige IT Trends die Arbeitswelt verändern

Consulting Development Design

Nachhaltiges Lernen als Prozess innovative Kombination von Microlearning, Training und Learning on the Job

Uninformierte Suche in Java Informierte Suchverfahren

Was hier fehlt? Enterprise Search mit der Intelligenz von Google. Jetzt von Kapsch.

Simulation of Longitudinal Beam Dynamics

Mobile Learning ::: Bildung in Happchen?

Controlled Language with Terminology-Ontologies

Der Mensch spielt nur, wo er in voller Bedeutung des Wortes Mensch ist, und er ist nur ganz Mensch, wo er spielt. Friedrich Schiller

Algorithmen & Datenstrukturen 1. Klausur

ITIL Prozese in APEX am Beispiel des Vodafone FCH

Gamification Und was heißt das auf handwerklicher Ebene?

TeamSolutions Mehrzieloptimierung zur Kompromissfindung in Spielen

SemTalk Services. SemTalk UserMeeting

Spieltheorie. Sebastian Wankerl. 16. Juli 2010

RE-Metriken in SCRUM. Michael Mainik

Prof. Dr. Margit Scholl, Mr. RD Guldner Mr. Coskun, Mr. Yigitbas. Mr. Niemczik, Mr. Koppatz (SuDiLe GbR)

Cross-Kanal-Werbewirkung die Welt ist keine Badewanne

facebook.com/asmadigames

KI und Sprachanalyse (KISA)

Lego MindStorms Implementierung für Etoys

Auswertung zur Veranstaltung Ausgew. Themen aus d. Bereich Künstliche Intelligenz u. Robotik - Visuelle Navigation f. Flugroboter

Agentenbasiertes e-learning

Table Of Contents. a. Locations Allgemeines Controlling...4. b. Disclaimer i. Excel VBA für das Controlling... 4

Einfacher Problemlösungsagent. Übersicht. Begriffsdefinitionen für Einfach-Probleme

Grundlegende Algorithmen

Common Weaknesses of Android Malware Analysis Frameworks. Lars Richter

Amarok KDE 3.5.9

Fluid-Particle Multiphase Flow Simulations for the Study of Sand Infiltration into Immobile Gravel-Beds

Usability & Usability Engineering. Gerdenitsch Cornelia Seitlinger Paul

Institut für Baustatik Abteilung Vernetztes Lernen Technische Universität Graz

Dokumentation zum Spielserver der Software Challenge

Grundlagen der Künstlichen Intelligenz

Gamification in projektorientierten Unternehmen. MBA Thesis von Mag. David Spreitzer, MBA, PMP PMI Austria Chapter Forum Event 25.9.

Verteilte und kooperative VR-Anwendungen

Structurally Evolved Neural Networks for Forecasting

Verzeichnisdienste in heterogenen Systemen

Sports Data Mining. The Field and Methodology. Sublogo Fachbereich Informatik Prof. Johannes Fürnkranz 1

Monte Carlo simulation for estimating rare event probabilities and parameters in Markov process models

Rapide An Event-Based Architecture Definition Language

ERFOLGREICHES LERNEN Schnell und effektiv

TEILNAHMEBEDINGUNGEN. STREICHWERK International String Competition

Aktuelle Beteiligung an EU-Projekten

Multimedia Systeme. Dr. The Anh Vuong. * B-MMS * Multimedia Systeme

Game Audio Vertonung von Computerspielen

Motivation. Themenblock: Klassifikation. Binäre Entscheidungsbäume. Ansätze. Praktikum: Data Warehousing und Data Mining.

BPM Solution Day 2010 T-Systems Multimedia Solutions GmbH

Simulation virtueller Gemeinschaften

Analytics, Big Data, Multi-Touch Attribution und Content Marketing E-Business 2014

Monte Carlo Simulation (Grundlagen)

Anfrage Erweiterung Jan Schrader

Einführung in Heuristische Suche

(27 - Selbstanordnende lineare Listen)

SEODisc: Ansatz zur Erkennung von SEO-Attacken

Optimale Integration der IT-Security in Geschäftsprozesse

Abschlussworte. Jakob Schnell, Friedrich Schwedler und Patrick Dammann. 27. September 2015

Transkript:

General Video Game AI Competition 2016 Teilnahme an einem Wettbewerb der künstlichen Intelligenz für Computerspiele Miriam Moneke, Nils Schröder, Tobias Joppen Christan Wirth, Prof. J. Fürnkranz 13.04.2016 Fachbereich Informatik Knowledge Engineering Group Prof. J. Fürnkranz 1

Motivation Industrie Verhalten von nicht-spieler Charakteren Entscheidungsfindung PCG (Procedural Content Generation) 13.04.2016 Fachbereich Informatik Knowledge Engineering Group Prof. J. Fürnkranz 2

AI Research in Games Spiele als Benchmarks für künstliche Intelligenz: 13.04.2016 Fachbereich Informatik Knowledge Engineering Group Prof. J. Fürnkranz 3 3

General Video Game Playing Video game-based AI Competitions 13.04.2016 Fachbereich Informatik Knowledge Engineering Group Prof. J. Fürnkranz 4 4

General Video Game Playing General Video Game Playing? 13.04.2016 Fachbereich Informatik Knowledge Engineering Group Prof. J. Fürnkranz 5 5

GVGAI und VGDL Existierendes Framework (GVGAI) Teilnehmer reichen Agenten ein 110 Spiele insgesamt in Trainings, Validation und Final Sets Spiele sind mit der Video Game Description Language implementiert Fully observable environment Agenten haben 40 ms Zeit, um Entscheidungen zu treffen 13.04.2016 Fachbereich Informatik Knowledge Engineering Group Prof. J. Fürnkranz 6

VGDL and the GVGAI Framework Der erste Agent ist einfach zu erstellen! 13.04.2016 Fachbereich Informatik Knowledge Engineering Group Prof. J. Fürnkranz 7 7

VGDL and the GVGAI Framework Zu jedem Zeitschritt bekommt der Agent Informationen: Spielzustand: Punktzahl, Zeitschritt, Sieger, Spiel beendet, Spielfeldgröße, Zustand des eigenen Avatar: Position, Geschwindigkeit, Blickrichtung, Inventar, Lebenspunkte, Verfügbare Aktionen Aktuelle Spielhistorie (Kollisionen) Andere Spielobjekte: Spielraster mit Spielobjekten Kategorisierte Spielobjekte (NPCs, statische Objekte, Ressourcen, ) 13.04.2016 Fachbereich Informatik Knowledge Engineering Group Prof. J. Fürnkranz 8 8

VGDL and the GVGAI Framework Dem Agenten steht ein forward-model zur Verfügung: copy() advance(action) Simuliert das Ausführen einer Aktion (Liefert neuen Spielzustand) Dadurch lassen sich Auswirkungen und Effekte ermittlen Spiele sind im allgemeinen stochastisch Der Nachfolgezustand ist nur ein möglicher von mehreren möglichen Der Agent ist dafür verantwortlich diese Ungenauigkeit zu verarbeiten 13.04.2016 Fachbereich Informatik Knowledge Engineering Group Prof. J. Fürnkranz 9 9

GVGAI und VGDL 13.04.2016 Fachbereich Informatik Knowledge Engineering Group Prof. J. Fürnkranz 10 10

Beispiel (Pacman) 13.04.2016 Fachbereich Informatik Knowledge Engineering Group Prof. J. Fürnkranz 11 11

Beispiel (Plants) 13.04.2016 Fachbereich Informatik Knowledge Engineering Group Prof. J. Fürnkranz 12 12

Lösungsansätze I (Exhaustive Tree Search) Breath first search Depth first search Best first search [ ] 13.04.2016 Fachbereich Informatik Knowledge Engineering Group Prof. J. Fürnkranz 13

Lösungsansätze II (Stochastic Tree Search) Monte Carlo Tree Search 13.04.2016 Fachbereich Informatik Knowledge Engineering Group Prof. J. Fürnkranz 14

Lösungsansätze II (Stochastic Tree Search) Monte Carlo Tree Search 1. Selection: Von der Wurzel: wähle Nachfolgeknoten. Iteriere bis Blattknoten. 13.04.2016 Fachbereich Informatik Knowledge Engineering Group Prof. J. Fürnkranz 15

Lösungsansätze II (Stochastic Tree Search) 2. Expansion: Erstelle neuen Kindknoten. Monte Carlo Tree Search 13.04.2016 Fachbereich Informatik Knowledge Engineering Group Prof. J. Fürnkranz 16

Lösungsansätze II (Stochastic Tree Search) Monte Carlo Tree Search 3. Simulation: Simuliere Zustand in die Tiefe: führe mehrere zufällige Züge hintereinander aus und bewerte letzten Zustand. 13.04.2016 Fachbereich Informatik Knowledge Engineering Group Prof. J. Fürnkranz 17

Lösungsansätze II (Stochastic Tree Search) Monte Carlo Tree Search 4. Backpropagation: Bewerte alle Knoten auf dem Weg zur Wurzel entsprechend der Bewertung des simulierten Zustands 13.04.2016 Fachbereich Informatik Knowledge Engineering Group Prof. J. Fürnkranz 18

Lösungsansätze II (Stochastic Tree Search) Wiederhole, bis Zeit abgelaufen Monte Carlo Tree Search 13.04.2016 Fachbereich Informatik Knowledge Engineering Group Prof. J. Fürnkranz 19

Lösungsansätze III (Evolutionary Algorithms) Individuum: Eine Gewichtung der einzelnen Bestandteile der Fitness Function Fitness Function: Auswertung des Spielzustandes nach Ausführen der Aktionen Wenn die Zeit abgelaufen ist: Führe erste Aktion des besten Individuums aus 13.04.2016 Fachbereich Informatik Knowledge Engineering Group Prof. J. Fürnkranz 20

Spielabhängiges Wissen aneignen Spiele sind aus Regeln aufgebaut (siehe VGDL) Regeln können gelernt werden Klevere Heuristiken können erzeugt werden Lässt sich gut mit den genannten Lösungsansätzen kombinieren 13.04.2016 Fachbereich Informatik Knowledge Engineering Group Prof. J. Fürnkranz 21

Beispiel 13.04.2016 Fachbereich Informatik Knowledge Engineering Group Prof. J. Fürnkranz 22

GVGAI 2016 Competition Single Player Planning Track: Weiterführung des letztjährigen Wettbewerbs Viele Spiele: 80 öffentlich, 20 zur Validierung GECCO 2016 Denver, US (20 th 24 th July) CIG 2016 Santorini, Greece (20 th 23 rd September) Erwartete Abgabefrist: Anfang July Bewertungsschema des offiziellen Wettbewerbs: # Wins > avg(score) > avg(spielzüge) Formel 1 Rating (1. Platz -> 25, 2. Platz -> 18, 3. Platz -> 15, [..]) 13.04.2016 Fachbereich Informatik Knowledge Engineering Group Prof. J. Fürnkranz 23

Beispielagent (One Step Look Ahead) Das Framework stellt Beispielagenten zur Verfügung: Simple One Step Look Ahead: 13.04.2016 Fachbereich Informatik Knowledge Engineering Group Prof. J. Fürnkranz 24 24

Beispielagent (One Step Look Ahead) Simple One Step Look Ahead: 13.04.2016 Fachbereich Informatik Knowledge Engineering Group Prof. J. Fürnkranz 25 25

Beispielagent (One Step Look Ahead) Simple One Step Look Ahead: 13.04.2016 Fachbereich Informatik Knowledge Engineering Group Prof. J. Fürnkranz 26 26

Organisatorisches Gruppen bis zu 5 Personen Wöchentliches Treffen mit Besprechung des Fortschritts Mittwochs 15:20 (wie heute) Gruppen tragen Ergebnisse vor Pro Treffen trägt eine Gruppe die Fortschritte detaillierter vor Arbeitsbeginn: Jetzt! Meiste Arbeit fällt ab sofort an, nicht zum Ende des Semesters 13.04.2016 Fachbereich Informatik Knowledge Engineering Group Prof. J. Fürnkranz 27

Seid ihr interessiert? 13.04.2016 Fachbereich Informatik Knowledge Engineering Group Prof. J. Fürnkranz 28

Aufgaben für nächste Woche Teambildung Registrieren auf www.gvgai.net (1 Account pro Team!) Framework einrichten ( und zum laufen bringen) Auch ohne visuelles Feedback starten (headless) Einen Agenten hochladen und online auswerten lassen Die Google-Group abonnieren (siehe gvgai.net) Für Motivierte: Ein paar Spiele angucken (gvgai.net / youtube.com) Erste eigene Lösungsideen entwickeln 13.04.2016 Fachbereich Informatik Knowledge Engineering Group Prof. J. Fürnkranz 29