Konzepte der AI Maschinelles Lernen http://www.dbai.tuwien.ac.at/education/aikonzepte/ Wolfgang Slany Institut für Informationssysteme, Technische Universität Wien mailto: wsi@dbai.tuwien.ac.at, http://www.dbai.tuwien.ac.at/staff/slany/
Konzepte der AI: Maschinelles Lernen (Wolfgang Slany) 2 Übersicht Was ist Lernen? Wozu maschinelles Lernen? Welche Arten maschinellen Lernen gibt es? Ein Beispiel Literatur und Links
Konzepte der AI: Maschinelles Lernen (Wolfgang Slany) 3 Was ist Lernen? Sinnvolle Änderungen im Gehirn Meist aufgrund erlebter Erfahrungen Meist kann dadurch etwas besser gemacht werden Verknüpfen mit bestehendem Wissen
Konzepte der AI: Maschinelles Lernen (Wolfgang Slany) 4 Wozu maschinelles Lernen? Fortschritte in Algorithmen und Theorie Datenflut (Internet,... ) Rechenleistung mittlerweile vorhanden Bedarf an autonomer maschineller Intelligenz Manche Probleme lassen sich anders nicht lösen
Konzepte der AI: Maschinelles Lernen (Wolfgang Slany) 5 Drei beispielhafte Nischen für maschinelles Lernen: Datamining: historische Daten zur Verbesserung von Entscheidungen: Krankengeschichten medizinisches Wissen Anwendungen, die nicht von Hand programmierbar sind: Fahrerloses Auto Spracherkennung Selbst-konfigurierende Anwendungen: Aufzüge in Hochhäusern Kühlschränke in Kaufhäusern
Konzepte der AI: Maschinelles Lernen (Wolfgang Slany) 6 Welche Arten maschinellen Lernen gibt es? Neurale Netzwerke (cf. Gehirn) Genetische Algorithmen (cf. Evolution) Induktive Logische Programmierung (Verallgemeinern) Abduktion auf logischen Wissensbasen (Theorien erfinden) Decision tree learning (Bsp: Tiere Raten) Computationales/Statistisches Lernen (PAC-Learning, Vapnik-Chervonenkis-Dimension) Probabilistic reinforcement learning (Bsp: Ramsey Spiel)...
Konzepte der AI: Maschinelles Lernen (Wolfgang Slany) 7 Deduktion: Poldi hat von dem Waschmittel getrunken. (Fall) Das Waschmittel ist giftig. (Regel) Daher hat Poldi starke Bauchschmerzen. (Resultat) Induktion: Durch Austausch des Resultats mit der Regel in obiger Deduktion erhält man einen (deduktiv falschen) Syllogismus, der als induktive Verallgemeinerung betrachtet werden kann: Poldi hat von dem Waschmittel getrunken. (Fall) Poldi hat starke Bauchschmerzen. (Resultat) Daher ist das Waschmittel giftig. (Regel)
Konzepte der AI: Maschinelles Lernen (Wolfgang Slany) 8 Abduktion: Alternativ entsteht durch Austausch des Resultats mit dem Fall ein (ebenfalls deduktiv falscher) Syllogismus, der als abduktive Erklärung betrachtet werden kann: Poldi hat starke Bauchschmerzen. (Resultat) Das Waschmittel ist giftig. (Regel) Daher hat Poldi von dem Waschmittel getrunken. (Fall) Meistens wird Abduktion in folgender Situation angewandt: Ein überraschendes Resultat, B, wurde beobachtet; Aber wenn A wahr wäre, dann würde B sofort daraus folgen. Also hat man guten Grund anzunehmen, daß A wahr ist.
Konzepte der AI: Maschinelles Lernen (Wolfgang Slany) 9 Computational learning theory: PAC-learning: Jede eigentlich falsche Hypothese sollte mit hoher Wahrscheinlichkeit anhand einer kleinen Menge von Beobachtungen als solche erkennbar sein. Daher sollte jede Hypothese, die mit ausreichend vielen Beobachtungen im Einklang steht, wahrscheinlich ungefähr korrekt, also probably approximately correct sein. Wichtige Voraussetzung: Training und Test-Daten müssen gleiche Wahrscheinlichkeitsverteilung haben! Theorie Vapnik-Chervonenkis-Dimension: Maß für die Ausdruckskraft des Hypothesenraums, d.h. wie viele unterschiedliche Fälle maximal unterschieden werden können. Bsp: (Baum 1994)... multilayer [neural] nets have a VC dimension roughly equal to their total number of [adjustable] weights.
Konzepte der AI: Maschinelles Lernen (Wolfgang Slany) 10 Beispiel: Probabilistic reinforcement learning in Sim A : red: green: uncolored:
Konzepte der AI: Maschinelles Lernen (Wolfgang Slany) 11 Eine interaktive Session mit einem System sagt oft mehr als tausend Bilder:
Konzepte der AI: Maschinelles Lernen (Wolfgang Slany) 12... mit zufälligen Permutationen zwischen den Zügen: Dieses Java Applet spielt Sim und eine Variante, Sim + (mehrere Kanten können pro Zug gefärbt werden). Wer gewinnt kann sich in in der Hall-of-fame verewigen!
Konzepte der AI: Maschinelles Lernen (Wolfgang Slany) 13 Sim und Sim + können nie unentschieden enden: Ramsey(3,3)=6 p (Visueller Beweis nach Ranan Banerji)
Konzepte der AI: Maschinelles Lernen (Wolfgang Slany) 14 Definition 1 (J. Schaeffer & Lake 1996) Ein kombinatorisches Spiel ist... ultra-schwach gelöst wenn der spieltheoretische Wert der Anfangsstellung bekannt ist, schwach gelöst wenn es ultra-schwach gelöst ist und eine Strategie existiert, die es erlaubt, diesen spieltheoretischen Wert unter Einsatz mäßiger Ressourcen tatsächlich zu realisieren, stark gelöst wenn der spieltheoretische Wert aller möglichen Spielstellungen unter Einsatz mäßiger Ressourcen berechnet werden kann, und ultra-stark gelöst wenn das Spiel stark gelöst ist und in allen nicht-gewinnenden Spielstellungen eine Strategie vorhanden ist, die es erlaubt, ein besseres Resultat als den spieltheoretischen Wert gegen einen suboptimalen Gegner zu erzielen.
Konzepte der AI: Maschinelles Lernen (Wolfgang Slany) 15 Theor. Größe von Sims Spielbaum:!. Im Fall von Sim + :!. Tatsächliche Größe ihrer directed acyclic game graphs: Sim: 2,309 nicht-isomorphe Stellungen Sim + : 13,158 nicht-isomorphe Stellungen Starke Lösungen von Sim und Sim+ sind machbar. Um Sim auch ultra-stark zu lösen: maximieren wir die statische Wahrscheinlichkeit des Gegners, einen Fehler zu machen diese Strategie wird durch ein probabilistic reinforcement learning durch positive und negative Spielresultate am Internet ergänzt Sim und Sim + sind ultra-stark gelöst.
Konzepte der AI: Maschinelles Lernen (Wolfgang Slany) 16 Definition 2 Sim n : es wird auf dem vollständigen Graphen mit Ramsey n n Knoten gespielt, wobei ein einfärbiger vollständiger Graph mit n Knoten vermieden werden soll; z.b. ist Sim 3 Sim. Problem: Trotz größter Anstrengungen ist nur noch Ramsey(4,4) 18 bekannt (Vermutung (McKay 1998) Ramsey(5,5)? 43 basierend auf 10 cpu-jahren von Berechnungen... ). Das Spiel Sim 4 wird! auf dem vollständigen Graphen mit 18 18 Knoten und 2" 153 Kanten gespielt, wobei man kein einfärbiges Tetrahedron bauen darf. Leider wurde berechnet, dass die Anzahl der nicht-isomorphen Spielstellungen in Sim 4 größer als #%$ ist.
Konzepte der AI: Maschinelles Lernen (Wolfgang Slany) 17 Es besteht daher wenig Hoffnung, Sim n oder Sim + n ab n & 3 auch nur ultra-schwach zu lösen. Lernende Heuristiken sollten aber möglich sein. Sim und Sim + : einfach genug für eine vollständige Analyse, aber weit entfernt davon, trivial zu sein. Kommerzielle Anwendungen: Sim und Sim + sollen in ein Rollenspiel integriert werden, um cheats zu erschweren. Bitte probiert unser Applet auf http://www.dbai.tuwien.ac.at/proj/ramsey/ damit es noch besser werden kann!
Konzepte der AI: Maschinelles Lernen (Wolfgang Slany) 18 Allgemeine Literatur zu maschinellem Lernen: Mitchell, Machine Learning, McGraw-Hill, 1997, http://www.cs.cmu.edu/ tom/mlbook.html Nilsson, Introduction to Machine Learning, online book draft 1996, http://robotics.stanford.edu/people/nilsson/mlbook.html Russell & Norvig, AI A Modern Approach, Prentice Hall 1995 (Part VI Learning ). Machine Learning Online Resources http://www.aic.nrl.navy.mil/ aha/research/machine-learning.html