Einführung. Künstliche Intelligenz. Steuerungs- und Regelungstechnik. Psychologie. Reinforcement Learning (RL)

Größe: px
Ab Seite anzeigen:

Download "Einführung. Künstliche Intelligenz. Steuerungs- und Regelungstechnik. Psychologie. Reinforcement Learning (RL)"

Transkript

1 Einführung Künstliche Intelligenz Psychlgie Reinfrcement Learning (RL) Steuerungs- und Regelungstechnik Neurwissenschaft Künstliche Neurnale Netze W19, , J. Zhang

2 Was ist Reinfrcement Learning? Lernen aus Interaktin Ziel-rientiertes Lernen Lernen durch, vn, und während der Interaktin mit einer eternen Umgebung Lernen was zu tun ist wie man Situatinen auf Aktinen abbildet um ein numerisches Reward- Signal zu maimieren W19, , J. Zhang

3 Überwachtes Lernen Trainings Inf = gewünschte (Sll-) Ausgabe Eingaben Überwacht lernendes System Ausgaben Fehler = (Sll-Ausgabe Systemausgabe) W19, , J. Zhang

4 Reinfrcement Learning Trainings Inf = Bewertungen ( rewards / penalties ) Eingaben RL System Ausgaben ( Aktinen ) Ziel: erreiche sviel Reward wie möglich W19, , J. Zhang

5 Reinfrcement Learning Ziel: Möglichst erflgreich in der Umgebung agieren Entspricht Maimierung der Belhnungssequenz R t Agent s t r t a t Umgebung W19, , J. Zhang

6 Key Features vn RL Lerner bekmmt nicht gesagt welche Aktinen zu wählen sind Trial-and-Errr Suche Möglichkeit eines verspäteten ( delayed ) Reward Aufgeben vn kurzfristigem Ertrag um höheren langfristigen Ertrag zu erhalten Das Dilemma eplratin vs. eplitatin Betrachte das kmplette Prblem eines ziel-rientierten Agenten in Interaktin mit einer unsicheren Umgebung W19, , J. Zhang

7 Der vllständige Agent Zeitlich situiert Beständiges Lernen und Planen Beeinflusst die Umgebung Umgebung ist stchastisch und ungewiss Umgebung Zustand Aktin Reward Agent W19, , J. Zhang

8 Elemente des RL Plicy Reward Value Mdell der Umgebung Plicy: was ist zu tun Reward: was ist gut Value: was ist gut, da es Reward vrhersagt Mdell: was flgt auf was W19, , J. Zhang

9 Ein erweitertes Beispiel: Tic-Tac Tac-TeTe } s Zug } s Zug } s Zug } s Zug Setzt einen nicht perfekten Gegner vraus: er/sie macht manchmal Fehler } s Zug W19, , J. Zhang

10 Ein RL Ansatz für Tic-Tac Tac-TeTe 1. Erstelle eine Tabelle mit einem Eintrag pr Zustand: Zustand.5.5 V(s) geschätzte Wahrscheinlichkeit für den Gewinn 1 gewnnen 2. Jetzt spiele viele Spiele. Um einen Zug zu wählen, schaue einen Schritt nach vrne: Mmentaner Zustand verlren 0 unentschieden * Verschiedene mögliche nächste Zustände Nehme den nächsten Zustand mit der höchsten geschätzten Gewinnwahrscheinlichkeit das höchste V(s); ein greedy Zug. Aber in 10% aller Fälle wähle einen zufälligen Zug; ein eplrierender Zug. W19, , J. Zhang

11 RL-Lernregel Lernregel für Tic-Tac Tac-TeTe Zug des Gegners { Startpsitin a Unser Zug Zug des Gegners Unser Zug { { { e* c* c d e b Eplrierender Zug s Zustand vr dem greedy Zug s Zustand nach dem greedy Zug Wir inkrementieren jedes V(s) zu V( s ) ein backup : Zug des Gegners { f Unser Zug { g* g kleiner psitiver Wert, z.b. α = 0.1 der Schrittweitenparameter W19, , J. Zhang

12 Verbesserung des T.T.T Spielers Beachten vn Symmetrien Darstellung/Generalisierung Wie kann dies fehlschlagen? Braucht man Zufallszüge? Warum? Braucht man immer die 10%? Kann man vn Zufallszügen lernen? Kann man ffline lernen? Vr-Lernen durch Spielen gegen sich selbst? Verwendung vn gelernten Mdellen des Gegners?... W19, , J. Zhang

13 z.b. Generalisierung Tabelle Zustand V s s s Generalisierender Funktinsapprimatr Zustand V Trainiere hier s N W19, , J. Zhang

14 Warum ist Tic-Tac Tac-TeTe einfach? Endliche, kleine Anzahl an Zuständen Es ist immer möglich einen Schritt nach vrnezugucken(ne-step lk ahead) Zustände kmplett wahrnehmbar... W19, , J. Zhang

15 Einige namhafte RL Anwendungen TD-Gammn: Tesaur weltbestes Backgammn Prgramm Aufzugssteuerung: Crites & Bart High Perfrmance dwn-peak Aufzugscntrller Lagerverwaltung: Van Ry, Bertsekas, Lee & Tsitsiklis 10 15% Verbesserung gegenüber standard Industriemethden Dynamische Kanalzurdnung: Singh & Bertsekas, Nie & Haykin High Perfrmance Zurdnung vn Funkkanälen zu Mbiltelefnaten W19, , J. Zhang

16 TD-Gammn Tesaur, Value Aktinsauswahl durch 2 3 Lagensuche TD Fehler V t+1 V t Starte mit zufälligem Netzwerk Spiele sehr viele Spiele gegen dich selbst Lerne eine Wertefunktin anhand dieser simulierten Erfahrung Dies prduziert whl den besten Spieler der Welt W19, , J. Zhang

17 10 Stckwerke, 4 Kabinen Aufzugseinteilung Crites and Bart, 1996 Zustände: Knpfzustände; Psitinen, Richtungen, und Bewegungszustände der Kabinen; Persnen in Kabinen & in Etagen Aktinen: halte an, der fahre nach Y, nächste Etage Rewards: geschätzt, 1 pr Zeitschritt für jede wartende Persn 22 Vrsichtige Schätzung: ca. 10 Zustände W19, , J. Zhang

18 Perfrmance Vergleich Durchschn. Warteund 40 System-2zeiten 0 2 % Wartezeit >1 Minute 1 0 Durchschn. quadrierte Wartezeit Lastenverteiler Lastenverteiler Lastenverteiler W19, , J. Zhang

19 Trial-and-Errr learning Thrndike (Ψ) 1911 Minsky Klpf Bart et al. RL Geschichte Tempral-difference learning Secndary reinfrcement (Ψ) Samuel Hlland Witten Suttn ptimal cntrl, value functins Hamiltn (Physics) 1800s Shannn Bellman/Hward (R) Werbs Watkins W19, , J. Zhang

20 W19, , J. Zhang MENACE ( MENACE (Michie Michie 1961) 1961) Matchb Educable Nughts and Crsses Engine

Was ist Reinforcement Learning? Einführung. Überwachtes Lernen. Reinforcement Learning. Ziel: erreiche soviel Reward wie möglich

Was ist Reinforcement Learning? Einführung. Überwachtes Lernen. Reinforcement Learning. Ziel: erreiche soviel Reward wie möglich Fachbereich Infrmatik Fachbereich Infrmatik Psychlgie Einführung Künstliche Intelligenz Reinfrcement Learning (RL) Steuerungs- und Regelungstechnik Was ist Reinfrcement Learning? Lernen aus Interaktin

Mehr

Reinforcement Learning

Reinforcement Learning VL Algorithmisches Lernen, Teil 3d Jianwei Zhang, Dept. of Informatics Vogt-Kölln-Str. 30, D-22527 Hamburg zhang@informatik.uni-hamburg.de 08/07/2009 Zhang 1 Terminübersicht: Part 3 17/06/2009 Dimensionsproblem,

Mehr

12. Maschinelles Lernen

12. Maschinelles Lernen 12. Maschinelles Lernen Maschinelles Lernen dient der Herbeiführung vn Veränderungen im System, die adaptiv sind in dem Sinne, daß sie es dem System ermöglichen, dieselbe der eine ähnliche Aufgabe beim

Mehr

Algorithmen und Datenstrukturen

Algorithmen und Datenstrukturen Algrithmen und Datenstrukturen Prf. Dr. Ralf Möller Universität zu Lübeck Institut für Infrmatinssysteme Tanya Braun (Übungen) swie viele Tutren Suchgraphen für 2-Persnen-Nullsummenspiele Typen vn Spielen

Mehr

Reinforcement Learning

Reinforcement Learning Reinforcement Learning 1. Allgemein Reinforcement Learning 2. Neuronales Netz als Bewertungsfunktion 3. Neuronales Netz als Reinforcement Learning Nils-Olaf Bösch 1 Allgemein Reinforcement Learning Unterschied

Mehr

Reinforcement learning

Reinforcement learning Reinforcement learning Erfolgsgeschichten... Quelle: twitter.com/ai memes Q-Learning als Art von Reinforcement learning Paul Kahlmeyer February 5, 2019 1 Einführung 2 Q-Learning Begriffe Algorithmus 3

Mehr

Handreichung. Handreichung für Studierende zur Arbeit auf der Online- Plattform Moodle. Projekt OPEN OPen Education in Nursing

Handreichung. Handreichung für Studierende zur Arbeit auf der Online- Plattform Moodle. Projekt OPEN OPen Education in Nursing Handreichung Handreichung für Studierende zur Arbeit auf der Online- Plattfrm Mdle Prjekt OPEN OPen Educatin in Nursing Infrmatin Lehren und Lernen in Live-Vrlesungen sind die meisten gewhnt; die elektrnische

Mehr

Reinforcement Learning

Reinforcement Learning Universität Potsdam Institut für Informatik Lehrstuhl Maschinelles Lernen Reinforcement Learning Uwe Dick Inhalt Problemstellungen Beispiele Markov Decision Processes Planen vollständige MDPs Lernen unbekannte

Mehr

Fit4Wedding JETZT DURCHSTARTEN!

Fit4Wedding JETZT DURCHSTARTEN! Fit4Wedding JETZT DURCHSTARTEN! Machen ist wie wllen, NUR KRASSER! Herzlich willkmmen auf meiner Fitness-Seite. Ich bin Stephan. Leidenschaftlicher Fitnesstrainer, Ernährungsptimierer und Mtivatr. Wenn

Mehr

Combining Manual Feedback with Subsequent MDP Reward Signals for Reinforcement Learning W. Bradley Knox und Peter Stone

Combining Manual Feedback with Subsequent MDP Reward Signals for Reinforcement Learning W. Bradley Knox und Peter Stone Combining Manual Feedback with Subsequent MDP Reward Signals for Reinforcement Learning W. Bradley Knox und Peter Stone 14.12.2012 Informatik FB 20 Knowlegde Engineering Yasmin Krahofer 1 Inhalt Problemstellung

Mehr

Teil III: Wissensrepräsentation und Inferenz. Nachtrag zu Kap.5: Neuronale Netze. w i,neu = w i,alt + x i * (Output soll - Output ist ) Delta-Regel

Teil III: Wissensrepräsentation und Inferenz. Nachtrag zu Kap.5: Neuronale Netze. w i,neu = w i,alt + x i * (Output soll - Output ist ) Delta-Regel Einfaches Perzeptrn Delta-Regel Vrlesung Künstliche Intelligenz Wintersemester 2006/07 Teil III: Wissensrepräsentatin und Inferenz Nachtrag zu Kap.5: Neurnale Netze Beim Training werden die Beispiele dem

Mehr

EBOOK ZERTIFIZIERUNG

EBOOK ZERTIFIZIERUNG EBOOK ZERTIFIZIERUNG Ausführliche Beschreibung zur Zertifizierungsstufe Master Certified Cach Seien Sie dabei und setzen Sie Ihr persönliches Zeichen für Qualität und Prfessinalität im Caching! Stand Januar

Mehr

Sage Office Line und cobra: die ideale Kombination. Sage und cobra

Sage Office Line und cobra: die ideale Kombination. Sage und cobra Sage Office Line und cbra: die ideale Kmbinatin Sage und cbra 1 Die Kmbinatin und ihre Synergieeffekte Unternehmen brauchen eine ERP-Lösung zur Verwaltung und Abwicklung ihrer Geschäftsprzesse. cbra hingegen

Mehr

Reinforcement Learning

Reinforcement Learning Reinforcement Learning Viktor Seifert Seminar: Knowledge Engineering und Lernen in Spielen SS06 Prof. Johannes Fürnkranz Übersicht 1. Definition 2. Allgemeiner Lösungsansatz 3. Temporal Difference Learning

Mehr

Berater-Profil Thomas Biniasz *1964

Berater-Profil Thomas Biniasz *1964 Berater-Prfil Thmas Biniasz *1964 Landauer Strasse 2, 14197 Berlin 0172-30 666 85 thmas@biniasz-partner.de Diplm- Psychlge Klinischer Psychlge (BdP) Supervisr (BdP) Psychtherapeut (HPG) NLP Lehrtrainer

Mehr

Übersicht meiner Workshop-Angebote

Übersicht meiner Workshop-Angebote Übersicht meiner Wrkshp-Angebte 1. Grenzen erweitern & Mtivatin Teenpwer : In einem 3-tägigen Wrkshp legen Jugendliche den Grundstein für eine erflgreiche Berufsrientierung und entwickeln eine hhe Eigenmtivatin,

Mehr

Informationen zur Veranstaltung Erfolgreiche Kommunikation im Beruf und Alltag - mit Selbst- & Fremdcoaching zum Ziel -

Informationen zur Veranstaltung Erfolgreiche Kommunikation im Beruf und Alltag - mit Selbst- & Fremdcoaching zum Ziel - Infrmatinen zur Veranstaltung Erflgreiche Kmmunikatin im Beruf und Alltag - mit Selbst- & Fremdcaching zum Ziel - Beschreibung: Das Leben ist Kmmunikatin, denn hne Kmmunikatin ist kein Leben möglich. Kmmunikatin

Mehr

pepp Handout Schlüsselkompetenzen Rhetorik und Präsentation im IT-Projekt Personalpotenziale

pepp Handout Schlüsselkompetenzen Rhetorik und Präsentation im IT-Projekt Personalpotenziale Persnalptenziale Handut Schlüsselkmpetenzen Rhetrik und Präsentatin im IT-Prjekt Präsentatin ist eine spezielle Frm der Kmmunikatin. Dabei ist es vn besnderer Bedeutung sich präzise und zielgruppenrientiert

Mehr

Entwurf und simulative Bewertung eines Verfahrens zur dynamischen Steuerung des Overprovisioning durch Bandwidth Broker

Entwurf und simulative Bewertung eines Verfahrens zur dynamischen Steuerung des Overprovisioning durch Bandwidth Broker Einleitungsvrtrag zur Diplmarbeit Entwurf und simulative Bewertung eines Verfahrens zur dynamischen Steuerung des Overprvisining durch Bandwidth Brker Marcus Drews 13.07.2001 Gliederung 1. Einleitung /

Mehr

EBOOK ZERTIFIZIERUNG

EBOOK ZERTIFIZIERUNG EBOOK ZERTIFIZIERUNG Ausführliche Beschreibung zur Zertifizierungsstufe Assciate Certified Cach Seien Sie dabei und setzen Sie Ihr persönliches Zeichen für Qualität und Prfessinalität im Caching! Stand

Mehr

Preise für ein Engel-Reading

Preise für ein Engel-Reading Preise für ein Engel-Reading (Stand: 30. Nvember 2018) Es gibt 2 Wege ein Reading vn mir zu erhalten: a. Reading im persönlichen 1:1 Caching über eine verschlüsselte Videknferenz (der alternativ auch über

Mehr

RL und Funktionsapproximation

RL und Funktionsapproximation RL und Funktionsapproximation Bisher sind haben wir die Funktionen V oder Q als Tabellen gespeichert. Im Allgemeinen sind die Zustandsräume und die Zahl der möglichen Aktionen sehr groß. Deshalb besteht

Mehr

Algorithmische Grundlagen des Internets VIII

Algorithmische Grundlagen des Internets VIII Vrlesung Smmersemester 2003 Universität Paderbrn EIM Institut für Infrmatik Algrithmische Grundlagen des Internets VIII schindel@upb.de Universität Paderbrn Fakultät für Elektrtechnik, Infrmatik und Mathematik

Mehr

Workshop-Angebote für Schulen

Workshop-Angebote für Schulen Wrkshp-Angebte für Schulen Cnstantin Weimar Jugendcach 30167 Hannver Mbil: 0170 3085500 kntakt@cnstantinweimar.de www.cnstantinweimar.de 1. Persönlichkeitsentwicklung Teenpwer : In einem mehrtägigen Wrkshp

Mehr

Überblick. Mathematik und Spiel. Ohne Glück zum Sieg. Bedeutung der Strategie. Zwei Hauptaspekte

Überblick. Mathematik und Spiel. Ohne Glück zum Sieg. Bedeutung der Strategie. Zwei Hauptaspekte Überblick Ohne Glück zum Sieg R. Verfürth Fakultät für Mathematik Ruhr-Universität Bochum Bochum / 8. Oktober 2009 Kategorisierung Strategische Spiele Bewertung einer Stellung Aufwand Epilog Literatur

Mehr

Ausbildung zum diplomierten Resilienz Coach

Ausbildung zum diplomierten Resilienz Coach Ausbildung zum diplmierten Resilienz Cach Als Resilienz bezeichnet man die innere Stärke eines Menschen und seine Fähigkeit mit Knflikten, Misserflgen, Lebenskrisen, berufliche Fehlschlägen der traumatischen

Mehr

TD-Gammon. Michael Zilske

TD-Gammon. Michael Zilske TD-Gammon Michael Zilske zilske@inf.fu-berlin.de TD-Gammon Ein Backgammon-Spieler von Gerald Tesauro (Erste Version: 1991) TD-Gammon Ein Neuronales Netz, das immer wieder gegen sich selbst spielt und dadurch

Mehr

DYNAMISCHE IT-INFRASTRUKTUREN IM UTILITYUMFELD EFFEKTIV PLANEN UND UMSETZTEN

DYNAMISCHE IT-INFRASTRUKTUREN IM UTILITYUMFELD EFFEKTIV PLANEN UND UMSETZTEN Elektrnische Persnalakte aus der Clud DYNAMISCHE IT-INFRASTRUKTUREN IM UTILITYUMFELD EFFEKTIV PLANEN UND UMSETZTEN Wlfgang Will Leiter Shared Service Stadtwerke Cttbus GmbH Clud Cmputing Praktische Anwendungen

Mehr

Lebensmittelqualität und -sicherheit

Lebensmittelqualität und -sicherheit Variabilität der Zahl thermphiler Campylbacter auf Brilerschlachtkörpern Erwägungen für die Entwicklung vn mikrbilgischen Kriterien und Minimierungsmaßnahmen Reich, F. 1, Valer, A. 2, Schill, F. 1, Bungenstck,

Mehr

Reinforcement Learning

Reinforcement Learning Reinforcement Learning Ziel: Lernen von Bewertungsfunktionen durch Feedback (Reinforcement) der Umwelt (z.b. Spiel gewonnen/verloren). Anwendungen: Spiele: Tic-Tac-Toe: MENACE (Michie 1963) Backgammon:

Mehr

Temporal Difference Learning

Temporal Difference Learning Temporal Difference Learning Das Temporal Difference (TD) Lernen ist eine bedeutende Entwicklung im Reinforcement Lernen. Im TD Lernen werden Ideen der Monte Carlo (MC) und dynamische Programmierung (DP)

Mehr

3. Das Reinforcement Lernproblem

3. Das Reinforcement Lernproblem 3. Das Reinforcement Lernproblem 1. Agierender Agent in der Umgebung 2. Discounted Rewards 3. Markov Eigenschaft des Zustandssignals 4. Markov sche Entscheidung 5. Werte-Funktionen und Bellman sche Optimalität

Mehr

Rechtsanwälte Dr. Reip & Köhler. Rechtsanwälte für Recht der Erneuerbaren Energien Jena Hildburghausen

Rechtsanwälte Dr. Reip & Köhler. Rechtsanwälte für Recht der Erneuerbaren Energien Jena Hildburghausen Rechtsanwälte Dr. Reip & Köhler Rechtsanwälte für Recht der Erneuerbaren Energien Jena Hildburghausen 3. Nvember 2015 Phtvltaikanlagen auf kmmunalen Einrichtungen 8. Jahrestagung Kmmunaler Energie-Dialg

Mehr

FAMILIEN IM KONTEXT ARMUT. Lebensbedingungen und ihre Auswirkungen auf Familiendynamiken

FAMILIEN IM KONTEXT ARMUT. Lebensbedingungen und ihre Auswirkungen auf Familiendynamiken FAMILIEN IM KONTEXT ARMUT Lebensbedingungen und ihre Auswirkungen auf Familiendynamiken Vrbemerkung Zahlen und Definitinen zu Armut Systemische Betrachtung vn Armut Thesen zur Psych-Szialen Verarbeitungsdynamiken

Mehr

Karin und Karl Luger Coaching Lebensberatung Persönlichkeitstraining - Supervision. VHS Seminare Pregarten - Mauthausen

Karin und Karl Luger Coaching Lebensberatung Persönlichkeitstraining - Supervision. VHS Seminare Pregarten - Mauthausen 1 Aktuelle u. buchbare Seminare: VHS Seminare Pregarten - Mauthausen Frühjahr 2016 VHS Pregarten Kinder wir verstehen euch! - 6 KE Mitunter ist der Umgang mit sich und den anderen etwas kmpliziert. Warum

Mehr

Reinforcement-Learning

Reinforcement-Learning Reinforcement-Learning Vortrag von: Fabien Lapok Betreuer: Prof. Dr. Meisel 1 Agenda Motivation Überblick und Probleme von RL Aktuelle Forschung Mein Vorgehen Konferenzen und Quellen 2 Reinforcement Learning

Mehr

2. Aufbau von Trainingseinheiten

2. Aufbau von Trainingseinheiten 2. Aufbau vn Trainingseinheiten Der Schwerpunkt des Trainings sllte das einzelne Training wie ein rter Faden durchziehen. Dabei in etwa dem flgenden zeitlichen Grundaufbau (Ablauf) flgen: - ca. 10 (15)

Mehr

Bildungsinstitut für Pflegepädagogik und Soziales Management

Bildungsinstitut für Pflegepädagogik und Soziales Management Pädaggische Werkstatt Juliane alk Bildungsinstitut für Pflegepädaggik und Sziales Management Vermittlung einer pädaggischen Basiskmpetenz für Lehrende an Schulen des Gesundheits- und Szialwesens in fünf

Mehr

Sparpotential Gemeindeverwaltung

Sparpotential Gemeindeverwaltung Sparptential Gemeindeverwaltung Sparptential in den ö. Gemeindeverwaltungen Dr. Werner Lenzelbauer Land Oberösterreich Direktin Präsidium Abteilung Statistik Datum: 28.10.2014 - sfusin Die einer Gemeinde

Mehr

5.2 Übergewicht und Adipositas

5.2 Übergewicht und Adipositas 5.2 Übergewicht und Im Übungskatalg für adipöse und übergewichtige Kinder und Jugendliche finden sich 18 Übungsvrschläge, jeweils sechs zur - und schulung swie sechs Übungen für ein krankheitsadäquates.

Mehr

Wirksame Führung und situative Leadership heute

Wirksame Führung und situative Leadership heute Skript zum Thema Wirksame Führung und situative Leadership heute Einführung ins Thema Was ist Führung in Unternehmen und Organisatinen wie wir sie heute erleben? Unter dem Begriff Führung der dem englischen

Mehr

Auslandserfahrungsbericht. Auslandssemester an der Higher School of Economics, Moskau, Russland

Auslandserfahrungsbericht. Auslandssemester an der Higher School of Economics, Moskau, Russland Auslandserfahrungsbericht Auslandssemester an der Higher Schl f Ecnmics, Mskau, Russland Smmersemester 2005 (März Juli 2005) Vn Nicle Petrick Idee Die Idee ein Auslandssemester in Russland zu verbringen

Mehr

Rezeptions- und Wirkungsforschung Vorlesung im Modul 1002/103/107

Rezeptions- und Wirkungsforschung Vorlesung im Modul 1002/103/107 Rezeptins- und Wirkungsfrschung Vrlesung im Mdul 1002/103/107 Vrlesung 7: Das Prblem der Medienwirkungen: Wirkungen Begriff, Mdelle, Dimensinen 1 Prblemstellung Wrum es geht: Wie sll man an Medienwirkungen

Mehr

Schülerfragebogen. Diese Seite bitte nicht abtrennen! S 0.1 (S)

Schülerfragebogen. Diese Seite bitte nicht abtrennen! S 0.1 (S) S 0.1 (S) Diese Seite bitte abtrennen! Schülerfragebgen Liebe Schülerinnen und Schüler, die Qualitätsagentur am Staatsinstitut für Schulqualität und Bildungsfrschung hat den Auftrag, den Schulen dabei

Mehr

Entwicklung einer KI für Skat. Hauptseminar Erwin Lang

Entwicklung einer KI für Skat. Hauptseminar Erwin Lang Entwicklung einer KI für Skat Hauptseminar Erwin Lang Inhalt Skat Forschung Eigene Arbeit Risikoanalyse Skat Entwickelte sich Anfang des 19. Jahrhunderts Kartenspiel mit Blatt aus 32 Karten 3 Spieler Trick-taking

Mehr

Real-time reinforcement learning von Handlungsstrategien für humanoide Roboter

Real-time reinforcement learning von Handlungsstrategien für humanoide Roboter Real-time reinforcement learning von Handlungsstrategien für humanoide Roboter von Colin Christ 1 Aufgabenstellung Entwicklung einer Applikation zur Demonstration von RL für humanoide Roboter Demonstration:

Mehr

BESSER SPIELEN TECHNIK & TAKTIK

BESSER SPIELEN TECHNIK & TAKTIK BESSER SPIELEN TECHNIK & TAKTIK www.tennismagazin.de 7 26 Jahre DTB-Cheftrainer, Berater der ITF, Autr zahlreicher Tennistechnikbücher. Experte für Bimechanik, Technik und Taktik. schenbrn@tennismagazin.de

Mehr

Kriminalprognose. Prof. Dr. Wolfgang Retz Institut für Gerichtliche Psychologie und Psychiatrie Universität des Saarlandes Campus Homburg

Kriminalprognose. Prof. Dr. Wolfgang Retz Institut für Gerichtliche Psychologie und Psychiatrie Universität des Saarlandes Campus Homburg Kriminalprgnse Prf. Dr. Wlfgang Retz Institut für Gerichtliche Psychlgie und Psychiatrie Universität des Saarlandes Campus Hmburg 1 Lernziele Kriminalprgnstische Methden Empirisch gesicherte Risikfaktren

Mehr

Klausur: Einführung in die Statistik Sommersemester 2014

Klausur: Einführung in die Statistik Sommersemester 2014 Klausur: Einführung in die Statistik Smmersemester 2014 1. Für eine statistische Analyse wird eine Reihe vn Merkmalen erfasst- Ntieren Sie jeweils mit N, O, I bzw. R, b es sich um eine Nminal-, Ordinal-,

Mehr

Optimierendes Lernen (Reinforcement Learning) - Adaptive Verfahren für dynamische Optimierungsprobleme. VE 1: Einführung

Optimierendes Lernen (Reinforcement Learning) - Adaptive Verfahren für dynamische Optimierungsprobleme. VE 1: Einführung Optimierendes Lernen (Reinforcement Learning) - Adaptive Verfahren für dynamische Optimierungsprobleme VE 1: Einführung Prof. Dr. Martin Riedmiller Machine Learning Lab Albert-Ludwigs-Universitaet Freiburg

Mehr

Einführung in den Forschungsprozess und die Methoden der empirischen Kommunikations- und Medienforschung

Einführung in den Forschungsprozess und die Methoden der empirischen Kommunikations- und Medienforschung Einführung in den Frschungsprzess und die Methden der empirischen Kmmunikatins- und Medienfrschung Vrlesung 9: Methden II: Befragung 14.12.2015 Frschungsprzess und Methden 9 1 Gliederung Vrlesung 9 1.

Mehr

Monte Carlo Methoden

Monte Carlo Methoden Monte Carlo Methoden Lernverfahren zur Berechnung von Wertefunktionen und Policies werden vorgestellt. Vollständige Kenntnis der Dynamik wird nicht vorausgesetzt (im Gegensatz zu den Verfahren der DP).

Mehr

Personalentwicklung als strategisches Unternehmensziel Erfolgsfaktor für kleine und mittelständische Unternehmen

Personalentwicklung als strategisches Unternehmensziel Erfolgsfaktor für kleine und mittelständische Unternehmen Persnalentwicklung als strategisches Unternehmensziel Erflgsfaktr für kleine und mittelständische Unternehmen PTC Pasch Training & Caching Impulsveranstaltung der Qualifizierungsffensive Landkreis Gießen

Mehr

GTI ÜBUNG 10 FLIPFLOPS UND AUTOMATEN

GTI ÜBUNG 10 FLIPFLOPS UND AUTOMATEN GTI ÜBUNG FLIPFLOPS UND AUTOMATEN Aufgabe Flipflps 2 Beschreibung In dieser Aufgabe sllen die Eigenschaften ausgesuchter Flipflpschaltungen untersucht werden. Die Verzögerungszeit eines jeden Lgikgatters

Mehr

Einzel. Ranglistenturniere U19. Hinweise und Hilfen zur online-meldung für Ranglistenturnier U19. Schritt 1. Auf der Bezirksseite.

Einzel. Ranglistenturniere U19. Hinweise und Hilfen zur online-meldung für Ranglistenturnier U19. Schritt 1. Auf der Bezirksseite. Ranglistenturniere U19 Miles Eggers Hinweise und Hilfen zur nline-meldung für Ranglistenturnier U19 Einzel Schritt 1 Auf der Bezirksseite Auswahl Einzel Diese Maske erscheint. Schritt 2 Auswahl der Anzahl

Mehr

Prüfungsthemen zur Lehrveranstaltung Kommunikation

Prüfungsthemen zur Lehrveranstaltung Kommunikation Prf. Rlf Schwermer Prüfungsthemen zur Lehrveranstaltung Kmmunikatin Einige der flgenden Themen können Inhalte der Prüfung zur Lehrveranstaltung Kmmunikatin werden. Mündliche Kmmunikatin schriftliche Kmmunikatin

Mehr

AUFGABE 2: DIE BEGEGNUNG Schau dir den Anfang des Films ohne Ton an und bearbeite anschließend die Aufgaben.

AUFGABE 2: DIE BEGEGNUNG Schau dir den Anfang des Films ohne Ton an und bearbeite anschließend die Aufgaben. Film Stufe Drei vn Nathan Nill Seite 1 vn 8 Materialien für den Unterricht zum Kurzfilm Stufe Drei vn Nathan Nill Deutschland 2012, 26 Minuten, Spielfilm AUFGABE 1: DER FILMTITEL Der Film heißt Stufe Drei.

Mehr

Komplementär kommunizieren in Coaching, Beratung und Training I

Komplementär kommunizieren in Coaching, Beratung und Training I Kmplementär kmmunizieren in Caching, Beratung und Training I Zertifizierte NLP-Practitiner-Ausbildung mit Heidrun Strikker, DVNLP-Lehrtrainerin September 2013 - Juni 2014 Heidrun Strikker SHS CONSULT GmbH

Mehr

Jugendberufsagenturen Herausforderungen und Chancen in der Zusammenarbeit verschiedener Institutionen

Jugendberufsagenturen Herausforderungen und Chancen in der Zusammenarbeit verschiedener Institutionen Jugendberufsagenturen Herausfrderungen und Chancen in der Zusammenarbeit verschiedener Institutinen Prf. Dr. Peter Fischer Ausbildungsknferenz 2017, Regensburg, 27.11.17 Prf. Dr. Peter Fischer Lehrstuhl

Mehr

Reinforcement Learning. Volker Tresp

Reinforcement Learning. Volker Tresp Reinforcement Learning Volker Tresp 1 Überwachtes und unüberwachtes Lernen Überwachtes Lernen: Zielgrößen sind im Trainingsdatensatz bekannt; Ziel ist die Verallgemeinerung auf neue Daten Unüberwachtes

Mehr

Spiral Dynamics integral - level 2 Ein durch Dr. Don Beck zertifiziertes Training

Spiral Dynamics integral - level 2 Ein durch Dr. Don Beck zertifiziertes Training Spiral Dynamics integral - level 2 Ein durch Dr. Dn Beck zertifiziertes Training Für wem? Dieses Training ist bestimmt für diejenigen welche sich mit der Anwendung vn Spiral Dynamics beschäftigen und sich

Mehr

Einsatz von Reinforcement Learning in der Modellfahrzeugnavigation

Einsatz von Reinforcement Learning in der Modellfahrzeugnavigation Einsatz von Reinforcement Learning in der Modellfahrzeugnavigation von Manuel Trittel Informatik HAW Hamburg Vortrag im Rahmen der Veranstaltung AW1 im Masterstudiengang, 02.12.2008 der Anwendung Themeneinordnung

Mehr

P r e s s e i n f o r m a t i o n Wien, 23. Oktober 2013

P r e s s e i n f o r m a t i o n Wien, 23. Oktober 2013 P r e s s e i n f r m a t i n Wien, 23. Oktber 2013 Weltspartag 2013 individuelle Veranlagungslösungen stehen im Mittelpunkt Die BAWAG P.S.K. zeigt, wie man in bewegten Anlagezeiten sinnvll sparen, veranlagen

Mehr

Referat Wettkampfsport O19 Ranglistenturniere O19

Referat Wettkampfsport O19 Ranglistenturniere O19 Referat Wettkampfsprt O19 Ranglistenturniere O19 Miles Eggers Stand 25.08.2017 Hinweise und Hilfen zur nline-meldung O19 Schritt 1 Aufruf der BLV-Seite http://blv-nrw.de/nmel/rlt19/anmeldung Hier werden

Mehr

Seminar Künstliche Intelligenz WS 2013/14 Grundlagen des Maschinellen Lernens

Seminar Künstliche Intelligenz WS 2013/14 Grundlagen des Maschinellen Lernens Seminar Künstliche Intelligenz WS 2013/14 Grundlagen des Maschinellen Lernens Martin Hacker Richard Schaller Künstliche Intelligenz Department Informatik FAU Erlangen-Nürnberg 19.12.2013 Allgemeine Problemstellung

Mehr

AirLino Konfiguration unter Android

AirLino Konfiguration unter Android AirLin Knfiguratin unter Andrid Direct-Play unter Andrid hne zusätzliche App. Schließen Sie den AirLin an das mitgelieferte Netzteil an und warten Sie bis die LED dauerhaft rt leuchtet. Gehen Sie bei Ihrem

Mehr

Der Stabilitäts- und Wachstumspakt und seine Zukunft (18.4.)

Der Stabilitäts- und Wachstumspakt und seine Zukunft (18.4.) Der Stabilitäts- und Wachstumspakt und seine Zukunft (..) Text: Eichengreen, B. (): Institutins fr Fiscal Stability, CESif Ecnmic Studies, Vl. 5, /, pp. -5 Fragen:. Fassen Sie kurz zusammen, was Eichengreen

Mehr

Psychisch gesund am Arbeitsplatz

Psychisch gesund am Arbeitsplatz Psychisch gesund am Arbeitsplatz Dr. Sandra Kaltner Diplm-Psychlgin Über mich Akademischer Werdegang 10/2011-10/2015 Prmtin 10/2006-08/2011 Studium der Psychlgie Prjektarbeit 10/2011-dat Inhalte: Tätigkeit

Mehr

Reinforcement Learning

Reinforcement Learning Universität Potsdam Institut für Informatik Lehrstuhl Maschinelles Lernen Reinforcement Learning Uwe Dick Inhalt Problemstellungen Beispiele Markov Decision Processes Planen vollständige MDPs Lernen unbekannte

Mehr

Der peds-braintrainer 5 ist komplett entwickelt im WWW-Standard HTML5.

Der peds-braintrainer 5 ist komplett entwickelt im WWW-Standard HTML5. The peds-braintrainer 5 Dipl.Math. Friedrich Haugg peds GbR Marienstrasse 20 D 82327 Tutzing peds@peds.de www.peds.de Vrab ein technischer Hinweis: Der peds-braintrainer 5 ist kmplett entwickelt im WWW-Standard

Mehr

Übersicht. Künstliche Intelligenz: 21. Verstärkungslernen Frank Puppe 1

Übersicht. Künstliche Intelligenz: 21. Verstärkungslernen Frank Puppe 1 Übersicht I Künstliche Intelligenz II Problemlösen III Wissen und Schlussfolgern IV Logisch Handeln V Unsicheres Wissen und Schließen VI Lernen 18. Lernen aus Beobachtungen 19. Wissen beim Lernen 20. Statistische

Mehr

Kniffel-Agenten. Von Alexander Holtkamp

Kniffel-Agenten. Von Alexander Holtkamp Kniffel-Agenten Von Alexander Holtkamp Übersicht Grundregeln Vorteil der Monte Carlo -Methode Gliederung des Projekts Aufbau State - Action Kodierung von State - Action Optimierung Aussicht Grundregeln

Mehr

- die Aktionen anderer Agenten beeinflussen den payoff für einen Agenten. Payoffs sind. - strategische Inferenz: ein rationaler Agent berücksichtigt

- die Aktionen anderer Agenten beeinflussen den payoff für einen Agenten. Payoffs sind. - strategische Inferenz: ein rationaler Agent berücksichtigt Semantik-Kllquium, Institut für Linguistik, Universität Leipzig 26.01.2006 1 Einführung Spieltherie Sprachliche Kmmunikatin als Spiel. Einführung in die spieltheretische Pragmatik Matthias Irmer - In einem

Mehr

Ausschreiben MTB Lehrgänge 2017 im Radsportbezirk RNO

Ausschreiben MTB Lehrgänge 2017 im Radsportbezirk RNO Ausschreiben MTB Lehrgänge 2017 im Radsprtbezirk RNO "... gefördert vn der Badischen Radsprtjugend" Für das kmmende Jahr 2017 Veranstaltet der Radsprtbezirk Rhein-Neckar-Odenwald in Kperatin mit den Vereinen

Mehr

EBOOK ZERTIFIZIERUNG

EBOOK ZERTIFIZIERUNG EBOOK ZERTIFIZIERUNG Ausführliche Beschreibung zur Zertifizierungsstufe Prfessinal Certified Cach Seien Sie dabei und setzen Sie Ihr persönliches Zeichen für Qualität und Prfessinalität im Caching! Stand

Mehr

Einführung in den Forschungsprozess und die Methoden der empirischen Kommunikations- und Medienforschung

Einführung in den Forschungsprozess und die Methoden der empirischen Kommunikations- und Medienforschung Einführung in den Frschungsprzess und die Methden der empirischen Kmmunikatins- und Medienfrschung Vrlesung 7: Lgik der Beweisführung: Mdell Experiment 30.11.2012 Frschungsprzess und Methden 7 1 Gliederung

Mehr

EBOOK ZERTIFIZIERUNG

EBOOK ZERTIFIZIERUNG EBOOK ZERTIFIZIERUNG Ausführliche Beschreibung zur Zertifizierungsstufe Prfessinal Certified Cach Seien Sie dabei und setzen Sie Ihr persönliches Zeichen für Qualität und Prfessinalität im Caching! Stand

Mehr

Rezeptions- und Wirkungsforschung Vorlesung im Modul 1002/103/107

Rezeptions- und Wirkungsforschung Vorlesung im Modul 1002/103/107 Rezeptins- und Wirkungsfrschung Vrlesung im Mdul 1002/103/107 Vrlesung 8: Lernen aus den Medien I: Medien und Einstellungsänderung 06.12.2013 Prf. Dr. Hans-Jörg Stiehler (stiehler@uni-leipzig.de) 1 Prblemstellung

Mehr

s zähmen leicht gemacht! Übersicht behalten nichts Wichtiges verpassen weniger Ärger!

s zähmen leicht gemacht! Übersicht behalten nichts Wichtiges verpassen weniger Ärger! Emails zähmen leicht gemacht! Übersicht behalten nichts Wichtiges verpassen weniger Ärger! Mnika Himpelmann Intr Hier finden Sie eine Strategie mit der Flut vn emails umzugehen. Sie funktiniert schn seit

Mehr

Abgeordnete Digital. Politische Kommunikation im Zeichen des Netzes. Entwicklungen und Perspektiven POLITIKA BERLIN

Abgeordnete Digital. Politische Kommunikation im Zeichen des Netzes. Entwicklungen und Perspektiven POLITIKA BERLIN POLITIKA BERLIN FAIRNESS TRANSPARENZ QUALITÄT Abgerdnete Digital Plitische Kmmunikatin im Zeichen des Netzes Entwicklungen und Perspektiven Ein Prjekt vn Plitika Berlin e.v. www.plitika-berlin.de Leitung:

Mehr

2. Schularbeit aus. Mathematik und Angewandte Mathematik

2. Schularbeit aus. Mathematik und Angewandte Mathematik . Schularbeit aus Mathematik und Angewandte Mathematik Freitag,. April 06 5. Jahrgänge NAME: Punkte:. vn 40 Nte:.. Ntenschlüssel Sehr Gut Gut Befriedigend Genügend Nicht Genügend 40 5 0 5 9 6 6 0 0 Löse

Mehr

ONLINE - GRAMMATIK. Modalverben. Modalverben treten in einem Satz meistens mit einem zweiten Verb, dem "Vollverb", auf. Das Vollverb steht im

ONLINE - GRAMMATIK. Modalverben. Modalverben treten in einem Satz meistens mit einem zweiten Verb, dem Vollverb, auf. Das Vollverb steht im Mdalverben 1) Was man über Mdalverben wissen sllte. Mdalverben treten in einem Satz meistens mit einem zweiten Verb, dem "Vllverb", auf. Das Vllverb steht im Infinitiv am Satzende. Das Mdalverb wird knjugiert

Mehr

Mediation bei internationalen Kindschaftskonflikten

Mediation bei internationalen Kindschaftskonflikten Internatinales Mediatinszentrum für Familienknflikte und Kindesentführung Mediatin bei internatinalen Kindschaftsknflikten Evaluatinsbgen für Eltern Sehr geehrte Damen und Herren, vr einiger Zeit haben

Mehr

Erstellung einer Demoanwendung mit Simulator

Erstellung einer Demoanwendung mit Simulator Erstellung einer Demanwendung mit Simulatr Vertiefungsarbeit 5. Semester Patrick Schachner, WWI 01 B Gliederung Pwersim Live Dem Pwersim Live Dem 16.07.2004 Erstellung einer Demanwendung mit Simulatr Flie

Mehr

Heinke Deloch & Hejo Feuerstein

Heinke Deloch & Hejo Feuerstein Heinke Delch & Hej Feuerstein Experiential Cncept Caching Präsentiert auf der 22. Internatinalen Fcusing-Knferenz, Pfrzheim www.experientielle-beratung.de www.fcusing.de C (2010) Delch & Feuerstein Experiential

Mehr

UMSETZUNGSHILFE Exta Einladung zur Durchführung eines betrieblichen Eingliederungsmanagement nach 84 Abs. 2 SGB IX

UMSETZUNGSHILFE Exta Einladung zur Durchführung eines betrieblichen Eingliederungsmanagement nach 84 Abs. 2 SGB IX UMSETZUNGSHILFE Exta Einladung zur Durchführung eines betrieblichen Eingliederungsmanagement nach 84 Abs. 2 SGB IX Mai 2015 & Thmas Hchgeschurtz 1. Anschreiben an Mitarbeiter zur Verfahrenseinleitung Einladung

Mehr

- Drehscheiben der MINT-Botschafter-Initiative -

- Drehscheiben der MINT-Botschafter-Initiative - MINT-Partner und HUBs - Drehscheiben der MINT-Btschafter-Initiative - Einleitung...2 MINT- Partner...2 Das MINT- Prtal und die MINT- Btschafter- Plattfrm...3 Die Btschafter- Cmmunity...4 MINT- Btschafter...4

Mehr

Ihre Antrittsrede als neue Führungskraft:

Ihre Antrittsrede als neue Führungskraft: Führung und Management Gratis Bklet: Tipps sfrt umsetzbar Ihre Antrittsrede als neue Führungskraft: Weshalb sllten Sie eine Rede halten? Was ist wichtig? Was sllten Sie vermeiden? - Praktische Tipps und

Mehr

Die folgende Grafik zeigt eine Übergangsmatrix mit zugehörigem Graph: Geben Sie analog zu den folgenden Graphen jeweils eine Transitionsmatrix an.

Die folgende Grafik zeigt eine Übergangsmatrix mit zugehörigem Graph: Geben Sie analog zu den folgenden Graphen jeweils eine Transitionsmatrix an. Stephan Peter Wirtschaftsingenieurwesen SS 2017 Mathematik II Serie 2 Matrizen II Aufgabe 1 Die flgende Grafik zeigt eine Übergangsmatrix mit zugehörigem Graph: a) Geben Sie analg zu den flgenden Graphen

Mehr

Rezeptions- und Wirkungsforschung Vorlesung im Modul 1002/103/107

Rezeptions- und Wirkungsforschung Vorlesung im Modul 1002/103/107 Rezeptins- und Wirkungsfrschung Vrlesung im Mdul 1002/103/107 Vrlesung 3: Mediennutzung: Kntakt, Rezeptin, Aneignung 01.11.2013 Prf. Dr. Hans-Jörg Stiehler 1 Prblemstellung Wrum es geht: Wie ist Medienkmmunikatin

Mehr

Einführung in den Forschungsprozess und die Methoden der empirischen Kommunikations- und Medienforschung

Einführung in den Forschungsprozess und die Methoden der empirischen Kommunikations- und Medienforschung Einführung in den Frschungsprzess und die Methden der empirischen Kmmunikatins- und Medienfrschung Vrlesung 7: Lgik der Beweisführung: Mdell Experiment 16.12.2016 Frschungsprzess und Methden 7 1 Gliederung

Mehr

Beispiel 1: Bestimme zu den gegebenen reellen Funktionen jeweils den. f 2 : x x f 3 : x ln x f4

Beispiel 1: Bestimme zu den gegebenen reellen Funktionen jeweils den. f 2 : x x f 3 : x ln x f4 Übungen für die. Schularbeit Übungsblatt Beispiel : Bestimme zu den gegebenen reellen jeweils den größtmöglichen Definitinsbereich. Definitinsbereich a) b) c) d) f : f : f 3 : ln f4 : Beispiel : Gegeben:

Mehr

(&) documenta-stadt Vorlage Nr. 101.16.1856 Kassel, 13.09.2010

(&) documenta-stadt Vorlage Nr. 101.16.1856 Kassel, 13.09.2010 Magistrat -II-/-20- (&) dcumenta-stadt Vrlage Nr. 101.16.1856 Kassel, 13.09.2010 Städtische Werke AG (STW) Gründung der Stadtwerke Unin Nrdhessen (SUN) Berichterstatter/-in: Stadtkämmerer Dr. Barthel Antrag

Mehr

Ausbildung zur/zum Großgruppen-ModeratorIn

Ausbildung zur/zum Großgruppen-ModeratorIn Ausbildung zur/zum Grßgruppen-MderatrIn Lernen und Erleben Sie die hhe Kunst der Mderatin grßer Gruppen! Ihre Herausfrderung / Ihr Nutzen Sie wllen weg vn unprduktiven Wrkshps hin zu Events, die das kreative

Mehr

Grundlagen der KI 13. Maschinelles Lernen

Grundlagen der KI 13. Maschinelles Lernen Grundlagen der KI 13. Maschinelles Lernen Lernen durch Bebachtung Michael Beetz Viele Abbildungen sind dem Buch Artificial Intelligence: A Mdern Apprach entnmmen. Viele Flien beruhen auf Vrlagen vn Prf.

Mehr

LADIES FIRST Wie werde ich eine FIRST LADY?

LADIES FIRST Wie werde ich eine FIRST LADY? LADIES FIRST Wie werde ich eine FIRST LADY? Weibliche Führungskmpetenzen spielerisch entwickeln Aus der Reihe: Business meets Impr Nicle Erichsen & Katrin Wulf September 2013 WIO-Strategie & Impr Theater

Mehr

Anleitung zum Anlegen eines digitalen Entwicklungsplans. Sehr geehrte Damen und Herren,

Anleitung zum Anlegen eines digitalen Entwicklungsplans. Sehr geehrte Damen und Herren, Anleitung zum Anlegen eines digitalen Entwicklungsplans Sehr geehrte Damen und Herren, Sie haben bereits die wichtigsten Przessschritte im INQA-Audit-Einstiegsprzess bewältigt. Nun geht es darum, die Ergebnisse

Mehr