Intelligente Agenten



Ähnliche Dokumente
Grundlagen der Künstlichen Intelligenz

Meilenstein 3 - Abschlusspräsentation

Kapitel 7 und Kapitel 8: Gleichgewichte in gemischten Strategien. Einleitung. Übersicht Teil 2 2. Übersicht 3

Grundlagen der Künstlichen Intelligenz

Künstliche Intelligenz

Rente = laufende Zahlungen, die in regelmäßigen Zeitabschnitten (periodisch) wiederkehren Rentenperiode = Zeitabstand zwischen zwei Rentenzahlungen

How to do? Projekte - Zeiterfassung

Kapitalerhöhung - Verbuchung

Dokumentation für das Spiel Pong

Würfelt man dabei je genau 10 - mal eine 1, 2, 3, 4, 5 und 6, so beträgt die Anzahl. der verschiedenen Reihenfolgen, in denen man dies tun kann, 60!.

Mechanismus Design Auktionen

Melanie Kaspar, Prof. Dr. B. Grabowski 1

OECD Programme for International Student Assessment PISA Lösungen der Beispielaufgaben aus dem Mathematiktest. Deutschland

Klausur zur Vorlesung Stochastische Modelle in Produktion und Logistik im SS 09

Das große ElterngeldPlus 1x1. Alles über das ElterngeldPlus. Wer kann ElterngeldPlus beantragen? ElterngeldPlus verstehen ein paar einleitende Fakten

Rente = laufende Zahlungen, die in regelmäßigen Zeitabschnitten (periodisch) wiederkehren Rentenperiode = Zeitabstand zwischen zwei Rentenzahlungen

Reinforcement Learning

Info-Veranstaltung zur Erstellung von Zertifikaten

Professionelle Seminare im Bereich MS-Office

Step by Step Webserver unter Windows Server von Christian Bartl

AGROPLUS Buchhaltung. Daten-Server und Sicherheitskopie. Version vom b

i x k k=1 i u i x i v i 1 0, ,08 2 0, ,18 3 0, ,36 4 0, ,60 5 1, ,00 2,22 G = n 2 n i=1

Anleitung zum erstellen einer PDF-Datei aus Microsoft Word

Statuten in leichter Sprache

1. Software installieren 2. Software starten. Hilfe zum Arbeiten mit der DÖHNERT FOTOBUCH Software

ACDSee Pro 2. ACDSee Pro 2 Tutorials: Übertragung von Fotos (+ Datenbank) auf einen anderen Computer. Über Metadaten und die Datenbank

GeoPilot (Android) die App

Einleitende Bemerkungen

Suche in Spielbäumen Spielbäume Minimax Algorithmus Alpha-Beta Suche. Suche in Spielbäumen. KI SS2011: Suche in Spielbäumen 1/20

Was ist Sozial-Raum-Orientierung?

Anleitung für die Teilnahme an den Platzvergaben "Studio II, Studio IV und Studio VI" im Studiengang Bachelor Architektur SS15

KI im Weltall: Der Remote Agent

Arbeit zur Lebens-Geschichte mit Menschen mit Behinderung Ein Papier des Bundesverbands evangelische Behindertenhilfe e.v.

R. Brinkmann Seite Schriftliche Übung Mathematik Stochastik II (Nachschreiber) Jan. 2007

Grundlagen des Maschinellen Lernens Kap. 4: Lernmodelle Teil II

Microsoft Access 2013 Navigationsformular (Musterlösung)

Corporate Actions in epoca

Unsere Ideen für Bremen!

Universität Bonn 28. Juli 2010 Fachbereich Rechts- und Wirtschaftswissenschaften Statistische Abteilung Prof. Dr. A. Kneip. KLAUSUR Statistik B

geben. Die Wahrscheinlichkeit von 100% ist hier demnach nur der Gehen wir einmal davon aus, dass die von uns angenommenen

Noten ausrechnen mit Excel/Tabellenkalkulation. 1) Individuellen Notenschlüssel/Punkteschlüssel erstellen

Tipps und Tricks zu Netop Vision und Vision Pro

Microsoft Office 365 Kalenderfreigabe

Zeichen bei Zahlen entschlüsseln

Pädagogische Hochschule Thurgau. Lehre Weiterbildung Forschung

Ein neues System für die Allokation von Spenderlungen. LAS Information für Patienten in Deutschland

Local Control Network

6. Bayes-Klassifikation. (Schukat-Talamazzini 2002)

1 Einleitung. 1.1 Motivation und Zielsetzung der Untersuchung

Klausur zur Vorlesung Stochastische Modelle in Produktion und Logistik im SS 2010

Qualität und Verlässlichkeit Das verstehen die Deutschen unter Geschäftsmoral!

Orderarten im Wertpapierhandel

Lichtbrechung an Linsen

Diese Ansicht erhalten Sie nach der erfolgreichen Anmeldung bei Wordpress.

Aktuelles, Mitteilungen und Veranstaltungen verwalten

Für Kunden die den neuen TopMaps Viewer EINER für ALLE als Betrachtungs-Software verwenden wollen. Top10 V1, Top25 V3, Top50 V5, WR50 V3 DVD s

AUFWÄRMEN 1: Aufprall-Rundlauf von Ralf Peter ( )

Niedersächsisches Kultusministerium. Die wichtigsten Fragen und Antworten zur inklusiven Schule. - Leichte Sprache - Niedersachsen

GEORG.NET Anbindung an Ihr ACTIVE-DIRECTORY

8.6.1 Erwartungswert eines beliebigen Operators O Beispiel: Erwartungswert des Impulses eines freien Teilchens

Anleitung Scharbefragung

Bedienungsanleitung für den Online-Shop

2 Intelligente Agenten - Grundlagen

Anleitung zum Download und zur Bedienung des Tarifbrowsers für Mac OSX und Safari / Mozilla Firefox

SILVERBALL MAX. Technische Info V10 Update

Stadt Luzern. 1. Wozu ein Benutzerkonto?

Mit dem Tool Stundenverwaltung von Hanno Kniebel erhalten Sie die Möglichkeit zur effizienten Verwaltung von Montagezeiten Ihrer Mitarbeiter.

Ihr Mandant möchte einen neuen Gesellschafter aufnehmen. In welcher Höhe wäre eine Vergütung inklusive Tantieme steuerrechtlich zulässig?

Maschinenrichtlinie 2006/42/EG 150 Fragen und Antworten zum Selbststudium

ACDSee Pro 3-Tutorials: Fotos (+ Datenbank) auf einen anderen Computer bringen

Vorgaben der DIN ISO Statistische Verfahren für Eignungsprüfungen durch Ringversuche

Zusammenführen mehrerer Dokumente zu einem PDF In drei Abschnitten erstellen Sie ein Dokument aus mehreren Einzeldokumenten:

Der monatliche Tarif für ein Handy wurde als lineare Funktion der Form f(x) = k x + d modelliert (siehe Grafik).

Der Kalender im ipad

Erstellen von x-y-diagrammen in OpenOffice.calc

RT Request Tracker. Benutzerhandbuch V2.0. Inhalte

Applikationen für das Qualitätsmanagement

Anbindung des eibport an das Internet

Dialup Verbindung und Smarthost einsetzen

Künstliche Intelligenz

Service für Bauherren

Abituraufgabe zur Stochastik, Hessen 2009, Grundkurs (TR)

Markovketten. Bsp. Page Ranking für Suchmaschinen. Wahlfach Entscheidung unter Risiko und stat. Datenanalyse

Ordner Berechtigung vergeben Zugriffsrechte unter Windows einrichten

Anleitung zum Download und zur Bedienung des Tarifbrowsers für Microsoft Windows 7 und Mozilla Firefox

Im Folgenden werden einige typische Fallkonstellationen beschrieben, in denen das Gesetz den Betroffenen in der GKV hilft:

SafeRun-Modus: Die Sichere Umgebung für die Ausführung von Programmen

TESTEN SIE IHR KÖNNEN UND GEWINNEN SIE!

Empfehlungen zur Nutzung der CD zum Buch: Klee & Wiemann: Beweglichkeit und Dehnfähigkeit. Schorndorf: Hofmann,

Was meinen die Leute eigentlich mit: Grexit?

Die Online-Meetings bei den Anonymen Alkoholikern. zum Thema. Online - Meetings. Eine neue Form der Selbsthilfe?

Benutzerhandbuch MedHQ-App

y P (Y = y) 1/6 1/6 1/6 1/6 1/6 1/6

SCHRITT 1: Öffnen des Bildes und Auswahl der Option»Drucken«im Menü»Datei«...2. SCHRITT 2: Angeben des Papierformat im Dialog»Drucklayout«...

EINFACHES HAUSHALT- KASSABUCH

Zahlen und das Hüten von Geheimnissen (G. Wiese, 23. April 2009)

W-Rechnung und Statistik für Ingenieure Übung 11

Transkript:

Intelligente Agenten Einige einfache Überlegungen zu Agenten und deren Interaktionsmöglichkeiten mit ihrer Umgebung. Agent benutzt: Sensoren Aktuatoren (Aktoren; Effektoren) zum Beobachten/Mess seiner Umgebung ergibt zeitliche Beobachtungssequenz zur Manipulation der Umgebung/seiner Position Agent Sensoren Umgebung Aktuatoren KI, SS 11, Folien 1 Ag, Seite 1 14. April 2011

Intelligente Agenten Agentenfunktion: Agentenprogramm { Beobachtungsfolgen} {Aktionen}. vollständige Tabelle / Algorithmus. KI, SS 11, Folien 1 Ag, Seite 2 14. April 2011

Intelligente Agenten- Beispiel Staubsaugerwelt (Russel / Norvig) varrierbare Modellwelt (Mikrowelt) KI, SS 11, Folien 1 Ag, Seite 3 14. April 2011

Staubsaugerwelt zwei Räume A, B in denen sich der Agent (Staubsauger) aufhalten kann. Jeder Raum kann Dreck enthalten oder nicht. Der Agent kann nur seinen Raum beobachten: Sauber/ Dreckig, mögliche Aktionen: InsAndereQuadrat, Saugen, NichtsTun. A B KI, SS 11, Folien 1 Ag, Seite 4 14. April 2011

Staubsaugerwelt implizite Annahmen: der Agent ist nur an einem Ort. Aktionen nur zur aktuellen Zeit und am aktuellen Ort Umgebung kann sich unabhängig vom Agenten verändern Agent kann nicht beobachten, wo er ist seine Aktionen sind immer ausführbar. Er kann nur eine Aktion gleichzeitig ausführen. KI, SS 11, Folien 1 Ag, Seite 5 14. April 2011

Staubsaugerwelt Wann ist der Agent rational / gut / vernünftig / intelligent? Vorgabe: ein (externes) Performanzmaß Leistungsbewertung des Agenten. Beispiele Alles soll immer maximal sauber sein. Konsequenz wäre, dass der Staubsauger immer hin und her fährt und saugt. möglichst sauber sein UND geringer Stromverbrauch diskrete Zeit, Sauberkeitspukte pro pro Zeiteinheit und Zimmer Wechsel des Zimmers: Minuspunkte Maß: mittlere Punktzahl pro Zeit maximal sauber UND keine Störung der Bewohner. Agent kann nicht beobachten, ob er stört!? KI, SS 11, Folien 1 Ag, Seite 6 14. April 2011

Güte des Agenten Das Performanzmaß Das Vorwissen über die Umgebung Die möglichen Aktionen Die aktuelle Beobachtungsfolge Ein vernünftiger (intelligenter, rationaler) Agent ist derjenige, der stets die optimale Aktion bzgl des Performanzmaßes wählt, aufgrund seiner Beobachtungsfolge und seines Vorwissens über die Umgebung. Vorwissen kann z.b. sein: die stochastische Verteilung der Verschmutzung über die Zeit Agent kann oft das Performanzmaß nicht berechnen Ersatz: Bewertungsfunktion (utility function) KI, SS 11, Folien 1 Ag, Seite 7 14. April 2011

Lernen Vorwissen über die Umgebung oft nicht ausreichend Umgebung kann sich ändern Deshalb: Mittels der Sensoren Wissen über die Umgebung zu sammeln Beispiel: Erkundung der Umgebung (Karte) lernfähig zu sein, bzw. sich adaptiv zu verhalten, aufgrund der Beobacht Autonomie: Wenn der Agent eher aus seinen Beobachtungen lernt und nicht auf vorprogrammierte Aktionen angewiesen ist. KI, SS 11, Folien 1 Ag, Seite 8 14. April 2011

Verschiedene Varianten von Umgebungen Klassifikation nach Eigenschaften der Umgebungen: Vollständig beobachtbar vs. teilweise beobachtbar Der Staubsauger kann z.b. nur sein eigenes Quadrat beobachten. Deterministisch vs. Stochastisch. Der Dreck erscheint zufällig in den Quadraten. Episodisch vs. sequentiell. Episodisch: Es gibt feste Zeitabschnitte, in denen beobachtet und agiert wird, und die alle unabhängig voneinander sind. Sequentiell. Es gibt Spätfolgen der Aktionen. Statisch vs. Dynamisch Dynamisch: Umgebung ändert sich unabhängig vom Agenten Diskret vs. Stetig. Ein Agent oder Multiagenten. Bei Multiagenten kann man unterscheiden zwischen Gegnern / Wettbewerber / Kooperierenden Agenten. bzw Kombinationen KI, SS 11, Folien 1 Ag, Seite 9 14. April 2011

Agenten Beispiele Beispieltabelle aus Russel / Norvig Arbeitsumgebung Beobachtbar Deterministisch Episodisch Statisch Diskret Agenten Kreuzworträtsel vollst. det. seq. statisch diskret 1 Schach mit Uhr vollst. strat. seq. semi diskret n Poker teilw. strat. seq. statisch diskret n Backgammon vollst. stoch. seq. statisch diskret n Taxifahren teilw. stoch. seq. dyn. stetig n Medizinische teilw. stoch. seq. dyn. stetig 1 Diagnose Bildanalyse vollst. det. episod. semi stetig 1 Interaktiver Englischlehrer teilw. stoch. seq. dyn. diskret n KI, SS 11, Folien 1 Ag, Seite 10 14. April 2011

Struktur des Agenten Ein Agent besteht aus: Physikalischer Aufbau inkl. Sensoren und Aktuatoren; Architektur des Agenten. dem Programm des Agenten KI, SS 11, Folien 1 Ag, Seite 11 14. April 2011

Programm des Agenten / Möglichkeiten Einfacher Reflex-Agent: Tabelle: Beobachtung Aktion Tabellengesteuerter Agent: endlicher Automat mit einer Tabelle von Einträgen: (Zustand, Beobachtung) Zustand,Aktion) Oder allgemeiner: (Zustand, Beobachtungsfolge) (Zustand, Aktion) Programmgesteuerter Agent: programmierte Funktion: (Zustand, Beobachtung) Aktion, Zustand KI, SS 11, Folien 1 Ag, Seite 12 14. April 2011

Strukturierung des Agenten / Möglichkeiten Modellbasierte Strukturierung Zustand Umgebung Z.B. beim Staubsauger: Lageplan und letzte Orte/Aktionen Zweckbasierte Strukturierung (goalbased, zielbasiert) Aktion wird so gewählt, dass möglichst das vorgegebene Ziel erreicht wird. Nutzenbasierte Strukturierung (utility-based, nutzenbasiert) Aktion wird so gewählt, dass ein internes Gütemaß sich verbessert Nutzenfunktion (internes Gütemaß) KI, SS 11, Folien 1 Ag, Seite 13 14. April 2011

Bewertungsfunktion Aufgrund der eingeschränkten Beobachtung: kann das Performanzmaß i.a nicht vom Agenten berechnet werden. Bewertungsfunktion (utility function) zur internen Bewertung der zukünftigen Aktionen das vom Agenten(-programm) berechnet werden kann. Beispiel: Staubsauger mit Stromspar-Optimierung kann nicht wissen ob der andere Raum schon Dreck enthält Utility-function basierend auf dem Erwartungswert der Wartezeit. KI, SS 11, Folien 1 Ag, Seite 14 14. April 2011

Lernende Agenten Tabellen sind oft viel zu groß zu aufwändig zu erstellen zu inflexibel (Agent nicht autonom) Abhilfe können Lernverfahren bieten andere Programm-Struktur der Agenten: Lernmodul Ausführungmodul (bisheriges Programm) (zu Lernmethoden siehe Kap. zum Lernen) KI, SS 11, Folien 1 Ag, Seite 15 14. April 2011