Kybernetik Intelligent Agents- Action Selection

Ähnliche Dokumente

Einführung in die Robotik Regelung. Mohamed Oubbati Institut für Neuroinformatik. Tel.: (+49) 731 / mohamed.oubbati@uni-ulm.de

Kybernetik Regelung. Mohamed Oubbati Institut für Neuroinformatik. Tel.: (+49) 731 / mohamed.oubbati@uni-ulm.de

Autonome Mobile Systeme

Kybernetik LTI-Systeme

Kybernetik Systemidentifikation

LTAM-T2EE-ASSER FELJC/GOERI 3. P-Regler

Institut für Leistungselektronik und Elektrische Antriebe. Übungen Regelungstechnik 2

Lineargleichungssysteme: Additions-/ Subtraktionsverfahren

Fuzzy Logik und Genetische Algorithmen für adaptive Prozesskontrolle

Professionelle Seminare im Bereich MS-Office

Handbuch ECDL 2003 Modul 2: Computermanagement und Dateiverwaltung Der Task-Manager

Simulink: Einführende Beispiele

1.) Aufrufen des Programms WinFACT 7 (BORIS)

Einführung in die Robotik Analog-Digital und Digital-Analog Wandler

Kybernetik Braitenberg Vehikel

Senkung des technischen Zinssatzes und des Umwandlungssatzes

Algorithmische Kryptographie

Kybernetik Laplace Transformation

FOREX und Währungsanalyse? COT Report. DollarIndex - AUD/USD? CHF/JPY? EUR/CHF, EUR/JPY, EUR/USD? GBP/CHF? NZD/JPY

SIMULATION. example Data Transfer (XDT) Protocol. entwickelt im Rahmen der Bachelor-Arbeit. von. Tobias Weimann. User-Manual

Rheinische Fachhochschule Köln

Folgende Voraussetzungen für die Konfiguration müssen erfüllt sein: - Ein Bootimage ab Version Optional einen DHCP Server.

Teambildung. 1 Einleitung. 2 Messen der Produktivität

GDI - Lohn & Gehalt Umstieg auf Firebird 2.5

Erweiterung der Aufgabe. Die Notenberechnung soll nicht nur für einen Schüler, sondern für bis zu 35 Schüler gehen:

Grundlagen der Elektro-Proportionaltechnik

Künstliches binäres Neuron

Technical Note Nr. 101

Zusammenfassung der 8. Vorlesung

Projekt 2HEA 2005/06 Formelzettel Elektrotechnik

DSO. Abtastrate und Speichertiefe

Kybernetik Übertragungsfunktion

How to do? Projekte - Zeiterfassung

Stellvertretenden Genehmiger verwalten. Tipps & Tricks

Grundlagen der Videotechnik. Redundanz

Der Anschluss an einen Computer

Controlling Konzepte für pneumatische Muskeln

DAUERHAFTE ÄNDERUNG VON SCHRIFTART, SCHRIFTGRÖßE

Regelungs- und Systemtechnik 1. Kapitel 1: Einführung

Usability ohne Maus und ohne Bildschirm

Das Recht auf gesundheitliche Versorgung ein Menschenrecht!

Primzahlen und RSA-Verschlüsselung

Definition 3.1: Ein Differentialgleichungssystem 1. Ordnung

Verwendung von LS-OPT zur Generierung von Materialkarten am Beispiel von Schaumwerkstoffen

Unterrichtsmaterialien in digitaler und in gedruckter Form. Auszug aus: Übungsbuch für den Grundkurs mit Tipps und Lösungen: Analysis

KI im Weltall: Der Remote Agent

K L A U S U R D E C K B L A T T

Aktuell 2014 als Startseite der PK-Website auf Firefox einstellen

Matrix42. Use Case - Sicherung und Rücksicherung persönlicher Einstellungen über Personal Backup. Version September

ecall sms & fax-portal

Kondensatoren ( Verdichter, von lat.: condensus: dichtgedrängt, bezogen auf die elektrischen Ladungen)

Modellbildungssysteme: Pädagogische und didaktische Ziele

Thermoguard. Thermoguard CIM Custom Integration Module Version 2.70

Gezielt über Folien hinweg springen

Charakteristikenmethode im Beispiel

Zeichen bei Zahlen entschlüsseln

Vertical-Spreads Iron Condor Erfolgsaussichten

Simulation LIF5000. Abbildung 1

Projektmanagement für Ingenieure

IBIS Professional. z Dokumentation zur Dublettenprüfung

teischl.com Software Design & Services e.u. office@teischl.com

SMP Financial Engineering GmbH Begleitmaterial zum Softwarepaket CheckForTrend des Nanotraders bzw. der Futurestation

Gimp Kurzanleitung. Offizielle Gimp Seite:

2. Negative Dualzahlen darstellen

Regelungstechnik 1 Praktikum Versuch Unterschied zwischen Steuerung und Regelung Reglereinstellung mittels Schwingversuch

Bedienungsanleitung für den Online-Shop

Reinforcement Learning

Anbindung des eibport an das Internet

AGROPLUS Buchhaltung. Daten-Server und Sicherheitskopie. Version vom b

erster Hauptsatz der Thermodynamik,

Auktionen erstellen und verwalten mit dem GV Büro System und der Justiz Auktion

Systemen im Wandel. Autor: Dr. Gerd Frenzen Coromell GmbH Seite 1 von 5

Rohstoffanalyse - COT Daten - Gold, Fleischmärkte, Orangensaft, Crude Oil, US Zinsen, S&P500 - KW 07/2009

Elektronenstrahloszilloskop

Leichtathletik Datenverarbeitung Handbuch für Ausrichter

Diskussionshilfe zum Thema: mit Ergebnissen der Wareneingangskontrolle

Informatik 2 Labor 2 Programmieren in MATLAB Georg Richter

Der naldo-offline-handyfahrplan

Windows XP Jugendschutz einrichten. Monika Pross Molberger PC-Kurse

Laborübung Gegentaktendstufe Teil 1

Unterrichtsmaterialien in digitaler und in gedruckter Form. Auszug aus:

Reglement der Verwaltungskommission der Kantonalen Pensionskasse Schaffhausen zur Bildung von technischen Rückstellungen

Warum kann ein Flugzeug fliegen?

Konvertieren von Settingsdateien

Skalierung des Ausgangssignals

Datensicherung und Wiederherstellung

Wie Sie mit Mastern arbeiten

Informationsblatt Induktionsbeweis

Erfahrungen mit Hartz IV- Empfängern

Speicher in der Cloud

Würfelt man dabei je genau 10 - mal eine 1, 2, 3, 4, 5 und 6, so beträgt die Anzahl. der verschiedenen Reihenfolgen, in denen man dies tun kann, 60!.

ZfP-Sonderpreis der DGZfP beim Regionalwettbewerb Jugend forscht BREMERHAVEN. Der Zauberwürfel-Roboter. Paul Giese. Schule: Wilhelm-Raabe-Schule

Besonderheiten und Einstellungen von BLDC-Motoren

Wie ist das Wissen von Jugendlichen über Verhütungsmethoden?

Makroökonomie II: Vorlesung Nr. 2. Die offene Volkswirtschaft bei vollständiger Kapitalmobilität (Mundell- Fleming-Analyse)

Downloadfehler in DEHSt-VPSMail. Workaround zum Umgang mit einem Downloadfehler

RT-E: Entwurf der Drehzahlregelung eines Gebläsemotors

Algorithmen und Datenstrukturen

Digitale Signaturen. Sven Tabbert

Transkript:

Kybernetik Intelligent Agents- Action Selection Mohamed Oubbati Institut für Neuroinformatik Tel.: (+49) 731 / 50 24153 mohamed.oubbati@uni-ulm.de 26. 06. 2012

Intelligent Agents

Intelligent Agents Environment Agent Intelligent Agents continuously perform 4 functions: 1. Perception (sensory data + interpretation). 2. Reasoning. 3. Decision making. 4. Action selection to affect the environment in order to meet its design objectives.

Intelligent Agents Agent objective Environment - Perception - Reasoning -Decision Action selection

Intelligent Agents Agent objective Environment - Perception - Reasoning -Decision Action selection How should the agent select actions?

Intelligent Agents How should the agent select actions? One way is to use architectures from control theory.

Intelligent Agents How should the agent select actions? Sollwert + - e Regler System Sensor

Intelligent Agents How should the agent select actions? Sollwert + - e Agent (action selection) Environment Sensor

Intelligent Agents How should the agent select actions? We consider the following control architectures 1. ON-OFF 2. PID 3. MRAC (Model Reference Adaptive Control) 4. MPC (Model Predictive Control)

ON-OFF Regler

ON-OFF Regler Diese Art der Regelung wird nur für einfache Anwendungen eingesetzt. Beispiel 1

ON-OFF Regler Beispiel 2: Regelung der Temperature im Backofen Soll-Wert + - ON/OFF Aktuelle Temperatur Temperatur Sensor - Der Regler schaltet "Aus", wenn die Temperatur höher als der Soll-Wert ist. - Der Regler schaltet "Ein", wenn der Soll-Wert unterschritten wird.

PID Regler

PID Regler PID-Regler besteht aus folgenden Anteilen: - Proportionalen Anteil (P-Regler) - Integralen Anteil (I-Regler) - Differentialen Anteil (D-Regler)

PID Regler P-Regler Er bestimmt die Stellgröße u(t) durch Multiplikation der Regelabweichung e(t) mit einem Faktor Kp: V(t) + e(t) P-Regler u(t) System y(t) - u(t)= Kp e(t)

PID Regler P-Regler Er bestimmt die Stellgröße u(t) durch Multiplikation der Regelabweichung e(t) mit einem Faktor Kp: V(t) + e(t) P-Regler u(t) System y(t) - u(t)= Kp e(t) - reagiert nur auf aktuellen Wert der Regelabweichung e(t) berücksichtigt nur die Gegenwart. - je größer (kleiner) die Regelabweichung e(t), desto größer (kleiner) ist die Stellgröße u(t). - Getting closer to the desired value means that the control signal u(t) does practically nothing! eine bleibende Regelabweichung.

P-Regler Simulation V(t) + - e(t) P-Regler u(t) System && y + 10 y& + 5 = u y(t)

P-Regler Sollwert Kp=50

P-Regler Sollwert Kp=100

P-Regler Sollwert Kp=200

P-Regler Sollwert Kp=300

P-Regler P-Regler Zusammenfassung Die Regeldifferenz und die Ausregelzeit werden kleiner, wenn Kp größer gewählt wird. Aber dazu erhalt man eine stärkere Überschwingung!

P-Regler P-Regler einfach im Aufbau und damit relative preiswert. das Verhalten wird nur durch die Einstellung des Parameters Kp. Kp Kp bleibende Regeldifferenz Überschwingweite

I-Regler I-Regler Beim I-Regler (integrierender Regler) ist die Stellgröße u(t), abgesehen vom Anfangswert, proportional zum Zeitintegral der Regelabweichung e(t): V + e I-Regler u System y - u 1 ( t ) = e ( τ ) d τ k i t 0 alle zurückliegenden Werte der Regelabweichung e(t) werden integriert. berücksichtigt die Vergangenheit. Advantage If e(t) remains non-zero (even for small values) for a length of time, the control signal u(t) gets larger and larger as time goes on! keine bleibende Regelabweichung

I-Regler I-Regler Simulation V(t) + - e(t) I-Regler u(t) System && y + 10 y& + 5 = u y(t)

I-Regler Ki=0.8

I-Regler Ki=10

I-Regler Ki=30

I-Regler Ki=50

I-Regler I-Regler keine bleibende Regeldifferenz. I-Regler greift langsamer ein als P-Regler.

PI-Regler PI-Regler Die Kombination eines I-Reglers mit einem P-Regler führt zum PI-Regler. u 1 ( t ) = K + p e ( t ) e ( τ ) d τ k i t 0

PI-Regler PI-Regler Simulation V(t) + - e(t) PI-Regler u(t) System && y + 10 y& + 5 = u y(t)

PI-Regler PI-Regler Kp=60 Ki=30

PI-Regler Kp=60 Ki=30

PI-Regler Kp=100 Ki=90

PI-Regler PI-Regler - anfangs schneller als der I-Regler. - präziser als der P-Regler (keine bleibende Regeldifferenz) Einstellung von zwei Reglerparametern (Zeit Aufwand beim Tuning)

D-Regler D-Regler Der D-Regler (differentialer Regler) bestimmt den Stellwert aus der zeitlichen Ableitung der Regelabweichung. V + e D-Regler u System y - u ( t ) = K d de ( t ) dt -Der D-Regler reagiert auf der Änderung der Regelabweichung. - Die Änderung zeigt, wohin die Regelabweichung in der Zukunft gehen wird. berücksichtigt die Zukunft. - Je stärker die Änderung der Regelabweichung e(t), desto größer ist die Stellgröße u(t). Überschwingen wird minimiert.

PI-Regler D-Regler Simulation V(t) + - e(t) D-Regler u(t) System && y + 10 y& + 5 = u y(t)

D-Regler Sollwert Kd=50

D-Regler Sollwert Kd=50

D-Regler D-Regler greift sofort ein beim Auftreten einer Regeldifferenz. Das Überschwingen zu minimieren. - reagiert nicht auf eine konstante Regeldifferenz. - verstärkt Messrauschen.

PD-Regler PD-Regler Die Parallelschaltung eines D-Reglers und eines P-Reglers führt zum PD-Regler. u( t) = K e( t) + p K d de( t) dt

PI-Regler D-Regler Simulation V(t) + - e(t) PD-Regler u(t) System && y + 10 y& + 5 = u y(t)

PD-Regler Sollwert Kp=10 Kd=50

PD-Regler Sollwert Kp=100 Kd=60

PD-Regler PD-Regler sehr schneller Regler, und größere Regeldifferenz werden vermieden. bleibende Regeldifferenz tritt auf.

PID-Regler PID-Regler Der PID-Regler vereint die Verhaltensweisen der P-, I-, und D-Regler. u( t) 1 = K p e( t) + e( τ ) dτ + K i t 0 K d d dt e( t)

PI-Regler PID-Regler Simulation V(t) + - e(t) PID-Regler u(t) System && y + 10 y& + 5 = u y(t)

PID-Regler Sollwert Kp=300 Ki=150 Kd=80

PID-Regler PID-Regler - reagiert schnell - läßt keine bleibende Regeldifferenz zu - erlaubt keine großen Regelabweichungen Einstellung eines PID-Regler erfordert einen großen Zeitaufwand

PID-Regler Die Merkmale der elementaren PID-Regler

Model Reference Adaptive Control (MRAC)

MRAC desired output actual output reference model Regler Adjustment Mechanism System + - Das Modell-Referenz-Verfahren besteht aus dem Regler und einem Referenzmodell. Das Ziel ist dann, das dynamische Verhalten des Regelkreises in Übereinstimmung mit dem Referenzmodell zu bringen.

Model Predictive Control (MPC)

MPC desired output actual output Regler control inputs System System model Systemidentifikation Beim MPC wird zuerst ein Modell des Systems verwendet, um die zukünftigen Zustände des Systems zu berechnen (vorhersagen). Aufgrund dieser Prädiktion wird dann die geeignete Eingangssignale (control inputs) gewählt.