Vorlesung Softwareagenten zur Informationssuche Wintersemester 1999/2000 Universität Magdeburg http://wwwiti.cs.uni-magdeburg.de/~sattler/ Motivation ƒ Wunsch nach (intelligenter) Unterstützung bei Informationssuche und -aufbereitung im weiteren Sinne Nachrichten, Dokumente, Produkte, Forschungsergebnisse,... ƒ Bedingt durch Informationsmenge Verfügbarkeit leistungsfähiger Hard- und Software Vorlesung Softwareagenten 1-2 Softwareagenten ƒ aktuelle Technologie Bewertung und Einordnung neuer Entwicklungen Entwicklung eigener Anwendungen mit Agententechniken ƒ Interdisziplinäres Gebiet Netzwerke/Kommunikation, Information Retrieval, Datenintegration, KI, Software Engieering,... Vielfältige Anwendungen Kaum klare Begriffswelt, fehlende Abgrenzung Vorlesung Softwareagenten 1-3 1
Vorlesung: Ziel und Gegenstand ƒ Einführung in Technologie der Softwareagenten Techniken und Methoden Anwendungen ƒ Schwerpunkt Aspekte der Informationssuche, -filterung und aufbereitung Kommunikation, Kooperation Lernen und Planen Vorlesung Softwareagenten 1-4 Vorlesung: Organisatorisches ƒ Zeit: Mittwoch 17.15-18.45 ƒ Ort: G14(H)-101 ƒ Skript: Kopie der Folien http://wwwiti.cs.uni-magdeburg.de/~sattler/lectures/agents.html Vorlesung Softwareagenten 1-5 Vorlesung: Ablauf 1. Einführung ƒ Motivation ƒ Grenzen und Potentiale 2. Begriffsbestimmung und Klassifikation ƒ Begriff Softwareagent ƒ Charakterisika ƒ Taxonomie Vorlesung Softwareagenten 1-6 2
Vorlesung: Ablauf 3. Basistechniken von Softwareagenten ƒ Information Retrieval und Filtering ƒ Metadaten ƒ Kommunikation und Kooperation ƒ Mobilität ƒ Lernen und Planen ƒ Nutzermodellierung ƒ Sicherheit und Vertraulichkeit Vorlesung Softwareagenten 1-7 Vorlesung: Ablauf 4. Entwicklungsmethoden und werkzeuge ƒ Architekturen ƒ Sprachen ƒ Entwicklungswerkzeuge ƒ Standardisierung 5. Beispielsysteme 6. Zusammenfassung und Ausblick Vorlesung Softwareagenten 1-8 Hinweise zur Übung ƒ Zeit: Montag (1.Woche), 7.15-8.45 ƒ Ort: G05(F)-312 ƒ Inhalt: Untersuchung von Agentensystemen Analyse, Präsentation Vorlesung Softwareagenten 1-9 3
Literatur ƒ Brenner, Zarnekow, Wittig: Intelligente Softwareagenten: Grundlagen und Anwendungen, Springer 1998 ƒ Bradshaw (Hrg.): Software Agents, MIT Press 1997 ƒ Jennings, Wooldridge (Hrg.): Agent Technology: Foundations, Applications, and Markets, Springer 1998 ƒ Klusch (Hrg.): Intelligent Information Agents, Springer 1999 ƒ Negroponte: Being Digital, Hodder & Stougthon, 1995 ƒ Russell, Norvig: Artificial Intelligence A Modern Approach, Prentice Hall 1995 Vorlesung Softwareagenten 1-10 Ressourcen ƒ UMBC AgentWeb: http://www.cs.umbc.edu/agents/ ƒ Agent Society: http://www.agent.org/ ƒ BotSpot: http://botspot.com/main.html ƒ MIT Media Lab: http://lcs.www.media.mit.edu/groups/agents/ Vorlesung Softwareagenten 1-11 Ausgangssituation " Vorlesung Softwareagenten 1-12 4
Probleme ƒ Informationsmenge und zuwachs In den letzten 30 Jahren mehr Informationen als in den 5000 Jahren zuvor 200-320 Mill. Indexierbare Web-Seiten (1997) Web ist nur ein Teil des Informationsraums Belanglose Inhalte, unsinnige Formen der Darstellung, Spamming Vorlesung Softwareagenten 1-13 Probleme ƒ Heterogenität der Quellen Vielzahl von Quellen: y Druckerzeugnisse (Bibliotheken), Nachrichten, Internet-Quellen (Web, ftp, NetNews), Unternehmensdaten,... Allein im Internet: verschiedene y Medien (Text, Bilder, Video, Audio, Applets) y Formate (HTML, Postscript, PDF, semistrukturierte Daten) y Zugriffsschnittstellen (CGI, SQL,...) Vorlesung Softwareagenten 1-14 Speicherbedarf Einheit Exponent Bytes Beispiel Byte 1 1 Schreibmaschinenanschlag 6 Wort 100 Satz Kilobyte 3 1000 0,5 Seiten Text 10.000 1 Sekunde Sprachaufzeichnung 100.000 Bild, komprimiert Megabyte 6 1.000.000 Roman (Moby Dick) 20.000.000 Digitalisiertes Buch 500.000.000 CD-ROM, Oxford English Dictionary Vorlesung Softwareagenten 1-15 5
Speicherbedarf Einheit Exponent Bytes Beispiel Gigabyte 9 10.000.000.000 8mm-Band 10.000.000.000 Digitalisierter Film 100.000.000.000 Flur einer Bibliothek Terabyte Petabyte 12 15 20.000.000.000.000 Inhalt der Kongreßbibliothek (als Text) 1.000.000.000.000.000 Nationalbibliothek 15.000.000.000.000.000 Weltproduktion Festplatten (1995) Quelle: Lesk, Practical Digital Libraries, Morgan Kaufmann, 1995 Vorlesung Softwareagenten 1-16 Informationszugriff und -verteilung ƒ Push: zentrale Verteilung an passive Konsumenten/Abonn enten Rundfunk, TV Information Broker Internet Channels Vorlesung Softwareagenten 1-17 Informationszugriff und -verteilung ƒ Pull: gezielter, aktiver Zugriff auf verschiedene Anbieter Internet- Suchmaschinen Surfen, Browsen Vorlesung Softwareagenten 1-18 6
Exkurs Web-Suchmaschinen ƒ Web ohne eigenständige Suchkomponente wie Queryprozessor im DBMS ƒ Formen: Kataloge (Yahoo) Suchmaschinen (Altavista) Meta-Suchmaschinen (MetaCrawler) ƒ Technik: Volltextsuche Vorlesung Softwareagenten 1-19 Web-Suchmaschinen: Prinzip Internet Agent, Spider, Robot Query Server Suchmaschine Vorlesung Softwareagenten 1-20 Web-Suchmaschinen: Probleme ƒ 10% des Web-Traffics durch Suchmaschinen [Wired96] ƒ Query-Mechanismen ƒ Manipulation von Suchmaschinen Verkauf von Plätzen auf Trefferlisten durch GoTo Anreicherung durch häufige Suchbegriffe ƒ Bewertung der Ergebnisse Abdeckung Indexverfahren (Altavista: keine Metatags, Lycos: 100 Wörter) ƒ Aufwand Manuelles Klassifizieren (Yahoo: 150 Codierer) Vorlesung Softwareagenten 1-21 7
Vergleich von Suchmaschinen Suchmaschine Altavista Inktomi Excite Infoseek Lycos WebCrawler Indizierte Seiten (Mill.) 140 110 55 30 30 2 Abdeckung (%) 70 55 28 15 15 1 Quelle: www.searchenginewatch.com Vorlesung Softwareagenten 1-22 Auswege ƒ Für das Web Entwicklungen im Hardware-Bereich Verbesserte Suchmechanismen (Konzeptbasierte/semantische Suche, NLP) Nutzer-Training Ordnung, Regulierung ƒ Allgemein Intelligentere Werkzeuge @Softwareagenten? Vorlesung Softwareagenten 1-23 Softwareagenten: Historisches ƒ 1921: Karel Capek RUR = Rossum Universal Robots ƒ Mitte der 50er Jahre: McCarthy, Selfridge (MIT) Soft Robot oder Softbot = System, welches zu einem gegebenen Ziel die entsprechenden Schritte ermitteln und dabei vom Nutzer Hinweise erfragen kann ƒ 70er Jahre: Verteilte KI Deliberative ( nachdenkende Agenten) Multi-Agenten-Systeme ƒ 90er Jahre: breitere Anwendungsbereiche (Web) intelligente Assistenten Mobile Agenten Vorlesung Softwareagenten 1-24 8
Einflußgebiete ƒ Künstliche Intelligenz Techniken das Planens und Schlußfolgerns Reaktive Agenten, Subsumption-Architektur [Brooks] Belief-Desire-Intention-Modell ƒ Objektsysteme Weiterentwicklung des Objektbegriffs Aktive Objekte Vorlesung Softwareagenten 1-25 Einflußgebiete ƒ Mensch-Maschine-Interface (HCI) Delegierung von Aufgaben (Expertenassistenz, digitale Butler) ƒ Datenbanken, Information Retrieval Daten- und Informationsintegration Informationssuche Vorlesung Softwareagenten 1-26 Agenten-Metapher ƒ Jemand/Etwas, der bzw. das für eine Person selbständig bestimmte Aufgaben erledigen kann. [Webster] ƒ Beispiel: Reisebüro, Versicherung ƒ Übertragen auf Software @ intelligente Softwareagenten Vorlesung Softwareagenten 1-27 9
Informationsagenten: Anforderungen ƒ Autonome Handlungsweise Repräsentation von Zielen Ableitung von Aktionen zum Erreichen dieser Ziele Reaktion auf Umgebung Beispiele: y günstigste CD von mehreren Händlern y Dokumentsuche über verschiedene Suchmaschinen y Druckexemplare aller Reports von X der letzten Jahre Vorlesung Softwareagenten 1-28 Informationsagenten: Anforderungen ƒ Suchen, Sammeln und Aufbereiten von Informationen Zugriff auf Quellen in heterogenen Umgebungen Nutzung von Informationen über Quellen und Daten/Informationen (Metadaten) Beispiele: y Format von Produtkatalogen (welches Attribut ist Preis, Ort der Kataloge) Informationsintegration intelligentes Suchen (NLP, Semantik) Vorlesung Softwareagenten 1-29 Informationsagenten: Anforderungen ƒ Berücksichtigen persönlicher Präferenzen Ermittlung und Repräsentationdes Nutzerinteresses ( über die Schulter schauen ) Abgleich mit ermittelten Ergebnissen y Welche der gefundenen Ergebnisse sind relevant? Feedback (Rückwirkung auf Nutzermodellierung) Vorlesung Softwareagenten 1-30 10
Informationsagenten: Beispiele ƒ Softbot als Schnittstelle zum Internet (Etzioni, Weld; CACM 7/94) ƒ Eigenschaften Zielorientierung: Anforderung beschreibt, was der Nutzer wünscht; wie ist vom Softbot zu entscheiden Nachsichtigkeit: Verarbeitung unvollständiger oder ungenauer Anforderungen Ausgewogenheit: Abwägung der Kosten für eigenständige Suche gegenüber Nachfragen Integration: Schnittstelle zu Internet-Diensten Vorlesung Softwareagenten 1-31 Softbot ƒ Beispiel einer Anforderung: Sende den Projektantrag an Herrn Meier in Halle! Welcher Herr Meier? Welches Dokument? Wo ist es gespeichert? Wie soll es gesendet werden (Email, FAX,...)? Wie soll verfahren werden, wenn Dokument vertraulich ist ƒ Erstellung eines Plans, Abarbeitung Nutzung verschiedener Dienste: netfind, finger, ftp,... Vorlesung Softwareagenten 1-32 Softbot Vorlesung Softwareagenten 1-33 11
Informationsagenten: Beispiele ƒ Email-Agent Maxims (CACM 7/94) ƒ Lernen von Handlungsweisen des Nutzers: implizite Nutzermodellierung Sortieren, Speichern, Löschen usw. von Emails anhand von Eigenschaften (Subject, From, Body, CC) ƒ Merken von Situation-Aktion -Paaren ƒ Vorschläge zur Behandlung neuer Nachrichten Vorlesung Softwareagenten 1-34 Maxims Vorlesung Softwareagenten 1-35 Potentiale ƒ Entwicklung reaktiver Systeme (Interaktion mit Umgebung) ƒ Offenheit von Systemen Selbstanpassung Berücksichtigung von Heterogenität Systemstruktur und komponenten bei Erstellung nicht vollständig bekannt Vermittlung und Kooperation zwischen Komponenten Vorlesung Softwareagenten 1-36 12
Potentiale ƒ Komplexe Systeme Modularität und Abstraktion System als Gesellschaft autonom agierender Agenten ƒ Mensch-Maschine-Interface Delegierung von Aufgaben an Computer anstelle des direkten Manipulierens Vorlesung Softwareagenten 1-37 Potentiale ƒ Verteilung von Daten, Steuerung, Ressourcen Verschiedene, heterogene Quellen Dezentralisierung von Aufgaben, Kooperation ƒ Integration von Legacy-Systemen Interoperabilität über Agenten-Wrapper ƒ Weltsicht Systeme als autonome, evtl. kooperierende Komponenten Persönliche digitale Agenten (digital butler, digital sister-in-law) Vorlesung Softwareagenten 1-38 Grenzen der Agententechnologie ƒ Keine globale Kontrolle/Steuerung möglich Erfüllung von Echtzeitanforderungen Vermeiden von Deadlocks ƒ Keine globale Sichtweise Verhalten ist bestimmt durch lokalen Zustand Kein gobales Wissen ƒ Vertrauen/Sicherheit Delegieren von Aufgaben an Agenten erfordert Vertrauen Selbständiges Entscheiden? Vorlesung Softwareagenten 1-39 13
Anwendungsfelder ƒ Kommerzielle Anwendungen Informationsmanagement y Suchen, Sammeln, Filtern und Aufbereiten von Informationen E-Commerce y Elektronischer Handel y Shopping Agenten Workflow-Management y Geschäftsprozeß als Gesellschaft diensterbringender Agenten; Agent = Rolle oder Abteilung im Unternehmen Vorlesung Softwareagenten 1-40 Anwendungsfelder ƒ Industrielle Anwendungen Prozeßsteuerung y Multi-Agenten-Systeme; Agenten = Prozeß- Controller Fertigung y Agenten = Fertigungszellen Flugleitsysteme y Agenten = Flugzeuge, Flugkontrollsysteme Vorlesung Softwareagenten 1-41 Anwendungsfelder ƒ Medizinische Anwendungen Patientenüberwachung Patientenmanagement ƒ Unterhaltung Spiele Interaktive Filme Vorlesung Softwareagenten 1-42 14