Web Information Retrieval. Zwischendiskussion. Überblick. Meta-Suchmaschinen und Fusion (auch Rank Aggregation) Fusion

Save this PDF as:
 WORD  PNG  TXT  JPG

Größe: px
Ab Seite anzeigen:

Download "Web Information Retrieval. Zwischendiskussion. Überblick. Meta-Suchmaschinen und Fusion (auch Rank Aggregation) Fusion"

Transkript

1 Web Information Retrieval Hauptseminar Sommersemester 2003 Thomas Mandl Überblick Mehrsprachigkeit Multimedialität Heterogenität Qualität, semantisch, technisch Struktur Links HTML Struktur Technologische Herausforderungen Effizienz Was ist der bessere Hub? HITS: kontra-intuitiv 2,7 2,8 0,1 Lösung von Borodin et al. 2002: Durchschnittbildung 3* = 2,7 Durchschnitt Durchschnitt 4* 0,5 = 2,0 0,5 0,1 Meta-Suchmaschinen und Fusion (auch Rank Aggregation) Fusion Zusammenfassen mehrerer Evidenzen unterschiedliche Suchmaschinen unterschiedliche Ranking-Algorithmen Grundidee Verfahren Metasuchmaschinen 1 A 0,5 B 0,45 C 0,4 D 0,3 2 Endgültige B C 0,3 D 0,2 A 0,15 3 A 0,25 G 0,2 B 0,15 D 0,1 E 0,1 F 0,1 C 0 1

2 Meta-Suchmaschinen und Fusion Verfahren Round Robin: Nimm immer von jeder Liste einen Treffer Summierung der Gewichte vorher normalisieren gewichtete Summierung der Gewichte ein System ist als besser bekannt Obersten Treffer einer Liste nach den Werten einer anderen neu sortieren wohl häufig in Link-Analyse angewandt Transparente Fusion QSV Qualitätsfilter 1. Treffer Treffer 0, Treffer 0,79 0,2 4. Treffer 0, Treffer 0, Treffer 0, Treffer 0,66 0,1 8. Treffer 0, Treffer 0, Treffer 0, Treffer 0,51 1 QSV 1. Treffer Treffer 0, Treffer 0,43 4. Treffer 0, Treffer 0, Treffer 0, Treffer 0, Treffer 0,65 0,8 9. Treffer 0, Treffer 0, Treffer 0,51 0 Qualitätsaufwertung Data Mining Any algorithm that enumerates patterns from, or fits models to, data is a data mining algorithm (U. Fayyad 1997, in Heft 1 der Zeitschrift Data Mining and Knowledge Discovery) Data Mining im Knowledge Discovery Prozess Aus: Fayyad et al Web-Mining: Einführung Finden von Mustern in großen Mengen von Daten, die im Internet vorliegen oder gesammelt werden Teilgebiete Web Usage Mining Web Structure Mining Web Content Mining 2

3 Web-Mining Benutzer Benutzer wandern auf Pfaden Dokumenten-Bestand (aus WWW) s zeichnen Aktionen auf Usage Mining Suche nach Mustern Beobachtung des Informations-verhaltens zahlreicher Benutzer (und Autoren) Log- Datei Log- Datei Mögliche Anwendungen: - Usability untersuchen - Benutzer kategorisieren Web-Mining Beispiel Erstellung eines Klassifizierers Extraktion von Wissen: Listen mit typischem Vokabular Terme Gesundheit: Apotheke Arzt Terme Freizeit: Kino Film Terme Politik: Kanzler Parlament Übertragung auf weitere Seiten: Klassifizieren und Filtern Web IR im Zusammenhang Gesamtumfang unklar und schwer zu erfassen: CRAWLING Stark heterogene Inhalte und Darstellung semantische Het., wemantic web Wissen über Beziehungen, Ähnlichkeiten und Verteilungen MODELLE des Web, Link-Analyse, Kategorisierung Thematische Zuordnung Extraktion von Wissen Uebertragung auf weitere Seiten Autoren Informations- Suchender Erstellung Fortsetzung des Informationsprozesses durch Browsing möglich, Information seeking, foraging WWW Information Extraktion Repräsentation Dokumente (Objekte) Indexierung Ergebnis- Dokumente Interaktionsparadigma Agenten und Filtering Objekt- Eigenschaft- Matrix Ähnlichkeitsberechnung Kommerzielle Interessen (Reklame, Manipulation) Linkanalyse Formulierung Anfrage Indexierung Anfrage- Repräsentation 3

4 Überblick Mehrsprachigkeit Multimedialität Heterogenität Qualität, semantisch, technisch Struktur Links HTML Struktur Technologische Herausforderungen Effizienz Erfolgkontrolle: typische Prüfungsfragen Welche Herausforderungen stellt das Internet an das IR? Wie funktioniert Link-Analyse? Wozu wird sie im IR eingesetzt? Wie plausibel sind die Grundannahmen der Link-Analyse? Welche Evaluierungsergebnisse zur Linkanalyse sind Ihnen bekannt? Wer im Raum hat in den letzten drei Monaten Google benutzt? Wer eine andere Suchmaschine benutzt? Wer hat eine Suchmaschine mit grafischer Unterstützung wie Kartoo benutzt? Wer hat eine Suchmaschine mit Cluster- Funktionalität wie Visimo benutzt? Würden Sie ein intelligentes System benutzen? Was erwarten Sie von einem intelligenten System? Ist Google intelligent? Scirus 4

5 newsmaps Newsmaps.com Visimo Kartoo Wer im Raum hat in den letzten drei Monaten Google benutzt? Wer eine andere Suchmaschine benutzt? Wer hat eine Suchmaschine mit grafischer Unterstützung wie Kartoo benutzt? Wer hat eine Suchmaschine mit Cluster- Funktionalität wie Visimo benutzt? Würden Sie ein intelligentes System benutzen? Was erwarten Sie von einem intelligenten System? Ist Google intelligent? 5

Personalisierung. Der Personalisierungsprozess Nutzerdaten erheben aufbereiten auswerten Personalisierung. Data Mining.

Personalisierung. Der Personalisierungsprozess Nutzerdaten erheben aufbereiten auswerten Personalisierung. Data Mining. Personalisierung Personalisierung Thomas Mandl Der Personalisierungsprozess Nutzerdaten erheben aufbereiten auswerten Personalisierung Klassifikation Die Nutzer werden in vorab bestimmte Klassen/Nutzerprofilen

Mehr

Web Data Mining. Alexander Hinneburg Sommersemester 2007

Web Data Mining. Alexander Hinneburg Sommersemester 2007 Web Data Mining Alexander Hinneburg Sommersemester 2007 Termine Vorlesung Mi. 10:00-11:30 Raum?? Übung Mi. 11:45-13:15 Raum?? Klausuren Mittwoch, 23. Mai Donnerstag, 12. Juli Buch Bing Liu: Web Data Mining

Mehr

Suchmaschinenalgorithmen. Vortrag von: Thomas Müller

Suchmaschinenalgorithmen. Vortrag von: Thomas Müller Suchmaschinenalgorithmen Vortrag von: Thomas Müller Kurze Geschichte Erste Suchmaschine für Hypertexte am CERN Erste www-suchmaschine World Wide Web Wanderer 1993 Bis 1996: 2 mal jährlich Durchlauf 1994:

Mehr

Suchmaschinen. Anwendung RN Semester 7. Christian Koczur

Suchmaschinen. Anwendung RN Semester 7. Christian Koczur Suchmaschinen Anwendung RN Semester 7 Christian Koczur Inhaltsverzeichnis 1. Historischer Hintergrund 2. Information Retrieval 3. Architektur einer Suchmaschine 4. Ranking von Webseiten 5. Quellenangabe

Mehr

Data/Information Quality Management

Data/Information Quality Management Data/Information Quality Management Seminar WI/Informationsmanagement im Sommersemester 2002 Markus Berberov, Roman Eder, Peter Gerstbach 11.6.2002 Inhalt! Daten und Datenqualität! Einführung und Definition!

Mehr

Suchmaschinen und ihre Architektur. Seminar: Angewandtes Information Retrieval Referat von Michael Wirz

Suchmaschinen und ihre Architektur. Seminar: Angewandtes Information Retrieval Referat von Michael Wirz Suchmaschinen und ihre Architektur Seminar: Angewandtes Information Retrieval Referat von Michael Wirz Ziel Rudimentäre Grundkenntnisse über die Funktionsweise von Suchmaschinen und Trends Einführung in

Mehr

Web Mining und Farming

Web Mining und Farming Web Mining und Farming Shenwei Song Gliederung Übersicht über Web Mining und Farming Web Mining Klassifikation des Web Mining Wissensbasierte Wrapper-Induktion Web Farming Übersicht über Web-Farming-Systeme

Mehr

Lehrangebot. Fachgebiet Informationssysteme Prof. Dr. Norbert Fuhr. N. Fuhr, U. Duisburg-Essen. Lehrangebot

Lehrangebot. Fachgebiet Informationssysteme Prof. Dr. Norbert Fuhr. N. Fuhr, U. Duisburg-Essen. Lehrangebot Lehrangebot Fachgebiet Informationssysteme Prof. Dr. Norbert Fuhr N. Fuhr, U. Duisburg-Essen Lehrangebot 1 Lehrangebot des FG Informationssysteme Datenbanken Internet-Suchmaschinen Information Retrieval

Mehr

DAFFODIL : Nutzerorientiertes Zugangssystem für heterogene Digitale Bibliotheken

DAFFODIL : Nutzerorientiertes Zugangssystem für heterogene Digitale Bibliotheken DAFFODIL : Nutzerorientiertes Zugangssystem für heterogene Digitale Bibliotheken C.-P. Klas N. Fuhr S. Kriewel A. Schaefer G. Fischer Informatik 2005 Outline Motivation Strategische Unterstützung Höhere

Mehr

Text-Mining: Einführung

Text-Mining: Einführung Text-Mining: Einführung Claes Neuefeind Fabian Steeg 22. April 2010 Organisatorisches Was ist Text-Mining? Definitionen Anwendungsbeispiele Textuelle Daten Aufgaben u. Teilbereiche Literatur Kontakt Sprechstunde:

Mehr

Kurze Einführung in Web Data Mining

Kurze Einführung in Web Data Mining Kurze Einführung in Web Data Mining Yeong Su Lee Centrum für Informations- und Sprachverarbeitung (CIS), LMU 17.10.2007 Kurze Einführung in Web Data Mining 1 Überblick Was ist Web? Kurze Geschichte von

Mehr

Detecting Near Duplicates for Web Crawling

Detecting Near Duplicates for Web Crawling Detecting Near Duplicates for Web Crawling Gurmeet Singh Manku et al., WWW 2007* * 16th international conference on World Wide Web Detecting Near Duplicates for Web Crawling Finde near duplicates in großen

Mehr

Data Mining im Internet

Data Mining im Internet Data Mining im Internet Dipl.-Dok. Helga Walter Bayer HealthCare, Wuppertal PH-R-EU Scientific Information and Documentation 1 Arten / Quellen wissenschaftlicher Information Strukturierte Informationen:

Mehr

Infrastruktur für Web Intelligent Systems

Infrastruktur für Web Intelligent Systems Infrastruktur für Web Intelligent Systems Thema: Business Intelligence Teil II: Data Mining & Knowledge Discovery von Christian Merker Gliederung Web-Intelligent-Systeme Begriffsklärung Personalisiertes

Mehr

Diplomarbeit. Intelligente Agenten zur Dokumentenrecherche im World Wide Web

Diplomarbeit. Intelligente Agenten zur Dokumentenrecherche im World Wide Web Universität Hamburg Fakultät für Mathematik, Informatik und Naturwissenschaften Verteilte Systeme und Informationssysteme Diplomarbeit Intelligente Agenten zur Dokumentenrecherche im World Wide Web Afiriyie

Mehr

Das Knowledge Grid. Eine Architektur für verteiltes Data Mining

Das Knowledge Grid. Eine Architektur für verteiltes Data Mining Das Knowledge Grid Eine Architektur für verteiltes Data Mining 1 Gliederung 1. Motivation 2. KDD und PDKD Systeme 3. Knowledge Grid Services 4. TeraGrid Projekt 5. Das Semantic Web 2 Motivation Rapide

Mehr

9. IR im Web. bei Anfragen im Web gibt es eine Reihe von zusätzlichen Problemen, die gelöst werden

9. IR im Web. bei Anfragen im Web gibt es eine Reihe von zusätzlichen Problemen, die gelöst werden IR im Web 9. IR im Web bei Anfragen im Web gibt es eine Reihe von zusätzlichen Problemen, die gelöst werden müssen Einführung in Information Retrieval 394 Probleme verteilte Daten: Daten sind auf vielen

Mehr

Das Komplexe einfach machen

Das Komplexe einfach machen Das Komplexe einfach machen Semantik und Visualisierung im Bibliothekskatalog der Zukunft 14. April 2015 Dr. Jens Mittelbach, SLUB Dresden Das Komplexe einfach machen Semantik und Visualisierung im Bibliothekskatalog

Mehr

Maschinelles Lernen und Data Mining: Methoden und Anwendungen

Maschinelles Lernen und Data Mining: Methoden und Anwendungen Maschinelles Lernen und Data Mining: Methoden und Anwendungen Eyke Hüllermeier Knowledge Engineering & Bioinformatics Fachbereich Mathematik und Informatik GFFT-Jahrestagung, Wesel, 17. Januar 2008 Knowledge

Mehr

Quelle. Thematische Verteilungen. Worum geht es? Wiederholung. Link-Analyse: HITS. Link-Analyse: PageRank. Link-Analyse: PageRank. Link-Analyse: HITS

Quelle. Thematische Verteilungen. Worum geht es? Wiederholung. Link-Analyse: HITS. Link-Analyse: PageRank. Link-Analyse: PageRank. Link-Analyse: HITS Hauptseminar Web Information Retrieval Quelle Thematische Verteilungen 07.05.2003 Daniel Harbig Chakrabati, Soumen; Joshi, Mukul; Punera, Kunal; Pennock, David (2002): The Structure of Broad Topics on

Mehr

INFORMATIONSLOGISTIK VERSUS SUCHE. Wie die aktive Bereitstellung von Informationen hilft, Zeit zu sparen und Ziele zu erreichen

INFORMATIONSLOGISTIK VERSUS SUCHE. Wie die aktive Bereitstellung von Informationen hilft, Zeit zu sparen und Ziele zu erreichen INFORMATIONSLOGISTIK VERSUS SUCHE Wie die aktive Bereitstellung von Informationen hilft, Zeit zu sparen und Ziele zu erreichen 2 Informationslogistik versus Suche Inhalt Seite Thema 3 Suchen 3 Grundlegende

Mehr

Vektormodelle. Universität zu Köln HS: Systeme der maschinellen Sprachverarbeitung Prof. Dr. J. Rolshoven Referentin: Alena Geduldig

Vektormodelle. Universität zu Köln HS: Systeme der maschinellen Sprachverarbeitung Prof. Dr. J. Rolshoven Referentin: Alena Geduldig Vektormodelle Universität zu Köln HS: Systeme der maschinellen Sprachverarbeitung Prof. Dr. J. Rolshoven Referentin: Alena Geduldig Gliederung Vektormodelle Vector-Space-Model Suffix Tree Document Model

Mehr

Einführung in die Wissensverarbeitung und Data Mining

Einführung in die Wissensverarbeitung und Data Mining Einführung in die Wissensverarbeitung und Data Mining Peter Becker FH Bonn-Rhein-Sieg Fachbereich Angewandte Informatik!" $# Vorlesung Wintersemester 2001/02 1. Einführung Vorbemerkungen 1 Einführung Vorbemerkungen

Mehr

Information Retrieval in P2P-Netzen

Information Retrieval in P2P-Netzen Information Retrieval in P2P-Netzen Vorstellung der Vortragsthemen zum Seminar Henrik Nottelmann 30. Oktober 2003 Henrik Nottelmann 1/21 Grundstruktur A) Filesharing-Systeme (3 Themen) B) Zugriffsstrukturen

Mehr

Neue wissenschaftliche Informations- und Rechercheangebote als Grundlage für Seminar-/Oberstufenkurse an Gymnasien.

Neue wissenschaftliche Informations- und Rechercheangebote als Grundlage für Seminar-/Oberstufenkurse an Gymnasien. Neue wissenschaftliche Informations- und Rechercheangebote als Grundlage für Seminar-/Oberstufenkurse an Gymnasien Internetrecherche Fortbildung an der UB Heidelberg, 02.02.2010 Dr. Annette Klein UB Mannheim

Mehr

INEX. INitiative for the Evaluation of XML Retrieval. Sebastian Rassmann, Christian Michele

INEX. INitiative for the Evaluation of XML Retrieval. Sebastian Rassmann, Christian Michele INEX INitiative for the Evaluation of XML Retrieval Was ist INEX? 2002 gestartete Evaluierungsinitiative Evaluierung von Retrievalmethoden für XML Dokumente Berücksichtigt die hierarchische Dokumentstruktur

Mehr

Informationsintegration I Einführung

Informationsintegration I Einführung Informationsintegration I Einführung Felix Naumann Integrierte Informationssysteme Anfrage Integriertes Informationssystem Oracle, DB2 Anwendung Dateisystem Web Service HTML Form Integriertes Info.-system

Mehr

Recommender Systems. Stefan Beckers Praxisprojekt ASDL SS 2006 Universität Duisburg-Essen April 2006

Recommender Systems. Stefan Beckers Praxisprojekt ASDL SS 2006 Universität Duisburg-Essen April 2006 Recommender Systems Stefan Beckers Praxisprojekt ASDL SS 2006 Universität Duisburg-Essen April 2006 Inhalt 1 - Einführung 2 Arten von Recommender-Systemen 3 Beispiele für RCs 4 - Recommender-Systeme und

Mehr

BINGO! Ein fokussierender Crawler zur Generierung personalisierter Ontologien

BINGO! Ein fokussierender Crawler zur Generierung personalisierter Ontologien BINGO! Ein fokussierender Crawler zur Generierung personalisierter Ontologien Martin Theobald Stefan Siersdorfer,, Sergej Sizov Universität des Saarlandes Lehrstuhl für Datenbanken und Informationssysteme

Mehr

Warum Suche (trotzdem) bedeutend ist

Warum Suche (trotzdem) bedeutend ist Warum Suche (trotzdem) bedeutend ist Prof. Dr. Dirk Lewandowski Hochschule für Angewandte Wissenschaften Hamburg, Department Information dirk.lewandowski@haw-hamburg.de Drei Themen 1 Agenda Wie steht die

Mehr

5. Suchmaschinen Herausforderungen beim Web Information Retrieval. Herausforderungen beim Web Information Retrieval. Architektur von Suchmaschinen

5. Suchmaschinen Herausforderungen beim Web Information Retrieval. Herausforderungen beim Web Information Retrieval. Architektur von Suchmaschinen 5. Suchmaschinen Herausforderungen beim Web Information Retrieval 5. Suchmaschinen 5. Suchmaschinen Herausforderungen beim Web Information Retrieval Verweisstrukturen haben eine wichtige Bedeutung Spamming

Mehr

Maßgeschneiderte Suchmaschinen

Maßgeschneiderte Suchmaschinen Maßgeschneiderte Suchmaschinen Usability Stammtisch Frankfurt am Main 17.11.2009 Walter Ebert Web Development www.walterebert.de Braucht meine Website eine Suchmachine? Wahrscheinlich, wenn: Eine gute

Mehr

Ähnlichkeitssuche auf XML-Daten

Ähnlichkeitssuche auf XML-Daten Ähnlichkeitssuche auf XML-Daten Christine Lehmacher Gabriele Schlipköther Übersicht Information Retrieval Vektorraummodell Gewichtung Ähnlichkeitsfunktionen Ähnlichkeitssuche Definition, Anforderungen

Mehr

Präsentation des Dissertationsvorhabens Erste Schritte. Carola Carstens Hildesheim, 15. Oktober 2007

Präsentation des Dissertationsvorhabens Erste Schritte. Carola Carstens Hildesheim, 15. Oktober 2007 Präsentation des Dissertationsvorhabens Erste Schritte Carola Carstens Hildesheim, 15. Oktober 2007 Überblick Rahmenbedingungen Institut Thematische Interessen Erste Schritte Erfassung des State of the

Mehr

Studierende, die diese Vorlesung hören, haben sich auch für folgende Lehrveranstaltungen interessiert:

Studierende, die diese Vorlesung hören, haben sich auch für folgende Lehrveranstaltungen interessiert: Studierende, die diese Vorlesung hören, haben sich auch für folgende Lehrveranstaltungen interessiert: 1 des FG Informationssysteme Datenbanken Internet-Suchmaschinen Information Retrieval Information

Mehr

Matrikelnr: Name: Vorname: Aufgabe 1 2 3 4 Summe Maximal erreichbare 20 30 30 20 100 Punktzahl Erreichte Punktzahl. Note:

Matrikelnr: Name: Vorname: Aufgabe 1 2 3 4 Summe Maximal erreichbare 20 30 30 20 100 Punktzahl Erreichte Punktzahl. Note: Fakultät für Wirtschaftswissenschaft Matrikelnr: Name: Vorname: : Modul 32711 Business Intelligence Termin: 28.03.2014, 9:00 11:00 Uhr Prüfer: Univ.-Prof. Dr. U. Baumöl Aufbau und Bewertung der Aufgabe

Mehr

Conversion: Konvertierung zum Erstkunden. Akquisitionskosten für Neukunden. Konvertierungsrate der Neukunden. Ertrag je Neukunde

Conversion: Konvertierung zum Erstkunden. Akquisitionskosten für Neukunden. Konvertierungsrate der Neukunden. Ertrag je Neukunde Internet- Nutzer Besucher der Webseite Kunde Stammkunde Attraction: Besucher Akquisition Conversion: Konvertierung zum Erstkunden Retention: Erhalt als Stammkunde Anzahl der Besucher Akquisitionskosten

Mehr

Übungsaufgaben mit Lösungsvorschlägen

Übungsaufgaben mit Lösungsvorschlägen Otto-Friedrich-Universität Bamberg Lehrstuhl für Medieninformatik Prof. Dr. Andreas Henrich Dipl. Wirtsch.Inf. Daniel Blank Einführung in das Information Retrieval, 8. Mai 2008 Veranstaltung für die Berufsakademie

Mehr

Web Information Retrieval. Web Information Retrieval. Informationssuche im Web Typen von Web-Suche (nach Andrei Broder) Das World Wide Web

Web Information Retrieval. Web Information Retrieval. Informationssuche im Web Typen von Web-Suche (nach Andrei Broder) Das World Wide Web Web Information Retrieval Web Information Retrieval Ingo Frommholz / Norbert Fuhr 30. Januar 2012 Informationssuche im Web Browsing und Suche Beispiel einer Web-Suchmaschine: Google Hypertext und Web IR

Mehr

Vorstellung des Diplomarbeitsthemas. dawn. (direction. anticipation in web-navigation. navigation) Sebastian Stober 12.

Vorstellung des Diplomarbeitsthemas. dawn. (direction. anticipation in web-navigation. navigation) Sebastian Stober 12. Vorstellung des Diplomarbeitsthemas dawn (direction anticipation in web-navigation navigation) Sebastian Stober 12. August 2005 Motivation Suchmaschinen & Verzeichnisse bieten einem User einen guten Einstiegspunkt

Mehr

generiere aus Textdokumenten zunächst Metadaten, wende Data Mining - Techniken dann nur auf diese an

generiere aus Textdokumenten zunächst Metadaten, wende Data Mining - Techniken dann nur auf diese an 9. Text- und Web-Mining Text Mining: Anwendung von Data Mining - Verfahren auf große Mengen von Online-Textdokumenten Web Mining: Anwendung von Data Mining - Verfahren auf Dokumente aus dem WWW oder auf

Mehr

Erfolgreich suchen im Internet

Erfolgreich suchen im Internet Erfolgreich suchen im Internet Steffen-Peter Ballstaedt 05.10.2015 Statistik Weltweit: etwa 1 Milliarde Websites BRD: 15 Millionen Websites Das Internet verdoppelt sich alle 5,32 Jahre Die häufigste Aktivität

Mehr

Ontologien und Ontologiesprachen

Ontologien und Ontologiesprachen Ontologien und Ontologiesprachen Semantische Datenintegration SoSe2005 Uni Bremen Yu Zhao Gliederung 1. Was ist Ontologie 2. Anwendungsgebiete 3. Ontologiesprachen 4. Entwicklung von Ontologien 5. Zusammenfassung

Mehr

Semestralklausur zur Vorlesung. Web Mining. Prof. J. Fürnkranz Technische Universität Darmstadt Sommersemester 2004 Termin: 22. 7.

Semestralklausur zur Vorlesung. Web Mining. Prof. J. Fürnkranz Technische Universität Darmstadt Sommersemester 2004 Termin: 22. 7. Semestralklausur zur Vorlesung Web Mining Prof. J. Fürnkranz Technische Universität Darmstadt Sommersemester 2004 Termin: 22. 7. 2004 Name: Vorname: Matrikelnummer: Fachrichtung: Punkte: (1).... (2)....

Mehr

Kapitel IR:I. I. Einführung. Retrieval-Szenarien Begriffsbildung Einordnung Information Retrieval

Kapitel IR:I. I. Einführung. Retrieval-Szenarien Begriffsbildung Einordnung Information Retrieval Kapitel IR:I I. Einführung Retrieval-Szenarien Begriffsbildung Einordnung Information Retrieval IR:I-1 Introduction STEIN 2005-2010 Retrieval-Szenarien Liefere Dokumente, die die Terme «Information» und

Mehr

Suchen, um zu finden. Sta,s,k BRD (Quelle: Comscore, 2013) Beziehungsgeflecht der Suchmaschinen. Antworten auf folgende Fragen: 24.06.

Suchen, um zu finden. Sta,s,k BRD (Quelle: Comscore, 2013) Beziehungsgeflecht der Suchmaschinen. Antworten auf folgende Fragen: 24.06. Suchen, um zu finden Sta,s,k BRD (Quelle: Comscore, 2013) Steffen- Peter Ballstaedt 24.6.2015 etwa 6 Milliarden Suchanfragen pro Monat etwa 2.500 Anfragen pro Sekunde 96% der Suchanfragen über Google Beziehungsgeflecht

Mehr

Suchen im WWW. Web-Vorgeschichte. Das World Wide Web. Web-Browser-Geschichte. Einführung

Suchen im WWW. Web-Vorgeschichte. Das World Wide Web. Web-Browser-Geschichte. Einführung Web-Vorgeschichte Ted Nelson entwickelte 1965 die Idee des Hypertexts. Suchen im WWW Einführung Doug Engelbart erfand die Maus und bildete die erste Implementierung von Hypertext in den späten 60igern

Mehr

Übungsaufgaben. Aufgabe 1 Internetsuchmaschinen. Einführung in das Information Retrieval, 8. Mai 2008 Veranstaltung für die Berufsakademie Karlsruhe

Übungsaufgaben. Aufgabe 1 Internetsuchmaschinen. Einführung in das Information Retrieval, 8. Mai 2008 Veranstaltung für die Berufsakademie Karlsruhe Otto-Friedrich-Universität Bamberg Lehrstuhl für Medieninformatik Prof. Dr. Andreas Henrich Dipl. Wirtsch.Inf. Daniel Blank Einführung in das Information Retrieval, 8. Mai 2008 Veranstaltung für die Berufsakademie

Mehr

Macht Knowledge- Management Unternehmen effizienter?

Macht Knowledge- Management Unternehmen effizienter? Macht Knowledge- Management Unternehmen effizienter? Karl-Heinz Plünnecke Geschäftsführer H.U.T GmbH 1 Software Performance Entwicklung Performance Was dann? ecommerce ERP SCM CRM Zeit 2 1 Noch Potential?

Mehr

2006, Falk Neubert (ecoservice / materialboerse.de GmbH)

2006, Falk Neubert (ecoservice / materialboerse.de GmbH) Wie wird meine Webseite gefunden? Falk Neubert, Geschäftsführer ecoservice / materialboerse.de GmbH Was kann gefunden werden? alles was im sichtbaren Web vorhanden ist...... Texte, Dokumente, Grafiken,

Mehr

Analyse einer speziellen Lernangebotsnutzung mit Hypertextstruktur

Analyse einer speziellen Lernangebotsnutzung mit Hypertextstruktur LFE Medieninformatik Abschlussvortrag Projektarbeit Analyse einer speziellen Lernangebotsnutzung mit Hypertextstruktur Dhana Sauernheimer Betreuer: Anke Lindmeier, Sara Streng 17.11.2009 Gliederung Gliederung

Mehr

Informationsflut bewältigen - Textmining in der Praxis

Informationsflut bewältigen - Textmining in der Praxis Informationsflut bewältigen - Textmining in der Praxis Christiane Theusinger Business Unit Data Mining & CRM Solutions SAS Deutschland Ulrich Reincke Manager Business Data Mining Solutions SAS Deutschland

Mehr

Vortrag zum Fortsetzungantrag

Vortrag zum Fortsetzungantrag 1 / 18 Vortrag zum Fortsetzungantrag Universität Rostock Fakultät für Informatik und Elektrotechnik Institut für Informatik Lehrstuhl für Informations- und Kommunikationsdienste 24.06.2008 2 / 18 Inhalt

Mehr

Roboter Erkennung für Nutzungsstatistiken

Roboter Erkennung für Nutzungsstatistiken für Nutzungsstatistiken Vorgehen für die Filterung von automatisierten Zugriffen auf Dokumente in Repositorien für Nutzungsstatistiken Version 1.1, Juli 2013 Matthias Hitzler, Marco Recke Computer und

Mehr

Semantische Bildsuche mittels kollaborativer Filterung und visueller Navigation

Semantische Bildsuche mittels kollaborativer Filterung und visueller Navigation Semantische Bildsuche mittels kollaborativer Filterung und visueller Navigation Prof. Dr. Kai Uwe Barthel HTW Berlin / pixolution GmbH Übersicht Probleme der gegenwärtigen Bildsuchsysteme Schlagwortbasierte

Mehr

Apache Lucene. Mach s wie Google! Bernd Fondermann freier Software Architekt bernd.fondermann@brainlounge.de berndf@apache.org

Apache Lucene. Mach s wie Google! Bernd Fondermann freier Software Architekt bernd.fondermann@brainlounge.de berndf@apache.org Apache Lucene Mach s wie Google! Bernd Fondermann freier Software Architekt bernd.fondermann@brainlounge.de berndf@apache.org 1 Apache Apache Software Foundation Software free of charge Apache Software

Mehr

Business Intelligence Explorer

Business Intelligence Explorer Business Intelligence Explorer Discovering BI on the Web David Spretke Bachelor IE, 5. Semester Universität Konstanz Seminar Business Intelligence WS 2006/07 30.01.2007 Gliederung 1 Einleitung Definitionen

Mehr

Datenbanken und Informationssysteme

Datenbanken und Informationssysteme Datenbanken und Informationssysteme Lehrangebot Stefan Conrad Heinrich-Heine-Universität Düsseldorf Institut für Informatik April 2012 Stefan Conrad (HHU) Datenbanken und Informationssysteme April 2012

Mehr

Process Mining Tutorial: ProM 6 und Disco. Luise Pufahl 3. Juni 2014

Process Mining Tutorial: ProM 6 und Disco. Luise Pufahl 3. Juni 2014 Process Mining Tutorial: ProM 6 und Disco Luise Pufahl 3. Juni 2014 5 Gliederung 1. Szenario 2. Disco Fluxicon 3. ProM 6 2 Szenario 5 Szenario Purchase Process Requester Request for quotation Request for

Mehr

Was ist der Markt? Markt- & Konkurrenzanalyse richtig gemacht. Dr. Gerald Ruppert 8.6.2009

Was ist der Markt? Markt- & Konkurrenzanalyse richtig gemacht. Dr. Gerald Ruppert 8.6.2009 Markt- & Konkurrenzanalyse richtig gemacht Dr. Gerald Ruppert 8.6.2009 Was ist der Markt? Vertriebswege Substitutionsprodukte Patentschutz Kooperationen Preisstrukturen Umsätze Kunden Mitbewerb Normen

Mehr

Übung Medienretrieval WS 07/08 Thomas Wilhelm, Medieninformatik, TU Chemnitz

Übung Medienretrieval WS 07/08 Thomas Wilhelm, Medieninformatik, TU Chemnitz 02_Grundlagen Lucene Übung Medienretrieval WS 07/08 Thomas Wilhelm, Medieninformatik, TU Chemnitz Was ist Lucene? (1) Apache Lucene is a high-performance, full-featured text search engine library written

Mehr

Technologische Entwicklung von GIS und Internet der letzten Jahre

Technologische Entwicklung von GIS und Internet der letzten Jahre Technologische Entwicklung von GIS und Internet der letzten Jahre 10. Seminar GIS & Internet 10. bis 12. September 2007 UniBwMünchen Dr. Christine Giger Übersicht GIS vor 30 Jahren GIS vor 20 Jahren GIS

Mehr

Linked Data und Semantic Webbasierte Funktionalität in Europeana

Linked Data und Semantic Webbasierte Funktionalität in Europeana Linked Data und Semantic Webbasierte Funktionalität in Europeana Semantic Web in Bibliotheken - SWIB09 Köln, 25. November 2009 Stefan Gradmann, Marlies Olensky Humboldt-Universität zu Berlin, Berlin School

Mehr

Social Media Analytics Aktuelle Herausforderungen

Social Media Analytics Aktuelle Herausforderungen Lehrstuhl für Informatik 5 Informationssysteme RWTH Aachen Social Media Analytics Aktuelle Herausforderungen Ralf Klamma RWTH Aachen I5-KL-111010-1 Gesellschaft für Informatik Regionalgruppe Köln Themenabend

Mehr

Studierende, die diese Vorlesung hören, haben sich auch für folgende Lehrveranstaltungen interessiert:

Studierende, die diese Vorlesung hören, haben sich auch für folgende Lehrveranstaltungen interessiert: Studierende, die diese Vorlesung hören, haben sich auch für folgende Lehrveranstaltungen interessiert: Lehrangebot des FG Informationssysteme Modellierung Datenbanken Internet-Suchmaschinen Information

Mehr

!!!!T!!! Systems!() Multimedia Solutions

!!!!T!!! Systems!() Multimedia Solutions Inhalt. Was ist das semantische Web? Wie findet man einen Arzttermin mit Hilfe des semantischen Web? Wie gibt man Inhalten einen Sinn? Welche Werkzeuge stehen zur Verfügung? Wo können strukturierte Inhalte

Mehr

Textmining Klassifikation von Texten Teil 1: Naive Bayes

Textmining Klassifikation von Texten Teil 1: Naive Bayes Textmining Klassifikation von Texten Teil 1: Naive Bayes Dept. Informatik 8 (Künstliche Intelligenz) Friedrich-Alexander-Universität Erlangen-Nürnberg (Informatik 8) Klassifikation von Texten 1: Naive

Mehr

Was Bibliotheken von Suchmaschinen lernen können. Prof. Dr. Dirk Lewandowski dirk.lewandowski@haw-hamburg.de

Was Bibliotheken von Suchmaschinen lernen können. Prof. Dr. Dirk Lewandowski dirk.lewandowski@haw-hamburg.de Was Bibliotheken von Suchmaschinen lernen können Prof. Dr. Dirk Lewandowski dirk.lewandowski@haw-hamburg.de 1 Dirk Lewandowsk: Was Bibliotheken von Suchmaschinen lernen können Suchmaschinen 2 Dirk Lewandowsk:

Mehr

TEXTKLASSIFIKATION. WS 2011/12 Computerlinguistik I Deasy Sukarya & Tania Bellini

TEXTKLASSIFIKATION. WS 2011/12 Computerlinguistik I Deasy Sukarya & Tania Bellini TEXTKLASSIFIKATION WS 2011/12 Computerlinguistik I Deasy Sukarya & Tania Bellini GLIEDERUNG 1. Allgemeines Was ist Textklassifikation? 2. Aufbau eines Textklassifikationssystems 3. Arten von Textklassifikationssystemen

Mehr

Semantik in Suchmaschinen Beispiele. Karin Haenelt 7.12.2014

Semantik in Suchmaschinen Beispiele. Karin Haenelt 7.12.2014 Semantik in Suchmaschinen Beispiele Karin Haenelt 7.12.2014 Inhalt Google Knowledge Graph Freebase schema.org 2 Google Knowledge Graph Zuordnung von Suchtermen zu Weltentitäten Darstellung von Zusammenhängen

Mehr

5. Suchmaschinen Herausforderungen beim Web Information Retrieval. 5. Suchmaschinen. Herausforderungen beim Web Information Retrieval

5. Suchmaschinen Herausforderungen beim Web Information Retrieval. 5. Suchmaschinen. Herausforderungen beim Web Information Retrieval 5. Suchmaschinen Herausforderungen beim Web Information Retrieval 5. Suchmaschinen Herausforderungen beim Web Information Retrieval Architektur von Suchmaschinen Spezielle Bewertungsfunktionen Information

Mehr

Modul 5: Semantik im WWW

Modul 5: Semantik im WWW Modul 5: Semantik im WWW Lernziele The Internet will become a repository of knowledge, Vinton Cerf (geb. not only a compendium of facts. 1943), einer der Väter des Internets [W1] Interoperabilität und

Mehr

Web Services Einsatzmöglichkeiten für das Information Retrieval im WWW

Web Services Einsatzmöglichkeiten für das Information Retrieval im WWW Web Services Einsatzmöglichkeiten für das Information Retrieval im WWW Fabio Tosques & Philipp Mayr Frankfurt am Main, den 24. Mai 2005 27. Online-Tagung der DGI 2005 1 Überblick Datenanalyse mittels screen

Mehr

Web Data Management Systeme

Web Data Management Systeme Web Data Management Systeme Seminar: Web-Qualitätsmanagement Arne Frenkel Agenda Einführung Suchsysteme Suchmaschinen & Meta-Suchmaschinen W3QS WebSQL WebLog Information Integration Systems Ariadne TSIMMIS

Mehr

Technische Aspekte einer Videosuchmaschine. Björn Wilmsmann, CEO - MetaSieve GmbH

Technische Aspekte einer Videosuchmaschine. Björn Wilmsmann, CEO - MetaSieve GmbH Technische Aspekte einer Videosuchmaschine Björn Wilmsmann, CEO - MetaSieve GmbH 1 Über MetaSieve http://www.metasieve.com Softwareentwicklung Internet Software Spezialisiert auf Suchmaschinentechnologie

Mehr

P2P - Projekt. 1. Die gleiche Aufgabe zwei Herangehensweisen 2. Voraussetzungen. 3. Automatische Semantische Konvergenz

P2P - Projekt. 1. Die gleiche Aufgabe zwei Herangehensweisen 2. Voraussetzungen. 3. Automatische Semantische Konvergenz P2P - Projekt 1. Die gleiche Aufgabe zwei Herangehensweisen 2. Voraussetzungen 1. Natürlicher Suchalgorithmus 2. Small Worlds 3. Automatische Semantische Konvergenz 1. Netzwerkerstellung 2. Suche 1. Die

Mehr

Opinion Mining in der Marktforschung

Opinion Mining in der Marktforschung Opinion Mining in der Marktforschung von andreas.boehnke@stud.uni-bamberg.de S. 1 Überblick I. Motivation Opinion Mining II. Grundlagen des Text Mining III. Grundlagen des Opinion Mining IV. Opinion Mining

Mehr

Integration lokaler Daten in ifuice

Integration lokaler Daten in ifuice : Integration lokaler Daten in ifuice Bearbeiter: Sarah Gebhardt Betreuer: Andreas Thor Seite 1 Motivation Warum eine Integration lokaler Daten? Viele Infos im Web, aber andere Listen im Web, aber nicht

Mehr

PageRank-Algorithmus

PageRank-Algorithmus Proseminar Algorithms and Data Structures Gliederung Gliederung 1 Einführung 2 PageRank 3 Eziente Berechnung 4 Zusammenfassung Motivation Motivation Wir wollen eine Suchmaschine bauen, die das Web durchsucht.

Mehr

Angewandtes Information Retrieval

Angewandtes Information Retrieval Angewandtes Information Retrieval Web Retrieval Enterprise Search Urs Hengartner (hengart@acm.org) Universität Basel HS 2015 Terminplan 25.09.2015 Motivation, Einführung und Übersicht 02.10.2015 Basiskonzepte

Mehr

Wissenschaftssuchmaschinen

Wissenschaftssuchmaschinen Wissenschaftssuchmaschinen Prof. Dr. Dirk Lewandowski dirk.lewandowski@haw-hamburg.de Vision Eine Datenbank die alle Themenbereiche abdeckt, eine optimale Recherche erlaubt, leicht zu bedienen ist, die

Mehr

Einführung. Information Retrieval. IR-Aufgaben. IR in Beispielen. Adhoc-Suche: Web. IR in Beispielen. Was ist IR? Norbert Fuhr

Einführung. Information Retrieval. IR-Aufgaben. IR in Beispielen. Adhoc-Suche: Web. IR in Beispielen. Was ist IR? Norbert Fuhr Einführung Information Retrieval Norbert Fuhr 13. Oktober 2011 IR in Beispielen Was ist IR? Daten Information Wissen Dimensionen des IR Rahmenarchitektur für IR-Systeme Adhoc-Suche: Web IR in Beispielen

Mehr

Websuche. Einflussfaktor (Impact Factor) Bibliographische Kopplung. Bibliometrik: Zitatanalyse. Linkanalyse

Websuche. Einflussfaktor (Impact Factor) Bibliographische Kopplung. Bibliometrik: Zitatanalyse. Linkanalyse Einflussfaktor (Imact Factor) Websuche Linkanalyse Von Garfield in 1972 entwickelt, um die Bedeutung (Qualität, Einfluss) von wissenschaftlichen Zeitschriften zu messen. Maß dafür, wie oft Artikel einer

Mehr

Datenbank- Recherche. SS 2015 8. Veranstaltung 18. Juni 2015. Philipp Schaer - philipp.schaer@gesis.org Philipp Mayr - philipp.mayr@gesis.

Datenbank- Recherche. SS 2015 8. Veranstaltung 18. Juni 2015. Philipp Schaer - philipp.schaer@gesis.org Philipp Mayr - philipp.mayr@gesis. Datenbank- Recherche SS 2015 8. Veranstaltung 18. Juni 2015 Philipp Schaer - philipp.schaer@gesis.org Philipp Mayr - philipp.mayr@gesis.org GESIS Leibniz- InsFtut für SozialwissenschaJen 2 Themen der heu2gen

Mehr

Vorlesung Information Retrieval Wintersemester 04/05

Vorlesung Information Retrieval Wintersemester 04/05 Vorlesung Information Retrieval Wintersemester 04/05 14. Oktober 2004 Institut für Informatik III Universität Bonn Tel. 02 28 / 73-45 31 Fax 02 28 / 73-43 82 jw@informatik.uni-bonn.de 1 Themenübersicht

Mehr

Von der Literaturverwaltung zur Dokumentenverwaltung

Von der Literaturverwaltung zur Dokumentenverwaltung Von der Literaturverwaltung zur Dokumentenverwaltung Literaturverwaltung erfasst Metadaten über ein Dokument Dokumentenverwaltung kümmert sich um die Dokumenten-Technologien Umsetzung meist in einem Dokumentmanagementsystem

Mehr

Linked Open Data (LOD) im Enterprise 2.0. Florian Kondert COO, Business Development

Linked Open Data (LOD) im Enterprise 2.0. Florian Kondert COO, Business Development Linked Open Data (LOD) im Enterprise 2.0 Florian Kondert COO, Business Development Über die SWC 21 Experten Semantische Technologien für Enterprise Systeme Thesaurus- & Metadaten Management Text Extraction

Mehr

Online-Recherche: Web-Recherche WS 2015/2016 4. Veranstaltung 5. November 2015

Online-Recherche: Web-Recherche WS 2015/2016 4. Veranstaltung 5. November 2015 Online-Recherche: Web-Recherche WS 2015/2016 4. Veranstaltung 5. November 2015 Philipp Schaer - philipp.schaer@gesis.org Philipp Mayr - philipp.mayr@gesis.org GESIS Leibniz-InsJtut für SozialwissenschaNen

Mehr

XML und seine Anwendungsmöglichkeiten bei der Archivierung im Gesundheitswesen

XML und seine Anwendungsmöglichkeiten bei der Archivierung im Gesundheitswesen Institut für Terminologie und angewandte Wissensforschung XML und seine Anwendungsmöglichkeiten bei der Archivierung im Gesundheitswesen Johannes Palme (itaw), Lukas Faulstich (ID) Karlsruher Archivtage

Mehr

Recherchieren im Internet

Recherchieren im Internet Recherchieren im Internet Proseminar 1 Physik für Studierende des Lehramts Übersicht 1. Allgemeines zur Lage 2. google und mehr 3. Kataloge und Metasuchmaschinen 4. Fachspezifische Suchdienste 1. Allgemeines

Mehr

Tipps und Tricks der Suchmaschinenoptimierung

Tipps und Tricks der Suchmaschinenoptimierung Tipps und Tricks der Suchmaschinenoptimierung Thomas Kleinert Institut für Wirtschaftsinformatik (IWi) im DFKI 16. Juli 2014 Agenda Was ist Suchmaschinenmarketing? Wie arbeiten Suchmaschinen? On-Page Optimierung

Mehr

Universal Search. `ljv^k. Whitepaper. Autor Peter Resele Datum 29. März 2010 Status Public

Universal Search. `ljv^k. Whitepaper. Autor Peter Resele Datum 29. März 2010 Status Public Universal Whitepaper Autor Peter Resele Datum 29. März 2010 Status Public `ljv^k=gmbh Karolingerstrasse 34a 82205 Gilching Germany t + 49 810 5779390 peter.resele@comyan.com f + 49 810 5779395 www.comyan.com

Mehr

2 Evaluierung von Retrievalsystemen

2 Evaluierung von Retrievalsystemen 2. Evaluierung von Retrievalsystemen Relevanz 2 Evaluierung von Retrievalsystemen Die Evaluierung von Verfahren und Systemen spielt im IR eine wichtige Rolle. Gemäß der Richtlinien für IR der GI gilt es,...

Mehr

Integration, Migration und Evolution

Integration, Migration und Evolution 14. Mai 2013 Programm für heute 1 2 Quelle Das Material zu diesem Kapitel stammt aus der Vorlesung Datenintegration & Datenherkunft der Universität Tübingen gehalten von Melanie Herschel im WS 2010/11.

Mehr

Seminar Datenbanksysteme

Seminar Datenbanksysteme Seminar Datenbanksysteme Recommender System mit Text Analysis für verbesserte Geo Discovery Eine Präsentation von Fabian Senn Inhaltsverzeichnis Geodaten Geometadaten Geo Discovery Recommendation System

Mehr

Beschreibungslogiken. Daniel Schradick 1schradi@informatik.uni-hamburg.de

Beschreibungslogiken. Daniel Schradick 1schradi@informatik.uni-hamburg.de Beschreibungslogiken Daniel Schradick 1schradi@informatik.uni-hamburg.de Was sind Beschreibungslogiken? Definition: Formalisms that represent knowledge of some problem domain (the world ) by first defining

Mehr

Text Mining mit LingPipe

Text Mining mit LingPipe Text Mining mit LingPipe Hauptseminar Information Retrieval PD Dr. Karin Haenelt Universität Heidelberg Vortrag von Alexander Kappe im Wintersemester 2008/2009 Übersicht Text Mining Definition & Abgrenzung

Mehr

Data Mining im e-commerce am Beispiel der Deutschen Bahn AG

Data Mining im e-commerce am Beispiel der Deutschen Bahn AG Fellowship Data Mining im e-commerce am Beispiel der Deutschen Bahn AG Katja Steuernagel Universität Kaiserslautern Momentan: GIP AG Göttelmannstraße 17 55130 Mainz katja@katja-steuernagel.de Zusammenfassung

Mehr

WMS Block: Management von Wissen in Dokumentenform PART: Text Mining. Myra Spiliopoulou

WMS Block: Management von Wissen in Dokumentenform PART: Text Mining. Myra Spiliopoulou WMS Block: Management von Wissen in nform PART: Text Mining Myra Spiliopoulou WIE ERFASSEN UND VERWALTEN WIR EXPLIZITES WISSEN? 1. Wie strukturieren wir Wissen in nform? 2. Wie verwalten wir nsammlungen?

Mehr