Dirk Lewandowski. Web Information Retrieval Technologien zur Informationssuche im Internet. DGI-Schrift (Informationswissenschaft 7}

Größe: px
Ab Seite anzeigen:

Download "Dirk Lewandowski. Web Information Retrieval Technologien zur Informationssuche im Internet. DGI-Schrift (Informationswissenschaft 7}"

Transkript

1 Dirk Lewandowski Web Information Retrieval Technologien zur Informationssuche im Internet DGI-Schrift (Informationswissenschaft 7}

2 Inhalt Vorwort 9 Suchmaschinen im Internet - informationswissenschaftlich betrachtet 9 1 Einleitung 13 2 Forschungsumfeld Suchmaschinen-Markt Formen der Suche im WWW Aufbau von algorithmischen Suchmaschinen Abfragesprachen Arten von Suchanfragen Nutzerstudien Methoden der Nutzerforschung Nutzergruppen Recherchekenntnisse und -Strategien Themen und Auswahl der Suchbegriffe Sichten der Treffer Wissen über Suchmaschinen und deren Finanzierung Forschungsbereiche 39 3 Die Größe des Web und seine Abdeckung durch Suchmaschinen Die Größe des indexierbaren Web Struktur Crawling Aktualität invisible Web 51 4 Strukturinformationen Strukturierungsgrad von Dokumenten Strukturinformationen in den im Web gängigen Dokumenten HTML Word-Dokumente PDF Trennung von Navigation, Layout und Inhalt Repräsentation der Dokumente in den Datenbanken der Suchmaschinen

3 5 Klassische Verfahren des Information Retrieval und ihre Anwendung bei WWW-Suchmaschinen Unterschiede zwischen klassischem" Information Retrieval und Web Information Retrieval Kontrolliertes Vokabular Kriterien für die Aufnahme in den Datenbestand Modelle des Information Retrieval Boolesches Modell Vektorraummodell Probabilistisches Modell 86 6 Ranking Rankingf aktoren Messbarkeit von Relevanz Grundsätzliche Probleme des Relevance Ranking in Suchmaschinen 97 7 Informationsstatistische und informationslinguistische Verfahren Textstatistische Verfahren Nutzungsstatistische Verfahren Informationslinguistische Verfahren Stemming Phrasenerkennung Synonyme, Homonyme, Akronyme Rechtschreibkontrolle Linktopologische Ran kingverfahren Grundlagen: Science Citation Indexing PageRank Der klassische PageRank-Algorithmus Weiterentwicklungen: Reranking HITS Hilltop Evaluierung der linktopologischen Verfahren Problembereiche linktopologischer Rankingverfahren Fazit linktopologische Verfahren 137 6

4 9 Retrievaltests Aufbau und Nutzen von Retrievaltests Aufbau und Ergebnisse ausgewählter Retrievaltests Kritik Verfahren der intuitiven Benutzerführung Relevance Feedback Vorschläge zur Erweiterung und Einschränkung der Suchanfrage Klassifikation und Thesaurus Clusterbildung Graphische Ansätze der Ergebnispräsentation Aktualität Bedeutung der Beschränkung nach der Aktualität der Dokumente Funktionsfähigkeit der Datumsbeschränkung in Suchmaschinen Methodik Ergebnisse Möglichkeiten der Ermittlung von Datumsangaben in Web-Dokumenten Aktualitätsfaktoren im Ranking Spezialisierte Suchmaschinen für Nachrichten Auswahl der gewünschten Aktualität durch den Nutzer Qualität Bedeutung der Beschränkung nach der Qualität der Dokumente Qualitätsbeschränkungen bei der Recherche in Datenbank-Hosts Identifizierung von Top-Quellen im WWW Manuelle Einbindung von Top-Quellen Automatisierte Einbindung von invisible-web-quellen Einbindung von Web-Verzeichnissen in Suchmaschinen Erschließung des Web mittels Suchmaschinen und Verzeichnissen Web-Verzeichnisse und ihre Integration in Suchmaschinen Erschlieliung der Sites in Web-Verzeichnissen Einbindung der Verzeichnisdaten in Suchmaschinen 206 7

5 13 Verbesserung der Dokumentrepräsentation 13.1 Beschränkung auf den Inhaltsteil der Dokumente 13.2 Erweiterungen der Dokumentrepräsentation S truktu rinf ormationen Größenangaben Abbildungen und Tabellen 13.3 Ersatz für die Nicht-Verwendbarkeit generischer Top-Level-Domains 13.4 Aufbereitung der Suchergebnisse in den Trefferlisten 14 Fazit und Ausblick Literatur Register

Information Retrieval

Information Retrieval Information Retrieval Information Retrieval Uni-Köln Institut für Sprachliche Informationsverarbeitung Computerlinguistik I J. Hermes 13.10.2009 16-17.30h Referenten Adalbert Wrona Klaus Jettkant Klassisches

Mehr

limlhaidftswgirzälhimds

limlhaidftswgirzälhimds limlhaidftswgirzälhimds 1 Einführung 1 1.1 Die Bedeutung der Suchmaschinen 2 1.2 Ein Buch über Google? 6 1.3 Ziel dieses Buchs 7 1.4 Über Suchmaschinen sprechen 8 1.5 Aufbau des Buchs 8 1.6 Aufbau der

Mehr

Inhaltsverzeichnis 1 Einführung 2 Formen der Suche im Web 3 Wie Suchmaschinen funktionieren

Inhaltsverzeichnis 1 Einführung 2 Formen der Suche im Web 3 Wie Suchmaschinen funktionieren Inhaltsverzeichnis 1 Einführung...................................................... 1 1.1 Die Bedeutung der Suchmaschinen............................... 2 1.2 Ein Buch über Google?........................................

Mehr

Reihe Informationswissenschaft der DGI Band 7. herausgegeben von Marlies Ockenfeld

Reihe Informationswissenschaft der DGI Band 7. herausgegeben von Marlies Ockenfeld Reihe Informationswissenschaft der DGI Band 7 herausgegeben von Marlies Ockenfeld 1 2 Dirk Lewandowski Web Information Retrieval Technologien zur Informationssuche im Internet DGI-Schrift (Informationswissenschaft

Mehr

Suchmaschinen und E-Commerce-Sites als Herausforderer der Bibliotheksangebote

Suchmaschinen und E-Commerce-Sites als Herausforderer der Bibliotheksangebote Suchmaschinen und E-Commerce-Sites als Herausforderer der Bibliotheksangebote 94. Deutscher Bibliothekartag, Düsseldorf 2005 Dirk Lewandowski Heinrich-Heine-Universität Düsseldorf, Abt. Informationswissenschaft

Mehr

Suchmaschinen und das Web 2.0

Suchmaschinen und das Web 2.0 Suchmaschinen und das Web 2.0 Prof. Dr. Dirk Lewandowski dirk.lewandowski@haw-hamburg.de Agenda Rechercheverhalten der Suchmaschinennutzer Qualität der Web-Suchmaschinen Web 2.0 Dienste für die Suche Fazit

Mehr

Kapitel 23 Strukturinformationen in Dokumenten. HHU Düsseldorf, WS 2008/09 Information Retrieval 368

Kapitel 23 Strukturinformationen in Dokumenten. HHU Düsseldorf, WS 2008/09 Information Retrieval 368 Kapitel 23 Strukturinformationen in Dokumenten HHU Düsseldorf, WS 2008/09 Information Retrieval 368 Erkennung von Strukturinformationen in Web- Dokumenten Aufgaben: Kreation von Metadaten optimal: Eintragen

Mehr

Alternativen zu Google. Prof. Dr. Dirk Lewandowski

Alternativen zu Google. Prof. Dr. Dirk Lewandowski Alternativen zu Google Prof. Dr. Dirk Lewandowski dirk.lewandowski@haw-hamburg.de Agenda Situation / warum Alternativen zu Google? Lohnt sich die Recherche in anderen Universalsuchmaschinen? Alternative

Mehr

Erfolgreich suchen im Internet

Erfolgreich suchen im Internet Erfolgreich suchen im Internet Steffen-Peter Ballstaedt 05.10.2015 Statistik Weltweit: etwa 1 Milliarde Websites BRD: 15 Millionen Websites Das Internet verdoppelt sich alle 5,32 Jahre Die häufigste Aktivität

Mehr

Suchen, um zu finden. Sta,s,k BRD (Quelle: Comscore, 2013) Beziehungsgeflecht der Suchmaschinen. Antworten auf folgende Fragen: 24.06.

Suchen, um zu finden. Sta,s,k BRD (Quelle: Comscore, 2013) Beziehungsgeflecht der Suchmaschinen. Antworten auf folgende Fragen: 24.06. Suchen, um zu finden Sta,s,k BRD (Quelle: Comscore, 2013) Steffen- Peter Ballstaedt 24.6.2015 etwa 6 Milliarden Suchanfragen pro Monat etwa 2.500 Anfragen pro Sekunde 96% der Suchanfragen über Google Beziehungsgeflecht

Mehr

User Experience vs. Retrievaltests Wie lässt sich die Relevanz von Suchergebnissen bewerten?

User Experience vs. Retrievaltests Wie lässt sich die Relevanz von Suchergebnissen bewerten? User Experience vs. Retrievaltests Wie lässt sich die Relevanz von Suchergebnissen bewerten? Prof. Dr. Dirk Lewandowski Hochschule für Angewandte Wissenschaften Hamburg dirk.lewandowski@haw-hamburg.de

Mehr

Themen und Typen der Suchanfragen an deutsche Web-Suchmaschinen

Themen und Typen der Suchanfragen an deutsche Web-Suchmaschinen Themen und Typen der Suchanfragen an deutsche Web-Suchmaschinen Dr. Dirk Lewandowski Heinrich-Heine-Universität Düsseldorf, Abt. Informationswissenschaft Inhalt 1. Einleitung 2. Themen der Web-Suche 3.

Mehr

Information Retrieval. Peter Kolb

Information Retrieval. Peter Kolb Information Retrieval Peter Kolb Semesterplan Einführung Boolesches Retrievalmodell Volltextsuche, invertierter Index Boolesche Logik und Mengen Vektorraummodell Evaluation im IR Term- und Dokumentrepräsentation

Mehr

Information Retrieval. Überblick

Information Retrieval. Überblick Fachhochschule Köln, Campus Gummersbach Institut für Informatik und Ingenieurwissenschaften Information Retrieval WPF 45 Überblick Prof. Dr. Heide Faeskorn - Woyke Fachhochschule Köln Campus Gummersbach

Mehr

Evaluierung von Suchmaschinen Qualitätsvergleich von Google- und Bing- Suchergebnissen unter besonderer Berücksichtigung von

Evaluierung von Suchmaschinen Qualitätsvergleich von Google- und Bing- Suchergebnissen unter besonderer Berücksichtigung von Evaluierung von Suchmaschinen Qualitätsvergleich von Google- und Bing- Suchergebnissen unter besonderer Berücksichtigung von Universal-Search-Resultaten Information Retrieval: Suchen bzw. Wiederfinden

Mehr

SUCHMASCHINEN VERSTEHEN

SUCHMASCHINEN VERSTEHEN SUCHMASCHINEN VERSTEHEN Prof. Dr. Dirk Lewandowski Hochschule für Angewandte Wissenschaften Hamburg dirk.lewandowski@haw-hamburg.de @Dirk_Lew Stell dir vor, du möchtest folgende Frage mit Hilfe einer Suchmaschine

Mehr

Bewertung von linktopologischen Verfahren als bestimmender Ranking-Faktor bei WWW- Suchmaschinen

Bewertung von linktopologischen Verfahren als bestimmender Ranking-Faktor bei WWW- Suchmaschinen Bewertung von linktopologischen Verfahren als bestimmender Ranking-Faktor bei WWW- Suchmaschinen DIRK LEWANDOWSKI Heinrich-Heine-Universität Düsseldorf Institut für Sprache und Information, Abt. Informationswissenschaft

Mehr

Wie Web 2.0 und Suche zusammenwachsen. Prof. Dr. Dirk Lewandowski dirk.lewandowski@haw-hamburg.de

Wie Web 2.0 und Suche zusammenwachsen. Prof. Dr. Dirk Lewandowski dirk.lewandowski@haw-hamburg.de Wie Web 2.0 und Suche zusammenwachsen Prof. Dr. Dirk Lewandowski dirk.lewandowski@haw-hamburg.de Web search: Always different, always the same AltaVista 1996 1 http://web.archive.org/web/19961023234631/http://altavista.digital.com/

Mehr

Suchmaschinenoptimierung in der Praxis

Suchmaschinenoptimierung in der Praxis Suchmaschinenoptimierung in der Praxis So steigern Sie die Zugriffe auf Ihre Webseite. Frank Jäger, Präsentation am 11. Juni 2010, 1 Überblick Suchmaschinenoptimierung in der Theorie Aufbau der Google-Suchergebnisseite

Mehr

Fit für die Projektarbeit. Thematische Literatursuche in 5 Schritten Quelle: Lotse, Skript zur Thematischen Literatursuche. Stand 1.10.

Fit für die Projektarbeit. Thematische Literatursuche in 5 Schritten Quelle: Lotse, Skript zur Thematischen Literatursuche. Stand 1.10. Fit für die Projektarbeit Thematische Literatursuche in 5 Schritten Quelle: Lotse, Skript zur Thematischen Literatursuche. Stand 1.10.2010 Thematische Literatursuche in 5 Schritten 1. Was suchen Sie? Analysieren

Mehr

Zugang zum Academic Invisible Web

Zugang zum Academic Invisible Web Zugang zum Academic Invisible Web Dr. Dirk Lewandowski Heinrich-Heine-Universität Düsseldorf, Abt. Informationswissenschaft dirk.lewandowski@uni-duesseldorf.de www.durchdenken.de/lewandowski Gliederung

Mehr

Deutsche Suchmaschinen im Vergleich: AltaVista.de, Fireball.de, Google.de und Lycos.de

Deutsche Suchmaschinen im Vergleich: AltaVista.de, Fireball.de, Google.de und Lycos.de Deutsche Suchmaschinen im Vergleich: AltaVista.de, Fireball.de, Google.de und Lycos.de Joachim Griesbaum 1 / Marc Rittberger 2 / Bernard Bekavac 1 1 Universität Konstanz Fach D 87 D-78457 Konstanz 2 Heinrich-Heine-Universität

Mehr

Hauptseminar Information Retrieval. Karin Haenelt Vorschläge für Seminarprojekte

Hauptseminar Information Retrieval. Karin Haenelt Vorschläge für Seminarprojekte Hauptseminar Information Retrieval Vorschläge für Seminarprojekte Karin Haenelt 17.10.2010 Projektarten Implementierungsprojekte: Standardalgorithmen Modellierungsexperimente Vorhandene Werkzeuge studieren,

Mehr

Schubert Foo, Douglas Hendry: for Desktop Searching

Schubert Foo, Douglas Hendry: for Desktop Searching Schubert Foo, Douglas Hendry: Evaluation of Visual Aid Suite for Desktop Searching Sergey Tarassenko Einführung Weltweite Verbreitung von Elektronischen Information Schnelle Entwicklung von Suchmaschinen.

Mehr

Semiautomatische Erweiterung von Topic Maps mit Hilfe von Thesauri und User-Feedback

Semiautomatische Erweiterung von Topic Maps mit Hilfe von Thesauri und User-Feedback Semiautomatische Erweiterung von Topic Maps mit Hilfe von Thesauri und User-Feedback Andreas Bertram andy@asware.net Abstract: Das Semantic Web stellt die nächste Stufe der Evolution des World Wide Web

Mehr

Soziale Suchdienste und Tagging in der Praxis

Soziale Suchdienste und Tagging in der Praxis Soziale Suchdienste und Tagging in der Praxis Status quo und Entwicklungstendenzen Christian Maaß & Dirk Lewandowski Lübeck, 8. September 20 8. September 20 1/23 Warum eigentlich dieser Vortrag? Hintergrund:

Mehr

Von wem wir abhängig sind Über die Auffindbarkeit von Informationen

Von wem wir abhängig sind Über die Auffindbarkeit von Informationen Von wem wir abhängig sind Über die Auffindbarkeit von Informationen Prof. Dr. Dirk Lewandowski Hochschule für Angewandte Wissenschaften Hamburg, Department Information dirk.lewandowski@haw-hamburg.de Agenda

Mehr

Suchmaschinenalgorithmen. Vortrag von: Thomas Müller

Suchmaschinenalgorithmen. Vortrag von: Thomas Müller Suchmaschinenalgorithmen Vortrag von: Thomas Müller Kurze Geschichte Erste Suchmaschine für Hypertexte am CERN Erste www-suchmaschine World Wide Web Wanderer 1993 Bis 1996: 2 mal jährlich Durchlauf 1994:

Mehr

Wer suchet, der findet

Wer suchet, der findet Wer suchet, der findet - Über die Kunst des Suchens - 1 Maik Hetmank W W W as möchte ich wissen? omit soll ich suchen? ie soll ich suchen? 2 Maik Hetmank Was genau möchte ich wissen? Offen Welche Gefahren

Mehr

Formen der Suche im Web

Formen der Suche im Web Formen der Suche im Web 2 Vordergründig mag uns die Suche im Web erst einmal trivial erscheinen: Wir geben eine Suchanfrage ein und erhalten daraufhin eine Suchergebnisseite, auf der wir einen Treffer

Mehr

Information Retrieval in Wikis Wie können klassische Methoden des Information Retrievals die Suchfunktion eines Wikis bereichern?

Information Retrieval in Wikis Wie können klassische Methoden des Information Retrievals die Suchfunktion eines Wikis bereichern? Wie können klassische Methoden des Information Retrievals die Suchfunktion eines Wikis bereichern? Jens Terliesner, Düsseldorf Y o u n g i n f o r m a t i o n P r o f e s s i o n a l s D a y 2 0 0 9 Wikis

Mehr

Was Bibliotheken von Suchmaschinen lernen können. Prof. Dr. Dirk Lewandowski dirk.lewandowski@haw-hamburg.de

Was Bibliotheken von Suchmaschinen lernen können. Prof. Dr. Dirk Lewandowski dirk.lewandowski@haw-hamburg.de Was Bibliotheken von Suchmaschinen lernen können Prof. Dr. Dirk Lewandowski dirk.lewandowski@haw-hamburg.de 1 Dirk Lewandowsk: Was Bibliotheken von Suchmaschinen lernen können Suchmaschinen 2 Dirk Lewandowsk:

Mehr

Hintergrund: Web Search & Ranking in Websuchmaschinen

Hintergrund: Web Search & Ranking in Websuchmaschinen Hintergrund: Web Search & Ranking in Websuchmaschinen Prof. Dr. Dirk Lewandowski Hochschule für Angewandte Wissenschaften Hamburg dirk.lewandowski@haw-hamburg.de @Dirk_Lew LibRank-Abschlussworkshop Hamburg,

Mehr

Effizienzsteigerung durch Kooperation?

Effizienzsteigerung durch Kooperation? Effizienzsteigerung durch Kooperation? die vascoda- Suchmaschinenföderation Ben Burkard (hbz) 98. Deutscher Bibliothekartag 02.-06.06.2009 Gliederung I. vascoda II. Warum Suchmaschinentechnologie? III.Zentrale

Mehr

Internetsuchmaschinen - Kritische Betrachtung von Funktionalität und Leistungsfähigkeit im Vergleich

Internetsuchmaschinen - Kritische Betrachtung von Funktionalität und Leistungsfähigkeit im Vergleich Internetsuchmaschinen - Kritische Betrachtung von Funktionalität und Leistungsfähigkeit im Vergleich Prof. Dr. Dirk Lewandowski Hochschule für Angewandte Wissenschaften Hamburg, Fakultät DMI, Department

Mehr

LIVIVO: Das neue ZB MED-Suchportal für Lebenswissenschaften Jana Pössel. AGMB-Tagung Basel, Seite

LIVIVO: Das neue ZB MED-Suchportal für Lebenswissenschaften Jana Pössel. AGMB-Tagung Basel, Seite LIVIVO: Das neue ZB MED-Suchportal für Lebenswissenschaften Jana Pössel AGMB-Tagung Basel, 08.09.2015 MEDPILOT und GREENPILOT schließen einen Bund fürs Leben: LIVIVO Interdisziplinäre Literatursuche: Datenquellen

Mehr

Suchmaschinen. Anwendung RN Semester 7. Christian Koczur

Suchmaschinen. Anwendung RN Semester 7. Christian Koczur Suchmaschinen Anwendung RN Semester 7 Christian Koczur Inhaltsverzeichnis 1. Historischer Hintergrund 2. Information Retrieval 3. Architektur einer Suchmaschine 4. Ranking von Webseiten 5. Quellenangabe

Mehr

Vorbei die Zeiten von Gebrauchsanweisungen für Bibliotheksportale Nutzerbeteiligung am Beispiel des neuen KOBV-Portals

Vorbei die Zeiten von Gebrauchsanweisungen für Bibliotheksportale Nutzerbeteiligung am Beispiel des neuen KOBV-Portals Vorbei die Zeiten von Gebrauchsanweisungen für Bibliotheksportale Nutzerbeteiligung am Beispiel des neuen KOBV-Portals Seite 1 Seite 2 Seite 3 Das KOBV-Portal Das Projekt K2 Projektseminar und Nutzerbeteiligung

Mehr

Der Kultkatalog, hergestellt mit modernster Technik! München, den

Der Kultkatalog, hergestellt mit modernster Technik! München, den Der Kultkatalog, hergestellt mit modernster Technik! München, den 30.06.2016 Der erste MICHEL! Entstand im Jahre 1909/10.! Er hatte zu dieser Zeit etwa 100 Seiten.! Heute umfasst die Gesamtproduktion etwa

Mehr

In den Tiefen des Webs das Richtige finden

In den Tiefen des Webs das Richtige finden Betriebswirtschaftslehre In den Tiefen des Webs das Richtige finden Information Retrieval: Grundlagenforschung für Suchmaschinen Suchmaschinen wie Google, Yahoo! oder Windows Live sind aus dem Alltag eines

Mehr

Der semantische Discovery Service YEWNO - ein Pilotprojekt an der Bayerischen Staatsbibliothek. Dr. Berthold Gillitzer Bayerische Staatsbibliothek

Der semantische Discovery Service YEWNO - ein Pilotprojekt an der Bayerischen Staatsbibliothek. Dr. Berthold Gillitzer Bayerische Staatsbibliothek 1 Der semantische Discovery Service YEWNO - ein Pilotprojekt an der Bayerischen Staatsbibliothek Dr. Berthold Gillitzer Bayerische Staatsbibliothek Bibliotheken und die digitale Welt sind wir schon angekommen?

Mehr

Computergestützte Freizeitplanung basierend auf Points of Interest

Computergestützte Freizeitplanung basierend auf Points of Interest Computergestützte Freizeitplanung basierend auf Points of Interest Peter Bücker & Ugur Macit {peter.buecker,ugur.macit}@uni-duesseldorf.de Institut für Sprache und Information Abteilung für Informationswissenschaft

Mehr

Data Mining im Internet

Data Mining im Internet Data Mining im Internet Dipl.-Dok. Helga Walter Bayer HealthCare, Wuppertal PH-R-EU Scientific Information and Documentation 1 Arten / Quellen wissenschaftlicher Information Strukturierte Informationen:

Mehr

Möglichkeiten und Grenzen der Wissenschaftssuchmaschine Google Scholar. Prof. Dr. Dirk Lewandowski

Möglichkeiten und Grenzen der Wissenschaftssuchmaschine Google Scholar. Prof. Dr. Dirk Lewandowski Möglichkeiten und Grenzen der Wissenschaftssuchmaschine Google Scholar Prof. Dr. Dirk Lewandowski dirk.lewandowski@haw-hamburg.de Anspruch von Google Scholar Goal: Best possible scholarly search. Idea:

Mehr

Suchmaschinen im Internet

Suchmaschinen im Internet Michael Glöggler Suchmaschinen im Internet Funktionsweisen, Ranking Methoden, Top Positionen Mit 47 Abbildungen und 25 n Springer Inhaltsverzeichnis 1 Überblick Suchdienste im World Wide Web 1 1.1 Webkataloge

Mehr

Fit für die Projektarbeit. Thematische Literatursuche in 5 Schritten Basiert auf: Lotse, Skript zur Thematischen Literatursuche. Stand 1.10.

Fit für die Projektarbeit. Thematische Literatursuche in 5 Schritten Basiert auf: Lotse, Skript zur Thematischen Literatursuche. Stand 1.10. Fit für die Projektarbeit Thematische Literatursuche in 5 Schritten Basiert auf: Lotse, Skript zur Thematischen Literatursuche. Stand 1.10.2010 Thematische Literatursuche in 5 Schritten 1. Was suchen Sie?

Mehr

Information Retrieval

Information Retrieval Reginald Ferber Information Retrieval Suchmodelle und Data-Mining-Verfahren für Textsammlungen und das Web d p u n kt.ver I ag Inhaltsverzeichnis I Grundlagen und klassische IR-Methoden 1 1 1.1 1.2 1.3

Mehr

Integration von Web-Verzeichnissen in algorithmische Suchmaschinen

Integration von Web-Verzeichnissen in algorithmische Suchmaschinen Integration von Web-Verzeichnissen in algorithmische Suchmaschinen Dirk Lewandowski, Düsseldorf 1 Einleitung Suchmaschinen sind bemüht, den Nutzern möglichst hochwertige Ergebnisse zu liefern. Dass dies

Mehr

Kapitel 8 Typologie von Retrievalsystemen

Kapitel 8 Typologie von Retrievalsystemen Kapitel 8 Typologie von Retrievalsystemen HHU Düsseldorf, WS 2008/09 Information Retrieval 115 nach Medienform der Dokumente: textuelle Dokumente strukturierte Dokumente schwach strukturierte Dokumente:

Mehr

Die Startseite der Datenbank im Netz lautet

Die Startseite der Datenbank im Netz lautet 1 Hilfe VITIS-VEA ist eine internationale englischsprachige Literaturdatenbank im Weinbau auf den Gebieten Morphologie, Physiologie, Biochemie der Rebe, Bodenkunde, Genetik und Rebenzüchtung, Phytopathologie

Mehr

Bibliotheken vs. Google? Literaturrecherche im Internet

Bibliotheken vs. Google? Literaturrecherche im Internet Bibliotheken vs. Google? Literaturrecherche im Internet Wer braucht noch Bibliotheken im Internet? Quelle: OCLC: Perceptions of Libraries, 2010: Context and Community Google ist kein Register des Internets

Mehr

Wörter - Texte - Information. Möglichkeiten und Grenzen automatischer Erschließungsverfahren

Wörter - Texte - Information. Möglichkeiten und Grenzen automatischer Erschließungsverfahren Wörter - Texte - Information Möglichkeiten und Grenzen automatischer Erschließungsverfahren Automatische Indexierung - Einführung 1 Indexieren und Automatisches Indexieren Dokumente Volltexte bibliografische

Mehr

Suchmaschinen. Bachelor Informationsmanagement / Modul Digitale Bibliothek (SS 2014) Dr. Jakob Voß

Suchmaschinen. Bachelor Informationsmanagement / Modul Digitale Bibliothek (SS 2014) Dr. Jakob Voß Suchmaschinen Bachelor Informationsmanagement Modul Digitale Bibliothek (SS 2014) Dr Jakob Voß 2014-03-31 Suchmaschinen (1/39) CC-BY-SA / 2014-03-31 / Dr Jakob Voß Eingangsfrage: Wie funktioniert Google?

Mehr

Nur die ersten Drei zählen! - Erfolgsfaktoren beim Betrieb von Discovery Systeme. Dr. Elmar Haake Staats- und Universitätsbibliothek Bremen

Nur die ersten Drei zählen! - Erfolgsfaktoren beim Betrieb von Discovery Systeme. Dr. Elmar Haake Staats- und Universitätsbibliothek Bremen Nur die ersten Drei zählen! - Erfolgsfaktoren beim Betrieb von Discovery Systeme Dr. Elmar Haake Staats- und Universitätsbibliothek Bremen Deutscher Bibliothekartag 3.-6.6.2014 1 Relevanzranking als Erfolgsfaktor

Mehr

Recherchieren im Internet: Wie funktionieren Suchmaschinen? Steffen-Peter Ballstaedt

Recherchieren im Internet: Wie funktionieren Suchmaschinen? Steffen-Peter Ballstaedt Recherchieren im Internet: Wie funktionieren Suchmaschinen? Steffen-Peter Ballstaedt Vortrag vor dem Genealogischen Arbeitskreis Tübingen am 17.2.2016 Zahlen und Fakten 82% der Computernutzer suchen, 79%

Mehr

Was Google nicht findet gibt es nicht

Was Google nicht findet gibt es nicht Was Google nicht findet gibt es nicht Zur (Un-)Zulässigkeit der Treffer-Optimierung bei Suchmaschinen im Web 3.0 Dr. Hans Peter Wiesemann 5. Dialog Camp München, 19. Februar 2016 A. Einleitung A. Einleitung

Mehr

Bachelorarbeit. Markus Günther. vorgelegt von. Studiengang Bibliotheks- und Informationsmanagement DEPARTMENT INFORMATION

Bachelorarbeit. Markus Günther. vorgelegt von. Studiengang Bibliotheks- und Informationsmanagement DEPARTMENT INFORMATION DEPARTMENT INFORMATION Bachelorarbeit Evaluierung von Suchmaschinen Qualitätsvergleich von Google- und Bing-Suchergebnissen unter besonderer Berücksichtigung von Universal-Search-Resultaten vorgelegt von

Mehr

Bewertung von linktopologischen Verfahren als bestimmender Ranking-Faktor bei WWW- Suchmaschinen

Bewertung von linktopologischen Verfahren als bestimmender Ranking-Faktor bei WWW- Suchmaschinen Bewertung von linktopologischen Verfahren als bestimmender Ranking-Faktor bei WWW- Suchmaschinen DIRK LEWANDOWSKI Heinrich-Heine-Universität Düsseldorf Institut für Sprache und Information, Abt. Informationswissenschaft

Mehr

Studienprojekt TaxoSearch Spezifikation

Studienprojekt TaxoSearch Spezifikation Studienprojekt TaxoSearch Spezifikation Semantisch gestützte Suche im Internet Lehrstuhl für Computerlinguistik Ruprecht-Karls-Universität Heidelberg WS 2002-2003 vorgestellt von Thorsten Beinhorn, Vesna

Mehr

Information Retrieval Einführung

Information Retrieval Einführung Information Retrieval Einführung Kursfolien Karin Haenelt 22.7.2015 Themen Traditionelles Konzept / Erweitertes Konzept Auffinden von Dokumenten Rankingfunktionen Auffinden und Aufbereiten von Information

Mehr

Informationssysteme für Ingenieure

Informationssysteme für Ingenieure Informationssysteme für Ingenieure Vorlesung Herbstsemester 2016 Überblick und Organisation R. Marti Organisation Web Site: http://isi.inf.ethz.ch Dozent: Robert Marti, martir ethz.ch Assistenz:??

Mehr

Advanced Topics in Databases The Anatomy of a Large-Scale Hypertextual Web Search Engine

Advanced Topics in Databases The Anatomy of a Large-Scale Hypertextual Web Search Engine Advanced Topics in Databases The Anatomy of a Large-Scale Hypertextual Web Search Engine Hasso-Plattner-Institut Potsdam Fachgebiet Informationssysteme Markus Güntert WS 2008/2009 20.01.2009 1 The Anatomy

Mehr

Unbeschränkter Zugang zu Wissen?

Unbeschränkter Zugang zu Wissen? Unbeschränkter Zugang zu Wissen? Leistungsfähigkeit und Grenzen von Suchdiensten im Web. Zwischen informationeller Absicherung und manipulierter Information Joachim Griesbaum Informationswissenschaft Universität

Mehr

Teil 4. Aufbau von Datenbanken. Universitätsbibliothek Chemnitz - AG Informationskompetenz

Teil 4. Aufbau von Datenbanken. Universitätsbibliothek Chemnitz - AG Informationskompetenz Teil 4 Datenbanken I Aufbau von Datenbanken 30.08.2007 Überblick 1. Abfrage der Hausaufgabe: Erstellen einer Themenanalyse 2. Wiederholung Thematische Literaturrecherche: Was suche ich? 3. Thematische

Mehr

Boole sches Retrieval als frühes, aber immer noch verbreitetes IR-Modell mit zahlreichen Erweiterungen

Boole sches Retrieval als frühes, aber immer noch verbreitetes IR-Modell mit zahlreichen Erweiterungen Rückblick Boole sches Retrieval als frühes, aber immer noch verbreitetes IR-Modell mit zahlreichen Erweiterungen Vektorraummodell stellt Anfrage und Dokumente als Vektoren in gemeinsamen Vektorraum dar

Mehr

Bücher und Artikel zum Thema

Bücher und Artikel zum Thema Materialsammlung zur Implementierung von Information Retrieval Systemen Karin Haenelt 11.12.2005/11.12.2004/06.12.2003/10.11.2002 1 Bücher und Artikel zum Thema Frakes/Baeza-Yates, 1992 Baeza-Yates/Ribeiro-Neto,

Mehr

Materialsammlung zur Implementierung von Information Retrieval Systemen

Materialsammlung zur Implementierung von Information Retrieval Systemen Materialsammlung zur Implementierung von Information Retrieval Systemen Karin Haenelt 11.12.2005/11.12.2004/06.12.2003/10.11.2002 1 Bücher und Artikel zum Thema Frakes/Baeza-Yates, 1992 Baeza-Yates/Ribeiro-Neto,

Mehr

PubMed: Suchergebnisse verbessern und verfeinern

PubMed: Suchergebnisse verbessern und verfeinern PubMed: Suchergebnisse verbessern und verfeinern Henriette Senst M.A. (LIS), Robert Koch-Institut, Berlin Fortbildung für den Öffentlichen Gesundheitsdienst 2016 Pubmed Wichtigste internationale bibliographische

Mehr

Seite 1. Effektive Suche im Internet / in Datenbanken (mit Beispielen) Stand: März Probleme bei der Informationssuche im Internet

Seite 1. Effektive Suche im Internet / in Datenbanken (mit Beispielen) Stand: März Probleme bei der Informationssuche im Internet Seite 1 Probleme bei der Informationssuche im Internet Fehlende Organisation keine zentrale Koordination / Kontrolle; + Vielfalt von Angeboten, leichter Zugang für alle Fehlende Strukturierung +- verschiedene

Mehr

die Relevanz von Webseiten bestimmt Alexander Pohl

die Relevanz von Webseiten bestimmt Alexander Pohl Wie die Relevanz von Webseiten bestimmt Alexander Pohl Gliederung 1. Einleitung 2. Das Web als Graph 3. Das Random Surfer Modell 4. Gleichgewicht im Random Surfer Modell (?) 5. Vervollständigung des Modells:

Mehr

Online-Recherche: Web-Recherche WS 2015/2016 4. Veranstaltung 5. November 2015

Online-Recherche: Web-Recherche WS 2015/2016 4. Veranstaltung 5. November 2015 Online-Recherche: Web-Recherche WS 2015/2016 4. Veranstaltung 5. November 2015 Philipp Schaer - philipp.schaer@gesis.org Philipp Mayr - philipp.mayr@gesis.org GESIS Leibniz-InsJtut für SozialwissenschaNen

Mehr

Google, Deep Web und Fachdatenbanken. Dirk Lewandowski dirk.lewandowski@haw-hamburg.de

Google, Deep Web und Fachdatenbanken. Dirk Lewandowski dirk.lewandowski@haw-hamburg.de Google, Deep Web und Fachdatenbanken Dirk Lewandowski dirk.lewandowski@haw-hamburg.de Vision Eine Datenbank die alle Themenbereiche abdeckt, eine optimale Recherche erlaubt, leicht zu bedienen ist, die

Mehr

Inhalt. 1 Einführung... 11. 2 Funktionsweise von Suchmaschinen... 21. 3 So werden Suchergebnisse gewichtet... 39

Inhalt. 1 Einführung... 11. 2 Funktionsweise von Suchmaschinen... 21. 3 So werden Suchergebnisse gewichtet... 39 1 Einführung.......................................................... 11 1.1 Eine kurze Geschichte von fast allem.................................. 12 1.2 Die Bedeutung von Suchmaschinen gestern, heute

Mehr

Lucene eine Demo. Sebastian Marius Kirsch 9. Februar 2006

Lucene eine Demo. Sebastian Marius Kirsch 9. Februar 2006 Lucene eine Demo Sebastian Marius Kirsch skirsch@luusa.org 9. Februar 2006 Text Retrieval wie funktioniert das? Aufgabe: Finde zu Stichwörtern die passenden Dokumente Sortiere sie nach Relevanz zur Suchanfrage.

Mehr

Vorbei die Zeiten von Gebrauchsanweisungen für Bibliotheksportale Nutzerbeteiligung am Beispiel des neuen KOBV-Portals

Vorbei die Zeiten von Gebrauchsanweisungen für Bibliotheksportale Nutzerbeteiligung am Beispiel des neuen KOBV-Portals Vorbei die Zeiten von Gebrauchsanweisungen für Bibliotheksportale Nutzerbeteiligung am Beispiel des neuen KOBV-Portals Seite 1 Seite 2 Seite 3 Der KOBV Das KOBV-Portal Das Projekt K2 Projektseminar an

Mehr

Möglichkeiten und Grenzen der Wissenschaftssuchmaschine Google Scholar

Möglichkeiten und Grenzen der Wissenschaftssuchmaschine Google Scholar Möglichkeiten und Grenzen der Wissenschaftssuchmaschine Google Scholar Prof. Dr. Dirk Lewandowski dirk.lewandowski@bui.haw-hamburg.de Anspruch von Google Scholar Goal: Best possible scholarly search. Idea:

Mehr

Tipps und Tricks der Suchmaschinenoptimierung

Tipps und Tricks der Suchmaschinenoptimierung Tipps und Tricks der Suchmaschinenoptimierung Thomas Kleinert Institut für Wirtschaftsinformatik (IWi) im DFKI 16. Juli 2014 Agenda Was ist Suchmaschinenmarketing? Wie arbeiten Suchmaschinen? On-Page Optimierung

Mehr

Suchmaschinen, Datenbanken, Virtuelle Fachbibliotheken. Rechts- und Verwaltungsinformationen

Suchmaschinen, Datenbanken, Virtuelle Fachbibliotheken. Rechts- und Verwaltungsinformationen Recherche im WWW Online-Recherche Suchmaschinen, Datenbanken, Virtuelle Fachbibliotheken Rechts- und Verwaltungsinformationen EU- und nationales Recht RSS-Feeds Wissenstreppe Wissen Geldmarkthandel Daten

Mehr

Suchmaschinenwerbung: Sponsored Links als Geschäftsmodell der Suchwerkzeuge

Suchmaschinenwerbung: Sponsored Links als Geschäftsmodell der Suchwerkzeuge Chang Kaiser Suchmaschinenwerbung: Sponsored Links als Geschäftsmodell der Suchwerkzeuge Mit einer Fallstudie über chinesische Suchdienste Verlag Dr. Kovac Hamburg 2010 Inhalt Abbildungsverzeichnis 11

Mehr

Real Time Suche Dirk Lewandowski Einleitung

Real Time Suche Dirk Lewandowski Einleitung RealTimeSuche DirkLewandowski Hochschule für Angewandte Wissenschaften Hamburg, Fakultät DMI, Department Information,BerlinerTor5,20099Hamburg.dirk.lewandowski@haw hamburg.de Einleitung Twitter, Facebook

Mehr

Volltextsuche und Text Mining

Volltextsuche und Text Mining Volltextsuche und Text Mining Seminar: Einfuehrung in die Computerlinguistik Dozentin: Wiebke Petersen by Rafael Cieslik 2oo5-Jan-2o 1 Gliederung 1. Volltextsuche 1. Zweck 2. Prinzip 1. Index 2. Retrieval

Mehr

Web-Suchmaschinen: Suchverhalten, Informationsqualität, Trends. Prof. Dr. Dirk Lewandowski dirk.lewandowski@haw-hamburg.de

Web-Suchmaschinen: Suchverhalten, Informationsqualität, Trends. Prof. Dr. Dirk Lewandowski dirk.lewandowski@haw-hamburg.de Web-Suchmaschinen: Suchverhalten, Informationsqualität, Trends Prof. Dr. Dirk Lewandowski dirk.lewandowski@haw-hamburg.de Agenda Nutzerverhalten Wie gut sind die gängigen Suchmaschinen? Suche und Web 2.0

Mehr

Das Wissen und die Erfahrung Ihres Unternehmens nutzbar machen.

Das Wissen und die Erfahrung Ihres Unternehmens nutzbar machen. Das Wissen und die Erfahrung Ihres Unternehmens nutzbar machen. Herausforderungen im Service Fünf Schritte des Erfolgs - Sinkende 1st-Call-Fix-Rate - Zunehmende Komplexität der Produkte - Ständiger Kostendruck

Mehr

Website-Suche mit OpenText Web Site Management. Frank Steffen - Senior Product Manager

Website-Suche mit OpenText Web Site Management. Frank Steffen - Senior Product Manager Website-Suche mit OpenText Web Site Management Frank Steffen - Senior Product Manager Inhalt Überblick Konzepte der Suchmaschinenanbindung Verity K2 Anbindung Der neue OT Search Engine Connector Federated

Mehr

Relevance Ranking Revisited Mischen unterschiedlicher Quellen in VuFind

Relevance Ranking Revisited Mischen unterschiedlicher Quellen in VuFind Relevance Ranking Revisited Mischen unterschiedlicher Quellen in VuFind 3. VuFind Anwendertreffen 2014 Frankfurt Stefan Winkler Anfragen im Support Warum kommt bei meiner Suche ein Dokument an dieser Stelle?

Mehr

Web-Suche im Umbruch? Entwicklungstendenzen bei Web- Suchdiensten

Web-Suche im Umbruch? Entwicklungstendenzen bei Web- Suchdiensten Web-Suche im Umbruch? Entwicklungstendenzen bei Web- Suchdiensten Joachim Griesbaum Bernard Bekavac Universität Konstanz HTW Chur Informationswissenschaft Hochschule für Technik und Wirtschaft Fach D 87

Mehr

I N T E R N E T. Einsteigerkurs. Teil 6 Suchmaschinen

I N T E R N E T. Einsteigerkurs. Teil 6 Suchmaschinen I N T E R N E T Einsteigerkurs Teil 6 Definition(Wikipedia) Teil 6 Was ist eine Suchmaschine? Eine Suchmaschineist ein Programm zur Recherche von Dokumenten, die in einem Computer oder einem Computernetzwerk

Mehr

SUCHMASCHINEN XAPIAN. Michael Strzempek FH Wiesbaden, 5. Juni 2008

SUCHMASCHINEN XAPIAN. Michael Strzempek FH Wiesbaden, 5. Juni 2008 SUCHMASCHINEN XAPIAN Michael Strzempek FH Wiesbaden, 5. Juni 2008 INHALT 1. Motivation 2. Prinzip / Vokabular 3. Xapian 4. Omega 5. Datenbank Indizierung 6. Levenshtein Distanz 7. Boolesche Suche 8. Probabilistische

Mehr

Deep Web Suchen wir was man finden könnte?

Deep Web Suchen wir was man finden könnte? Deep Web Suchen wir was man finden könnte? Dr. Dirk Lewandowski dirk.lewandowski@uni-duesseldorf.de www.durchdenken.de/lewandowski Gliederung Die Bedeutung des Deep Web Die Größe des Deep Web Strategien

Mehr

Leitfaden: Journal Impact Factor (JIF) im Web of Science (WoS) ermitteln

Leitfaden: Journal Impact Factor (JIF) im Web of Science (WoS) ermitteln Leitfaden: Journal Impact Factor (JIF) im Web of Science (WoS) ermitteln Hochschulbibliothek Dezernat Hochschulschriften Januar 2012 Inhalt Definition Journal Impact Factor (JIF) Anleitung zur Ermittlung

Mehr

Die Suche nach wissenschaftlicher Information in der Physik - nicht nur über GOOGLE

Die Suche nach wissenschaftlicher Information in der Physik - nicht nur über GOOGLE Die Suche nach wissenschaftlicher Information in der Physik - nicht nur über GOOGLE Detlef Görlitz www.physik.uni hamburg.de Die Suche nach wissenschaftlicher Information in der Physik - nicht nur über

Mehr

dacore Datenbanksysteme AG Neue Konzepte zur Optimierung der Auslastungsplanung und Big Data im Informationsmanagement

dacore Datenbanksysteme AG Neue Konzepte zur Optimierung der Auslastungsplanung und Big Data im Informationsmanagement dacore Datenbanksysteme AG Neue Konzepte zur Optimierung der Auslastungsplanung und Big Data im Informationsmanagement dacore Datenbanksysteme AG Neue Konzepte zur Optimierung der Auslastungsplanung Die

Mehr

Prototypische Entwicklung einer Software für die Erfassung und Analyse explorativer Suchen in Verbindung mit Tests zur Retrievaleffektivität

Prototypische Entwicklung einer Software für die Erfassung und Analyse explorativer Suchen in Verbindung mit Tests zur Retrievaleffektivität SWIF 2012: 08. 10. November 2012 Session 4 All about Search Suchmaschinen und ihre Evaluierung Prototypische Entwicklung einer Software für die Erfassung und Analyse explorativer Suchen in Verbindung mit

Mehr

Vom Suchen und Finden - Google und andere Ansätze

Vom Suchen und Finden - Google und andere Ansätze Vom Suchen und Finden - Google und andere Ansätze Norbert Fuhr Universität Duisburg Essen FB Ingenieurwissenschaften Abteilung Informatik 12. Mai 2005 Gliederung 1 Einführung 2 Grundlagen 3 Erweiterte

Mehr

Vorgehen bei der Informationssuche

Vorgehen bei der Informationssuche Vorgehen bei der Informationssuche Hüseyin Colak April 25, 2007 Hüseyin Colak () Vorgehen bei der Informationssuche April 25, 2007 1 / 15 Inhaltsverzeichnis 1 Einleitung 2 Projekt IKommHelp 3 Hilfestellung

Mehr