Information Retrieval

Größe: px
Ab Seite anzeigen:

Download "Information Retrieval"

Transkript

1 Information Retrieval

2 Information Retrieval Uni-Köln Institut für Sprachliche Informationsverarbeitung Computerlinguistik I J. Hermes h Referenten Adalbert Wrona Klaus Jettkant

3 Klassisches Information Retrieval Definition und Einführung Entwicklungen Arten von Datenbanken Terme und Indexierung Lemmatisierung und Stemming Retrieval Modelle Web Information Retrieval Die Größe des Web und seine Abdeckung durch Suchmaschinen Strukturinformationen Anwendung klassischer Verfahren des IR bei Suchmaschinen Ranking Informationsstatistische und Informationslinguistische Verfahren Linktopologische Rankingverfahren

4 Klassisches Information Retrieval Definition und Einführung Entwicklungen Arten von Datenbanken Terme und Indexierung Lemmatisierung und Stemming Retrieval Modelle Web Information Retrieval Die Größe des Web und seine Abdeckung durch Suchmaschinen Strukturinformationen Anwendung klassischer Verfahren des IR bei Suchmaschinen Ranking Informationsstatistische und Informationslinguistische Verfahren Linktopologische Rankingverfahren

5 Klassisches Information Retrieval Definition und Einführung Entwicklungen Arten von Datenbanken Terme und Indexierung Lemmatisierung und Stemming Retrieval Modelle Web Information Retrieval Die Größe des Web und seine Abdeckung durch Suchmaschinen Strukturinformationen Anwendung klassischer Verfahren des IR bei Suchmaschinen Ranking Informationsstatistische und Informationslinguistische Verfahren Linktopologische Rankingverfahren

6 Definition und Einführung Information Retrieval ist gezieltes Abrufen von Information aus unstrukturiertem Material (gewöhlich Dokumente), dass in großen Sammlungen gespeichert ist (gewöhnlich auf Rechnern) alle Verfahren, die mit der Aufbereitung, Speicherung und Wiedergewinnung (Recherche) von Wissen (Texte, Fakten) zu tun haben

7

8 Definition und Einführung Konzepte Vagheit: Der Benutzer kann sein "diffuses" Informationsbedürfnis nicht präzise und formal ausdrücken. Die Anfrage enthält daher vage Bedingungen. Unsicherheit: Dem System fehlen Kenntnisse über den Inhalt der Dokumente. Dies führt zu fehlerhaften und fehlenden Antworten. Probleme bei Texten bereiten z. B. Homographe (Wörter, die gleich geschrieben werden; z. B. Bank - Geldinstitut, Sitzgelegenheit) und Synonyme (Bank und Geldinstitut)

9 Klassisches Information Retrieval Definition und Einführung Entwicklungen Arten von Datenbanken Terme und Indexierung Lemmatisierung und Stemming Retrieval Modelle Web Information Retrieval Die Größe des Web und seine Abdeckung durch Suchmaschinen Strukturinformationen Anwendung klassischer Verfahren des IR bei Suchmaschinen Ranking Informationsstatistische und Informationslinguistische Verfahren Linktopologische Rankingverfahren

10 Entwicklungen Vier Entwicklungen haben das Aufkommen des Information Retrieval in Online Datenbanken im wesentlichen beeinflusst: 1. Wachsende Anerkennung der Bedeutung von Information (Sputnik-Schock) 2. Digitalisierung von Referatorganen, Schriftstücken 3. Entwicklung im Computerbereich: 4. Entwicklung der Telekommunikationsnetze

11 Klassisches Information Retrieval Definition und Einführung Entwicklungen Arten von Datenbanken Terme und Indexierung Lemmatisierung und Stemming Retrieval Modelle Web Information Retrieval Die Größe des Web und seine Abdeckung durch Suchmaschinen Strukturinformationen Anwendung klassischer Verfahren des IR bei Suchmaschinen Ranking Informationsstatistische und Informationslinguistische Verfahren Linktopologische Rankingverfahren

12 Arten von Datenbanken Referenz- oder Literatur-DB Volltext-DB Fakten-DB

13 Klassisches Information Retrieval Definition und Einführung Entwicklungen Arten von Datenbanken Terme und Indexierung Lemmatisierung und Stemming Retrieval Modelle Web Information Retrieval Die Größe des Web und seine Abdeckung durch Suchmaschinen Strukturinformationen Anwendung klassischer Verfahren des IR bei Suchmaschinen Ranking Informationsstatistische und Informationslinguistische Verfahren Linktopologische Rankingverfahren

14 Terme und Indexierung Terme Deskriptoren Indexierung Thesaurus Relationen Weitere Merkmale

15 Klassisches Information Retrieval Definition und Einführung Entwicklungen Arten von Datenbanken Terme und Indexierung Lemmatisierung und Stemming Retrieval Modelle Web Information Retrieval Die Größe des Web und seine Abdeckung durch Suchmaschinen Strukturinformationen Anwendung klassischer Verfahren des IR bei Suchmaschinen Ranking Informationsstatistische und Informationslinguistische Verfahren Linktopologische Rankingverfahren

16 Lemmatisierung / Stemming Grundformenreduktion Stammformenreduktion

17 Klassisches Information Retrieval Definition und Einführung Entwicklungen Arten von Datenbanken Terme und Indexierung Lemmatisierung und Stemming Retrieval Modelle Web Information Retrieval Die Größe des Web und seine Abdeckung durch Suchmaschinen Strukturinformationen Anwendung klassischer Verfahren des IR bei Suchmaschinen Ranking Informationsstatistische und Informationslinguistische Verfahren Linktopologische Rankingverfahren

18 Retrieval Modelle Mengentheoretische Modelle: Boolsche Logik Algebraische Modelle: Vektor-Raum-Modelle Probabilistische Modelle: stochastische Verfahren, Abstufung über Wahrscheinlichkeiten (z.b. Inferenznetze)

19 Retrieval Modelle Das Boolesche Retrieval OR Es werden die Dokumente gefunden, die entweder Element der Menge 1 oder Element der Menge 2 oder Element beider Mengen sind AND Es werden die Dokumente gefunden, die sowohl Element der Menge 1 als auch Element der Menge 2 sind

20 Retrieval Modelle Das Boolesche Modell NOT Es werden die Dokumente gefunden, die Element der Menge 1, aber nicht Element der Menge 2 sind

21 Retrieval Modelle Das erweiterte Boolesche Retrieval Werte werden mathematisch über einem Interval [0,1] definiert, wobei null für "falsch", eins für "wahr" steht.

22 Retrieval Modelle Grenzen und Nachteile der Booleschen Recherche

23 Klassisches Information Retrieval Definition und Einführung Entwicklungen Arten von Datenbanken Terme und Indexierung Lemmatisierung und Stemming Retrieval Modelle Web Information Retrieval Die Größe des Web und seine Abdeckung durch Suchmaschinen Strukturinformationen Anwendung klassischer Verfahren des IR bei Suchmaschinen Ranking Informationsstatistische und Informationslinguistische Verfahren Linktopologische Rankingverfahren

24 Klassisches Information Retrieval Definition und Einführung Entwicklungen Arten von Datenbanken Terme und Indexierung Lemmatisierung und Stemming Retrieval Modelle Web Information Retrieval Die Größe des Web und seine Abdeckung durch Suchmaschinen Strukturinformationen Anwendung klassischer Verfahren des IR bei Suchmaschinen Ranking Informationsstatistische und Informationslinguistische Verfahren Linktopologische Rankingverfahren

25 Die Größe des Web und seine Abdeckung durch Suchmaschinen Die Betreiber von Suchmaschinen werben in der Regel damit "The Worlds Information" (Google) zugänglich zu machen.

26 Die Größe des Web und seine Abdeckung durch Suchmaschinen Indexierte Dokumente 2004/2005 Google: ~8 Mrd. Dokumente MSN: ~5 Mrd. Dokumente Yahoo: ~5 Mrd. Dokumente Teoma: ~2,5 Mrd. Dokumente

27 Die Größe des Web und seine Abdeckung durch Suchmaschinen Indexierte Dokumente 2005 Yahoo: 20 Mrd Dokumente Google: etwa drei mal so viel Seitdem sind keine Angaben über Indexgrößen veröffentlicht mehr worden.

28 Klassisches Information Retrieval Definition und Einführung Entwicklungen Arten von Datenbanken Terme und Indexierung Lemmatisierung und Stemming Retrieval Modelle Web Information Retrieval Die Größe des Web und seine Abdeckung durch Suchmaschinen Strukturinformationen Anwendung klassischer Verfahren des IR bei Suchmaschinen Ranking Informationsstatistische und Informationslinguistische Verfahren Linktopologische Rankingverfahren

29 Strukturinformationen Für die Erschließung von Web-Dokumenten ist die Einbeziehung der Dokumentstruktur von besonderer Bedeutung.

30 Strukturinformationen Unterscheidung der Dokumente aufgrund ihrer Struktur nach Free Text (Fließtext) Structured Text (strukturierter Text) Semistructured Text (schwach strukturierter Text)

31 Strukturinformationen Explizit inhaltsbeschreibende HTML-Tags HTML-Tags, die zur Extraktion von Strukturinformationen eingesetzt werden können abbr acronym address blockquote cite code usw. Abkürzung Akronym Adresse abgesetztes Zitat Zitat Quellcode b big, small br font size hr i usw. fett größere/kleinere Schrift in Relation Zeilenumbruch Schriftgröße Trennlinie kursiv

32 Strukturinformationen In den Datenbanken der Suchmaschinen werden die Dokumente (dokumentarische Bezugseinheit - DBE) durch einen Repräsentanten (Dokumentationseinheit) repräsentiert.

33 Klassisches Information Retrieval Definition und Einführung Entwicklungen Arten von Datenbanken Terme und Indexierung Lemmatisierung und Stemming Retrieval Modelle Web Information Retrieval Die Größe des Web und seine Abdeckung durch Suchmaschinen Strukturinformationen Anwendung klassischer Verfahren des IR bei Suchmaschinen Ranking Informationsstatistische und Informationslinguistische Verfahren Linktopologische Rankingverfahren

34 Anwendung klassischer Verfahren des IR bei Suchmaschinen Die Unterschiede zwischen klassischem Information Retrieval und Web Retrieval lassen sich in vier Klassen unterteilen: Dokumentenkorpus Inhalt Nutzer Eigenarten des IR-Systems

35 Anwendung klassischer Verfahren des IR bei Suchmaschinen Bei der automatischen Erschließung der Web-Suchmaschinen bleibt stets die Frage offen, ob auch wirklich alle relevante Information gefunden wurde und ob Dokumente ausgeschlossen werden, die als qualitativ nicht relevant angesehen werden können.

36 Anwendung klassischer Verfahren des IR bei Suchmaschinen Boolesche Retrievalsysteme kostengünstige Umsetzung (AND, OR, AND NOT) Implementiert in Interfaces der Suchmaschinen dennoch keine wirkliche Boolesche Suche

37 Anwendung klassischer Verfahren des IR bei Suchmaschinen Vektorraummodell sucht nach Ähnlichkeiten zwischen Dokumenten und Suchanfrage Abfrageterme und Dokumente als Vektor Gemeinsamkeiten als Kosinus des Winkels zwischen den Vektoren

38 Anwendung klassischer Verfahren des IR bei Suchmaschinen Vektorraummodell

39 Anwendung klassischer Verfahren des IR bei Suchmaschinen Wie man anhand der Eigenschaften des Booleschen und des Vektorraum orientierten Modell sieht, setzen die Betreiber Mischformen von Modellen ein, wie zum Beispiel auch das erweiterte Boolesche Modell, welches um Wertigkeiten von Suchtermen erweitert wurde.

40 Anwendung klassischer Verfahren des IR bei Suchmaschinen Das probalistische Modell Wahrscheinlichkeitsermittlung der Relevanz Ähnlichkeit zwischen der Anfrage und dem Dokument Ähnlichkeitswert abhängig von der Häufigkeit der Suchbegriffe im Dokument

41 Klassisches Information Retrieval Definition und Einführung Entwicklungen Arten von Datenbanken Terme und Indexierung Lemmatisierung und Stemming Retrieval Modelle Web Information Retrieval Die Größe des Web und seine Abdeckung durch Suchmaschinen Strukturinformationen Anwendung klassischer Verfahren des IR bei Suchmaschinen Ranking Informationsstatistische und Informationslinguistische Verfahren Linktopologische Rankingverfahren

42 Ranking Rankingverfahren sollen erreichen, dass Dokumente innerhalb einer Trefferliste so sortiert werden das die relevantesten Dokumente oben stehen.

43 Ranking Anfrageabhängige Faktoren Worthäufigkeiten Position der Suchbegriffe im Dokument Anfrageunabhängige Faktoren Bestimmung der Qualität bzw. die Autorität eines Dokuments unabhängig von einer Suchanfrage

44 Ranking Anfrageabhängige Faktoren im Ranking: Dokumentspezifische Wortgewichtung (WDF Wortabstand Position der Suchbegriffe Reihenfolge der Suchbegriffe in der Anfrage Metatags Stellung der Suchbegriffe innerhalb des Dokuments Betonung von Begriffen durch HTML-Elemente Groß-/Kleinschreibung Inverse Dokumenthäufigkeit (IDF) Ankertext Sprache- Geo-Targeting.

45 Ranking Anfrageunabhängige Faktoren im Ranking Verzeichnisebene Anzahl eingehende Links Linkpopularität Klickhäufigkeit Aktualität Dokumentlänge Dateiformat Größe der Site

46 Klassisches Information Retrieval Definition und Einführung Entwicklungen Arten von Datenbanken Terme und Indexierung Lemmatisierung und Stemming Retrieval Modelle Web Information Retrieval Die Größe des Web und seine Abdeckung durch Suchmaschinen Strukturinformationen Anwendung klassischer Verfahren des IR bei Suchmaschinen Ranking Informationsstatistische und Informationslinguistische Verfahren Linktopologische Rankingverfahren

47 Informationsstatistische und Informationslinguistische Verfahren Textstatistische Verfahren gehören zu den klassischen Verfahren des Information Retrieval.

48 Informationsstatistische und Informationslinguistische Verfahren Auswertung von Nutzungsstatistischen bestimmt die Güte eines Dokuments

49 Informationsstatistische und Informationslinguistische Verfahren Informationslinguistische Verfahren dienen der Vorbereitung von Dokumenten zur Indexierung

50 Informationsstatistische und Informationslinguistische Verfahren Informationslinguistische Verfahren Worterkennung Morphologie Lexikon Syntax Semantik Diskursanalyse Pragmatik Stemming Rechtschreibfehler

51 Informationsstatistische und Informationslinguistische Verfahren Soundex-Algorithmus am Beispiel von economics" (1) Der erste Buchstabe des Wortes bleibt erhalten (2) Falls der zweite Buchstabe identisch mit dem ersten ist, übergehe ihn [E] (3) Falls zwei aufeinander folgende Buchstaben im Ausgangswort identisch sind, übergehe den jeweils zweiten (4) Falls zwei aufeinander folgende Buchstaben im entstehenden Codewort identisch sind, notiere beide (5) Übergehe die Buchstaben AEIOUYWH [Ecnmcs] (6) Falls ein Buchstabe CGJKQSXZ ist, notiere C [ECnmC] (7) Falls ein Buchstabe BFPV ist, notiere B (8) Falls ein Buchstabe DT ist, notiere D (9) Falls ein Buchstabe MN ist, notiere M [ECMMC] (10) Die Buchstaben L und R bleiben erhalten (11) Falls der letzte Buchstabe AIOUY, notiere Y

52 Klassisches Information Retrieval Definition und Einführung Entwicklungen Arten von Datenbanken Terme und Indexierung Lemmatisierung und Stemming Retrieval Modelle Web Information Retrieval Die Größe des Web und seine Abdeckung durch Suchmaschinen Strukturinformationen Anwendung klassischer Verfahren des IR bei Suchmaschinen Ranking Informationsstatistische und Informationslinguistische Verfahren Linktopologische Rankingverfahren

53 Linktopologisches Rankingverfahren Neben den Vorgestellten Kriterien zur Bewertung von Qualität und Güte von Dokumenten im Web stellt das Linktopologische Rankingverfahren das wichtigste Verfahren dar

54 Linktopologisches Rankingverfahren Methoden des Linktopologischen Verfahrens Sience Citation Indexing PageRank Kleinbergs HITS Hilltop

55 Linktopologisches Rankingverfahren Sience Citation Indexing (Eugene Garfield) Wissenschaftliches Prinzip der Zitation

56 Linktopologisches Rankingverfahren PageRank-Verfahren (Lawrence Page) Ordnet jedem indexierten Dokument einen statischen PageRank-Wert zu

57 Linktopologisches Rankingverfahren PageRank-Verfahren (Lawrence Page)

58 Linktopologisches Rankingverfahren Kleinbergs HITS Das Kleinbergs-HITS Verfahren (Hyperlink induced topic search) versucht, die Einschränkungen einfacher Linkzählungen bzw. die themenunabhängige Bewertungen von Webseiten zu überwinden und wichtigsten Seiten (sog. Autoritäten) passend zum Thema der jeweiligen Suchanfrage ermitteln.

59 Linktopologisches Rankingverfahren Kleinbergs HITS

60 Linktopologisches Rankingverfahren Hilltop Hilltop beschreibt ein Verfahren, das die besten Seiten zu populären Themen mit Hilfe von sogenannten Expert Pages finden soll.

61 Linktopologisches Rankingverfahren Anmerkung zu den Problemstellungen des Linktopologischen Verfahrens

62 Bibliographie LEWANDOWSKI, Dirk; OCKENFELD, Marlies (Hg.): Web Information Retrieval. Technologie zur Informationssuche im Internet. Reihe de Informationswissenschaft der DGI. Band 7, Frankfurt am Main 2005 BENJAMINS, V. Richard; CASANOVAS, Pompeu; BREUKER, Joost; GANGEMI, Aldo: Law and the Semantic Web. Legal Ontologies, Methodologies, Legal Information Retrieval, and Applications, Berlin Heidelberg, 2005 BERRY, Michael W.; BROWNE, Murray; DONGARRA, Jack J. (Hg.): Understanding Search Engines. Methematical Modeling and Text Retrieval. Second Edition. Software - Environments - Tools, Philadelphia, 2005 GROSSMANN, David A.; FRIEDE, Ophir: Information Retrieval. Algorithms and Heuristics. Second Edition, Dordrecht, 2004 BUßMANN, Hadumod: Lexikon der Sprachwissenschaft, Stuttgart, 1990 MÜLLER, Horst M. (Hg.): Arbeitsbuch Linguistik, Paderborn, 2002 POETSCH, Eleonore: Information Retrieval. Einführung in Grundlagen und Methoden, Saarbrücken, 1998

63 URLS "Yahoo hat über 20 Mrd. Items Indexiert", internetmarketing-news.de "Größe des Web", The Web Characterization Project des Online Computer Library Center (OCLC) [Google, MSN, Yahoo, Ask Jeeves]

Dirk Lewandowski. Web Information Retrieval Technologien zur Informationssuche im Internet. DGI-Schrift (Informationswissenschaft 7}

Dirk Lewandowski. Web Information Retrieval Technologien zur Informationssuche im Internet. DGI-Schrift (Informationswissenschaft 7} Dirk Lewandowski Web Information Retrieval Technologien zur Informationssuche im Internet DGI-Schrift (Informationswissenschaft 7} Inhalt Vorwort 9 Suchmaschinen im Internet - informationswissenschaftlich

Mehr

Nachteile Boolesches Retrieval

Nachteile Boolesches Retrieval Nachteile Boolesches Retrieval Komplizierte Anfragen Häufigkeit bzw. Relevanz der Terme in den Dokumenten nicht berücksichtigt 2 von 3 UND-verknüpften Termen im Dokument so schlecht wie 0 Terme Keine Rangfolge

Mehr

Suchmaschinenalgorithmen. Vortrag von: Thomas Müller

Suchmaschinenalgorithmen. Vortrag von: Thomas Müller Suchmaschinenalgorithmen Vortrag von: Thomas Müller Kurze Geschichte Erste Suchmaschine für Hypertexte am CERN Erste www-suchmaschine World Wide Web Wanderer 1993 Bis 1996: 2 mal jährlich Durchlauf 1994:

Mehr

Information Retrieval, Vektorraummodell

Information Retrieval, Vektorraummodell Universität Potsdam Institut für Informatik Lehrstuhl Maschinelles Lernen Information Retrieval, Vektorraummodell Tobias Scheffer Paul Prasse Michael Großhans Uwe Dick Information Retrieval Konstruktion

Mehr

Suchmaschinen. Anwendung RN Semester 7. Christian Koczur

Suchmaschinen. Anwendung RN Semester 7. Christian Koczur Suchmaschinen Anwendung RN Semester 7 Christian Koczur Inhaltsverzeichnis 1. Historischer Hintergrund 2. Information Retrieval 3. Architektur einer Suchmaschine 4. Ranking von Webseiten 5. Quellenangabe

Mehr

Kapitel 23 Strukturinformationen in Dokumenten. HHU Düsseldorf, WS 2008/09 Information Retrieval 368

Kapitel 23 Strukturinformationen in Dokumenten. HHU Düsseldorf, WS 2008/09 Information Retrieval 368 Kapitel 23 Strukturinformationen in Dokumenten HHU Düsseldorf, WS 2008/09 Information Retrieval 368 Erkennung von Strukturinformationen in Web- Dokumenten Aufgaben: Kreation von Metadaten optimal: Eintragen

Mehr

Federated Search: Integration von FAST DataSearch und Lucene

Federated Search: Integration von FAST DataSearch und Lucene Federated Search: Integration von FAST DataSearch und Lucene Christian Kohlschütter L3S Research Center BSZ/KOBV-Workshop, Stuttgart 24. Januar 2006 Christian Kohlschütter, 24. Januar 2006 p 1 Motivation

Mehr

Studienprojekt TaxoSearch Spezifikation

Studienprojekt TaxoSearch Spezifikation Studienprojekt TaxoSearch Spezifikation Semantisch gestützte Suche im Internet Lehrstuhl für Computerlinguistik Ruprecht-Karls-Universität Heidelberg WS 2002-2003 vorgestellt von Thorsten Beinhorn, Vesna

Mehr

Google PageRank vs. HITS

Google PageRank vs. HITS Google PageRank vs. HITS Seminar Information Retrieval Ulf Schmidt Übersicht Einführung Hyperlinked Induced Topic Search Google PageRank Vergleich Weiterentwicklungen Fazit Quellen 29/01/07 Information

Mehr

Erfolgreich suchen im Internet

Erfolgreich suchen im Internet Erfolgreich suchen im Internet Steffen-Peter Ballstaedt 05.10.2015 Statistik Weltweit: etwa 1 Milliarde Websites BRD: 15 Millionen Websites Das Internet verdoppelt sich alle 5,32 Jahre Die häufigste Aktivität

Mehr

Online-Recherche: Web-Recherche WS 2015/2016 4. Veranstaltung 5. November 2015

Online-Recherche: Web-Recherche WS 2015/2016 4. Veranstaltung 5. November 2015 Online-Recherche: Web-Recherche WS 2015/2016 4. Veranstaltung 5. November 2015 Philipp Schaer - philipp.schaer@gesis.org Philipp Mayr - philipp.mayr@gesis.org GESIS Leibniz-InsJtut für SozialwissenschaNen

Mehr

Suchmaschinenoptimierung in der Praxis

Suchmaschinenoptimierung in der Praxis Suchmaschinenoptimierung in der Praxis So steigern Sie die Zugriffe auf Ihre Webseite. Frank Jäger, Präsentation am 11. Juni 2010, 1 Überblick Suchmaschinenoptimierung in der Theorie Aufbau der Google-Suchergebnisseite

Mehr

Ranking Functions im Web: PageRank & HITS

Ranking Functions im Web: PageRank & HITS im Web: PageRank & HITS 28. Januar 2013 Universität Heidelberg Institut für Computerlinguistik Information Retrieval 4 / 30 Idee PageRank Entstehung: Larry Page & Sergey Brin, 1998, genutzt von Google

Mehr

Information Retrieval. Peter Kolb

Information Retrieval. Peter Kolb Information Retrieval Peter Kolb Semesterplan Einführung Boolesches Retrievalmodell Volltextsuche, invertierter Index Boolesche Logik und Mengen Vektorraummodell Evaluation im IR Term- und Dokumentrepräsentation

Mehr

Indexstrukturen für Zeichendaten und Texte. Karsten Molka 05IN

Indexstrukturen für Zeichendaten und Texte. Karsten Molka 05IN Indexstrukturen für Zeichendaten und Texte Karsten Molka 05IN 1 Gliederung 1 Information Retrieval Was ist Information Retrieval? Warum Information Retrieval? Grundbegriffe des Information Retrieval Konkreter

Mehr

Wissenschaftliche Suchmaschinen

Wissenschaftliche Suchmaschinen Wissenschaftliche Suchmaschinen Beatrice Altorfer 14.5.2013 1 Überblick 1. Grundlagen des Internet 2. Allgemeine Suchmaschinen 3. Metasuchmaschinen 4. Wissenschaftliche Suchmaschinen 5. Google Scholar

Mehr

limlhaidftswgirzälhimds

limlhaidftswgirzälhimds limlhaidftswgirzälhimds 1 Einführung 1 1.1 Die Bedeutung der Suchmaschinen 2 1.2 Ein Buch über Google? 6 1.3 Ziel dieses Buchs 7 1.4 Über Suchmaschinen sprechen 8 1.5 Aufbau des Buchs 8 1.6 Aufbau der

Mehr

T = {t 1,..., t n } sei die Menge der Terme. D = {d 1,..., d m } sei die Menge der Dokumente.

T = {t 1,..., t n } sei die Menge der Terme. D = {d 1,..., d m } sei die Menge der Dokumente. Vektorraummodell T = {t 1,..., t n } sei die Menge der Terme. D = {d 1,..., d m } sei die Menge der Dokumente. Dokumente und Anfragen werden als Vektoren in einem Vektorraum aufgefaßt. Der Vektorraum wird

Mehr

Information Retrieval,

Information Retrieval, Universität Potsdam Institut für Informatik Lehrstuhl Maschinelles Lernen Information Retrieval, Vektorraummodell Tobias Scheffer Uwe Dick Peter Haider Paul Prasse Information Retrieval Konstruktion von

Mehr

Seminar Text- und Datamining Textmining-Grundlagen Erste Schritte mit NLTK

Seminar Text- und Datamining Textmining-Grundlagen Erste Schritte mit NLTK Seminar Text- und Datamining Textmining-Grundlagen Erste Schritte mit NLTK Martin Hacker Richard Schaller Künstliche Intelligenz Department Informatik FAU Erlangen-Nürnberg 08.05.2014 Gliederung 1 Vorverarbeitung

Mehr

9. IR im Web. bei Anfragen im Web gibt es eine Reihe von zusätzlichen Problemen, die gelöst werden

9. IR im Web. bei Anfragen im Web gibt es eine Reihe von zusätzlichen Problemen, die gelöst werden IR im Web 9. IR im Web bei Anfragen im Web gibt es eine Reihe von zusätzlichen Problemen, die gelöst werden müssen Einführung in Information Retrieval 394 Probleme verteilte Daten: Daten sind auf vielen

Mehr

Alternativen zu Google. Prof. Dr. Dirk Lewandowski

Alternativen zu Google. Prof. Dr. Dirk Lewandowski Alternativen zu Google Prof. Dr. Dirk Lewandowski dirk.lewandowski@haw-hamburg.de Agenda Situation / warum Alternativen zu Google? Lohnt sich die Recherche in anderen Universalsuchmaschinen? Alternative

Mehr

12. Vorlesung. Statistische Sprachmodelle für Information Retrieval

12. Vorlesung. Statistische Sprachmodelle für Information Retrieval 12. Vorlesung Statistische Sprachmodelle für Information Retrieval Allgemeiner Ansatz Unigram Modell Beziehung zum Vektorraummodell mit TF-IDF Gewichten Statistische Spachmodelle zur Glättung Idee von

Mehr

Vom Suchen und Finden - Google und andere Ansätze

Vom Suchen und Finden - Google und andere Ansätze Vom Suchen und Finden - Google und andere Ansätze Norbert Fuhr Universität Duisburg Essen FB Ingenieurwissenschaften Abteilung Informatik 12. Mai 2005 Gliederung 1 Einführung 2 Grundlagen 3 Erweiterte

Mehr

Suchen, um zu finden. Sta,s,k BRD (Quelle: Comscore, 2013) Beziehungsgeflecht der Suchmaschinen. Antworten auf folgende Fragen: 24.06.

Suchen, um zu finden. Sta,s,k BRD (Quelle: Comscore, 2013) Beziehungsgeflecht der Suchmaschinen. Antworten auf folgende Fragen: 24.06. Suchen, um zu finden Sta,s,k BRD (Quelle: Comscore, 2013) Steffen- Peter Ballstaedt 24.6.2015 etwa 6 Milliarden Suchanfragen pro Monat etwa 2.500 Anfragen pro Sekunde 96% der Suchanfragen über Google Beziehungsgeflecht

Mehr

Semantik in Suchmaschinen Beispiele. Karin Haenelt 7.12.2014

Semantik in Suchmaschinen Beispiele. Karin Haenelt 7.12.2014 Semantik in Suchmaschinen Beispiele Karin Haenelt 7.12.2014 Inhalt Google Knowledge Graph Freebase schema.org 2 Google Knowledge Graph Zuordnung von Suchtermen zu Weltentitäten Darstellung von Zusammenhängen

Mehr

Suchmaschinen und das Web 2.0

Suchmaschinen und das Web 2.0 Suchmaschinen und das Web 2.0 Prof. Dr. Dirk Lewandowski dirk.lewandowski@haw-hamburg.de Agenda Rechercheverhalten der Suchmaschinennutzer Qualität der Web-Suchmaschinen Web 2.0 Dienste für die Suche Fazit

Mehr

Verlinkung von Webseiten

Verlinkung von Webseiten Verlinkung von Webseiten Search Engine Strategies Conference & Expo, München 2007 Alan Webb CEO, ABAKUS Internet Marketing Warum ist Linkaufbau so wichtig? > Folgende Suchmaschinen bewerten Linkpopularität

Mehr

Wie Google Webseiten bewertet. François Bry

Wie Google Webseiten bewertet. François Bry Wie Google Webseiten bewertet François Bry Heu6ge Vorlesung 1. Einleitung 2. Graphen und Matrizen 3. Erste Idee: Ranking als Eigenvektor 4. Fragen: Exisi6ert der Eigenvektor? Usw. 5. Zweite Idee: Die Google

Mehr

Volltextsuche und Text Mining

Volltextsuche und Text Mining Volltextsuche und Text Mining Seminar: Einfuehrung in die Computerlinguistik Dozentin: Wiebke Petersen by Rafael Cieslik 2oo5-Jan-2o 1 Gliederung 1. Volltextsuche 1. Zweck 2. Prinzip 1. Index 2. Retrieval

Mehr

Erfolgreiche Suchmaschinenoptimierung. Christoph Runkel

Erfolgreiche Suchmaschinenoptimierung. Christoph Runkel Erfolgreiche Suchmaschinenoptimierung Christoph Runkel 1 Agenda 2 Bewertungsfaktoren - ONSITE URL Seitentitel HTML-Tags (Überschriften, Aufzählungen) Linktexte Korrektheit des Quelltexts Metatags Dateinamen

Mehr

Suchmaschinenoptimierung (SEO)

Suchmaschinenoptimierung (SEO) Suchmaschinenoptimierung (SEO) SOMEXCLOUD Social Media Akademie Marco Schlauri Webrepublic AG 11.06.2014 About Me SEO Consultant Webrepublic AG Agentur für Online Marketing und Digitale Strategie Location:

Mehr

Information Retrieval. Überblick

Information Retrieval. Überblick Fachhochschule Köln, Campus Gummersbach Institut für Informatik und Ingenieurwissenschaften Information Retrieval WPF 45 Überblick Prof. Dr. Heide Faeskorn - Woyke Fachhochschule Köln Campus Gummersbach

Mehr

Web Data Mining. Alexander Hinneburg Sommersemester 2007

Web Data Mining. Alexander Hinneburg Sommersemester 2007 Web Data Mining Alexander Hinneburg Sommersemester 2007 Termine Vorlesung Mi. 10:00-11:30 Raum?? Übung Mi. 11:45-13:15 Raum?? Klausuren Mittwoch, 23. Mai Donnerstag, 12. Juli Buch Bing Liu: Web Data Mining

Mehr

Boole'sches Modell <is web>

Boole'sches Modell <is web> Boole'sches Modell basiert auf Mengentheorie und Boole'scher Algebra sehr einfaches Modell mit klarer Semantik Dokumente als Mengen von Indextermen Termgewichte sind binär: im Dokument enthalten oder nicht

Mehr

Wörter - Texte - Information. Möglichkeiten und Grenzen automatischer Erschließungsverfahren

Wörter - Texte - Information. Möglichkeiten und Grenzen automatischer Erschließungsverfahren Wörter - Texte - Information Möglichkeiten und Grenzen automatischer Erschließungsverfahren Automatische Indexierung - Einführung 1 Indexieren und Automatisches Indexieren Dokumente Volltexte bibliografische

Mehr

Recherchieren im Internet

Recherchieren im Internet Recherchieren im Internet Proseminar 1 Physik für Studierende des Lehramts Übersicht 1. Allgemeines zur Lage 2. google und mehr 3. Kataloge und Metasuchmaschinen 4. Fachspezifische Suchdienste 1. Allgemeines

Mehr

Erfolg in Suchmaschinen Spickzettel

Erfolg in Suchmaschinen Spickzettel Erfolg in Suchmaschinen Spickzettel Die wichtigsten Begriffe bei Suchmaschinen Einleitung Eigentlich ist es ganz einfach Das Marketing in Suchmaschinen wimmelt von Abkürzungen. SEM, SEO, SERP, CPC lassen

Mehr

Die treffende Auswahl anbieten: Im Internet (Referat 3a)

Die treffende Auswahl anbieten: Im Internet (Referat 3a) www.zeix.com Die treffende Auswahl anbieten: Im Internet (Referat 3a) Fachtagung: Suchfunktionen im Web Zürich, 26. Oktober 2006 Jürg Stuker, namics Gregor Urech, Zeix Bern, Frankfurt, Hamburg, München,

Mehr

Grundbegriffe des Information Retrieval

Grundbegriffe des Information Retrieval Grundbegriffe des Information Retrieval Alexandra Bünzli 11.04.2001 1 Allgemeines 1.1 Motivation Datenmenge wächst Immer mehr Menschen haben Zugang zu diesen Daten Nutzen der Daten ist nur gewährleistet,

Mehr

Industrie- und Handelskammer Stuttgart

Industrie- und Handelskammer Stuttgart Industrie- und Handelskammer Stuttgart SUCHMASCHINEN-OPTIMIERUNG die vorderen Plätze bei Google, Yahoo & Co 1. Über Beyond Media 2. Erste Schritte 3. freundliche 4. Arbeitsweise 5. Bewertungsmethoden 6.

Mehr

Kapitel IR:III (Fortsetzung)

Kapitel IR:III (Fortsetzung) Kapitel IR:III (Fortsetzung) III. Retrieval-Modelle Modelle und Prozesse im IR Klassische Retrieval-Modelle Bool sches Modell Vektorraummodell Retrieval-Modelle mit verborgenen Variablen Algebraisches

Mehr

Information Retrieval

Information Retrieval Information Retrieval Ferdinand Hofherr 17. Mai 2005 Zusammenfassung Information Retrieval spielt in vielen Bereichen unseres Lebens eine wichtige Rolle. Wir kommen damit zum Beispiel in Berührung, wenn

Mehr

Vorgehen bei der Informationssuche

Vorgehen bei der Informationssuche Vorgehen bei der Informationssuche Hüseyin Colak April 25, 2007 Hüseyin Colak () Vorgehen bei der Informationssuche April 25, 2007 1 / 15 Inhaltsverzeichnis 1 Einleitung 2 Projekt IKommHelp 3 Hilfestellung

Mehr

Webarchiv Schweiz. Ausbildung, Teil 1: Sammeln. 8. und 14. März 2007 Silvia Hofmann / Jean-Philippe Accart

Webarchiv Schweiz. Ausbildung, Teil 1: Sammeln. 8. und 14. März 2007 Silvia Hofmann / Jean-Philippe Accart Webarchiv Schweiz Ausbildung, Teil 1: Sammeln 8. und 14. März 2007 Einige Fragen vorweg: 1. Was ist das Internet? 2. Was findet man im WWW? 3. Wie wird das WWW genutzt? 4. Wie findet man die gesucht Information?

Mehr

Alan Webb CEO, ABAKUS Internet Marketing

Alan Webb CEO, ABAKUS Internet Marketing Suchmaschinenoptimierung - aktuelle Trends und Erfolgsfaktoren E-Business-Tag: Online-Marketing - neue Wege zum Kunden Alan Webb CEO, ABAKUS Internet Marketing ABAKUS Internet Marketing > Über 5 Jahre

Mehr

In den Tiefen des Webs das Richtige finden

In den Tiefen des Webs das Richtige finden Betriebswirtschaftslehre In den Tiefen des Webs das Richtige finden Information Retrieval: Grundlagenforschung für Suchmaschinen Suchmaschinen wie Google, Yahoo! oder Windows Live sind aus dem Alltag eines

Mehr

Inhaltsverzeichnis 1 Einführung 2 Formen der Suche im Web 3 Wie Suchmaschinen funktionieren

Inhaltsverzeichnis 1 Einführung 2 Formen der Suche im Web 3 Wie Suchmaschinen funktionieren Inhaltsverzeichnis 1 Einführung...................................................... 1 1.1 Die Bedeutung der Suchmaschinen............................... 2 1.2 Ein Buch über Google?........................................

Mehr

Suchmaschinen. Bachelor Informationsmanagement / Modul Digitale Bibliothek (SS 2014) Dr. Jakob Voß

Suchmaschinen. Bachelor Informationsmanagement / Modul Digitale Bibliothek (SS 2014) Dr. Jakob Voß Suchmaschinen Bachelor Informationsmanagement Modul Digitale Bibliothek (SS 2014) Dr Jakob Voß 2014-03-31 Suchmaschinen (1/39) CC-BY-SA / 2014-03-31 / Dr Jakob Voß Eingangsfrage: Wie funktioniert Google?

Mehr

Suchmaschinenwerbung: Sponsored Links als Geschäftsmodell der Suchwerkzeuge

Suchmaschinenwerbung: Sponsored Links als Geschäftsmodell der Suchwerkzeuge Chang Kaiser Suchmaschinenwerbung: Sponsored Links als Geschäftsmodell der Suchwerkzeuge Mit einer Fallstudie über chinesische Suchdienste Verlag Dr. Kovac Hamburg 2010 Inhalt Abbildungsverzeichnis 11

Mehr

Diese Anleitung ist ausschließlich nur für das Woltlab Burning Board der Version 3 geschrieben wurden!

Diese Anleitung ist ausschließlich nur für das Woltlab Burning Board der Version 3 geschrieben wurden! Einleitung Diese Anleitung ist ausschließlich nur für das Woltlab Burning Board der Version 3 geschrieben wurden! Alle darin enthaltene Texte sowie Grafiken und sonstigen Elementen unterliegen dem Verfasser

Mehr

Indexvokabular {Korsika, Sardinien, Strand, Ferienwohnung, Gebirge} Verknüpfung von Enthaltenseinsbedingungen mittels Boole'scher Junktoren.

Indexvokabular {Korsika, Sardinien, Strand, Ferienwohnung, Gebirge} Verknüpfung von Enthaltenseinsbedingungen mittels Boole'scher Junktoren. Boole'sches Modell Boole'sches Modell: Beispiel basiert auf Mengentheorie und Boole'scher Algebra sehr einfaches Modell mit klarer Semantik Dokumente als Mengen von Indextermen Termgewichte sind binär:

Mehr

Boole sches Retrieval als frühes, aber immer noch verbreitetes IR-Modell mit zahlreichen Erweiterungen

Boole sches Retrieval als frühes, aber immer noch verbreitetes IR-Modell mit zahlreichen Erweiterungen Rückblick Boole sches Retrieval als frühes, aber immer noch verbreitetes IR-Modell mit zahlreichen Erweiterungen Vektorraummodell stellt Anfrage und Dokumente als Vektoren in gemeinsamen Vektorraum dar

Mehr

Information Retrieval Modelle und neue Technologien. Prof. Dr. Wolfgang Riggert FDH Flensburg

Information Retrieval Modelle und neue Technologien. Prof. Dr. Wolfgang Riggert FDH Flensburg Information Retrieval Modelle und neue Technologien Prof. Dr. Wolfgang Riggert FDH Flensburg Gliederung IR-Modelle Suchmaschinen Beispiel: Google Neue Technologien Retrievalmodell - allgemein Ein Retrievalmodell

Mehr

Suchmaschinenoptimierung (SEO) Die Grundlagen was Sie wissen sollten?

Suchmaschinenoptimierung (SEO) Die Grundlagen was Sie wissen sollten? Suchmaschinenoptimierung (SEO) Die Grundlagen was Sie wissen sollten? Search Engine Marketing SEM = Search Engine Marketing SEA SEO Suchmaschinen-Marketing umfasst alle Maßnahmen zur Gewinnung von qualifizierten

Mehr

Boolesche- und Vektorraum- Modelle

Boolesche- und Vektorraum- Modelle Boolesche- und Vektorraum- Modelle Viele Folien in diesem Abschnitt sind eine deutsche Übersetzung der Folien von Raymond J. Mooney (http://www.cs.utexas.edu/users/mooney/ir-course/). 1 Retrieval Modelle

Mehr

Urbacher-Computer-Forum. Herzlich Willkommen!

Urbacher-Computer-Forum. Herzlich Willkommen! Herzlich Willkommen! Wer suchet der findet!? Oder auch nicht! Überblick: Welche Suchdienste gibt es? Suchmaschinen Verzeichnisse Spezialsuchmaschinen Metasuchmaschinen Nachschlagwerke Welche Suchdienste

Mehr

Suchen mit der Suchmaschine

Suchen mit der Suchmaschine Suchen mit der Suchmaschine Links einiger Suchmaschinen http://www.google.ch/ http://search.bluewin.ch http://www.altavista.de http://www.fireball.de http://www.metacrawler.de/ http://www.msn.ch Lexikon:

Mehr

Suchmaschinen und ihre Architektur. Seminar: Angewandtes Information Retrieval Referat von Michael Wirz

Suchmaschinen und ihre Architektur. Seminar: Angewandtes Information Retrieval Referat von Michael Wirz Suchmaschinen und ihre Architektur Seminar: Angewandtes Information Retrieval Referat von Michael Wirz Ziel Rudimentäre Grundkenntnisse über die Funktionsweise von Suchmaschinen und Trends Einführung in

Mehr

Inhalt. 1 Einführung... 11. 2 Funktionsweise von Suchmaschinen... 21. 3 So werden Suchergebnisse gewichtet... 39

Inhalt. 1 Einführung... 11. 2 Funktionsweise von Suchmaschinen... 21. 3 So werden Suchergebnisse gewichtet... 39 1 Einführung.......................................................... 11 1.1 Eine kurze Geschichte von fast allem.................................. 12 1.2 Die Bedeutung von Suchmaschinen gestern, heute

Mehr

Relevance Ranking Revisited Mischen unterschiedlicher Quellen in VuFind

Relevance Ranking Revisited Mischen unterschiedlicher Quellen in VuFind Relevance Ranking Revisited Mischen unterschiedlicher Quellen in VuFind 3. VuFind Anwendertreffen 2014 Frankfurt Stefan Winkler Anfragen im Support Warum kommt bei meiner Suche ein Dokument an dieser Stelle?

Mehr

3. Retrievalmodelle Grundkonzept des Vektorraummodells. Vektorraummodell. Dokumente und Anfragen werden als Vektoren in einem Vektorraum aufgefaßt.

3. Retrievalmodelle Grundkonzept des Vektorraummodells. Vektorraummodell. Dokumente und Anfragen werden als Vektoren in einem Vektorraum aufgefaßt. 3. Retrievalmodelle Grundkonzept des Vektorraummodells Vektorraummodell Dokumente und Anfragen werden als Vektoren in einem Vektorraum aufgefaßt. Der Vektorraum wird durch die in der Datenbank enthaltenen

Mehr

SUCHMASCHINEN XAPIAN. Michael Strzempek FH Wiesbaden, 5. Juni 2008

SUCHMASCHINEN XAPIAN. Michael Strzempek FH Wiesbaden, 5. Juni 2008 SUCHMASCHINEN XAPIAN Michael Strzempek FH Wiesbaden, 5. Juni 2008 INHALT 1. Motivation 2. Prinzip / Vokabular 3. Xapian 4. Omega 5. Datenbank Indizierung 6. Levenshtein Distanz 7. Boolesche Suche 8. Probabilistische

Mehr

Recherche im Internet

Recherche im Internet Recherche im Internet Tools für die Internetsuche Wie suche ich im Internet? Fachliche Internetseiten Einige Vor- und Nachteile der Internetsuche Vorteile Schneller Zugriff vom Arbeitsplatz aus Oft reicht

Mehr

#Backlinks: Was macht einen guten Backlink aus?

#Backlinks: Was macht einen guten Backlink aus? #Backlinks: Was macht einen guten Backlink aus? Start 1 Was ist ein Backlink? Wozu brauche ich Backlinks? Backlink: Verweis von einer anderen Webseite Wichtiger Rankingfaktor für alle großen Suchmaschinen

Mehr

Suchmaschinenoptimierung

Suchmaschinenoptimierung Suchmaschinenoptimierung Oliver Hallmann SEO - Search Engine Optimization Plan B Unternehmer Stammtisch 31. August 2006 http://www.oliverhallmann.de http://www.planb-stammtisch.de Wie arbeitet Google?

Mehr

Link Analysis and Web Search Jan Benedikt Führer

Link Analysis and Web Search Jan Benedikt Führer Link Analysis and Web Search Jan Benedikt Führer 16. Januar 2011 DKE TUD Jan Benedikt Führer 1 Gliederung Motivation Link-Analyse mit Hubs und Authorities PageRank Anwendung innerhalb des WWW Anwendungen

Mehr

IR Seminar SoSe 2012 Martin Leinberger

IR Seminar SoSe 2012 Martin Leinberger IR Seminar SoSe 2012 Martin Leinberger Suchmaschinen stellen Ergebnisse häppchenweise dar Google: 10 Ergebnisse auf der ersten Seite Mehr Ergebnisse gibt es nur auf Nachfrage Nutzer geht selten auf zweite

Mehr

5. Vorlesung. Das Ranking Problem PageRank HITS (Hubs & Authorities) Markov Ketten und Random Walks PageRank und HITS Berechnung

5. Vorlesung. Das Ranking Problem PageRank HITS (Hubs & Authorities) Markov Ketten und Random Walks PageRank und HITS Berechnung 5. Vorlesung Das Ranking Problem PageRank HITS (Hubs & Authorities) Markov Ketten und Random Walks PageRank und HITS Berechnung Seite 120 The Ranking Problem Eingabe: D: Dokumentkollektion Q: Anfrageraum

Mehr

TYPO3-Suchmaschinenoptimierung für Redakteure

TYPO3-Suchmaschinenoptimierung für Redakteure TYPO3-Suchmaschinenoptimierung für Redakteure TYPO3 Version 7.6 LTS Allgemeines Dieses Dokument beschreibt redaktionelle Maßnahmen zur Verbesserung des Suchmaschinen- Rankings. Diese Maßnahmen sind Teil

Mehr

Erfolgreiche Internetsuche

Erfolgreiche Internetsuche Rainer Kolbeck Erfolgreiche Internetsuche Informationen weltweit gezielt suchen und finden Markt&Technik Buch- und Software-Verlag GmbH i J Inhaltsverzeichnis Inhaltsverzeichnis Vorwort 11 Teil I: Grundlagen

Mehr

Gesucht und Gefunden: Die Funktionsweise einer Suchmaschine

Gesucht und Gefunden: Die Funktionsweise einer Suchmaschine Gesucht und Gefunden: Die Funktionsweise einer Suchmaschine Prof. Dr. Peter Becker FH Bonn-Rhein-Sieg Fachbereich Informatik peter.becker@fh-bonn-rhein-sieg.de Vortrag im Rahmen des Studieninformationstags

Mehr

Hauptseminar Information Retrieval. Karin Haenelt Vorschläge für Seminarprojekte

Hauptseminar Information Retrieval. Karin Haenelt Vorschläge für Seminarprojekte Hauptseminar Information Retrieval Vorschläge für Seminarprojekte Karin Haenelt 17.10.2010 Projektarten Implementierungsprojekte: Standardalgorithmen Modellierungsexperimente Vorhandene Werkzeuge studieren,

Mehr

Kurze Einführung in Web Data Mining

Kurze Einführung in Web Data Mining Kurze Einführung in Web Data Mining Yeong Su Lee Centrum für Informations- und Sprachverarbeitung (CIS), LMU 17.10.2007 Kurze Einführung in Web Data Mining 1 Überblick Was ist Web? Kurze Geschichte von

Mehr

Maschinelle Übersetzung

Maschinelle Übersetzung Hauptstudiumsprojekt SoSe 07 Maschinelle Übersetzung Walther v. Hahn, Cristina Vertan {vhahn,vertan}@informatik.uni-hamburg.de Wozu dient ein Projekt? Projekte im Umfang von 6 SWS dienen der Bearbeitung

Mehr

I N T E R N E T. Einsteigerkurs. Teil 6 Suchmaschinen

I N T E R N E T. Einsteigerkurs. Teil 6 Suchmaschinen I N T E R N E T Einsteigerkurs Teil 6 Definition(Wikipedia) Teil 6 Was ist eine Suchmaschine? Eine Suchmaschineist ein Programm zur Recherche von Dokumenten, die in einem Computer oder einem Computernetzwerk

Mehr

Die Mathematik hinter Google

Die Mathematik hinter Google Die Mathematik hinter Google Informationstag für Gymnasiastinnen und Gymnasiasten Universität Fribourg (Schweiz) georges.klein@unifr.ch Fribourg, 24. November 2010 georges.klein@unifr.ch Die Mathematik

Mehr

Maßgeschneiderte Suchmaschinen

Maßgeschneiderte Suchmaschinen Maßgeschneiderte Suchmaschinen Usability Stammtisch Frankfurt am Main 17.11.2009 Walter Ebert Web Development www.walterebert.de Braucht meine Website eine Suchmachine? Wahrscheinlich, wenn: Eine gute

Mehr

Mein Internetauftritt auf dem Prüfstand

Mein Internetauftritt auf dem Prüfstand Mein Internetauftritt auf dem Prüfstand Praxisseminar am 13.03.2008 Dr. Wolfgang Krauß Krauß-Marketing Unternehmensberatung Chemnitz www.krauss-marketing.de Das Marketing befindet sich im Umbruch These:

Mehr

SEO SEARCH ENGINE OPTIMIZATION

SEO SEARCH ENGINE OPTIMIZATION SEO SEARCH ENGINE OPTIMIZATION Warum Suchmaschinenoptimierung? Mehr als 80% der Nutzer kommen über Suchmaschinen und Web-Verzeichnisse zu neuen Websites 33% aller Suchmaschinen User glauben, dass die zuerst

Mehr

Einheitlicher Ansprechpartner 2.0 / Suchtechnologie und Chatbots. Berlin,

Einheitlicher Ansprechpartner 2.0 / Suchtechnologie und Chatbots. Berlin, Einheitlicher Ansprechpartner 2.0 / Suchtechnologie und Chatbots Berlin, 12.07.2016 Suchmethoden im Überblick Keyword-basierte Suche Semantische Suche machine learning Suche Exakte Suche nach Textketten

Mehr

Übersicht. Volltextindex Boolesches Retrieval Termoperationen Indexieren mit Apache Lucene

Übersicht. Volltextindex Boolesches Retrieval Termoperationen Indexieren mit Apache Lucene Übersicht Volltextindex Boolesches Retrieval Termoperationen Indexieren mit Apache Lucene 5.0.07 1 IR-System Peter Kolb 5.0.07 Volltextindex Dokumentenmenge durchsuchbar machen Suche nach Wörtern Volltextindex:

Mehr

Quelle. Thematische Verteilungen. Worum geht es? Wiederholung. Link-Analyse: HITS. Link-Analyse: PageRank. Link-Analyse: PageRank. Link-Analyse: HITS

Quelle. Thematische Verteilungen. Worum geht es? Wiederholung. Link-Analyse: HITS. Link-Analyse: PageRank. Link-Analyse: PageRank. Link-Analyse: HITS Hauptseminar Web Information Retrieval Quelle Thematische Verteilungen 07.05.2003 Daniel Harbig Chakrabati, Soumen; Joshi, Mukul; Punera, Kunal; Pennock, David (2002): The Structure of Broad Topics on

Mehr

SuchmaschinenOptimierung

SuchmaschinenOptimierung V 1 w Daniel Koch SuchmaschinenOptimierung Website-Marketing für Entwickler ADDISON-WESLEY An imprint of Pearson Education München Boston San Francisco Harlow, England Don Mills, Ontario Sydney Mexico

Mehr

<is web> Information Systems & Semantic Web

<is web> Information Systems & Semantic Web Information Systems University of Koblenz Landau, Germany 3 Prinzipien des Information Retrieval Einführung Information-Retrieval-Modelle Relevance Feedback Bewertung von Retrieval-Systemen Nutzerprofile

Mehr

Retrieval Modelle. Boolesche- und Vektorraum- Modelle. Weitere Modell-Dimensionen. Klassen von Retrieval Modellen. Boolesche Modelle (Mengentheorie)

Retrieval Modelle. Boolesche- und Vektorraum- Modelle. Weitere Modell-Dimensionen. Klassen von Retrieval Modellen. Boolesche Modelle (Mengentheorie) Retrieval Modelle Boolesche- und Vektorraum- Modelle Ein Retrieval-Modell spezifiziert die Details der: Repräsentation von Dokumenten Repräsentation von Anfragen Retrievalfunktion Legt die Notation des

Mehr

Search Engine Evaluation. Franziska Häger, Lutz Gericke

Search Engine Evaluation. Franziska Häger, Lutz Gericke Search Engine Evaluation Franziska Häger, Lutz Gericke 23.07.2009 Ansätze 2 Tägliche Abfragen mit geringer Ergebnismenge Evaluation von Precision und Recall Revisionsabfrage aus Suchmaschinen-Caches Bestimmung

Mehr

Suchmaschinen und E-Commerce-Sites als Herausforderer der Bibliotheksangebote

Suchmaschinen und E-Commerce-Sites als Herausforderer der Bibliotheksangebote Suchmaschinen und E-Commerce-Sites als Herausforderer der Bibliotheksangebote 94. Deutscher Bibliothekartag, Düsseldorf 2005 Dirk Lewandowski Heinrich-Heine-Universität Düsseldorf, Abt. Informationswissenschaft

Mehr

Prototypische Komponenten eines Information Retrieval Systems: Vektormodell

Prototypische Komponenten eines Information Retrieval Systems: Vektormodell Prototypische Komponenten eines Information Retrieval Systems: Vektormodell Implementierung & Präsentation: Stefan Schmidt (Uni Mannheim) Kontakt: powder@gmx.de Seminar: Information Retrieval WS2002/2003

Mehr

Suchmaschinen Grundlagen. Thomas Grabowski

Suchmaschinen Grundlagen. Thomas Grabowski Suchmaschinen Grundlagen Thomas Grabowski 1 / 45 Überblick 1. Einleitung 2. Suchmaschinen Architektur 3. Crawling-Prozess 4. Storage 5. Indexing 6. Ranking 2 / 45 1. Einleitung Der Webgraph unterliegt

Mehr

Literaturdatenbanken

Literaturdatenbanken Workshop Tipps und Tools für eine effektive Literaturrecherche in Pubmed/Medline 5. Kongress für Arzneimittelinformation Köln 04.02.2017 Dr. Mirjam Gnadt Arzneimittelinformationsstelle der Bayerischen

Mehr

Internetsuchmaschinen - Kritische Betrachtung von Funktionalität und Leistungsfähigkeit im Vergleich

Internetsuchmaschinen - Kritische Betrachtung von Funktionalität und Leistungsfähigkeit im Vergleich Internetsuchmaschinen - Kritische Betrachtung von Funktionalität und Leistungsfähigkeit im Vergleich Prof. Dr. Dirk Lewandowski Hochschule für Angewandte Wissenschaften Hamburg, Fakultät DMI, Department

Mehr

Wie Web 2.0 und Suche zusammenwachsen. Prof. Dr. Dirk Lewandowski dirk.lewandowski@haw-hamburg.de

Wie Web 2.0 und Suche zusammenwachsen. Prof. Dr. Dirk Lewandowski dirk.lewandowski@haw-hamburg.de Wie Web 2.0 und Suche zusammenwachsen Prof. Dr. Dirk Lewandowski dirk.lewandowski@haw-hamburg.de Web search: Always different, always the same AltaVista 1996 1 http://web.archive.org/web/19961023234631/http://altavista.digital.com/

Mehr

Multimedia-Datenbanken im SS 2010 Einführung in MMDB

Multimedia-Datenbanken im SS 2010 Einführung in MMDB Multimedia-Datenbanken im SS 2010 Einführung in MMDB Dr.-Ing. Marcin Grzegorzek 27.04.2010 Ähnlichkeitssuche in Multimedia-Datenbanken 2/ 28 Inhalte und Termine 1. Einführung in MMDB 1.1 Grundlegende Begriffe

Mehr

Was bedeutet der Begriff:

Was bedeutet der Begriff: Wie gewinnen Sie mit Ihrer Internetseite neue Gäste? THEMA : Sichtbarkeit schaffen durch SUCHMASCHINEN-OPTIMIERUNG (SEO) Was bedeutet der Begriff: SEO? Die Kunst der Suchmaschinen-Optimierung oder Wie

Mehr