Vorlesung Information Retrieval Wintersemester 04/05

Größe: px
Ab Seite anzeigen:

Download "Vorlesung Information Retrieval Wintersemester 04/05"

Transkript

1 Vorlesung Information Retrieval Wintersemester 04/05 7. Dezember 2004 Institut für Informatik III Universität Bonn Tel / Fax / Google 1

2 Googol (im Deutschen etwa Gugol auszusprechen) Googol Bezeichnung rührt von der amerikanischen Aussprache des Wortes googol her 1938 Namensgebung: Milton Sirotta (*1929), Neffe des US-amerikanischen Mathematikers Edward Kasner Ein Googol ist größer als die Anzahl der Elementarteilchen im Weltall, die auf bis geschätzt wird. Ein Googol entspricht in etwa 70!, also Die binäre Darstellung eines Googol umfasst 333 Bits. 3

3 Der Name Google-Gründer waren auf der Suche nach einer treffenden Bezeichnung für die Fülle an Informationen, welche mit ihrer Suchmaschine im Web aufgefunden werden sollte Googol soll die Assoziation mit einer ungeheuerlichen Zahl von indexierten Webseiten aufkommen lassen Realität (Dezember 2004) nur um etwas über 8 Milliarden (= ) (laut Betreiberangaben: ) Seiten. klein gegenüber der geschätzten totalen Größenordnung von Webseiten (ca. 500 Milliarden im Deep Web) 4 Weitere Verwendung Roman: Googol. Der Flug der Nostradamus von H.D. Klein Kinderbuch: Can You Count to a Googol? von Robert E. Wells Kino von Springfield: bei The Simpsons" heißt Googolplex 5

4 Das Unternehmen 6 Historie 1995 Larry Page und Sergey Brin begegnen sich an der Stanford University. Sie konzipieren die Suchmaschine BackRub einen Google-Vorläufer Internetportale zeigen Desinteresse an der entwickelten Suchtechnologie. 7. September 1998 In einer Garage gründen Page und Brin die Google Inc. Mit einem Startkapital von $ von Andreas Bechtolsheim bringen sie die erste Testversion des Programms auf den Markt. Februar 1999 Google bezieht mit acht Angestellten ein Büro in Palo Alto. Etwa Suchanfragen werden täglich verzeichnet. September 1999 AOL und Netscape arbeiten mit Google zusammen, die Suchanfragen versechsfachen sich. 7

5 Historie Juni 2000 Mit mehr als einer Milliarde Seiten im Index ist Google Marktführer bei Suchmaschinen geworden. Dezember 2001 Die Zahl von drei Milliarden Dokumentenzugriffen wird erreicht. Juli 2003 Ein deutschsprachiger Nachrichtenservice wird angeboten. Angeblich entstehen hier Google-News ohne menschliches Eingreifen. 29. April 2004 Google verkündet den seit geraumer Zeit erwarteten Gang an die US-Börse. 16. Mai 2004 Peri Fleisher, eine Großnichte Edward Kassners und Mutter des Inhabers der Buchrechte an "Mathematics and the Imagination" (1940, Definition des Googol) erwägt in einem Interview pünktlich zum Börsengang eine Klage wegen der Namesrechte gegen Google. 8 Historie Am 1. August 2004 startete die Online-Registrierung für den IPO (Börsengang) erhoffter Erlös von 3,3 Milliarden US-Dollar ursprünglich geplante Ausgabepreis von 108 bis 135 Dollar je Aktie musste auf 80 bis 85 Dollar gesenkt werden, 19. August 2004 erster Handelstag Kurs stieg auf über 100 Dollar Larry Page und Sergey Brin, halten 38 Millionen Aktien Google macht sie zu Multimilliardären aktueller Kurs: $ ( ) 9

6 Finanzierung Google ist ein kommerzielles Unternehmen Google kommt ohne grafische Werbebanner aus Verkauft werden beliebige Suchbegriffe. Diese reine Text-Werbung so genannte AdWords ist aber speziell hervorgehoben, so dass die eigentlichen Suchergebnisse nicht beeinflusst werden Weitere Einnahmen: von Internet-Portalen, welche die Google-Suchtechnik für ihre eigenen Dienste übernehmen Zusätzlich entstehen Gewinne durch das Google AdSense - Partnerprogramm; dies ist kontextabhängige Werbung, welche Webmaster auf ihren Webseiten einbinden können. 10 Firmensitz und Umsatz Das Unternehmen hat seinen Sitz im kalifornischen Mountain View. Es beschäftigte im Sommer 2004 rund 2300 Mitarbeiter. Jahresumsatz (in Mio. Dollar): 2003: 961,9 Gewinn: 105,6 2002: 347,8 Gewinn: 99,7 2001: 86,4 Gewinn: 7, : 19,1 Gewinn: -14,7 11

7 Computer Hardware normale Standard-PCs, in mehreren weltweit verteilten Computercluster Betriebssystem: GNU/Linux bei Defekt werden Computer einfach abgeschaltet kostengünstige Alternative zu einem Großrechner Schätzung der Hardwareausstattung: 719 Racks Rechner CPUs GHz processing power GB RAM TB Festplattenspeicher 12 Datenschutz Verwendung von sehr langlebigen Cookies weitere Vorwürfe: Speichern der Cookie ID, Speichern der IP-Adresse, Zeit, Datum und Inhalt der Suchabfrage sowie der Browser-Konfiguration Nominierung der Bürgerrechtsgruppe Public Information Research, für den Big Brother Award 1. April 2004 Start des Googles -Dienst Gmail offiziell weiterhin in der Testphase verspricht seinen Nutzern ein -Postfach in der Größe von einem Gigabyte. scannen der Post elektronisch auf Schlüsselwörter, um den s passende Werbung zur Seite zu generieren 13

8 Manipulation Google ist Hauptziel von Suchmaschinen-Spamming Doorway-Pages: Suchroboter wird ein zum Suchbegriff passender Inhalt vorgegaukelt die von Google kommende Besucher werden auf eine Seite des Spammers weitergeleitet Google-Bombe: Manipulation der Reihenfolge der Treffer Bsp.: Kampf um den vordersten Platz beim Suchbefehl "miserable failure" ( klägliches Scheitern ). - Gegner des amtierenden Präsidenten George W. Bush sorgten dafür, dass die Webseite des Weißen Hauses mit Bushs Biografie auf Platz 1 landete November 2003: umfassende Anpassung des Ranking, die jedoch wieder rückgängig gemacht wurde 14 Einfache Suche Voreingestellter Boolscher Operator ist UND Disjunktive Suche mit OR ist durchführbar Stoppwörter werden ignoriert, können aber mit + in die Suche mit eingebunden werden. Phrasen werden mit Anführungsstrichen markiert NICHT- Operator ist das Minuszeichen Google sucht exakt zeichengetreu Zu beachten: einfacher mathematischer Schreibweisen, z. B. 2^2 liefert keine Seiten sonder das Ergebnis der Rechnung Google indiziert immer nur die ersten 100 KB einer Datei 15

9 Erweiterte Suche (1) Folgende, teils undokumentierte Schlüsselbegriffe sind derzeit bekannt: filetype: Sucht nach Dokumenten, mit bestimmten Dateiendungen. Beispiel: geschäftsbericht filetype:xls. Formate: PS, PDF, AI, DOC, PPT, XLS, sowie alle textbasierten Dateien wie RTF, TXT, ASP, PHP, CGI, HTM, LOG, INI, JS usw. site: mit diesem Schüsselbegriff lässt sich die Suche auf eine bestimmte Domain eingrenzen. Beispiel: Desoxribonukleinsäure site:wikipedia.org link: Gibt alle Seiten aus, die auf eine bestimmte Seite verlinken. Beispiel: link:wikipedia.org intitle: Sucht nach Dokumenten, bei welchen der oder die Suchbegriffe nur im Titel der Datei vorkommen. Beispiel: intitle:"bearbeiten von Google" 16 Erweiterte Suche (2) inurl: gibt Seiten zurück, bei denen der Suchbegriff in der URL auftaucht. Beispiel: "Karl Müller" inurl:impressum daterange: schränkt die Suche auf das Datum ein, zu dem die Seite von Google indiziert wurde. Zeitangaben: Julianisches Datum Berechnung: Anzahl der Tage, die seit dem 1. Januar 4713 v.chr. vergangen sind. Beispiel: = daterange: Vorteil: format-unabhängig cache: gibt nur die von Google gespeicherten Seiten aus. Die Inhalte sind über einen bestimmten Zeitraum noch bei Google gespeichert und können dort gelesen werden. inanchor: - Sucht nach den Begriffen nur in Links. Oftmals führt ein Link mit einer bestimmten Bezeichnung präziser zu einem Ziel, als wenn die Bezeichnung irgendwo im Text vorkommt. 17

10 Google API seit Frühling 2002: Google Web API registrierten Entwicklern können eigene Anwendungen bzw. Schnittstellen schreiben, die den Datenbestand von Google abfragen Angebot auf 1000 Anfragen pro Tag begrenzt Näheres unter: 18 Sonstiges googlefest: gewählte Sucheingabe liefert genau das gewünschte Suchergebnis Google Labs: Google Blogs: Erlebnisse seiner Mitarbeiter (http://www.google.com/googleblog) Google Whack: Suche nach zwei Wörtern (ohne Anführungszeichen), die genau ein Ergebnis liefert Google Doodles: Veränderung des Google- Logos auf der Startseite in Anlehnung an aktuelle und/oder wiederkehrende Ereignisse bezeichnet (seit 1999). Google Zeitgeist: 19

11 Systemarchitektur 20 Übersicht 21

12 Komponenten der Architektur von Google Crawling: das Downloaden von Webseiten erfolgt durch mehrere verteilte Crawler. URL Server: dieser Server sendet eine Liste mit URLs zu den Crawlern, die eingesammelt werden sollen. Store Server: dieser Server komprimiert und speichert die Webseiten in einem Repository. Jeder Seite wird eine ID-Nummer (docid) zugewiesen. Indexfunktion: diese Funktion wird vom Indexer und dem Sorter durchgeführt. 22 Komponenten der Architektur von Google Indexer: erfüllt eine Vielzahl von Funktionen. > Lesen des Repository und Dekomprimierung: Jedes Dokument wird in eine Menge von Wortvorkommenshäufigkeiten (hits) konvertiert. Jeder Hits protokolliert das Wort, die Position im Dokument, eine Nährung der Fontgröße und die Großschreibung. Der Indexer verteilt alle Hits auf eine Menge von Barrels und erzeugt einen teilweise sortierten Forward Index. > Parsen aller Links aus jeder Webseite: In einem Anchor File werden die Informationen zu einem Link (Linktext, Ausgangs- und Endpunkt des Links) gespeichert. URL Resolver: liest das Anchor File und konvertiert relative URLs in absolute URLs und weist gleichzeitig die docid zu. Er generiert eine Datenbank von Links aus Paaren von docids. 23

13 Komponenten der Architektur von Google Sorter: der Sorter nimmt die nach der docid sortierten Barrels und sortiert diese nach der wordid für den invertierten Index. Der Sorter erzeugt eine Liste von wordids und Offsets im invertierten Index. DumpLexikon: dieses Programm nimmt die vom Sorter erzeugte Liste und das vom Indexer erzeugte Lexikon und generiert ein neues Lexikon für den Searcher. Searcher: läuft auf einem Webserver und benutzt das Lexikon zusammen mit dem invertierten Index und den PageRanks zur Beantwortung von Anfragen. 24 Datenstrukturen Die Datenstruktur von Google ist so optimiert, dass große Dokumentkollektionen mit wenigen Kosten gecrawled, indexiert und durchsucht werden können. BigFiles virtuelle Dateien die mehrere Dateisysteme umspannen und mit 64 Bit Integerzahlen adressierbar sind die Verteilung über mehrere Dateisysteme wird automatisch gehandhabt 25

14 Datenstrukturen Repository enthält den kompletten HTML-Code jeder Webseite jede Seite wird mit zlib (RFC1950) komprimiert bei der Auswahl des Kompressionsverfahren muss ein Gleichgewicht zwischen Schnelligkeit und Kompressionsrate bestehen zlib besitzt eine Kompressionsrate von 3 zu 1 im Repository werden die Dokumente nacheinander mit der docid, der Länge und ihrer URL gespeichert das Repository benötigt keine weiteren Datenstrukturen, um darauf zugreifen zu können 26 Darstellung der Repository Datenstruktur 27

15 Datenstrukturen Document Index der Dokumentindex enthält Informationen über jedes Dokument ISAM (Index sequential access mode) Index, der nach der docid sortiert ist die in jedem Eintrag gespeicherten Informationen beinhalten den aktuellen Dokumentstatus, einen Zeiger ins Repository, eine Dokument Checksumme und verschiedene Statistiken falls das Dokument gecrawled wurde, enthält es zusätzlich einen Pointer auf eine Datei (docinfo), die den URL und den Titel enthält andererseits verweist der Pointer in die URL-Liste Einschub 28 Datenstrukturen Konvertierung von URLs in docids Liste von URL Checksummen mit den jeweiligen docids (sortiert nach Checksumme) Suche einer docid: Berechnung der URL Checksumme Binär Suche um docid zu finden Schrittweise Konvertierung von URLs in docids und anschließender Merge Verwendete Technik des URLResolver Updates im Batch-Modus entscheidend, da ansonsten eine Suche für jeden Link durchgeführt werden muss (bei 1 Festplatte mehr als 1 Monat für 322 Mio. Links) 29

16 Einschub: ISAM ISAM - indexed sequential access method Datenbankzugriffsverfahren mit einem eindeutigen Schlüssel, um bei großen Datenbeständen kurze Suchzeiten zu erhalten. Prinzip: aus den eigentlichen Daten werden die Felder ausgewählt, über die man schnell an die gewünschte Information kommen möchte. Diese Felder werden indexiert (vorsortiert) und in einer separaten Datei abgelegt. Zu der Feldinformation wird die Datensatznummer als direkter Zeiger festgehalten. Suche: durchsucht wird die kleine Indexdatei und der Zugriff erfolgt über den Zeiger auf die Tabelle 30 Datenstrukturen Lexikon die aktuelle Implementation des Lexikons ermöglicht es im Arbeitsspeicher (256 MB) zu halten das Lexikon enthält 14 Millionen Wörter (Stand: 1998) ist in zwei Teilen implementiert: > Liste von Wörtern, wobei die einzelnen Wörter miteinander verkettet sind und durch Nullen getrennt werden. > Hashtabelle mit Pointer 31

17 Datenstrukturen Hit Lists eine Hit List protokolliert in einer Liste alle Vorkommen eines speziellen Wortes in einem speziellen Dokument zusammen mit der Position, dem Font und der Großschreibungsinformation Hit Listen machen den meisten Speicher aus, der von beiden Indizes (Forward und Inverted) benutzt wird für die effiziente Implementation wurde ein eigenes Kodierungsverfahren entwickelt, dass zwei Bytes für jeden Hit benötigt es werden zwei Hits unterschieden: > fancy hits > plain hits 32 Datenstrukturen - Hit Lists Fancy hits: dazu gehören Hits, die in einer URL, dem Titel, einem Anchor Text oder einem Meta-Tag vorkommen Plain hits: dazu gehören alle Hits, die keine fancy hits sind Repräsentation: Plain hits bestehen aus: einem capitalization Bit 3 Bits für die Fontgröße relativ zum restlichen Dokument gemessen und 12 Bits für die Wortposition im Dokument (alle Positionen größer als 4095 werden mit 4096 gelabelt) cap:1 imp:3 position:12 33

18 Datenstrukturen - Hit Lists Fancy hits bestehen aus: einem capitalization Bit die Fontgröße ist gleich 7 gesetzt, um zu markieren, dass es sich um einen Fancy hit handelt 4 Bits zur Kodierung des Typs des Fancy hits und 8 Bits für die Wortposition im Dokument cap:1 imp=7 type:4 position:8 Für Anchor hits werden die 8 Bits für die Position in 4 Bits für die Position des Ankers und 4 Bits für einen Hashwert der docid, in dem der Anker vorkommt, aufgeteilt. cap:1 imp=7 type:4 hash:4 position:8pos:4 34 Datenstrukturen - Hit Lists die Länge einer Hit List wird vor den Hits gespeichert um Platz zu sparen, ist die Länge der Hit List mit der wordid aus dem Forward Index und der docid des Inverted Index kombiniert 35

19 Datenstrukturen Forward Index dieser Index ist bereits teilweise sortiert er wird gespeichert in einer gewissen Anzahl von Barrels (z.b. 64) jeder Barrel beinhaltet eine bestimmten Bereich an wordids wenn ein Dokument Wörter enthält, die in einen besonderen Barrel fallen, wird die docid zusammen mit einer Liste von wordids und derren Hit Lists in diesem Barrel erfasst Dieses Schema benötigt zwar wegen den doppelten docids geringfügig mehr Speicherplatz aber der Unterschied ist sehr klein für eine angemessene Anzahl an Buckets. 36 Datenstrukturen - Forward Index anstatt den aktuellen wordids werden im Forward Index die wordids als eine relative Differenz zur minimalen wordid des jeweiligen Barrel gespeichert es werden 24 Bits für die wordids in den unsortierten Barrels verwendet und 8 Bits für die Länge der Hit List 37

20 Datenstrukturen Inverted Index besteht aus denselben Barrels als der Forward Index mit dem Unterschied, dass sie von dem Sorter verarbeitet wurden für jede gültige wordid beinhaltet das Lexikon einen Pointer in den Barrel mit der zugehörigen wordid der Pointer zeigt auf eine Dokumentliste mit docids und den dazugehörigen Hit Listen 38 Datenstrukturen - Inverted Index Eine wichtige Entscheidung ist die Reihenfolge in der die docids in der Dokumentliste auftreten: 1. Möglichkeit: Sortierung nach der docid + schnelle Mischung von verschiedenen Dokumentlisten für Mehrwort-Anfragen 2. Möglichkeit: Sortierung nach einem Ranking der Wortvorkommen in jedem Dokument + einfache Beantwortung von Einzelwortanfragen - Mischung von Dokumentlisten ist schwierig - eine Veränderung der Rankingfunktion erfordert eine Neubildung des Index 39

21 Datenstrukturen - Inverted Index Die Lösung von Google ist ein Kompromiß zwischen den beiden Möglichkeiten: Speicherung von zwei Mengen der invertierten Barrels 1. Menge: nur Hit Listen bestehend aus Anchor Hits und Titel Hits 2. Menge: alle Hit Listen Vorgehensweise: zuerst wird in der ersten Menge nach Treffern gesucht, falls es dort nicht genügend Übereinstimmungen gibt, wird die größere Menge untersucht. 40 Crawling im Web zum Sammeln von mehreren Hundert Millionen Seiten besitzt Google ein schnelles verteiltes Crawling System ein einzelner URL Server verteilt Listen mit URLs an Crawler (typischerweise mehr als 3 Crawler im Einsatz) URLserver und Crawler sind in Python implementiert jeder Crawler hält 300 Verbindungen gleichzeitig offen zu Spitzenzeiten kann das System mit 4 Crawlern über 100 Webseiten pro Sekunde crawlen 41

22 Crawling im Web Performanz wird am meisten belastet durch DNS Lookup Jeder Crawler besitzt seinen eigenen DNS Cache Verbindungen können in verschiedenen Zuständen sein: DNS lookup Verbindung zu Host Anfrage senden Antwort empfangen Es ist unmöglich die Crawler zu testen, ohne sie auf einer großen Teilmenge des Webs gelaufen sind. 42 Indexgenerierung Parsen Robustes Verfahren, um mit HTML Fehlern, nicht-ascii Zeichen, usw. umgehen zu können Einsatz von Flex, um einen Lexical Analyzer zu generieren Indexierung von Dokumenten in Barrels Konvertierung jedes Wortes in eine wordid mit dem Lexikon (Hash Tabelle im Speicher) Updates des Lexikon werden in einer Datei gespeichert Vorkommen aller Wörter eines Dokuments in Hit Liste übersetzen und in Forward Barrel schreiben Parallelisierung: - Wörter, die nicht in einem Basislexikon vorkommen, werden in einer extra Datei gesammelt 43

23 Indexgenerierung Sortierung Jeder Forward Barrel wird nach der wordid sortiert - Invertierter Barrel für Titel und Anchor Hits - Volltext invertierter Barrel Dieser Prozess wird einzeln für jeden Barrel durchgeführt, ohne das viel Zwischenspeicher benötigt wird. Parallelisierung der Sortierungsphase, in dem so viele Rechner wie möglich eingesetzt werden. Mehrere Sortierer verarbeiten verschiedene Buckets Barrels passen nicht in Hauptspeicher und werden in Baskets aufgeteilt, die in den Speicher passen 44 Evaluation der Anfragen in Google 1. Parsen der Anfrage 2. Konvertierung der Wörter in wordids 3. Suche den Start der Dokumentliste in dem kleinen Barrel für jedes Wort 4. Scannen der doclist bis ein Dokument alle Suchterme enthält. 5. Berechnung des Rangplatz des Dokuments 6. Falls man am Ende einer Dokumentliste des kurzen Barrels steht, suche den Anfang der Dokumentliste im gesamt Barrel für jedes Wort und weiter bei Schritt Falls man nicht am Ende einer doclist angekommen ist, dann gehe zu Schritt 4. Sortierung der gefundenen Dokumente nach dem Rang und Ausgabe der ersten k. 45

24 Ergebnisse und Performanz Storage Statistics Total Size of Fetched Pages GB Compressed Repository 53.5 GB Short Inverted Index 4.1 GB Full Inverted Index 37.2 GB Lexicon 293 MB Temporary Anchor Data 6.6 GB (not in total) Document Index Incl. 9.7 GB Variable Width Data Links Database 3.9 GB Total Without Repository 55.2 GB Total With Repository GB Stand: 1998 für 24 Millionen Webseiten 46 Literatur Sergey Brin und Lawrence Page: The Anatomy of a Large- Scale Hypertextual Web Search Engine. Proceedings of the 7th International World Wide Web Conference, April 1998 Mechtild Stock, Wolfgang Stock: Internet-Suchwerkzeuge im Vergleich (IV) Relevance Ranking nach Popularität von Webseiten: Google. In: Password Nr. 2 (2001), S Tom Schimmeck: Die Herrscher der Portale. In: GEO WISSEN Nr. 27/ April 2001, S. 1-4 Lukas Denzler: Das Geheimniss von Google. Interview mit Urs Hölzle. In: ETH Life, August 2001 Google. 47

5. Suchmaschinen Herausforderungen beim Web Information Retrieval. Herausforderungen beim Web Information Retrieval. Architektur von Suchmaschinen

5. Suchmaschinen Herausforderungen beim Web Information Retrieval. Herausforderungen beim Web Information Retrieval. Architektur von Suchmaschinen 5. Suchmaschinen Herausforderungen beim Web Information Retrieval 5. Suchmaschinen 5. Suchmaschinen Herausforderungen beim Web Information Retrieval Verweisstrukturen haben eine wichtige Bedeutung Spamming

Mehr

5. Suchmaschinen Herausforderungen beim Web Information Retrieval. 5. Suchmaschinen. Herausforderungen beim Web Information Retrieval

5. Suchmaschinen Herausforderungen beim Web Information Retrieval. 5. Suchmaschinen. Herausforderungen beim Web Information Retrieval 5. Suchmaschinen Herausforderungen beim Web Information Retrieval 5. Suchmaschinen Herausforderungen beim Web Information Retrieval Architektur von Suchmaschinen Spezielle Bewertungsfunktionen Information

Mehr

Websites optimieren für Google & Co.

Websites optimieren für Google & Co. Sebastian Röring Websites optimieren für Google & Co. schnell+kompakt Suchmaschinen link zu meiner Seite Diesen

Mehr

Erfolgreich suchen im Internet

Erfolgreich suchen im Internet Erfolgreich suchen im Internet Steffen-Peter Ballstaedt 05.10.2015 Statistik Weltweit: etwa 1 Milliarde Websites BRD: 15 Millionen Websites Das Internet verdoppelt sich alle 5,32 Jahre Die häufigste Aktivität

Mehr

Geschichte des Internets Suchmaschinen Fachinformationszentren. Institute for Science Networking

Geschichte des Internets Suchmaschinen Fachinformationszentren. Institute for Science Networking Geschichte des Internets Suchmaschinen Fachinformationszentren Kurze Geschichte des Internets Internet: Geschichte beginnt mit der Entwicklung paketvermittelter Netze. Bei der Paketvermittlung werden Nachrichten

Mehr

Recherchieren im Internet

Recherchieren im Internet Recherchieren im Internet Proseminar 1 Physik für Studierende des Lehramts Übersicht 1. Allgemeines zur Lage 2. google und mehr 3. Kataloge und Metasuchmaschinen 4. Fachspezifische Suchdienste 1. Allgemeines

Mehr

Inhalt. 1 Einführung... 11. 2 Funktionsweise von Suchmaschinen... 21. 3 So werden Suchergebnisse gewichtet... 39

Inhalt. 1 Einführung... 11. 2 Funktionsweise von Suchmaschinen... 21. 3 So werden Suchergebnisse gewichtet... 39 1 Einführung.......................................................... 11 1.1 Eine kurze Geschichte von fast allem.................................. 12 1.2 Die Bedeutung von Suchmaschinen gestern, heute

Mehr

Web-Recherche WS 2015/2016 3. Veranstaltung 29. Oktober 2015

Web-Recherche WS 2015/2016 3. Veranstaltung 29. Oktober 2015 Web-Recherche WS 2015/2016 3. Veranstaltung 29. Oktober 2015 Philipp Mayr - philipp.mayr@gesis.org Philipp Schaer - philipp.schaer@gesis.org GESIS Leibniz-Institut für Sozialwissenschaften 2 Themen der

Mehr

Textdokument-Suche auf dem Rechner Implementierungsprojekt

Textdokument-Suche auf dem Rechner Implementierungsprojekt Textdokument-Suche auf dem Rechner Implementierungsprojekt Referent: Oliver Petra Seminar: Information Retrieval Institut für Computerlinguistik Ruprecht-Karls-Universität Heidelberg 19.01.2015 Überblick

Mehr

Ohne Mathematik undenkbar!

Ohne Mathematik undenkbar! Die tägliche - Suche: Ohne Mathematik undenkbar! Dipl.-Wirt.Math. Jan Maruhn FB IV - Mathematik Universität Trier 29. März 2006 29. März 2006 Seite 1 Gliederung Einleitung und Motivation Das Internet als

Mehr

Suchen, um zu finden. Sta,s,k BRD (Quelle: Comscore, 2013) Beziehungsgeflecht der Suchmaschinen. Antworten auf folgende Fragen: 24.06.

Suchen, um zu finden. Sta,s,k BRD (Quelle: Comscore, 2013) Beziehungsgeflecht der Suchmaschinen. Antworten auf folgende Fragen: 24.06. Suchen, um zu finden Sta,s,k BRD (Quelle: Comscore, 2013) Steffen- Peter Ballstaedt 24.6.2015 etwa 6 Milliarden Suchanfragen pro Monat etwa 2.500 Anfragen pro Sekunde 96% der Suchanfragen über Google Beziehungsgeflecht

Mehr

- Google als Suchmaschine richtig nutzen -

- Google als Suchmaschine richtig nutzen - - Google als Suchmaschine richtig nutzen - Google ist die wohl weltweit bekannteste und genutzte Suchmaschine der Welt. Google indexiert und aktualisiert eingetragene Seiten in bestimmten Intervallen um

Mehr

Diskrete Modellierung

Diskrete Modellierung Diskrete Modellierung Wintersemester 2013/14 Prof. Dr. Isolde Adler Letzte Vorlesung: Korrespondenz zwischen der Page-Rank-Eigenschaft und Eigenvektoren zum Eigenwert 1 der Page-Rank-Matrix Markov-Ketten

Mehr

Suchmaschinen und ihre Architektur. Seminar: Angewandtes Information Retrieval Referat von Michael Wirz

Suchmaschinen und ihre Architektur. Seminar: Angewandtes Information Retrieval Referat von Michael Wirz Suchmaschinen und ihre Architektur Seminar: Angewandtes Information Retrieval Referat von Michael Wirz Ziel Rudimentäre Grundkenntnisse über die Funktionsweise von Suchmaschinen und Trends Einführung in

Mehr

1. Was war zuerst da - das Internet oder Google? Ein kurzer Rückblick

1. Was war zuerst da - das Internet oder Google? Ein kurzer Rückblick 1. Was war zuerst da - das Internet oder Google? Ein kurzer Rückblick 1. 1 Die Geschichte der Suchmaschinen - 1990 Archie - 1991 Gopher - 30. April 1993: Das World Wide Web wird zur allgemeinen Nutzung

Mehr

Web Information Retrieval. Web Information Retrieval. Informationssuche im Web Typen von Web-Suche (nach Andrei Broder) Das World Wide Web

Web Information Retrieval. Web Information Retrieval. Informationssuche im Web Typen von Web-Suche (nach Andrei Broder) Das World Wide Web Web Information Retrieval Web Information Retrieval Ingo Frommholz / Norbert Fuhr 30. Januar 2012 Informationssuche im Web Browsing und Suche Beispiel einer Web-Suchmaschine: Google Hypertext und Web IR

Mehr

OPERATIONEN AUF EINER DATENBANK

OPERATIONEN AUF EINER DATENBANK Einführung 1 OPERATIONEN AUF EINER DATENBANK Ein Benutzer stellt eine Anfrage: Die Benutzer einer Datenbank können meist sowohl interaktiv als auch über Anwendungen Anfragen an eine Datenbank stellen:

Mehr

Jakarta Lucene. Eine Java-Bibliothek zur Suchindex-Erstellung. Seminararbeit Tilman Schneider

Jakarta Lucene. Eine Java-Bibliothek zur Suchindex-Erstellung. Seminararbeit Tilman Schneider Jakarta Lucene Eine Java-Bibliothek zur Suchindex-Erstellung Seminararbeit Tilman Schneider 2004 Tilman Schneider Seminararbeit: Jakarta Lucene Folie 1 Agenda Definition: Suchmaschine Vorstellung von Jakarta

Mehr

SuchmaschinenOptimierung

SuchmaschinenOptimierung V 1 w Daniel Koch SuchmaschinenOptimierung Website-Marketing für Entwickler ADDISON-WESLEY An imprint of Pearson Education München Boston San Francisco Harlow, England Don Mills, Ontario Sydney Mexico

Mehr

Ebsco Business Source Premier: Recherche

Ebsco Business Source Premier: Recherche Ebsco Business Source Premier: Recherche Wenn Sie in der Datenbank Business Source Premier recherchieren wollen müssen Sie diese auf der Startseite auswählen: Choose Databases: Business Source Premier

Mehr

Was ist Custom Search?

Was ist Custom Search? Custom Search Was ist Custom Search? Benutzerdefinierte Suchmaschine Eingrenzen der zu durchsuchenden Seiten oder Hervorheben priorisierter Seiten in der Websuche Gestaltung des Aussehens der Eingabeleiste

Mehr

Die folgenden Features gelten für alle isquare Spider Versionen:

Die folgenden Features gelten für alle isquare Spider Versionen: isquare Spider Die folgenden s gelten für alle isquare Spider Versionen: webbasiertes Management (Administratoren) Monitoring Sichten aller gefundenen Beiträge eines Forums Statusüberprüfung Informationen

Mehr

Datenschutzerklärung ENIGO

Datenschutzerklärung ENIGO Datenschutzerklärung ENIGO Wir, die, nehmen den Schutz Ihrer persönlichen Daten sehr ernst und halten uns strikt an die Regeln der Datenschutzgesetze. Personenbezogene Daten werden auf dieser Website nur

Mehr

Erklärung der Webalizer Statistik

Erklärung der Webalizer Statistik Webhost Linux Erklärung der Webalizer Statistik - 1 - Erklärung der Webalizer-Statistik Dieses Dokument beschreibt den Aufbau der Auswertung der Webserver-Statistiken. Die Auswertungen sind täglich ab

Mehr

Web Data Mining. Alexander Hinneburg Sommersemester 2007

Web Data Mining. Alexander Hinneburg Sommersemester 2007 Web Data Mining Alexander Hinneburg Sommersemester 2007 Termine Vorlesung Mi. 10:00-11:30 Raum?? Übung Mi. 11:45-13:15 Raum?? Klausuren Mittwoch, 23. Mai Donnerstag, 12. Juli Buch Bing Liu: Web Data Mining

Mehr

Geschichte der Suchmaschinen und heutige Vernetzungsstrukturen

Geschichte der Suchmaschinen und heutige Vernetzungsstrukturen Geschichte der Suchmaschinen und heutige Vernetzungsstrukturen Seminar Web Suchmaschinen - WS0304 I. Was gab es vor den WWW Suchmaschinen II. Die Geschichte der WWW Suchmaschinen III. Zusammenfassung und

Mehr

Suchen und finden mit. Treff 24.10. 2012 Heinz Cronimund

Suchen und finden mit. Treff 24.10. 2012 Heinz Cronimund Suchen und finden mit Treff 24.10. 2012 Heinz Cronimund Inhalt Wissenswertes zu Suchmaschinen Seite 3 Google - Benutzeroberfläche Google Dienste 7 - Einfache Suchen 9 - Optimierte Suchen mit Operatoren

Mehr

Themenschwerpunkt Social SEO

Themenschwerpunkt Social SEO Themenschwerpunkt Social SEO Der soziale Einfluss in die Ergebnisse der Google- Suche Definition Social SEO Social SEO bezeichnet Maßnahmen zur Steigerung der persönlichen bzw. emotionalen Ansprache der

Mehr

Peter Dikant mgm technology partners GmbH. Echtzeitsuche mit Hadoop und Solr

Peter Dikant mgm technology partners GmbH. Echtzeitsuche mit Hadoop und Solr Peter Dikant mgm technology partners GmbH Echtzeitsuche mit Hadoop und Solr ECHTZEITSUCHE MIT HADOOP UND SOLR PETER DIKANT MGM TECHNOLOGY PARTNERS GMBH WHOAMI peter.dikant@mgm-tp.com Java Entwickler seit

Mehr

Willkommen. Benutzerhandbuch für die OECD Online-Bibliothek

Willkommen. Benutzerhandbuch für die OECD Online-Bibliothek Willkommen Benutzerhandbuch für die OECD Online-Bibliothek Startseite Sie haben drei Möglichkeiten, zu den Studien und Statistiken der OECD zu gelangen: Klicken Sie oben auf die Kategorie, für die Sie

Mehr

Indexstrukturen in XML

Indexstrukturen in XML Seminar XML und Datenbanken Indexstrukturen in XML Vanessa Schäfer 07.02.2003 Übersicht Einführung Indexstrukturen in XML Ein Vergleich SphinX vs. Lore Zusammenfassung und Ausblick Seminar XML und Datenbanken

Mehr

SEMT. Prof. G. Bengel. Searching as a Service (Programming Model: MapReduce)

SEMT. Prof. G. Bengel. Searching as a Service (Programming Model: MapReduce) Hochschule Mannheim Fakultät für Informatik SEMT Prof. G. Bengel Sommersemester 2009 Semester 8I Searching as a Service (Programming Model: MapReduce) Michel Schmitt (520361) 1.06.2009 Inhalt 1. Einführung...

Mehr

I N T E R N E T. Einsteigerkurs. Teil 6 Suchmaschinen

I N T E R N E T. Einsteigerkurs. Teil 6 Suchmaschinen I N T E R N E T Einsteigerkurs Teil 6 Definition(Wikipedia) Teil 6 Was ist eine Suchmaschine? Eine Suchmaschineist ein Programm zur Recherche von Dokumenten, die in einem Computer oder einem Computernetzwerk

Mehr

FLOCOM. Google beachtet nicht die Groß- bzw. Kleinschreibung: KOCHREZEPTE, kochrezepte und Kochrezepte bringen alle das gleiche Ergebnis.

FLOCOM. Google beachtet nicht die Groß- bzw. Kleinschreibung: KOCHREZEPTE, kochrezepte und Kochrezepte bringen alle das gleiche Ergebnis. Suchmaschinen richtig Mit über 200 Millionen Suchanfragen täglich hat sich Google zu der wichtigsten und meist genutzten Suchmaschine im WWW entwickelt. Deshalb werden wir für unsere Übungen auch Google

Mehr

Aktenverwaltung einfach gemacht

Aktenverwaltung einfach gemacht Aktenverwaltung einfach gemacht Das Problem Der sichere und schnelle Zugriff auf Geschäftsakten und - Dokumente ist das Rückgrat jedes betrieblichen Informations- Management-Systems und kann wesentlich

Mehr

Ein kleines Computer-Lexikon

Ein kleines Computer-Lexikon Stefan Edelmann 10b NIS-Klasse Ein kleines Computer-Lexikon Mainboard Die Hauptplatine! Sie wird auch Motherboard genannt. An ihr wird das gesamte Computerzubehör angeschlossen: z.b. Grafikkarte Soundkarte

Mehr

Suchmaschinenalgorithmen. Vortrag von: Thomas Müller

Suchmaschinenalgorithmen. Vortrag von: Thomas Müller Suchmaschinenalgorithmen Vortrag von: Thomas Müller Kurze Geschichte Erste Suchmaschine für Hypertexte am CERN Erste www-suchmaschine World Wide Web Wanderer 1993 Bis 1996: 2 mal jährlich Durchlauf 1994:

Mehr

kleines keyword brevier Keywords sind das Salz in der Suppe des Online Marketing Gordian Hense

kleines keyword brevier Keywords sind das Salz in der Suppe des Online Marketing Gordian Hense Keywords sind das Salz in der Suppe des Online Marketing Keywords - Das Salz in der Suppe des Online Marketing Keyword Arten Weitgehend passende Keywords, passende Wortgruppe, genau passende Wortgruppe

Mehr

Übersicht. Grundidee des Indexing Lucene Wichtige Methoden und Klassen Lucene Indizierungsbeispiele Lucene Suchbeispiele Lucene QueryParser Syntax

Übersicht. Grundidee des Indexing Lucene Wichtige Methoden und Klassen Lucene Indizierungsbeispiele Lucene Suchbeispiele Lucene QueryParser Syntax Indizierung Lucene Übersicht Grundidee des Indexing Lucene Wichtige Methoden und Klassen Lucene Indizierungsbeispiele Lucene Suchbeispiele Lucene QueryParser Syntax Grundideen und Ziel des Indexing Effizientes

Mehr

Es gibt situationsabhängig verschiedene Varianten zum Speichern der Dokumente. Word bietet im Menü DATEI unterschiedliche Optionen an.

Es gibt situationsabhängig verschiedene Varianten zum Speichern der Dokumente. Word bietet im Menü DATEI unterschiedliche Optionen an. 3. SPEICHERN DATEIEN SPEICHERN Dateien werden in Word Dokumente genannt. Jede Art von Datei, die Sie auf Ihrem Computer neu erstellen, befindet sich zuerst im Arbeitsspeicher des Rechners. Der Arbeitsspeicher

Mehr

Suchmaschinenoptimierung SEO

Suchmaschinenoptimierung SEO Mai 2013 Bei der Suchmaschinenoptimierung (search engine optimization SEO) wird der Internetauftritt im Hinblick auf Suchmaschinen optimiert. Im Folgenden geben wir Ihnen einige Tipps, die Sie bei der

Mehr

Universitätsbibliothek. Technische Universität München. Internetsuche. Wissenswertes und Wissenschaftliches

Universitätsbibliothek. Technische Universität München. Internetsuche. Wissenswertes und Wissenschaftliches Internetsuche Wissenswertes und Wissenschaftliches 1. Allgemeine Suchmaschinen 2 Gezielter Suchen in Google Bestimmt nutzen Sie allgemeine Suchmaschinen (beinahe) täglich. Allerdings ist die Menge und

Mehr

Black-Hat Search Engine Optimization (SEO) Practices for Websites

Black-Hat Search Engine Optimization (SEO) Practices for Websites Beispielbild Black-Hat Search Engine Optimization (SEO) Practices for Websites Damla Durmaz - 29. Januar. 2009 Proseminar Technisch Informatik Leitung: Georg Wittenburg Betreuer: Norman Dziengel Fachbereich

Mehr

SolarWinds Engineer s Toolset

SolarWinds Engineer s Toolset SolarWinds Engineer s Toolset Die Discovery Tools Das Engineer s Toolset ist eine Sammlung von 49 wertvoller und sinnvoller Netzwerktools. Die Schwerpunkte liegen in den Bereichen Discovery Tools, Monitoring

Mehr

Suchmaschinen Grundlagen. Thomas Grabowski

Suchmaschinen Grundlagen. Thomas Grabowski Suchmaschinen Grundlagen Thomas Grabowski 1 / 45 Überblick 1. Einleitung 2. Suchmaschinen Architektur 3. Crawling-Prozess 4. Storage 5. Indexing 6. Ranking 2 / 45 1. Einleitung Der Webgraph unterliegt

Mehr

Apache Lucene. Mach s wie Google! Bernd Fondermann freier Software Architekt bernd.fondermann@brainlounge.de berndf@apache.org

Apache Lucene. Mach s wie Google! Bernd Fondermann freier Software Architekt bernd.fondermann@brainlounge.de berndf@apache.org Apache Lucene Mach s wie Google! Bernd Fondermann freier Software Architekt bernd.fondermann@brainlounge.de berndf@apache.org 1 Apache Apache Software Foundation Software free of charge Apache Software

Mehr

Inverted Files for Text Search Engines

Inverted Files for Text Search Engines Inverted Files for Text Search Engines Justin Zobel, Alistair Moffat PG 520 Intelligence Service Emel Günal 1 Inhalt Einführung Index - Inverted Files - Indexkonstruktion - Indexverwaltung Optimierung

Mehr

David Mika. Donnerstag, den 15. März 2012. Verein zur Förderung der privaten Internet Nutzung e.v. Suchen und Finden im Internet. david@ping.

David Mika. Donnerstag, den 15. März 2012. Verein zur Förderung der privaten Internet Nutzung e.v. Suchen und Finden im Internet. david@ping. Suchen im David Mika Verein zur Förderung der privaten Nutzung e.v. Donnerstag, den 15. März 2012 Themenüberblick 1 2 3 4 5 6 Informationsflut im Jeder kann schnell und einfach Dokumente publizieren Aktuell

Mehr

Neue Funktionen in Virthos 3.2

Neue Funktionen in Virthos 3.2 Neue Funktionen in Virthos 3.2 Stand: 03.02.2012 Neue Funktionen in Virthos 3.2 Automatische Bildskalierung Automatische Bildskalierung Der vtmedia-platzhalter erlaubt ab der Virthos-Version 3.2 einen

Mehr

Kooperativer Speicher: Schwächen und Gegenmaßnahmen

Kooperativer Speicher: Schwächen und Gegenmaßnahmen Kooperativer Speicher: Schwächen und Gegenmaßnahmen Cooperative storage: weaknesses and countermeasures Lutz Behnke 2. Dezember 2005 2005 Lutz Behnke 1 /home/sage/texte/haw/master/seminar/coop_storage_failure.sxi

Mehr

Schnellanleitung. (Version für Microsoft Windows)

Schnellanleitung. (Version für Microsoft Windows) Schnellanleitung (Version für Microsoft Windows) Inhalt: Wondershare PDF Converter Pro installieren... 2 Wondershare PDF Converter Pro starten... 2 PDF-Dokument hinzufügen... 4 Ausgabevariante wählen...

Mehr

Recommended Search Engine Optimization

Recommended Search Engine Optimization Beispielbild Recommended Search Engine Optimization by Ralf Kuschel Student, Freie Universität Berlin Directory 2 Architektur 3 Architektur Document Index übernimmt die Datenverwaltung teilt Dokumenten

Mehr

Internet-Suchmaschinen Ein kurzes Exposee zu drei wichtigen Informationsseiten im Internet. 04.03.2012 Computeria Rorschach Roland Liebing

Internet-Suchmaschinen Ein kurzes Exposee zu drei wichtigen Informationsseiten im Internet. 04.03.2012 Computeria Rorschach Roland Liebing Internet-Suchmaschinen Ein kurzes Exposee zu drei wichtigen Informationsseiten im Internet 04.03.2012 Computeria Rorschach Roland Liebing Internet-Suchmaschinen Eine Suchmaschine ist ein Programm zur Recherche

Mehr

Praktikum Information Retrieval Wochen 12: Suchmaschine

Praktikum Information Retrieval Wochen 12: Suchmaschine Praktikum Information Retrieval Wochen 12: Suchmaschine Melikka Khosh-Niat Matthias Jordan 23. Mai 3. Juni 2011 Lösungen: Upload bis 3. Juni 2011 Aktuelle Informationen, Ansprechpartner, Material und Upload

Mehr

RIS-ABFRAGEHANDBUCH REGIERUNGSVORLAGEN

RIS-ABFRAGEHANDBUCH REGIERUNGSVORLAGEN RIS-ABFRAGEHANDBUCH REGIERUNGSVORLAGEN 1 Überblick Die Dokumentation der Regierungsvorlagen ist eine Teilapplikation des Rechtsinformationssystems der Republik Österreich (RIS) und wird vom Bundeskanzleramt

Mehr

Industrie- und Handelskammer Stuttgart

Industrie- und Handelskammer Stuttgart Industrie- und Handelskammer Stuttgart SUCHMASCHINEN-OPTIMIERUNG die vorderen Plätze bei Google, Yahoo & Co 1. Über Beyond Media 2. Erste Schritte 3. freundliche 4. Arbeitsweise 5. Bewertungsmethoden 6.

Mehr

Produktentwicklung damit sollten Sie rechnen

Produktentwicklung damit sollten Sie rechnen Produktentwicklung damit sollten Sie rechnen 0. Zusammenfassung Wer Produktentwicklung betreiben will, muss in erster Linie sehr viel lesen: Dokumente aus unterschiedlichsten Quellen und in vielen Formaten.

Mehr

RIS-ABFRAGEHANDBUCH REICHS-, STAATS- UND BUNDESGESETZBLATT 1848 1940

RIS-ABFRAGEHANDBUCH REICHS-, STAATS- UND BUNDESGESETZBLATT 1848 1940 RIS-ABFRAGEHANDBUCH REICHS-, STAATS- UND BUNDESGESETZBLATT 1848 1940 1 Überblick Die Dokumentation der Reichs-, Staats- und Bundesgesetzblätter 1848 bis 1940 ist eine Teilapplikation des Rechtsinformationssystems

Mehr

Übung Medienretrieval WS 07/08 Thomas Wilhelm, Medieninformatik, TU Chemnitz

Übung Medienretrieval WS 07/08 Thomas Wilhelm, Medieninformatik, TU Chemnitz 02_Grundlagen Lucene Übung Medienretrieval WS 07/08 Thomas Wilhelm, Medieninformatik, TU Chemnitz Was ist Lucene? (1) Apache Lucene is a high-performance, full-featured text search engine library written

Mehr

Deep Web Suchen wir was man finden könnte?

Deep Web Suchen wir was man finden könnte? Deep Web Suchen wir was man finden könnte? Dr. Dirk Lewandowski dirk.lewandowski@uni-duesseldorf.de www.durchdenken.de/lewandowski Gliederung Die Bedeutung des Deep Web Die Größe des Deep Web Strategien

Mehr

Seminar Peer-to-Peer Netzwerke 06/07

Seminar Peer-to-Peer Netzwerke 06/07 YaCy: P2P Web-Suchmaschine Seminar Peer-to-Peer Netzwerke 06/07 Lehrstuhl für Rechnernetze und Telematik Albert-Ludwigs-Universität Freiburg Fakultät für Angewandte Wissenschaften Daniel Rebei daniel@rebei.de

Mehr

Arbeiten mit Datenbanken

Arbeiten mit Datenbanken Prof. Dr. Rüdiger Zarnekow TU Berlin, Fakultät VII Kommunikationsmanagement Kommunikationsmanagement Inhalte und Ziele 1. wichtige Hinweise 2. Freie Datenbanken der TU 3. Schlagwortsuche 4. Übung 1 5.

Mehr

1. Wie findet man Dinge? 2. Und wie findet man Sie wieder?

1. Wie findet man Dinge? 2. Und wie findet man Sie wieder? Suchen im Internet Internet und Webseiten-Gestaltung Wirtschaftsinformatik 3 Vorlesung 2005-05-27 Dipl.-Inf. (FH) T. Mättig 1. Wie findet man Dinge? 2. Und wie findet man Sie wieder?? 2004-05-27 Internet

Mehr

Die Statistiken von SiMedia

Die Statistiken von SiMedia Die Statistiken von SiMedia Unsere Statistiken sind unter folgender Adresse erreichbar: http://stats.simedia.info Kategorie Titel Einfach Erweitert Übersicht Datum und Zeit Inhalt Besucher-Demographie

Mehr

Grundlagen DNS 1/5. DNS (Domain Name System)

Grundlagen DNS 1/5. DNS (Domain Name System) Grundlagen DNS 1/5 DNS (Domain Name System) Weltweit gibt es 13 zentrale DNS-Server (Root-Nameserver), auf denen die verschiedenen Domains abgelegt sind. Der Domönennamensraum bzw. das Domain Name Space

Mehr

Anleitung, WebRecherche

Anleitung, WebRecherche 1 Warum dieses Programm? Anleitung, WebRecherche Wer kennt es nicht: Man will möglichst viele Informationen zu einem Thema oder einem Produkt sammeln. Also entsprechende Suchbegriffe in die Suchmaschine

Mehr

Nachteile Boolesches Retrieval

Nachteile Boolesches Retrieval Nachteile Boolesches Retrieval Komplizierte Anfragen Häufigkeit bzw. Relevanz der Terme in den Dokumenten nicht berücksichtigt 2 von 3 UND-verknüpften Termen im Dokument so schlecht wie 0 Terme Keine Rangfolge

Mehr

Daniel Heß. Donnerstag, den 16. November 2006. Verein zur Förderung der privaten Internet Nutzung e.v. Wie funktioniert das Internet? dh@ping.

Daniel Heß. Donnerstag, den 16. November 2006. Verein zur Förderung der privaten Internet Nutzung e.v. Wie funktioniert das Internet? dh@ping. Daniel Heß Verein zur Förderung der privaten Internet Nutzung e.v. Donnerstag, den 16. November 2006 Was ist Ein globales Netzwerk von Computern und Kommunikationsgeräten Quelle für eine fast unendliche

Mehr

Herzlich willkommen an der Universitätsbibliothek in Landau

Herzlich willkommen an der Universitätsbibliothek in Landau Herzlich willkommen an der Universitätsbibliothek in Landau Richtig recherchieren im Internet zu der Schulung: Internetrecherche leicht gemacht Was erwartet Sie? 1. Welche Internet-Suchdienste gibt es

Mehr

Anleitung Webalizer. Inhaltsverzeichnis

Anleitung Webalizer. Inhaltsverzeichnis Inhaltsverzeichnis. Aufgabe / Nutzen des s... 2. Allgemeine Informationen...2.2 Begriffserklärungen...2 2. Zugang zum... 2 3. Die Eingangsseite... 3 4. Die Monatsübersichten und Tagesübersichten... 3 4.

Mehr

staffitpro WEB Produkte und Lizenzen (SaaS) (Ergänzung zu Allgemeine Geschäftsbedingungen audeosoft GmbH staffitpro Web-SaaS )

staffitpro WEB Produkte und Lizenzen (SaaS) (Ergänzung zu Allgemeine Geschäftsbedingungen audeosoft GmbH staffitpro Web-SaaS ) staffitpro WEB Produkte und Lizenzen (SaaS) (Ergänzung zu Allgemeine Geschäftsbedingungen audeosoft GmbH staffitpro Web-SaaS ) Verantwortlich für den Inhalt: audeosoft GmbH, Kreuzberger Ring 44a, 65205

Mehr

Grundlagen der Rechnerarchitektur

Grundlagen der Rechnerarchitektur Grundlagen der Rechnerarchitektur Einführung Unsere erste Amtshandlung: Wir schrauben einen Rechner auf Grundlagen der Rechnerarchitektur Einführung 2 Vorlesungsinhalte Binäre Arithmetik MIPS Assembler

Mehr

6.2 FAT32 Dateisystem

6.2 FAT32 Dateisystem 6.2 FAT32 Dateisystem Dateisystem für Windows 98 einige Unterschiede zum Linux-Dateisystem EXT2: keine Benutzeridentifikation für Dateien und Verzeichnisse! Partitionen werden durch Laufwerke repräsentiert,

Mehr

Lösungen zur Lernzielkontrolle Internet

Lösungen zur Lernzielkontrolle Internet Lösungen zur Lernzielkontrolle Internet 18 Fragen 1. Was ist das Internet im Vergleich zum WWW? 2. Ein ISP ist WWW ist ein Dienst des Internets ein Anbieter von Internetdiensten 3. Was ist bei der Adresse

Mehr

SharePoint 2013 als Wissensplattform

SharePoint 2013 als Wissensplattform SharePoint 2013 als Wissensplattform Daniel Dobrich & Darius Kaczmarczyk 29.11.2012 7. SharePoint UserGroup Hamburg Treffen 1 Themen Verwaltete Metadaten in SharePoint 2013 Was sind verwaltete Metadaten

Mehr

MATCHING VON PRODUKTDATEN IN DER CLOUD

MATCHING VON PRODUKTDATEN IN DER CLOUD MATCHING VON PRODUKTDATEN IN DER CLOUD Dr. Andreas Thor Universität Leipzig 15.12.2011 Web Data Integration Workshop 2011 Cloud Computing 2 Cloud computing is using the internet to access someone else's

Mehr

Dateiorganisation und Zugriffsstrukturen

Dateiorganisation und Zugriffsstrukturen Dateiorganisation und Zugriffsstrukturen Prof. Dr. T. Kudraß 1 Mögliche Dateiorganisationen Viele Alternativen existieren, jede geeignet für bestimmte Situation (oder auch nicht) Heap-Dateien: Geeignet

Mehr

In diesem Abschnitt wollen wir uns mit der Architektur von Datenbank Managements Systemen beschäftigen.

In diesem Abschnitt wollen wir uns mit der Architektur von Datenbank Managements Systemen beschäftigen. 1 In diesem Abschnitt wollen wir uns mit der Architektur von Datenbank Managements Systemen beschäftigen. Zunächst stellt sich die Frage: Warum soll ich mich mit der Architektur eines DBMS beschäftigen?

Mehr

1 von 5 03.03.2010 19:10

1 von 5 03.03.2010 19:10 Statistik für kindgerechte-schule.ch (-02) - main 1 von 5 03.03. 19:10 Zuletzt aktualisiert: 03.03. - 15:55 Zeitraum: OK Zeitraum Monat Feb Erster Zugriff 01.02. - 00:18 Letzter Zugriff 28.02. - 23:53

Mehr

Architektur und Implementierung von Apache Derby

Architektur und Implementierung von Apache Derby Architektur und Implementierung von Apache Derby Das Zugriffssystem Carsten Kleinmann, Michael Schmidt TH Mittelhessen, MNI, Informatik 16. Januar 2012 Carsten Kleinmann, Michael Schmidt Architektur und

Mehr

CPU (Prozessor), Festplatte, Grafikkarte, Soundkarte, diverse Schnittstelle (USB, COM, SERIELL), Arbeitsspeicher (RAM), ROM, CD/DVD-Laufwerk

CPU (Prozessor), Festplatte, Grafikkarte, Soundkarte, diverse Schnittstelle (USB, COM, SERIELL), Arbeitsspeicher (RAM), ROM, CD/DVD-Laufwerk FRAGEKATALOG Informatik BAKIP HARDWARE Frage 01: Im inneren eines Computergehäuses befindet sich unter anderem das Mainboard. Welche Komponenten sind an diesem Mutterbrett angeschlossen bzw. verbaut? Nenne

Mehr

Federated Search: Integration von FAST DataSearch und Lucene

Federated Search: Integration von FAST DataSearch und Lucene Federated Search: Integration von FAST DataSearch und Lucene Christian Kohlschütter L3S Research Center BSZ/KOBV-Workshop, Stuttgart 24. Januar 2006 Christian Kohlschütter, 24. Januar 2006 p 1 Motivation

Mehr

Online Suchsystem Guide

Online Suchsystem Guide Liebe Kreative, auf den folgenden Seiten möchten wir Euch einige Hinweise geben, die den Umgang mit der Suchmaschine erleichtern und Euch dabei helfen sollen, schnell und zielsicher zur passenden Musik

Mehr

Maßgeschneiderte Suchmaschinen

Maßgeschneiderte Suchmaschinen Maßgeschneiderte Suchmaschinen Usability Stammtisch Frankfurt am Main 17.11.2009 Walter Ebert Web Development www.walterebert.de Braucht meine Website eine Suchmachine? Wahrscheinlich, wenn: Eine gute

Mehr

So machen Sie Kunden auf das eigene Angebot aufmerksam Seite 9

So machen Sie Kunden auf das eigene Angebot aufmerksam Seite 9 So machen Sie Kunden auf das eigene Angebot aufmerksam Seite 9 So funktionieren Google & Co Seite 12 Was Sie über natürliche Suchergebnisse und Anzeigen bei Google wissen sollten Seite 13 Warum Sie global

Mehr

SolarWinds Engineer s Toolset

SolarWinds Engineer s Toolset SolarWinds Engineer s Toolset Diagnostic Tools Das Engineer s Toolset ist eine Sammlung von 49 wertvoller und sinnvoller Netzwerktools. Die Nr. 1 Suite für jeden Administrator! Die Schwerpunkte liegen

Mehr

Motivation. Inhalt. URI-Schemata (1) URI-Schemata (2)

Motivation. Inhalt. URI-Schemata (1) URI-Schemata (2) 14. URIs Uniform Resource Identifier 14-1 14. URIs Uniform Resource Identifier 14-2 Motivation Das WWW ist ein Hypermedia System. Es enthält: Resourcen (Multimedia Dokumente) Verweise (Links) zwischen

Mehr

Wie man einen neuen Index einrichtet

Wie man einen neuen Index einrichtet B E N U T Z E R D O K U M E N TAT I O N ( A L E P H I N O 5. 0 ) Wie man einen neuen Index einrichtet Alephino Version 5.0 1/9 zuletzt aktualisiert: 04.07.2014 INHALT 1) Einführung.3 2) Definition Indexdatei

Mehr

DIE SUCHFUNKTION VON WINDOWS 7

DIE SUCHFUNKTION VON WINDOWS 7 DIE SUCHFUNKTION VON WINDOWS 7 Vorbemerkung Im Anschluss an den Vortrag dieses Themas bei den PC-Senioren LB am 05.07.2012 habe ich aufgrund verschiedener Reaktionen und Fragen einzelner Zuhörer festgestellt,

Mehr

im folgenden eine ausführliche Keyword-Analyse von cosmobutler.com.

im folgenden eine ausführliche Keyword-Analyse von cosmobutler.com. www.seosuisse.ch info@seosuisse.ch Zilmattweg 1 6403 Küssnacht Aug 15, 2014 Ihre persönliche Keyword-Analyse für cosmobutler.com Sehr geehrter Herr Beninca im folgenden eine ausführliche Keyword-Analyse

Mehr

Datenschutzerklärung. Published: 2009-08-03 Author: 42media services GmbH

Datenschutzerklärung. Published: 2009-08-03 Author: 42media services GmbH Datenschutzerklärung Published: 2009-08-03 Author: 42media services GmbH Inhaltsverzeichnis Datenschutzerklärung... 4 Datenverarbeitung auf dieser Internetseite... 4 Cookies... 4 Newsletter... 4 Auskunftsrecht...

Mehr

Zusammenfassung der letzten Vorlesungen. - Ergänzungen zu Menüs /Sprachumschaltung. - indexed search

Zusammenfassung der letzten Vorlesungen. - Ergänzungen zu Menüs /Sprachumschaltung. - indexed search Websiteentwicklung auf Basis vontypo3 Extensions -10- Zusammenfassung der letzten Vorlesungen - Ergänzungen zu Menüs /Sprachumschaltung - Extensions - indexed search 1 TYPO3 Entwicklung Footernavigation

Mehr

Algorithmen und Datenstrukturen (ESE) Entwurf, Analyse und Umsetzung von Algorithmen (IEMS) WS 2014 / 2015. Vorlesung 5, Donnerstag, 20.

Algorithmen und Datenstrukturen (ESE) Entwurf, Analyse und Umsetzung von Algorithmen (IEMS) WS 2014 / 2015. Vorlesung 5, Donnerstag, 20. Algorithmen und Datenstrukturen (ESE) Entwurf, Analyse und Umsetzung von Algorithmen (IEMS) WS 2014 / 2015 Vorlesung 5, Donnerstag, 20. November 2014 (Wie baut man eine Hash Map, Universelles Hashing)

Mehr

Angewandtes Information Retrieval

Angewandtes Information Retrieval Angewandtes Information Retrieval Web Retrieval Enterprise Search Urs Hengartner (hengart@acm.org) Universität Basel HS 2015 Terminplan 25.09.2015 Motivation, Einführung und Übersicht 02.10.2015 Basiskonzepte

Mehr

Suchmaschinenoptimierung in der Praxis

Suchmaschinenoptimierung in der Praxis Suchmaschinenoptimierung in der Praxis So steigern Sie die Zugriffe auf Ihre Webseite. Frank Jäger, Präsentation am 11. Juni 2010, 1 Überblick Suchmaschinenoptimierung in der Theorie Aufbau der Google-Suchergebnisseite

Mehr

ht://dig WWW Search Engine Software

ht://dig WWW Search Engine Software ht://dig WWW Search Engine Software Ruprecht-Karls-Universität Heidelberg Seminar für Computerlinguistik Kurs: Information Retrieval Leitung: PD Dr. Karin Haenelt 22.01.2007 Erwin Glockner Übersicht Einführung

Mehr

Anmerkungen zur Erstellung, dem automatisierten Versand und der automatisierten Auswertung von pdf-formularen

Anmerkungen zur Erstellung, dem automatisierten Versand und der automatisierten Auswertung von pdf-formularen Anmerkungen zur Erstellung, dem automatisierten Versand und der automatisierten Auswertung von pdf-formularen Vorbemerkung Häufig besteht die Notwendigkeit pdf-formulare Kunden, Mitarbeitern etc. zur Verfügung

Mehr

Zur Funktionsweise von Suchmaschinen

Zur Funktionsweise von Suchmaschinen Zur Funktionsweise von Suchmaschinen Wie in dem Beitrag zur Geschichte des Internets schon beschrieben, ist das Internet eine Vernetzung von Computern, die zunächst einmal so aussieht wie ein verwirrendes

Mehr

Universität Bielefeld Technische Fakultät AG Rechnernetze und verteilte Systeme. Vorlesung 4: Memory. Wintersemester 2001/2002. Peter B.

Universität Bielefeld Technische Fakultät AG Rechnernetze und verteilte Systeme. Vorlesung 4: Memory. Wintersemester 2001/2002. Peter B. Universität Bielefeld Technische Fakultät AG Rechnernetze und verteilte Systeme Vorlesung 4: Memory Peter B. Ladkin Address Translation Die Adressen, die das CPU benutzt, sind nicht identisch mit den Adressen,

Mehr

Woher kommt die Idee Internet?

Woher kommt die Idee Internet? Woher kommt die Idee Internet? Aus den USA kommt die Idee. Nachdem die UdSSR 1957 den ersten Satelliten ins All schoss, fühlt en die USA sich bedroht. Die USA suchte nun eine Möglichkeit auch wenn das

Mehr