Recherchieren im Internet: Wie funktionieren Suchmaschinen? Steffen-Peter Ballstaedt

Ähnliche Dokumente
Erfolgreich suchen im Internet

Suchen, um zu finden. Sta,s,k BRD (Quelle: Comscore, 2013) Beziehungsgeflecht der Suchmaschinen. Antworten auf folgende Fragen:

limlhaidftswgirzälhimds

Inhaltsverzeichnis 1 Einführung 2 Formen der Suche im Web 3 Wie Suchmaschinen funktionieren

I N T E R N E T. Einsteigerkurs. Teil 6 Suchmaschinen

Recherchieren im Internet

Urbacher-Computer-Forum. Herzlich Willkommen!

Bibliotheken vs. Google? Literaturrecherche im Internet

Was bedeutet der Begriff:

Was Google nicht findet gibt es nicht

Auf der Zielgeraden. Veranstaltung für die Oberstufe. Bücherei & Recherche

David Mika. Donnerstag, den 15. März Verein zur Förderung der privaten Internet Nutzung e.v. Suchen und Finden im Internet.

Wer suchet, der findet

Suchmaschinenoptimierung in der Praxis

Wissenschaftliche Suchmaschinen

Suchmaschinenoptimierung (SEO) Die Grundlagen was Sie wissen sollten?

Facharbeitsrecherche. Eva Ottersbach

Suchstrategien und Suchinstrumente

Neue wissenschaftliche Informations- und Rechercheangebote als Grundlage für Seminar-/Oberstufenkurse an Gymnasien.

Webarchiv Schweiz. Ausbildung, Teil 1: Sammeln. 8. und 14. März 2007 Silvia Hofmann / Jean-Philippe Accart

Alternativen zu Google. Prof. Dr. Dirk Lewandowski

Eine zentrale Recherche-Plattform für Bibliotheksressourcen

Suchmaschinenoptimierung (SEO) Die Grundlagen was Sie wissen sollten?

Welche Dienste/Serverarten aus dem Internet gehören zu folgenden Adressen? 2

Dirk Lewandowski. Web Information Retrieval Technologien zur Informationssuche im Internet. DGI-Schrift (Informationswissenschaft 7}

Warum Suche (trotzdem) bedeutend ist

Google meets Social Media: Wie sich Xing, Facebook & Co. im Google-Index auswirken.

Suchmaschinen und das Web 2.0

Familienforschung im Internet

Ich google einfach, oder?

Suchen und Finden von Informationen Technik und Management

Internet und die Folge - 2

CONTENT MARKETING 2.0.

Bestandteile dieser Lektion. 1. Definition und Zielsetzung

Was Bibliotheken von Suchmaschinen lernen können. Prof. Dr. Dirk Lewandowski

Einführung in die Informationsrecherche. Julia Wäger / Mediothek BKS / 2017

Von wem wir abhängig sind Über die Auffindbarkeit von Informationen

Im Internet gefunden werden

Eine zentrale Recherche-Plattform für Bibliotheksressourcen

Mit dem ipad. Webseiten aufrufen. Kapitel

1. Finden statt Suchen Der kürzeste Weg zu den besten Webseiten

Suchen leicht gemacht

Neue Suchmaschine: Discovery-System Summon

4. Priorität Gäste binden!.und zu wiederkehrenden Besuchern und FreundenIhres Hotels machen.

Whitepaper. Die 5 besten Profi-Tipps für Suchmaschinenoptimierung. So wirst Du für Google & Co. zum Treffer

Web of Science - Kurzinformation

Computeria Dietikon 30. Juni Suchmaschinen. Hans-Ueli Preisig, Computeria-Dietikon

Die Suchmaschine für internationale Entwicklung und Frauen*Gender

Geschichte des Internets Suchmaschinen Fachinformationszentren. Institute for Science Networking

Literaturrecherche in Fachdatenbanken Ein Kurzleitfaden des Fachbereiches Pädagogik und Rehabilitation bei intellektueller Beeinträchtigung

Lucene eine Demo. Sebastian Marius Kirsch 9. Februar 2006

Erfolg in Suchmaschinen Spickzettel

Internetsuchmaschinen - Kritische Betrachtung von Funktionalität und Leistungsfähigkeit im Vergleich

Suche, Suchmaschinen, Suchmaschinenoptimierung. Workshop TYPO Sybille Peters

Informationsmittel der Universitätsbibliothek Würzburg.

Universitätsbibliothek. Technische Universität München. Internetsuche. Wissenswertes und Wissenschaftliches

Scopus bietet vier verschiedene Sucheinstiege an: Die Document-, Author-, Affiliation- und Advanced Search.

Recherche im Internet

Federated Search: Integration von FAST DataSearch und Lucene

Information Retrieval. Peter Kolb

Informationen / Literatur suchen und finden 1. Dr. Friedrich Rost

Real Time Suche Dirk Lewandowski Einleitung

Bezeichnung bestimmen, mit der Domänen in Google erscheinen

Schulungshandbuch. Bibliotheksservice-Zentrum Baden-Württemberg März 2011

SUCHMASCHINEN VERSTEHEN

JTL Stammtisch JTL SEO JTL SEO

Erstellen eines Normfall Projektspeichers auf Basis einer vorhandenen Installation von:

Suche, Suchmaschinen, Suchmaschinenoptimierung. Workshop TYPO Sybille Peters

Wissenschaftssuchmaschinen

Fachtagung Enterprise Search-Systeme Einführung Unternehmensweite Suche

Inhaltsverzeichnis. Seite.

Google findet Teilen gut? Eine empirische Studie zum Einfluss von Facebook- Shares und Co. auf das organische Ranking von Suchmaschinen

Informatik-Ausbildung. Basis: I-CH Modulbaukasten R3. Autorenteam des HERDT-Verlags

OPTIMIERUNG VON CONTENT Eine nachhaltige Strategie zur Umsatzsteigerung am Beispiel hervis.at

Die touristische Website

Evaluierung von Suchmaschinen Qualitätsvergleich von Google- und Bing- Suchergebnissen unter besonderer Berücksichtigung von

Fibel: 7 kostenlose-traffic-quellen Andrea Pfeiffer Online-Marketing-Master

Suchmaschinen im Internet

BenutzerInnenhandbuch Datenbankservice / MetaLib

Copyright Werbeagentur Morré, 2017

7 TIPPS FÜR MEHR ANFRAGEN ÜBER IHRE WEBSEITE Thomas Kortenjan (Leiter LandReise.de)

Gestaltung einer vorwissenschaftlichen Arbeit

Buch oder Internet wie finde ich richtige Informationen?

Erfolgreiche Internetsuche

KAPITEL I: ONLINE-MARKETING FÜR KRANKENHÄUSER

Zugang zum Academic Invisible Web

Rechercheprotokoll für die Facharbeit der Stadtbibliothek Brilon

Ausgegoogelt? Tolle Aussicht Auf Erfolg

die Relevanz von Webseiten bestimmt Alexander Pohl

Suchmaschinen, Datenbanken, Virtuelle Fachbibliotheken. Rechts- und Verwaltungsinformationen

Informationskompetenz - Was ist das?

Workshop zur Informationsrecherche. FHNW Olten HSA. Seraina Scherer,

Hintergrund: Web Search & Ranking in Websuchmaschinen

Erfolgreiche Online-Recherche

Wer suchet der findet? Warum SEO wichtig ist und wie es funktioniert Klasberg, Carsten Pierburg, Malte Tödtmann, Kevin

Informationskompetenz. Veranstaltung am Peter Daub

Transkript:

Recherchieren im Internet: Wie funktionieren Suchmaschinen? Steffen-Peter Ballstaedt Vortrag vor dem Genealogischen Arbeitskreis Tübingen am 17.2.2016

Zahlen und Fakten 82% der Computernutzer suchen, 79% mailen. Die häufigste Aktivität im Internet ist Mailen, gleich danach kommt Suchen. Über 50.000 Anfragen in der Sekunde bei Google!

Platzhirsch Google

Beziehungsgeflecht der Suchmaschinen

Zahlen und Fakten Die Ausdehnung des Internet kann nur grob geschätzt werden! Weltweit: über 1 Milliarde Websites BRD: etwa 15 Millionen Websites Das Internet verdoppelt sich alle 5,32 Jahre

Antworten auf folgende Fragen: Wie findet eine Suchmaschine Inhalte bzw. Dokumente im WWW? Was kann eine Suchmaschine nicht finden? Wie kommt die Trefferliste zustande (Ranking)? Welche Alternativen zu Google gibt es? Wie kann man personenbezogene Daten im Web suchen?

Wie findet eine Suchmaschine Inhalte im WWW?

Aufbau eine Suchmaschine WWW Crawler Indexer Searcher Dokumenten speicher Datenbank Web-Repräsentation

Crawling Ausgehend von bekannten Websites werden die Links verfolgt. Die Text-Dokumente werden erfasst und gespeichert (Dokumentenspeicher). Crawling findet kontinuierlich statt, nach Aktualität und Popularität.

Indexierung Erstellt eine Repräsentation des Dokuments aus sprachstatistischen Daten: Worthäufigkeit, Wortposition, Wort in Titel oder Überschrift. Der Index als eine riesige Datenbank ist das Herz einer Suchmaschine. Bei einer Suchanfrage wird nicht auf die Dokumente im Web, sondern auf diese Repräsentation des Web zugegriffen.

Beispiel: Indexierung von Text- Dokumenten D1 D2 D3 D4 Genealogie untersucht verwandtschaftliche Beziehungen zwischen Menschen. Heimatgeschichte ist eng mit Genealogie verbunden. Eine Quelle sind Kirchenbücher, eine andere Quelle sind Personenstandsbücher. Mit dem WWW hat die Genealogie einen Aufschwung erfahren.

Wort Dokument Häufigkeit Position andere D3 D3,6 Aufschwung D4 D4,8 Beziehungen D1 D1,6 dem D4 D4,2 Index der Dokumente die D4 D4,4 eine D3 D3:2 D3,1, D3,5 einen D4 D4,7 eng D2 D2,3 Suchanfragen, Stichworte erfahren D4 D4,9 Genealogie D1, D2, D4 D1:1 D2:1 D4:1 D1,1 D2,5 D4,6 hat D4 D4,4 Heimatgeschichte D2 D2,1 ist D2 D2,2 Kirchenbücher D3 D3,4 Menschen D1 D1,8 mit D2, D4 D2:1 D4:1 D2,4 D4,1 Personenstandsbücher D3 D3,9 Quelle D3 D3:2 D3,2 D3,7 sind D3 D3:2 D3,3 D3,8 untersucht D1 D1:1 D1,2 verbunden D2 D2,6 verwandtschaftliche D1 D1,5 WWW D4 D4,3 zwischen D1 D1,7 Genealogie Genealogie WWW Genealogie OR WWW Verwandtschaftliche Beziehungen D1, D2, D4 D4 D1, D2, D4 D1

Searcher Interpretation der Suchanfrage (der eingegeben Stichwörter): Suchanfrage in der jeweiligen Session Suchhistorie des Nutzers angeklickte Dokumente Verweildauer auf einem Treffer Suchverhalten vergleichbarer Nutzer

Was kann eine Suchmaschine nicht finden?

Grenzen für die Suchmaschine Beschränkung durch die Struktur des WWW: nicht alle Websites sind erreichbar. Beschränkung durch die Struktur der Website: nicht alle Dokumente sind erreichbar.

Struktur des WWW

unerreichbare Dokumente durch Passwort geschützte Bereiche Beispiel: Intranets durch Suchformulare nutzbare Datenbanken Beispiel Telefonbuch Social-Media-Dienste Beispiel: Facebook, Twitter Inhalte, die für Crawler gesperrt sind gewollter Ausschluss (robots exclusion) Filterung: Zensur oder rechtlich unzulässige Inhalte Echtzeitinhalte, die sich ständig verändern Beispiele: Börsenkurse, Wetterdaten

Surface Web und Deep Web

Wie kommt die Trefferliste zustande (Ranking)?

Ranking Die Treffer sind nach absteigender Relevanz aufgelistet. Die Berechnung des Ranking ist bei jeder Suchmaschine anders und ein Geheimnis (Algorithmus)! Das Ranking wird als Kombination und Gewichtung verschiedener Faktoren berechnet (200 bei Google)

Erzeugung der Trefferliste Anfrage Textstatistik Ranking Popularität PageRank Aktualität Lokalität Personalisierung Technische Faktoren

Ranking-Kriterien In das Ranking gehen keine qualitativen, sondern nur quantitative Größen ein: link-statistische Variablen nutzer-statistische Variablen Gesponserte Links müssen gekennzeichnet sein. Das Ranking kann durch Suchmaschinenoptimierung beeinflusst werden. Um das personalisierte Ranking zu erzeugen, speichert die Suchmaschine Daten über den Benutzer, erstellt ein Benutzerprofil.

Diese Daten speichert Google die IP-Adresse des Computers die Suchanfragen (Suchwörter) den Zeitpunkt der Suche die angesteuerten Treffer (auch Werbung) Verweildauer auf den Treffern

- Geschäftsmodell Kontextbezogene Werbung zu den Suchwörtern Personenbezogene Werbung über angelegte Benutzerprofile Verkauf von persönlichen Daten und Nutzerprofilen an Firmen für ihre personenbezogene Werbung

Bewertung der Treffer Impressum und Kontaktmöglichkeit vorhanden seriöse Institution, z.b. Hochschule, Verlag, Wissenschaftliche Gesellschaft, Qualitätspresse Autoren/Autorinnen der Texte sind benannt Angabe von Quellen, Belege für Behauptungen Verlinkung auf seriöse Sites Publikationsdatum und letzte Änderung (last update) Vorsicht bei kommerziellen und gesponserten Sites!

Welche Alternativen zu Google gibt es?

Universelle Suchmaschinen Startpage: Anfragen werden anonymisiert an Google weitergeleitet. Qwant: französische Suchmaschine mit deutscher Version DuckDuckGo: Die Suchmaschine, die Sie nicht verfolgt.

Meta-Suchmaschinen Haben keinen eigenen Index über Crawler angelegt. Suchanfragen werden an mehrere andere Suchmaschinen weitergeleitet. Treffer aus mehreren Trefferlisten werden neu gerankt. Meta-Suchmaschinen ergeben mehr Treffer, aber nicht unbedingt relevantere Treffer!

Meta-Suchmaschinen Ixquik: keine personenbezogene Daten gespeichert Metager: deutsche Suchmaschine der Uni Hannover

Spezialsuchmaschinen Es gibt Crawler und Suchmaschinen für spezielle Inhalte: Nachrichten, Jobs, Reise, Personen, Bilder, Videos Wissenschaftliche Suchmaschinen werten nur wissenschaftliche Dokumente aus: https://scholar.google.de http://www.base-search.net Portale/Verzeichnisse für Spezialsuchmaschinen www.suchmaschinen-datenbank.de www.suchlexikon.de

Was macht geschicktes und professionelles Suchen aus?

Anfragetypen Gezielte Suche nach einem bestimmten Faktum oder Dokument mit klar definiertem Ergebnis. Optimal: Der erste Treffer ist richtig Recherche zu einem Thema nach bisher unbekannten Informationen ohne klares Ende. Optimal: Viele relevante Treffer

Formulieren von Suchanfragen Passende Suchwörter nicht zu breite Bedeutung verschiedene Schreibweisen beachten Synonyme beachten Phrasensuche in Anführungszeichen bei Zitaten Einengung der Suchanfrage Boolesche Operatoren kombinieren Suchwörter Erweiterte Suche mit Befehlen: Filetyp, Sprache

Suchwort-Verknüpfungen mit Booleschen Operatoren A OR B Hund OR Katze 122.000.000 Treffer A AND B Hund (AND) Katze 5.800.000 Treffer A NOT B Hund NOT Katze 90.300.000 Treffer (Karotte OR Möhre) (Salat Nüsse) -Koriander

Such-Tipps In ausländischen Versionen einer universalen Suchmaschine suchen. Gleich eine ausländische Suchmaschine verwenden, z. B. Bing Portale und Verzeichnisse sind Linksammlungen zu einem speziellen Thema. Qualitätsprüfung durch ein Redakteursteam nur themenrelevante Treffer Verzeichnis der Verzeichnisse: www.suchlexikon.de

Wie findet man personenbezogene Daten im WWW? Friedrich Adolf Ballstaedt * 4.4.1884 in Schrimm 13.11.1941 in Stettin

direkte Personensuche Phrasensuche mit Vorname und Name in einer universellen Suchmaschine, ev. mit zusätzlichen Stichworten www.google.com Phrasensuche mit anderer Länderversion www.google.fr Phrasensuche mit ausländischer Suchmaschine https://www.yandex.ru Phrasensuche mit anderer Spracheinstellung www.google.de Einstellungen erweiterte Suche Sprache

direkte Personensuche Namenseingaben in eine spezielle Personensuchmaschine Liste von sozialen Netzwerken: http://www.yourtraces.com/ Sammlung von Informationen über lebende Personen ist wegen Datenschutz illegal.

direkte Personensuche Suche in Datenbanken, in der eine Person vermutet wird (teilweise registrier- und/oder kostenpflichtig) Genealogische Datenbanken https://familysearch.org/family-trees http://gav.azurewebsites.net Verzeichnisse/Portale von Datenbanken https://de.wikipedia.org/wiki/genealogie-datenbank http://wikide.genealogy.net/genealogische_datenbank/linkliste http://www.heimatarchiv.de/genealogie/webseiten.html Telefonbücher; Branchenverzeichnisse etc.

direkte Personensuche Genealogische Meta-Suchmaschine http://beuss.spdns.de/crawl/

indirekte Personensuche Suche nach Dokumenten, in denen die Person vermutet wird. Kirchenbuchportale: www.archion.de http://search.ancestry.de/search/db.aspx?dbid=2116 Online-Archive: https://archive.org/details/genealogy&tab=about https://archivalia.hypotheses.org/category/genealogie In den meist eingescannten Dokumenten ist keine Volltextsuche möglich.

Fazit Die genealogische Forschung verlegt sich immer mehr ins Web: Erschließung: Primärquellen werden digitalisiert und im Web zur Verfügung gestellt. Bearbeitung der Daten erfolgt mit Genealogie- Programmen, z.b. Gen_Plus. Die Zusammenführung der Daten findet weltweit über das Web statt. Standard: meist GEDCOM.

Fazit Forschungsergebnisse werden immer häufiger im Web präsentiert, da eine Print-Veröffentlichung teuer ist. Die Visualisierung der Befunde z.b. in Stammbäumen erfolgt durch spezielle Programme, z. B. GRAMPS. Schwer durchschaubarer Wildwuchs an Angeboten: Die Grenze zwischen laienhafter Aufarbeitung und wissenschaftlicher Forschung verwischen.

Visualisierung durch GRAMPS

Organisationen Eine deutsche Organisation zur Computergenealogie wurde 1989 gegründet. Ein Ziel: die EDV-gestützte standardisierte Erschließung, Bearbeitung und Veröffentlichung genealogischer Quellen.

Organisationen Family History Information Standards Organization, seit 2013. organisation established for the purpose of developing genealogy and family history information standards on a modern platform

Vielen Dank für Ihr Interesse! www.ballstaedt-kommunikation.de Downloads