Wissenschaftliche Suchmaschinen Beatrice Altorfer 14.5.2013 1
Überblick 1. Grundlagen des Internet 2. Allgemeine Suchmaschinen 3. Metasuchmaschinen 4. Wissenschaftliche Suchmaschinen 5. Google Scholar und BASE näher betrachtet 2
1. Grundlagen des Internet - Recherche Das Internet ist für die Wissenschaft mittlerweile zu einem wichtigen Informationsmedium geworden. Problem: Viele unstrukturierte Informationen Wichtig: Fachspezifische Angebote kennen und strukturiertes Vorgehen bei der Suche Internetrecherchen eignen sich für: überblicksartige Recherchen sehr genaue Recherchen, bei denen möglichst viele Angaben zur Quelle bekannt sind aktuelle und schnelllebige Themen Umfassende Liste verschiedener Suchdienste in SPRINT: Schweizer Portal für die Recherche im Internet 3
2. Allgemeine Suchmaschinen I Wie arbeiten allgemeine Suchmaschinen? Suchmaschinen = Programme (Crawler), die den Links auf Webseiten folgen. Die Webseiten werden inhaltlich erschlossen und in einem Index (Datenbank) gespeichert. 4
2. Allgemeine Suchmaschinen II Bei Eingabe von Suchbegriffen durch den Benutzer wird der Index nach den passenden Suchbegriffen durchsucht und die entsprechenden Dokumente in einer Trefferliste angezeigt. Erfasste Ressourcen sind inhaltlich, strukturell und qualitativ sehr heterogen. Trotz hoher Abdeckung (ca. 100-200 Milliarden frei zugängliche Internetseiten) besteht grosse Unsicherheit bezüglich der Vollständigkeit und Qualität der Ergebnisse. 5
2. Allgemeine Suchmaschinen III Nicht angezeigt werden können Seiten auf die kein Link führt die kostenpflichtig sind (z.b. lizenzierte Datenbanken) die versteckt sind hinter vielen Ebenen (Hierarchien) die sehr aktuell sind Crawler können eine Webseite nur alle paar Tage besuchen die keinen Text haben Bilder, Animationen etc. können nur über Beschreibungstexte indexiert werden, diese fehlen jed. häufig mit unbekanntem Dateiformat die dynamisch erzeugt werden wie z.b. Resultate aus einem Bibliothekskatalog 6
2. Ranking von allgemeinen Suchmaschinen I Anfrageabhängige Faktoren im Ranking Position der Suchbegriffe im Text: Wenn in Titel, Link, Überschrift oder URL Je exakter die Übereinstimmung der Schreibweise zwischen Suchbegriff und indexiertem Begriff Reihenfolge der Suchbegriffe in der Anfrage: erster Begriff wird als wichtigster betrachtet, zweiter als weniger wichtig etc. Hervorhebung der Suchbegriffe im Text (fett, kursiv, Schriftgrösse) Häufigkeit der Suchbegriffe im Text. 7
2. Ranking von allgemeinen Suchmaschinen II Anfrageunabhängige Faktoren im Ranking Anzahl und Qualität der eingehenden Links auf eine Webseite (Linkpopularität) Klickhäufigkeit Dateiformat Grösse der Site Aktualität. UND: Monetäre Kriterien wie Suchbegriffversteigerung 8
2. Ranking von allgemeinen Suchmaschinen III Unterschiedliche Gewichtung der Rankingfaktoren: Google und Yahoo [Stand: 2.11.2012] http://www.langreiter.com/exec/yahoo-vs-google.html 9
3. Metasuchmaschinen Metasuchmaschinen suchen über eine einzige Eingabemaske gleichzeitig in mehreren anderen Suchmaschinen und Katalogen. sind eingeschränkter in den Suchfunktionen, decken aber weite Bereiche des WWW ab. etools.ch Metacrawler http://www.etools.ch/search.do http://www.metacrawler.de/ 10
4. Suchen im Internet - Deep Web Das Deep Web kann nicht von allgemeinen Suchmaschinen durchsucht werden technische u. kommerzielle Gründe. umfasst mehrere Milliarden Webseiten, darunter auch Inhalte von kostenpflichtigen wissenschaftl. Datenbanken u. Texte aus nicht frei zugänglichen Zeitschriften «Academic Invisible Web». 11
4. Wissenschaftliche Suchmaschinen I Wissenschaftliche Suchmaschinen Sind i.d.r. Hybridsysteme, die sowohl das visible Web, speziell aber das invisible Web durchsuchen und wissenschaftliche Dokumente indexieren. Bei Verlagspublikationen: Entscheid des Anbieters, ob Zugriff auf Volltext oder nur Abstract möglich. Erschliessen überwiegend wissenschaftliche Artikel und andere Webinhalte. 12
4. Positive Aspekte wissenschaftlicher Suchmaschinen I gegenüber allgemeiner Suchmaschinen: Trefferlisten wissenschaftlicher Suchmaschinen verweisen auf Inhalte, die als wissenschaftlich relevant eingestuft werden (Academic Invisible Web) z.t. Fokussierung auf bestimmte Disziplinen 13
4. Positive Aspekte wissenschaftlicher Suchmaschinen II gegenüber allgemeiner Suchmaschinen: Im Ranking der Trefferliste werden Daten berücksichtigt, die in der Wissenschaft relevant sind: Anzahl Zitierungen eines Dokuments, verschiedene Versionen eines Dokuments oder Verfasserdaten z.t. übersichtlichere Darstellung der Treffer als bei universellen Suchmaschinen z.t. Angebot eines Nutzeraccounts für persönliche Dienste wie Alerts oder Newsfeeds 14
4. Positive Aspekte wissenschaftlicher Suchmaschinen III gegenüber kommerzieller Datenbanken und Suchportalen: Erschliessen vieler kostenloser Dokumente und Objekte. Verhältnis zwischen kostenlosen und lizenzpflichtigen Treffern variiert allerdings zwischen den Suchmaschinen Anzeige auch von lizenzpflichtige Dokumenten: Spektrum der zu einer Suchanfrage erhältlichen Literatur wird besser sichtbar, auch für Personen, ohne direkten Zugang zu diesen Quellen. Für Nutzer mit Zugang bilden sie eine Brücke zwischen wissenschaftlichen Inhalten im Netz und in den Datenbanken 15
4. Negative Aspekte wissenschaftlicher Suchmaschinen I Suchoptionen im Vergleich zu Fachdatenbanken eher marginal. Nur begrenzte Möglichkeiten, Suchanfragen weiter zu verarbeiten bzw. mit Hilfe einer Suchhistorie unterschiedliche Anfragen komplex miteinander zu verknüpfen. Mängel bei der Verarbeitung von Metadaten, dadurch z.t. falsche Autorennamen und/oder Zeitschriftentitel. Z.T. keine fehlerfreie Verarbeitung der Suchanfragen mit Booleschen Operatoren möglich. 16
4. Negative Aspekte wissenschaftlicher Suchmaschinen II Unterschiedliche Texttypen wie Zeitschriftenaufsätze, die einen Review-Prozess durchlaufen haben, als auch Konferenzberichte, Preprints, Postprints, Reports und Seminararbeiten werden in den Ergebnislisten gemischt präsentiert werden. Für Anwender oft nicht klar erkennbar, welche Qualitätsstandards gefundene Informationen erfüllen. Hinsichtlich Abdeckung derzeit keine Alternative zu bibliografischen Datenbanken. Anwendung eher für explorative Kontexte, bei denen Vollständigkeit und Genauigkeit der Suche von untergeordneter Bedeutung ist. 17
5. Wichtige wissenschaftliche Suchmaschinen Google Scholar (http://scholar.google.com/) Wissenschaftliche Artikel und Abstracts aus allen Forschungsbereichen, Dissertationen, Seminararbeiten, Bücher, Patente. Publikationen vieler verschiedener akademischer Verlage, wissenschaftlicher Institutionen und Berufsverbände. Suche auch in online Repositories von Hochschulen. Stellungnahmen von US amerikanischen Gerichten (nur in englischer GS-Version). Volltexte sowie bibliograph. Literaturangaben. Aktualisierung unklar, zwischen 6-12 Monaten. Suchtipps: http://scholar.google.ch/intl/en/scholar/help.html 18
5. Wichtige wissenschaftliche Suchmaschinen Bielefeld Academic Search Engine (BASE) (http://www.base-search.net/) Betreiber: Universität Bielefeld v.a. Dokumente aus Repository-Server (Hochschulschriften wie Dissertationen, Masterarbeiten) sowie ausgewählte Internetquellen und Dokumente aus dem Bibliothekskatalog der Universitätsbibliothek Bielefeld 70-80% der Volltexte sind frei zugänglich (38 Mio. Dokumente aus ca. 2 200 Quellen). Themenübergreifend. Scirus (http://www.scirus.com/) Webseiten von Hochschulen, wissenschaftlichen Organisationen und Regierungen, Webseiten von Wissenschaftlern, Preprint Server, Patent- und Fachdatenbanken. Naturwissenschaftlich ausgerichtet. 19
Fazit wissenschaftliche Suchmaschinen Als explorative, approximative oder komplementäre Recherchewerkzeuge einzusetzen: Low-Barrier-Ansatz unterstützt direkten Zugriff auf grosse Bandbreite an wissenschaftlichen Inhalten im Web. Anforderungen an eine umfassende wissenschaftliche Recherche in Bezug auf Vollständigkeit und Genauigkeit erfüllen sie aber nicht. 20
Ausblick auf nächste Angebote der ZHB Nächste Veranstaltung: Mi. 22.5., 17.15-19.00 Uhr: Musikmaterialien finden (J. Müller, ZHB) Weitere Veranstaltungen: www.zhb.ch / Veranstaltungen / Kurse u. Schulungen Weitere Hinweise www.zhb.ch / Recherche / Tipps und Tricks Werkzeugkasten HSLU: http://blog.hslu.ch/ikwerkzeugkasten 21