Ersetzt die Suchmaschine den Verbund-OPAC? Erfahrungen, Perspektiven und mögliche Kooperationsfelder aus Sicht der Verbünde

Größe: px
Ab Seite anzeigen:

Download "Ersetzt die Suchmaschine den Verbund-OPAC? Erfahrungen, Perspektiven und mögliche Kooperationsfelder aus Sicht der Verbünde"

Transkript

1 Ersetzt die Suchmaschine den Verbund-OPAC? Erfahrungen, Perspektiven und mögliche Kooperationsfelder aus Sicht der Verbünde Hermann Kronenberg 94. DBT Düsseldorf, 16. März 2005

2 Inhalt Katalog oder Suchmaschine? hbz-ziele Wie wird s gemacht Oberfläche Perspektiven

3 Katalog oder Suchmaschine? Warum nicht gemeinsam?

4 Katalog oder Suchmaschine? Katalog Viele Datenbanken mit vielen Sucheinstiegen Metasuche Bibliographische Daten Feldbezogene Suche Sacherschließung Klassifikation Normdaten Suchmaschine Ein Sucheinstieg für viele Quellen Hohe Performanz Volltextsuche Ranking Kategorisierung Linguistikmodule

5 hbz-ziele Gemeinsam sind sie stark!

6 hbz-ziele Die hbz-suchmaschine ist zukünftig der zentrale Sucheinstieg für alle Endkunden Die hbz-suchmaschine bietet einen schnellen und einfachen Zugriff auf das vollständige Datenangebot des hbz mittels moderner Erschließungstechnologie.

7 hbz-ziele Die Anwendung nutzt Funktionalitäten aktueller Suchmaschinen Kategorisierung der Treffermengen Präsentation und Sortierung (auch) großer Treffermengen mittels Ranking Ähnlichkeitssuchen Verwendung linguistischer Verfahren wie Rechtschreibvorschläge und Wortstammbildung Einbindung von Normdaten Integration von Systematiken wie der GHBS Beschleunigung der Zugriffe der DigiBib

8 Wie wird s gemacht Einsatz der Suchmaschine FASTData Search

9 Die Suchmaschine "fast" Tromsø Oslo Chicago San Francisco BostonLondon New York Washington DC Munich Rome Tokyo Rio de Janeiro Die Software FASTData Search ist ein Produkt der Firma FastSearch&Transfer (FAST) Die Firma wurde 1997 gegründet und ist ein Auswuchs einer Forschungs- und Entwicklungsabteilung der Norwegischen University of Science and Technology (NTNU)

10 Die Suchmaschine "fast" Indexierung Suche Schritt 1 -> Schritt 2 -> Schritt 3 <- Schritt 2<-Schritt 1 Content access = Document processing = Matching (search engine) = Query & result processing = Bereitsstellung Quelldaten (content) Datenanalyse und anreicherung Index-/Ergebniserstellung Such-/Ergebnisaufbereitung

11 content access der Verbunddaten Daten Bibliographische Daten Normdaten Lokal- und Exemplardaten aller Verbundteilnehmer Der hbz-aleph-connector führt viele Funktionen des document processing von fast aus. Grund z.b. Zusammenführung der getrennt gespeicherten Verbunddaten zu einem fastdocument, Voraussetzung für die folgenden fast- Prozesse.

12 content access der Verbunddaten C++, Java,.NET hbz-aleph-connector FAST

13 document processing der Verbunddaten Spracherkennung Lemmatisierung: Ergänzung von Grundformen (Biergärten Biergarten) Kategorisierung, z.b. für die Anzeige von Taxonomie-Bäumen und drill down-feldern in der Ergebnisanzeige (Erfolgt im hbz bereits beim content access) Ermittlung von Ranking-Informationen Erzeugung von Vektorräumen für eine Ähnlichkeitssuche

14 document processing der Verbunddaten Fast-Standardprogramme und/oder Benutzerprogramme zur Analyse und Anreicherung der zu übernehmenden Daten. Wird zur Zeit vom hbz nur wenig genutzt. Content FAST

15 matching der Verbunddaten Hier werden die im Analyseschritt ermittelten Daten in den Fast-Index integriert und für die Suche bereitgestellt. Die Indexierung erfolgt in den Schritten Oracle -> fixml (content access + document processing) fixml -> fast-binärindex (matching) Hier werden bei der Suche die gesuchten Daten erschlossen.

16 drill down (Treffer erschließen) Diese Funktionalität beruht auf einer Kategorisierung der Dokumente, Bereitstellung von Feldinhalten. Hierfür werden in der Oberfläche drill down angezeigt, die bei Auswahl eines Wertes durch die search engine ausgewertet werden und die Treffermenge reduzieren / erschließen.

17 taxonomy (Themengebiete) Diese Funktionalität beruht auf den im hbz-aleph-connector erstellten Feldern, die diese Dokumente in einer Baumstruktur positionieren. (Beispiel GHBS) Bei der Suche kann hierüber das Ergebnis auf Wissen(schaft)sbereiche eingeschränkt werden.

18 docvector (Suchtipps) Diese Funktionalität beruht auf dem Feld docvector, das beim Indexieren mit gewichteten Wortpaaren gefüllt wird. Jedes Wortpaar eines Dokumentes erhält einen Zahlenwert zugeordnet. Bei der Suche werden die Wortpaare der wichtigsten Treffersätze aufaddiert und entsprechend Ihrer Wertigkeit als neue mögliche Suchanfragen angeboten.

19 Ranking (sortieren nach Relevanz) Diese Funktionalität beruht auf Rankwerten, die Feldern beim document processing zugeordnet werden. Bei der Suche werden die Dokumente der Treffermenge bezogen auf die verwendeten Suchworte gewichtet. Entsprechend dieser Gewichtung werden die Dokumente sortiert und angezeigt.

20 Linguistische Funktionen Lemmatisierung der Titelformen Rechtschreibprüfung der Sucheingabe Auflösung deutscher Umlaute bei der Suche Links-, Mittel- und Rechtstrunkierung

21 Oberfläche Wie sieht die Lösung aus? Klicken statt tippen

22 Beispiel: Startseite

23 Beispiel: einfache Suche

24 Beispiel: Einstellungen

25 Beispiel: Treffer erschließen (1)

26 Auswahl aller Wörterbücher Beispiel: Treffer erschließen (2)

27 Filter Wörterbuch Beispiel: Treffer erschließen (3)

28 Beispiel: Themengebiete (1)

29 Auswahl Einzelne Nutzund Kulturplanzen Beispiel: Themengebiete (2)

30 Filter Einzelne Nutz- und Kulturplanzen Beispiel: Themengebiete (3)

31 Beispiel: Suchtipps (1)

32 Auswahl des Docvectors anorganische Chemie Beispiel: Suchtipps (2)

33 Beispiel: Suchtipps (3) Neue Suche mit Docvector anorganische Chemie

34 Personenname erkannt und Brühl als Brühe interpretiert Beispiel: linguistische Funktionen

35 Beispiel: erweiterte Suche (1)

36 Beispiel: erweiterte Suche (2)

37 Anzeige Details und Bibilothekstandorte Einsprung in den Verbund-OPAC und die DigiBib Weitere Titel zu Personen, Körperschaften und Schlagwörtern Verzweigen zu Über-/ Unterordnungen Suche um ähnliche Titel erweitern bzw. auf diese reduzieren Beispiel: weitere Funktionen

38 Beispiel: Details und Bibliotheksstandorte

39 Perspektiven Wie geht es weiter

40 Weitere Funktionen und Kooperationen Update-Verfahren der Indexdaten Verbesserung Treffer erschließen Verbesserung Themengebiete Verbesserung der Benutzerführung Weitere Anbindungen (DigiBib, KVK)

41 Weitere Datenquellen und Kooperationen Einbindung weiterer Datenbanken/Portale Einbindung weiterer elektronischer Medien Integration weiterer Sacherschließungsinformationen

42 Hier finden Sie den neuen Einstieg suchen.hbz-nrw.de für Anregungen und Fragen: