Das Komplexe einfach machen

Größe: px
Ab Seite anzeigen:

Download "Das Komplexe einfach machen"

Transkript

1 Das Komplexe einfach machen Semantik und Visualisierung im Bibliothekskatalog der Zukunft 14. April 2015 Dr. Jens Mittelbach, SLUB Dresden

2 Das Komplexe einfach machen Semantik und Visualisierung im Bibliothekskatalog der Zukunft 1. Das Konzept Resource Discovery 2. SLUBsemantics: Ein erster Schritt zu einer neuen Art von Discovery 3. Datengrundlagen schaffen: Linked Data als Basis moderner Discovery-Systeme 4. Visualisierung: Wie das Komplexe einfach machen? 5. Semantik: Das Komplexe einfach machen 6. Das Prinzip Discovery 14. April 2015 Seite 2

3 Das Konzept Resource Discovery Discovery als neues Paradigma Konzept Resource Discovery seit Anfang des Jahrzehnts: Summon, EBSCO Discovery Service, Primo One Stop Shop -Idee, integrierte Suche und integrierter Zugang zu in getrennten Datensilos verteilten Ressourcen Normalisierung/Homogenisierung heterogener Daten aus unterschiedlichen Quellsystemen Suchmaschinentechnologie statt feldbasierte Datenbanksuche Normdaten aus unterschiedlichen Systemen als Strings indexiert und damit für Suche und Facettierung nutzbar 14. April 2015 Seite 3

4 Das Konzept Resource Discovery Herausforderungen für Discovery-Systeme Herausforderung I Benutzer sind heute durch Google sozialisiert; sie erwarten Volltextindizes und denken nicht in Metadaten Herausforderung II Gängige Discovery-Systeme basieren auf dem String-Match- Algorithmus; unscharfe bzw. thematische Suchen werden daher nur begrenzt unterstützt 14. April 2015 Seite 4

5 Das Konzept Resource Discovery Herausforderungen für Discovery-Systeme Herausforderung I Benutzer sind heute durch Google sozialisiert; sie erwarten Volltextindizes und denken nicht in Metadaten Herausforderung II Gängige Discovery-Systeme basieren auf dem String-Match-Algorithmus; unscharfe bzw. thematische Suchen werden daher nur begrenzt unterstützt Lösung I: Benutze keine Bibliothekskataloge oder benutze sie nur für known item searches 14. April 2015 Seite 5

6 SLUBsemantics Erster Schritt zu neuartiger Discovery Herausforderung I Benutzer sind heute durch Google sozialisiert; sie erwarten Volltextindizes und denken nicht in Metadaten Herausforderung II Gängige Discovery-Systeme basieren auf dem String-Match-Algorithmus; unscharfe bzw. thematische Suchen werden daher nur begrenzt unterstützt Lösung II: SLUBsemantics Multilinguale und semantische Suche automatisch angereicherter Katalogdaten Mögliche Abfragen: 14. April 2015 Seite 6

7 SLUBsemantics Wie funktioniert es? Wikipedia: die größte Wissensbasis der Welt, die nach dem Prinzip des kollaborativen Schreibens fortwährend gemeinschaftlich korrigiert, erweitert und aktualisiert wird 14. April 2015 Seite 7

8 SLUBsemantics Phase 1: Anreicherung der Katalogdaten (Stapelweise) Verarbeitung bibliografischer Daten auf der Grundlage von Data- und Text-Mining-Algorithmen sowie Wikipedia-Dumps Katalog-Sätze werden mit Wikipedia-Konzepten durch stabile URIs aus dbpedia verbunden Speicherung angereicherter Indexdaten in einem Search Server 14. April 2015 Seite 8

9 SLUBsemantics Phase 1: Anreicherung der Katalogdaten 14. April 2015 Seite 9

10 SLUBsemantics Phase 2a: Retrieval-Prozess 1. Suchanfrage wird an einen lokalen vorprozessierten Wikipedia-Korpus gesendet 2. Ursprüngliche Suchanfrage wird erweitert durch IDs der für diese Anfrage als relevant eingeschätzten Wikipedia-Artikel 3. Erweiterte Suchanfrage wird gegen den in Phase 1 angereicherten Katalogindex gesendet (Metadaten & mehrsprachige Wikipedia-Konzepte) 14. April 2015 Seite 10

11 SLUBsemantics Phase 2b: Facetten-Erzeugung Disambiguierung des Begriffes chicken game mithilfe des Facettenbaumes, der on the fly aus dem Wikipedia- Kategoriensystem generiert wird: 14. April 2015 Seite 11

12 SLUBsemantics Demonstration Suche im SLUB-Katalog: Multilingualität: Suche nach steamboat paddlewheel Disambiguierung: Suche nach python Semantik: Suche nach gra w cykora (i.e. chicken game) 14. April 2015 Seite 12

13 Datengrundlagen schaffen: Linked Data Voraussetzungen für Discovery-Systeme neuer Art Datenintegration: Daten werden zusammengeführt, dedupliziert, semantisiert, FRBRisiert und normalisiert Bereitstellung einer Single Version of the Truth (SVOT) SVOT wird in einem RDF-Format im Sinne von Linked Open Data publiziert SVOT ist Basis für verschiedene Datenpräsentationsanwendungen der Bibliothek demo.dswarm.org 14. April 2015 Seite 13

14 Visualisierung: Das Komplexe einfach machen Semantische Daten in Rohform 14. April 2015 Seite 14

15 Visualisierung: Das Komplexe einfach machen Versuche in SLUBsemantics 14. April 2015 Seite 15

16 Visualisierung: Wie das Komplexe einfach machen? Grafische Suchmaschinen 14. April 2015 Seite 16

17 Visualisierung: Wie das Komplexe einfach machen? Natural User Interfaces 14. April 2015 Seite 17

18 Visualisierung: Wie das Komplexe einfach machen? Natural User Interfaces 14. April 2015 Seite 18

19 Visualisierung: Wie das Komplexe einfach machen? Google Knowledge Graph und DNB Entity Facts 14. April 2015 Seite 19

20 Semantik: Das Komplexe einfach machen Semantische Suche auf der Grundlage von LOD 14. April 2015 Seite 20

21 Das Prinzip Discovery The British Library 14. April 2015 Seite 21

22 Das Prinzip Discovery Knowledge is of two kinds: We know a subject ourselves, or we know where we can find information on it. Samuel Johnson 14. April 2015 Seite 22

23 Das Prinzip Discovery Discovery heißt Entdecken Wissenslandkarten ermöglichen Exploration Nach der Benutzung des Kataloges weiß ich mehr als vorher Das neue Wissen ist Domänenwissen bzw. Strukturwissen 14. April 2015 Seite 23

24 Das Komplexe einfach machen Danke für Ihre Aufmerksamkeit! Dr. Jens Sächsische Mittelbach, Landesbibliothek SLUB Staats- Dresden, und Universitätsbibliothek Dresden