Die automatische Erschließung in der Deutschen Nationalbibliothek

Größe: px
Ab Seite anzeigen:

Download "Die automatische Erschließung in der Deutschen Nationalbibliothek"

Transkript

1 1 40 Die automatische Erschließung in der Deutschen Nationalbibliothek 4./5. September 2018 Matthias Nagelschmidt Die automatische Erschließung in der Deutschen Nationalbibliothek

2 2 40 Die automatische Erschließung in der Deutschen Nationalbibliothek 4./5. September 2018 Inhalt Automatische Erschließung in der Entwicklung Das PETRUS-Projekt und die Folgen Automatische Erschließung in der Routine Verfahrensklassen Was wird wie erschlossen? Produktionsprozess Produktionsvolumen Funktionsweisen der automatischen Erschließung Was passiert bei der maschinellen? Was passiert bei der maschinellen Klassifikation? Weiterentwicklung der automatischen Erschließung

3 3 40 Die automatische Erschließung in der Deutschen Nationalbibliothek 4./5. September 2018 Automatische Erschließung in der Entwicklung

4 4 40 Die automatische Erschließung in der Deutschen Nationalbibliothek 4./5. September 2018 Automatische Erschließung in der Entwicklung: Das PETRUS-Projekt und die Folgen Prozessunterstützende Software für die digitale Deutsche Nationalbibliothek. Projektlaufzeit von 2009 bis Projektinhalte: Konzeption, Entwicklung und Implementierung der technischen und prozeduralen Verfahren für die automatische Erschließung.

5 5 40 Die automatische Erschließung in der Deutschen Nationalbibliothek 4./5. September 2018 Automatische Erschließung in der Entwicklung: Das PETRUS-Projekt und die Folgen Einstellung der intellektuellen Erschließung von Netzpublikationen Beginn PETRUS- Projekt Start: Klassifikation DNB- Sachgruppen Start: Klassifikation DDC- Kurznotationen und Ende PETRUS- Start: Projekt und Gründung des Referats AEN Start: ToC-basierte maschinelle von Start: englischspr. Netzpublikationen mit LCSH-Terminologie

6 6 40 Die automatische Erschließung in der Deutschen Nationalbibliothek 4./5. September 2018 Automatische Erschließung in der Routine

7 7 40 Die automatische Erschließung in der Deutschen Nationalbibliothek 4./5. September 2018 Automatische Erschließung in der Routine: Verfahrensklassen s Klassifizieren anhand der DNB-Sachgruppen (Clustering-Algorithmen, Support Vector Machines) s Beschlagworten von Netzund anhand der normierten Terminologien GND und LCSH (Text Mining, Textstatistik) s Identifizieren und Verknüpfen parallel erscheinender Print- und Netzpublikationen (Match- & Merge-Verfahren bibliografischer Metadaten) Inhaltserschließung Formalerschließung

8 8 40 Die automatische Erschließung in der Deutschen Nationalbibliothek 4./5. September 2018 Automatische Erschließung in der Routine: Verfahrensklassen s Klassifizieren anhand der DNB-Sachgruppen (Clustering-Algorithmen, Support Vector Machines) s Beschlagworten von Netzund anhand der normierten Terminologien GND und LCSH (Text Mining, Textstatistik) s Identifizieren und Verknüpfen parallel erscheinender Print- und Netzpublikationen (Match- & Merge-Verfahren bibliografischer Metadaten) Inhaltserschließung Formalerschließung

9 9 40 Die automatische Erschließung in der Deutschen Nationalbibliothek 4./5. September 2018 Automatische Erschließung in der Routine: Was wird wie erschlossen? Publikationen Print Digital Reihe A Reihe B Reihe H Reihe O Masch. Klassifizieren Sachgruppen DDC-Kurz DDC Masch. Beschlagworten Schlagwörter

10 10 40 Die automatische Erschließung in der Deutschen Nationalbibliothek 4./5. September 2018 Automatische Erschließung in der Routine: Produktionsprozess Averbis Extraction Platform Dokument- IDs CBS Repository PETRUS- Service

11 11 40 Die automatische Erschließung in der Deutschen Nationalbibliothek 4./5. September 2018 Automatische Erschließung in der Routine: Produktionsvolumen Sachgruppen DDC-Kurznotationen Reihe O Reihe B Reihe H Deutsch- und englischsprachige Netzpublikationen (Monografien, Zeitschriftenartikel)* mit digitalisierten ToCs Reihe O Deutsch- und englischsprachige Netzpublikationen (Monografien, Zeitschriftenartikel)* mit den Sachgruppen 004 (Informatik), 300 (Sozialwissenschaften), 540 (Chemie) und 610 (Medizin) Methode Volumen (08/2018) Geometrischer Ansatz, Support Vector Machines ca. 1,5 Mio. Datensätze *Von der Verarbeitung ausgeschlossen sind Zeitschriftentiteldatensätze und Publikationen der Sachgruppe B (Belletristik). Reihe B Reihe H Methode Volumen (08/2018) mit digitalisierten ToCs nur mit Sachgruppe 610 (Medizin) Geometrischer Ansatz, Support Vector Machines ca. 376 Tsd. Datensätze

12 12 40 Die automatische Erschließung in der Deutschen Nationalbibliothek 4./5. September 2018 Automatische Erschließung in der Routine: Produktionsvolumen Schlagwörter für das Deutsche Schlagwörter für das Englische Reihe O Deutschsprachige Netzpublikationen (Monografien, Zeitschriftenartikel)* Reihe O Englischsprachige Netzpublikationen (Monografien, Zeitschriftenartikel)* Reihe B Reihe H Methode mit digitalisierten ToCs Text Mining, Kombination etablierter statistischer, algorithmischer und lexikonbasierter Verfahren Methode Volumen (08/2018) Text Mining, Kombination etablierter statistischer, algorithmischer und lexikonbasierter Verfahren Datensätze Volumen (08/2018) ca. 242 Tsd. Datensätze *Von der Verarbeitung ausgeschlossen sind Zeitschriftentiteldatensätze und Publikationen der Sachgruppe B (Belletristik).

13 13 40 Die automatische Erschließung in der Deutschen Nationalbibliothek 4./5. September 2018 Funktionsweisen der automatischen Erschließung: Was passiert bei der maschinellen?

14 14 40 Die automatische Erschließung in der Deutschen Nationalbibliothek 4./5. September 2018 maschinellen? Übereinstimmungen werden als Schlagwörter in den bibliografischen Datensatz der Netzpublikation geschrieben Katalog GND LCSH Abgleich: Volltext und bibliogr. Metadaten der Netzpublikation <> GND/LCSH Repositorium

15 15 40 Die automatische Erschließung in der Deutschen Nationalbibliothek 4./5. September 2018 maschinellen? Übereinstimmungen werden als Schlagwörter in den bibliografischen Datensatz der Netzpublikation geschrieben Katalog GND LCSH Abgleich: Volltext und bibliogr. Metadaten der Netzpublikation <> GND/LCSH Repositorium Averbis Terminology Platform (ATP) Averbis Extraction Platform (AEP)

16 16 40 Die automatische Erschließung in der Deutschen Nationalbibliothek 4./5. September 2018 maschinellen? Text Linguistik Termidentifikation Termgewichtung und Termselektion Schlagwörter

17 17 40 Die automatische Erschließung in der Deutschen Nationalbibliothek 4./5. September 2018 maschinellen? Text Elektronischen Volltext der Netzpublikation einlesen. Linguistik Termidentifikation Termgewichtung und Termselektion Schlagwörter

18 18 40 Die automatische Erschließung in der Deutschen Nationalbibliothek 4./5. September 2018 maschinellen? Text Elektronischen Volltext der Netzpublikation einlesen. Linguistik Termidentifikation Spracherkennung, Satzerkennung, Wort- und Wortartenerkennung. Bereitstellung potenzieller Schlagwortkandidaten als Nominalphrasen. Termgewichtung und Termselektion Schlagwörter

19 19 40 Die automatische Erschließung in der Deutschen Nationalbibliothek 4./5. September 2018 maschinellen? Text Elektronischen Volltext der Netzpublikation einlesen. Linguistik Termidentifikation Spracherkennung, Satzerkennung, Wort- und Wortartenerkennung. Bereitstellung potenzieller Schlagwortkandidaten als Nominalphrasen. Abgleich der Nominalphrasen mit GND-Vokabular. Termgewichtung und Termselektion Schlagwörter

20 20 40 Die automatische Erschließung in der Deutschen Nationalbibliothek 4./5. September 2018 maschinellen? Text Elektronischen Volltext der Netzpublikation einlesen. Linguistik Termidentifikation Spracherkennung, Satzerkennung, Wort- und Wortartenerkennung. Bereitstellung potenzieller Schlagwortkandidaten als Nominalphrasen. Abgleich der Nominalphrasen mit GND-Vokabular. Termgewichtung und Termselektion Gewichtung der abgeglichenen Nominalphrasen nach versch. Kriterien (Position im Text, Auftretenshäufigkeit etc.).berechnung eines Konfidenzwertes und Definition eines Konfidenz-Schwellenwertes. Schlagwörter

21 21 40 Die automatische Erschließung in der Deutschen Nationalbibliothek 4./5. September 2018 maschinellen? Text Elektronischen Volltext der Netzpublikation einlesen. Linguistik Termidentifikation Spracherkennung, Satzerkennung, Wort- und Wortartenerkennung. Bereitstellung potenzieller Schlagwortkandidaten als Nominalphrasen. Abgleich der Nominalphrasen mit GND-Vokabular. Termgewichtung und Termselektion Schlagwörter Gewichtung der abgeglichenen Nominalphrasen nach versch. Kriterien (Position im Text, Auftretenshäufigkeit etc.).berechnung eines Konfidenzwertes und Definition eines Konfidenz-Schwellenwertes. Die n Terme mit dem höchsten Konfidenzwert und oberhalb des Konfidenz-Schwellenwertes werden als Schlagwörter ausgegeben.

22 22 40 Die automatische Erschließung in der Deutschen Nationalbibliothek 4./5. September 2018 maschinellen? Text Elektronischen Volltext der Netzpublikation einlesen. Linguistik Termidentifikation Spracherkennung, Satzerkennung, Wort- und Wortartenerkennung. Bereitstellung potenzieller Schlagwortkandidaten als Nominalphrasen. Abgleich der Nominalphrasen mit GND-Vokabular. Termgewichtung und Termselektion Schlagwörter Gewichtung der abgeglichenen Nominalphrasen nach versch. Kriterien (Position im Text, Auftretenshäufigkeit etc.).berechnung eines Konfidenzwertes und Definition eines Konfidenz-Schwellenwertes. Die n Terme mit dem höchsten Konfidenzwert und oberhalb des Konfidenz-Schwellenwertes werden als Schlagwörter ausgegeben.

23 23 40 Die automatische Erschließung in der Deutschen Nationalbibliothek 4./5. September 2018 maschinellen? Die Myokarditis ist eine Sammelbezeichnung für entzündliche Erkrankungen des Herzmuskels mit unterschiedlichen Ursachen. Obwohl eine Vielzahl der Myokarditen Eingabe

24 24 40 Die automatische Erschließung in der Deutschen Nationalbibliothek 4./5. September 2018 maschinellen? Die Myokarditis ist eine Sammelbezeichnung für entzündliche Erkrankungen des Herzmuskels mit unterschiedlichen Ursachen. Obwohl eine Vielzahl der Myokarditen Die Myokarditis ist eine Sammelbezeichnung für entzündliche Erkrankungen des Herzmuskels mit unterschiedlichen Ursachen. Eingabe Sentence Detector

25 25 40 Die automatische Erschließung in der Deutschen Nationalbibliothek 4./5. September 2018 maschinellen? Die Myokarditis ist eine Sammelbezeichnung für entzündliche Erkrankungen des Herzmuskels mit unterschiedlichen Ursachen. Obwohl eine Vielzahl der Myokarditen Die Myokarditis ist eine Sammelbezeichnung für entzündliche Erkrankungen des Herzmuskels mit unterschiedlichen Ursachen. Die Myokarditis ist eine Sammelbezeichnung für entzündliche Erkrankungen des Herzmuskels Eingabe Sentence Detector Tokenizer

26 26 40 Die automatische Erschließung in der Deutschen Nationalbibliothek 4./5. September 2018 maschinellen? Die Myokarditis ist eine Sammelbezeichnung für entzündliche Erkrankungen des Herzmuskels mit unterschiedlichen Ursachen. Obwohl eine Vielzahl der Myokarditen Die Myokarditis ist eine Sammelbezeichnung für entzündliche Erkrankungen des Herzmuskels mit unterschiedlichen Ursachen. Die Myokarditis ist eine Sammelbezeichnung für entzündliche Erkrankungen des Herzmuskels Die {ART} Myokarditis {NN} ist {VAFIN} eine {ART} Sammelbezeichnung {NN} für {APPR} entzündliche {ADJA} Erkrankungen {NN} des {ART} Herzmuskels {NN} Eingabe Sentence Detector Tokenizer POS- Tagger

27 27 40 Die automatische Erschließung in der Deutschen Nationalbibliothek 4./5. September 2018 maschinellen? Die Myokarditis ist eine Sammelbezeichnung für entzündliche Erkrankungen des Herzmuskels mit unterschiedlichen Ursachen. Obwohl eine Vielzahl der Myokarditen Die Myokarditis ist eine Sammelbezeichnung für entzündliche Erkrankungen des Herzmuskels mit unterschiedlichen Ursachen. Die Myokarditis ist eine Sammelbezeichnung für entzündliche Erkrankungen des Herzmuskels Die {ART} Myokarditis {NN} ist {VAFIN} eine {ART} Sammelbezeichnung {NN} für {APPR} entzündliche {ADJA} Erkrankungen {NN} des {ART} Herzmuskels {NN} Die Myokarditis {myo kard itis} ist eine Sammelbezeichnung {sammel bezeich} Eingabe Sentence Detector Tokenizer POS- Tagger Segments

28 28 40 Die automatische Erschließung in der Deutschen Nationalbibliothek 4./5. September 2018 maschinellen? Ergebnisse im bibliografischen Datensatz IDN Vergleich der Single-Port-Laparoskopie mit der konventionellen Multiport Laparoskopie bei urologischen Operationen [[Elektronische Ressource]] / Seven Johannes Sam Aghdassi 5051 $KK_A4_02_ _de$LS_WA3_WB38_ _de 5540 [GND]! !Laparoskopie 5540 [GND]! !Operation 5540 [GND]! !Nierenzyste 5540 [GND]! !Alleinstehender 5540 [GND]! !Komplikation 5540 [GND]! !Spätkomplikation

29 29 40 Die automatische Erschließung in der Deutschen Nationalbibliothek 4./5. September 2018 maschinellen? Ergebnisse im bibliografischen Datensatz IDN Vergleich der Single-Port-Laparoskopie mit der konventionellen Multiport Laparoskopie bei urologischen Operationen [[Elektronische Ressource]] / Seven Johannes Sam Aghdassi 5051 $KK_A4_02_ _de$LS_WA3_WB38_ _de 5540 [GND]! !Laparoskopie 5540 [GND]! !Operation 5540 [GND]! !Nierenzyste 5540 [GND]! !Alleinstehender 5540 [GND]! !Komplikation 5540 [GND]! !Spätkomplikation

30 30 40 Die automatische Erschließung in der Deutschen Nationalbibliothek 4./5. September 2018 maschinellen? Ergebnisse im bibliografischen Datensatz IDN Vergleich der Single-Port-Laparoskopie mit der konventionellen Multiport Laparoskopie bei urologischen Operationen [[Elektronische Ressource]] / Seven Johannes Sam Aghdassi 5051 $KK_A4_02_ _de$LS_WA3_WB38_ _de 5540 [GND]! !Laparoskopie 5540 [GND]! !Operation 5540 [GND]! !Nierenzyste 5540 [GND]! !Alleinstehender 5540 [GND]! !Komplikation 5540 [GND]! !Spätkomplikation

31 31 40 Die automatische Erschließung in der Deutschen Nationalbibliothek 4./5. September 2018 maschinellen? Ergebnisse im bibliografischen Datensatz IDN Vergleich der Single-Port-Laparoskopie mit der konventionellen Multiport Laparoskopie bei urologischen Operationen [[Elektronische Ressource]] / Seven Johannes Sam Aghdassi 5051 $KK_A4_02_ _de$LS_WA3_WB38_ _de 5540 [GND]! !Laparoskopie 5540 [GND]! !Operation 5540 [GND]! !Nierenzyste 5540 [GND]! !Alleinstehender 5540 [GND]! !Komplikation 5540 [GND]! !Spätkomplikation

32 32 40 Die automatische Erschließung in der Deutschen Nationalbibliothek 4./5. September 2018 maschinellen? Zwei mögliche Fehlerklassen: Viele mögliche Ursachen: s Schlagwort fehlt (inhaltlicher Aspekt wird nicht repräsentiert s Schlagwort ist falsch (inhaltlicher Aspekt wird falsch repräsentiert) Kein geeignetes GND-/LCSH- Schlagwort vorhanden? Geeignetes GND/LCSH- Schlagwort ist vorhanden, wird aber nicht berücksichtigt? Falsches GND/LCSH-Schlagwort durch Disambiguierungsfehler? Falsches GND/LCSH-Schlagwort durch Parametrisierung der?

33 33 40 Die automatische Erschließung in der Deutschen Nationalbibliothek 4./5. September 2018 Funktionsweisen der automatischen Erschließung: Was passiert bei der maschinellen Klassifikation?

34 34 40 Die automatische Erschließung in der Deutschen Nationalbibliothek 4./5. September 2018 maschinellen Klassifikation? Erzeugung von Dokument-Vektoren durch Merkmalsextraktion ( Bag-of-Words -Verfahren), Abbildung der Dokument-Vektoren im n-dimensionalen Vektorraum, Training: Beschreibung idealtypischer Dokumentenmerkmale für einzelne DNB-Sachgruppen, maschinelles Klassifizieren: Anwendung des Trainingsmodells auf neue Dokumente.

35 35 40 Die automatische Erschließung in der Deutschen Nationalbibliothek 4./5. September 2018 maschinellen Klassifikation? Klassifiziert wird anhand von Support-Vector-Machines (SVMs), die auf den Grenzverlauf zwischen zwei Merkmalsräumen abstellen. Es werden solche Dokumentvektoren identifiziert, die am äußeren Rand ihres jeweiligen Merkmalsraumes liegen ( Support Vectors ). Anschließend wird der Abstand zwischen diesen Support- Vektoren maximiert (Prinzip des Large-Margin-Classifiers ). Es entstehen homogene, trennscharfe Merkmalsräume, die als Klassen interpretiert werden können.

36 36 40 Die automatische Erschließung in der Deutschen Nationalbibliothek 4./5. September 2018 maschinellen Klassifikation? DDC-Kurznotationen: Über DDC-Notationen. Gebildet anhand der DDC-Abridged oder nach eigenem Schema. Produktive Tests für die Informatik (Sachgruppe 004), die Sozialwissenschaften (Sachgruppe 300), die Chemie (Sachgruppe 540) und die Medizin (Sachgruppe 610). Anzahl der DDC-Kurznotationen pro Sachgruppe variiert zwischen 15 (für die Chemie) und 120 (für die Medizin).

37 37 40 Die automatische Erschließung in der Deutschen Nationalbibliothek 4./5. September 2018 maschinellen Klassifikation? DDC-Kurznotation im bibliografischen Datensatz IDN Die Sarkoidose als Systemerkrankung / von R. Bergner, P. Korsten 5051 $KK_A8_03_ _de$LS_ART2_WB41_ _de $MMK_610_A2_06_ _de 5470 [MKN]616.7$K0,894$D *Krankheiten des Bewegungsapparats

38 38 40 Die automatische Erschließung in der Deutschen Nationalbibliothek 4./5. September 2018 Weiterentwicklung der automatischen Erschließung

39 39 40 Die automatische Erschließung in der Deutschen Nationalbibliothek 4./5. September 2018 Weiterentwicklung der automatischen Erschließung ToC-Experimente (läuft seit 04/2017): von der Reihen B und H Indexierung mit reduzierter Datenbasis (bibliografische Metadaten und gescannte Inhaltsverzeichnisse anstatt Volltexte), Projekt MAEN (abgeschlossen in 06/2018): englischsprachiger Netzpublikationen Indexierung englischsprachiger Netzpublikationen mit LCSH- Terminologie, Projekt TeMa (läuft seit 04/2017): Terminologiemanagement zur Unterstützung der intellektuellen und automatischen Inhaltserschließung Harmonisierung der Erschließungsarbeit.

40 40 40 Die automatische Erschließung in der Deutschen Nationalbibliothek 4./5. September 2018 Vielen Dank für die Aufmerksamkeit! Matthias Nagelschmidt Deutsche Nationalbibliothek Automatische Erschließungsverfahren, Netzpublikationen Deutscher Platz Leipzig m.nagelschmidt@dnb.de

Frank Busse. Maschinelle Klassifikation in der Deutschen Nationalbibliothek

Frank Busse. Maschinelle Klassifikation in der Deutschen Nationalbibliothek 1 Frank Busse Maschinelle Klassifikation in der Deutschen Nationalbibliothek 2 34 Maschinelle Klassifikation in der DNB 9. November 2018 Übersicht Allgemeines Maschinelle Klassifikation Workflow Kennzeichnung

Mehr

Christa Schöning-Walter. Ist automatische Erschließung möglich? Erfahrungen der Deutschen Nationalbibliothek

Christa Schöning-Walter. Ist automatische Erschließung möglich? Erfahrungen der Deutschen Nationalbibliothek Christa Schöning-Walter Ist automatische Erschließung möglich? Erfahrungen der Deutschen Nationalbibliothek 1 Automatische Erschließung bei der DNB warum? Ziele: Geschäftsprozesse beschleunigen Erschließungsaufwände

Mehr

Elisabeth Mödden. Maschinelle Klassifikation und Beschlagwortung der Reihe O in der Deutschen Nationalbibliothek Einblicke in die Praxis

Elisabeth Mödden. Maschinelle Klassifikation und Beschlagwortung der Reihe O in der Deutschen Nationalbibliothek Einblicke in die Praxis 1 Elisabeth Mödden Maschinelle Klassifikation und Beschlagwortung der Reihe O in der Deutschen Nationalbibliothek Einblicke in die Praxis 2 Workshop "Sacherschließung im HeBIS-Verbund" 15. Juni 2016 Automatische

Mehr

Die maschinelle Erschließung der Deutschen Nationalbibliothek. Elisabeth Mödden

Die maschinelle Erschließung der Deutschen Nationalbibliothek. Elisabeth Mödden Die maschinelle Erschließung der Deutschen Nationalbibliothek Elisabeth Mödden 1 Entwicklung maschinelle Inhaltserschließung 2 Masch. Verknüpfung paralleler Publikationen Reihe O 2010 Maschinelle Klassifikation

Mehr

Die maschinelle Erschließung der Deutschen Nationalbibliothek. Elisabeth Mödden

Die maschinelle Erschließung der Deutschen Nationalbibliothek. Elisabeth Mödden Die maschinelle Erschließung der Deutschen Nationalbibliothek Elisabeth Mödden 1 Entwicklung maschinelle Inhaltserschließung 2 Masch. Verknüpfung paralleler Publikationen Reihe O 2010 Maschinelle Klassifikation

Mehr

PETRUS Szenario 1 Automatische Sachgruppenvergabe

PETRUS Szenario 1 Automatische Sachgruppenvergabe PETRUS Szenario 1 Automatische Sachgruppenvergabe Elisabeth Mödden 1 Automatische Sachgruppenvergabe 1. DDC-Sachgruppen 2. Automatische Sachgruppenvergabe 3. Tests und Ergebnisse 4. Geschäftsprozesse und

Mehr

Die maschinelle Erschließung der Deutschen Nationalbibliothek. Elisabeth Mödden

Die maschinelle Erschließung der Deutschen Nationalbibliothek. Elisabeth Mödden Die maschinelle Erschließung der Deutschen Nationalbibliothek Elisabeth Mödden 1 Entwicklung maschinelle Inhaltserschließung Maschinelle Retro- Erschließung Reihe O 2017 Maschinelle Klassifikation DDC-

Mehr

Automatische Beschlagwortung mit dem Vokabular der Schlagwortnormdatei (SWD) und der Personennamendatei (PND) Erfahrungen aus dem DNB-Projekt PETRUS

Automatische Beschlagwortung mit dem Vokabular der Schlagwortnormdatei (SWD) und der Personennamendatei (PND) Erfahrungen aus dem DNB-Projekt PETRUS Sandro Uhlmann Automatische Beschlagwortung mit dem Vokabular der Schlagwortnormdatei (SWD) und der Personennamendatei (PND) Erfahrungen aus dem DNB-Projekt PETRUS 1 Automatische Beschlagwortung mit dem

Mehr

Automatische Beschlagwortung mit dem Vokabular der SWD

Automatische Beschlagwortung mit dem Vokabular der SWD Sandro Uhlmann Automatische Beschlagwortung mit dem Vokabular der SWD Erfahrungen aus dem Projekt PETRUS 1 Projekt PETRUS Szenario 4 Workshop 21./22.03.2011 Frankfurt am Main Projekt PETRUS: Szenario 4

Mehr

Kann man Inhaltserschließung automatisieren?

Kann man Inhaltserschließung automatisieren? Ulrike Junger Kann man Inhaltserschließung automatisieren? Das Projekt PETRUS an der Deutschen Nationalbibliothek 1 ODOK Leoben - 23.09.2010 Kurzer Abriß 1. Petrus warum, was, wie? 2. Automatische Sachgruppenvergabe

Mehr

Maschinelle Sachgruppenvergabe. Ein Projekt wird zur Routine.

Maschinelle Sachgruppenvergabe. Ein Projekt wird zur Routine. Elisabeth Mödden Maschinelle Sachgruppenvergabe. Ein Projekt wird zur Routine. 1 Maschinelle Sachgruppenvergabe 1. Integration des neuen Teilprozesses in den bestehenden Geschäftsprozess 2. Einführung

Mehr

Christa Schöning-Walter. Automatische Erschließung bei der Deutschen Nationalbibliothek

Christa Schöning-Walter. Automatische Erschließung bei der Deutschen Nationalbibliothek Christa Schöning-Walter Automatische Erschließung bei der Deutschen Nationalbibliothek 1 24 Projekt Petrus nestor-workshop am 21. Oktober 2010 Themen-Überblick Das Projekt PETRUS: Projektziel, Leitlinien,

Mehr

Elisabeth Mödden, Christa Schöning-Walter. Erschließung mit automatischen Methoden. Auswirkungen auf die bibliothekarische Praxis

Elisabeth Mödden, Christa Schöning-Walter. Erschließung mit automatischen Methoden. Auswirkungen auf die bibliothekarische Praxis Elisabeth Mödden, Christa Schöning-Walter Erschließung mit automatischen Methoden Auswirkungen auf die bibliothekarische Praxis 1 Inhaltsverzeichnis 1. Strategische Ziele und organisatorische Rahmenbedingungen

Mehr

Inhaltserschließung Neues in der DNB

Inhaltserschließung Neues in der DNB Dr. Guido Bee Inhaltserschließung Neues in der DNB 1 DDC Inhaltserschließung - Neues in der DNB 34. Jahrestagung der Gesellschaft für Klassifikation 23. 07.2010 Inhaltsverzeichnis 1. GND 2. RDA 3. CrissCross

Mehr

Sachliche Einordnung von Dokumenten in Bibliotheken: praktische Erfahrungen mit maschinellen Lernverfahren

Sachliche Einordnung von Dokumenten in Bibliotheken: praktische Erfahrungen mit maschinellen Lernverfahren Sachliche Einordnung von Dokumenten in Bibliotheken: praktische Erfahrungen mit maschinellen Lernverfahren Monika Lösse (Deutsche Nationalbibliothek) Mathias Lösch (Universitätsbibliothek Bielefeld) Workshop

Mehr

Inhaltserschließung im Zeitalter von Suchmaschinen und Volltextsuche

Inhaltserschließung im Zeitalter von Suchmaschinen und Volltextsuche INTERVIEW 47 Inhaltserschließung im Zeitalter von Suchmaschinen und Volltextsuche b.i.t.online-gespräch mit Elisabeth Mödden. Die studierte Bauingenieurin leitet bei der Deutschen Nationalbibliothek seit

Mehr

Inhaltserschließung mit der SWD in der Deutschen Nationalbibliothek. Yvonne Jahns Österreichischer Bibliothekartag, Innsbruck

Inhaltserschließung mit der SWD in der Deutschen Nationalbibliothek. Yvonne Jahns Österreichischer Bibliothekartag, Innsbruck Inhaltserschließung mit der SWD in der Deutschen Nationalbibliothek 11 Yvonne Jahns Österreichischer Bibliothekartag, Innsbruck 2011 19.10.2011 Agenda Sammeln Erschließen Beschlagworten Normieren & redigieren

Mehr

Computerunterstützte Sacherschliessung: Der Digitale Assistent

Computerunterstützte Sacherschliessung: Der Digitale Assistent Computerunterstützte Sacherschliessung: Der Digitale Assistent Informationsveranstaltung 29. Mai 2013 Computerunterstützte Sacherschliessung Programm! Ausgangslage in der Schweiz und Situation Hochschulplatz

Mehr

Maschinelle Sachgruppenvergabe für Netzpublikationen

Maschinelle Sachgruppenvergabe für Netzpublikationen Elisabeth Mödden, Katrin Tomanek Maschinelle Sachgruppenvergabe für Netzpublikationen Kontinuierliche Weiterentwicklung der maschinellen Sachgruppenvergabe Vom Projekt PETRUS in die Praxis Die Aufnahme

Mehr

Wörter - Texte - Information. Möglichkeiten und Grenzen automatischer Erschließungsverfahren

Wörter - Texte - Information. Möglichkeiten und Grenzen automatischer Erschließungsverfahren Wörter - Texte - Information Möglichkeiten und Grenzen automatischer Erschließungsverfahren Automatische Indexierung - Einführung 1 Indexieren und Automatisches Indexieren Dokumente Volltexte bibliografische

Mehr

Jan-Helge Jacobs. Wörterbuchpflege für die maschinelle Beschlagwortung mit der Gemeinsamen Normdatei (GND)

Jan-Helge Jacobs. Wörterbuchpflege für die maschinelle Beschlagwortung mit der Gemeinsamen Normdatei (GND) Jan-Helge Jacobs Wörterbuchpflege für die maschinelle Beschlagwortung mit der Gemeinsamen Normdatei (GND) 1 Jacobs Wörterbuchpflege 12. März 2013 1. Zwei Erschließungsarten Eine GND 2. Fehleridentifikation

Mehr

Volltextserver der Verbünde

Volltextserver der Verbünde Volltextserver der Verbünde Integrierter Zugriff auf lizenzierte Zeitschriftenartikel und freie elektronische Dokumente unter Einsatz von Suchmaschinentechnologie Kooperativer Bibliotheksverbund Berlin-Brandenburg

Mehr

Der Digitale Assistent und K10plus im Zusammenspiel

Der Digitale Assistent und K10plus im Zusammenspiel Der Digitale Assistent und K10plus im Zusammenspiel 2. Workshop Computerunterstützte Inhaltserschließung UB Stuttgart Volker Conradt / Armin Kühn Digitaler Assistent und SWB Zusammenspiel / Datenfluss

Mehr

Multimedia-Metadaten und ihre Anwendung

Multimedia-Metadaten und ihre Anwendung Multimedia-Metadaten und ihre Anwendung 14.02.2006 Automatische Gesichtserkennung Dominikus Baur Gesichtserkennung in MPEG-7 MPEG-7 bietet Face Descriptor zur Beschreibung von Gesichtern Im Folgenden:

Mehr

Das Projekt Automatische Sacherschließung an der ZBW

Das Projekt Automatische Sacherschließung an der ZBW Das Projekt Automatische Sacherschließung an der ZBW Martin Toepfer (Wissenschaftlicher Mitarbeiter, M. Sc. Informatik) ZBW Leibniz-Informationszentrum Wirtschaft Workshop Computerunterstützte Inhaltserschließung

Mehr

Semiautomatische Erschließung von Psychologie-Information

Semiautomatische Erschließung von Psychologie-Information PETRUS-Workshop "Automatische Erschließungsverfahren" 21./22.03.2011 Dipl.-Psych. Michael Gerards Semiautomatische Erschließung von Psychologie-Information Kontext Die Literaturdatenbank PSYNDEX: Erschließt

Mehr

Automatische Erschließungsverfahren für Netzpublikationen

Automatische Erschließungsverfahren für Netzpublikationen Christa Schöning-Walter Automatische Erschließungsverfahren für Netzpublikationen Monografische Netzpublikationen stehen im Fokus der automatischen Erschließung Zum Stand der Arbeiten im Projekt PETRUS

Mehr

Semiautomatische Erschließung von Psychologie-Information

Semiautomatische Erschließung von Psychologie-Information PETRUS-Workshop "Automatische Erschließungsverfahren" 21./22.03.2011 Dipl.-Psych. Michael Gerards Semiautomatische Erschließung von Psychologie-Information Kontext Die Literaturdatenbank PSYNDEX: Erschließt

Mehr

Computerunterstützte. IZUS / Universitätsbibliothek. Der Digitale Assistent BW für die Sacherschließung V2. Dr. Imma Hinrichs

Computerunterstützte. IZUS / Universitätsbibliothek. Der Digitale Assistent BW für die Sacherschließung V2. Dr. Imma Hinrichs IZUS / Universitätsbibliothek Computerunterstützte Sacherschließung Der Digitale Assistent BW für die Sacherschließung V2 Dr. Imma Hinrichs 13. InetBib-Tagung: Treiben wir oder werden wir getrieben? 10.

Mehr

Fremddatenanalyse für computerunterstütze Inhaltserschliessung

Fremddatenanalyse für computerunterstütze Inhaltserschliessung know-how innovation Fremddatenanalyse für computerunterstütze Inhaltserschliessung 9. Mai 2017, Lukas Fischer solution significance Masterarbeit von Ursula Jud-Reichlen MAS in Bibliotheks- und Informationswissenschaften

Mehr

Support Vector Machines, Kernels

Support Vector Machines, Kernels Support Vector Machines, Kernels Katja Kunze 13.01.04 19.03.2004 1 Inhalt: Grundlagen/Allgemeines Lineare Trennung/Separation - Maximum Margin Hyperplane - Soft Margin SVM Kernels Praktische Anwendungen

Mehr

Maschinelle Indexierung am Beispiel der DNB

Maschinelle Indexierung am Beispiel der DNB Maschinelle Indexierung am Beispiel der DNB Analyse und Entwicklungsmöglichkeiten 12.06.2018 107. Bibliothekartag in Berlin Folie 1 Vorab: Was will dieser Vortrag? Analyse von maschinell indexierten Beispielen

Mehr

Der Digitale Assistent

Der Digitale Assistent Der Digitale Assistent Erfahrungen mit (halb)automatisierten Verfahren der Erschliessung in der Zentralbibliothek Zürich Andrea Malits Aus- und Weiterbildung / Innovation andrea.malits@zb.uzh.ch Programm

Mehr

Erfahrungsbericht und Schlussfolgerungen des DIPF zur Erprobung automatischer Erschließung. Verena Wissel

Erfahrungsbericht und Schlussfolgerungen des DIPF zur Erprobung automatischer Erschließung. Verena Wissel Erfahrungsbericht und Schlussfolgerungen des DIPF zur Erprobung automatischer Erschließung Verena Wissel PETRUS-Workshop Automatische Erschließungsverfahren in der Deutschen Nationalbibliothek 22.03.2011

Mehr

Inhaltserschließung der juristischen Literatur in der Deutschen Nationalbibliothek

Inhaltserschließung der juristischen Literatur in der Deutschen Nationalbibliothek Inhaltserschließung der juristischen Literatur in der Deutschen Nationalbibliothek 1 Yvonne Jahns und Helga Karg AjBD-Fortbildung, Berlin 8. November 2012 Agenda Unsere Sammlung von Rechtsmaterialien Arbeitsteilige

Mehr

Vortrag im Rahmen der Vorlesung Data Warehouse Dozentin: Prof. Dr. Frey-Luxemburger WS 2011/2012. Referent: Florian Kalisch (GR09)

Vortrag im Rahmen der Vorlesung Data Warehouse Dozentin: Prof. Dr. Frey-Luxemburger WS 2011/2012. Referent: Florian Kalisch (GR09) Vortrag im Rahmen der Vorlesung Data Warehouse Dozentin: Prof. Dr. Frey-Luxemburger WS 2011/2012 Referent: Florian Kalisch (GR09) Rückblick Aktueller Status Einführung in Text-Mining Der Text-Mining Prozess

Mehr

Deutsche Nationalbibliothek. ILTIS-Infos. für das Jahr 2006

Deutsche Nationalbibliothek. ILTIS-Infos. für das Jahr 2006 Deutsche Nationalbibliothek ILTIS-Infos für das Jahr 2006 01.11.2006 ILTIS-Infos 2006 2 Inhalt > ILTIS Startseite > ILTIS Volltextsuche Inhalt 2 Nr. 001 Neues Format für SWD-Hinweissätze 3 Nr. 002 - Neue

Mehr

Der semantische Discovery Service YEWNO - ein Pilotprojekt an der Bayerischen Staatsbibliothek. Dr. Berthold Gillitzer Bayerische Staatsbibliothek

Der semantische Discovery Service YEWNO - ein Pilotprojekt an der Bayerischen Staatsbibliothek. Dr. Berthold Gillitzer Bayerische Staatsbibliothek 1 Der semantische Discovery Service YEWNO - ein Pilotprojekt an der Bayerischen Staatsbibliothek Dr. Berthold Gillitzer Bayerische Staatsbibliothek Bibliotheken und die digitale Welt sind wir schon angekommen?

Mehr

Objektmerkmale für die räumlich-spektrale Klassifikation

Objektmerkmale für die räumlich-spektrale Klassifikation Objektmerkmale für die räumlich-spektrale Klassifikation AG Geomatik Geographisches Institut Ruhr-Universität Bochum AK Fernerkundung, Bochum 2012 Übersicht Ansatz zur automatischen Bildinterpretation:

Mehr

BibSpider Eine neue Recherchemethode für Schlagwort- und Titelsuche

BibSpider Eine neue Recherchemethode für Schlagwort- und Titelsuche know-how innovation BibSpider Eine neue Recherchemethode für Schlagwort- und Titelsuche 05.09.2018, Adriano Meyer Broyn solution Zielsetzungen Zusammenspiel von Titeln und Inhaltserschliessung besser verstehen.

Mehr

Extraktion der Tabellen aus XML-Dokumenten und Erkennung deren Semantik. Exposé zur Bachelorarbeit

Extraktion der Tabellen aus XML-Dokumenten und Erkennung deren Semantik. Exposé zur Bachelorarbeit Extraktion der Tabellen aus XML-Dokumenten und Erkennung deren Semantik Exposé zur Bachelorarbeit eingereicht von Irina Glushanok 23.04.2015 1 Einführung Um eine bequeme Suche nach passender Literatur

Mehr

Approximate Maximum Margin Algorithms with Rules Controlled by the Number of Mistakes

Approximate Maximum Margin Algorithms with Rules Controlled by the Number of Mistakes Approximate Maximum Margin Algorithms with Rules Controlled by the Number of Mistakes Seminar Maschinelles Lernen VORTRAGENDER: SEBASTIAN STEINMETZ BETREUT VON: ENELDO LOZA MENCÍA Inhalt Vorbedingungen

Mehr

Sacherschließung in der Zukunft?

Sacherschließung in der Zukunft? Universitätsbibliothek Sacherschließung in der Zukunft? Der Einsatz des Digitalen Assistenten DA-2 für die Sacherschließung im SWB Dr. Peter Schäuble Dr. Helge Steenweg Einordnung und Ziele Inhaltserschliessung

Mehr

Quellen und Forschungsliteratur für die Geschichtswissenschaft

Quellen und Forschungsliteratur für die Geschichtswissenschaft 1 Herrmann : Lizenzierungsservice Vergriffene Werke (VW-LiS) 22.11.2017 Simon Herrmann Lizenzierungsservice Vergriffene Werke Quellen und Forschungsliteratur für die Geschichtswissenschaft 2 Herrmann :

Mehr

Lizenzierungsservice vergriffene Werke (VW-LiS): Feststellung des Lieferbarkeitsstatus und damit der Beantragbarkeit von Titeln

Lizenzierungsservice vergriffene Werke (VW-LiS): Feststellung des Lieferbarkeitsstatus und damit der Beantragbarkeit von Titeln Deutsche Nationalbibliothek Adickesallee 1 60322 Frankfurt am Main Lizenzierungsservice vergriffene Werke (VW-LiS): Feststellung des Lieferbarkeitsstatus und damit der Beantragbarkeit von Titeln Die Feststellung

Mehr

Einfuhrung in die inhaltliche Erschließung. Grundlagen - Methoden - Instrumente

Einfuhrung in die inhaltliche Erschließung. Grundlagen - Methoden - Instrumente Jutta Bertram Einfuhrung in die inhaltliche Erschließung Grundlagen - Methoden - Instrumente ERGON VERLAG Inhalt Verzeichnis wichtiger Abkürzungen 11 Vorwort 13 Kapitel 1 - Inhaltserschließung im Überblick

Mehr

FRED: Fremddatenanreicherung vollautomatisch, aber nicht maschinell

FRED: Fremddatenanreicherung vollautomatisch, aber nicht maschinell FRED: Fremddatenanreicherung vollautomatisch, aber nicht maschinell Dr. Madeleine Boxler Bestandsentwicklung Leitung Fachreferate Sprach- und Literaturwissenschaften Marcus Zerbst Systembibliothekar Deutscher

Mehr

Spartenübergreifende Nutzung der GND : am Beispiel des Projekts IN2N. Brigitte Wiechmann, DNB

Spartenübergreifende Nutzung der GND : am Beispiel des Projekts IN2N. Brigitte Wiechmann, DNB Spartenübergreifende Nutzung der GND : am Beispiel des Projekts IN2N Brigitte Wiechmann, DNB 1 IN2N - Projekt IN2N = Institutionenübergreifende Integration von Normdaten DFG-Projekt, Laufzeit 01.12.2012-28.02.2014

Mehr

RapidMiner als Werkzeug für die textorientierten Geisteswissenschaften Katharina Morik

RapidMiner als Werkzeug für die textorientierten Geisteswissenschaften Katharina Morik technische universität RapidMiner als Werkzeug für die textorientierten Geisteswissenschaften Katharina Morik Name Autor Ort und Datum Informatik: Linguistik: Methoden + Verfahren Forschungsfragen, Anforderungen

Mehr

SICHTWEISE VON CLARIN ZUKÜNFTIGE AUFGABEN, KOMPONENTEN, HERAUSFORDERUNGEN THORSTEN TRIPPEL, UNIVERSITÄT TÜBINGEN.

SICHTWEISE VON CLARIN ZUKÜNFTIGE AUFGABEN, KOMPONENTEN, HERAUSFORDERUNGEN THORSTEN TRIPPEL, UNIVERSITÄT TÜBINGEN. SICHTWEISE VON CLARIN ZUKÜNFTIGE AUFGABEN, KOMPONENTEN, HERAUSFORDERUNGEN THORSTEN TRIPPEL, UNIVERSITÄT TÜBINGEN CLARIN in Europa Zweites European Research Infrastructure Consortium (ERIC) Mitglieder:

Mehr

Collaborative Tagging als neuer Service von Hochschulbibliotheken

Collaborative Tagging als neuer Service von Hochschulbibliotheken Das Ende der bibliothekarischen Sacherschließung(?): Alternative Formen der Inhaltserschließung Collaborative Tagging als neuer Service von Hochschulbibliotheken Christine Krätzsch Universitätsbibliothek

Mehr

Metadaten-Anreicherungen und Big-Data- Ansätze

Metadaten-Anreicherungen und Big-Data- Ansätze Metadaten-Anreicherungen und Big-Data- Ansätze HEBIS-Verbundkonferenz 2016 15. September 2016 Frankfurt/Main Prof. Dr. Andreas Degkwitz Humboldt-Universität Berlin Innovationsansätze Innovation bezieht

Mehr

Social Media Analytics: Automatische Analyse von Hotelbewertungen

Social Media Analytics: Automatische Analyse von Hotelbewertungen Social Media Analytics: Automatische Analyse von Hotelbewertungen - Anwendungsbericht bei HRS Hotel Reservation Service - Dr. Kornél Markó, Averbis GmbH Dr. Katrin Tomanek, Averbis GmbH Oliver Juwig, HRS

Mehr

Die digitale Umgebung unserer Recherche-Tools: über Fallstricke und Mehrwerte

Die digitale Umgebung unserer Recherche-Tools: über Fallstricke und Mehrwerte Die digitale Umgebung unserer Recherche-Tools: über Fallstricke und Mehrwerte Verbundkonferenz im BVB München, 6. Oktober 2016 Dr. Berthold Gillitzer (BSB) und Dr. Andreas Weber (ITS Bayreuth) für die

Mehr

Einführung in Support Vector Machines (SVMs)

Einführung in Support Vector Machines (SVMs) Einführung in (SVM) Januar 31, 2011 Einführung in (SVMs) Table of contents Motivation Einführung in (SVMs) Outline Motivation Vektorrepräsentation Klassifikation Motivation Einführung in (SVMs) Vektorrepräsentation

Mehr

Die Bildähnlichkeitssuche eine Hilfe bei der Bilderschließung? Thomas Meiers Fraunhofer HHI Berlin Dr. Thomas Wolf Bayerische Staatsbibliothek

Die Bildähnlichkeitssuche eine Hilfe bei der Bilderschließung? Thomas Meiers Fraunhofer HHI Berlin Dr. Thomas Wolf Bayerische Staatsbibliothek Die Bildähnlichkeitssuche eine Hilfe bei der Bilderschließung? Thomas Meiers Fraunhofer HHI Berlin Dr. Thomas Wolf Bayerische Staatsbibliothek Motivation Massendigitalisierung Große Vielfalt an Material

Mehr

Interdisziplinäre fachdidaktische Übung: Sprache und Modelle. SS 2015: Grossmann, Jenko

Interdisziplinäre fachdidaktische Übung: Sprache und Modelle. SS 2015: Grossmann, Jenko Interdisziplinäre fachdidaktische Übung: Sprache und Modelle SS 2015: Grossmann, Jenko Einleitung Was ist ein Modell? Sprachlich orientierte Modelle Beispiele Wie entstehen Modelle? Zusammenhang Modell

Mehr

Federated Search: Integration von FAST DataSearch und Lucene

Federated Search: Integration von FAST DataSearch und Lucene Federated Search: Integration von FAST DataSearch und Lucene Christian Kohlschütter L3S Research Center BSZ/KOBV-Workshop, Stuttgart 24. Januar 2006 Christian Kohlschütter, 24. Januar 2006 p 1 Motivation

Mehr

Vergleich von SVM und Regel- und Entscheidungsbaum-Lernern

Vergleich von SVM und Regel- und Entscheidungsbaum-Lernern Vergleich von SVM und Regel- und Entscheidungsbaum-Lernern Chahine Abid Bachelor Arbeit Betreuer: Prof. Johannes Fürnkranz Frederik Janssen 28. November 2013 Fachbereich Informatik Fachgebiet Knowledge

Mehr

Kurzinhalt: Der Vortrag stellt die neue Gesamteinspielung der RVK in den SWB vor. Dabei wurden stabile Identnummern für die RVK-Notationen von der UB

Kurzinhalt: Der Vortrag stellt die neue Gesamteinspielung der RVK in den SWB vor. Dabei wurden stabile Identnummern für die RVK-Notationen von der UB Kurzinhalt: Der Vortrag stellt die neue Gesamteinspielung der RVK in den SWB vor. Dabei wurden stabile Identnummern für die RVK-Notationen von der UB Regensburg vergeben und in den SWB übernommen. Des

Mehr

Projektgruppe. Clustering und Fingerprinting zur Erkennung von Ähnlichkeiten

Projektgruppe. Clustering und Fingerprinting zur Erkennung von Ähnlichkeiten Projektgruppe Jennifer Post Clustering und Fingerprinting zur Erkennung von Ähnlichkeiten 2. Juni 2010 Motivation Immer mehr Internet-Seiten Immer mehr digitale Texte Viele Inhalte ähnlich oder gleich

Mehr

INFORMATION RETRIEVAL

INFORMATION RETRIEVAL INFORMATION RETRIEVAL Probabilistisches Modell Vortrag von David Wittum zum Hauptseminar Information Retrieval von Dr. Karin Haenelt Gehalten am 25.01.2010 ÜBERBLICK 1. Kurze Wiederholung: Berechnungsaufgaben

Mehr

Linked Open Data: Das Beispiel der Deutschen Nationalbibliothek als Beitrag zum Meinungsbildungsprozess in der AGV Konstanz, den 16.4.

Linked Open Data: Das Beispiel der Deutschen Nationalbibliothek als Beitrag zum Meinungsbildungsprozess in der AGV Konstanz, den 16.4. Reinhard Altenhöner mit Dank an die Kollegen Lars Svensson und Sarah Hartmann Linked Open Data: Das Beispiel der Deutschen Nationalbibliothek als Beitrag zum Meinungsbildungsprozess in der AGV Konstanz,

Mehr

Sarah Hartmann. ORCID DE Förderung der ORCID in Deutschland

Sarah Hartmann. ORCID DE Förderung der ORCID in Deutschland 1 Sarah Hartmann ORCID DE Förderung der ORCID in Deutschland 2 16 ORCID DE Normdatenanwendertreffen Bibliothekskongress Leipzig 15. März 2016 Was ist ORCID (Open Researcher and Contributor ID)? System

Mehr

Intelligentes Enterprise Information Management (EIM)

Intelligentes Enterprise Information Management (EIM) Intelligentes Enterprise Information Management (EIM) Franz Schreiber... verborgenes Wissen produktiv machen Durch Optimierung von Dokumenten und Informationen zum intelligenten EIM DM Dokumenten Management

Mehr

LOC-DB Status Prof. Dr. Kai Eckert / Dr. Annette Klein / Syed Tahseen Raza Rizvi

LOC-DB Status Prof. Dr. Kai Eckert / Dr. Annette Klein / Syed Tahseen Raza Rizvi LOC-DB Status Prof. Dr. Kai Eckert / Dr. Annette Klein / Syed Tahseen Raza Rizvi Mannheim, 06. November 2018 Überblick Was ist das Projekt LOC-DB? Was leistet das System aktuell? Was sind die nächsten

Mehr

Die Deutsche Historische Bibliografie Genese, Ziele und Entwicklungsstand

Die Deutsche Historische Bibliografie Genese, Ziele und Entwicklungsstand Die Deutsche Historische Bibliografie Genese, Ziele und Entwicklungsstand Katrin Getschmann, BSB Dr. Daniel Schlögl, IfZ Fortbildung für FachreferentInnen Zu Klios Diensten München, 21.-22. November 2017

Mehr

Diskriminatives syntaktisches Reranking für SMT

Diskriminatives syntaktisches Reranking für SMT Diskriminatives syntaktisches Reranking für SMT Fortgeschrittene Themen der statistischen maschinellen Übersetzung Janina Nikolic 2 Agenda Problem: Ranking des SMT Systems Lösung: Reranking-Modell Nutzung

Mehr

Vorlesung Wissensentdeckung

Vorlesung Wissensentdeckung Vorlesung Wissensentdeckung Stützvektormethode Katharina Morik, Uwe Ligges 23.5.2013 1 von 48 Gliederung 1 Geometrie linearer Modelle: Hyperebenen Einführung von Schölkopf/Smola 2 Lagrange-Optimierung

Mehr

Automatische Sacherschließung an der ZBW - Leibniz Informationszentrum Wirtschaft

Automatische Sacherschließung an der ZBW - Leibniz Informationszentrum Wirtschaft Automatische Sacherschließung an der ZBW - Leibniz Informationszentrum Wirtschaft Tobias Rebholz Wissenschaftliche Dienste ZBW Leibniz-Informationszentrum Wirtschaft Österreichischer Bibliothekartag 2015

Mehr

(Bamberg)

(Bamberg) Konzeption eines Frameworks für die Evaluation von Tag-Suggestion-Algorithmen Martin Garbe Steffen Oldenburg Lukas Zielinski Prof. Dr. Clemens Cap (Universität Rostock) 08.05.2008 (Bamberg) Übersicht Tags

Mehr

Computerunterstützte Sacherschliessung in der Zentralbibliothek Zürich

Computerunterstützte Sacherschliessung in der Zentralbibliothek Zürich Der Digitale Assistent Computerunterstützte Sacherschliessung in der Zentralbibliothek Zürich Prof. Dr. Susanna Bliggenstorfer, Direktorin Marcus Zerbst, Systembibliothekar Bremen, Deutscher Bibliothekartag,

Mehr

Vorlesung Maschinelles Lernen

Vorlesung Maschinelles Lernen Vorlesung Maschinelles Lernen Stützvektormethode Katharina Morik LS 8 Informatik Technische Universität Dortmund 12.11.2013 1 von 39 Gliederung 1 Hinführungen zur SVM 2 Maximum Margin Methode Lagrange-Optimierung

Mehr

Normen. Einfach. Managen. Mit Beratung und Lösungen von Beuth.

Normen. Einfach. Managen. Mit Beratung und Lösungen von Beuth. Normen. Einfach. Managen. Mit Beratung und Lösungen von Beuth. WERK RKN KNO NOR RMEN NAN NAL LYSE DIN Software: Wir holen das Beste aus Ihren Werknormen Die Herausforderung: Werknormen effizienter suchen

Mehr

GfKl Institut für Informationsmanagement. Fachhochschule Köln. T. Mengel K. Müller

GfKl Institut für Informationsmanagement. Fachhochschule Köln. T. Mengel K. Müller Anreicherung des Zugangsvokabulars zur DDC durch multilinguale Schlagwörter Das Projekt CrissCross vorgestellt am 08.03.2007 von Katrin Müller und Tina Mengel, FH Köln Projektdaten Projektträger: Deutsche

Mehr

Vorlesung Maschinelles Lernen

Vorlesung Maschinelles Lernen Vorlesung Maschinelles Lernen Stützvektormethode Katharina Morik LS 8 Informatik 8.11.2011 1 von 38 Gliederung 1 2 Lagrange-Optimierung 2 von 38 Übersicht über die Stützvektormethode (SVM) Eigenschaften

Mehr

LIVIVO: Das neue ZB MED-Suchportal für Lebenswissenschaften Jana Pössel. AGMB-Tagung Basel, Seite

LIVIVO: Das neue ZB MED-Suchportal für Lebenswissenschaften Jana Pössel. AGMB-Tagung Basel, Seite LIVIVO: Das neue ZB MED-Suchportal für Lebenswissenschaften Jana Pössel AGMB-Tagung Basel, 08.09.2015 MEDPILOT und GREENPILOT schließen einen Bund fürs Leben: LIVIVO Interdisziplinäre Literatursuche: Datenquellen

Mehr

Vorlesung Wissensentdeckung

Vorlesung Wissensentdeckung Vorlesung Wissensentdeckung Stützvektormethode Katharina Morik, Uwe Ligges 10.6.2010 1 von 40 Gliederung 1 Hinführungen zur SVM 2 Maximum Margin Methode Lagrange-Optimierung 3 Weich trennende SVM 2 von

Mehr

Automatische Vergabe von RVK-Notationen mittels fallbasiertem Schließen. Magnus Pfeffer Universitätsbibliothek Mannheim

Automatische Vergabe von RVK-Notationen mittels fallbasiertem Schließen. Magnus Pfeffer Universitätsbibliothek Mannheim Automatische Vergabe von RVK-Notationen mittels fallbasiertem Schließen Magnus Pfeffer Universitätsbibliothek Mannheim Gliederung Motivation und Historie Verfahren Umsetzung Experimentelle Ergebnisse Nachnutzung

Mehr

Vorlesung Wissensentdeckung

Vorlesung Wissensentdeckung Gliederung Vorlesung Wissensentdeckung Stützvektormethode 1 Hinführungen zur SVM Katharina Morik, Claus Weihs 26.5.2009 2 Maximum Margin Methode Lagrange-Optimierung 3 Weich trennende SVM 1 von 40 2 von

Mehr

Projekt-INF Folie 1

Projekt-INF Folie 1 Folie 1 Projekt-INF Entwicklung eines Testbed für den empirischen Vergleich verschiedener Methoden des maschinellen Lernens im Bezug auf die Erlernung von Produktentwicklungswissen Folie 2 Inhalt Ziel

Mehr

Support Vector Machines (SVM)

Support Vector Machines (SVM) Universität Ulm 12. Juni 2007 Inhalt 1 2 3 Grundlegende Idee Der Kern-Trick 4 5 Multi-Klassen-Einteilung Vor- und Nachteile der SVM 1 2 3 Grundlegende Idee Der Kern-Trick 4 5 Multi-Klassen-Einteilung Vor-

Mehr

Lieferung von Metadaten für Netzpublikationen an die Deutsche Nationalbibliothek. Metadaten-Kernset Definitionen

Lieferung von Metadaten für Netzpublikationen an die Deutsche Nationalbibliothek. Metadaten-Kernset Definitionen Lieferung von Metadaten für Netzpublikationen an die Deutsche Nationalbibliothek Metadaten-Kernset Definitionen Version 1.2 Stand: 12. März 2012 Redaktion: Maren Brodersen, Petra Fischer, Renate Weber

Mehr

Chancen im OPUS: Automatisiert SWD-Schlagwörter produzieren

Chancen im OPUS: Automatisiert SWD-Schlagwörter produzieren Chancen im OPUS: Automatisiert SWD-Schlagwörter produzieren SULB: Aufgabenspektrum Landesbibliothek SULB Universitätsbibliothek der Universität des Saarlandes Sondersammelgebiet Psychologie Landesbibliothek

Mehr

Neue Dienste der Elektronischen Zeitschriftenbibliothek

Neue Dienste der Elektronischen Zeitschriftenbibliothek Dr. Max Mustermann Referat Kommunikation & Marketing Verwaltung Neue Dienste der Elektronischen Zeitschriftenbibliothek Dr. Evelinde Hutzler Universitätsbibliothek Regensburg 106. Bibliothekartag 2017,

Mehr

CLARIN-D. Überblick, Metadaten, Demo. Christoph Kuras. Abt. Automatische Sprachverarbeitung Institut für Informatik, Universität Leipzig

CLARIN-D. Überblick, Metadaten, Demo. Christoph Kuras. Abt. Automatische Sprachverarbeitung Institut für Informatik, Universität Leipzig CLARIN-D Überblick, Metadaten, Demo Christoph Kuras Abt. Automatische Sprachverarbeitung Institut für Informatik, Universität Leipzig Institut für Informatik 1 CLARIN: Common Language Resource and Technology

Mehr

FRED, der Autopilot Sacherschliessung leicht gemacht?

FRED, der Autopilot Sacherschliessung leicht gemacht? FRED, der Autopilot Sacherschliessung leicht gemacht? Dr. Priska Bucher Leitung Fachreferate Sozial- und Naturwissenschaften, Recht Marcus Zerbst Systembibliothekar Zürich, NEBIS-Verbundtagung 16. Juni

Mehr

Christoph Broschinski, <broschinski@uni bielefeld.de>

Christoph Broschinski, <broschinski@uni bielefeld.de> Normalisierung von Lizenzinformationen in OAI Metadaten: Ein Beitrag zur Verbesserung der Open Access Statusanzeige in wissenschaftlichen Suchmaschinen Christoph Broschinski,

Mehr

Morpho-semantische Analyse von Texten

Morpho-semantische Analyse von Texten PETRUS-Workshop Automatische Erschließungsverfahren am 21./22. März 2011 Morpho-semantische Analyse von Texten Dr. Kornél Markó Dr. Katrin Tomanek Averbis GmbH Über Averbis Herkunft: Spin-off des Universitätsklinikums

Mehr

Neue Erkenntnisse aus unstrukturierten Daten gewinnen

Neue Erkenntnisse aus unstrukturierten Daten gewinnen Neue Erkenntnisse aus unstrukturierten Daten gewinnen Univ.-Prof. Dr. Josef Küng Institut für anwendungsorientierte Wissensverarbeitung (FAW) Johannes Kepler Universität Linz In Zusammenarbeit mit Mag.

Mehr

Integration von multimedialen Objekten in den GVK

Integration von multimedialen Objekten in den GVK Integration von multimedialen Objekten in den GVK Elena Derr, 28. Februar 2007 Übersicht ELAN-Projekt: Ziele und Aufgaben Aufgaben der TIB und UB Hannover Dauerhafter Nachweis Integration und Bereitstellung

Mehr

Uta Ackermann / Dirk Weisbrod (DNB) URN-Service der DNB

Uta Ackermann / Dirk Weisbrod (DNB) URN-Service der DNB Uta Ackermann / Dirk Weisbrod (DNB) URN-Service der DNB Inhaltsverzeichnis 1. urn:nbn:de 1. Ursprung und Motivation 2. urn:nbn:de-service als kooperativer Dienst 3. URN an der DNB 4. Andere PI an der DNB

Mehr

UNIVERSITÄT DES SAARLANDES PfflLOSOPHISCHE FAKULTÄT HI EMPIRISCHE HUMANWISSENSCHAFTEN

UNIVERSITÄT DES SAARLANDES PfflLOSOPHISCHE FAKULTÄT HI EMPIRISCHE HUMANWISSENSCHAFTEN UNIVERSITÄT DES SAARLANDES PfflLOSOPHISCHE FAKULTÄT HI EMPIRISCHE HUMANWISSENSCHAFTEN Automatische Klassifizierung von deutschsprachigen elektronischen Katalogen der Elektroindustrie nach dem Elektrotechnischen

Mehr

Mustererkennung. Support Vector Machines. R. Neubecker, WS 2018 / Support Vector Machines

Mustererkennung. Support Vector Machines. R. Neubecker, WS 2018 / Support Vector Machines Mustererkennung R. Neubecker, WS 018 / 019 (SVM) kommen aus der statistischen Lerntheorie gehören zu den optimalen Klassifikatoren = SVMs minimieren nicht nur den Trainingsfehler, sondern auch den (voraussichtlichen)

Mehr

Textmining Klassifikation von Texten Teil 2: Im Vektorraummodell

Textmining Klassifikation von Texten Teil 2: Im Vektorraummodell Textmining Klassifikation von Texten Teil 2: Im Vektorraummodell Dept. Informatik 8 (Künstliche Intelligenz) Friedrich-Alexander-Universität Erlangen-Nürnberg (Informatik 8) Klassifikation von Texten Teil

Mehr

Regensburger Verbundklassifikation und Schlagwortnormdatei im Tandem

Regensburger Verbundklassifikation und Schlagwortnormdatei im Tandem Regensburger Verbundklassifikation und Schlagwortnormdatei im Tandem Vortrag zur Bachelorarbeit im Fach Wissensmanagement an der Hochschule der Medien Stuttgart (SS 2009) Judith Probstmeyer Erstprüfer:

Mehr

Das DINI-Zertifikat 2010 Qualitätskriterien für wissenschaftliche Publikationsdienste Uwe Müller

Das DINI-Zertifikat 2010 Qualitätskriterien für wissenschaftliche Publikationsdienste Uwe Müller Das DINI-Zertifikat 2010 Qualitätskriterien für wissenschaftliche Publikationsdienste Uwe Müller Repositories im wissenschaftlichen Bereich Publikationsplattform bzw. Ablageort für Erst- und Parallelveröffentlichungen

Mehr

1/19. Kern-Methoden zur Extraktion von Informationen. Sebastian Marius Kirsch Back Close

1/19. Kern-Methoden zur Extraktion von Informationen. Sebastian Marius Kirsch Back Close 1/19 Kern-Methoden zur Extraktion von Informationen Sebastian Marius Kirsch skirsch@moebius.inka.de 2/19 Gliederung 1. Verfahren zur Extraktion von Informationen 2. Extraktion von Beziehungen 3. Maschinelles

Mehr

Methoden zur Cluster - Analyse

Methoden zur Cluster - Analyse Kapitel 4 Spezialvorlesung Modul 10-202-2206 (Fortgeschrittene Methoden in der Bioinformatik) Jana Hertel Professur für Bioinformatik Institut für Informatik Universität Leipzig Machine learning in bioinformatics

Mehr