Innovative Erschließung und Bereitstellung von Musikdokumenten im Probado-Projekt



Ähnliche Dokumente
Innovative Erschließung und Bereitstellung von Musikdokumenten im PROBADO-Projekt

Das Probado-Musikrepository an der Bayerischen Staatsbibliothek

DIE ZUKUNFT BEGINNT JETZT: ELEKTRONISCHE UNTERSCHRIFT

Jederzeit Ordnung halten

Über die Internetseite Hier werden unter Download/aktuelle Versionen die verschiedenen Module als zip-dateien bereitgestellt.

GE Capital Equipment Financing. GE Capital Leasing-Tool Schulungsunterlagen

OPplus Document Capture

Doku Pro Dokumenten & Informationsmanagement

Outlook. sysplus.ch outlook - mail-grundlagen Seite 1/8. Mail-Grundlagen. Posteingang

Anleitung zur Bearbeitung von Prüferkommentaren in der Nachreichung

Task: Nmap Skripte ausführen

Wichtige Hinweise zu den neuen Orientierungshilfen der Architekten-/Objektplanerverträge

Einrichten des Elektronischen Postfachs

Netzwerkeinstellungen unter Mac OS X

UpToNet DMS für die Immobilienbranche. Bis zu 50% Zeitersparnis bei der Dokumenten-Archivierung mit UpToNet DMS

Vorgehensweise bei Lastschriftverfahren

1 Einleitung. Lernziele. Symbolleiste für den Schnellzugriff anpassen. Notizenseiten drucken. eine Präsentation abwärtskompatibel speichern

Mediumwechsel - VR-NetWorld Software

Ihr CMS für die eigene Facebook Page - 1

Anwendungsbeispiele. Neuerungen in den s. Webling ist ein Produkt der Firma:

Informationskompetenz (Elektronisches Buch)

1. Einführung. 2. Die Mitarbeiterübersicht

Lehrer: Einschreibemethoden

How-to: Webserver NAT. Securepoint Security System Version 2007nx

INDEX. Öffentliche Ordner erstellen Seite 2. Offline verfügbar einrichten Seite 3. Berechtigungen setzen Seite 7. Öffentliche Ordner Offline

Umzug der abfallwirtschaftlichen Nummern /Kündigung

Anleitung Team-Space Einladung Annehmen. by DSwiss AG, Zurich, Switzerland V

Simple SMS SMS Gateway

Zunächst ist dieser Service nur für Mac OS verfügbar. Drucken unter Windows wird Ihnen im Laufe des Semesters zur Verfügung stehen.

ARCHIV- & DOKUMENTEN- MANAGEMENT-SERVER PAPIER ARCHIVIEREN

1 Dokumentenmanagement

Benutzerverwaltung Business- & Company-Paket

IAWWeb PDFManager. - Kurzanleitung -

User Manual Data 24. Login und Layout

Anleitung zur Daten zur Datensicherung und Datenrücksicherung. Datensicherung

Installation und Inbetriebnahme von SolidWorks

Individuelle Formulare

Datenaustausch mit dem BVK Data Room

Abamsoft Finos im Zusammenspiel mit shop to date von DATA BECKER

Novell Client. Anleitung. zur Verfügung gestellt durch: ZID Dezentrale Systeme. Februar ZID Dezentrale Systeme

YouTube: Video-Untertitel übersetzen

Alice SmartDisk. Auf dem PC - Schritt für Schritt erklärt

Schnittstelle DIGI-Zeiterfassung

[accantum].hosted Übersicht

Installationsanleitungen

MORE Profile. Pass- und Lizenzverwaltungssystem. Stand: MORE Projects GmbH

Für die Einrichtung des elektronischen Postfachs melden Sie sich wie gewohnt in unserem Online-Banking auf an.

Eine Einführung in die Installation und Nutzung von cygwin

Die Rückgabe kann über folgende, von uns getestete Programme / Apps vorgenommen werden: Adobe Digital Editions Sony Reader for PC Bluefire Reader

PowerPoint vertonen. by H.Schönbauer 1

MOZonline. Schulungsunterlagen Leistungen für Bedienstete. zur Verfügung gestellt durch: ZID Dezentrale Systeme. Februar ZID Dezentrale Systeme

Erste Schritte mit Desktop Subscription

Wiederkehrende Bestellungen. Tipps & Tricks

einrichtung in den kaufmännischen Programmen der WISO Reihe

GDPdU Export. Modulbeschreibung. GDPdU Export. Software-Lösungen. Stand: Seite 1

Ihre Interessentendatensätze bei inobroker. 1. Interessentendatensätze

Einstieg in Exact Online Buchungen erfassen. Stand 05/2014

Lizenzen auschecken. Was ist zu tun?

Vergleich: Positionen der Word 2003-Befehle in Word

Änderungsbeschreibung HWS32 SEPA Überweisungen

Whitepaper. Produkt: combit Relationship Manager / address manager. Dateiabgleich im Netzwerk über Offlinedateien

Informationen zum neuen Studmail häufige Fragen

Mediumwechsel - VR-NetWorld Software

ACHTUNG: Es können gpx-dateien und mit dem GP7 aufgezeichnete trc-dateien umgewandelt werden.

Er musste so eingerichtet werden, dass das D-Laufwerk auf das E-Laufwerk gespiegelt

teischl.com Software Design & Services e.u. office@teischl.com

Bedienungsanleitung für den Online-Shop

FORUM HANDREICHUNG (STAND: AUGUST 2013)

Microsoft Access 2013 Navigationsformular (Musterlösung)

Zeiterfassung mit Aeonos. Bedienungsanleitung für die App

Guide DynDNS und Portforwarding

Kostenstellen verwalten. Tipps & Tricks

Windows 7: Neue Funktionen im praktischen Einsatz - Die neue Taskleiste nutzen

Überprüfung der digital signierten E-Rechnung

ecaros2 - Accountmanager

HANDBUCH PHOENIX II - DOKUMENTENVERWALTUNG

Empfehlungen zur Nutzung der CD zum Buch: Klee & Wiemann: Beweglichkeit und Dehnfähigkeit. Schorndorf: Hofmann,

Mail-Signierung und Verschlüsselung

Einsatzbearbeitung im Sanitätsdienst

DER SELBST-CHECK FÜR IHR PROJEKT

Die Downloadarea ist nur noch bedingt mit den bestehenden Dingen befüllt, wird aber nicht mehr aktualisiert.

DOKUMENTATION VOGELZUCHT 2015 PLUS

RIGGTEK. Dissolution Test Systems. DissoPrep Browser-Interface

Grundfunktionen und Bedienung

Inhalt. 1 Einleitung AUTOMATISCHE DATENSICHERUNG AUF EINEN CLOUDSPEICHER

Anleitung - Archivierung

Kaiser edv-konzept, Inhaltsverzeichnis

Anleitung zum Importieren, Durchführen und Auswerten von Umfragen in Blackboard

2. Die eigenen Benutzerdaten aus orgamax müssen bekannt sein

Die Dateiablage Der Weg zur Dateiablage

e LEARNING Kurz-Anleitung zum Erstellen eines Wikis 1. Wiki erstellen

Zwischenablage (Bilder, Texte,...)

kurzanleitung modul debitoren

BEO-SANKTIONSPRÜFUNG Eine Einführung zum Thema Sanktionsprüfung und eine Übersicht zur BEO-Lösung.

Ordner Berechtigung vergeben Zugriffsrechte unter Windows einrichten

Das große ElterngeldPlus 1x1. Alles über das ElterngeldPlus. Wer kann ElterngeldPlus beantragen? ElterngeldPlus verstehen ein paar einleitende Fakten

Zimmertypen. Zimmertypen anlegen

Transkript:

Jürgen Diet, Christian Göhlert Innovative Erschließung und Bereitstellung von Musikdokumenten im Probado-Projekt Musik und andere nicht-textuelle Dokumente stellen sowohl Bibliothekare als auch die Nutzer von Bibliotheken vor große Herausforderungen. Obwohl sich die Technologie zur Verarbeitung und Nutzung rein textueller Dokumente in den letzten Jahren sprunghaft entwickelt hat, hinkt die Verarbeitung nicht-textueller Dokumente in dieser Hinsicht weit hinterher. Während Volltextsuche in und automatische Indexierung von Texten mittlerweile gängige Praxis ist, bleibt die Arbeit mit Musik meist auf die Suche in manuell erstellten Metadaten beschränkt. Hier setzt das Projekt Probado ( Prototypischer Betrieb allgemeiner Dokumente ) 1 an. Gemeinsam mit der TIB Hannover und Informatikern der Universität Bonn und der TU Darmstadt entwickelt die Bayerische Staatsbibliothek in diesem seit Februar 2006 von der Deutschen Forschungsgemeinschaft geförderten und auf fünf Jahre angelegten Projekt innovative Lösungen für die einzigartigen Probleme, die die Erschließung und Bereitstellung nicht-textueller Dokumente an Bibliotheken und ihre Nutzer stellen 2. Tonaufnahmen und Musikalien stehen dabei im Mittelpunkt des Teilprojekts Probado-Musik, das von der Bayerischen Staatsbibliothek bzw. deren Münchner Digitalisierungszentrum und Musikabteilung sowie dem Institut für Informatik III der Universität Bonn (Arbeitsgruppe Professor Clausen) betreut wird. Die drei wichtigsten Ziele dieses Teilprojektes sind die weitgehende Automatisierung der Erschließung und Indexierung von Musikdokumenten, die Anwendung neuartiger inhaltsbasierter Suchverfahren für Musik und der Aufbau nutzerfreundlicher Oberflächen zur komfortablen Arbeit mit diesen Dokumenten. Der Kern von Probado-Musik besteht aus dem an der Bayerischen Staatsbibliothek angesiedelten Repositorium, das Musikdokumente in verschiedenen Formaten enthält. 3 Dazu gehören sowohl die eingescannten Partituren im TIFF-Format und JPEG-Format, als auch symbolische Musikformate wie z.b. Music-XML und MIDI. Symbolische Musikformate können vom Rechner gelesen und verarbeitet werden und ermöglichen die inhaltsorientierte Suche in den Musikdokumenten. Hinzu kommen Audiodateien verschiedener Einspielungen der Werke im WAV- und MP3-Format und natürlich sämtliche relevanten Metadaten. 1 Für allgemeine Informationen zum Projekt Probado siehe http://www.probado.de/ 2 Vgl. Ina Blümel, Jürgen Diet, Harald Krottmaier: Integrating Multimedia Repositories into the PROBADO Framework, in Proceedings of the 11th International Conference on Digital Information Management (ICDM 2008), Nov. 2008. 3 Vgl. Jürgen Diet, Frank Kurth: The Probado Music at the Bavarian State Library, in Proceedings of the 8 th Conference on Music Information Retrieval (ISMIR 2007), Sept. 2007, online verfügbar unter http://ismir2007.net/proceedings/ismir2007_p501_diet.pdf

Dafür wurde eigens ein Metadatenmodell entwickelt, das sich weitgehend an FRBR (Functional Requirements for Bibliographic Records) 4 orientiert. Im Mittelpunkt dieses Modells steht nicht die einzelne Ausgabe oder auch Einspielung eines musikalischen Werkes, sondern das Werk an sich, die abgeschlossene, selbstständige geistige oder künstlerische Schöpfung. Die Bearbeitung oder die Übersetzung eines Werks, d.h. die geistige oder künstlerische Realisierung dieser Schöpfung, die Ausgabe oder Einspielung, in der sich diese Realisierung manifestiert, und schließlich das gedruckte Buch, die CD oder die Audiodatei, die wiederum als deren materieller Ausdruck in den Regalen einer Bibliothek stehen, beziehungsweise auf ihren Rechnern gespeichert ist; all diese Ebenen sind dem eigentlichen Werk in FRBR untergeordnet, ihm gleichsam angegliedert. Gerade im Bereich Musik liegen die Vorteile eines solchen werkorientierten Modells auf der Hand: Ein einzelnes musikalisches Werk liegt oft in zahllosen Ausgaben, Bearbeitungen und Einspielungen vor. Tonträger umfassen nicht selten Teile verschiedenster Werke, etwa Lieder aus verschiedenen Zyklen, mitunter auch Werke verschiedener Komponisten. Die Recherche auf der Ebene des einzelnen bibliographischen Katalogeintrags gestaltet sich für den Nutzer oft zeitraubend und frustrierend. Das Probado- Metadatenmodell schafft Abhilfe; es macht die Recherche einfacher, schneller und präziser. 4 Zum FRBR-Modell siehe IFLA Study Group on the Functional Requirements of Bibliographic Records. Functional Requirements for Bibliographic Records (Hg.): Functional Requirements for Bibliographic Records Final Report. Saur, München: K.G. Saur, 1998, verfügbar unter www.ifla.org/vii/s13/frbr/frbr.pdf

0,1 0,1 Work part_of contr_work Contributor work_exp 1,1 contr_expr Expression contr_manif exp_man 1,* 0,1 Ma nifes ta tion based_upon man_item 1,1 1,1 File item_file Item Abbildung 1: Das Probado-Metadatenmodell Abb. 1 zeigt den Aufbau des Probado-Metadatenmodells und offenbart, wie eng es an den Vorgaben von FRBR ausgerichtet ist: Mit work, expression, manifestation und item wurden alle Entitäten der FRBR-Gruppe 1 übernommen. Die Entität contributor hingegen deckt die Entitäten der FRBR-Gruppe 2 ab, die für die beteiligten Personen und Körperschaften stehen. Als zusätzliche Entität, die nicht in FRBR enthalten ist, wurde im obigen Modell die Entität file aufgenommen. Dort werden Informationen

zu den Dateien abgelegt, die zu einem item gehören, z.b. zu den WAV- und MP3-Dateien einer CD oder die TIFF- und JPEG-Dateien, die zu einem Notendruck gehören. In der frühen Phase des Projekts enthielt das Repositorium nur eine kleine Menge von Musikdokumenten zu Testzwecken. Insgesamt umfasste es etwa 6000 gescannte Seiten klassischromantischer Klavierlieder und Klaviersonaten mit den dazugehörigen Audiodateien und Metadaten. Derzeit wird das Repositorium systematisch durch Werkausgaben großer Komponisten erweitert. Die Digitalisierung der Werke von Franz Liszt, Georg Friedrich Händel, Felix Mendelssohn Bartholdy und Robert Schumann ist bereits abgeschlossen, ihre Erschließung und die Befüllung der Datenbanken mit den nach dem neuen Modell gestalteten Metadaten läuft noch. Dadurch konnte das Repositorium bis jetzt um ca. 55.000 Notenseiten erweitert werden. User Interface Layer Standard Search Content-based Search User Layer Interface (Global Metadata) Manager Dispatcher Session&User Manager Probado System Layer Interface (Music) (3D)... Layer Abbildung 2: Die Probado-Systemarchitektur Bei der technischen Umsetzung des Repositoriums wurde großer Wert auf die Erweiterbarkeit und auf die Einbindung in das Gesamtprojekt Probado gelegt. Wie aus Abb. 2 ersichtlich wird, ist das Musik- Repositorium nur eines von mehreren Repositoren, in denen jeweils nicht-textuelle Dokumente einer

bestimmten Art gesammelt sind. Parallel zum Teilprojekt Probado-Musik läuft das Teilprojekt Probado-3D, bei dem die Arbeit mit dreidimensionalen Computergraphiken im Mittelpunkt steht, wie sie etwa in der Architektur Verwendung finden. Jedes Teilprojekt verfügt über ein eigenes Repositorium, in dem nicht nur die Dokumente selbst, sondern auch alle Programme und Funktionen enthalten sind, die zur Arbeit mit ihnen nötig sind, so etwa zur Suche in den Dokumenten. Die zentrale Systemschicht sorgt dafür, dass die von den Nutzern gestellten Suchanfragen an die entsprechenden Repositorien weitergeleitet und die Suchergebnisse aus den Repositorien an den Nutzer zurückgegeben werden. Dazu enthält sie neben den nötigen Programmen für die Verwaltung und Bearbeitung von Nutzeranfragen lediglich eine kleine Sammlung globaler Dublin-Core-Metadaten der Dokumente in allen Repositorien. Die eigentliche Sucharbeit wird dann in den Repositorien selbst geleistet. So wird sichergestellt, dass Probado jederzeit durch neue Repositorien erweitert werden kann, ohne dass dafür tief greifende Änderungen an der Systemschicht nötig wären. Die Systemschicht wird zentral eingerichtet und verwaltet, die einzelnen Repositorien aber werden lokal betrieben. Welche Dokumente und Funktionen aber stellt das Musik-Repositorium nun genau bereit? Wie bereits beschrieben, umfasst das Musik-Repositorium zwei Arten von Dokumenten: Tonaufnahmen und gescannte Noten. Auf diese Dokumente soll wie in Abb. 3 dargestellt mit vier verschiedenen Suchverfahren zugegriffen werden: Der traditionellen Suche in den Metadaten, der Suche in Liedtexten, der Suche nach Melodien und der Suche nach Audioausschnitten. Die Suche in den Metadaten ähnelt der traditionellen Suche in einem OPAC. Die Metadaten, mit denen die nach dem oben beschriebenen Modell gestaltete Datenbank befüllt wird, stammen vornehmlich aus zwei Quellen: dem Katalog der Bayerischen Staatsbibliothek und externen Datenbanken, wie sie beispielsweise von der Tonträgerindustrie betrieben werden. Die Anpassung dieser Daten an das neue Metadatenmodell, sozusagen die FRBRisierung, ist noch nicht restlos automatisierbar, weshalb auch noch manuelle Katalogisierungsarbeit notwendig ist. Sowie die Datenbank mit den Metadaten befüllt ist, stellt die Suche darin kein großes Problem mehr dar.

Interface to Probado System Layer Query Engine 1 Lyrics Search Query Engine 2 Melody Search Query Engine 3 Audio Matching Query Engine 4 Metadata Search Lyrics Index Melody Index Feature Index Lyrics Indexer Lyrics Melody Indexer Symbolic Music Feature Indexer Symbolic Music Feature Indexer Audio Database (Metadata) OCR OMR Scanned Scores Document collections Audio Recordings Abbildung 3: Der Aufbau des Musik-Repositoriums Für die inhaltsbasierte Suche nach Liedtexten, Melodien und Audioausschnitten ist hingegen jeweils ein eigener Suchindex notwendig. Die Indexierung ist dabei weitestgehend automatisiert. Die Suche in Liedtexten ähnelt stark der traditionellen Volltextsuche, die Suche nach Melodien und Audioausschnitten gestaltet sich hingegen etwas komplizierter. Parallel zur traditionellen Texterkennungssoftware existieren Programme zur Notenerkennung, die die für den Menschen lesbaren Noten in symbolische Formate umwandeln. Aus diesen symbolischen Formaten wird dann mittels von Informatikern der Universität Bonn entwickelten Indexierungsverfahren ein Suchindex erstellt, mit dessen Hilfe der Nutzer beispielsweise nach Melodien suchen kann.

Abbildung 4: Der Probado-Score-Viewer Damit der Anwender den größtmöglichen Nutzen aus diesen neuartigen Möglichkeiten ziehen kann, müssen ihm entsprechende Nutzeroberflächen zur Verfügung gestellt werden. Soll er beispielsweise nach Melodien und Harmoniefolgen suchen können, müssen ihm die nötigen Werkzeuge an die Hand gegeben werden, diese Melodien einzugeben, etwa durch Summen in ein Mikrofon oder durch die Eingabe auf einer elektronischen Klaviatur. Auch in der Darstellung der Dokumente will Probado neue Wege beschreiten. So ist beispielsweise geplant, die Anzeige von Noten und die Wiedergabe der Audiodateien eng miteinander zu verbinden. In der eigens zu diesem Zweck entwickelten Software, dem in Abb. 4 dargestellten Probado-Score-Viewer wird während der Wiedergabe der Audiodatei der jeweils gerade gespielte Takt farblich hervorgehoben. Durch einen einfachen Klick auf einen bestimmten Takt in den Notenscans lässt sich jede Stelle des Stückes in der Audio-Wiedergabe gezielt ansteuern. Abb. 5 veranschaulicht die Synchronisation von Notenblatt und Audiodatei, und auf der Probado-Webseite http://www.probado.de ist in der Rubrik Demo ein 7-minütiges Video zu sehen, das einen Eindruck vom Probado-Score-Viewer vermittelt.

Abbildung 5: Die Synchronisation von Notendarstellung und Audioplayback Inwiefern es rechtlich möglich sein wird, dem Nutzer die Audiodateien zur Verfügung zu stellen, wird derzeit noch geklärt, wobei u.a. die Anwendung des neuen 52b im Urheberrechtsgesetz geprüft wird ( Wiedergabe von Werken an elektronischen Leseplätzen in öffentlichen Bibliotheken, Museen und Archiven ) und die Digitalisierung von mindestens 50 Jahre alten Tonträgern in Erwägung gezogen wird, bei denen die Leistungsschutzrechte abgelaufen sind. Schon heute ist es aber möglich, über die ViFaMusik auf die im Rahmen von Probado-Musik digitalisierten Werkausgaben von Liszt, Händel, Mendelssohn Bartholdy und Schumann zuzugreifen. Auf http://www.vifamusik.de lassen sich die Digitalisate im Bereich Digitalisierungen einsehen und inzwischen auch als PDF-Dokumente herunterladen. Auch in Zukunft sollen Probado und die Angebote der ViFaMusik eng miteinander verzahnt werden, etwa durch die Anwendung der für Probado entwickelten Technologien auf die Datenquellen der ViFaMusik. Jürgen Diet und Christian Göhlert sind Mitarbeiter des Münchener Digitalisierungszentrums der Bayerischen Staatsbibliothek und arbeiten dort für das Probado-Projekt.