Die Metadateninfrastruktur des CLARIN-Projektes
|
|
- Helene Schulze
- vor 6 Jahren
- Abrufe
Transkript
1 Die Metadateninfrastruktur des CLARIN-Projektes Thomas Eckart Abteilung Automatische Sprachverarbeitung Universität Leipzig, Deutschland 1
2 Agenda 1. Forschungsinfrastruktur CLARIN 2. Metadaten in CLARIN (CMDI) 3. Erstellungsprozess von Metadaten 4. Bereitstellung und Aufbereitung von Metadaten in föderierten Infrastrukturen 5. Problemfälle und Lösungsansätze 2
3 Metadaten? Metadaten [ ] sind Daten, die Informationen über Merkmale anderer Daten enthalten, aber nicht diese Daten selbst. Interoperable Metadaten sind [...] Metadaten aus potenziell unterschiedlichen Quellen, zwischen denen eine Beziehung in der Weise besteht, dass mit ihnen gemeinsam gearbeitet werden kann. ( 3
4 Wozu? FRBR User Tasks: Find: meeting a user's search criteria Identify/Select: confirm they have found what they looked for, meeting a user's requirements with respect to content, physical format, etc. Obtain: enables to acquire an entity (Navigate) ( 4
5 Schema vs. Instanz Bauplan vs. Konkrete Ausprägung Person vs. Thomas Eckart,... 5
6 1. CLARIN Eine Forschungsinfrastruktur für Sprachressourcen 6
7 CLARIN-D CLARIN-D Eine web- und zentrenbasierte Forschungsinfrastruktur für die Geistesund Sozialwissenschaften Linguistische Daten, Werkzeuge und Dienste werden bereitgestellt... In einer integrierten, interoperabel und skalierbaren Infrastruktur Entwickelt für und in enger Zusammenarbeit mit den Geistes- und Sozialwissenschaften Gefördert vom Bundesministerium für Bildung und Forschung (BMBF) CLARIN ist eine europäische InfrastrukturInitiative mit zur Zeit 15+ Mitgliedsländern Aktuelle Förderung bis September 2020 Website: 7
8 Ressourcen Textkorpora / Treebanks / Wörterbücher Audio (+Transkriptionen) Multimodale Daten (z.b. Video + Audio + Gesten) Werkzeuge: Annotation, Visualisierungen Services: SOAP/RESTful Webservices Beschreibung interner Projektstrukturen CLARIN-D, , Berlin 8
9 Architektur Keine monolithische Architektur Stattdessen: verteilte Architektur / föderiertes System CLARIN-D, , Berlin 9
10 Walkthrough VLO -> FCS -> WebLicht 11
11 Architektur Zertifizierungsprozess für Zentren u.a. Kontaktpersonen (administrativ/technisch) Data Seal of Approval Assessment Verwendung persistenter Identifier (PIDs) Beschreibung vorliegender Ressourcen über Metadaten CLARIN-D, , Berlin 12
12 Voraussetzungen 13
13 2. Component MetaData Infrastructure Metadaten in CLARIN 14
14 CMDI Beispiel: Beschreibung eines texttragenden Objektes 15
15 CMDI Beispiel: Aspekte der Beschreibung eines texttragenden Objektes Autor Titel/Name Beschreibung Sprache Identifier (ISBN, Handle, DOI,...) Zugriffsort (Regalnummer, URI) Zeitangaben: Publikation, Änderungen Schlüsselwörter/Keywords Bereitstellende Institution/Person Kontaktdaten Angaben zur Größe (Wörter, Sätze, Fläche, Gewicht,...) Angaben zum Zustand usw. usf. 16
16 CMDI Beispiel: Aspekte der Beschreibung eines texttragenden Objektes Autor Ersteller Titel/Name Beschreibung Sprache Identifier (ISBN, Handle, DOI,...) Zugriffsort (Regalnummer, URI) Zeitangaben: Publikation, Änderungen Schlüsselwörter/Keywords Bereitstellende Institution/Person Kontaktdaten Angaben zur Größe (Wörter, Sätze, Fläche, Gewicht,...) Angaben zum Zustand usw. usf. 17
17 CMDI CMDI: Allgemeines Framework zur Beschreibung von Metadatenformaten Metaformat zur Spezifikation von MDSchemata (ISO :2015) Ressourcentypen-übergreifend 18
18 CMDI Grundideen (1): Alle Ressourcen sollten beliebig (fein-)granular beschreiben werden können Alle Ressourcen(-typen) können durch verschiedene Aspekte beschrieben werden Aspekte können Ressourcentypen-spezifisch sein (sind es aber häufig nicht) Wiederverwendbarkeit ist gut Spart Zeit Erlaubt Berücksichtigung von Expertenwissen Verringert Fehler 19
19 CMDI - Komponente Beispiel: Aspekt Kontaktdaten Personenname Postadresse -Adresse Organisation Telefonnummer Webseite In CMDI: 1 Aspekt 1 Komponente Komponente = Bauplan / Template / Schema 20
20 CMDI - Komponente Beispiel: Aspekt Kontaktdaten Person: Erika Mustermann Adresse: Heidestrasse 17, Köln emuster@server.de emuster@server2.de Organisation: Telefon: 0123/ Website: - 21
21 CMDI Grundideen (2): Jeder (im Prinzip) kann solche Komponenten erstellen Gespeichert an zentralem Ort Ziel: beliebig detaillierte Beschreibung eigener Ressourcentypen 22
22 CMDI - Komponente Ziele: Formale Interpretierbarkeit Wiederverwendbarkeit Verständlichkeit Austauschbarkeit Ausnutzung von Expertenwissen Effizientere Arbeitsprozesse Offenheit 25
23 CMDI - Profil Bündelung aller Aspekte eines Ressourcentypen in einem Profil Profil = vollständiger Bauplan zur Beschreibung einer Klasse von Ressourcen 26
24 CMDI - Profil 27
25 CMDI - Komponente Zusammenfassung: Jeder Ressourcentyp = 1 Profil Profil besteht aus beliebig vielen Komponenten Profil dient zur Beschreibung beliebig vieler Instanzen (Ressourcen) 28
26 3. Erstellungsprozess von Metadaten in der CMDI 29
27 Erstellung von Metadaten Erstellung von Metadaten 1. Erstellen bzw. Finden eines passenden Schemas zentrale Registratur (Freie Lesezugriff, Login für Schreibzugriff) 2. Erstellen konkreter Instanzen als Beschreibung konkreter Objekte dezentral (zentrenabhängig) 30
28 Erstellung von Metadaten Component Registry (Testversion) ComponentRegistry 31
29 Erstellung von Metadaten Instanzerstellung Manuell XML-Editoren (Oxygen, XMLSpy,...) Web-Editoren (z.b. COMEDI) Automatisch Transformationen aus bestehenden Metadaten (z.b. XSLT) XML-Bibliotheken (z.b. XStream, JAXB) 32
30 Erstellung von Metadaten Beispiel für Instanzdatei eines Textkorpus: Name: deu_news_2010_1m Identifier: hdl:11022/ e0-e Sätze deutscher Zeitungstext von
31 4. Bereitstellung und Aufbereitung von Metadaten in föderierten Infrastrukturen 34
32 Bereitstellung in föderierten Infrastrukturen Metadateninstanzen liegen lokal vor was nun? Rechtliche Unterscheidung von Ressourcen und ihrer Metadaten Ziel: freie Verteilung über Standardprotokolle Populärer Standard: OAI-PMH 35
33 Bereitstellung in föderierten Infrastrukturen OAI: Open Archives Initiative PMH: Protocol for Metadata Harvesting Einfaches maschinenlesbares Protokoll Abfrage von XML-Dokumenten die lokalen Ressourcen-Bestand beschreiben 36
34 Bereitstellung in föderierten Infrastrukturen Verschiedene Anfragen ( verbs ) an einen OAI-PMH-Endpunkt: Identify ListMetadataFormats ListIdentifiers GetRecord Aufruf:
35 Bereitstellung in föderierten Infrastrukturen verb=identify 38
36 Bereitstellung in föderierten Infrastrukturen verb=listmetadataformats 39
37 Bereitstellung in föderierten Infrastrukturen verb=listsets 40
38 Bereitstellung in föderierten Infrastrukturen verb=listidentifiers 41
39 Bereitstellung in föderierten Infrastrukturen verb=getrecord (1/2) 42
40 Bereitstellung in föderierten Infrastrukturen verb=getrecord (2/2) 43
41 Bereitstellung in föderierten Infrastrukturen Weitere Abfragemöglichkeiten: Liste alle Einträge im CMDI-Format auf, welche zum Set myset gehören: PROVIDER_URL? verb=listrecords&metadataprefix=cmdi&set=myset Liste alle Einträge im CMDI-Format auf, welche nach dem um 8:30 hinzugefügt/geändert wurden: PROVIDER_URL? verb=listrecords&metadataprefix=cmdi&from= t08:30:00z 44
42 Bereitstellung in föderierten Infrastrukturen Weitere Beispiele für OAI-PMH-Endpunkte: TextGrid: textgridlab.org/1.0/tgoaipmh/oai Europeana: oai.europeana.eu/oaicat/ (restricted) DAI: opac.dainst.org/oai DNB: services.dnb.de/oai/repository (restricted) OAI-Liste (>3000 Einträge): 45
43 Bereitstellung in föderierten Infrastrukturen OAI-PMH-Harvester: Sammelt die dezentral in den Zentren hinterlegten Metadaten ein Anfrage: Welche Datensätze im CMDI-Format wurden seit der letzten Harvesting-Runde hinzugefügt? 46
44 Bereitstellung in föderierten Infrastrukturen Momentan zwei Harvester in CLARIN: 1. Alle Metadaten für zentrale Suchmaschine automatische Integration in das VLO 2. Alle Metadaten die Webservices beschreiben automatische Integration in Workflow-Engine WebLicht 47
45 Bereitstellung in föderierten Infrastrukturen Das Finale: Import in das VLO 48
46 Bereitstellung in föderierten Infrastrukturen Facettendefinition language Language ID (hdl:11459/ccr_c-2482_08eded e3f-88e5-e0807fb01e17) Language Name (hdl:11459/ccr_c-2484_669684e7-cb9e-ea96-59cb-a25fe89b9b9d) 49
47 Bereitstellung in föderierten Infrastrukturen Das Finale: Import in das VLO 50
48 VLO 51
49 5. Problemfälle und Lösungsansätze 52
50 Probleme und Lösungsansätze Robin Wendler: On a horse -Problem Theodore Roosevelt Collection Robin Wendler, The eye of the beholder: Challenges of image description and access at Harvard, In: Diane I. Hillmann and Elaine Westbrooks (editors). Metadata in Practice. Chicago: ALA Editions, pp
51 Probleme und Lösungsansätze (ein) Grundproblem: Relevance under change of context Abschätzung zukünftiger Interessenten/Kontexte Beispiel: transkribiertes Werk Avé-Lalleman: Das Deutsche Gaunerthum (BBAW) im VLO 54
52 Probleme und Lösungsansätze Woher wissen was den Nutzer interessiert? Nutzerfeedback! 55
53 Nutzerfeedback Kritik am VLO (u.a. Nutzerbefragung 2010): Nutzer wollen direkten Zugriff auf Ressourcen Rechtefrage Nutzer hassen falsche/veraltete Informationen u.a. inhärentes Problem föderierter Systeme Nutzer möchten möglichst schnell Ergebnisse Ungeeignete Suchfacetten (ongoing struggle) Inkompatible Vokabulare in Instanzen 56
54 Nutzerfeedback 57
55 Nutzeranfragen - Anfragetypen VLO 3 58
56 Nutzeranfragen - Facettennutzung VLO 3 59
57 Nutzerfeedback - Zusammenfassung Auswahl relevanter Metadaten: Sowohl Domänen-abhängig als auch Allgemeingültig (siehe Dublin Core)
58 Vokabulare Problem 2: Vokabulare (oder Was schreibe ich in die MD-Instanzen? )
59 Vokabulare Natürlicher Prozess Nutzung einheitlichen Vokabulares ist schwer Wird noch schwerer, falls Lange Zeiträume Verteilte Arbeitsprozesse Viele Teilprojekte Multilinguale / Multikulturelle Umgebung Dezentrale Strukturen 70
60 Vokabulare Weitere Probleme (kleiner Auszug): Datums/Zeitangaben ( 02/05/2017 vs ) Lizenzangaben ( CC-BY 2.0 vs. Creative Commons 2.0 ) Granularität der Beschreibung: Text, Document, Manuscript, Poem Volltext vs. Identifier ( German vs. deu ) Groß/Kleinschreibung (Problemfälle TüBa-D/Z)... 71
61 Vokabulare 1. mögliche Lösung: Manuelles Nachbearbeiten VLO: 16 Aufbearbeitungsdienste Beispiel: Sprachangabe 72
62 Vokabulare 2. mögliche Lösung: Zentrale Normdateien ein Verzeichnis von normierten Begriffen zur Verwendung als Deskriptor in der Dokumentation (de.wikipedia.org/normdatei) z.b. Gemeinsame Normdatei (GND) der DNB: Normdatei für Personen, Körperschaften, Kongresse, Geografika, Sachschlagwörter und Werktitel Idee: Statt Beschreibung lieber Verweis auf autoritative Instanz Weitere Normdateien auch in Ihrem Fachbereich! 73
63 Vokabulare Beispiel: 74
64 Vokabulare Weitere Normdateien/kontrolliertes Vokabular auch in Ihrem Fachbereich! Inter-Active Terminology for Europe (IATE) Schlagwortnormdatei (mittlerweile in GND) Library of Congress Control Number... 75
65 Zentrale Evaluierung - Feedbackschleife Qualität von Metadaten als zentrale Aufgabe Entsprechende Taskforces in CLARIN CMDI-Taskforce VLO working group Metadata curation 76
66 Zentrale Evaluierung - Feedbackschleife Idee: Feedbackschleife 77
67 Zentrale Evaluierung - Feedbackschleife Curation Module des ACDH Wien Automatische Auswertung aller bereitgestellten Metadaten Bewertet sowohl Schema als auch Instanz Überprüft: Anteil leerer Elemente Anteil gefüllter Suchfacetten im VLO... Zusammenfassung für einzelne Zentren 78
68 Zentrale Evaluierung - Feedbackschleife Curation Module (ACDH Wien) Beispiel: 79
69 Zusammenfassung Metadaten: 1. sind ein spannendes Thema 2. stellen häufig ersten Einstieg in Ressourcen her 3. erschließen große (riesige) Ressourcenbestände 4. sind Grundlage für verschiedenste Anwendungen, weit über einfache Kataloge hinaus 5. sind nur bei Einhaltung von Qualitätsstandards hilfreich 6. sind nicht statisch, sondern sollten müssen an veränderte Kontexte angepasst werden 80
70 Fragen? Anmerkungen? 81
Vom digitalen Hausmeister zum international vernetzten Forschungsdatenzentrum. Die Entwicklung der digitalen Infrastruktur des
Vom digitalen Hausmeister zum international vernetzten Forschungsdatenzentrum. Die Entwicklung der digitalen Infrastruktur des Daniel Jettka, Hanna Hedeland, Timm Lehmberg 16.09.2015 1 Struktur und Profil
MehrOpen Archives Initiative - Protocol for Metadata Harvesting (OAI-PMH)
, XML LV BF23 (0F32) Open Archives Initiative - Protocol for Metadata Harvesting (OAI-PMH) Achim Oßwald FH Köln Institut für Informationswissenschaft Wintersemester 2010 (Stand: 3.12.10) 1/ 18 OAI-PMH
MehrSoftware & Schnittstellen (1/28)
Software & Schnittstellen Bachelor Informationsmanagement Modul Digitale Bibliothek (SS 2014) Dr Jakob Voß 2014-05-19 Software & Schnittstellen (1/28) CC-BY-SA / 2014-05-19 / Dr Jakob Voß Software Computerprogramm
MehrChristoph Broschinski, <broschinski@uni bielefeld.de>
Normalisierung von Lizenzinformationen in OAI Metadaten: Ein Beitrag zur Verbesserung der Open Access Statusanzeige in wissenschaftlichen Suchmaschinen Christoph Broschinski,
MehrMetadaten für multimodale Corpora
Metadaten für multimodale Corpora Bernhard Jackl jackl@phonetik.uni-muenchen.de 09. April 2015 CLARIN-D Workshop München, 09.04.2015 1 / 22 We kill people based on metadata. General Michael Hayden, former
Mehr8. Tübinger Symposium Handschriften, Alte Drucke. VD16/17 Massendigitalisierung Neue Entwicklungen. 8. Tübinger Symposium Handschriften, Alte Drucke
VD16/17 Massendigitalisierung Neue Entwicklungen VD16/17 Massendigitalisierung Neue Entwicklungen Was ist VD16/17 Massendigitalisierung? Warum ein DFG-Viewer? Technische Standards Datenformat Schnittstellen
MehrDokumentenserver: Praxisfragen
Dokumentenserver: Praxisfragen Workshop in Bern, 18. Mai 2006 Dr. Matthias Töwe Gliederung Situation in der Schweiz Offene Fragen zum Betrieb Lokale Server vs. zentrale Dienste (z.b. RERO DOC) Sind die
MehrJens Kupferschmidt Universitätsrechenzentrum
Einordnung der Metadaten im MyCoRe Projekt Connection to other databases Data presentations MyCoResearch over instances Classifications Metadate and search Derivate User and access rights GUI Workflow
MehrKIM. www.kim-forum.org
KIM www.kim-forum.org Interoperable Metadatenmodelle und Repositorien Stefanie Rühle Niedersächsische Staats- und Universitätsbibliothek Göttingen Mirjam Keßler Deutsche Nationalbibliothek KIM Ausgangslage
MehrFederated Search: Integration von FAST DataSearch und Lucene
Federated Search: Integration von FAST DataSearch und Lucene Christian Kohlschütter L3S Research Center BSZ/KOBV-Workshop, Stuttgart 24. Januar 2006 Christian Kohlschütter, 24. Januar 2006 p 1 Motivation
MehrIdeen und Konzepte für ein deutsches und ein europäisches. Archivportal D
Ideen und Konzepte für ein deutsches und ein europäisches Archivportal Angelika Menne-Haritz, Bundesarchiv 27.9.2007 1 Bessere Sichtbarkeit der Bestände und Wozu Archivportale? der damit verbundenen Dienstleistungsangebote
MehrJudaica recherchieren
Judaica recherchieren Unterstützung bei der Realisierung forschungsspezifischer Suchlösungen durch die generische Suche von DARIAH-DE de.dariah.eu Harald Lordick Steinheim-Institut Tobias Gradl Universität
MehrDeutsche Übersetzung des Dublin-Core-Metadaten-Elemente-Sets. Version 1.1
Deutsche Übersetzung des Dublin-Core-Metadaten-Elemente-Sets Version 1.1 Identifier: http://www.kim-forum.org/material/pdf/uebersetzung_dcmes_20070822.pdf Source: http://www.dublincore.org/documents/dces/
MehrZwischenbericht Diplomarbeit Entwicklung einer Laufzeitumgebung für Komponenten mit Ressourcenanforderungen
Zwischenbericht Diplomarbeit Entwicklung einer Laufzeitumgebung für Komponenten mit Ressourcenanforderungen Brit Engel Überblick Beschreibung Aufgabenstellung Entwurf der Komponenten Verwaltung Funktionsbereiche
MehrDIGITAL REPOSITORY NIJOLE UKELYTE CHRISTOPHER POLLIN KERSTIN HUMMELBRUNNER
DIGITAL REPOSITORY NIJOLE UKELYTE CHRISTOPHER POLLIN KERSTIN HUMMELBRUNNER REPOSITORY INTRO Problem der Sichtbarkeit der Repositorien GRÜNDE LÖSUNGSVERSUCHE: OAI, ROAR, OperDOAR REPOSITORY PROBLEM DER
MehrDie Deutsche Nationalbibliografie in der Linked Data Cloud
Sarah Hartmann, Julia Hauser Die Deutsche Nationalbibliografie in der Linked Data Cloud 1 Die Deutsche Nationalbibliografie in der Linked Data Cloud 101. Bibliothekartag, 24. Mai 2012 Die Nationalbibliografie
MehrDFG-Praxisregeln Digitalisierung. Stefanie Rühle KIM WS 2014 14.04.2014
DFG-Praxisregeln Digitalisierung Stefanie Rühle 14.04.2014 Überblick über die Richtlinie Metadaten Metadatenstandards Sammlungsbeschreibung CIDOC-CRM LIDO Überblick Veröffentlicht von der DFG 2009, aktuelle
MehrDas CLARIN-D Servicezentrum des Zentrum Sprache an der BBAW. Kai Zimmer BBAW
Das CLARIN-D Servicezentrum des Zentrum Sprache an der BBAW Kai Zimmer BBAW 1 Das Repositorium Das Repositorium des CLARIN- Servicezentrum des Zentrum Sprache an der Berlin-Brandenburgischen Akademie der
MehrJa, Statistiken. Aber.
OA-Statistik mit Dspace Ja, Statistiken. Aber. Marco Recke Dspace User Group Treffen * Tübingen 5. Oktober 2015 Ja Statistiken, aber welche stimmt? Sessions TOP Downloads Universität Ulm Volltextserver
MehrSarah Hartmann. Von der Formalerschließung zum Metadatenmanagement II. 1 RDA, MARC und Co. Österreichischer Bibliothekartag 2011
Sarah Hartmann RDA, MARC und Co. Von der Formalerschließung zum Metadatenmanagement II 1 RDA, MARC und Co. Österreichischer Bibliothekartag 2011 Von der Formalerschließung - Beschreibung von Bibliotheksmaterialien
MehrGrenzen und Gemeinsamkeiten: Die Beziehung zwischen der Computerlinguistik und den Digital Humanities
Grenzen und Gemeinsamkeiten: Die Beziehung zwischen der Computerlinguistik und den Digital Humanities Gerhard Heyer Universität Leipzig heyer@informatik.uni-leipzig.de Institut für Informatik Kurzvorstellung
MehrDatenmodelle im Kontext von Europeana. Stefanie Rühle (SUB Göttingen)
Datenmodelle im Kontext von Europeana Stefanie Rühle (SUB Göttingen) Übersicht Datenmodelle RDF DCAM ORE SKOS FRBR CIDOC CRM Datenmodelle "Datenmodellierung bezeichnet Verfahren in der Informatik zur formalen
MehrDaniel Burckhardt / Thomas Meyer. Normdaten, Schnittstellen und RDF als Grundlage für die Vernetzung bibliographischer Fachinformationen
Daniel Burckhardt / Thomas Meyer Normdaten, Schnittstellen und RDF als Grundlage für die Vernetzung bibliographischer Fachinformationen Die geschichtswissenschaftliche Fachbibliographie der Zukunft moderne
MehrDie Warenkorbfunktion (workbasket)
Beschreibung der Komponente zur integration eines Warenkorbs in die Anwendung Table of contents 1 Allgemein...2 2 Körbe speichern und laden...3 3 Aufgelöstes XML oder beliebige weitere Metadaten im Korb...
MehrMetadaten und Identifikatoren
Planung des Forschungsdaten-Managements: Metadaten und Identifikatoren Timo Gnadt SUB Göttingen gnadt@sub.uni-goettingen.de 6. Dezember 2011, Göttingen Überblick Metadaten Motivation Planungsaspekte Dimensionen
MehrWeiterentwicklung digitaler Bibliothekssysteme zu OpenArchives-Systemen
Weiterentwicklung digitaler Bibliothekssysteme zu OpenArchives-Systemen Osnabrück, 2003-03-13 Prof. Dr. G. Specht, U Ulm Dipl.-Inform. Michael G. Bauer, TU München 1. OMNIS/2 Motivation 2. Übersicht über
MehrTextGrid: Eine modulare Plattform für kooperative Textdatenverarbeitung
workshop: Perspektiven der Digital Humanities - 12. Oktober 2011, Würzburg TextGrid: Eine modulare Plattform für kooperative Textdatenverarbeitung Thomas Kollatz - Salomon Ludwig Steinheim-Institut für
MehrDas Repositorium für Forschungsdaten und publikationen der TU Berlin als Serviceplattform für die Wissenschaftler
Das Repositorium für Forschungsdaten und publikationen der TU Berlin als Serviceplattform für die Wissenschaftler UB der TU Berlin, Hauptabteilung 3 Elektronische Dienste Projekt
MehrDas Deutsche Textarchiv als Repositorium und Werkzeug. Frank Wiegand (BBAW) Deutsches Textarchiv
Das Deutsche Textarchiv als Repositorium und Werkzeug Frank Wiegand (BBAW) Deutsches Textarchiv www.deutschestextarchiv.de wiegand@bbaw.de Deutsches Textarchiv Referenzkorpus für die schriftliche neuhochdeutsche
MehrLangzeitarchivierungskonzepte, Visualisierungsmöglichkeiten
Content Provider Workshop, 22. April 2010, Göttingen Langzeitarchivierungskonzepte, TextGridRep & Visualisierungsmöglichkeiten 1. LZA Konzepte (Heike Neuroth) 2. TextGridRep (Wolfgang Pempe) 3. Visualisierung
MehrMetadaten für die Informationsversorgung von morgen: Kooperativ erstellen - gemeinsam nutzen
Metadaten für die Informationsversorgung von morgen: Kooperativ erstellen - gemeinsam nutzen Was sind Metadaten? Metadaten sind strukturierte Daten über Daten. Sie dienen der Beschreibung von Informationsressourcen.
MehrSemantic Markup für die Dokumentenklassifizierung. Seminarvortrag von Mirko Pracht
Semantic Markup für die Dokumentenklassifizierung Seminarvortrag von Mirko Pracht Ziel des Vortrags Aufbau digitaler Bibliotheken Verbesserung Informationssuche Semantic Markup Gliederung 1. Grundlagen
MehrFreie und vernetzte Daten:
Freie und vernetzte Daten: Das Konzept des Linked Open Data und sein Einsatz beim RISM-OPAC KoFIM-Kolloquium an der Staatsbibliothek zu Berlin, 6. Oktober 2014 Jürgen Diet, Bayerische Staatsbibliothek
MehrForschungsdatenmanagement an der Technischen Universität Berlin
Forschungsdatenmanagement an der Technischen Universität Berlin Monika Kuberek, Universitätsbibliothek der TU Berlin Lost in Dissertation? Von der Literaturverwaltung zur Publikation Eine Vortragsreihe
MehrEinführung. Internet vs. WWW
Einführung Bernhard Plattner 1-1 Internet vs. WWW "the Internet is the entirety of all computers which are interconnected (using various physical networking technologies) and employ the Internet protocol
MehrSeminar: mobile GIS Austausch von Geodaten
Seminar: mobile GIS Austausch von Geodaten Tobias Wallura 30. Juni 2011 Tobias Wallura Austausch von Geodaten 30.06.2011 1 / 31 Agenda 1 Einführung 2 XML XML Schema XLink und XPointer XSLT 3 GML GML Dokumente
MehrRepositorieninhalte als Linked Data bereitstellen. Pascal-Nicolas Becker Technische Universität Berlin 104. Bibliothekartag Nürnberg, 28.05.
Repositorieninhalte als Linked Data bereitstellen Pascal-Nicolas Becker Technische Universität Berlin 104. Bibliothekartag Nürnberg, 28.05.2015 Digitale Repositorien Ein Repositorium ist ein System zur
MehrFachwissenschaftliche Anforderungen von Geistes- und KulturwissenschaftlerInnen an digitale (offene) Forschungsdaten
Fachwissenschaftliche Anforderungen von Geistes- und KulturwissenschaftlerInnen an digitale (offene) Forschungsdaten Dr. Stefan Schmunk DARIAH-DE SUB Göttingen Agenda Agenda 1. Einleitung 2. Scholarly
MehrURN-Management an Der Deutschen Bibliothek
92. Deutscher Bibliothekartag, 11.04.2002 URN-Management an Der Deutschen Bibliothek Kathrin Schroeder Die Deutsche Bibliothek Gliederung 1 Persistent Identifier (PI) Warum Persistent Identifier? Voraussetzungen
MehrAufbau Datenportal Deutsche Meeresforschung
Aufbau Datenportal Deutsche Meeresforschung durch das Marine Network for Integrated Data Access MaNIDA MaNIDA-Team Datenintensive marine Forschung 2 26.04.2013 Angela Schäfer Überblick Impuls- und Vernetzungsfonds
MehrLibrary of Labs Application Profile (LiLa AP)
Evaluierung und Zertifizierung von datenprofilen Teil II Application Profile (LiLa AP) Claus Spiecker Universitätsbibliothek Stuttgart Co-funded by the Community programme econtentplus 4. Leipziger Kongress
MehrSpaten trifft Daten 29. Mai 2015 Data Center for the Humanities (DCH)
Data Center for the Humanities (DCH) Kölner Datenzentrum für die Geisteswissenschaften zentrale Serviceeinrichtung der Philosophischen Fakultät der Universität zu Köln Gegründet 2013 unterstützt die dauerhafte
Mehrehealth Composite Plattform (ehc) FormsFramework Eine Schlüsseltechnologie zur Umsetzung semantischer Interoperabilität
ehealth Composite Plattform (ehc) FormsFramework Eine Schlüsseltechnologie zur Umsetzung semantischer Interoperabilität Dipl.-Inform. Med. Markus Birkle TELEMED 2015 Berlin HL7 Clinical Document Architecture
MehrArchitektur der DARIAH-DE Forschungsinfrastruktur
Architektur der DARIAH-DE Forschungsinfrastruktur 1. Sitzung des Wissenscha2lichen Beirates von DARIAH- DE 14. September 2012, GöHngen Rainer Stotzka, Peter Gietz, Rene Smolarski, u.v.a. de.dariah.eu Dienste
MehrSchnittstellen zwischen Dokumenten- und Publikationsservern und E-Learning Anwendungen
Schnittstellen zwischen Dokumenten- und Publikationsservern und E-Learning Anwendungen Frank Lützenkirchen Marcel Heusinger Universitätsbibliothek Duisburg-Essen luetzenkirchen@ub.uni-duisburg-essen.de
MehrHistorische Textkorpora für die Geistes- und Sozialwissenschaften. Fragestellungen und Nutzungsperspektiven
Historische Textkorpora für die Geistes- und Sozialwissenschaften. Fragestellungen und Nutzungsperspektiven - Begrüßung und Einführung - Alexander Geyken BBAW (DWDS/DTA/CLARIN-D) DTA-/CLARIN-D-Konferenz
MehrWie offen sind Forschungsdaten in Repositorien?
Wie offen sind Forschungsdaten in Repositorien? Ergebnisse einer Metadatenanalyse Maxi Kindling Open-Access-Tage 2015 Universität Zürich 8. September 2015 Dieses Werk ist soweit nicht anders gekennzeichnet
MehrITIL Prozese in APEX am Beispiel des Vodafone FCH
ITIL Prozese in APEX am Beispiel des Vodafone FCH Tobias Strohmeyer Düsseldorf, 10.06.2015 MT AG Kurzporträt Stefan Witwicki Ratingen, 2015 GESCHÄFTSFORM HAUPTSITZ INHABERGEFÜHRTE AG RATINGEN GRÜNDUNGSJAHR
MehrDie TEI. in einer halben Stunde
Die TEI in einer halben Stunde Die TEI ist eine Personengruppe ist ein Satz an Computerbefehlen ist eine Reflexion über Text ist gar nicht so schwer! Geschichte 1987 XI Vassar College, Conference Ziel:
MehrSemantic Web Services
Semantic Web Services Daniel Fischer TU Chemnitz - WS 2011/12 1 Gliederung (1) Web Services (2) Semantic Web Services: Motivation (3) Ontologien (4) Technologien 1. WSDL 2. SA-WSDL 3. WSMF / WSMO 4. OWL-S
MehrJürgen Keiper Deutsche Kinemathek. Offene Quellen, offene Netze Perspektiven von Open Source-Software im Archiv- und Museumsbereich
Jürgen Keiper Deutsche Kinemathek Offene Quellen, offene Netze Perspektiven von Open Source-Software im Archiv- und Museumsbereich 1/23 Eine Kameradatenbank als erster Test Situation der Archive Perspektiven
MehrAktuellesausderPraxis
Von museumdatzulido - AktuellesausderPraxis AG Datenaustausch/ FG Dokumentation im DMB Regine Stein Bildarchiv Foto Marburg Von museumdat zu LIDO - Aktuelles aus der Praxis Entwicklung von LIDO: Formate
MehrDissertationsserver mit miless / MyCoRe:
Dissertationsserver mit miless / MyCoRe: Workflow und Funktionalität http://miless.uni-duisburg-essen.de/ http://www.mycore.de/ F. Lützenkirchen Universitätsbibliothek Duisburg-Essen Wesentlich basierend
MehrPersistenzschicht in Collaborative Workspace
Persistenzschicht in Collaborative Workspace Mykhaylo Kabalkin 03.06.2006 Überblick Persistenz im Allgemeinen Collaborative Workspace Szenario Anforderungen Systemarchitektur Persistenzschicht Metadaten
MehrMetadaten in ArcGIS Matthias Schenker ESRI Geoinformatik AG, Zürich
Metadaten in ArcGIS Matthias Schenker ESRI Geoinformatik AG, Zürich 2005 ESRI Geoinformatik AG Inhalt ArcGIS und Metadaten Editoren Stylesheets & Co Automatische Synchronisation Import und Export von bestehenden
MehrDie DARIAH-DE Demonstratoren
Die DARIAH-DE Demonstratoren 1. Sitzung des Wissenschaftlichen Beirates von DARIAH-DE 14. September 2012, Göttingen de.dariah.eu Demonstratoren in DARIAH DARIAH Demonstratoren sind fachwissenschaftliche
MehrGDI-Forum Nordrhein-Westfalen Technischer Workshop 2 - Geodienste - 2.3 INSPIRE-konforme Download-Dienste. Inhalt
GDI-Forum Nordrhein-Westfalen Technischer Workshop 2 - Geodienste - 2.3 INSPIRE-konforme Download-Dienste Inhalt Inspire Downloaddienste -Grundlagen- Varianten Direkter Zugriff via WFS Vordefinierte Datensätze
MehrHandbuch für die Erweiterbarkeit
Handbuch für die Erweiterbarkeit Inhalt Pakete für die Erweiterbarkeit... 2 Actions... 2 Items... 2 Itemset... 2 Die UseCaseNewAction... 3 Eigene Shapes... 4 Der Shape Container... 5 User Objects... 6
MehrDas TextGrid & DARIAH-DE Repositorium
Das TextGrid & DARIAH-DE Repositorium Referenzierung und Publikation von geisteswissenschaftlichen Forschungsdaten Stefan E. Funk Stefan Schmunk SUB Göttingen Überblick DARIAH-DE Anforderungen von FachwissenschaftlerInnen
MehrIHR WEG ZUR DOI-REGISTRIERUNG
// TIB DOI-SERVICE IHR WEG ZUR DOI-REGISTRIERUNG So werden Ihre Forschungsdaten im Internet auffindbar und zitierfähig. 10.3207/2959859860 10.1594/GFZ.GEOFON.gfz2009kciu 100 90 80 70 60 50 40 30 20 10
MehrÜbersetzung des Singapore Framework für Dublin-Core-Anwendungsprofile
Übersetzung des Singapore Framework für Dublin-Core-Anwendungsprofile Identifier: http://www.kimforum.org/material/pdf/uebersetzung_singapore_20090213.pdf Title: Übersetzung des Singapore Framework für
MehrSuche für Anwender in SharePoint 2013
Suche für Anwender in SharePoint 2013 Vorstellung Nico Thiemer Buch- und Fachartikelautor zum Thema SharePoint Trainer und Berater Microsoft SharePoint Dynamics CRM Office 365/Azure SharePoint und Dynamics
MehrLinked Open Cultural Heritage.
Linked Open Cultural Heritage. Herausforderungen, Risiken und Chancen der Datenvernetzung im Bereich des Kulturerbes. Georg Hohmann Germanisches Nationalmuseum Referat für Museums- und Kulturinformatik
MehrGemeinsam auf dem Weg zum Katalogisierungssystem der Zukunft
Gemeinsam auf dem Weg zum Katalogisierungssystem der Zukunft Gabriele Meßmer Bayerische Staatsbibliothek München Beate Rusch Kooperativer Bibliotheksverbund Berlin-Brandenburg 9. BVB Verbundkonferenz,
MehrDIGITAL OBJECT IDENTIFIER (DOI) FÜR TECHNIK UND NATURWISSENSCHAFTEN. So werden Ihre Forschungsdaten im Internet auffindbar und zitierfähig.
100 90 80 70 60 50 40 30 20 10 0 10.3207/2959859860 10.1594/GFZ.GEOFON.gfz2009kciu // TIB DOI-SERVICE DIGITAL OBJECT IDENTIFIER (DOI) FÜR TECHNIK UND NATURWISSENSCHAFTEN 10.3205/09ptcog233 So werden Ihre
MehrKapitel 1 Überblick Content Management und Digitale Bibliotheken
Kapitel 1 Überblick Content Management und Digitale Bibliotheken Prof. Dr.-Ing. Stefan Deßloch Geb. 36, Raum 329 Tel. 0631/205 3275 dessloch@informatik.uni-kl.de 1 Überblick Was ist Content? Daten, Dokumente,
MehrMetadaten METS. Markus Schnöpf Berlin-Brandenburgische Akademie der Wissenschaften IDE. IDE Autumn School 2012, Chemnitz
Metadaten METS Markus Schnöpf Berlin-Brandenburgische Akademie der Wissenschaften IDE Inhalt Was ist METS und wofür brauchen wir es?! Geschichte! METS-Schema und Sektionen! Verbindung METS - TEI Folie
Mehr97. Deutscher Bibliothekartag. VZG zvdd. Gerald Steilen / Verbundzentrale des GBV (VZG)
97. Deutscher Bibliothekartag 1 DFG-Projekt Laufzeit: 1.4.2005 bis 31.3.2008 Partner VZG (Verbundzentrale des GBV): Projektleitung hbz (Hochschulbibliothekszentrum des Landes Nordrhein-Westfalen) AG SDD
Mehr- ein Softwarepaket für die Erstellung digitaler Bibliotheken. - quelloffen, lizensiert unter der GNU General Public License
1 Greenstone Software Greenstone ist - ein Softwarepaket für die Erstellung digitaler Bibliotheken die im Internet oder auf einem Datenträger publiziert werden können - quelloffen, lizensiert unter der
MehrAdministration von Artikelbearbeitungsgebühren mittels EPrints
Dr. Max Mustermann Open Referat Access Kommunikation Beauftragter & Marketing Verwaltung Administration von Artikelbearbeitungsgebühren g mittels EPrints Dr. Gernot Deinzer Überlick Publikationsfonds Software:
MehrLangzeitarchivierungsaspekte. im Dokumentenlebenszyklus
Document Engineering Langzeitarchivierungsaspekte im enlebenszyklus Motivation Disziplin der Computer Wissenschaft, welche Systeme für e aller Formen und Medien erforscht. enlebenszyklus en Management
MehrOffice 365 User Integration
Office 365 User Integration lernplattform schule.at - Office 365 User Integration Sie verwenden an Ihrer Schule Office 365 und möchten die bestehenden SchülerInnen mit Ihrer Lernplattform verknüpfen? Die
MehrDaten- und Metadatenstandards Wintersemester 2011 / Januar 2012 Digitale Bibliotheken, Metadatenstandards: MARC, Dublin Core, METS/MODS & Co.
Daten- und Metadatenstandards Wintersemester 2011 / 2012 24. Januar 2012 Digitale Bibliotheken, Metadatenstandards: MARC, Dublin Core, METS/MODS & Co. Sitzungsüberblick BAM -Sektor: Bibliotheken, Archive,
MehrDOI-Registrierung mit DataCite in Deutschland
DOI-Registrierung mit DataCite in Deutschland Frauke Ziedorn Technische Informationsbibliothek, Hannover DataCite Globales Konsortium getragen von lokalen Einrichtungen In Kooperation mit Datenzentren
MehrIntelligente Informationssysteme CoreMedia Smart Content Technology. Grundlagen
Intelligente Informationssysteme CoreMedia Smart Content Technology Grundlagen Gunar Fiedler CAU Kiel, Institut für Informatik und Praktische Mathematik Arbeitsgruppe Technologie der Informationssysteme
MehrRückblick auf zwei Jahre
Rückblick auf zwei Jahre SCOAP 3 Beispiel einer erfolgreichen Transformation zu Open Access 10. Mai 2016 Alexander Kohls, CERN SCOAP 3 Operations Manager Rückblick auf zwei Jahre SCOAP 3 Idee und Geschäftsmodell
MehrWerkzeugbasierte Entwicklung von Benutzeroberflächen mit CDA-Templates und ART DECOR
Werkzeugbasierte Entwicklung von Benutzeroberflächen mit CDA-Templates und ART DECOR Dipl.-Inform. Med. Markus Birkle HL7/IHE Jahrestagung 2015, Kassel Praktische Herausforderungen bei der Implementierung
MehrErschließung von Autographen in Visual Library
Erschließung von Autographen in Visual Library Editionsarbeit unter Berücksichtigung internationaler Standards Dienstag, 23. Juni 2015 Akademie der Künste Berlin Juni 2015 - Akademie der Künste Berlin
MehrWerkzeugbasierte Entwicklung von Benutzeroberflächen mit CDA-Templates und ART DECOR
Werkzeugbasierte Entwicklung von Benutzeroberflächen mit CDA-Templates und ART DECOR Dipl.-Inform. Med. Markus Birkle Heidelberger Archivtage 2015, Heidelberg HL7 Clinical Document Architecture (CDA) für
MehrXML Extensible Markup Language
XML-Praxis XML Extensible Markup Language Jörn Clausen joern@techfak.uni-bielefeld.de Übersicht Woher? Wohin? Warum? Bestandteile von XML XML-Dokumente erstellen und bearbeiten XML-Praxis XML Extensible
MehrXML Service Architekturen im Unternehmen
XML Service Architekturen im Unternehmen Version 2.0 August 2001 Daniel Schmutz, Simtech AG ! Einführung! Architekturen! Organisation! Fallstudie Inhalt Einführung! Was ist XML! Grundsätze von XML! Was
MehrEnriched Content Browsing
Enriched Content Browsing Textanalyse meets Web 2.0: Eine Technologiestudie zur automatisierten Anreicherung von Web Inhalten Holger Seubert holger.seubert@de.ibm.com IBM Information Management Agenda
MehrEmpfehlungen für die Zukunft Mehrwerte für Ihre Daten. Prof. Felix Sasaki (Deutsches Forschungszentrum für Künstliche Intelligenz)
Empfehlungen für die Zukunft Mehrwerte für Ihre Daten Prof. Felix Sasaki (Deutsches Forschungszentrum für Künstliche Intelligenz) 1 Daten bisher: unverknüpfte Silos Original Übersetzung Proprietäre Formate
MehrNachhaltigkeit Publikationsfonds Technisch-organisatorische Dienstleistungen
Dr. Max Mustermann Open Referat Access Kommunikation Beauftragter & Marketing Verwaltung Nachhaltigkeit Publikationsfonds Technisch-organisatorische Dienstleistungen Dr. Gernot Deinzer Überlick Publikationsfonds
MehrInnovationslabor Semantische Integration von Webdaten
Innovationslabor Semantische Integration von Webdaten Workflow-basierte Datenintegration und Objekt-Matching Dr. Andreas Thor http://dbs.uni-leipzig.de/format Workflow-basierte Datenintegration Ausgangspunkt
MehrRessourcen-Beschreibung im Semantic Web
Ressourcen-Beschreibung im Semantic Web Cristina Vertan Inhaltsübersicht Wie sollen die Ressourcen für Semantic Web annotiert werden? Was ist und wie funktioniert RDF? Wie kodiert man RDF-Statements in
MehrDSpace 5 und Linked (Open) Data. Pascal-Nicolas Becker Technische Universität Berlin German DSpace User Group Meeting 2014 Berlin, 28.
DSpace 5 und Linked (Open) Data Pascal-Nicolas Becker Technische Universität Berlin German DSpace User Group Meeting 2014 Berlin, 28. Oktober 2014 Ausblick: DSpace 5 Metadaten für alle Objekte (Collections,
MehrHerbst-Treffen des Fachausschusses Virtuelle Akustik der DEGA
Herbst-Treffen des Fachausschusses Virtuelle Akustik der DEGA TU Berlin, 13.11.2015 Objektivität und Reproduzierbarkeit - Zur Bedeutung von Infrastrukturen für originale Forschungsdaten Stefan Weinzierl
MehrNOKIS Stand des Projekts
NOKIS Stand des Projekts Carsten Heidmann (BAW) Wassili Kazakos (disy) Überblick Das Projekt Software Gazetteer Einbettung in GDI-DE Zusammenarbeit mit PortalU Ausblick Projektinformation - NOKIS Laufzeit
MehrElektronisches Pflichtstück und Langzeitarchivierung
Elektronisches Pflichtstück und Langzeitarchivierung am Beispiel von Silke Schomburg, Elmar Schackmann Hochschulbibliothekszentrum des Landes NRW (HBZ) Landesbibliothekszentrum Rheinland-Pfalz Rheinische
MehrFragment Identifiers, Template Handles
Fragment Identifiers, Tibor Kálmán Gesellschaft für wissenschaftliche Datenverarbeitung mbh Göttingen (GWDG) Tibor [dot] Kalman [at] gwdg [dot] de 1 Übersicht Problematik der Referenzierung Technische
MehrQualitätsmanagement in der GDI-DE
222 Qualitätsmanagement in der GDI-DE Daniela HOGREBE Zusammenfassung Der vorliegende Beitrag stellt die Ziele und methodischen Ansätze des Qualitätsmanagements der GDI-DE vor, beschreibt beispielhaft
MehrMarius Neumann - agentbase AG
Marius Neumann - agentbase AG 1 Profil Seit über 15 Jahren IT Beratung und Realisierung von IT Projekten Im Kundenauftrag Entwicklung / Konzeption / Einführung von Maßgeschneiderten Anwendungen Prozessen
MehrReferat 01b: Vom Dokument zur digitalen Edition: Prozessmodell der Textedition
Referat 01b: Vom Dokument zur digitalen Edition: Prozessmodell der Textedition DARIAH-DE Tutorial Digitale Textkodierung mit TEI Redaktion: Christof Schöch (Univ. Würzburg) Version 1.0, 02/2014 Lizenz:
MehrIntegration von ecodicology in die DARIAH Dienstewelt
Integration von ecodicology in die DARIAH Dienstewelt Danah Tonne, Rainer Stotzka KIT Universität des Landes Baden-Württemberg und nationales Forschungszentrum in der Helmholtz-Gemeinschaft www.kit.edu
MehrNTM Metadaten Schema Metadaten Schema für nicht textuelle Materialien
NTM Metadaten Schema Metadaten Schema für nicht textuelle Materialien Basierend auf dem DataCite metadata scheme Version 2.1 Version 2.1 Diese Arbeit wird unter den Lizenzbedingungen der Creative Commons
MehrSODA. Die Datenbank als Document Store. Rainer Willems. Master Principal Sales Consultant Oracle Deutschland B.V. & Co. KG
SODA Die Datenbank als Document Store Rainer Willems Master Principal Sales Consultant Oracle Deutschland B.V. & Co. KG vs No Anforderungskonflikte Agile Entwicklung Häufige Schema-Änderungen Relationales
MehrWeb Service Discovery mit dem Gnutella Peer-to-Peer Netzwerk
Seminar E-Services WS 02/03 Web Service Discovery mit dem Gnutella Peer-to-Peer Netzwerk WS 02/03 Web Service Discovery mit dem Gnutella Peer-to-Peer Netzwerk Inhalt Einführung Discovery Problematik Standard
MehrIUG DRESDEN ERSTELLUNG VON ROBUSTEN NATURAL SERVICES Software AG. All rights reserved. For internal use only
IUG DRESDEN ERSTELLUNG VON ROBUSTEN NATURAL SERVICES 2016 Software AG. All rights reserved. For internal use only DIGITAL BUSINESS APPLICATIONS DRIVE THE DIGITAL BUSINESS Partner Lieferanten Kunden SaaS
MehrStatusbericht: Einsatz von Gauss VIP im Kompetenznetz Maligne Lymphome SY 5.2 CMS. Matthias Löbe IMISE Leipzig
SY 5.2 CMS Statusbericht: Einsatz von Gauss VIP im Kompetenznetz Maligne Lymphome AG Systemkomponenten 1 Agenda Zur Person Gründe für die Entscheidung für VIP CMS Evaluation I/2000 Stärken von Gauss VIP
Mehr