Koordinationsstelle für die dauerhafte Archivierung elektronischer Unterlagen

Ähnliche Dokumente
Changes SIP Spezifikation, Data Dictionary und XSD

Matrikelnummer: Bitte Namen und Matrikelnummer auf jeder Seite der Vorgabe und allen Arbeitsblättern eintragen!

XML Schema 2012/2013 S Seite 1 h_da W

XML Schema. Seite 1. h_da SS 22007

XML Schema S 2010/2011 a W _d Seite 1 h

XML Schema 2014 S h_da S Seite 1

XML Schema 2015 S h_da S Seite 1

XML Schema S 2012 h_da S Seite 1

LGBl. Nr. 114/ ausgegeben am 28. Dezember von 17

XML Schema 2016 S h_da S Seite 1

XML Vorlesung ETHZ SS XML Vorlesung ETHZ, Sommersemester

XML Schema S 2011 h_da S Seite 1

XML Schema 2015 S h_da S Seite 1

3. XML Schema. XML Schema. Eigenschaften von XML Schema. Vorteile eines expliziten Schemas: Die XML Schema Recommendation des W3C besteht aus:

LGBl. Nr. 59/ ausgegeben am 11. August von 6

LGBl. Nr. 92/ ausgegeben am 14. Dezember von 10

Mondsee. Nußdorf am Attersee. Nussdorf. Tiefgraben. Tiefgraben. Oberwang. Hof. Oberwang. Lichtenbuch. Oberaschau. Innerschwand am Mondsee Innerschwand

XML Schema 2016 S h_da S Seite 1

2a) Rekursion (zugeschnitten auf Anfrage) (C) Prof. E. Rahm Universität Leipzig

Android will doch nur spielen XML

Gunther Heinrich, Tobias Steimer. XML-Schema. Im Fach SOA, ISM 2008

Aufgabe 1 XML-Schema. <?xml version="1.0" encoding="utf-8"?> <xs:schema xmlns:xs=" elementformdefault="qualified"

urn:schemas-microsoft-com:xml-msdata 1.1 DefaultTypes.xsd MoveIn MoveInDate STDDate UnitType UnitType NumOccupants

LGBl. Nr. 135/ ausgegeben am 30. November von 6

D#32058 Spezifikation UPOC DM V2

XSD - XML Schema Definition

XML. Teil 5: XML-Schemas. Abteilung Informatik WS 02/03

Nonstandard Datenbanken

Koordinatenbezogene Grenze des Naturschutzgebiets "Langmoos" im GML-Standard

Koordinatenbezogene Grenze des Naturschutzgebiets Fuschler-Ache im GML-Standard

XML Schema 2016 S h_da S Seite 1

XML Schema 2012/2013 S Seite 1 h_da W

Kritik von HTML. Multimedia-Technik XML. Syntax von XML-Dokumenten. Extensible Markup Language (XML) reine Strukturbeschreibung

Seminar: mobile GIS Austausch von Geodaten

Einleitung. Schema root Übersicht Dokumentation

Tutorial: Ein Benutzerprofil erstellen. Version: 2.0 Autoren: Anja Beuth, Stefan Suermann

Dokumentverarbeitung

Technische Richtlinie

XML Vorlesung ETHZ SS XML Vorlesung ETHZ, Sommersemester

Übung 3 Klaus Schild,

GAEB-DA-XML 3.0: Was kommt danach?

<B1>Skript</B1> Skript zur Vorlesung Auszeichnungssprachen Stand: September 2016

XML Vorlesung ETHZ SS XML Vorlesung ETHZ, Sommersemester

Diese Version ist anwendbar für die Übermittlung von Daten, die die folgenden Veranlagungszeiträume betreffen:

Übung 3 Klaus Schild,

Infobrief der Bundesagentur für Arbeit Datenlieferung über XSozial-BA-SGB II:

Schema sales-order.xsd

6. XML-Datenbanken: Datendefinition

PRÜFUNG AUS SEMISTRUKTURIERTE DATEN Kennnr. Matrikelnr. Familienname Vorname

5. XML Datenbanken: Datendefinition

Herbstsemester Januar Datenbanksysteme II

TR TR PDÜ Änderungsdokument

Schnittstellenbeschreibung Bordereau der Abgaben (ce service est remplacé par Edec- BordereauService)

XML-Übersicht. Von HTML zu XML

XML-Übersicht. Von HTML zu XML. Nutzen von XML. Geschichte von XML. Eigenschaften von XML. Nutzen von XML (extensible Markup Language)

XML Schema vs. Relax NG

Beschreibung der Datenübertragung an die SQR-BW (Version 2.3)

5. XML-Datenbanken: Datendefinition

Korrekturmoduladapter. Autor: Immo Schulz-Gerlach, FeU- Softwaretechnik, ZMI

Deklaration standalone="yes" Quelle:

1. Übung zur Vorlesung Service-orientierte Architekturen

Vorlesung XML und Datenbanken Klausur

Klaus Schild, Klaus Schild, Element-Deklaration: 1. Möglichkeit

1. Einführung 2. DTD 3. XML Schema 4. XPath 5. XSLT 6. XSL-FO 7. XQuery 8. Web Services 9. XML und Datenbanken

Definition von Datentypen mit XML- Schemata

Gruppe A PRÜFUNG AUS SEMISTRUKTURIERTE DATEN Kennnr. Matrikelnr. Familienname Vorname

Einführung in XML. Präsenzveranstaltung zur E-Learning-Veranstaltung. Sommersemester Prof. Dr. Klaus-Peter Fähnrich Dr.

4. XML-Datenbanken: Datendefinition

Übungsblatt 6 Ausgabe: Prof. Dr. Dr. Lars Schmidt-Thieme, André Busche SoSe 2012

PRÜFUNG AUS SEMISTRUKTURIERTE DATEN Kennnr. Matrikelnr. Familienname Vorname

Kapitel WT:III (Fortsetzung)

Historisches Ortsnamenverzeichnis

a) Erklären Sie, was die folgenden Eigenschaften eines XML-Dokumentes aussagen? wohlgeformt gültig

Tutorial zu Kapitel WT:III

Zusammenfassung XML. Metasprache um Dokumenttypen zu definieren

Einzelne Anforderungen an den Inhalt und den Aufbau des Datensatzes

XML und Datenbanken Fortsetzung

Beschreibung der Datenübertragung an die SQR-BW (Version 2.6)

Kapitel WT:III (Fortsetzung)

XML für Medientechnologen

XML. extensible Markup Language

Schema gettsdstatus_v1.2.xsd

Extraktion von Metainformationen

Web Technologien XML, XQuery, XPath und XSLT

XML Kurs LRZ 1

Die elektronische Akte Was ist das? Die Justiz des Landes Nordrhein-Westfalen

Namespaces 2015/2016 S h_da W Seite 1

JAXB. Java Architecture for XML Binding.

Gruppe A PRÜFUNG AUS SEMISTRUKTURIERTE DATEN Kennnr. Matrikelnr. Familienname Vorname

Namensräume. Allgemeines Deklaration Komponenten aus beliebigen Namensräumen

Interface Spezifikation exotargets LS

5. Semistrukturierte Daten (XML, JSON)

:09:50 DATEIVERGLEICH Seite 1

Übung zur Vorlesung Digitale Medien. Hanna Schneider Ludwig-Maximilians-Universität München Wintersemester 2014/2015

Einführung in XML. Präsenzveranstaltung zur E-Learning-Veranstaltung. Sommersemester Prof. Dr. Klaus-Peter Fähnrich Heiko Kern

Whitepaper Lucene 2.0

Abschlussklausur. Modul INMJ01 5 ECTS-Punkte

Transkript:

KOST Koordinationsstelle für die dauerhafte Archivierung elektronischer Unterlagen Ein Gemeinschaftsunternehmen von Schweizer Archiven Change Request zu SIP Schema arelda_v3.13.2 Einleitung... 1 1 Change Request bentō... 2 2 Zusätzliche Schema-Änderung... 6 3 Beilagen... 7 Einleitung Die Aufgabestellung in bentō "3.2.3 Metadaten" Punkt 6 lautet: "Zusätzlich muss es im SIP eine Möglichkeit geben, weitere Metadaten jeglicher Art aus dem Quellsystem als Key-Value- Paare festzuhalten. Damit besteht zwar die Gefahr, im SIP (und folglich im AIP) einer unkontrollierten Entwicklung der Metadaten den Weg zu ebnen. Eine Möglichkeit, im SIP und AIP zusätzlich zu den minimal spezifizierten weitere Metadaten festzuhalten, ist jedoch ein breites Desiderat und somit unabdingbar." Eine Lösung für dieses Problem, die keine Einschränkungen und Anpassungen am BAR PackageHandler wie auch an anderen, bereits entwickelten Tools bedingt (Abwärtskompatibilität), und nur wenige Änderungen am heutigen BAR-SIP arelda_v3.13.2 verlangt, ist nicht einfach. Der Vorschlag in der Folge erfüllt diese Forderung bedingt. Die vorgeschlagene Lösung bettet strukturierte Informationen in einem neuen optionalen Knoten <zusatzdaten> ein, der unter <ordnungssystemposition>, <dossier> und <dokument> im SIP eingehängt werden kann. <zusatzdaten> erlaubt strukturierte Darstellung von Daten als eine Liste von Key-Value-Paaren. Unstrukturierter Text soll grundsätzlich weiterhin im Element <bemerkung> untergebracht werden. Der Knoten <zusatzdaten> ist bei der Entität Ordnungssystemposition in der Reihenfolge (sequence) hinter dem Knoten <sonstigebestimmungen>, bei den Entitäten Dossier und Dokument aber hinter dem Knoten <bemerkung> angelegt. Die Positionierung in der Reihenfolge ist eigentlich ohne Bedeutung, wird aber durch das Schema festgelegt. Weil ein neuer Knoten <zusatzdaten> in der XML Datei auftaucht, ist es erst nach Anpassung bzw. Erweiterung bestehender Ingest-Tools möglich, den Inhalt dieser strukturierten Daten zu sehen und zu validieren. Km, 14.09.2010, v0.11 Az 31-02.3 Seite 1/7

1 Change Request bentō Es wurde bewusst versucht, die Schemaerweiterung sprachlich an die (deutschsprachigen) areldatag-namen anzupassen. Folgende Übersetzungen für Begriffe aus den METS und EAD Schemata wurden gewählt: otherdata zusatzdaten property merkmal key schlüssel value wert 1.1 Schema-Erweiterungen An der Master Schemadatei arelda_v3.13.2.xsd müssen vier Änderungen vorgenommen werden. Zusätzlich kommt in den Ordner metadata/xsd eine neue Schemadatei zusatzdaten.xsd. 1.1.1 metadata.xml <?xml version="1.0" encoding="utf-8"?> <paket xmlns:xsi="http://www.w3.org/2001/xmlschema-instance" xmlns="http://bar.admin.ch/arelda/v3.13.2" xsi:schemalocation="http://bar.admin.ch/arelda/v3.13.2 xsd/arelda_v3.13.2_bento_cr.xsd" xsi:type="paketsip"> 1.1.2 Schema: arelda_v3.13.2_bento_cr.xsd Vier Änderungen an arelda_v3.13.2.xsd: <xs:include schemalocation="zusatzdaten.xsd"/> <xs:complextype name="ordnungssystemposition" abstract="true"> <xs:element name="federfuehrendeorganisationseinheit" type="federfuehrendeorganisationseinheitordnungssystemposition" minoccurs="0"/> <xs:element name="klassifizierungskategorie" type="klassifizierungskategorieordnungssystemposition" minoccurs="0"/> <xs:element name="datenschutz" type="datenschutzordnungssystemposition" minoccurs="0"/> <xs:element name="oeffentlichkeitsstatus" type="oeffentlichkeitsstatusordnungssystemposition" minoccurs="0"/> <xs:element name="oeffentlichkeitsstatusbegruendung" type="oeffentlichkeitsstatusbegruendungordnungssystemposition" minoccurs="0"/> <xs:element name="sonstigebestimmungen" type="sonstigebestimmungenordnungssystemposition" minoccurs="0"/> <xs:element name="zusatzdaten" type="zusatzdaten" minoccurs="0"/> <xs:complextype name="dossier" abstract="true"> <xs:element name="zusatzmerkmal" type="zusatzmerkmal" minoccurs="0"/> Km, 14.09.2010, v0.10 Az 31-02.3 Seite 2/7

<xs:element name="titel" type="titeldossier"/> <xs:element name="inhalt" type="inhalt" minoccurs="0"/> <xs:element name="forminhalt" type="forminhalt" minoccurs="0"/> <xs:element name="erscheinungsform" type="erscheinungsformdossier" minoccurs="0"/> <xs:element name="federfuehrendeorganisationseinheit" type="federfuehrendeorganisationseinheitdossier" minoccurs="0"/> <xs:element name="entstehungszeitraum" type="historischerzeitraum"></xs:element> <xs:element name="entstehungszeitraumanmerkung" type="entstehungszeitraumanmerkung" minoccurs="0"/> <xs:element name="klassifizierungskategorie" type="klassifizierungskategoriedossier" minoccurs="0"/> <xs:element name="datenschutz" type="datenschutzdossier" minoccurs="0"/> <xs:element name="oeffentlichkeitsstatus" type="oeffentlichkeitsstatusdossier" minoccurs="0"/> <xs:element name="oeffentlichkeitsstatusbegruendung" type="oeffentlichkeitsstatusbegruendungdossier" minoccurs="0"/> <xs:element name="sonstigebestimmungen" type="sonstigebestimmungendossier" minoccurs="0"/> <xs:element name="bemerkung" type="bemerkungdossier" minoccurs="0"/> <xs:element name="zusatzdaten" type="zusatzdaten" minoccurs="0"/> <xs:attribute name="id" type="iddossier" use="required"/> <xs:complextype name="dokument" abstract="true"> <xs:element name="titel" type="titeldokument"/> <xs:element name="autor" type="autor" minoccurs="0" maxoccurs="unbounded" ecore:name="autoren"/> <xs:element name="erscheinungsform" type="erscheinungsformdokument"/> <xs:element name="dokumenttyp" type="dokumenttyp" minoccurs="0"/> <xs:element name="registrierdatum" type="historischerzeitpunkt" minoccurs="0"></xs:element> <xs:element name="entstehungszeitraum" type="historischerzeitraum" minoccurs="0"> <xs:element name="klassifizierungskategorie" type="klassifizierungskategoriedokument" minoccurs="0"/> <xs:element name="datenschutz" type="datenschutzdokument" minoccurs="0"/> <xs:element name="oeffentlichkeitsstatus" type="oeffentlichkeitsstatusdokument" minoccurs="0"/> <xs:element name="oeffentlichkeitsstatusbegruendung" type="oeffentlichkeitsstatusbegruendungdokument" minoccurs="0"/> <xs:element name="sonstigebestimmungen" type="sonstigebestimmungendokument" minoccurs="0"/> <xs:element name="bemerkung" type="bemerkungdokument" minoccurs="0"/> <xs:element name="zusatzdaten" type="zusatzdaten" minoccurs="0"/> <xs:element name="dateiref" type="xs:idref" minoccurs="0" maxoccurs="unbounded" ecore:name="dateien" ecore:unsettable="true" ecore:reference="datei"/> <xs:attribute name="id" type="iddokument" use="required"/> Km, 14.09.2010, v0.10 Az 31-02.3 Seite 3/7

1.1.3 Schema: zusatzdaten.xsd Zusätzliche Schemadatei: <?xml version="1.0" encoding="utf-8"?> <xs:schema xmlns:xs="http://www.w3.org/2001/xmlschema" elementformdefault="qualified" attributeformdefault="unqualified"> <xs:complextype name="zusatzdaten" mixed="false"> <xs:documentation>merkmal - Werte Gruppen erlaubt das festhalten weiterer Metadaten in tabellarisch strukturierter Form</xs:documentation> <xs:element name="merkmal" maxoccurs="unbounded"> <xs:complextype> <xs:simplecontent> <xs:extension base="xs:string"> <xs:attribute name="name" type="xs:string" use="required"> <xs:documentation>name des Merkmal - Werte Paares</xs:documentation> </xs:attribute> <xs:attribute name="order" type="xs:integer" use="optional"> <xs:documentation>das Attribut erlaubt das Ordnen einer Reihe gleicher Merkmale</xs:documentation> </xs:attribute> </xs:extension> </xs:simplecontent> </xs:element> </xs:schema> 1.1.4 Beispielausschnitt aus metadata.xml Folgende Tabelle wird in metadata.xml als Zusatzdaten zum Dossier 22.06.12 festgehalten. Man beachte, dass Titel im Original ein Zweizeiler ist: Titel X. Nachtrag zum Volksschulgesetz Titel Zusammenfassung Erscheinungsjahr 2007 Km, 14.09.2010, v0.10 Az 31-02.3 Seite 4/7

<dossier id="ds-0"> <titel>x. Nachtrag zum Volksschulgesetz 123</titel> <erscheinungsform>nicht digital</erscheinungsform> <klassifizierungskategorie>nicht klassifiziert</klassifizierungskategorie> <datenschutz>false</datenschutz> <zusatzdaten> <merkmal name="titel" order="1">x. Nachtrag zum Volksschulgesetz</merkmal> <merkmal name="titel" order="2">zusammenfassung</merkmal> <merkmal name="erscheinungsjahr">2007</merkmal> </zusatzdaten> <aktenzeichen>22.06.12</aktenzeichen> 1.2 Validieren und bearbeiten mit bestehenden Tools Für die Validierung mit bereits bestehenden und noch nicht angepassten Tools reicht leider eine Transformation der strukturierten Daten in CDATA 1 Daten nicht. Der Grund dafür ist, dass an der Stelle im arelda Schema keine Daten, sondern nur Knoten erlaubt sind und nicht geparste Daten dennoch den Status von Text annehmen. Die einzige Lösung ist die Transformation zu XML Kommentar (Achtung XML-Kommentar 2 und nicht XML-Annotation 3 ). In transformierter Form: <dossier id="ds-0"> <titel>x. Nachtrag zum Volksschulgesetz 123</titel> <erscheinungsform>nicht digital</erscheinungsform> <klassifizierungskategorie>nicht klassifiziert</klassifizierungskategorie> <datenschutz>false</datenschutz> <!-- <zusatzdaten> <merkmal name="titel" order="1">x. Nachtrag zum Volksschulgesetz</merkmal> <merkmal name="titel" order="2">zusammenfassung</merkmal> <merkmal name="erscheinungsjahr">2007</merkmal> </zusatzdaten> --> <aktenzeichen>22.06.12</aktenzeichen> 1 Als CDATA markierte Daten werden vom XML Parser nicht geparst http://www.w3.org/tr/rec-xml/#sec-cdata-sect 2 Siehe http://www.w3.org/tr/rec-xml/#sec-comments 3 XML Schema Annotation beschreiben ein Schema http://www.w3.org/tr/xmlschema-0/#commvers Km, 14.09.2010, v0.10 Az 31-02.3 Seite 5/7

2 Zusätzliche Schema-Änderung Folgende Schema-Änderung ist aus Kompatibilitätsgründen mit xmllint gewünscht: 2.1 "the base type is expected to be a complex type" Um eine Erweiterung von "eigenschaft" mit Attributen zu realisieren, muss "eigenschaftdatei" als complextype definiert werden und von einem base type abstammen, der ebenfalls als complextype definiert ist. Ein aus einem simpletype abgeleiteter complextype wiederum ist immer eine extension zum simpletype, keine restriction. Die gewünschte Änderung ist rein formal und hat keinen Einfluss auf die gewünschte Funktionalität. arelda_v3.13.2.xsd 951 <xs:complextype name="eigenschaftdatei"> 952 <xs:complexcontent> 953 <xs:extension base="eigenschaft"> 954 <xs:attribute name="name" type="text4" use="required"/> 955 </xs:extension> 956 </xs:complexcontent> 957 datei.xsd (original) xmllint.exe -noout -schema xsd\arelda_v3.13.2.xsd metadata.xml xsd/arelda_v3.13.2.xsd:951: element complextype: Schemas parser error: complex type 'eigenschaftdatei': If using <complexcontent>, the base type is expected to be a complex type. The base type '{http://bar.admin.ch/arelda/v3.13.2}eigenschaft' is a simple type. <xs:simpletype name="eigenschaft"> <xs:documentation>generisches Attribut, welches im Zusammenhang mit Wert verwendet wird. Wird bspw. eine CSV-Datei abgeliefert, dann können mittels Attributpaar "eigenschaft" und "wert" Feld- und Zeilendelemiter, Texterkennungszeichen oder Spaltennamen angegeben werden. </xs:documentation> <xs:restriction base="text4"/> </xs:simpletype> Km, 14.09.2010, v0.10 Az 31-02.3 Seite 6/7

datei.xsd (mit gewünschter Änderung) xmllint.exe -noout -schema xsd\arelda_v3.13.2_bento_cr.xsd metadata.xml metadata.xml validates <xs:complextype name="eigenschaft"> <xs:documentation>generisches Attribut, welches im Zusammenhang mit Wert verwendet wird. Wird bspw. eine CSV-Datei abgeliefert, dann können mittels Attributpaar "eigenschaft" und "wert" Feld- und Zeilendelemiter, Texterkennungszeichen oder Spaltennamen angegeben werden. </xs:documentation> <xs:simplecontent> <xs:extension base="text4"/> </xs:simplecontent> 3 Beilagen In der Beilage arelda_v3.13.2_bento_cr.zip befindet sich ein Beispielablieferung mit den entsprechend angepassten Schemadateien und die geänderten Schemadateien in arelda_v3.13.2_bento_cr.schema.zip. Km, 14.09.2010, v0.10 Az 31-02.3 Seite 7/7