Multimedia Technologie II

Ähnliche Dokumente
Multimedia Technologie II

Klaus Schild, XML Clearinghouse Aufbau von XML- Dokumenten

Einführung in die extensible Markup Language

Eine Dokumenttypdefinition lässt sich im Kopfbereich des XML-Dokumentes (interne DTD) oder in einer separaten Datei formulieren (externe DTD).

Multimedia Technologie II

Komponenten-basierte Entwicklung Teil 2: Einführung in XML

Datenaustauschformate. Datenaustauschformate - FLV

XML Eine Einführung XML Dokumente Erstellen

Was ist SGML. - welche Auszeichnungen (Mark up) sind erlaubt? - welche Auszeichnungen sind notwendig?

Logische Dokumentenstruktur mit SGML und XML

XML-Technologien. Tutorium im Sommersemester Mai 2014

<B1>Skript</B1> Skript zur Vorlesung Auszeichnungssprachen Stand: September 2016

DTD: Syntax-Zusammenfassung

eden market Autor: Norman Lahme

IT-Zertifikat: Daten- und Metadatenstandards

Verteilte Anwendungen. Teil 2: Einführung in XML

Document Type Definitions (DTDs)

Literatur. VA SS Teil 12/XML

Zusammenfassung XML. Metasprache um Dokumenttypen zu definieren

Verteilte Anwendungen. Teil 12: XML-Einführung

2 XML-Basiskonzepte. 2.1 XML-Dokumente

Multimedia Technologie II

XML Schema 2016 S h_da S Seite 1

XML Extensible Markup Language

Semistrukturierte Daten

XML Grundlagen Teil I

Strukturierung von Inhalten

Document Type Definition (DTD)

XML steht für Extensible Markup Language. Helmut Vonhoegen (2007) beschreibt XML unter anderem so:


Fachhochschule Wiesbaden - Fachbereich DCSM. XML Information Set.

XML. Teil 1: Grundbegriffe. Abteilung Informatik WS 02/03

Semistrukturierte Daten. Teil 3: Document Type Definitions (DTDs)

2. Einführung in Datenbanken und XML

Musterlösung des Übungsblattes 1

Kurzeinführung in XML. Was ist XML? Well-formed u. gültiges XML Erste Anwendung in XML Externe DTD Attribute und Entities Datenausgabe mit XSL

Einführung in XML. Seminarunterlage. Version 3.05 vom

Einführung in XML Extensible Markup Language

XML Eine Einführung XML Dokumente Erstellen

6. Datenbanken und XML

Agenda GRUNDKURS INFORMATIK 8 BESCHREIBUNG VON DATEN XML. Von SGML zu XML. Grundbegriffe XML Dokument. XML Beispiel

- Kapselung der Syntax/Semantik Definition. - Wiederverwendung, Standardisierung. - Vereinfachung der Festlegung von Datenstrukturen

XHTML. Lernfragen zu XHTML. Was ist HTML? Überblick

GRUNDKURS INFORMATIK. Marcel Götze

XML. Einführung, XML-Grundlagen und -Konzepte. XPath DTD. XQuery. XML-Schema XSLT XML-Grundlagen, -Sprachen, -Datenhaltungsfragen

XML. Einführung, XML-Grundlagen und -Konzepte. XPath DTD. XQuery. XML-Schema XSLT XML-Grundlagen, -Sprachen, -Datenhaltungsfragen

Auszeichnungssprachen. Auszeichnungssprachen

Musterlösung Übungsblatt 14

XML-Technologien Tutorium 1

... MathML XHTML RDF

Attribut-Konventionen und Normierungsregeln

03 XML Grundlagen. Manuel Burghardt Lehrstuhl für Medieninformatik

Dirk Ammelburger XML. Grundlagen der Sprache und Anwendungen in der Praxis HANSER

Linux I II III Res WN/TT NLTK XML Weka E XML BNC XSLT BNC/XML 7 BNC/XML XML BNC XSLT. Ressourcen-Vorkurs

3 4! 8"!$, ! "! ' () * &, -.% /-0111 % = ; - ; ' :05

Attribut-Konventionen und Normierungsregeln

Musterlösung des Übungsblattes 2

Aufbau von XML- Dokumenten. Syntax wohlgeformter. XML-Dokument. Heutige Vorlesung. Wiederholung: Was ist XML?

Konzeptionelle Modellierung von XML-Dokumenttypen

Integrierte Anwendungssysteme XML - Übungsaufgabe

2. XML 2.1 XML 1.0 und XML Schema. Jörg Schwenk Lehrstuhl für Netz- und Datensicherheit

Aufbau von XML- Dokumenten

Textauszeichnung mit XML

XML exemplarisch. nach: André Bergholz, Extending Your Markup: An XML Tutorial IEEE Internet Computing, Jul./Aug. 2000, 74 79

DTDs und XML- Schemata

Praktikum zur Veranstaltung XML-Technologie: Übung 02

Extensible Markup Language (XML)

Beschreibung von Dokumenten mit DTDs

XML Grundlagen. Andreas Rottmann,Sebastian Riedl. 27. August Quit Full Screen Previous Page Next Page GoTo Page Go Forward Go Back

Information und Struktur Einführung in XML

XML Schema 2012/2013 S Seite 1 h_da W

XML 1. Einführung, oxygen. Ulrike Henny. IDE Summer School 2013, Chemnitz

Knowledge Management im Bildungsbereich KMB: Teil 4

Informationsmodellierung in XML und SGML

3.1 Sinn und Zweck von Namensräumen

Kurze Einführung in XML

XML und Dokumentenmanagement

xmltex Oder Wie bringt man XML und TeX zusammen? Daniel Radünz

Digitale Medien. Übung zur Vorlesung. Vorlesung: Heinrich Hußmann Übung: Renate Häuslschmid

Probeklausur Digitale Medien

Einführung in XML. Arthur Brack FHDW Hannover. 1. Oktober 2009

XML kompakt. Eine praktische Einführung. Bearbeitet von Thomas Michel

Weiterführende Literatur: M. Knobloch, M. Kopp: Web-Design mit XML, dpunkt-verlag 2001

XML Extensible Markup Language

Einführung in XML. Seminar: XML in der Bioinformatik Frank Schönmann WS 2002/03

Musterlösung des Übungsblattes 2

Was läßt sich mit Informationen tun?

XML, XHTML und MathML

Kritik von HTML. Multimedia-Technik XML. Syntax von XML-Dokumenten. Extensible Markup Language (XML) reine Strukturbeschreibung

XML Extensible Markup Language

Beuth Hochschule Verschiedene Bestandteile einer XML-Datei WS10/11

Single Source Publishing mit XML

Einführung in XML. Seminar: XML in der Bioinformatik Frank Schönmann WS 2002/03

XML-Namensräume (NSP)

1 Was ist XML? Hallo XML! Kommentare in XML 52

Namespaces in XML. Warum Namensräume in XML? Warum Namensräume in XML?

Transkript:

Vorlesung / Übungen Multimedia Technologie II Prof. Dr. Michael Frank / Prof. Dr. Klaus Hering Sommersemester 2004 HTWK Leipzig, FB IMN

3. Extensible Markup Language (XML) Wie SGML ist XML eine Meta-Markup Language, d.h. sie bietet Mechanismen zur Definition von Markup Languages. Alle über XML definierten Sprachen (bezeichnet als XML-Applikationen oder Dokumenttypen) müssen gewissen syntaktischen Grudregeln (z. B. bezüglich der Bildung und Verwendung von tags) genügen. Diesen Regeln entsprechende Dokumente heißen wohlgeformt (well-formed). Darüber hinausgehende Regeln zur Definition von XML-Applikationen werden zum Beispiel im Rahmen von Dokumenttyp-Definitionen (DTD) gegeben. Diese verkörpern eine Menge von Deklarationen zur Einführung von Elementnamen (als Bezeichnung durch tags eingegrenzter Dokumentteile), Attributnamen (zur Verbindung von Elementen mit Eigenschaften), Entitynamen (als Bezeichnung von Dokumentteilen) und Typnamen (zur Charakterisierung speziell zu behandelnder Dokumentteile). XML Schemata stellen eine alternative Definitionsform für Dokumenttypen dar. 0280 Multimedia Technologie II, Prof. Klaus Hering, SS 2004

Dokument aus der Mathematics Markup Language (MathML) <?xml version= 1.0?> <math xmlns= http://www.w3.org/tr/rec-mathml/ > <mi>f</mi><mo>=</mo> <mi>g</mi><mo>&invisibletimes;</mo> <mfrac> <mrow> <mi>m</mi><mo>&invisibletimes;</mo><mi>m</mi> </mrow> <apply> <power><mi>r</mi><mn>2</mn></power> </apply> </mfrac> </math> verkörpert Gleichung F = GMm / r 2 (Newton sches Gravitationsgesetz) 0290 Multimedia Technologie II, Prof. Klaus Hering, SS 2004

Dokument aus der Scalable Vector Graphics (SVG) Language <?xml version= 1.0 standalone= no?> <!DOCTYPE svg PUBLIC -//W3C//DTD SVG 20001102//EN http://www.w3.org/tr/2000/cr-svg-20001102/dtd/svg-20001102.dtd> <svg> <desc>three shapes</desc> <rect fill= green x= 1cm y= 1cm width= 3cm height= 3cm /> <circle fill= red cx= 3cm cy= 2cm r= 4cm /> <polygon fill= blue points= 110,160 50,300 180,290 /> </svg> verkörpert drei Figuren (Rechteck, Kreis, Polygon) vielfältige Interpretationsmöglichkeiten von XML-Dokumenten vielversprechende Anwendung von XML zur Spezifikation von Formaten für den Datentransfer zwischen Applikationen 0300 Multimedia Technologie II, Prof. Klaus Hering, SS 2004

XML beschreibt die Struktur und Semantik, aber nicht die Formatierung von Sprachelementen. Letztere wird über Style Sheets festgelegt. Das birgt eine Reihe von Vorteilen: gleiche Stilvorgaben können für viele Dokumente verwendet werden Änderungen einer Stilvorgabe erfolgen konzentriert an einem Ort und alle damit in Verbindung stehenden Dokumente werdadurch beeeinflußt entsprechend dem Verwendungszweck eines Dokuments können Stylesheets ausgetauscht werden Experimente in Bezug auf das Layout lassen die Dokumentstruktur völlig unberührt keine textliche Vermischung von Notationen zu Inhalt und Form 0310 Multimedia Technologie II, Prof. Klaus Hering, SS 2004

3.1 Syntaktische Konstrukte Elemente verkörpern die Grundbausteine von XML. Dabei handelt es sich um in tags eingeschlossene Dokumentteile, die eine Mischung aus Text und anderen Elementen enthalten können. <el1>ein reines Textelement</el1> <outer>text<inner>text</inner>text</outer> Spezialfall eines leeren Elements: <empty/> Elemente können durch Attribute näher beschrieben werden. Attributnamen dürfen nicht mehrfach an ein Element gebunden werden. 0320 Multimedia Technologie II, Prof. Klaus Hering, SS 2004

Container-Element: <name att 1 = val 1 att i = val i > </name> element_content Leeres Element: <name att 1 = val 1 att i = val i /> Regeln für wohlgeformte Dokumente: Von zwei Elementen innerhalb eines Dokuments ist entweder eines vollständig im anderen enthalten oder beide überlappen nicht. Die Sonderzeichen <, >, [, ], & treten nicht isoliert im content-bereich auf (Ausnahme: CDATA-Bereiche) Element-Namen müssen mit einem Buchstaben oder _ beginnen. Sie dürfen lediglich Buchstaben, Ziffern oder Zeichen aus der Menge {-,., _} enthalten (außerdem : im Zusammenhang mit name spaces). 0330 Multimedia Technologie II, Prof. Klaus Hering, SS 2004 start tag (übereinstimmender Name, Groß- und Kleinschreibung beachten!) end tag Attributlisten können leer sein

Innerhalb von XML-Dokumenten fungieren sogenannte Entities als Platzhalter (Abkürzungen) für Dokumentteile. Sofern sie nicht vordefiniert sind, werden Entities im Dokumentprolog oder in einer externen DTD deklariert. parameter Entities general internal nur innerhalb einer DTD external character unparsed predefined numbered named mixed-content internal external 0340 Multimedia Technologie II, Prof. Klaus Hering, SS 2004

Entity-Deklaration: Bezugnahme: <!ENTITY name value > &name; (general entity) Predefined character entities: % name; (parameter entity) (name,value): (amp,&) (apos, ) (gt,>) (lt,<) (quot, ) Bezug auf eine numbered character entity: &#xa3 (163. Unicode character ) Named character entities sind explizit zu deklarieren aber einfacher zu merken als numbered character entities. Es gibt eine Reihe vorgefertigter DTDn mit entsprechenden Deklarationen. 0350 Multimedia Technologie II, Prof. Klaus Hering, SS 2004

Internal mixed-code entity: <!ENTITY IBM <company>international Business Machines Corporation</company> > External mixed-code entity: <!ENTITY chap2 SYSTEM chap02.xml > Unparsed entity: <!ENTITY picture SYSTEM person.gif NDATA GIF> Konstrukte, die ihren Inhalt vor dem Parser abschirmen: Comments, CDATA Sections, Processing Instructions 0360 Multimedia Technologie II, Prof. Klaus Hering, SS 2004

Kommentar: <!-- text and markup --> CDATA section: <![CDATA[ text ]]> CDATA sections verkörpern für den Parser Dokumentteile, die frei von Markup-Konstrukten sind. Die Verwendung dieser Konstrukte bietet sich zum Beispiel zur Darstellung von Programmfragmenten an: <![CDATA[if (&x < &y)]]> Processing instructions: <?name data?> Ein processing instruction handler, der den angegebenen Namen akzeptiert, kann die Daten verwenden. 0370 Multimedia Technologie II, Prof. Klaus Hering, SS 2004

Dokument-Gesamtstruktur: Prolog XML-Deklaration Dokumenttyp-Deklaration Root Element Dokument-Körper XML-Deklaration: Eigenschaftsdefinitionen <?xml name 1 = val 1 name i = val i?> Eigenschaft Wert 0380 Multimedia Technologie II, Prof. Klaus Hering, SS 2004

mögliche Eigenschaften: version gibt XML-Versionsnummer an encoding gibt den verwendeten Zeichensatz an (standardmäßig UTF-8) standalone gibt an, ob weitere Files geladen werden müssen (z.b. eine Dokumenttyp-Definition oder externe Dokumentteile), Werte: yes, no Die Angabe von Eigenschaftsdefinitionen ist optional, allerdings sollte wenigstens die XML-Versionsnummer bereitgestellt werden. 0390 Multimedia Technologie II, Prof. Klaus Hering, SS 2004

Dokumenttyp-Deklaration: <!DOCTYPE root_element_name DTD_reference [ internal_declarations ]> } external subset internal subset root_element_name stimmt mit dem Namen des tags überein, welcher zum Einschließen des Dokument-Körpers verwendet wird DTD_reference verkörpert einen (optionalen) Verweis auf eine externe Datei, die in einer DTD zugelassene Deklarationen enthält Die zu einem Dokument gehörende DTD wird durch die Gesamtheit der Deklarationen in internal subset und external subset bestimmt (beide Teile können leer sein) Falls vorhanden, überlagern interne Deklarationen auf das gleiche Objekt bezogene externe Deklarationen 0400 Multimedia Technologie II, Prof. Klaus Hering, SS 2004

Beispiel: <?xml version= 1.0?> <!DOCTYPE book PUBLIC -//ORA//DTD DBLITE XML//EN SYSTEM usr/local/prod/dtds/dblite.dtd [ ] > <!ENTITY chap1 SYSTEM ch01.xml > <!ENTITY chap2 SYSTEM ch02.xml > <!ENTITY xml <acronym>xml</acronym> > <book> </book> 0410 Multimedia Technologie II, Prof. Klaus Hering, SS 2004

3.2 Dokumenttyp-Definition (DTD) im folgenden: Konstruktion einer kompletten Beispiel-DTD Dokumenttyp (XML-Applikation) Katalog (in Bezug auf Bücher) siehe P. Spencer: Professional XML Design and Implementation. Wrox Press, 1999. Vorgehen: TOP-DOWN Betrachtung der Dokumentstruktur Einführung entsprechender Elemente Erzeugung zugehöriger Deklarationen (Elementtyp-, Attributlisten-, Entity-, Notations-Deklarationen) 0420 Multimedia Technologie II, Prof. Klaus Hering, SS 2004

Informale Beschreibung: Ein Katalog soll eine Folge von Buchbeschreibungen enthalten. Zu einer Buchbeschreibung sollen Titel, Autoren, Verlag, Seitenzahl, ISBN-Nummer und Preisangaben, ggf. in unterschiedlichen Währungen, gehören. Einführung des root-elements: Katalog Die folgende Elementtyp-Deklaration drückt aus, dass ein Katalog-Element eine (möglicherweise leere) Folge von Buch- Elementen enthält: <!ELEMENT Katalog (Buch)*> kein Vorkommen der eingeklammerten Kategorie oder beliebig viele hintereinander liegende 0430 Multimedia Technologie II, Prof. Klaus Hering, SS 2004

Einführung des Buch-Elements: Ein Buch-Element soll (in dieser Reihenfolge) ein Titel-, Autoren-, Verlag-Element, optional ein Seiten-Element, ein ISBN-Element und ein oder mehrere Preis-Elemente enthalten. <!ELEMENT Buch (Titel, Autoren, Verlag, Seiten?, ISBN, Preis+)> ein oder kein Vorkommen des Seiten-Elements ein oder mehrere Vorkommen des Preis-Elements Einführung des Autoren-Elements: Ein Autoren-Element soll ein oder mehrere Autor-Ele- Mente enthalten. <!ELEMENT Autoren (Autor+)> 0440 Multimedia Technologie II, Prof. Klaus Hering, SS 2004

Schließlich sollen das Titel-, Autor-, Verlag-, Seiten-, ISBNund Preis-Element reinen Text (parsed character data, PCDATA) enthalten. Das wird durch die folgenden Deklarationen ausgedrückt: <!ELEMENT Titel (#PCDATA)> <!ELEMENT Autor (#PCDATA)> <!ELEMENT Verlag (#PCDATA)> <!ELEMENT Seiten (#PCDATA)> <!ELEMENT ISBN (#PCDATA)> <!ELEMENT Preis (#PCDATA)> Für das Preis-Element wird noch ein mit Waehrung bezeichnetes Attribut eingeführt, dem als Wert eine Zeichenkette (CDATA) zugeordnet sein soll. Weiter soll dieses Attribut in jedem start tag eines Preis-Elements gefordert sein. <!ATTLIST Preis Waehrung CDATA #REQUIRED> 0450 Multimedia Technologie II, Prof. Klaus Hering, SS 2004

Gültiges Beispieldokument des Typs Katalog: <?xml version="1.0"?> <!DOCTYPE Katalog [ <!ELEMENT Katalog (Buch)*> <!ELEMENT Buch (Titel, Autoren, Verlag, Seiten?, ISBN, Preis+)> <!ELEMENT Autoren (Autor+)> <!ELEMENT Titel (#PCDATA)> <!ELEMENT Autor (#PCDATA)> DTD <!ELEMENT Verlag (#PCDATA)> <!ELEMENT Seiten (#PCDATA)> <!ELEMENT ISBN (#PCDATA)> <!ELEMENT Preis (#PCDATA)> <!ATTLIST Preis Waehrung CDATA #REQUIRED> ]> Fortsetzung auf der nächsten Folie 0460 Multimedia Technologie II, Prof. Klaus Hering, SS 2004

<Katalog> <Buch> <Titel>XML in der Praxis</Titel> <Autoren> <Autor>Henning Behme</Autor><Autor>Stefan Mintert</Autor> </Autoren> <Verlag>Addison-Wesley</Verlag> <ISBN >3-8273-1636-7</ISBN> <Preis Waehrung="USD">52.25</Preis><Preis Waehrung= ATS">700</Preis> </Buch> <Buch> <Titel>Learning XML</Titel> <Autoren><Autor>Erik T. Ray</Autor></Autoren> <Verlag>O&apos;Reilly</Verlag> <Seiten>356</Seiten> <ISBN>0-596-00046-4</ISBN> <Preis Waehrung="Euro">47</Preis> </Buch> </Katalog> 0470 Multimedia Technologie II, Prof. Klaus Hering, SS 2004