Einführung XOP Fast Infoset. Seminar: XML und intelligente Systeme. 31. Oktober 2005. XML und Binärdaten. Kai Rabien krabien@techfak.uni-bielefeld.



Ähnliche Dokumente
Norm 230 Übertragung von Dateien

XINDICE. The Apache XML Project Name: J acqueline Langhorst blackyuriko@hotmail.de

Übertragungsmedien in der Kommunikationstechnik. Eine Präsentation von Vanessa Hörnig

Der Weg zur eigenen App

1. Stellenwerte im Dualsystem

Run Length Coding und Variable Length Coding

Grundbegriffe der Informatik

OERA OpenEdge Reference Architecture. Mike Fechner PUG Infotag 19. Mai 05 Frankfurt

10%, 7,57 kb 20%, 5,3 kb 30%, 4,33 kb 40%, 3,71 kb 50%, 3,34 kb. 60%, 2,97 kb 70%, 2,59 kb 80%, 2,15 kb 90%, 1,62 kb 99%, 1,09 kb

Konzentration auf das. Wesentliche.

Free your work. Free your work. Wir wollen Ihnen die Freiheit geben, sich auf Ihr Geschäft zu konzentrieren.

Wenn Sie das T-Online WebBanking das erste Mal nutzen, müssen Sie sich zunächst für den Dienst Mobiles Banking frei schalten lassen.

AGROPLUS Buchhaltung. Daten-Server und Sicherheitskopie. Version vom b

Wie ist das Wissen von Jugendlichen über Verhütungsmethoden?

MehrWerte. Das Wipak Web Center DE 2014/03

MSXFORUM - Exchange Server 2003 > SMTP Konfiguration von Exchange 2003

Multimedia und Datenkommunikation

2. Negative Dualzahlen darstellen

Anleitung über den Umgang mit Schildern

Der Gabelstapler: Wie? Was? Wer? Wo?

Binäre Gleitkommazahlen

Peter K. Brandt Ergon Informatik AG, Zürich. Kompakte Speicherung von RailML Daten mit WBXML

Investitionsentscheidungsrechnung vollständiger Finanzplan

Allgemeines zu Datenbanken

Social Media Monitoring Was wird über Sie und Ihre Wettbewerber gesagt?

Containerformat Spezifikation

Glaube an die Existenz von Regeln für Vergleiche und Kenntnis der Regeln

Webseiten sind keine Gemälde. Webstandards für ein besseres Web. Webstandards für ein besseres Web

Grundsätzliches zur TimeTec Cloud Preisgestaltung

Kernkompetenzen eines Wirtschaftsinformatikers heute und morgen

Folgen KMU dem Megatrend Mobile-Business?

WinVetpro im Betriebsmodus Laptop

Die Bundes-Zentrale für politische Bildung stellt sich vor

StuPro-Seminar Dokumentation in der Software-Wartung. StuPro-Seminar Probleme und Schwierigkeiten in der Software-Wartung.

Barrierefreie Web Projekte Ein strategischer Ansatz

Anschließen und loslegen. Erleben Sie das One Click Wonder.

DER SELBST-CHECK FÜR IHR PROJEKT

:: Anleitung Hosting Server 1cloud.ch ::

Leichte Sprache Informationen zum Europäischen Sozialfonds (ESF) Was ist der Europäische Sozialfonds?

hcadress Adressverwaltung Bergstrasse Neuenkirch Tel Mail info@hellcom.ch Web

C09: Einsatz SAP BW im Vergleich zur Best-of-Breed-Produktauswahl

Reporting Services und SharePoint 2010 Teil 1

Erfahrungen mit Hartz IV- Empfängern

Kommunikation als kreativer Prozess: Im Dialog mit dem Kunden

Informationen zum Ambulant Betreuten Wohnen in leichter Sprache

XML und Datenbanken. Wintersemester 2003/2004. Vorlesung: Dienstag, 13:15-15:00 Uhr IFW A36. Übung: Dienstag, 15:15-16:00 Uhr IFW A36

Fachkonferenz DOJ vom 18. November Kurze Einführung über das Wiki allgemein und Vergleich mit dem voja-wiki

Wir machen neue Politik für Baden-Württemberg

Entwicklung des Dentalmarktes in 2010 und Papier versus Plastik.

Ökonomik der Agrar und Ernährungswirtschaft in ILIAS

Eine Logikschaltung zur Addition zweier Zahlen

Grundzüge und Vorteile von XML-Datenbanken am Beispiel der Oracle XML DB

Die Stadt-Bibliothek Mannheim in einfacher Sprache.

Solarstrom selbst erzeugen und speichern so geht s!

Übungsaufgaben zu XML:

Professionelle Seminare im Bereich MS-Office

Fragen zu Mehrfamilienhäusern

Übung - Datensicherung und Wiederherstellung in Windows Vista

Lokale Installation von DotNetNuke 4 ohne IIS

Partnerportal Installateure Registrierung

Informationsblatt zu den Seminaren am Lehrstuhl. für Transportsysteme und -logistik

DIGITALKONSULAT DK. Unsere Leistungen

Ein Blick voraus. des Autors von C++: Bjarne Stroustrup Conrad Kobsch

mobilepoi 0.91 Demo Version Anleitung Das Software Studio Christian Efinger Erstellt am 21. Oktober 2005

Research Note zum Thema: Laufzeit von Support-Leistungen für Server OS

Analyse zum Thema: Laufzeit von Support-Leistungen für ausgewählte Server OS

Was ich als Bürgermeister für Lübbecke tun möchte

ERPaaS TM. In nur drei Minuten zur individuellen Lösung und maximaler Flexibilität.

Ihre PLM-Prozessexperten für Entwicklung und Konstruktion

Executive Information. «Setup and forget it!» So automatisieren Sie Ihr Datacenter mit dem Microsoft System Center Orchestrator 2012.

e LEARNING Kurz-Anleitung zum Erstellen eines Wikis 1. Wiki erstellen

Containerformat Spezifikation

Entwicklung und Stärkung der persönlichen Kompetenzen!

Lineargleichungssysteme: Additions-/ Subtraktionsverfahren

ACDSee Pro 3-Tutorials: Versenden von Bilder an eine FTP-Site

Unternehmens-Check (U.C.)

2250 Deutsche Internetadressen, für kostenlose Kleinanzeigen"

Oracle APEX Installer

SWOT Analyse zur Unterstützung des Projektmonitorings

SMS/ MMS Multimedia Center

Handbuch für die DailyDeal Entwertungs-App

Herr Müller möchte anderen Menschen helfen. Er bekommt kein Geld für diese Arbeit. Aber die Arbeit macht ihm Freude.

Die Wirtschaftskrise aus Sicht der Kinder

Die integrierte Zeiterfassung. Das innovative Softwarekonzept

Was heißt das Was soll das?

1. Weniger Steuern zahlen

Das Recht auf gesundheitliche Versorgung ein Menschenrecht!

BITte ein BIT. Vom Bit zum Binärsystem. A Bit Of Magic. 1. Welche Werte kann ein Bit annehmen? 2. Wie viele Zustände können Sie mit 2 Bit darstellen?

ROFIN App Benutzerhandbuch. Version 1.0

Professionelle Seminare im Bereich MS-Office

Meet the Germans. Lerntipp zur Schulung der Fertigkeit des Sprechens. Lerntipp und Redemittel zur Präsentation oder einen Vortrag halten

HIER GEHT ES UM IHR GUTES GELD ZINSRECHNUNG IM UNTERNEHMEN

RDF und RDF Schema. Einführung in die Problematik Von HTML über XML zu RDF

Ihre Stimme für 7 % für Kinder!

ASV-Betrieb für die Coburger Schulen. Einbindung externer Schulen via RemoteApp

40x wissensch. Lehrerin / wissensch. Lehrer. 2. Mit dem Thema digitales Whiteboard als Unterrichtsmittel habe ich mich bereits beschäftigt.

Gründe für fehlende Vorsorgemaßnahmen gegen Krankheit

Transkript:

Seminar: XML und intelligente Systeme 31. Oktober 2005 XML und Binärdaten Kai Rabien krabien@techfak.uni-bielefeld.de

Überblick Einführung Binärdaten in XML Die Problematik Ansätze XOP Vorstellung XOP, Beispiel Was fehlt? Fast Infoset Komponenten Beispiel Fazit / Diskussion

Binärdaten in XML Daten sollen in XML eingebunden werden z.b. Bilder in einer Adressen- Datenbank XML soll effizienter transportiert werden kleinere Datenmengen -> schnellerer Transport Parsen / Serialisierung soll effizienter werden Nicht-String-Daten sind in XML meist nicht in ihrer nativen Form gespeichert. Die Konvertierung kostet Rechenzeit / Energie

base64 In XML-Dokumenten liegen Binärdaten i.d.r. base64 codiert vor. Der base64- Algorithmus bildet je 3 Bytes auf 4 6-bit- Bytes ab: Rohdaten base64 Quelle: wikipedia

Das Problem: Demnach werden base64- codierte Daten 33% umfangreicher. Das kostet Speicherkapazität, und vor allem: Bandbreite! Das ist in heutigen Web Services nicht akzeptabel.

Lösungsansätze Datenkomprimierung Datenreduktion durch nachträgliche Komprimierung bzw. Dekomprimierung vor dem Parsen (kostet extra Rechenleistung) Infoset- basierte Modelle Braucht kein Schema, bildet XML-Textdarstellung direkt in ein Binärformat ab (flexibel) Schema- basierte Modelle Verwendet Schema-Wissen zur Datenreduktion(effizient) Hybride

Schema-orientiert: XOP XOP ist eine w3c- Recommendation base64- Kodierung wird ersetzt durch Binärdaten- Blöcke, die im Datenstrom verlinkt werden <m:data xmlns:m='http://example.org/data'> <m:photo> <xop:include xmlns:xop='[...]/xop/include' href='cid:http://example.org/me.png'/> </m:photo> </m:data> --MIME_boundary Content-Type: image/png Content-Transfer-Encoding: binary Content-ID: <http://example.org/me.png> // binär codiertes png......... <m:data xmlns:m='http://example.org/data'> <m:photo> // base64 codiertes png GLWBIMSSJQSGGUqcuiclEmL RIYSp+5JDCOWLMEQhPGDIgA 1Av5yy8En88Qp1ql1q2xtDS ep7ciokkkqiohp2it8cyg7v... +BBmz0ZVALqLU/ekRAKzZ8O OBVJlgHxu3chNRXHlZ73ZTV 5leden/0CKZPh8LCapJVpaN zhx49kigvwtbyhh6+zbk59d... </m:photo> </m:data>... Quelle: http://www.w3.org/tr/xop10/ (gekürzt/ergänzt)

Resultat: Deutlich kleinere Datenmengen Je nach Anwendung auch weniger Aufwand (base64 en- und decoding kann entfallen) Es ist ein Schema nötig (Schema- orientierter Ansatz) Wenn eine Konvertierung nach base64 nötig wird, entsteht zusätzlicher Aufwand

XML -> XOP -> XML http://www.w3.org/tr/2004/pr-xop10-20041116/

Was ist mit dem Text? XML- Daten enthalten immer noch Overhead : human-readable Viel whitespace, der keine verarbeitungsrelevanten Informationen enthält <cac:address> <cbc:streetname>marsh Lane</cbc:StreetName> <cbc:cityname>nowhere</cbc:cityname> <cbc:postalzone>nr18 4XX</cbc:PostalZone> <cbc:countrysubentity>norfolk</cbc:countrysubentity> </cac:address>

Infoset-orientiert: Fast Infoset Eine Recommendation der ITU-T, die die Performance-Probleme mit XML-Daten lösen will: To enable fast and efficient end-to-end, interoperable, Web Services for a whole spectrum of devices, from mobile phones to large back end servers (Artikel Fast Web Services, developer.sun.com)

Fast Infoset und XML- Infoset Verarbeitung Datenmodell Serialisierung Anwendung XML- API XML- Infoset XML 1.0 Fast Infoset ASN.1 PER

ASN.1 Abstract Syntax Notation One (ASN.1) Seit 20 Jahren in der Entwicklung Verwendet in Telefon-Netzwerken: wired: Verarbeitung von Routing-Daten wireless: Zell-Transfer Abwicklung ASN.1 ermöglicht Strukturdefinitionen ähnlich XML -> es existiert ein direktes Mapping zu XSD

PER Packed Encoding Rules ist laut Sun: Die kompakteste Art der ASN.1 Kodierung Die schnellste ASN.1 Kodierung Die schnellste ASN.1 Dekodierung

Beispiel:

Resultat: Schnelleres Parsing Schnellere Serialisierung Interoperabilität hängt von FI-Schicht ab

Fazit / Diskussion Xml-binary Optimized Packaging sorgt für einen effizienteren Transport von Binärdaten innerhalb von XML-Dokumenten. Das Infoset selbst bleibt, wie es ist. Fast Infoset kodiert XML-Infosets in einem Binärformat, das nicht mehr wesentliche Eigenschaften von XML hat. Wie könnten Anwendugsszenarien aussehen? Wo liegen die Schwächen dieser Konzepte? Wie könnte man darauf reagieren? Kai Rabien krabien@techfak.uni-bielefeld.de