Metadaten Bedeutung und Anwendung von Metadaten Platform for Internet Content Selection (PICS) Resource Description Framework (RDF) Abteilung für Wirtschaftsinformatik Folie 1
Metadaten Metadaten sind Daten über Daten. Metadaten im Web: Maschniell verarbeitbare Information über Information im Web. Klassisches Anwendungsgebiet: Bibliotheken Metadaten zu Büchern: Titel, Autor, Verlag, Preis, Seitenzahl,... Projekte im Web: PICS, DSig, WebDAV, Dublin Core (15 Kernattribute), RDF, DMOZ,... Abteilung für Wirtschaftsinformatik Folie 2
Anwendungsbereiche für Metadaten Web-Kataloge (bspw. DMOZ) Annotationssyteme Austauschpattformen für digitale Güter (UNIVERSAL) Annotierte Bibliographien Suchmaschinen, resource discovery Digitale Signaturen, Urheberschutz,... Inhaltsbewertung, Jugendschutz (PICS) Rechteverwaltung (rights management languages), elektronische Verträge Abteilung für Wirtschaftsinformatik Folie 3
Metadaten bei MPEG-7 Generelle Metadaten - Titel,..., Kameramann, Musik,... Strukturelle Beschreibung - 3. Szene,... Räumliche und zeitliche Metadaten Abteilung für Wirtschaftsinformatik Folie 4
Problembereiche für interoperable Metadaten Syntax: In welcher Form werdenmetadaten ausgetauscht (Kandidat: XML) Semantik: Welche Metadaten können/dürfen für eine Ressource vergebenwerden (Bestimmung eines Vokabulars, eines Schemas) Assoziationsproblem: Wie werden Metadaten mit Ressourcen verknüpft (wer vergibt Metadaten, werden Metadaten getrennt von den Ressourcen verwaltet, etc). Abteilung für Wirtschaftsinformatik Folie 5
Assoziationsmodelle für Metadaten Abteilung für Wirtschaftsinformatik Folie 6
PICS PICS: Platform for Internet Content Selection Aufgabe von PICS: Web-Ressourcen werden zusätzliche Attribute (PICS-Jargon: label ) zugewiesen. Diese Attribute können zum Filtern von Inhalten in Web-Klienten oder Vermittlungsrechnern verwendet werden. Ursprünglich für Jugendschutz entwickelt, kann auch für andere Zwecke genutzt werden Abteilung für Wirtschaftsinformatik Folie 7
PICS-Prinzipien Herstellerunabhängig und -übergreifend Vergabe der PICS-Attribute: durch den Informationsanbieter durch mehrere, unabhängige Institutionen (engl.: labeling bureaus) Leichte Verwendbarkeit: Obrigkeiten (Eltern, Lehrern, Dienstgebern,...) sollen leicht die durch ihre Systeme erreichbare Information regulieren können. Aktuelle Verison: 1.1 (Okt. 1996, W3C) Abteilung für Wirtschaftsinformatik Folie 8
PICS-Architektur Abteilung für Wirtschaftsinformatik Folie 9
Schritte zur PICS-Anwendung Definition eines Vokabulars Zuweisung der Label an Ressourcen Verteilung der Label Erstellung von Filterungs-Software Erstellung von Filterungs-Regeln Anwendung der Regeln Alle Punkte durch unterschiedliche Institutionen realisierbar (offenes Protokoll) Abteilung für Wirtschaftsinformatik Folie 10
PICS-Vokabular von ICRA ICRA: Internet Content Rating Association Abteilung für Wirtschaftsinformatik Folie 11
PICS-Vokabular (Schema) von ICRA ((PICS-version 1.1) (rating-system "http://www.rsac.org/ratingsv01.html") (rating-service "http://www.rsac.org/") (name "The RSAC Ratings Service") (description "The Recreational Software Advisory Council rating service. Based on the work of Dr. Donald F. Roberts of Stanford University, who has studied the effects of media on children for nearly 20 years.") (default (label-only true) (category (transmit-as "v") (name "Violence") (label (name "Conflict") (description "Harmless conflict; some damage to objects") (value 0)) (label (name "Fighting") (description "Creatures injured or killed; damage to objects; fighting") (value 1)) (label (name "Killing") (description "Humans injured or killed with small amount of blood") (value 2)) (label (name "Blood and Gore") (description "Humans injured or killed; blood and gore") (value 3)) (label (name "Wanton Violence") (description "Wanton and gratuitous violence; torture; rape") (value 4)))... Zuweisung von Zahlenwerten an unterschiedliche Ausprägunge der Kategorie Violence Abteilung für Wirtschaftsinformatik Folie 12
PICS-Rating für ein Dokument (PICS-1.1 "http://www.rsac.org/v2.5" labels on "1994.11.05T08:15-0500" exp "1999.12.31T23:59-0000" for "http://www.greatdocs.com/foo.html" by "George Sanderson, Jr." ratings (v 2 sex 1 nudity 3)) Rating kann im Dokument abgelegt sein von einem getrennten Server im Internet stammen. Abteilung für Wirtschaftsinformatik Folie 13
PICS-Zusammenfassung PICS-Schema: Kategorien Ausprägungen: numerische Werte LISP-ähnliche Syntax Wunsch nach: Strukturierten Metadaten Reichhaltigere Schemata allgemeines Austauschformat in XML Entwicklung von RDF Abteilung für Wirtschaftsinformatik Folie 14
RDF RDF: Resource Description Framework, Entwicklung durch das W3C, April 1998 Zur Abbildung von allgemeinen Metadaten, kann alle anderen Metadatenformate ersetzen (bspw. PICS) Austauschformat in XML Quelle: http://w3.org/rdf Abteilung für Wirtschaftsinformatik Folie 15
RDF-Komponenten RDF-Schema: Zur Definitionen des Vokabulars RDF-Instanzen: Ausprägungen von Metadaten, Bedeutung durch RDF-Datenmodell bestimmt, Austausch in XML-Syntax RDF-Query: Abfragesprache (frühes Stadium) Abteilung für Wirtschaftsinformatik Folie 16
RDF-Datenmodell RDF-Daten bestehen aus Knoten (engl.: resources), und Attribut-/Wert-Paaren (engl.: property types, property values), die den Knoten zugewiesen werden. Knoten (resources): alles, was über eine URI adressiert werden kann Attributnamen (property types) sind atomar, Attribut- Werte können strukturiert sein. Die RDF-Information bildet einen gerichteten und beschrifteten Graphen Abteilung für Wirtschaftsinformatik Folie 17
Graphische Notation von RDF Abteilung für Wirtschaftsinformatik Folie 18
Einfaches RDF-Modell 2 RDF-Statements: Gustaf Neumann ist der Creator von page.html My Homepage ist der Title von page.html Aufbau: Subject, Predicate, Object Abteilung für Wirtschaftsinformatik Folie 19
RDF-Modell mit strukturiertem Wert Wert von Creator ist zusammengesetzt (strukturiert) Abteilung für Wirtschaftsinformatik Folie 20
Exkurs: XML-Namespaces Grundidee RDF: Unterschiedliche Institutionen können Metadaten für unterschiedliche Zwecke unabhängig vergeben RDF-Property-Types werden in XML zu Element-Namen Problem: was passiert, wenn 2 Institutionen den gleichen Namen für unterschiedliche Zwecke benutzen Lösung: Namensräume (engl.: namespaces), durch Vergabe eines Prefix werden Namen eindeutig: <rdf:rdf xmlns:rdf= http://w3.org/1999/02/22-rdf-syntax-ns# xmls:dc= http://purl.org/dc/elements/1.0/ >... </rdf:rdf> Abteilung für Wirtschaftsinformatik Folie 21
XML-Notation für RDF Verwendung des Vokabulars von Dublin Core (DC) Aus jeder Resource wird ein Element namens Description Der Name der Resource wird ein Attribut namens about Aus den Property-Types werden Elemente Abteilung für Wirtschaftsinformatik Folie 22
RDF-Modell mit XML-Notation <rdf:rdf xmlns:rdf= http://w3.org/1999/02/22-rdf-syntax-ns# xmls:dc= http://purl.org/dc/elements/1.0/ > <rdf:description about= page.html > <DC:Creator>Gustaf Neumann</DC:Creator> <DC:Title>My Homepage</DC:Title> </rdf:description> </rdf:rdf> Abteilung für Wirtschaftsinformatik Folie 23
RDF-Modell mit XML-Notation Verwendung des Dublin Core Vokabulars und eines weiteren RDF-Schemas namens BIB Abteilung für Wirtschaftsinformatik Folie 24
RDF-Modell mit XML-Notation <rdf:rdf xmlns:rdf= http://w3.org/1999/02/22-rdf-syntax-ns# xmlns:dc= http://purl.org/dc/elements/1.0/ xmlns:bib= http://person.org/bib-schema# > <rdf:description about= page.html > <DC:Creator> <rdf:description> <BIB:Name>Gustaf Neumann</BIB:Name> <BIB:Email>Gustaf.Neumann@wu-wien.ac.at</BIB:Email> </rdf:description> </DC:Creator> <DC:Title>Homepage of Gustaf</DC:Title> </rdf:description> </rdf:rdf> Abteilung für Wirtschaftsinformatik Folie 25
RDF-Schemata Zur Definition des gültigen Vokablulars in RDF Property-zentrierter Ansatz : Im Schema werden Property-Types definiert Jeder Property-Type wird durch domain (Welche Ressourcen können diese Property erhalten?) und range (Welche Werte kann diese Property annehmen`?) definiert. Beispiel: Definition des Property-Type PREIS domain : alle Katalogeinträge range : Geldbetrag Abteilung für Wirtschaftsinformatik Folie 26
RDF-Beispielsanwendung: DMOZ Open Directory Project, Web-Katalog ähnlich YAHOO: http://www.dmoz.org... <Topic r:id="top/arts"> <tag catid="2"/> <d:title>arts</d:title> <link r:resource="http://www3.bc.sympatico.ca/phillipshotglass/glasspage.html"/> </Topic> <ExternalPage r:about="http://www3.bc.sympatico.ca/phillipshotglass/glasspage.html"> <d:title>john phillips Blown glass</d:title> <d:description>a small display of glass by John Phillips</d:Description> </ExternalPage>... Abteilung für Wirtschaftsinformatik Folie 27
XML-Quellen im WWW PICS: http://w3.org/pics Internet Content Rating Association: http://www.icra.org RDF http://w3.org/rdf Zusätzlich: Wirtschaftsinformatik 1, 8. Auflage Abteilung für Wirtschaftsinformatik Folie 28