Dokumenten- und Content Management 1 Dokumentenbeschreibung...2 1.1 SGML...2 1.2 HTML...3 1.3 XML...3 1.4 XML-Anwendungen...6 1.5 Datenaustausch mit XML...6 2 Content-Management...7 2.1 Medienprodukte...7 2.2 Content Life Cycle...9 2.3 Content-Management-Systeme...10 3 Dokumenten-Management-Systeme (DMS)...12 3.1 Dokumentenretrieval...13 Seite 1 von 14
1 Dokumentenbeschreibung Ein Dokument bildet eine Einheit aus Inhalt, Struktur und Layout. Der Inhalt enthält die Daten, bzw. die zu vermittelnden Informationen, die Struktur spiegelt den Aufbau wieder und das Layout dient der Visualisierung der strukturierten Informationen. 1.1 SGML Es handelt sich bei SGML (structured generalized markup language) um einen ISO-Standard zur strukturierten Beschreibung von Daten. Bestehend aus SGML Declaration Document Type Definition (DTD) Document Instance Seite 2 von 14
1.2 HTML Auf SGML basierende Seitenbeschreibungssprache zur Erstellung von Hypertextdokumenten mit vorgegebenen, einfachen Formatierungsmöglichkeiten. 1.3 XML Extensible Markup Language (XML) ist eine Teilmenge von GML. Speziell im Internet findet XML Anwendung und wurde entwickelt, um reich strukturierte Elemente im Web zu verwenden. Wichtige Deklarationen innerhalb der XML-DTD sind: Elementtypdeklaration Entitydeklaration Weitere wichtige Eigenschaft: Wohlgeformt Ein Dokument besteht aus Zeichenketten Tags Processing Instructions DTD Entity References Comments XML-Schemata sind eine alternative Methode zur Definition von XML-Sprachen. Seite 3 von 14
Beispiel: Seite 4 von 14
XML-Schema- Definition zur DTD "cdsammlung" XML-Schema- Definition zur DTD "cdsammlung" Seite 5 von 14
1.4 XML-Anwendungen Weitere XML-Anwendungen sind: XHTML NewsML VoxML SMIL 1.5 Datenaustausch mit XML XML hat sich ebenfalls für die Definition von Sprachen etabliert, um den unternehmensübergreifenden Datenaustausch zu unterstützen. Dazu müssen sich Unternehmen im Vorfeld das Datenaustausches auf eine gemeinsame XML-DTD einigen. Seite 6 von 14
Unternehmen A Daten Internet Unternehmen B Daten 1 XML- Dokument 5 XML-Exportfilter 3 XML-Importfilter 2 DTD- Server 4 Datenaustauschprozess 2 Content-Management 2.1 Medienprodukte Unter Content sind die redaktionell erzeugten oder ausgewählten Informationselemente zu verstehen. Mehrere Informationselemente werden zu logischen Einheiten gebündelt (Medienprodukt) Strukturinformationen beschreiben den Aufbau des Dokuments Seite 7 von 14
Layoutinformationen beschreiben, wie der Inhalt im Medienprodukt dargestellt wird Struktur von Medienprodukten Seite 8 von 14
2.2 Content Life Cycle Content Life Cycle ist ein Referenzmodell für das Content Management: Planung Interner Bereich Recherche Erstellung Zusammenfassung Prüfung Archivierung XOR Externer Bereich Freigabe Content Life Cycle Das Modell trifft einige vereinfachende Annahmen: Die Inhalte werden redaktionell zusammengestellt Die Inhalte werden selbst erzeugt Alle Inhalte durchlaufen den gleichen Zyklus Die Prüfung der Inhalte ist einstufig Es existieren verschiedene Vorgehensweisen: Layoutorientierte Vorgehensweise Contentorientierte Vorgehensweise Seite 9 von 14
Erstellungsprozess von Medienprodukten 2.3 Content-Management-Systeme Content Management Systeme (CMS) sind IV-Systeme zur Unterstützung des Content-Managements. Sie bieten sowohl Funktionalitäten für dispositive Aufgaben, als auch für operative Aktivitäten und unterstützende Tätigkeiten. Ziele bei dem Einsatz von CMS sind Kostenersparnis und Qualitätssteigerung. Eine der wichtigsten Aufgaben eines CMS ist das Speichern von Inhalten, Metadaten und Steuerungsinformationen. Das CMS Verwaltet Benutzer und Zugriffsrechte Aktualisiert die inhaltliche Planung Seite 10 von 14
Bündelt Informationselemente über mehrere Stufen Übernimmt Korrekturfunktionen Usw. Bei der Architektur lässt sich wie folgt unterscheiden: Hauptkomponenten eines CMS Editorial System: umfasst Werkzeuge zur Erzeugung und Bearbeitung sowie zur Verwaltung Das Content Repository umfasst drei Aspekte: Trennung von Form und Inhalt Abbildung von Makro- und Mikrostrukturen Einbindung dynamischer Informationsarten Die Funktionen des Publishing Systems sind stark vom Zielmedium abhängig. Seite 11 von 14
Template- Mechanismus Statische und dynamische Erzeugung von HTML-Seiten 3 Dokumenten-Management-Systeme (DMS) Seite 12 von 14
Unter DMS versteht man IV-Systeme zur strukturierten Erzeugung, Ablage, Verwaltung und Widerverwendung von elektronischen Dokumenten. Auf Grund des Speichervolumens kommen vorwiegend optische Speichermedien zum Einsatz. Zum Wiederfinden von Dokumenten werden Indizes verwendet: Direkte Indexierung Scanning Inhaltliche Erkennung Zwischenablage Indexierung Speicherung Sachbearbeitung Indirekte Indexierung Scanning Inhaltliche Erkennung Zwischenablage Sachbearbeitung Indexierung Speicherung Direkte- und indirekte Indexierung 3.1 Dokumentenretrieval Das Problem der Dokumentenbeschaffung liegt in erster Linie im Auffinden der entsprechenden Daten. Somit werden Suchverfahren eingesetzt, die möglichst exakte Ergebnisse in angemessener Zeit liefern. Relevant für die Güte eines Suchergebnisses sind: Precision Recall Das Ziel besteht in der Maximierung beider Werte. Weitere Unterteile des Dokumentenretrievals sind Textretrieval, Bildretrieval, Audioretrieval und Videoretrieval. Seite 13 von 14
4 Literatur Bodendorf, F. 2003 /Daten- und Wissensmanagement / Heidelberg 2003 Alle Abbildungen sind aus diesem Buch. Seite 14 von 14