Enterprise Content Management Dr.-Ing. Raymond Bimazubute Lehrstuhl für Künstliche Intelligenz Friedrich Alexander Universität Erlangen-Nürnberg Email: raymond.bimazubute@informatik.uni-erlangen.de
Vorbemerkungen Homepage der Vorlesung http://www8.informatik.uni-erlangen.de/immd8 /Lectures/ECM/ Folienkopien als PDF-Dateien Vorlesung Blockveranstaltung: Jede 2. Woche von 08:30-12:00 Scheinerwerb möglich 2
Gliederung Einführung und Begriffsbestimmung Dokumentenmanagement Groupware und Workflow Web Content Management Basistechnologien im ECM XML XSL Web Services 3
Motivation Wachsende Informationsmenge in Unternehmen (Fileserver, Datenbanken, Mail Server) Heterogene Dokumentformate und Repositories Notwendigkeit einer integrierten Architektur zur Verwaltung der anfallenden Informationen 4
Erwartetes Datenvolumen in Intranets Angaben in Terrabytes 5
Einführung Was ist Enterprise Content Management? Enterprise Content Management umfasst Technologien zur Erfassung, Verwaltung, Speicherung, Bewahrung und Bereitstellung von Dokumenten und Content zur Unterstützung von organisatorischen Prozessen (Quelle: AIIM International) 6
Was ist ein Dokument? Klassische Sicht: Urkunde, Schriftstück, das Informationen festhält (Liegt in Papierform vor!) Ist eine Word-Datei ein Dokument? Ist eine Website ein Dokument? Funktionale Sicht: Eine in sich geschlossene Inhaltsmenge (.) es ist persistent (dauerhaft) und hat statischen Charakter (ändert sich nicht nach Fertigstellung) Ist eine dynamische Website ein Dokument? Nach ISO 8613: Eine strukturierte Menge von Informationen, die zur Wahrnehmung durch den Menschen bestimmt ist und als Einheit zwischen Systemen und/oder Benutzern ausgetauscht werden kann 7
Dokumente Bestandteile: Inhalt Struktur Layout Metadaten Aspekte: Kodierung (Syntax) Semantik Darstellung Speicherung Zugriff Transport Modellierung 8
Merkmale von Dokumenten (Metadaten) Physische Eigenschaften (Papier, Datei) Formale Eigenschaften (Aufbau, Gestaltung) Ordnung (fachliche Zugehörigkeit, Reihenfolge, Version) Inhalt (inhaltlicher Bezug) Charakter (archivwürdig, Rechtscharakter, Bearbeitungsmöglichkeiten) Zeit (Erfassungsdatum, Verfallsdatum, letzte Nutzung) Erzeuger (Absender, Ersteller) Nutzer (Empfänger, Bearbeiter, Leser) 9
Dokumente - Inhalt NCI-Dokumente (Non coded information): Dokumente deren Inhalt nicht verarbeitet werden kann CI-Dokumente (Coded information): Dokumente, die mit Hilfe einer Anwendung elektronisch erzeugt oder eines geeigneten Verfahrens aus NCI-Dokumenten umgewandelt wurden 10
Dokumente: Einteilung nach Zweck Informationsdokumente: Manuale, Produktkataloge, technische Dokumente, Bücher, Kommunikationsdokumente: Belege, emails etc. genutzt in Groupware-Tools Nachweisdokumente: Nachweis einer Tatsache (z.b. Rechnungen, Verträge, Untersuchungsberichte) Dokumentation: Zusammenstellung von Dokumenten zu einem bestimmten Sachverhalt (z.b. medizinische Dokumentation, Software-Dokumentation) 11
Was ist Content? Information in strukturierter, schwach strukturierter und in unstrukturierter Form, die in elektronischen Systemen zur Nutzung bereitgestellt wird Strukturierter Content sind Daten, die in einem standardisierten Layout aus datenbankgestützten Systemen bereitgestellt werden (z.b. formatierte Datensätze aus einer Datenbank) Schwach strukturierter Content sind Informationen und Dokumente, die zum Teil Layout und Meta-Daten mit sich tragen, jedoch nicht standardisiert sind (z.b. Textverarbeitungsdateien) Unstrukturierter Content besteht aus beliebigen Informationsobjekten, deren Inhalt nicht direkt erschlossen werden kann und die nicht eine Trennung von Inhalt, Layout und Metadaten besitzen (Bilder, GIFs, Video, Sprache, Faksimiles etc.) 12
Teilgebiete des ECM Input Management Dokumentenmanagement Groupware Workflow (Business Process Management BPM) Web Content Management Records Management (elektronische Archivierung) 13