Netzliteratur authentisch archivieren und verfügbar machen Stephanie Kuch, M.A. Die Archivierung des Web als Mittel des digitalen Bestandsaufbaus: Eine Standortbestimmung, Workshop der Bayerischen Staatsbibliothek am 10.03.2016
DLA Marbach Campus
Sammelkriterien DLA (allgemein) Primärliteratur 1. neuere (= seit ca. 1750) 2. deutsche (= deutsprachige) 3. Literatur (= Schöne Literatur: Lyrik, Dramatik, Epik)
Auswahl Literatur im Netz - Neue deutsche Literatur (Primärtexte) - Born digital - Öffentliche Verfügbarkeit - Referenz und Rezeption - Exemplarische Vertreter der einzelnen literarischtechnischen Formen und zeitlichen Abschnitte - Keine reinen Werbe-Auftritte
Übersicht Geschäftsgang Akzession Katalogisierung Archivierung Bearbeitung in GiNFix Sichtung des Angebots Ablage (Bookmarks und opmls) und Auswahl Rechteeinholung Katalogisierung (Kallías, ZDB und SWB) Upload Metadaten nach SWBcontent Spiegelung in SWBcontent inkl. Erzeugung der URN Prüfung der Vollständigkeit und der Darstellung Dokumentation und Fehleranalyse Rückmeldung und Nachtrag ZDB: URN SWB: via ZDB Kallías: URN, Verfügbarkeitsdaten, Erscheinungszeitraum
Rechtliche Aspekte
Ingest 1. Kurze Vorabanalyse der Quelle mit ArchiveReady 2. SWBcontent: Formulierung der Crawl-Bedingungen 3. SWBcontent: Crawl mit Heritrix 4. SWBcontent: Rechteverwaltung 5. Qualitätskontrolle
ArchiveReady - Analyse einer Ressource im Netz
Literatur im Netz - 57 Netzliteratur - 277 Blogs - 72 Zeitschriften - 2,7 TB Speicherplatz
Das Projekt Zahlen, Daten, Fakten - Aufbau eines Quellenkorpus für die seit den 90er Jahren entstehende Literaturgattung "Netzliteratur" - deutschsprachige Netzliteratur - DFG-finanziert - Laufzeit: 3 Jahre - 50 Publikationen
Projekt: Ziele - Archivierung der Werke - Beschreibung/Erschließung/Verfügbarmachung - Tools und Methoden entwickeln & in den bestehenden Workflow integrieren
Literatur im Netz und Netzliteratur - Künstlerischer Umgang mit natürlicher Sprache im elektronischen Raum Blogs Stochastische Texte... aber: Netztechniken werden für die Gestaltung verwendet Gestaltung ist elementar Kein Medienwechsel möglich
Probleme bei der Spiegelung - Inhalte, die auf externen Diensten basieren (z.b. Google Maps) - Deep Web - Links in Javascript, etc. werden u.u. nicht extrahiert und somit auch nicht gespiegelt
Probleme bei der Wiedergabe - Authentizität - Wiedergabe von browser-spezifischen Werken - Geschwindigkeit: alte vs neue Hard- und Software
Authentizität? - Wiedergabe unabhängig von der Hard- und Software
Archivierung & Dokumentation - Spiegelung - Screenshot - Screencast - Archivierung der Quelltexte
Screenshot - zwei Ausführungen - mind. 1 Screenshot pro Werk Dokumentation des Erscheinungsbildes
Screencast - Abfilmen des Bildschirms - evtl. Erstellung eines Drehbuchs => Dokumentation der Interaktivität
Werke: Endlose Liebe
Handlungsstränge - pro Akt ca. 30 45 min Videomaterial
Archivierung der Quelltexte - Kooperation mit Autoren - Beschreibung in einer structmd
Metadaten-Modell - Zusammenarbeit mit dem BSZ - Anwendung verschiedener Schemata METS (Container) MODS (bibliographisch, rechtlich) PREMIS (technisch) - veröffentlicht unter: https://wwik-prod.dlamarbach.de/line/index.php/projektpapiere
Technische Metadaten - Beschreibung der benötigten Hard- und Software Grundlage: PRONOM, National Software Reference Library
Archivformat BagIt
Darstellung: Anpassung SWBcontent
Eigenschaften der Methoden Crawl Kopie der Publikation u.u. nicht vollständig Wiedergabe u.u. nicht authentisch Screencast Dokumentation der Publikation keine Interaktion Speicherplatz Sourcecode Archivierung == Publikation keine Verfügbarmachung
Danke für die Aufmerksamkeit! Weitere Informationen: https://wwik-prod.dla-marbach.de/line Kontakt: kuch @ dla-marbach.de