Langzeitarchivierung von Biodiversitätsdaten Eine besondere Anforderung an die Bioinformatik Michael Türkay Forschungsinstitut Senckenberg Frankfurt a. M.
Naturkundliche Museen archivieren Objekte in Sammlungen Naturkundliche Sammlungen sind! Archive für das Vorkommen von Organismen an einem bestimmten Ort zu einer bestimmten Zeit! Archive für wissenschaftliche Konzepte und Theorien zu einem bestimmten Zeitpunkt! Materielle Grundlage für die Vergleichbarkeit Von Aussagen auf allen Gebieten der organismischen Biologie
Beziehung Art versus Objekt " Die Beziehung zwischen Arten, Namen und Daten herzustellen, ist Aufgabe der Taxonomie " M. a. W.: Taxonomie ist die Wissenschaft von der Klassifikation von Naturobjekten In der Natur gibt es als faßbare Objekte nur Individuen Jede Artumgrenzung ist die Behauptung, daß die in der Teilmenge enthaltenen Objekte nach den Artkriterien zusammengehören Taxonomie ist somit nicht eine Registratur sondern eine wissenschaftliche Entscheidung auf deren Basis Klassenbildungen vorgenommen werden. Sie erzeugt Taxa, die wissenschaftlichen Konzepten entsprechen
Organismische Biologie Taxon Determination Name Determination Objekt n:1 n:1 Assoziierte Daten Objektdaten " Taxon-assoziierte Daten sind nur dann vergleichbar, wenn sie sich auf dasselbe Taxon beziehen " Identität wird über den identischen Namen formal sichergestellt " Die Behauptung allgemeiner Prinzipien ist identisch mit der Aussage, daß sie für alle Taxa gelten
Dokumentation und Archivierung assoziierter Informationen
Dokumentation und Archivierung assoziierter Informationen X Kataloge und Karteien werden zu historischen Dokumenten Datenhaltung in Datenbanken
Biodiversitätsinformatik 1:1 1:n 1:1 Taxonbasierte Datenbank Objektbasierte Datenbank
Datenumfang SeSam (= Senckenbergisches Datenmanagement-System) www.senckenberg.de/sesam/ " 25.000 Objekte belegen mit reinen Textinformationen 150 MB " 20 Mio Objekte werden entsprechend etwa 120 GB belegen " 80 Mio Objekte in ganz Deutschland entsprechen etwa 480 GB Bei Bildern von Objekten, die in der Datenbank gespeichert werden (ca. 100 KB/Bild) steigen die Datenmengen für ganz Deutschland leicht in den Terabyte- Bereich
Datenarten Objektassoziierte Daten: Beschreibende Textdaten (Datenbankfelder) Bilder des Objektes Bilder der Originaletiketten Stimmen und Laute Videodateien Literatur zum Objekt Taxonassoziierte Daten: 1. Determinierte Bilder von Organismen 2. Lebensraumbilder 3. Tierstimmen 4. Videodateien 5. Literatur zum Taxon
Archivierungsarten Datenart Archivierung Textdaten In Datenbank, Sicherung auf Band Bilddaten Thumbs in Datenbank, voll aufgelöste Bilder auf CD/DVD Stimmen In Datenbank, Sicherung auf Band Videosequenzen Auf CD/DVD
Innenarchive und Aussenvernetzung WWW GBIF-Portal Biodiv_DB Bibliotheken Geographische Archive
Anforderungen für die Zukunft " Biodiversitätsdatenbanken nachhaltig sichern und vernetzen " Sicherungsstrategien für Bild- und Videoarchive entwickeln " Bild- und Videodaten nachhaltig sichern " Strategien zur Pflege verteilter und redundanter Archive entwickeln " Nationale und internationale Vernetzung vorantreiben