Dokumente mit WWW-Verweisen auf Dokumente der Digital Document Library (DDL) in Bern Gerd Graßhoff Bern Inhaltsverzeichnis 1 Ziel 1 2 Technische Realisierung 4 3 Digital Document Library for the History and Philosophy of Science at Bern 4 4 Referenz auf nicht-skalierbare Bilder 4 4.1 Navigation............................................... 4 4.2 L A TEX spezifische Angaben zur Nutzung der DDL......................... 5 4.2.1 Referenz auf eine Seite.................................... 5 4.2.2 Referenz auf eine Seite mit Markierung.......................... 5 5 Referenz auf skalierbare Seiten 5 5.0.3 Referenz auf eine Seite.................................... 5 1 Ziel Mit der Digital Document Library wird das Ziel verfolgt, ein nachhaltiges Archiv von digitalen Dokumenten aufzubauen und verschiedene Mittel bereitzustellen, um auf diese Dokumente dauerhaft zugreifen zu können. Die Quellen sind sehr unterschiedlich und werden mit teilweise sehr verschiedenen Digitalisierungstechniken erstellt: Fotokopien von publizierten Dokumenten in schwarzweiß Scans von Dokumenten in Graustufen Scans von Mikrofilmen in Graustufen Scans von Dias in Farbe Der Nutzer soll auf diese Quellen in sehr verschiedener Qualität mit unterschiedlichen Dateigrößen mit der gleichen Benutzeroberfläche zugreifen können. Es soll keinen Unterschied machen, auf welche Weise seine Dokumente digitalisiert worden sind. Für die technische Realisierung der Digital Document Library stellt das eine große technische Herausforderung dar. Grundsätzlich wird der Ansatz verfolgt, die digitalisierten Dokumente auf der Seite des Dokumenten Servers so aufzubereiten, daß sie für den WWW Browser des Benutzers entsprechend umgerechnet werden. Sehr große Dateien wie beispielsweise hochauflösenden Scans von Dias in Farbe werden bei jeder Abfrage eines Benutzers für die Auflösung umgerechnet, mit der er sie betrachten möchte. Möchte der Benutzer an einer bestimmten Stelle das Bildes in einem höher aufgelösten Teilausschnitt betrachten, sendet das Programm einen Befehl an das Programm des Servers, das den entsprechenden Ausschnitt aus dem sehr hoch aufgelöst Bildes herauskopiert und in der für den 1
Benutzer sinnvollen Auflösung umrechnet und verschickt. Auf diese Weise gelingt es, einerseits die Größe der über das WWW verschickten Dateien stark zu begrenzen. Andererseits sind für die Betrachtung der Dokumente die technischen Anforderungen auf Seiten des Betrachters sehr gering. Es reicht ein Standard Browser auf durchschnittlich leistungsfähigen Computern, um die Bilder mit großer Effizienz abzufragen und zu betrachten. Neben dem Aspekt der Bereitstellung von Daten verfolgt die Digital Document Library noch ein weiteres Ziel. Es soll auf vielfältige Weise möglich sein, auf einzelne digitale Dokumente von anderen Dokumenten und Programmen aus zuzugreifen. Hauptsächlich erfolgt das dadurch, daß in diesen Dokumenten oder Programmen auf den Dokument Server ein link mit einer Angabe zu der betreffenden Seiten und möglicherweise auf bestimmte Stellen dieser Seite angegeben ist. Diese Anfragen über Internet werden von dem Document beantwortet, indem er eine Internetseite on the fly generiert, in der die gewünschten Dokumente erscheinen. 2 Technische Realisierung Dieses erste Beispiel zeigt, auf welche Weise man mit L A TEX-Dokumenten Verweise auf Digitale Bilder geben kann. Die Verweise in PDF-Dateien als Link eingetragen, z.b. durch die Erstellung der PDF-Dateien mit dem Textsatzsystem L A TEX. Startet man den Link, wird ein Kommando an die Digital Document Library geschickt. Dort sucht ein Programm aus der Datenbank die Informationen über das Dokument heraus. Danach wird die Seite aus dem Digital Document Library extrahiert und an den WWW-Browser geschickt. Dieses alles geschieht auf einem Hochleistungsserver, auf dem mittlerweile mehr als 400 000 Seiten abgespeichert sind. Die digitalen Bilder werden für die Anforderungen des Betrachters on-the-fly umgewandelt, mit Navigationsknöpfen versehen und anschließend an den Betrachter übermittelt. 3 Digital Document Library for the History and Philosophy of Science at Bern Neben dem Java basierten ImageViewer der Digital Document Library gibt es jetzt eine Version, bei der alle Bearbeitungen des Katalogs und der Bilder auf der Basis von JAVA auf der Seite der Server erfolgt und die Ergebnisse der Bearbeitungen mittels üblicher WWW-Browser und Javascript betrachtet werden können. Der derzeitige Vorteil ist die hohe Geschwindigkeit, mit der die Dokumente auf der Seite der Clients betrachtet werden können. Die Digital Library Dieser Link wurde erzeugt mit: \href{http://penelope.unibe.ch/docuserver/digitallibrary/frame.htm}{die \textsc{digital Library}} 4 Referenz auf nicht-skalierbare Bilder 4.1 Navigation Vor Beginn der Graphik sind Navigationsknöpfe eingefügt. Sie haben die Funktionen: back Springt zum vorherigen digitalen Bild. Sollte die Seite nicht existieren, erscheint eine Fehlermeldung. next Springt zum nächsten digitalen Bild. Sollte die Seite nicht existieren, erscheint eine Fehlermeldung. ref Dieser Knopf ruft ein neues Fenster auf, in dem blau markiert der Textaufruf für den Verweis auf diese Seite in L A TEXangegeben ist. Der Text ist bereits markiert und kann mit CNTL-C kopiert werden und 2
Abbildung 1: Einstiegsseite der Digital Document Library 3
Abbildung 2: Einstiegsseite der Digital Document Library 4
anschließend gleich mit CNTL-V im Fenster des Text-Editors an die Stelle kopiert werden, wo der Link erscheinen soll. Der zweite Parameter ist obligatorisch mit TEXT besetzt und sollte durch den Benutzer ersetzt werden. page Ein kleines Fenster erscheint, in dem die Nummer der digitalisierten Seite des gleichen Dokuments angegeben werden kann, zu der der nächste Aufruf springen soll. mark Setzt eine Marke auf das digitale Bild und gibt einen LaTeX-Hyperref-Link aus. Dieser kann in einen Text eingesetzt werden und zeigt dann die Seite mit der Markierung an. Die Information über die Lage der Markierung ist ausschließlich im Link enthalten und bleibt deshalb im link der aufrufenden Dokumente oder Datenbanken bestehen, ohne externe Datenbanken zu belasten. 4.2 L A TEX spezifische Angaben zur Nutzung der DDL 4.2.1 Referenz auf eine Seite Das L A TEX Dokument nutzt für die Verwendung von Hyperlinks das Paket hyperref, das z.b. wie folgt in die Präambel des L A TEX Dokuments aufgerufen wird. \usepackage[pagebackref]{hyperref} Damit steht im weiteren insbesondere der Befehl \href{#1}{#2} zur Verfügung. Der erste Parameter enthält die URL auf die Digitale Bibliothek, der zweite enthält den Text, der im L A TEX Dokument farbig erscheint. Klickt man im PDF-Dokument auf diesen Text, startet der Dokument Server den Aufruf des Dokuments. \href{http://penelope.unibe.ch/docuserver/digitallibrary/digilib.jsp?/histgeo/wegener.1912+bilder+9} {Das 9. digitalisierte Bild von der ersten Veröffentlichung von Wegener 1912} Dieser Aufruf enthält eine http Referenz auf das Programm der Digitalen Bibliothek, das mit Parametern nach dem Fragezeichen das gesuchte Dokument ermittelt und an den Web-Browser übermittelt. Von L A TEXumgesetzt erscheint der obige Befehl farbig hervorgehoben: Das 9. digitalisierte Bild von der ersten Veröffentlichung von Wegener 1912 4.2.2 Referenz auf eine Seite mit Markierung Mit einem Link wie Markierungsbeispiel: Achten Sie auf den roten Punkt! können sie bestimmte Stellen eines digitalen Dokuments markieren. Wenn ein Dokument die Markierungsinformation enthält, kann jeder über das Internet diese Information abfragen, ohne daß auf Datenbanken zugegriffen werden muß. 5 Referenz auf skalierbare Seiten 5.0.3 Referenz auf eine Seite Erste Seite eines Graustufenbildes eines mittelalterlichen Manuskripts \href{http://penelope.unibe.ch/docuserver/digitallibrary/digilib.jsp?histast/eastwood-collection/ha+east Seite eines Graustufenbildes eines mittelalterlichen Manuskripts} 5