Anwendungsbeschreibung an einem Beispiel Im folgenden soll anhand einer Beispiel-URL die Arbeitsweise des Programmes erläutert werden und die Anwendung beschrieben werden. Als Anwendungsbeispiel soll die Web-Dokumentenstruktur dieser SWP Dokumentation bestimmt und visualisiert werden. Vorraussetzung ist die korrekte Installation des Java Runtime Environment (JRE). JWebToGML* Dieses Programm ermöglicht es, die Dokumentenstruktur von einer angegebenen URL zu erstellen. Zunächst wird JWebToGML gestartet. Das kann an der Eingabeaufforderung durch das Kommando java WebToGML.JWebToGML geschehen. (man muss ich im Wurzelverzeichnis der Installation befinden). Es erscheint die grafische Oberfläche des Programms (alternativ gibt es für Linux und Unix auch ein Startscript namens JWebToGML ). Im Feld URL die zu scannende URL eingetragen. Die Scantiefe kann ebenfalls noch modifiziert werden bzw. eine Einschränkung der zurückgelieferten Links durch Angabe eines regulären Ausdrucks gemacht werden. Subdomaindepth: Die Subdomaintiefe gibt an, wie oft der Subdomain beim Scannvorgang gewechselt werden darf. Domaindepth: Die Domaintiefe legt fest, wie oft der Domain beim Scannen gewechselt werden darf. Die Standardwerte für diese beiden Felder sind 0, das bedeutet, daß weder Domain noch Subdomain gewechselt wird beim Scannen. Der Scanvorgang beschränkt sich also nur auf den Server, der im URL Feld angegeben wurde. RegExp: Wird dieses Feld aktiviert, ist es möglich, einen regulären Ausdruck anzugeben um festzulegen, daß nur Seiten gescannt werden, die dem angegebenen regulären Ausdruck genügen. Der Ausdruck ist in Perl 5 Syntax anzugeben. Hier ist die genaue Syntax für RegExp nachzulesen. Hilfsweise kopiert der Button Copy die aktuelle URL in das RegExp Feld. Nach dem Anklicken des Start-Buttons wird der Scanvorgang gestartet. Dies kann bei großen Sites und/oder hohen Scantiefen länger dauern. In der Statuszeile werden die aktuell gescannten Seiten angezeigt und die entsprechenden Tiefen. Der Button Start wandelt sich während eines Scanvorgangs in einen Abbruch Button um, mit dem der aktuelle Scannvorgang abgebrochen werden kann. Die gescannten Links werden nach erfolgreichem Scanvorgang im unteren Bereich angezeigt (Bild 1).
Bild 1 - Scannvorgang fertig Nach Beendigung des Scanvorgangs (wird durch Status "Scanvorgang abgeschlossen" signalisiert) sollte nun die GML Datei erstellt werden. Ein Klick auf den Button make GML öffnet ein neues Dialogfenster. In der ersten Karteikarte Change Labels kann man einen Ausdruck in der URL durch einen anderen ersetzen, was nach dem Anklicken des Apply -Buttons sofort sichtbar wird. Der Button Reset setzt die Labels auf die Anfangswerte zurück. Diese Funktionen sind optional und müssen nicht angewandt werden. Es ist zu beachten, daß sich die Änderungen immer auf die aktuellen Labels auf der rechte Seite beziehen.
Dies ist wichtig zu wissen im Falle, daß man mehrere Ersetzungen vornehmen möchte (Bild 2). Bild 2 - Change Labels In der Options Karteikarte kann mittels Shape ausgewählt werden, welche Form die Knoten bekommen sollen. Label Position legt fest, wo die Bezeichnung des Knotens positioniert werden soll. Die Felder für das H-Spacing und V-Spacing geben an, wie groß der Abstand (horizontal bzw. vertikal) zwischen den Knoten sein soll. Bei sehr umfangreichen Seiten, wo viele Links enthalten sind (also wo auch viele Knoten im Graphen sein werden) ist es sinnvoll, die Abstände entsprechend zu vergrößern. Durch Orientation wird angegeben, in welche Richtung die Baumstruktur des Graphen gehen soll. Günstig ist hier der Wert down. (Bild 3)
Bild 3 - Options Die Karteikarte Save ermöglicht es, einen Namen für die zu schreibende GML Datei zu wählen. Nach einen Druck auf den Save-Button wird dann die GML Datei in das aktuelle Verzeichnis geschrieben. Nach diesem Schritt liegt nun eine GML Datei vor, die dieweb-dokumentenstruktur in Form eines Baumes enthält. Durch File --> Exit wird das Programm geschlossen. VGJ* Dieses Programm kann GML Dateien lesen und den Inhalt in Form eines Graphen visualisieren. VGJ steht für "Visualizing Graphs with Java" und beinhaltet eine Vielzahl von Möglichkeiten bei der Bearbeitung bzw. Erstellung von Graphen. Das Programm steht unter GPL und kann hier runtergeladen werden. Es ist zu beachten, daß wir das Programm jedoch für unsere Zwecke modifiziert bzw. erweitert. Als erstes ist die Mouse Action per default auf Select Nodes gesetzt. Weiterhin haben wir die Funktionalität (Get Node Attributes ) hinzugefügt, die es erlaubt Eigenschaften (linked from und linked to) zu den Knoten abzufragen, da dies bei einem Link sehr sinnvoll ist. Dazu aber später Genaueres. Diese modifizierte Version ist bereits in unserem Bundle enthalten. Gestartet kann VGJ mit dem Kommando java EDU.auburn.VGJ.VGJ werden, wenn man sich im
Wurzelverzeichnis der Installation befindet. (Für Linux und Unix steht wieder ein Startscript zur Verfügung: VGJ ). Nach dem Anklicken von Start a Graph Window wird das eigentliche VGJ Programm aufgerufen. Nun öffnet man die erstellte GML Datei (File --> Open (GML) ). Nach dem Laden der Datei wird die Web-Dokumentenstruktur im rechten Teil des Programmfensters sichtbar. Durch Drücken der Taste s vergößert sich die sichbare Fläche. Außerdem kann durch die Scrollbalken der Graph vollständig betrachtet werden. Wird nun ein Knoten mit der Maus angeklickt ist dieser markiert. Durch die Funktion (Get Note Attributes) im Menü Properties erscheint ein neues Fenster, welches nützliche Informationen zu dem ausgewählten Knoten anzeigt. Label ist der Name des Knotens. Linked to gibt an, auf welche Knoten (Links) der aktuelle Knoten verweißt. Linked from dagegen informiert, welche Seiten auf den aktuellen Link zeigen. Durch Auswählen eines anderen Knotens ändert sich sofort das Informationsfenster. (Bild 4) VGJ bietet noch eine Vielzahl von Bearbeitungsmöglichkeiten des Graphen, auf die hier nicht eingegangen werden soll, da sie für die Lösung unserer Aufgabe irrelevant sind. Durch File --> Exit This Window und weiteres Anklicken des Exit Buttons wird das VGJ Programm beendet.
Bild 4 - Visualisierung mit VGJ * VGJ and JWebToGML may be distributed under the terms of the GNU General Public License, Version 2.