KoGIs Kompetenzzentrum für die Gestaltung der Informationssysteme. Logfile Analyse eines Webauftritts



Ähnliche Dokumente
Die Statistiken von SiMedia

Aufklappelemente anlegen

Favoriten sichern. Sichern der eigenen Favoriten aus dem Webbrowser. zur Verfügung gestellt durch: ZID Dezentrale Systeme.

Suche schlecht beschriftete Bilder mit Eigenen Abfragen

Seite 1 von 14. Cookie-Einstellungen verschiedener Browser

Universal Dashboard auf ewon Alarmübersicht auf ewon eigener HTML Seite.

Anleitungen zum Publizieren Ihrer Homepage

Step by Step Webserver unter Windows Server von Christian Bartl

Installation von Wordpress

Outlook 2000 Thema - Archivierung

Webalizer HOWTO. Stand:

Einfügen von Bildern innerhalb eines Beitrages

Netzwerk einrichten unter Windows

KURZANLEITUNG CLOUD OBJECT STORAGE

SICHERN DER FAVORITEN

Einstellungen im Internet-Explorer (IE) (Stand 11/2013) für die Arbeit mit IOS2000 und DIALOG

Outlook Web App 2010 Kurzanleitung

Novell Client. Anleitung. zur Verfügung gestellt durch: ZID Dezentrale Systeme. Februar ZID Dezentrale Systeme

Mit der Maus im Menü links auf den Menüpunkt 'Seiten' gehen und auf 'Erstellen klicken.

Anleitung mtan (SMS-Authentisierung) mit SSLVPN.TG.CH

Einrichten eines Postfachs mit Outlook Express / Outlook bis Version 2000

Musterlösung für Schulen in Baden-Württemberg. Windows Basiskurs Windows-Musterlösung. Version 3. Stand:

Durchführung der Datenübernahme nach Reisekosten 2011

Handbuch ECDL 2003 Professional Modul 3: Kommunikation Postfach aufräumen und archivieren

Er musste so eingerichtet werden, dass das D-Laufwerk auf das E-Laufwerk gespiegelt

2. Word-Dokumente verwalten

Anleitung für den Zugriff auf Mitgliederdateien der AG-KiM

ÖKB Steiermark Schulungsunterlagen

Daten werden auf dem eigenen Server gespeichert (datenschutzkonform)

AWSTATS Statistik benutzen und verstehen

.htaccess HOWTO. zum Schutz von Dateien und Verzeichnissen mittels Passwortabfrage

Ihr CMS für die eigene Facebook Page - 1

Übersicht Die Übersicht zeigt die Zusammenfassung der wichtigsten Daten.

ecall sms & fax-portal

Einrichten eines POP-Mailkontos unter Thunderbird Mail DE:

Persönliches Adressbuch

BAYERISCHES STAATSMINISTERIUM DES INNERN

FTP-Leitfaden RZ. Benutzerleitfaden

Adminer: Installationsanleitung

2.1 Grundlagen: Anmelden am TYPO3-Backend

Einkaufslisten verwalten. Tipps & Tricks

2. Einrichtung der ODBC-Schnittstelle aus orgamax (für 32-bit-Anwendungen)

Einrichtung -Account

Artikel Schnittstelle über CSV

Die Dateiablage Der Weg zur Dateiablage

Ihre Interessentendatensätze bei inobroker. 1. Interessentendatensätze

Guide DynDNS und Portforwarding

Einrichtung des Cisco VPN Clients (IPSEC) in Windows7

So richten Sie Ihr Postfach im Mail-Programm Apple Mail ein:

SafeRun-Modus: Die Sichere Umgebung für die Ausführung von Programmen

Ablaufbeschreibung für das neu Aufsetzen von Firebird und Interbase Datenbanken mit der IBOConsole

Webhost Unix Statistik

Import, Export und Löschung von Zertifikaten mit dem Microsoft Internet Explorer

FTP-Server einrichten mit automatischem Datenupload für

Neue Steuererklärung 2013 erstellen

VERWALTUNG. Postfächer, Autoresponder, Weiterleitungen, Aliases. Bachstraße 47, 3580 Mödring

Facebook I-Frame Tabs mit Papoo Plugin erstellen und verwalten

Ihr Benutzerhandbuch für das IntelliWebs - Redaktionssystem

Dateimanagement in Moodle Eine Schritt-für

ARAkoll 2013 Dokumentation. Datum:

Stundenerfassung Version 1.8 Anleitung Arbeiten mit Replikaten

In diesem Tutorial lernen Sie, wie Sie einen Termin erfassen und verschiedene Einstellungen zu einem Termin vornehmen können.

Handbuch ECDL 2003 Professional Modul 2: Tabellenkalkulation Vorlagen benutzen und ändern

Cookies. Krishna Tateneni Jost Schenck Übersetzer: Jürgen Nagel

Tutorial: Wie kann ich Dokumente verwalten?

Stammdatenanlage über den Einrichtungsassistenten

Installation des Zertifikats. Installationsanleitung für Zertifikate zur Nutzung des ISBJ Trägerportals

H A N D B U C H FILEZILLA. World4You Internet Service GmbH. Hafenstrasse 47-51, A-4020 Linz office@world4you.com

Kurzanleitung fu r Clubbeauftragte zur Pflege der Mitgliederdaten im Mitgliederbereich


Installationsanweisung Gruppenzertifikat

Leitfaden zur ersten Nutzung der R FOM Portable-Version für Windows (Version 1.0)

Erste Hilfe. «/IE Cache & Cookies» Logout, alte Seiten erscheinen, Erfasstes verschwindet?

Android VHS - Weiterbildungskurs Ort: Sulingen

Diese Anleitung beschreibt das Vorgehen mit dem Browser Internet Explorer. Das Herunterladen des Programms funktioniert in anderen Browsern ähnlich.

PayPal API Zugang aktivieren und nutzen Version / Datum V 1.5 / a) Aktivierung auf der PayPal Internetseite. 1 von 7

Anleitung ftp-zugang Horn Druck & Verlag GmbH Bruchsal

INSTALLATION VON INSTANTRAILS 1.7

ICS-Addin. Benutzerhandbuch. Version: 1.0

Installation KVV Webservices

Es gibt einige Kardinalstellen, an denen sich auf der Festplatte Müll ansammelt: Um einen Großteil davon zu bereinigen.

SANDBOXIE konfigurieren

Urlaubsregel in David

Kleines Handbuch zur Fotogalerie der Pixel AG

RightsLink der Frankfurter Buchmesse Dokumentation

Über die Internetseite Hier werden unter Download/aktuelle Versionen die verschiedenen Module als zip-dateien bereitgestellt.

DFÜ-Netzwerk öffnen Neue Verbindung herstellen Rufnummer einstellen bundesweit gültige Zugangsnummer Benutzererkennung und Passwort

Startmenü So einfach richten Sie surfen manuell auf Ihrem PC oder Notebook ein, wenn Sie Windows XP verwenden.

PK-Website: Besuche & Seitenaufrufe 2010 und 2011

Neue Schriftarten installieren

Clientkonfiguration für Hosted Exchange 2010

Handbuch zum besseren Verständnis des Webalizers Kurzanleitung

Überprüfung der digital signierten E-Rechnung

Dokumentation zum Spielserver der Software Challenge

Anton Ochsenkühn. amac BUCH VERLAG. Ecxel für Mac. amac-buch Verlag

Handbuch zur Anlage von Turnieren auf der NÖEV-Homepage

Anleitung zum Prüfen von WebDAV

Speichern. Speichern unter

Transkript:

KoGIs Kompetenzzentrum für die Gestaltung der Informationssysteme Logfile Analyse eines Webauftritts Stand: 13.07.2009

Inhaltsverzeichnis 1 Einleitung... 4 2 Technische Grundlagen... 5 2.1 Logfiles... 5 2.2 Session IDs... 6 2.3 Cookies... 6 2.4 Web Bugs... 6 2.5 Technische Datenauswertung... 6 2.6 Inhaltliche Datenauswertung... 6 2.6.1 Treffer bzw. Hit...6 2.6.2 Seitenaufruf bzw. Pageimpressions... 7 2.6.3 Besuch bzw. Visit... 7 2.6.4 Referrer... 8 2.6.5 Suchmaschinen... 8 2.6.6 Browseranalyse... 8 2.6.7 Navigationspfade... 8 2.6.8 Ein und Ausstiegsseiten... 8 2.6.9 Transfer... 9 2.6.10 Fehlertypen...9 2.6.11 Besuchszeiten... 10 2.6.12 IP Nummern... 10 3 Der Auswertungsprozess... 11 3.1 Probleme bei der Analyse... 11 3.2 Durchführung der Analyse... 11 3.2.1 Herunterladen der Logfiles... 12 3.2.2 Entpacken und Zusammenstellen der Logfiles... 13 3.2.3 Konfiguration von Weblog Expert Professional... 16 3.2.4 Auswertung erstellen und starten... 23 4 Interpretation der Ergebnisse... 26 4.1 Allgemeine Statistik... 26 4.2 Aktivitätsstatistik...27 4.2.1 Tägliche Zugriffe... 27 4.2.2 Nach Tageszeit... 28 4.2.3 Nach Wochentag... 29 4.2.4 Nach Monat... 29 4.3 Zugriffsstatistik... 30 4.3.1 Seiten... 30 4.3.2 Dateien... 34 4.3.3 Verzeichnisse... 35 4.3.4 Pages and Queries... 35 4.3.5 Einstiegsseiten... 36 4.3.6 Ausstiegsseiten... 37 4.3.7 Pfade... 37 4.3.8 Dateitypen... 39 4.4 Besucher... 39 4.4.1 Hosts... 39 4.4.2 Oberste Domains... 42 4.4.3 Länder... 43 4.4.4 US Staaten... 44 4.4.5 Organisationen... 44 4.5 Verweise... 45 4.5.1 Verweisende Sites... 45 KoGIs Seite 2 13.07.2009

4.5.2 Verweisende URLs... 45 4.5.3 Suchmaschinen... 46 4.6 Browser... 47 4.6.1 Betriebssysteme... 47 4.6.2 Spider... 47 4.7 Fehler... 48 5 Zusammenfassung... 49 6 Abschließende Empfehlungen für geeignete Werkzeuge zur Analyse von Logfiles... 50 6.1.1 WebTrends... 53 6.1.2 WebSuxess... 54 6.1.3 Mescalero... 55 6.1.4 W3 Statistics... 56 6.1.5 Econda Monitor... 57 6.1.6 LogFile Analyse Pro... 58 6.1.7 Nedstat/Sitestat... 58 6.1.8 NetTracker... 59 6.1.9 WebLog Expert... 60 KoGIs Seite 3 13.07.2009

1 Einleitung Dieses Handbuch gibt zunächst eine grundlegende Einführung in das Thema Logfile Analyse, um das notwendige Verständnis für die Thematik und die Werkzeuge zu schaffen. Anschließend wird beispielhaft ein Logfile des KoGIs Webauftritts ausgewertet und dabei der statistische Auswertungsprozess beschrieben, um die Ergebnisse detailliert vorzustellen und aus den Ergebnissen Empfehlungen zu formulieren, die helfen sollten, die Webseiten zielgruppengerechter zu gestalten. Um die Webstatistik als gutes Instrument für die Qualitätsanalyse einer Website zu nutzen, ist es erforderlich, mehrere Messgrößen heranzuziehen. Jede Veränderung des Webauftritts schlägt sich in der Nutzung der einzelnen Komponenten nieder und wird in den Logfiles aufgezeichnet. Zudem können langfristige Trends in der Website Nutzung aufgedeckt werden. Jede Dienststelle hat ganz spezielle Vorstellungen von der eigenen Website und von den Funktionen, die die Besucher des Auftritts nutzen. Ob dies auch dem Verständnis der Benutzer entspricht, kann allein durch eine Logfile Analyse nicht erfolgen. Aber es können Hinweise auf die eingeschlagene Richtung offen gelegt werden, indem z.b. das Navigieren der Nutzer auf der Site überprüft wird. Jede einzelne Seite sollte für den Benutzer einen Gewinn an Informationen oder zumindest eine Zeitersparnis darstellen. Doch alle guten Seiten helfen nur, wenn sie gut besucht werden. KoGIs Seite 4 13.07.2009

2 Technische Grundlagen Web Logfiles protokollieren Benutzer Transaktionen auf Webservern. Aus ihnen lassen sich neben Informationen zum Benutzungs bzw. Navigationsverhalten der Besucher weitergehende Informationen entnehmen, die allgemeine Rückschlüsse über Zugangswege und Verlinkungen von Webinhalten möglich machen. Der nachfolgende Abschnitt soll einen kleinen Überblick über die allgemeinen Begriffe geben, die im Zusammenhang mit dem Thema Logfile Analyse verwendet werden. Sie haben für das Verständnis der Untersuchung in den folgenden Kapiteln grundlegende Bedeutung. 2.1 Logfiles Web Logfiles sind strukturiert aufgebaute Textdateien. Sie bestehen aus einfachen (ASCII ) Zeichen, in denen die Zugriffe auf den Webserver gespeichert werden. Der Webserver bzw. die Webserversoftware schreibt dazu für jede HTTP Transaktion (z.b. das Aufrufen einer Seite, das Ausführen von Scripten usw.) typischerweise eine Zeile mit Informationen, die diese Transaktion betreffen. Eine Zeile im Logfile stellt somit eine Anfrage auf dem Webserver dar. Das folgende Beispiel zeigt eine Zeile eines Internet Information Webservers. Die einzelnen Felder des Logfiles werden durch das Tab oder Space Zeichen voneinander getrennt. Zunächst wird das Datum und die Uhrzeit aufgelistet (in diesem Beispiel der 26. Januar 2004, 15:13 Uhr und 39 Sekunden). Mit den IPs 217.231.89.82 und 213.188.99.32 wurde die Seite von der Firma RIPE Network Coordination Centre (Amsterdam) durchforscht (dies erkennt man am sichersten über eine "Whois Abfrage" z.b. über http://ws.arin.net/cgi bin/whois.pl), die von dem Server die Datei index.htm abgerufen hat. Die Datei wurde erfolgreich ausgeliefert, da der Statuscode 200 angegeben ist (das bedeutet, dass keine Fehler aufgetreten sind). Obwohl es sehr einfach erscheint, den Browsernamen in ein Logfile zu schreiben, ist es schon eine eigene Wissenschaft, aus den Browserangaben auf den tatsächlich verwendeten Browser zu schließen. Dies beruht darauf, dass manche Webserver abhängig vom Browser unterschiedliche Seiten "browseroptimiert" erzeugen. Der Browser von Netscape meldet sich beispielsweise mit "Mozilla". Da Microsoft mit dem Browser Internet Explorer erreichen wollte, dass die exakt gleichen Informationen auch unter dem Internet Explorer verfügbar sind, meldet sich der Browser IE 6.0 mit "Mozilla/4.0+(compatible;+MSIE+6.0;+Windows+NT+4.0)", wenn er unter Windows NT verwendet wird. Die Angabe zum Betriebssystem ist zumeist richtig. Auf diese Daten greifen klassische Logfile Analyse Programme zu und analysieren sie anhand der IP Adresse des Nutzers, die als eindeutiges Unterscheidungsmerkmal dient. Diese Annahme trifft jedoch nicht immer zu. So werden zum Beispiel von Providern die gleichen IP Adressen nach einer Zeit an unterschiedliche Personen (besser: Computer) vergeben oder verschiedene Mitarbeiter der bremischen Verwaltung erscheinen nach außen als eine einzige Person, da sie alle die gleiche IP Adresse KoGIs Seite 5 13.07.2009

zugewiesen bekommen und über die Proxys des BVNs (Bremisches Verwaltungsnetz) in das Internet geh en. 2.2 Session IDs Ein anderer Ansatz der Logfile Analyse besteht darin, nicht das Logfile zu analysieren, sondern die Nutzer beim Betreten der Website zu identifizieren und ihnen sozusagen einen Erkennungszettel anzuheften, die so genannte Session ID. Diese "tragen" sie während der gesamten Dauer des Besu (d er Session) "mit ches sich". 2.3 Cookies Die Identifizierung wiederkehrender Besucher ist zum Beispiel über das Setzen von Cookies möglich, die sich dauerhaft auf dem Computer des Nutzers befinden. Teilweise wird dies jedoch vom Besucher abgelehnt. Interessant ist die zeitnahe Analyse der Website. So kann man erkennen, wie viele Persogerade online sind, welchen Links sie folgen oder wie lange sie auf welchen Seiten nen bleiben. 2.4 Web Bugs Hat der Betreiber einer Webseite keinen Zugriff auf das Logfile des Webservers, kann versucht werden, so genannte Web Bugs einzusetzen, um damit eine statistische Auswertung zu ermöglichen. Hierzu werden kleine unsichtbare (1x1 Pixel groß und transparent) Bilder in die Webseite eingebunden, die auf einem Webserver abgelegt werden, dessen Logfile man auswerten kann. Ein klassisches Beispiel für das Einbinden von Web Bugs sind Zähler (Counter), die bei jedem neuen Besucher ein neu es "Bild", d.h. eine um eins erhöhte Zahl anzeigen. 2.5 Technische Datenauswertung Es gibt zahlreiche kostenlose, kostengünstige (bis 200 ) und teure (mehrere Tausend ) Analysewerkzeuge auf dem Markt. Sie unterscheiden sich hauptsächlich in der Anzahl der zu analysierenden Kategorien, der Möglichkeit, die Ergebnisse grafisch darzustellen und in der Möglichkeit, weitere Filter zu verwenden. 2.6 Inhaltliche Datenauswertung Nicht jedes Programm liefert die gleichen Analysen, so dass nachfolgend ein allgemeiner Überblick über d ie inhaltlichen Kategorien erfolgt. 2.6.1 Treffer bzw. Hit Ein "Treffer" bzw. "Hit" im eigentlichen Sinne ist der Abruf einer beliebigen Datei vom Webserver. Also erzeugt auch das Abrufen eines Bildes einen Treffer (siehe folgende Abbildung). KoGIs Seite 6 13.07.2009

Bei anspruchsvollen Logfile Analysen müssen aber Unterschiede bei den Daten gemacht werden. Ein Treffer im Logfile, der auf ein grafisches Element zurückgeht, das automatisch bei einem Zugriff auf eine Webseite mitgeladen wird, lässt sich eben nicht mit dem Treffer der eigentlich angeforderten Seite gleichsetzen. Genauso verursachen Suchmaschinen Treffer im Logfile. Diese Maßeinheit erscheint somit im Zusammenhang von detaillierten Logfile Analysen als zu ungenau. Wie erfolgreich eine Seite im Vergleich zu anderen Seiten ist, lässt sich damit überhaupt nicht sagen. Leider wird der Begriff Treffer oder Hit von vielen Internet Nutzern und Webmastern mit "Seitenaufruf" oder "Besuch" verwechselt. 2.6.2 Seitenaufruf bzw. Pageimpressions Der Begriff Seitenaufruf bzw. Pageimpressions wird oftmals mit dem Begriff PageView gleichgesetzt. Dieser Begriff gibt an, wie viele HTML Dokumente von den Besuchern der Site abgerufen wurden. Berücksichtigt werden hier bei der Zählung lediglich die vom Besucher explizit angeforderten Webseiten. Zusätzliche Seiten wie zum Beispiel Pop ups werden bei dieser Methode nicht berücksichtigt. Konsequenterweise gehören aber auch Script Aufrufe (wie beispielsweise das Versenden eines Fragebogens und das gleichzeitige Aufrufen der Rückmeldungsseite) dazu. Die Seitenaufrufe sind recht gut geeignet, den "Erfolg" verschiedener Websites oder auch Unterrubriken einer Website zu vergleichen. Allerdings kann man bei dieser Auflistung nicht zwischen Seitenaufrufen von wirklichen "Besuchern" und beispielsweise Suchmaschinen unterschieden werden, die ebenfalls eine Seite aufrufen. Deshalb ist eine Verknüpfung zwischen "Seitenaufruf" und "Besucher" (mit ggf. hohen Aufent haltsdauern) ratsam. 2.6.3 Besuch bzw. Visit Ein häufig genannter Indikator für die Intensität der Benutzung einer Website und somit der Popularität und dem Erfolg der Site, ist die Anzahl der Websitebesuche, auch visit oder session genannt. Ein Websitebesuch (visit) setzt sich aus Transaktionen einzelner Besucher (Visitors) zusammen. Problematisch bei der Bewertung von Visit Messungen ist die Tatsache, dass bei der Analyse zeitliche Festlegungen getroffen werden müssen. Wann beginnt z.b. ein Websitebesuch und wann endet er. Im Gegensatz zu kommerziellen Datenbankrecherchen, bei denen sich der Recherchierende an und abmeldet, gibt es ein "Logoff" bei Websitesessions auf öffentlichen Websites nicht. Das bedeutet, dass bei Logfile Analysen für die Bestimmung der "visits" ein so genanntes Timeout gesetzt wird. KoGIs Seite 7 13.07.2009

In unseren Auswertungen des KoGIs Webauftritts gehen wir standardmäßig von einer sehr hohen Aufenthaltsdauer von mindestens 30 Minuten aus und vergleichen die Ergebnisse mit den Zahlen von mindestens 20 Minuten, zehn und dann fünf Minuten. 2.6.4 Referrer Der Referrer gibt an, welche Seite ein Besucher vor dem Aufruf der aktuellen besucht hat und beschreibt damit die Navigation eines Internetnutzers von einer Website zu einer anderen über definierte Linkbeziehungen. Wenn man Logfiles durchsieht, kann man feststellen, dass viele Referrer auf die eigene Seite verweisen. Solch ein Effekt entsteht, wenn ein Besucher einem Link innerhalb der eigenen Seite folgt. Der Browser lädt dann die neue Seite und schickt die URL der alten gleichzeitig als Referrer mit. Der Referrer ist eine der nützlichsten Angaben in Logfiles überhaupt. Mit seiner Hilfe ist es möglich herauszufinden, welche andere Seiten eigentlich auf die eigenen linken bzw. wie viele Besucher von dort kommen. 2.6.5 Suchmaschinen Viele Programme machen Angaben zum Oberbegriff der Suchmaschinen. Dabei gibt es verschiedene Teilbereiche mit jeweils verschiedenen Interpretationsmöglichkeiten: Der erste Aspekt ist die Fragestellung, wie viele Besucher über Suchmaschinen kommen. Je nach inhaltlicher Ausrichtung der Site kann diese Angabe unterschiedlich interpretiert werden. Wenn regelmäßig neue Inhalte und Artikel online gestellt werden, ist ein großer Anteil wiederkehrender Benutzer zu erwarten. Kommen in diesem Falle viele Benutzer über Suchmaschinen, dann steht das für einen niedrigen Anteil selbstständig wiederkehrender Benutzer, was im Endeffekt schlecht wäre. Untersucht werden sollte ebenfalls, über welche Suchmaschinen die Besucher zu der Site kommen. Fehlt Google z.b. völlig, dann ist davon auszugehen, dass die Site entweder gar nicht im Google Index steht oder aber unter wirklich unpassenden Schlagworten. Dem sollte in diesem Fall abgeholfen werden. Weiterhin ist wichtig, nach welchen Begriffen die Besucher gesucht haben, bevor die Suchmaschine die Site als Ergebnis ausgegeben hat. Dies gibt Aufschluss darüber, über welche Schlagwörter die Site gefunden wird. Wenn diese Schlagwörter das Thema der Site nur am Rande wirklich treffen, dann müssen sie angepasst werden, indem die elementaren Oberbegriffe mehr in den Vordergrund gewerden, z.b. in Titel oder stellt Überschriften. 2.6.6 Browseranalyse Die Browseranalyse gibt Auskunft darüber, welche Browser von den Besuchern benutzt werden. Aus dieser Statistik kann abgeleitet werden, welche Browser beim nächsten Layout Wechsel eventuell "vernachlässigt" werden können und welchen aktuell mehr Beachtung geschenkt werden sollte. 2.6.7 Navigationspfade Einige Programme versuchen, aus den Logfiles die bevorzugten Wege der Besucher zu rekonstruieren. Absolut sicher ist diese Analyse jedoch nicht. Der Wert einer solchen Analyse wird deutlich, wenn es darum geht, Schwachstellen in der Navigation zu entdecken. Ein Link, der auf Seite A sehr häufig angeklickt wird, auf Seite B aber nur selten, gibt Anlass zu der Vermutung, dass die Navigation auf B nicht optimal funktioniert. 2.6.8 Ein und Ausstiegsseiten Die Ein und Ausstiegsseitenanalyse funktioniert nach dem gleichen Prinzip wie die Analyse der Navigationspfade. Einziger Unterschied ist, dass hier nicht nach kompletten Pfaden, sondern nur nach einem Pfadanfang bzw. Pfadende gesucht wird. Man kann mit Hilfe dieser Angaben nach schlechten KoGIs Seite 8 13.07.2009

Inhalten und mangelhaften Navigationen suchen: Dort, wo die Seite besonders häufig verlassen wird, könnt e ein solcher Fall vorliegen. 2.6.9 Transfer Der Transfer ist nur interessant, wenn der erzeugte Traffic der Website selbst bezahlt werden muss, was beim Gebrauch der KoGIs Module nicht der Fall ist. Die Transferanalyse wird oft dazu genutzt, den laufenden Traffic zu kontrollieren, so z.b. einmal pro Woche oder sogar jeden Tag. Bedrohlichen Entwicklungen (z.b. plötzliche Verdopplung des tägl. Transfers) lässt sich so rechtzeitig entgegenwirken. Die Analyse des Transfers kann aber auch, wenn die Daten anschaulich aufbereitet werden, bei der Verminderung des Traffics helfen. Optimal wäre hier eine Anzeige der Dateien, die im Verhältnis zu ihren Aufrufen den meisten Traffic erzeugen. Solche Dateien sollten dann gezielt verkleinert werden. 2.6.10 Fehlertypen Viele Programme unterstützen eine Analyse der Serverfehler. Ein Serverfehler ist alles, was den Server veranlasst, eine Anfrage eines Clients (des Computers des Besuchers) nicht in der gewünschten Art zu beantworten. Mögliche Ursachen sind z.b., dass eine Datei angefordert wird, die es gar nicht gibt (Fehler 404), oder dass ein Script aufgrund eines Fehlers im Code nicht ausgeführt werden kann. Eine genaue Übersicht der acht häufigsten Fehlertypen wird im Folgenden aufgelistet (eine umfangreichere Liste erhält man beispielsweise unter http://dalastat.de/allefehler.html). 403 Verboten Dieser Fehler tritt auf, wenn man nicht die notwendigen Berechtigungen hat, um eine Seite aufzurufen. Die Verbindung wurde vom Host abgelehnt, in der Regel erscheint diese Meldung bei passwortgeschützten Dateien. 400 Falsche Anfrage Die eingegebene URL ist nicht in Ordnung. Möglicherweise ist auch das Dokument nicht vorhanden. Zunächst sollte die URL überprüft werden, besonders ist auf Klein und Großschreibung, Punkte und Schrägstriche zu achten. 404 Nicht gefunden Dieser Fehler tritt immer dann auf, wenn eine Seite aufgerufen wird, die nicht existiert. 405 Methode nicht erlaubt Die versuchte Zugriffsmethode ist nicht erlaubt. 406 Nicht akzeptierbar Dabei handelt es sich um eine nicht akzeptierbare Beschreibung zur Auffindung der gesuchten Datei. Der Browser hatte Charakteristiken angegeben, die die gewünschte Datei beschrieben. Der Server konnte aber keine Datei zuordnen, die diese Vorgaben erfüllen konnte. Der Server liefert in der Regel aber zur "Hilfe" eine Liste mit Beschreibungsmöglichkeiten. 411 Länge erforderlich Der Client hat an den Server Daten übermittelt, den dieser nicht ohne die im Header Content length angegebene Größe akzeptiert. 500 Interner Serverfehler KoGIs Seite 9 13.07.2009

Dies können Hard oder Softwarefehler sein, die den Server von einer korrekten Abarbeitung abhalten, z.b. bei der Abarbeitung von Scripten, wenn dort interne Fehler vom Interpreter geliefert werden. 501 Nicht implementiert Die Anfrage kann von dem Server grundsätzlich nicht beantwortet werden, weil diese Art der Anfrage entwed er nicht implementiert (eingebaut) oder einfach unbekannt ist. 2.6.11 Besuchszeiten Viele Programme werten auch die Zeitangaben in den Logfiles aus. Aus der entstehenden Statistik können beispielsweise Rückschlüsse auf die primäre Besuchergruppe gezogen werden. Private Besucher z.b. bevorzugen den Abend, wohingegen Besucher mit geschäftlichem Auftrag eher morgens unterwegs sind. Werden ungewöhnlich viele Zugriffe mitten in der Nacht verzeichnet, dann kann man davon ausgehen, dass die Site auch bei transatlantischen oder asiatischen Surfern Gefallen findet oder aber und dies ist wahrscheinlicher in dieser Zeit vermehrt von Suchmaschinen durchwird. forscht 2.6.12 IP Nummern Die aufgeführten IP Nummern der Besucher lassen sich geographisch rückverfolgen: IP Nummern lassen sich Domains, diese wiederum Providern zuordnen. Von Providern weiß man (oft), aus welchem Land sie kommen. Nicht zuletzt die Top Level Domain (beispielsweise ".de" für Deutschland) gibt hier einen Hinweis. Diese Analyse sollte jedoch mit Vorsicht betrachtet werden. Die einzige Aussage ist, aus welchem Land der Provider des Besuchers kommt, nicht, aus welchem Land der Kunde selbst kommt. Analog dazu hat auch ein amerikanischer Provider unter Umständen nicht nur Amerikaner als Kunden. Details zu diesem Thema kann man z.b. manuell nachschlagen unter: RIPE Réseau IP Européens: http://www.ripe.de /db/whois/whois.html APNIC Asia Pacific Network Information Centre: http://www.apnic.net/search/index.html LACNIC Latin American and Caribbean Internet Addresses Registry: http://lacnic.net/en/index.html ARIN American Registry for Internet Numbers: http://ww2.arin.net /whois/ Für die geografische Lokalisierung einer IP eignet sich besonders die Software NeoTrace: http://www.neotrace.com. KoGIs Seite 10 13.07.2009

3 Der Auswertungsprozess Untersuchungsgegenstand sind die Web Logfiles des KoGIs Webservers des Webauftritts http:// www.kogis.bremen.de über den Zeitraum vom 02.01.2008 bis zum 31.12.2008. 3.1 Probleme bei der Analyse Web Logfile Analysen werden durch unterschiedliche Faktoren bzgl. ihrer Aussagekraft und Genauigkeit eingeschränkt, die der Vollständigkeit halber an dieser Stelle aufgeführt werden sollen. Das Hauptproblem der Logfile Analyse bei Webserver Logfiles ist die Tatsache, dass HTTP ein zustandsloses Protokoll ist. Das heißt, jede Anfrage eines Clients nach einer Webseite (oder jeder einzelnen darin vorkommenden Grafik usw.) ist für den Webserver eine eigenständige Aktion. Klickt sich der Benutzer durch eine Website, hat der Webserver keinerlei Kenntnis, dass der Benutzer gerade schon eine Seite abgerufen hat. Dynamisch vergebene IP Adressen stellen für die Logfile Analyse ein weiteres Problem dar. Wegen des begrenzten Vorrats an IP Adressen vergeben Online Dienste wie z.b. AOL oder T Online wie auch andere Internet Service Provider ihre IP Adressen dynamisch. Das führt zu zwei unterschiedlichen Effekten: 1. Mit wenigen Adressen kann ein Online Anbieter eine große Zahl von Nutzern bedienen. Gerade sehr aktiven Benutzern wird oft ein spezieller Pool von Adressen zugewiesen. Der Effekt ist, dass im Logfile nur wenige Adressen zu finden sind, hinter denen sich jedoch eine Vielzahl von Benutzern verbergen kann (so kann es auch zu deutlichen Differenzen zwischen Seitenaufrufen und Besucherzahlen kommen). 2. Derselbe Benutzer kann zu unterschiedlichen Zeiten unterschiedliche IP Adressen zugewiesen bekommen. Im Logfile erscheinen dann zwei Adressen, hinter denen sich jedoch nur ein Benutzer verbirgt. Diese Verfälschung des Logfiles ist damit insofern problematisch, da eine Ermittlung von genauen "Besuchszahlen" (visits) und eine Identifikation einzelner Benutzer sehr schwierig wird. Eine weitere Schwierigkeit stellen die methodischen Probleme bei der Logfile Analyse dar. Methodisch lässt sich beispielsweise nicht in Erfahrung bringen, welche Benutzer Transaktionen im Logfile nicht aufgezeichnet werden, weil sie zuvor durch Caching Mechanismen (Browser Cache oder Proxy Cache) herausgefiltert werden und daher nicht bis zum Webserver gelangen. Weiterhin spielen Firewalls bei Logfile Analysen eine problematische Rolle, weil sie die IP Adresse der einzelnen Computer im bremischen Netz auf eine einheitliche anonyme IP Adresse verkürzen. Einzelne Websitebesucher lassen sich somit nicht mehr unterscheiden. Die Proxy sowie die Firewall Problematik können sich beim Einsatz beider Techniken überlagern. Die Folge sind ungenaue und verzerrte Aussagen bzgl. der Besucherzahlen. Abschließend erschwert die Anonymisierung der IP Adressen (das Nullen der letzten drei Ziffern) in den Logfiles, die KoGIs aufgrund der Datenschutzbestimmungen durchführen muss, ebenfalls die genaue Auswertung der Nutzungszahlen. 3.2 Durchführung der Analyse Für die im Folgenden durchgeführte Analyse wurden beispielhaft zwei Programme verwendet: WinRar: Archivierungsprogramm zum Entpacken und Zusammenstellen der vom Server generierten Logfiles und WeblogExpert Professional zur eigentlichen Auswertung der Logfiles KoGIs Seite 11 13.07.2009

3.2.1 Herunterladen der Logfiles Die monatlichen Logfiles befinden sich in einem eigenen Verzeichnis einer jeden KoGIs Instanz. Beim KoGIs Webauftritt ist dies beispielsweise http://www.kogis.bremen.de/logfiles. Die Dateien liegen dabei in einem geschützten Verzeichnis, deren Zugang die Eingabe eines Benutzernamens und Passworts erforderlich macht (beides erhalten Sie beim KoGIs). Nach Eingabe der Zugangsdaten werden zwei Unterverzeichnisse angezeigt. Die Logfiles befinden sich in dem Verzeichnis access. Die monatlichen Logfiles werden immer am ersten eines Folgemonats abgelegt, also für Januar beispielsweise am 01. Februar. KoGIs Seite 12 13.07.2009

Durch Linksklick auf die einzelnen Monatslogfiles können diese lokal gespeichert werden. Bitte beachten Sie, dass der Internet Explorer beim Herunterladen die Endung der Dateien fälschlicherweise umbenennt. Sie müssen die lokal gespeicherten Dateien deshalb nach Download über den Internet Explorer unbedingt wieder umbenennen. Richtig ist die Endung.tgz. Alternativ können oder sollten Sie den Firefox zum Herunterladen der Dateien verwenden, da dieser Browser die Dateiendungen nicht verändert. Das folgende Bildschirmfoto zeigt zwölf Monatslogfiles (Januar bis Dezember 2009): 3.2.2 Entpacken und Zusammenstellen der Logfiles Die meisten Logfileauswertungsprogramme können gepackte Dateien importieren und auswerten. Im vorliegenden Fall bestehen die einzelnen gepackten Monatslogfiles allerdings aus ebenfalls gepackten Tageslogfiles, so dass manche Programme diese verschachtelten Dateien nicht sauber importieren. Aus diesem Grund empfiehlt es sich, die Monatslogfiles in Tageslogfiles zu entpacken und diese dann gesammelt wieder zu einem Paket zu komprimieren: KoGIs Seite 13 13.07.2009

Dazu werden alle Monatslogfiles (Endung.tgz) markiert und über die rechte Maustaste über das Kontextmenü der Menüpunkt Hier entpacken ausgewählt. Das Programm WinRAR entpackt die markierten Archive in das Verzeichnis. Unterhalb der Monatslogfiles erscheinen die gepackten Tageslogfiles (Endung.gz): KoGIs Seite 14 13.07.2009

Dieser Schritt wird nochmals bei den Tageslogfiles wiederholt, so dass diese nun ausgepackt vorliegen. Die Dateinamen haben keine Endung: Um beim Import der Logfiles in das Analyse Programm nicht jede Datei einzeln integrieren zu müssen, sollten Sie die Dateien wiederum zu einer einzigen Datei (in diesem Fall also eine Jahresdatei) zusammenführen. KoGIs Seite 15 13.07.2009

Für das Gesamtarchiv sollte ein sprechender Titel vergeben werden: Das fertige Logfile liegt nach Abschluss des Archivierungsvorgangs bereit: 3.2.3 Konfiguration von Weblog Expert Professional Nach dem Öffnen von Weblog Expert befinden Sie sich im Hauptfenster. Zunächst müssen die allgemeinen Einstellungen über Options angepasst werden. Deaktivieren Sie die ersten drei Ankreuzfelder, damit das Programm keine Endungen der Adressen abschneidet, da die SixCMS Adressen beispielsweise durchaus Fragezeichen enthalten können. Auch sollten die nächsten drei Ankreuzfelder aktiviert werden, damit alle Zusatzinformationen angezeigt werden. Die beiden Ankreuzfelder zum Internet Information Server Logfile können deaktiviert werden, da die vorliegenden Logfiles von einem Apache Server stammen. Die zwei darauf folgenden Ankreuzfelder sollten aktiviert werden, damit Diagramme in dem fertigen Report angezeigt werden. KoGIs Seite 16 13.07.2009

Die zwei letzten Einstellungen lassen wir unberührt. Wichtig ist an dieser Stelle noch die Einstellung der Besuchszeiten der Nutzer (Visitor session timeout). Wir empfehlen, eine nicht zu niedrige Zeit zu wählen, so dass zumindest einige Suchmaschinenanfragen bereits herausgefiltert werden. Über explizite Filter kann die Besuchszeit auch reduziert werden. Im Bereich Files sind alle wesentlichen Dateiendungen, die untersucht werden, enthalten. Sollten auf der Website allerdings besondere Dateiformate beispielsweise zum Download angeboten werden, können diese hier nachgetragen werden. Wichtig bei der Registerkarte Date & Time ist die Anpassung des Wochenbeginns. Hier sollte Monday (Montag) ausgewählt werden. KoGIs Seite 17 13.07.2009

Unter Ignore List können Hosts und Referrer explizit von der Bewertung ausgenommen werden. Diese Einstellungen sind bei der Auswertung von lokal vorliegenden Logfiledateien nicht relevant. Beim Report Format (gleiche Registerkarte wie Report) können Sie die Sprache des Analysereports auswählen. Hinweis: Die Einstellung German wurde noch nicht 100%ig fehlerfrei umgesetzt, so dass im späteren Report einige Beschriftungen noch in Englisch aufgeführt werden. Der Custom report title erscheint auf der Startseite des Reports. Hier wird automatisch der Profilname eingetragen, der beim Anlegen einer neuen Auswertung vergeben werden muss. KoGIs Seite 18 13.07.2009

Die HTML Eigenschaften können in dieser Form übernommen werden. Das Ergebnis stellt ein Report dar, der aus zwei Fenstern besteht. Links wird ein Inhaltsverzeichnis aufgeführt, deren Hauptkapitel weiter aufgeklappt werden können. Im rechten Fenster erscheint der zugehörige Inhalt (siehe folgendes Bildschirmfoto). KoGIs Seite 19 13.07.2009

Falls der Report in PDF Form erstellt werden soll, kann hier u.a. das Format eingestellt werden. Die PDF Form ist ausschließlich in der kommerziellen Professional Version verfügbar und eignet sich beispielsweise für das Versenden des fertigen Reports an weitere Kollegen. KoGIs Seite 20 13.07.2009

Die Ergebnisse werden neben den Diagrammen in umfangreichen Listen aufgeführt. Unter Items kann z.b. die Anzahl der Listenbeiträge angegeben werden. Auch die Höchstwerte für die Einträge in den Diagrammen können angepasst werden. Unter Custom können die Auswertungskategorien ausgewählt werden, die tabellarisch und mittels eigener Anpassungen und Einschränkungen angezeigt werden. Diese Einstellung ist ausschließlich in der Professional Version möglich. Sollten nur bestimmte Kategorien wie z.b. Besucherzahlen und populärste Seiten ausgewertet werden, sollten auch nur diese hier ausgewählt werden. Damit verkürzt sich die Auswertungszeit deutlich. Auch verwirren bei einer kleineren Auswahl die vielen Auswertungskategorien nicht. Für unsere Auswertung wurden alle Einträge ausgewählt. Unter Content können die Auswertungskategorien ausgewählt werden, die tabellarisch und mit Diagrammen angezeigt werden. Sollten nur bestimmte Kategorien wie z.b. Besucherzahlen und populärste Seiten ausgewertet werden, sollten auch nur diese hier ausgewählt werden. Damit verkürzt sich die Auswertungszeit deutlich. Auch verwirren bei einer kleineren Auswahl die vielen Auswertungskategorien nicht. Für unsere Auswertung wurden alle Einträge ausgewählt. KoGIs Seite 21 13.07.2009

Der Report wird mit dem Standardbrowser geöffnet. Sollte der Report abweichend mit einem speziellen Browser geöffnet werden, so kann dieser hier eingetragen werden. Die Einstellungen in dieser Maske können übernommen werden. Das Logfile liefert IP Adressen zurück, die laut oben gemachten Einstellungen nach Möglichkeit aufgelöst werden sollen. Dafür muss sich das Analyseprogramm die zugehörigen Tabellen aus dem Internet herunterladen und verfügt dann über ein bestimmtes "Kontingent". Diese Tabellen sollten aber immer auf einem relativ neuen Stand gehalten (z.b. alle 7 Tage aktualisiert) werden. Diese Einstellungen sind bei der Auswertung von lokal vorliegenden Logfiledateien nicht relevant. KoGIs Seite 22 13.07.2009

Die automatische Versendung des Reports per E Mail an eine bestimmte Adresse ist ausschließlich in der Professional Version möglich. Dabei kann der Report über die Einrichtung eines Schedulers automatisch generiert und per E Mail versendet werden. 3.2.4 Auswertung erstellen und starten Es ist bereits eine Beispielauswertung Sample angelegt. Diese kann markiert und durch Klick auf Delete in der Symbolleiste gelöscht werden. Anschließend wird eine neue Auswertung mit New angelegt. Es erscheint ein Assistent, der durch die einzelnen Schritte führt. Im Feld Profilname wird der Name der Auswertung angegeben. Es können beliebig viele Auswertungen erstellt werden. Da es sich bei dieser Auswertung um eine Jahresauswertung handelt, vergeben wir den Namen KoGIs Auswertung 2008. Im Feld Domain wird der Domainnamen der Homepage eingegeben, in diesem Beispiel www.kogis.bremen.de. Als Index file geben wir für unser Beispiel die Adresse der Startseite ein: sixcms/detail.php?gsid=bremen02.c.730.de. Wenn die Checkbox Lookup DNS names markiert wird, werden in der Auswertung anstelle der IP Adressen der Webseitenbesucher (z.b: 123.456.789.0) der logische Name (also bayern.de, o. ä.) angezeigt. Da in Deutschland sehr viele Internetnutzer über Provider wie beispielsweise T Online ins Internet gehen, werden in der Auswertung sehr viele t online.de Adressen auftauchen. Sofern auf die Seiten aber von Firmen o. ä. zugegriffen wird, die über eine eigene Internetverbindung verfügen, werden deren Firmendomains (z.b. siemens.de) angezeigt. Da zur Auflösung der IP Adressen in logische Namen diese erst ermittelt werden müssen, dauert die Erstellung der Auswertung entsprechend länger. Zur besseren Lesbarkeit der Reports empfehlen wir Ihnen, die Checkbox zu markieren und das Mehr an Zeitaufwand in Kauf zu nehmen. Klicken Sie dann auf Weiter >. KoGIs Seite 23 13.07.2009

Im nächsten Schritt muss dem Programm mitgeteilt werden, wo es die Protokolldateien findet. Hier wird als Log Location: Local file ausgewählt und bei Path: die auszuwertende Logfiledatei ausgewählt. Wenn in der Auswahlbox Log Location Multiple ausgewählt werden, können mehrere Logdateien für die Auswertung angegeben werden. Klicken Sie dann auf Weiter >. Im nächsten Schritt kann ein Zeitraum festgelegt werden, über den die Auswertung erstellt werden soll. Da es sich um eine Jahresauswertung handelt und alle zuvor zusammengestellten Logfiles für die Auswertung herangezogen werden sollen, wird hier All activity ausgewählt. Sie können aber auch einzelne Reports (z.b. monatliche, pro Quartal oder halbjährlich) aus der Vorlagendatei auswerten. Ebenso können aus monatlichen Logdateien einzelne Tage ausgewertet werden. Im Feld From wird dann der Beginn des Auswertungszeitraums eingegeben, im Feld to das Ende des Zeitraums. Wenn die Standardeinstellung All activity übernommen wird, wird die gesamte Logdatei ausgewertet. Die nächsten beiden Dialogseiten Tracking und Filters werden für dieses Beispiel ohne Eingaben übersprungen. Dort könnten weitere detaillierte Einstellungen vorgenommen werden wie z.b. die Beschränkung der Auswertung nur auf einen Untermenüpunkt o. ä. KoGIs Seite 24 13.07.2009

Im letzten Schritt wird der Speicherort des Reports festgelegt. Standardmäßig wird der Report im Programmverzeichnis des WebLog Experts im Unterverzeichnis Report gespeichert. Diese Einstellung kann beibehalten werden, wir empfehlen aber die Speicherung an einem eigenen Ort. Wenn die Checkbox Remove old report file... gesetzt ist, wird ein in dem Verzeichnis vorhandener alter Report gelöscht. Mit dem Setzen der Checkbox Show generated report startet nach Erstellen des Reports automatisch der lokale Internet Browser und zeigt das Ergebnis der Auswertung an. Mit Fertig stellen wird der Dialog geschlossen und die Einstellungen gespeichert. Im Hauptfenster wird die gerade definierte Auswertung markiert und in der Symbolleiste der Knopf Analyse betätigt. Die Auswertung wird nun erstellt und anschließend im Internet Explorer angezeigt. KoGIs Seite 25 13.07.2009

4 Interpretation der Ergebnisse Wir gehen bei unserem Webauftritt von folgenden Grundannahmen aus und möchten in Erfahrung bringen, ob diese Annahmen durch die Logfileanalyse bestätigt werden: Da die KoGIs Module ausschließlich von Dienststellen, Eigenbetrieben und Gesellschaften der bremischen Verwaltung genutzt werden können, rechnen wir mit Ausnahme von Google auch hauptsächlich mit Besuchern aus dem bremischen Verwaltungsnetz. Durch die kontinuierlich steigende Verbreitung der Module rechnen wir ebenfalls mit einem kontinuierlichen Anstieg der Besucherzahlen. Die Neustrukturierung des KoGIs Webauftritts im August 2008 sollte den Besuchern die Navigation deutlich erleichtern. Das Rollout bestimmter Funktionen und Module müsste zu erhöhten Besucherzahlen führen, da zugehörige Informationen und Dokumentationen auf den Webseiten kostenfrei zur Verfügung gestellt werden. Der Newslettereinsatz sollte zu erhöhten Besucherzahlen führen. 4.1 Allgemeine Statistik Eine Auswertung ist in unterschiedliche Bereiche aufgeteilt, die links im Menü abgerufen werden können. Hinweis: Da es sich um eine englische Auswertung handelt, müssen die Kommas als Punkte und Punkte als Komma gelesen werden, z.b. Treffer gesamt: 343,419 demnach 343.419. Die zusammengefassten Ergebnisse des Untersuchungszeitraums (02.01.2008 bis 31.12.2008) im Überblick: Treffer Treffer gesamt 343,419 Durchschnittliche Treffer pro Tag 940 Durchschnittliche Treffer pro Besucher 26.91 Gecachte Anfragen 101,063 Fehlerhafte Anfragen 3,061 Seitenansichten Seitenansichten gesamt 189,338 Durchschnittliche Ansichten pro Tag 518 Durchschnittliche Ansichten pro Besucher 14.84 Besucher Besucher gesamt 12,762 Durchschnittliche Besucher pro Tag 34 Eindeutige IPs gesamt 1,943 Bandbreite Bandbreite gesamt Durchschnittliche Bandbreite pro Tag Durchschnittliche Bandbreite pro Treffer 5.15 GB 14.45 MB 15.73 KB KoGIs Seite 26 13.07.2009

Durchschnittliche Bandbreite pro Besucher 423.26 KB 12.762 Besucher haben 189.338 Seiten angesehen. Jeder Besucher hat dabei im Durchschnitt 14,84 Seiten abgerufen. Insgesamt wurden 343.419 Dateien herunter geladen (Seiten, Bilder, usw.). Interessant ist insbesondere bei dieser Auswertung die Zahl der durchschnittlichen Seitenansichten pro Besucher, da diese anzeigt, wie viele Seiten ein Besucher gelesen hat, bevor er den Webauftritt wie der verlassen hat. Je höher dieser Wert ist, desto attraktiver erscheint der Webauftritt. 4.2 Aktivitätsstatistik Hier wird angezeigt, wie sich die Zugriffe auf einzelne Monate, Tage oder Stunden verteilen. 4.2.1 Tägliche Zugriffe Die Statistik zeigt deutlich, dass zwischen April und Juni 2008 die Zugriffszahlen bzw. die Besucherzahlen deutlich gestiegen sind. In dieser Zeit fand das Rollout des IFG Moduls statt und auf den Webseiten wurde über Neuigkeiten informiert. Zusätzlich sind klare Besucherspitzen zu verzeichnen. Diese treten immer dann auf, wenn ein Newsletter verschickt wurde: KoGIs Seite 27 13.07.2009

4.2.2 Nach Tageszeit Die Besucher des Webauftritts betrachten der Statistik entsprechend die Webseiten während der Arbeitszeit. Die Besucherzahlen sind in der Zeit zwischen 09:00 Uhr und 17:00 fast gleich bleibend hoch. Die erhöhten Aktivitäten in den Nachtstunden könnten vor allem durch Suchmaschinen resultieren. Wenn durch einen Filter die zugreifenden Länder auf Deutschland (siehe Kapitel 4.4.3 Länder) beschränkt werden, gestaltet sich die Verteilung der Besucher auf die Tageszeiten auch deutlich anders. In den späten Abend, den Nacht und den sehr frühen Morgenstunden wird auf die Seiten so gut wie gar nicht zugegriffen: KoGIs Seite 28 13.07.2009

4.2.3 Nach Wochentag Die Besucherzahlen sind zwischen Montag und Donnerstag fast gleich bleibend hoch und fallen am Freitag ab, was sicherlich durch die kürzere Arbeitszeit der Mitarbeiter/ innen der bremischen Verwaltung begründet ist. Am Wochenende werden die Seiten ebenfalls besucht. 4.2.4 Nach Monat Analog zur täglichen Auswertung zeigt die monatliche Statistik ebenfalls, dass zwischen April und Juni 2008 die Zugriffszahlen bzw. die Besucherzahlen deutlich gestiegen sind. In den Sommerferien sinken die Besucherzahlen rapide ab. Zusätzlich ist ein leichter Aufwärtstrend der Zugriffszahlen zu erkennen (von 800 Besuchern Anfang des Jahres zu 1300 Ende des Jahres). KoGIs Seite 29 13.07.2009

4.3 Zugriffsstatistik Diese Auswertung ist wohl die interessanteste neben der allgemeinen Übersicht. Die Zugriffsstatistik gibt detailliert Auskunft darüber, welche Seiten besondern häufig abgerufen wurden. Diese Informationen können dazu verwendet werden, diese häufig abgerufenen Seiten noch besser im Internetauf g estalten oder z.b. direkt auf der Startseite zu tritt zu verlinken. 4.3.1 Seiten Die ersten drei Einträge müssen für die Bewertung von Inhaltsseiten ignoriert werden, da sie zum einen den regelmäßigen Datentransferauftrag der IFG Informationen an das zentrale Register und zum anderen Aufrufe des Style Sheets beinhalten. Auf unserer Homepage wurde neben der Startseite (detail.php?gsid=bremen02.c.730.de und "/") insbesondere die Seiten mit unserem RSS Feed (/rss), die Inhaltsseite mit den Schulungsterminen (http://www.kogis.bremen.de/sixcms/detail.php?gsid=bremen64.c.1723.de), die Beschreibung des Modulbaukastens (http://www.kogis.bremen.de/sixcms/detail.php?gsid=bremen02.c.734.de) und die Inhaltsseite mit den Handbüchern (http://www.kogis.bremen.de/sixcms/detail.php?gsid=bremen64.c.1584.de) aufgerufen. KoGIs Seite 30 13.07.2009

Die ersten drei Einträge sollten durch Filter bereits von der Analyse ausgenommen werden. Dazu wird das Programm und das aktuelle Profil geöffnet und über die Schaltfläche Edit die Profil Eigenschaften geöffnet. Hier wird die Registerkarte Filters ausgewählt. Ein neuer Filter wird über Add angelegt. Es öffnet sich ein neues Fenster mit einer Auswahl an Filtertypen. KoGIs Seite 31 13.07.2009

Um bestimmte Seiten oder Dateien aus der Analyse auszuschließen, muss als Filtertyp Exclude filter ausgewählt werden. Als Kriterium wird Requested file (aufgerufene Dateien) aktiviert und die Eingabe mit Klick auf Weiter bestätigt. In dem Eingabefeld werden nun mit Leerzeichen getrennt die Seiten oder Dateien eingetragen, die in der Analyse nicht berücksichtigt werden. In unserem Fall haben wir bewusst /sixcms/detail.php?template=* eingetragen, um alle über Templates aufgerufenen Seiten auszusparen. Damit sind beispielsweise auch die Suchergebnisseiten (Seiten, die die Suchergebnisse aus dem roten Eingabefeld anzeigen, nicht die darauf folgenden Seiten oder falls eigenständig implementiert Seiten nach Navigatorenauswahl) ausgeschlossen. Übrig bleiben sollten die Inhaltsseiten aus dem Container Seiten und Dateien. Mit Klick auf Fertigstellen wird der Filter gespeichert. Der Filter steht in der Auswahl zur Verfügung und kann deaktiviert werden, ohne dass eine Löschung erforderlich ist. Nach erneuter Analyse der Daten und Ansicht des Reports im Browser erscheinen deutlich mehr Seiten in der Übersicht. KoGIs Seite 32 13.07.2009

Die Tabelle enthält nun ebenfalls deutlich mehr Inhaltsseiten, die mehr Aufschluss über die tatsächlich besuchten Seiten geben: 1 http://www.kogis.bremen.de/ sixcms/detail.php?gsid= bremen02.c.730.de Seite Treffer Besucher Bandbreite (KB) 2,914 1,842 25,479 2 http://www.kogis.bremen.de/ 1,965 1,551 0 3 http://www.kogis.bremen.de/ rss/ 843 821 3,222 4 5 6 7 8 9 10 11 12 13 http://www.kogis.bremen.de/ sixcms/detail.php?gsid= bremen64.c.1723.de http://www.kogis.bremen.de/ sixcms/detail.php?gsid= bremen64.c.1584.de http://www.kogis.bremen.de/ sixcms/detail.php?gsid= bremen02.c.734.de http://www.kogis.bremen.de/ sixcms/detail.php?gsid= bremen64.c.1563.de http://www.kogis.bremen.de/ sixcms/detail.php?gsid= bremen64.c.1654.de http://www.kogis.bremen.de/ sixcms/detail.php?gsid= bremen64.c.5973.de http://www.kogis.bremen.de/ sixcms/detail.php?gsid= bremen64.c.1580.de http://www.kogis.bremen.de/ sixcms/detail.php?gsid= bremen64.c.8507.de http://www.kogis.bremen.de/ sixcms/detail.php?gsid= bremen64.c.1668.de http://www.kogis.bremen.de/ sixcms/detail.php?gsid= bremen64.c.1582.de 592 447 5,499 465 351 4,168 504 345 4,566 416 260 2,597 340 242 3,260 488 235 4,534 296 213 2,553 422 212 3,874 302 203 6,026 274 196 2,849 14 http://www.kogis.bremen.de/ de 381 152 18,627 KoGIs Seite 33 13.07.2009

15 16 17 18 19 20 tail.php?template=01_css_d& font=0 http://www.kogis.bremen.de/ detail.php?template=01_css_d& font=0&print=1 http://www.kogis.bremen.de/ sixcms/detail.php?gsid= bremen60.c.1419.de http://www.kogis.bremen.de/ sixcms/detail.php?gsid= bremen64.c.1674.de http://www.kogis.bremen.de/ sixcms/detail.php?gsid= bremen64.c.1589.de http://www.kogis.bremen.de/ sixcms/detail.php?gsid= bremen64.c.1586.de Seite Treffer Besucher Bandbreite (KB) http://www.kogis.bremen.de/ sixcms/detail.php?id= 1419 378 151 18,502 255 149 1,726 191 143 1,295 174 142 1,011 183 134 1,302 341 133 2,006 4.3.2 Dateien Die am häufigsten herunter geladene Datei ist eindeutig die robot.txt. Die robots.txt ist eine für Suchmaschinen wichtige Datei, da diese immer zuerst abgefragt wird. In dieser Datei stehen dann Anweisungen, was (nicht) indexiert werden soll. Danach kann man sehr gut erkennen, welche PDF Dateien am meisten nachgefragt werden. Dies wären in unserem Fall beispielsweise der Handlungsleitfaden zum Erstellen von Bildern für das Internet der Genderleitfaden das Handbuch zur Rechteverwaltung das Handbuch für Chefredakteure die Liste der Ansprechpartner für die Ressorts das KoGIs Organisationshandbuch das IFG Handbuch KoGIs Seite 34 13.07.2009

die Nutzungsbedingungen für eigene Weiterentwicklungen im SixCMS Hinweis: Unser Redakteurshandbuch wurde unter den ersten zehn Dateien nicht mit aufgeführt, da der Dateiname immer aktualisiert im Netz zur Verfügung gestellt wurde. Somit müssten eigentlich alle Einträge, die zum Redakteurshandbuch gehören, aufsummiert werden. Aus diesem Grund werden wir die Namen von Dateien, die oftmals aktualisiert werden, für die Zukun ft immer gleich lassen, damit sie in der Statistik auch sinngemäß auftauchen. 4.3.3 Verzeichnisse Da in KoGIs nur sehr wenig mit Aliasen gearbeitet wird, ergibt die Analyse der Verzeichnisse auch keine wirklichen Neuerungen. Das Verzeichnis "/sixcms/" bzw. Das oberste Verzeichnis "/" wird am häufigsten aufgerufen, gefolgt von den Bilderverzeichnissen (für Bilder der Layoutelemente einer jeden Seite sowie die Absatzbilder). Sollten Dienststellen verstärkt mit Aliasen arbeiten und beispielsweise auch diese Kurzadressen veröffentlichen, ist mit einer erhöhten Nutzung zu rechnen, die sich in der Analyse ebenfalls darstellen müsst e. 4.3.4 Pages and Queries Die Übersicht der Seiten und zugehörigen Aufrufen ergibt, dass über 3.000 Besucher bereits vor dem Laden der ersten Seite die Verbindung unterbrochen haben, über 3.000 Besucher eine Seite geöffnet, über 1.000 zwei Seiten, knapp 900 drei Seiten usw. Page Views per Visitor Visitors 1 0 page views 3,789 2 1 page view 3,269 3 2 page views 1,021 4 3 page views 887 5 4 page views 802 KoGIs Seite 35 13.07.2009

Page Views per Visitor Visitors 6 5 page views 412 7 6 page views 314 8 7 page views 284 9 8 page views 156 Die hohe Zahl der Nutzer, die keine Seite vollständig aufgerufen hat, kann durch Suchmaschinen resultieren, die nach Neuerungen auf den Seiten suchen, aber bereits sehr frühzeitig (vor dem vollständigen Laden) abbrechen. Fehlerhafte Seiten bzw. sehr große Dateien, die aufgrund der Größe nicht vollständig geladen werden, führen ebenfalls zu derartigen Ergebnissen. Da unsere Handbücher und Schulungsunterlagen sehr groß sind, kann dies die hohe Abbruchrate erklär en. 4.3.5 Einstiegsseiten Zu den häufigsten Einstiegsseiten gehört das Template "99_soap_client_d", weil damit der Aufruf zum Datentransfer der IFG Informationen an das zentrale Register gesteuert wird. Diese "Seite" wird alle zehn Minuten (24 Stunden am Tag) aufgerufen und sorgt dementsprechend für zahlreiche Einträge. Diese Einträge sollten durch Filter bereits von der Analyse ausgenommen werden. Die Startseite ist danach mit großem Abstand die am häufigsten vorkommende Einstiegsseite ("/", da explizit mit angegeben und "detail.php?gsid=bremen02.c.730.de" für die eigentliche Startinhaltsseite). Weiterhin wurde der RSS Feed über die Adresse direkt eingegeben, die Seiten der Schulungstermine (http://www.kogis.bremen.de/sixcms/detail.php?gsid=bremen64.c.1723.de) sowie des internen Bereichs (http://www.kogis.bremen.de/sixcms/detail.php?gsid=bremen64.c.1563.de) ebenfalls direkt über die Adresse eingegeben, anstatt über die Startseite zu navigieren. KoGIs Seite 36 13.07.2009

4.3.6 Ausstiegsseiten In unserem Fall verwundert es nicht, dass die Einstiegsseiten auch gleichzeitig die Ausstiegsseiten sind, da die Besucherzahlen ja ergeben haben, dass die meisten Besucher lediglich eine Seite betrachten. Da der größte Anteil der Besucher wahrscheinlich Suchmaschinen sind, ist diese Zahl auch nicht verwunderlich. 4.3.7 Pfade Die Darstellung der Pfade durch den Webauftritt zeigt in unserem Beispiel kaum neue Erkenntnisse, da nur wirklich wenige Besucher durch die Seiten stöbern sondern eher gezielt zu den Informationen gelangen. Da die Startseite die am stärksten besuchte Seite und zugleich die am häufigsten genutzte Ein und Ausstiegsseite ist, findet sich dieses Ergebnis auch in dem aufgeführten Pfadverlauf wieder. KoGIs Seite 37 13.07.2009

Beim Aufbau unseres Webauftritts wurde auf eine flache Struktur (möglichst ohne Verzweigungen) geachtet, was sich in dem Surfverhalten der Besucher auch spiegelt 1. Pfad Besucher % von Gesamt 1 /rss/ 750 17.83% 2 3 4 5 6 / > /sixcms/detail.php?gsid=bremen02.c.730.de Startseite /sixcms/media.php/13/handlungsleitfaden_bilder.pdf Handlungsleitfaden Bilder /sixcms/detail.php?gsid=bremen02.c.730.de Startseite /sixcms/media.php/13/genderleitfaden.pdf Genderleitfaden / > /sixcms/detail.php?gsid=bremen02.c.730.de > /sixcms/detail.php?gsid=bremen64.c.1723.de Startseite > Schulungstermine 420 9.98% 319 7.58% 120 2.85% 79 1.88% 68 1.62% 7 /robots.txt 63 1.50% 8 9 10 11 12 13 /sixcms/media.php/13/kogis_organisationshandbuch.pdf Organisationshandbuch für KoGIs /sixcms/detail.php?gsid=bremen64.c.8524.de RSS Feed /sixcms/media.php/13/rechteverwaltung_2007_12_07.pdf Handbuch zur Six Rechteverwaltung /sixcms/media.php/13/19 12 2006 Protokoll Workshop zur erweiterten Nutzung der SixCMS.pdf Protokoll eines KoGIs Workshops für Eigenentwicklungen /sixcms/detail.php?gsid=bremen64.c.1723.de Schulungstermine / > /sixcms/detail.php?gsid=bremen02.c.730.de > / > /sixcms/detail.php?gsid=bremen02.c.730.de 53 1.26% 35 0.83% 35 0.83% 35 0.83% 32 0.76% 31 0.74% 14 /sixcms/media.php/13/suchmaschinenoptimierung_sixcms_1_1.pdf 29 0.69% 15 /sixcms/media.php/13/gleichstellungsgesetz für Bremen.pdf 27 0.64% 16 /sixcms/media.php/13/ansprechpartner_multiplikatoren.pdf 23 0.55% 17 /sixcms/detail.php?gsid=bremen64.c.1668.de Anwenderübersicht 18 0.43% 18 /sixcms/media.php/13/2008 03 03_IST Analyse KoGIs.pdf 18 0.43% 19 /sixcms/media.php/13/2008 04 09 Abschlussbericht.pdf 18 0.43% 20 21 /sixcms/detail.php?gsid=bremen64.c.1654.de Hintergrundberichte / > /sixcms/detail.php?gsid=bremen02.c.730.de > /sixcms/detail.php?gsid=bremen64.c.2124.de 17 0.40% 17 0.40% 1 Die Auflistung der Pfade erfolgte nach Anwendung eines Filters, der die Templates bewusst aussortiert, damit nur de Inhaltsseiten übrig bleiben. Vereinzelt wurden die Seitennamen ermittelt und eingetragen. KoGIs Seite 38 13.07.2009

Pfad Besucher % von Gesamt 22 /sixcms/media.php/13/2008 04 09 Anlage 2 Bericht.pdf 16 0.38% 23 /sixcms/detail.php?gsid=bremen02.c.734.de 15 0.36% 24 25 26 / > /sixcms/detail.php?gsid=bremen02.c.730.de > /sixcms/detail.php?gsid=bremen64.c.1668.de /sixcms/media.php/13/anhang zum Zusatzmodul_IFG_2008_04_14.pdf / > /sixcms/detail.php?gsid=bremen02.c.730.de > /sixcms/detail.php?gsid=bremen64.c.1674.de 14 0.33% 14 0.33% 14 0.33% 27 /sixcms/media.php/13/zusatzmodul_ifg_2008_05_26.pdf 14 0.33% 28 /sixcms/detail.php?gsid=bremen64.c.2100.de 14 0.33% 29 /sixcms/media.php/13/eigenentwicklungen mit den KoGIs Basismodulen 2006 12 19.pdf 13 0.31% 30 /sixcms/media.php/13/19 12 2006 Protokoll Workshop.pdf 13 0.31% 4.3.8 Dateitypen Die am häufigsten angeforderten Dateitypen sind php (für die Seiten und Funktionen), gif, jpg und png für die Bilder (Layout und Absatzbilder) sowie pdf für die Dokumente: 4.4 Besucher Diese Auswertungen zeigen die einzelnen Besucher nach z.b. Firmen (Hosts) oder Ländern sortiert. Da in Deutschland sehr viele Nutzer über T Online oder AOL ins Internet gehen, findet sich natürlich sehr häufig t dialin.net oder proxy.aol.com in der Liste. Gut zu Erkennen sind auch die Suchmaschiie sich in der Regel als Crawler ausgeben wie z. B. crawler. googlebot.com o. nen, d ä. 4.4.1 Hosts Als erste Hosts finden sich zwei Server der Brekom, da vor allem die Mitarbeiter/ innen der bremishen Verwaltung die Webseiten besuchen. Danach folgen vor allem Suchmaschinen aus den USA. KoGIs Seite 39 13.07.2009