OA-Statistik mit Dspace Ja, Statistiken. Aber. Marco Recke Dspace User Group Treffen * Tübingen 5. Oktober 2015
Ja Statistiken, aber welche stimmt? Sessions TOP Downloads Universität Ulm Volltextserver HTTP-ANALYZE 1
Ja Statistiken, aber welche stimmt? Advanced Web Statistics 7.1.1 2
Beispiel: Dokument 24066 3
Ja Statistiken, aber welche stimmt? 4
Statistiken! Ja, aber welche stimmt? Wie ist der Umgang mit maschinellen Downloads Welchen Regeln, welche Filterlisten? 5
Counting Online Usage of Networked Electronic Resources Internationale Initiative, seit März 2002 Format und Plattform übergreifender Standard 6
ZBW: Econstor 7
Schauen Sie hin What does it mean when an organization states that it is COUNTER compliant? Only the organizations and usage reports listed on the relevant Register on the COUNTER website can be regarded as compliant with that Code of Practice. 8
Vergleichbar? 9
Zusammenfassung Viele haben keine (offen zugängliche) Statistik. Statistik mit Webanalysetools wie AWSTATS oder PIWIK. Statistik nach COUNTER Standard Datenlieferungen an einen Service- Provider (Open-Access-Statistik) 10
OAS -Projekt 05/2008-12/2010: Erste Förderphase 04/2011-04/2013: Zweite Förderphase, Erweiterung der Infrastruktur um weitere Repositorien und OA-Verlage mit dem Ziel, das Projekt in einen stabilen und nachhaltigen Dienst zu überführen. VZG erstmals Projektpartner. OAS -Dienst Seit 05/2013 Weiterentwicklung durch die Göttinger Verbundzentrale des Gemeinsamen Bibliotheksverbundes (VZG), Seit 06/2014 OA-Statistik in das Angebot eingliedert. 11
Weiterentwicklung der Projektsoftware Dazu mussten wir bisher Ca. 50 % des Quellcodes erneuern. Auch der Umfang des Quellcode hat sich nahezu verdoppelt Technische Infrastruktur Leistungsfähige Hardware in virtualisierter Umgebung Anbindung an DFN Wissenschaftsnetz 100 Gigabit/s Support 12
Ziele von OA-Statistik International standardisierte Nutzungsstatistiken Nachhaltige Service-Infrastruktur zur Erfassung und Auswertung von Nutzungsstatistiken Erhöhung der Akzeptanz von Open Access bei Autoren und Rezipienten 13
Partnerprojekte 14
15
Push: Tracker code Wenn ein Download erfolgt, werden die Details als OpenURL an den zentralen Analyseserver übermittelt. Vorteile weniger Overhead, zeitgleiche Übertragung (Ping) Nachteile Datenschutz, nicht reproduzierbar, mehr Aufwand bei der Serverkonfiguration durch Anpassung an verschiedene Repositorien Besucher, die Javascript und/oder Bilder in ihrem Browser blockieren, werden nicht erkannt. 16
Pull: OAI-PMH harvesting Auswertung der Protokolle des Webservers, Verarbeitung lokal auf dem Repository server (Dataprovider) als OpenURLContext Objects Vorteile IP Adressen werden nicht übermittelt (Datenschutz), Reproduzierbar, zeitunkritisch. Nachteile Overhead durch aufwendiges XML, Seitenabrufe, die aus Proxies, Zwischenspeichern o. ä. bedient werden, können vom Server nicht registriert werden 17
www.gbv.de/verbundzentrale/serviceangebote/oas-service/openaccess-statistik-service 18
OA Statistik in der VZG 75 GB Logfiles mit 300 Mio. Logzeilen/Jahr ausgewertet 19
Abruf der Statistikdaten vom Service Provider Grafik, JSON, XML, CSV REST-Schnittstelle, SUSHI geplant 20
Beispiele 21
22
API (1) 23
API (2) Zahlreiche Informationen über den Stand der Bearbeitung 24
API (3) Aktuelle und transparente Information zu den Filterregeln in der Robot List 25
API (4) Identifier und Zugriffszahlen (als Summe total) 26
API (5) Identifier und Zugriffszahlen (als Grafik) 27
Wie nehme ich Teil? (Lizenzen, Kosten, Ablauf) Dataprovider herunterladen, einrichten Anpassungen an das Repositorium vornehmen (Reguläre Ausdrücke, Identifier etc.) OAI-PMH Schnittstelle einrichten VZG: Serviceprovider einrichten Los gehts 28
Wie nehme ich Teil? (Lizenzen, Kosten, Ablauf) Preise Preisgruppe Kosten pro Jahr Grafikpaket small 1-1.000 Titel 150,- 25,- medium 1.001 bis 5.000 Titel 250,- 50,- large 5.001 bis 50.000 Titel 350,- 75,- extra large mehr als 50.000 Titel 400,- 100,- Für die Einrichtung des Serviceproviders sowie den technischen Support bei der Einrichtung des Dataproviders werden abhängig von der gewählten Preisgruppe ein oder zwei Tagessätze in Rechnung gestellt Preisgruppe small oder medium : 1 Tagessatz Preisgruppe large und extra large : 2 Tagessätze Lizenzen: Creative Commons 4 CC BY 4.0 29
30