Universitätsbibliothek Anmerkungen zu UStat Dr. Andreas Sabisch FU Berlin Universitätsbibliothek Copyright Creative Commons Attribution License (CCAL), Version 2.0 oder später http://creativecommons.org/licenses/by/2.0/
Gliederung Kurzer Überblick über Ustat Probleme: Datenprobleme Formatierungsprobleme Übersichtsprobleme Aussreiser SFX und Ustat Nutzungsdatendaten 2
Ustat Ziel: Sammeln und gemeinsame Auswertung von Nutzungsdaten elektronsicher Medien Derzeit werden Daten nach dem Counterstandart von Journals und Datenbank unterstützt, nicht jedoch Nutzungsdaten für Bücher Ein 'System as a Service' (SaaS) Programm von ExL, gehostet in Chicago/USA Zugänglich über einen Webbrowser für jeden VERDE und SFX- Kunden kostenloser account muss vorher beantragt werden Unterstützt SUSHI für eine Reihe von Anbietern FU ist dabei, eine Arbeitshilfe zu erstellen diese können wir weitergeben, wenn sie fertig ist. 3
Counter und Sushi Counter ist ein Standard, der definiert was wie gezählt wird wie es (einheitlich) präsentiert werden muss für Journals, Datenbanken und Bücher Shushi ist ein Protokoll, mit dem Counterdaten automatisiert beim Provider abgeholt und maschinell weiterverarbeitet werden kann Ustat unterstützt Counter JR1 und JR3 sowie DBR1 und DBR3, kein Bookreport; Sushi in Ustat unterstützt derzeit nur JR1 Zum weiterlesen: http://www.projectcounter.org/about.html Und wie wird gezählt: http://www.projectcounter.org/r4/appd.pdf 4
5
Woher kommen die Nutzungsdaten der FU? Per SuSHI (14 Provider) Download vom Anbieter (43 Provider) es werden Logindaten benötigt und viel Spürsinn Downlaod und 'So tun als ob' (2 Provider) Grundsätzlich keine Counterfähigen Daten (6 Provider) Einige Anbieter haben nur Journal- oder Datenbankstatistiken, einige beides ('Volltextdatenbanken') Noch offen: Viele kleine Anbieter 6
Datenprobleme Daten werden über SUSHI gehostet, aber Nicht alle SUSHI-Provider sind in Ustat schon eingerichtet Daten nicht immer korrekt, Kontrolle vor Auswertung notwendig Daten müssen per Download geholt werden Admin-Daten sind ggf. aus div. Quellen zu beschaffen Daten werden per Mail gesendet Ablage erfolgt durch (verschiedene) Empfänger zu 'beliebigen' Zeitpunkten Ablage in Dateisystem, Systematik und Namenskonventionen notwendig Beim öffnen Daten fehlformatiert also nie!!! zur Kontrolle öffnen (s.u.) Daten nicht in Counter verfügbar Uminterpretieren? Keine oder fehlerhafte Daten - unbrauchbar Andreas Sabisch, Marc Spieseke FU Berlin E-Medien in der FU 12.04.2012 7
Formatierungsproblem Öffnen von CVS- oder Excel-Daten führt immer zu Umformatierungen in den Dateien Grund: Deutsche Ländereinstellung interpretiert Amerikanische Formate (Datumsangaben, ISSN!) falsch Lösung: Im Bereich Systemsteuerung --> Länderspezifische Einstellungen vor der Datenbearbeitung die Ländereinstellung von Deutsch in Englisch (USA) ändern. Keine anderen Arbeiten durchführen, zurückstellen nach Änderung. Andreas Sabisch, Marc Spieseke FU Berlin E-Medien in der FU 12.04.2012 8
Übersichtsproblem Bei Zsn ca. 400 Targets, ca. 800 DB wo fangen wir an? Was ist wichtig? Was gibt es schon? Lösung: Export der Nutzungsstatistik MetaLib bzw. Target- Statistik für das betreffende Jahr aus SFX Beide Dateien dienen als initiale Bearbeitungslisten, Click- Though- bzw. Request-Rate werden als Wichtigkeit interpretiert Verfolgen der schon bearbeiten Quellen, Anmerkungen, Hinweise Andere Wichtung (Kosten) möglich Andreas Sabisch, Marc Spieseke FU Berlin E-Medien in der FU 12.04.2012 9
Targets, Datenbanken, Verlage, Platformen Kompletter Wirrwarr in der Namensgebung Aufpassen: Da Plattform und Verlag identische Daten, aber unterschiedliche Namen verwenden, sind Doppel-Uploads möglich (Metapress/Springer) Manche Verlage/Targets sind in Nutzungsdaten anderer Verlage enthalten ( Kluwer in Springer & Metapress ) Vertragsbezogene Analyse ist nur eingeschränkt möglich, so ist z.b. die Trennung zwischen Nationallizenzen (Archiv) und eigenem Bestand meist unmöglich Es ist eine Auswertung Zeitschriften bezogen möglich, es kann dabei nach Plattformen getrennt werden Volltextdatenbanken bieten manchmal Journal- und Datenbank- Counter (Ebsco, JSTOR), manchmal nur Datenbank-Counter (CIAO/Columbia, Beck als Sonderfall) Andreas Sabisch, Marc Spieseke FU Berlin E-Medien in der FU 12.04.2012 10
Aussreiser Gelegentlich sind in einem Monat abstruse hohe Werte zu finden, die durchaus um den Faktor 20 über der normalen Nutzung liegt Beispiele: Digizeitschriften, Wiso-Praxis Diese werden durch Mittelung auf die vor gegangenen und nachfolgenden Monatsnutzung angepasst Andreas Sabisch, Marc Spieseke FU Berlin E-Medien in der FU 12.04.2012 11
Vergleich SFX-Nutzung vs. Counter-Daten 90 80 70 60 50 40 30 20 10 Zsn-Request/Clicktroughs Quotient (Zsn-Requests nach Counter)/(SFX- Nutzungsdaten): Mittlerer Faktor: 10 Verlage mit spezialisiertem Angebot und/oder wenig Zsn zeigen starke Abweichungen nach oben Sonderfälle: Spezialisierte Volltextdatenbanken wie z.b. Beck! Zur Abschätzung der Gesamtnutzung sind die SFX- Clicktrough-Daten der Targets ausreichend und können mit dem Faktor multipliziert werden 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 Verlage nach Anz. Zsn Andreas Sabisch, Marc Spieseke FU Berlin E-Medien in der FU 12.04.2012 12
Zusammenfassung Überblick über Ustat: SaaS, SFX-Nutzer Sammeln von Counter-Daten für Journals und Datenbanken Probleme: Datenprobleme Formatierungsprobleme Übersichtsprobleme Aussreiser SFX und Ustat Nutzungsdatendaten 13