Join² Ein INVENIO Repository Framework Martin Köhler 0000-0003-0617-3319 HZG 29.03.2017 https://bib-pubdb1.desy.de/record/319799
Hintergrund und Zielsetzung Gestiegene Anforderungen an institutseigene Publikationsdatenbanken Nutzung für die Wissenschaft: > Literaturverwaltung für Wissenschaftler personalisierte Körbe Exportfunktionen (BibTeX, Endnote etc.) Volltextzugang (auch in press, Preprints) > Publikationslisten für Internetauftritte > Austausch mit Kollegen interne Sammlungen für Institute oder Arbeitsgruppen Bewertungen > Integration vorhandener Bibliotheksdienste > Anbindung an (OA-)Suchmaschinen > OpenAIRE-Lieferung istock.com/jgroup Martin Köhler HZG 29.03.2017 Seite 2
Hintergrund und Zielsetzung II Nutzung in der Forschungsevaluation > Normsätze ermöglichen genaue Abfrage von Publikationslisten für interne (z.b. HGF) und internationale Evaluationen (z.b. OpenAIRE) über Autoren Institute und Teilinstitute Forschungsprojekte Zeitschriften > Schnittstellen zu Zitationsdatenbanken vereinfachen Datenerhebung für bibliometrische Analysen > Einfache Datenerfassung > Beschleunigung des Workflows CC-BY-SA-3.0, via Wikimedia Commons Martin Köhler HZG 29.03.2017 Seite 3
Umsetzung > Systembasis: Invenio (Open-Source-Software, CERN) > Datenformat: Marc2 > Direkte Verknüpfungen zur weiterführenden Recherche oder Literaturbestellung > Daten über interne Strukturen Institutsbezeichnungen Autorennamen Statistikschlüssel (Projekte, Datenbankabdeckung) > Implementierung und Entwicklung als JOIN² Projekt Synergien bei Entwicklung, Wartung und Betrieb Gemeinsame Normdaten Einheitliches System Martin Köhler HZG 29.03.2017 Seite 4
Partner im join² Projekt Deutsches Elektronensynchrotron, Zentralbibliothek Forschungszentrum Jülich, Zentralbibliothek GSI Helmholtzzentrum für Schwerionenforschung, Bibliothek + Base-IT Deutsches Krebsforschungszentrum, Bibliothek Maier-Leibniz-Zentrum, Garching RWTH Aachen, Universitätsbibliothek 2000 + 3000 5000 + 1000 1050 iiiiiiiiiiiiii EEEEEEEEEEEEEE 300 9000 Museum Zitadelle Jülich Universität Witten / Herdecke interner Aufbau join² = just another invenio instance 20000 Nutzer + Gäste Ca. 355000 Dokumente, 43800 Open Access + 117000 Normdatensätze Martin Köhler HZG 29.03.2017 Seite 5
Partner im join² Projekt: Webseiten Powered by developed at CERN Martin Köhler HZG 29.03.2017 Seite 6
Publikationslisten FLA CFEL Martin Köhler HZG 29.03.2017 Seite 7
Systemarchitektur INVENIO > Web Server (Apache) > MySQL Datenbank > INVENIO ist in python geschrieben > Integration in IT Infrastructure nötig Join² > Zusätzliche Module (perl & python) > IT Experten zum Aufsetzten und Konfigurieren nötig > IT Know How auch zum Betrieb! Martin Köhler HZG 29.03.2017 Seite 8
Workflow Martin Köhler HZG 29.03.2017 Seite 9
Beispiel der Eingabe: PubDB / DESY Import-Feld (DOI, arxiv,...) Füllt die meisten Felder! Gruppe, Institut,... Programm-orientierte Förderung (POF) Auswahl weiterer Grants, wie EU-Projekte, SFB, BMBF, etc. Experimente, Beamlines, Facilities, etc. Autoren-Erkennung Journal- und Konferenz- Informationen Martin Köhler HZG 29.03.2017 Seite 10
Publikationslisten VITA Publikationen (Lebenslauf/Literaturlisten): Frühere Veröffentlichungen Externe Messungen Vollständige Liste der (eigenen) Veröffentlichungen in der Datenbank für Webseiten oder Berichte Standardisierte Ein- und Ausgabeformate Martin Köhler HZG 29.03.2017 Seite 11
Genehmigung einer Veröffentlichung (Workflow) > Eintrag in der Datenbank mit Volltext > Genehmigungsformular drucken > Bei Genehmigung: Bibliothek ergänzt benachrichtigt Nutzer > Nutzer vervollständigt Eintrag nach Erscheinen Martin Köhler HZG 29.03.2017 Seite 12
Statistikschlüssel in MARC21 Typischer Normdatensatz unserer Periodical (Zeitschriften) Basiert auf der Zeitschriftendatenbank (ZDB) der Staatsbibliothek zu Berlin ID-basiert, damit weiterer Content suchbar Recent Publications Anreichern mit Statistik-Informationen, wie gelistet in SCOPUS, etc. Basis für Suche auf Statistikschlüssel pro Jahr, pro POF-Programm, etc. Martin Köhler HZG 29.03.2017 Seite 13
Typische Normdatensätze für Grants Abbildung von Strukturen, wie übergeordnete Grants Verknüpfung zu bibliografischen Records Enthält Zuordnungen, wie Sprecher, Institute, etc. ID-suchbar Martin Köhler HZG 29.03.2017 Seite 14
Forschungsevaluation https://bib-pubdb1.desy.de/staturl.py: Vorauswahl der Statistik Welches Jahr, welcher Zeitraum? Ist mindestens ein interner Autor dabei? Ist mindestens ein externer Autor dabei? Auswahl der POF-Periode (POF I-III) Will man auch noch nicht von der Bibliothek freigegebene Publikationen zählen? Welche Kategorie? (Forschungsbereich, Programm, Topic, Subtopic) Nutzt man den Cache oder will man eine neue Rechnung anstoßen? Welche Teile will man berechnen? Martin Köhler HZG 29.03.2017 Seite 15
HGFStatistics2: Das Statistik-Tool von Join 2 Zusammenfassung: Überblick der Einrichtung Aufschlüsselung nach Statistikschlüssel Aufschlüsselung nach Publikationstypen Erfassung erfolgt über WEB -Jahr (wissenschaftlicher Ergebnisbericht) Zahlen sind Hyperlinks und führen zu den Suchanfragen gegen die Datenbank Anzeige und Auswahl gängiger Ausgabe-Formate (EndNote, BibTeX, RIS) Martin Köhler HZG 29.03.2017 Seite 16
HGFStatistics2: Ausführliche Statistiken Überblick der POF-Programme, Gruppen, Grants, Experimente oder Konferenzen: Aufschlüsselung aller relevanter Publikationstypen / statistischen Schlüssel Komplett als Hyperlinks zu den Suchabfragen aufgebaut Voll durchsuchbar und individuell einstellbar Martin Köhler HZG 29.03.2017 Seite 17
HGFStatistics2: Klick auf ISI + Scopus (POF3) Beispiel einer Query (Link): Suche nach Schlüssel oder Kombinationen daraus, Schlüssel für mindestens einen internen Autor, Collection (VDB), WEB-Jahr Auflistung aller zutreffenden Publikationen in Kurzanzeige Möglichkeit anderer Ausgabe- Formate für Listen in diversen Literatur- Verwaltungsprogrammen (EndNote, JabRef, Zotero, etc.) Martin Köhler HZG 29.03.2017 Seite 18
Bibliothekssystem > DESY Migration von Aleph 22 zu Invenio > Reverse Engineering für Bestand und Historie > Nutzerkonten über die vorhandenen Personennormsätze > SIP Selbstverbucher > Erwerbungsmodul noch in der Evaluation Martin Köhler HZG 29.03.2017 Seite 19
Ausblick Invenio 3.0 > Zur Zeit Alpha Stadium, aber vielversprechend > Neue Technologie (Flask, Jinja2, SQLAlchemie, PostgeSQL, Elasticsearch) > ~ 50 unabhängige Komponenten > Basissystem benötigt mindestens 6 Rechnernodes! > Neue Konzepte für Installation und Betrieb Docker Vagrant Kickstart + Overlays > Eine Herausforderung Martin Köhler HZG 29.03.2017 Seite 20
Thank You Martin Köhler HZG 29.03.2017 Seite 21