Einsatz kommerzieller und Open-Source Software für wissenschaftliche Workflows zur Datenpublikation in Marc Adolf & Wilhelm Hasselbring
Das Projekt-Konsortium Arbeitsgruppe Software Engineering Universitätsbibliothek der CAU Rechenzentrum der CAU Deutsche Zentralbibliothek für Wirtschaftswissenschaften Kieler Datenmanagementteam Bibliothek des GEOMAR Daten- und Rechenzentrum des GEOMAR
Einsatzbereich für PubFlow Einsatzbereich PubFlow (Datenpublikation)
Einsatzbereich für PubFlow Einsatzbereich PubFlow (Datenpublikation)
Publikation mit veröffentlichten Daten
Beispielworkflow zur Datenpublikation
Architektur: PubFlow als JiraPlugin Atlassian Jira Jira Issue System Co r e Ji ra Man agement Connector PubFlow Jira Plugin Workflow W o r kfl o w B r ok er Pu bfl ow Backen d jbpm Rest-Connector <<use>> Repositori es & Common PubFlow API EPrints-WF Service CVOO Rest CV OO-WF S ervice
PubFlow-Ticket in Jira
jbpm Beispiel jboss Quelle: http://www.jbpm.org/landingpage/09_eclipse_big.png
Vergleich: Jira vs jbpm Kosten Atlassian Jira jbpm Kauf einmalig pro Version Anschaffung kostenlos Kostenlose Version für Open-Source Projekte Apache Software License 2.0 Monatliche Kosten mit inklusivem Hosting Kostenmodell abhängig von der Nutzerzahl Betriebskosten (Personal + Hardware) Betriebskosten (Personal + Hardware) Support Support Quelle: https://www.atlassian.com/software/jira Quelle: http://jbpm.org/
Vergleich: Jira vs jbpm Support Atlassian Jira jbpm Forum Forum Mail-Anfragen (kostenlos) (IRC-)Chat Reaktiver Support (35k$/y) (kostenpflichtiger Support über Red Hat) Proaktiver Support (60k$/y) Quelle: https://www.atlassian.com/software/jira Quelle: http://jbpm.org/
Vergleich: Jira vs jbpm Dokumentation Atlassian Jira jbpm Getting Started Guide Umfangreicher User Guide Kaum Dokumentation Dokumentation durch Java-Doc Quellcodes vollständig einsehbar (Nach Registrierung + Lizenz) Quellcode vollständig als O-S einsehbar Quelle: https://www.atlassian.com/software/jira Quelle: http://jbpm.org/
Zusammenfassung (Semi-) Automatisierung von Publikationsworkflows Einsatz von kommerzieller und Open-Source Software Verschiedene Bezahl-, Lizenz- und Support-Varianten Dokumentation schwankt stark zwischen Softwareprojekten Unangekündigte Major-/API-breaking changes Änderungen kaum dokumentiert Updatebedarf auch für Abhängigkeiten (Java) Bisher keine neuere von jbpm Version nötig. pubflow.de
Weitere Software, Projekte und Services Galaxy (www.usegalaxy.org) (www.gfbio.org) (www.langzeitarchivierung.de) (www.textgrid.de) Apache Taverna (www.taverna.incubator.apache.org) CWA Flow (www.cwa.de) (www.bioconductor.org) BPipe (www.docs.bpipe.org) (www.scholarlyworkflow.org (www.pubflow.de) Pangaea (www.pangaea.de) (www.sprint.ly/) (http://kieker-monitoring.net) (www.stackfield.com/) (www.uni-trier.de)
Vorteil von Datenpublikation Quelle: Sharing Detailed Research Data Is Associated with Increased Citation Rate, Heather A. Piwowar, Roger S. Day, Douglas B. Fridsma
Provenienzdaten Rohdaten Datenprodukt? Provenienzdaten
Provenienzdaten
Beispielpreise für Jira
Architekturvision I d e nti f ic a ti o n Se rv i ce ( G ND) Atlassian Jira <<compon en t>> I dent if ic at io n Se rv ic e (O RCID) GND API (SRU) ORCID API Jira I ssue System PubFlow Jira Plugin Co r e Ji ra Ma na ge me n t Con ne ct or <<compon en t>> Workflow Co nne c ti on Workflow Broker Workflow Distributer Re st -Con nec t or W or kf l ow Ca l l w i th Re st jbpm Re st -Con ne ct or Di re c te d W or k fl ow C al l Pu bf l ow Bac k e nd <<use>> Rep os i to rie s & Common Pu bfl ow API EPri nts- WF Se rvic e CVO O Rest CVOO -WF Se rv ic e