R im Enterprise-Modus Skalierbarkeit, Support und unternehmensweiter Einsatz Dr. Eike Nicklas HMS Konferenz 2014
Was ist R? R is a free software environment for statistical computing and graphics - www.r-project.org Open Source (GPL) Nutzung an Unis Talent Pool Innovative Methoden früh verfügbar Viele Packages Große Community 2
Analytische Projekte sind anders Agiles Vorgehen Explorative Arbeitsweise Trial and Error Ähnlich wie in Forschung 3
R im unternehmensweiten Einsatz Aus der Forschung in die Produktion Herausforderungen Deployment Qualitätssicherung Benutzeroberflächen Einbindung in Infrastruktur Skalierbarkeit Support Validierung Option: Erweiterung von bestehenden Produkten Oracle, SAP HANA, Tableau, Microsoft Azure 4
Software Engineering Entwicklungsumgebungen, Unit Testing, Revolution Analytics DevelopR Basierend auf Visual Studio RStudio IDE für Desktop und Web Demo 5
Zentralisierte Infrastruktur für Entwicklung und Endanwendungen RStudio Server Entwicklung auf Server via Web Interface Rserve TCP/IP Server für R Revo DeployR Basiert auf Rserve Zentrale Administration von Nutzern, Skripten, Load Balancing / Scheduling Web API Desktop Applications (i.e. Excel) R R R scripts Business Intelligence (i.e. Cognos) Client libraries (JavaScript, Java,.NET) RevoDeployR Web Services Session Management Authentication HTTPS JSON/XML Data/Script Management Administration R Grid Node Interactive Web or Mobile Applications 6
Einbindung in Infrastruktur Anbindung an Frontends und Datenquellen Revo DeployR Beispiel: Anbindung an Excel (Thementisch) Revo ConnectR für Anbindung an andere Datenquellen SAS, SPSS, Textdateien Datenbanken: ODBC, Teradata Hadoop HDFS 7
Skalierbarkeit Revo ScaleR: Parallelisierbare Algorithmen Parallelisierbare und skalierbare Methoden für Datenanalyse, Machine Learning, Monte Carlo Simulationen, Eigenes Binärdatenformat (XDF) Demo 8
Skalierbarkeit Revo DistributedR: Verteiltes Rechnen Verwaltung von Ressourcen auf vielen verschiedenen Plattformen Windows, Linux, Hadoop, In-Database Nutzung im Cluster, Grid Integration von R in massiv parallele Maschinen: Netezza, Teradata 9
Benutzeroberflächen Präsentation, Interaktion Weboberflächen aus R Code erstellen Deployment mit Shiny Server oder in der Cloud Beispiel vom Thementisch Einführung in R 10
Einsatz im regulierten Umfeld Validierung? Validation - Establishing documented evidence which provides a high degree of assurance that a specific process will consistently produce a product meeting its predetermined specifications and quality attributes. 11
Einsatz im regulierten Umfeld Häufige Bedenken We cannot use R because it is not validated The FDA does not allow the use of R? 12
Einsatz im regulierten Umfeld Was sagt die FDA? R use at the FDA is completely acceptable and has not caused any problems. 13
Support Wo bekomme ich Hilfe? Community Support Foren Mailing Listen, r-help@r-project.org ca. 1000 Nachrichten / Monat Anbieter kommerzieller Erweiterungen von R Revolution Analytics RStudio Drittanbieter wie HMS Quelle: www.vipernet-design.ch 14
Fazit Und nun? R bietet viele Möglichkeiten im Bereich Analytics und Datenanalyse R ist eine Möglichkeit Lizenzkosten zu sparen und vorhandenes Know-How der Mitarbeiter zu nutzen R ist auf dem Weg unternehmenstauglich zu werden Wie stehen die Chancen, dass R sich im Unternehmensumfeld etabliert? 15
Vielen Dank für Ihre Aufmerksamkeit! Dr. Eike Nicklas Software-Ingenieur eike.nicklas@analytical-software.de HMS Analytical Software GmbH Rohrbacher Str. 26 69115 Heidelberg www.analytical-software.de info@analytical-software.de +49-6221-6051-0 HMS auf XING: https://www.xing.com/company/hmsanalyticalsoftwaregmbh 16