Oracle R zum Anfassen



Ähnliche Dokumente
Analytik Mittels R als übergreifende Plattform

Oracle BI&W Referenz Architektur Big Data und High Performance Analytics

Was ist Windows Azure? (Stand Juni 2012)

DATA WAREHOUSE. Big Data Alfred Schlaucher, Oracle

Step 0: Bestehende Analyse-Plattform

Microsoft Azure Deutschland ist jetzt verfügbar -

June Automic Hadoop Agent. Data Automation - Hadoop Integration

R Statistik im Oracle Produktstack

Das Beste aus zwei Welten

Mission. TARGIT macht es einfach und bezahlbar für Organisationen datengetrieben zu werden

BIW - Überblick. Präsentation und Discoverer Demonstration - Teil 1 - Humboldt Universität zu Berlin am 10. Juni 2004

R im Enterprise-Modus

Oracle Data Warehouse Mit Big Data neue Horizonte für das Data Warehouse ermöglichen

ETL in den Zeiten von Big Data

Archive / Backup System für OpenVMS

OERA OpenEdge Reference Architecture. Mike Fechner PUG Infotag 19. Mai 05 Frankfurt

Copyr i g ht 2014, SAS Ins titut e Inc. All rights res er ve d. HERZLICH WILLKOMMEN ZUR VERANSTALTUNG VISUAL ANALYTICS

Von ODBC zu OLE DB. Neue Möglichkeiten der Datenintegration. Harald Gladytz, Team Vertrieb ESRI Niederlassung Leipzig

Webbasierte Exploration von großen 3D-Stadtmodellen mit dem 3DCityDB Webclient

Langzeitarchivierung von Prozessdaten und Auswertung mithilfe des Informationsservers und Processhistorian von PCS7/WinCC

MapReduce und Datenbanken Thema 15: Strom bzw. Onlineverarbeitung mit MapReduce

Möglichkeiten für bestehende Systeme

Oracle R Enterprise. STCC DB Detlef E. Schröder Oracle DWH Community

EXASOL Anwendertreffen 2012

Hadoop Demo HDFS, Pig & Hive in Action. Oracle DWH Konferenz 2014 Carsten Herbe

Performance Tools. für alle Editionen

Business Intelligence Center of Excellence

O-BIEE Einführung mit Beispielen aus der Praxis

PL/SQL und Ingres. Der beste Weg, die Zukunft vorauszusagen, ist, sie zu gestalten. John Naisbitt (*1930), amerik. Prognostiker

Datenbankenseminar: SAP Reporting Vergleich ABAP vs. Quick View. Dipl. WiFo Sven Adolph

<Insert Picture Here> Oracle Datenbank Einführung Ulrike Schwinn

Agenda. Ziel Problematik OS-Installation Softwareverteilung Inventarisierung Stufenplan

Beratung. Results, no Excuses. Consulting. Lösungen. Grown from Experience. Ventum Consulting. SQL auf Hadoop Oliver Gehlert Ventum Consulting

ORM & OLAP. Object-oriented Enterprise Application Programming Model for In-Memory Databases. Sebastian Oergel

NoSQL-Datenbanken und Hadoop im Zusammenspiel mit dem Data Warehouse

IDS Lizenzierung für IDS und HDR. Primärserver IDS Lizenz HDR Lizenz

Von der spezialisierten Eigenentwicklung zum universellen Analysetool. Das Controlling-Informationssystem der WestLB Systems

Architekturen. Von der DB basierten zur Multi-Tier Anwendung. DB/CRM (C) J.M.Joller

Was ist Analyse? Hannover, CeBIT 2014 Patrick Keller

Darüber hinaus wird das Training dazu beitragen, das Verständnis für die neuen Möglichkeiten zu erlangen.

JEAF Cloud Plattform Der Workspace aus der Cloud

Ablösung von Control-M durch JobScheduler

Java Application 1 Java Application 2. JDBC DriverManager. JDBC-ODBC Br idge. ODBC Driver Manager. Dr iver C. Dr iver D.

Open Source BI 2009 Flexibilität und volle Excel-Integration von Palo machen OLAP für Endanwender beherrschbar. 24. September 2009

MySQL Cluster und MySQL Proxy

Prof. Dr.-Ing. Rainer Schmidt 1

Copyright 2014, Oracle and/or its affiliates. All rights reserved.

Oracle 10g und SQL Server 2005 ein Vergleich. Thomas Wächtler 39221

Microsoft Azure: Ein Überblick für Entwickler. Malte Lantin Technical Evangelist, Developer Experience & Evangelism (DX) Microsoft Deutschland GmbH

THEMA: SAS ADMINISTRATION LEICHT GEMACHT MIT SAS 9.4 ALLE SYSTEME IM BLICK" ANKE FLEISCHER

SAS Education. Grow with us. Anmeldung bei SAS Education. Kurstermine Juli Dezember 2015 für Deutschland, Österreich und die Schweiz

AS/point, Ihr Partner die nächsten 10 und mehr Jahre -

Tuning des Weblogic /Oracle Fusion Middleware 11g. Jan-Peter Timmermann Principal Consultant PITSS

Seminar C02 - Praxisvergleich OLAP Tools

5. Programmierschnittstellen für XML

Backup and Recovery. Der Abschnitt beschreibt Vorgehensweisen zur Sicherung und Wiederherstellung der Daten mit Applikationsmitteln.

1Ralph Schock RM NEO REPORTING

SAP Integration von Business Objects am Beispiel von SAP Student Lifecycle Management. Anke Noßmann Syncwork AG

5. Programmierschnittstellen für XML

Microsoft SQL Server Konfigurierung, Administration, Programmierung

Best Practice Infor PM 10 auf Infor Blending

Open Source BI Trends. 11. Dezember 2009 Wien Konstantin Böhm

SAS Predictive Analytics Factory The SAS approach for the production and maintenance of analytical models

SODA. Die Datenbank als Document Store. Rainer Willems. Master Principal Sales Consultant Oracle Deutschland B.V. & Co. KG

Problemstellung. Keine Chance! Ich brauche eine genaue Spezifikation und dann vielleicht in 3-4 Wochen können Sie einen erstes Beispiel haben!

Configuration Management mit Verbosy OSDC Eric Lippmann

vinsight BIG DATA Solution

Next Generation Cloud

Cubeware Connectivity for SAP Solutions

Technik der SAP-Anbindung Christian Aigner Team Entwicklung, Kranzberg

Fragen zur GridVis MSSQL-Server

BI in der Cloud eine valide Alternative Überblick zum Leistungsspektrum und erste Erfahrungen

Big Data Hype und Wirklichkeit Bringtmehrauchmehr?

LINUX Schulung. FrauenComputerZentrum Berlin. Jutta Horstmann, Mai 2006

Veeam Availability Suite. Thomas Bartz System Engineer, Veeam Software

NovaBACKUP DataCenter 5.0. Screenshots

SEARCH DRIVEN APPLICATIONS MIT DEM CONTENT SEARCH WEBPART

Albert HAYR Linux, IT and Open Source Expert and Solution Architect. Open Source professionell einsetzen

Übersicht Oracle Lizenzierung Oracle Lizenz-Shop

Gut zu wissen... Lorenz Keller Server Technologies Competence Center Nord

Portal for ArcGIS - Eine Einführung

Vorteile von Java und Konvergenz Service Creation mit JAIN Network Management mit JMX Fazit

Verfügbarkeit von Applikationen und Failover Szenarien. Winfried Wojtenek.

Michael Beeck. Geschäftsführer

Arbeiten mit einem lokalen PostgreSQL-Server

Zeitlich abhängig von OWB?

Fujitsu BeanConnect TM V3.0 Software 0 FUJITSU LIMITED 2013

Regionaltreffen Rhein Main 26. März 2007

CAIRO if knowledge matters

3.17 Zugriffskontrolle

Ora Education GmbH. Lehrgang: Oracle Application Server 10g R3: Administration

Grid-Systeme. Betrachtung verschiedener Softwareplattformen zur Realisierung von Grids und Vorstellung des Globus Toolkit Grid Systeme 1

OpenSource Business Strategien. Thomas Uhl Topalis AG

Windows Azure für Java Architekten. Holger Sirtl Microsoft Deutschland GmbH

Zend PHP Cloud Application Platform

Apache HBase. A BigTable Column Store on top of Hadoop

MSSQL Server Fragen GridVis

Zabbix 2.4. What's new? What's new in Zabbix of

IBM Netezza Data Warehouse Appliances - schnelle Analysen mit hohen Datenmengen

Transkript:

Oracle R zum Anfassen Alfred Schlaucher Oracle Deutschland (Data Warehouse) Oliver Bracht Andreas Prawitt Oracle Partner eoda

Oracle R zum Anfassen: Die Themen 09:30 Begrüßung 09:45 R Zum Anfassen Einführung 10:15 Minikurs in der Sprache R Sprachmittel, Hilfen, GUIs zum Erstellen der Skripte Schnell und einfach ansprechende Grafiken erstellen 11:00 Pause 11:15 Showcase Teil 1: Data Mining mit R Vergleich der Genauigkeit zweier Modelle 11:35 Oracle R Enterprise Einfache Anwendung, Performance Showcase Teil 2: Data Mining mit R in der Oracle Datenbank 12:20 Mittagspause 13:00 Big Data & R Hadoop, Map Reduce & R R als Instrument für Prototyping für Big Data 13:30 Abschließende Fragen 2

Oracle und R Oracle: Schwergewicht im Datenbank- und Data Warehouse-Segment Tradition im Umgang mit statistischen Analyse / Data Mining Symbiose Open Source R mit Oracle 3

Potentielle Informationsschätze Alle Kundenkontaktpunkte Alle Geschäftsbeziehungen zu dem Kunden Alle historischen Daten Alle öffentlich verfügbaren Kundendaten Plus soziographische Informationen (Referenzdaten) Ergeben ein vollständiges Bild 360 + neue Geschäftsoptionen 5

Informationsdrehscheibe für alle (!) Sachgebiete Harmonisieren Einheitliche verbundene Stammdaten Einheitliches Verständnis über Sachverhalte Standardisierte Kennzahlen Modelle Simulation Data Integration Layer Enterprise Information Layer Referenzdaten Stammdaten Bewegungsdaten User View Layer Advanced Analytics Ad-hoc Query & Reporting Standardisierte Berichte Stammdaten Referenzdaten Bewegungsdaten Neutrale Sicht auf alle Unternehmens- Bereiche Flexibel für alle Endebenutzer zugänglich 7

Analyseverfahren schon im Data Warehouse vorbereiten Alle Modellformen in einem System Umfangreichste R-Unterstützung Integriertes Data Mining Multidimensionale Speicherung als Add On zum Star User View Layer Mining- Struktur Würfel Relational Oracle R Enterprise Oracle Data Miner Oracle OLAP Any SQL Advanced Analytics Ad-hoc Query & Reporting Standardisierte Berichte Modelle Simulation Star Schema und 3 NF 8

R historisch Freie Programmiersprache für statistisches Rechnen und statistische Grafiken Anlehnung an S und Scheme Ursprünglich 1992 von Ross Ihaka und Robert Gentleman an der Universität Auckland entwickelt Seit 1995 GNU Projekt (freie Software) http://www.r-project.org/ Über Pakete-Konzept beliebig erweiterbar (> 6000) Pakete werden verwaltet und verbreitet über Comprehensive R Archive Network (CRAN) Einsatz an den Universitäten, zunehmend auch im kommerziellen Bereich Als Ersatz für SAS und SPSS geeignet 9

10 TIOBE Programming Community Index for September 2013

Zur Einordnung R universelles Sprachmittel - Flexible Sprache - Formulieren beliebiger Aufgabenstellungen - Geringe Einsatzhürden - mehr und flexiblere Analyse-Verfahren - individuelles Vorgehen - Plattform-unabhängig Günstige Alternative - zu SAS, SPSS - zu manch teuren Analyse Umgebungen - Unterstützung Trend zu mehr Advanced Analytics Zusätzliches Arbeitsumfeld für Oracle - Leichte Bereitstellung von Oracle-DB-Daten - Zugang für nicht SQL- affine MA - Erweiterung der Einsatzmöglichkeiten von R durch R - Enterprise Potentielles Prototyping für Big Data - Zugriff auf HDFS - Map Reduce Jobs - Umgehung von Java-Programmierung - Lösung von Schnittstellen-Problemen 11

Bisherige Art der Interaktion R <-> Datenbank read Flat Files extract / export Database export load SQL RODBC / RJDBC / ROracle R script cron job Paradigm shift: R SQL R R memory limitation data size, call-by-value R single threaded Access latency, backup, recovery, security? Ad hoc script execution 12

Collaborative Execution Model 1 2 3 R Engine Other R packages Oracle R Enterprise packages SQL Results Oracle Database User tables R Results R Engine Other R packages Oracle R Enterprise packages User R Engine on desktop R-SQL Transparency Framework intercepts R functions for scalable in-database execution Interactive display of graphical results and flow control as in standard R Submit entire R scripts for execution by Oracle Database Post processing of results Database Compute Engine Scale to large datasets Leverage database SQL parallelism Leverage in-database statistical and data mining capabilities Collaborative execution with in-database R engine R Engine(s) managed by Oracle DB Database manages multiple R engines for database-managed parallelism Efficient parallel data transfer to spawned R engines to emulate map-reduce style algorithms and applications Enables lights-out execution of R scripts Analytic techniques not available in-database 13

Oracle R Enterprise R workspace console Oracle statistics engine Function push-down data transformation & statistics OBIEE, Web Services No changes to the user experience Scale to large data sets Embed in operational systems Development Production Consumption 14

DATA WAREHOUSE

Oracle R zum Anfassen: Die Themen 09:30 Begrüßung 09:45 R Zum Anfassen Einführung 10:15 Minikurs in der Sprache R Sprachmittel, Hilfen, GUIs zum Erstellen der Skripte Schnell und einfach ansprechende Grafiken erstellen 11:00 Pause 11:15 Showcase Teil 1: Data Mining mit R Vergleich der Genauigkeit zweier Modelle 11:35 Oracle R Enterprise Einfache Anwendung, Performance Showcase Teil 2: Data Mining mit R in der Oracle Datenbank 12:20 Mittagspause 13:00 Big Data & R Hadoop, Map Reduce & R R als Instrument für Prototyping für Big Data 13:30 Abschließende Fragen 16

Oracle R Enterprise Oracle Advanced Analytics - Oracle R Enterprise and Oracle Data Mining R code und/oder SQL Modelle laufen In-Database Große Datenmengen Built-in security 17

Oracle R-Angebote Oracle R Distribution Free download, pre-installed on Oracle Big Data Appliance, bundled with Oracle Linux Enterprise support for customers of Oracle R Enterprise, Big Data Appliance, and Oracle Linux Contribute bug fixes and enhancements to open source R ROracle Open source Oracle database interface driver for R based on OCI Maintainer is Oracle rebuilt from the ground up Many bug fixes and optimizations Oracle R Enterprise Transparent access to database-resident data from R Embedded R script execution through database managed R engines Statistics engine Oracle R Connector for Hadoop R interface to Oracle Hadoop Cluster on BDA Access and manipulate data in HDFS, database, and file system Write MapReduce functions using R and execute through natural R interface 18

Mögliche Szenarien mit Oracle R-Enterprise File System R Engine Direkten Zugriff auf alle Tabellen in der Datenbank File System R Engine Auslagern der Analysen in die Datenbank Zurückholen der Ergebnisse Anlegen neuer Objekte in der Datenbank Parallelisierung durch die Datenbank R Engine R R Engine Engine R Engine R Engine R-Analysen über SQL-Funktionen (Batch) File System SQL Parallelisierung durch die Datenbank R Engine R R Engine Engine R Engine 19

Transparency Layer Support ORE bietet eine in-database execution Funktionalität als transparente Schicht an What s transparent about it? R Benutzte benötigen nur R Syntax Benutzer sehen Datenbank-Objekte as spezielle R Objekte Unterstützt weden fast alle R-Funktionen des Basis-Pakets Unterstützt R's Statistik und Graphik-Pakete Funktional vergleichbar mit SAS DATA STEP, läuft allerdings in- Datenbank! 21

Position 1 Position 2 Position 3 Memory Client R Engine Other R packages Transparency Layer Oracle R Enterprise packages Memory Oracle Database rq*apply () interface extproc User tables Memory DB R Engine Transparency Layer Oracle R Enterprise packages Other R packages Database Server 23

Client R Engine Other R packages Transparency Layer Oracle R Enterprise packages Memory Position 1 Memory Oracle Database rq*apply () interface extproc User tables Memory DB R Engine Transparency Layer Oracle R Enterprise packages Other R packages Database Server wetter <-read.csv(file.choose()) ore.create(wetter,table="tb_wetter") class(df) names(df) objects() dim(df) 24

Client R Engine Other R packages Transparency Layer Oracle R Enterprise packages Memory Memory Oracle Database rq*apply () interface extproc User tables Memory DB R Engine Transparency Layer Oracle R Enterprise packages Other R packages Database Server >x <- c(1,2,3) >mod <- ore.doeval ( function() + { + x <- c(10,20,30) + y <- x + }) >x >y mod Position 2 [1] 1 2 3 Error: object 'y' not found [1] 10 20 30 25

Memory Memory Client R Engine Other R packages Transparency Layer Oracle R Enterprise packages Memory Oracle Database rq*apply () interface extproc mod <- ore.doeval( function(param) { library(ore) ore.connect(user = "RQ",sid = "ORCL",host = "localhost",password = "RQ",port = 1521) ore.sync() ore.attach("rq") dat <- ore.pull(ontime_s) mod <- lm(arrdelay ~ DISTANCE + DEPDELAY, dat) mod}); User tables DB R Engine Transparency Layer Oracle R Enterprise packages Other R packages Database Server Position 3 mod_local <- ore.pull(mod) class(mod_local) summary(mod_local) 26

DATA WAREHOUSE