Robotron Datenbank-Software GmbH

Ähnliche Dokumente
Big Data als neuer Partner von Six Sigma Optimierung der diskreten Produktion

Prozessoptimierung durch Datenanalyse und -prognose mit R in der Praxis

Tipps und Tricks bei der Nutzung von EclipseLink (JPA)

Robotron Datenbank-Software GmbH

Titel ODA X6M & DBVisit, braucht es mehr?

BI Publisher-Praxis: Komplexe Reports und Apex- Dokugenerator

Robotron Datenbank-Software GmbH

Oracle BI Publisher Webservice API in Action

Einsatz von Java EE Security für APEX mit Oracle REST Data Services

Datenbank Services. Thomas Lehmann, Düsseldorf. Die Datenbank-Spezialisten.

Wohnungsmarktbeobachtung Niedersachsen (WOM-DB)

Adaptive Features Fluch oder Segen

Praktikum und Masterarbeit bei Robotron

+++ Bitte nutzen Sie die integrierte Audio-Funktion von WebEx (Menü Audio -> Integrated Voice Conference -> Start auswählen), um uns zu hören!!!.

H E R Z L I C H W I L L K O M M E N Z U R D O A G K O N F E R E N Z

Robotron Datenbank-Software GmbH

Prognose von Kostenschwankungen mit Predictive Analytics DOAG 2016

WILLKOMMEN INDUSTRIE 4.0

Oracle Cloud Control 13.2 Compliance Management (Monitoring) mit STIG s für Oracle Datenbanken

iedm intelligentes Energiedatenmanagement für die Industrie Software mit Ideen.

Beratung Software Lösungen. Migration von ProStore Logistics Intelligence von OBIEE 10g auf 11g

Statistisches Analyseverfahren

Das ist alles nur gecloudt Sicherheit in den roten Wolken

Installationen vereinheitlichen. Standards sind super. Marco Mischke, DOAG DB 2015 Düsseldorf. Die Datenbank-Spezialisten.

Oracle Snap Management Utility Snap mir eine. Marco Schwab, DOAG 2017,

Robotron Datenbank-Software GmbH Oracle VM3 Features und Praxiserfahrungen. Dirk Läderach Nürnberg,

Polynomiale Regression lässt sich mittels einer Transformation der Merkmale auf multiple lineare Regression zurückführen

Oracle Database Appliance - Projektbericht Erfolgreiche Migration bei der make-it

O-BIEE Einführung mit Beispielen aus der Praxis

BI Publisher: Erfahrungen mit Sub Templates im Berichtswesen

Wie sehen Ihre Testdaten aus? Anonymisierung mit Oracle Data Masking. Dirk Braunecker, CGI Deutschland DOAG Konferenz,

BUSINESS INTELLIGENCE IM MITTELSTAND EIN PRAXISBERICHT

IT SERVICE MANAGEMENT FÜR AGILE PROJEKTE. Zwischen Agilität und Stabilität Herausforderungen in einer agiler werdenden Organisation

<Insert Picture Here> Kerberos Geheimnisse in der Oracle Datenbank Welt

Plant Data Services Frei verwendbar Siemens AG 2016 siemens.de/plant-data-services

Data Mining in technischen Daten sinnvoll oder nicht? DOAG BI 2014

Dr. Jens Hündling Senior Sales Consultant. DOAG Apps 2011 Berlin, 05. Mai 2011

SQL Developer 4 DBAs DOAG Datenbank 2015 Düsseldorf Referent Ernst Leber. Düsseldorf, den

Verwaltung von OBI Metadaten: XML-Integration die Lösung aller Probleme? DOAG Konferenz und Ausstellung 2013

- Architektur & Integration -

Erfolg mit Oracle BI?

Robotron Datenbank-Software GmbH

OWB 10.2 Experts im Einsatz: Automatisierung von Designschritten bei der Bayer Healthcare AG. Referent: Lutz Bauer, Senior Systemberater, MT AG

Copyright 2014, Oracle and/or its affiliates. All rights reserved.

Unsere Vorträge auf der DOAG 2015

Oracle ACFS / CloudFS zuverlässig nutzbar?

<Insert Picture Here> BI Publisher Berichte in eigene Anwendungen integrieren

Orpheus Datacenter Azure Cloud On-premises. EU-Datacenter (Microsoft) SQL-Lizenzen, Backup, OS-Wartung (durch Orpheus) Dedizierte Umgebung

Renke Stolle. Mathias Temmeyer. Durchgängige Prozesse bei der PHL Logistik GmbH mit der Logistiksoftware DISPONENTplus. Geschäftsführer PHL

Die IBM Netezza Architektur für fortgeschrittene Analysen

Herzlich willkommen zum Nordlichtertreffen Bremen CGI Deutschland Ltd. & Co. KG, Bremen

ZWISCHEN ALBTRAUM UND OPTIMALER PERFORMANCE

PROfit 5.0. Hardware-/Software-Anforderungen. Ihre Ansprechpartner: BOC Information Technologies Consulting GmbH Naglerstraße Berlin

Gemeinsam mehr erreichen. Activiti vs. Oracle BPM

Lineare Modelle in R: Klassische lineare Regression

CAS coole Arbeitsumgebung für SAS Programme

Self-Service und Data Storytelling mit Qlik Sense und Qlikview. Referenten: Oliver Zemljak, Konstantin Wächter Session 2

DOAG BI Data-Mining in sozialen Online-Netzwerken

Safexpert Oracle Datenbank Konnektor

Windows Azure für Java Architekten. Holger Sirtl Microsoft Deutschland GmbH

Oracle Data Integrator

Vorteile einer Tool gestützten Modernisierung von Forms und Reports

Public Cloud im eigenen Rechenzentrum

Neue Features Oracle Database 12.2 Wann denn endlich?

Vorhersage Täglicher Stromverbrauch für den Industriekomplex

He H rz r lich Wil kommen zur DOAG SI S G G Fu F sion Middlewa w re r Hamburg

Divide et impera Session-Management im ETL

Beispiel: Wer gewinnt die Bundestagswahl

Herzlich Willkommen zum

Jungfernflug mit der Oracle Cloud bis ans Ende der Welt

Business Breakfast im Café Landtmann. 22. November 2016

DWH Best Practices das QUNIS Framework 80 Jahre Erfahrung bei der Modellierung & dem Betrieb von DWH. Referent: Ilona Tag

Performante Verarbeitung großer Datenbanken am praktischem Beispiel

SAP BO Web Intelligence auf SQL Server [A4] Üetliberg,

Forms 11g meets BI. Gerd Volberg OPITZ CONSULTING GmbH

good. better. outperform.

Klassisch und doch agil - Scrum Erfahrungen

go:identity Identity Management Lösung als IDM-Appliance ITConcepts Professional GmbH Marcus Westen

In 30 Minuten zur BI-Lösung in der Cloud Aufbau einer BI-Infrastruktur & Entwicklung von Reports Live. Referent: Patrick Eisner & Ronja Schermer

DOAG 2012 BI. Entwicklung eines IT-Instrumentariums für ein kommunales Bildungsmonitoring oder Das generierte BI-System. Marco Fischer,

Neues zur Oracle Lizenzierung (Michael Paege, OPITZ CONSULTING Hamburg, DOAG Competence Center Lizenzen)

Dr. Friedrich Schanda Projektmanagement PENTASYS AG

Zentrale Datenbank-Nutzerverwaltung

Teil XIII. Multiple lineare Regression. Woche 11: Multiple lineare Regression. Zusammenfassung Einfache lineare Regression.

Veeam und Microsoft. Marco Horstmann System Engineer, Veeam

Produktionsdaten mit Unternehmensdaten vernetzen

Prädiktion und Klassifikation mit

Ist Gradle auch für die APEX-Projekte?

Citrix Cloud Services und nlx.net im Vergleich für Ihren sicheren digitalen Arbeitsplatz

Industrie 4.0. Der Weg zur Smart Factory - von der Analyse bis zur Umsetzung SEITE 1

Zürich User Summit - Inflectra

QUNIS 360 was war, was wird? BI, Big Data, Cloud, Predictive & Advanced Analytics, Streaming. Referent: Steffen Vierkorn

Häufige Fehler in Oracle Forms und Reports Umfeld

Was Cloud Control über Ihre installierte Software berichten kann. Martin Obst Oracle Deutschland Potsdam

Lizenzierung des Oracle Application Servers und der Optionen

MS SQL Server 2012 (4)

Zeilen- vs. spaltenorientierte Datenhaltung im Hauptspeicher:

BI meets GEO DOAG Regionalgruppe Berlin-Brandenburg 3. Juni 2009

Transkript:

Robotron Datenbank-Software GmbH Prozessoptimierung durch Datenanalyse & Datenprognose mit R in der Praxis Simon Hofinger Nürnberg, 20.11.2013

Prozessoptimierung durch Datenanalyse & -prognose mit R in der Praxis

Zahlen und Fakten Robotron Datenbank-Software GmbH Gründungsjahr 1990 Mitarbeiterzahl 312 (Stand 11/2013) Stammkapital Umsatz 2012 Geschäftssitz 2,4 Mio. EUR 31,1 Mio. EUR Stuttgarter Str. 29 01189 Dresden Oracle-Partner ISO 9001 zertifiziert

Das Leistungsangebot von Robotron

Agenda Vorstellung des Business Case Datenanalyse und -prognose Modelloptimierung Verwendete Daten Integrationsmöglichkeiten

Business case Das Unternehmen Automobilzulieferer produziert Sensoren Auslöser des Projekts Für jeden Sensor müssen zur Kalibrierung Messungen an über 500 verschiedenen Messpunkten durchgeführt werden. Die Messwerte werden anschließend von einer komplizierten und schlecht zu wartenden Software ausgewertet.

Prozessoptimierung Ziel Reduzierung der Anzahl der zur Sensorkalibrierung nötigen Messpunkte Prognose der 14 vom Parameterrechner berechneten Zielvariablen in ausreichender Qualität zur korrekten Berechnung der Gänge Vorgehen Identifikation der aussagekräftigsten Messpunkte Identifikation des besten Prognosemodells

Identifikation der aussagekräftigsten Messpunkte Prozess Prozessdaten bereitstellen Unabhängige Variablen: Messungen des magnetischen Flusses an über 500 verschiedenen Messpunkten Sensorspezifische Parameter Abhängige Variablen: Sollwerte der 14 Zielvariablen

Identifikation der aussagekräftigsten Messpunkte Prozess Zugriff auf Prozessdaten über ROracle library(ore) ore.connect(user="user1",sid="sid1",host="localhost", password="***", port=1521) ore.sync() messpunkte_ore <- ore.get("messpunkte") messungen_ore <- ore.get("messungen") zielwerte_ore <- ore.get("zielwerte")

Identifikation der aussagekräftigsten Messpunkte Prozess Auswahl eines Messpunkts - Durch drei Dimensionen eindeutig bestimmt: Hebelposition (X, Y) und Luftspalt Auswahl einer Zielvariable - 14 Variablen in 3 verschiedenen Kategorien

Identifikation der aussagekräftigsten Messpunkte Prozess Datenanalyse und Prognose Schätzung eines Regressionsmodells Prüfung des Modells durch 10-fache Kreuzvalidierung Berechnung eines Gütemaßes pro Zielvariable und abschließend für den gesamten Messpunkt Übergang zum nächsten Messpunkt

Identifikation der aussagekräftigsten Messpunkte Prozess 10-fache Kreuzvalidierung

Identifikation der aussagekräftigsten Messpunkte Prozess Auswahl des besten Messpunkts Gütemaß = 14 i=1 ( Fehlerquadratsummen i )² n Standardabweichung i mit i = Zielvariable, n = Anzahl der Sensoren

Gütemaß Identifikation der aussagekräftigsten Messpunkte Prozess 21 18 15 12 9 6 3 0 1 2 3 4 5 6 7 Anzahl Messpunkte

Identifikation der aussagekräftigsten Messpunkte Prozess for(iteration in 1:number_of_iterations){ for(measurement_point in 1:number_of_measurement_points){ for(target_variable in 1:number_of_target_variables){ for(i in 1:10){ glm_model <- glm(formel, family=gaussian(link="identity"), data=dataset[dataset$partition!=i,])

Identifikation des besten Prognosemodells Für jede Zielvariable wird das Modell mit dem niedrigsten Root Mean Squared Error ermittelt: Modelle Var_1 Var_2 Generalized Linear Model 3,76 1,48 Random Forest 1,64 3,00 Support Vector Machine 1,78 2,04 Neuronal Networks 3,34 1,53 Kombinationen von Modellen können die Qualität der Prognosen weiter steigern

Identifikation des besten Prognosemodells Güte nach ASIC-Simulation 3 optimale Messpunkte (0,58% von 514): zu 97,5% die gleichen Gänge erkannt 7 optimale Messpunkte (1,36% von 514): zu 98,6% die gleichen Gänge erkannt

Identifikation des besten Prognosemodells Beispiel: Bestes gefundenes Vorgehen bei Var_1 1. Neue Prädiktoren aus vorhandenen Daten erzeugen: Quadrate Quotienten 2. Generalized Linear Model anwenden 3. Automatische Selektion der aussagekräftigsten Prädiktoren aus: Quadrate Quotienten Ergebnisse aus Schritt 2 4. Random Forest Model anwenden Ergebnis: Verbesserung des RMSE von 1,64 auf 0,95

Datenbasis Trainingsdaten Testdaten

Datenbasis Trainingsdaten: von 2011 bis 2012 Lose: 1, 2 Testdaten: von 2012 bis 2013 Lose: 2, 3

Integrationsmöglichkeiten Oracle R Enterprise bietet R Embedded Execution Bestandteil von Oracle Advanced Analytics R -Skripte werden direkt auf dem Datenbankserver ausgeführt Zwei Schnittstellen sind verfügbar: R (R, RStudio, Revolution R, etc.) SQL (SQL*Plus, SQL Developer, etc.) Oracle Data Miner bietet eigene statistische Modelle Verwendbar über die R-Schnittstelle

Integrationsmöglichkeiten Embedded Execution über die R-Schnittstelle library(ore) ore.connect(user= user1",sid= sid1",host= host1", password= ***", port=1521) ore.sync() m_points <- ore.get("messpunkte") Measurements <- ore.get("messungen") target_variables <- ore.get("zielwerte") ore.create(results_train, table = "TRAIN_SET") ore.sync(table=" TRAINING_SET ") TRAINING_SET <- ore.get(" TRAINING_SET ") ore_glm <- ore.tableapply( TRAINING_SET, function(x) { glm_t1<- glm(var1 ~ A + B + C, family=gaussian(link="identity"), data=x) }); glm_modell <- ore.pull(ore_glm) ore.predict(glm_modell, newdata = test_set)

Integrationsmöglichkeiten Verwendung des Oracle Data Miners über die R-Schnittstelle library(ore) library(rodm) ore.connect(user= user1",sid= sid1",host= host1", password= ***", port=1521) ore.sync() m_points <- ore.get("messpunkte") measurements <- ore.get("messungen") target_variables <- ore.get("zielwerte") glm_modell <- ore.odmglm(var1 ~ A + B + C, type="normal", data= training_set) ore.predict(glm_modell, newdata = test_set)

Integrationsmöglichkeiten

Besuchen Sie unseren Stand auf der DOAG Konferenz 2013! Wir freuen uns, Sie persönlich kennenzulernen! am Stand 226 auf Ebene 2

Unsere Vorträge auf der DOAG Konferenz 2013 Session Tag Zeit Raum Heiko Eitner (ZEBIT), Marco Mischke: Datenbanken Konsolidiert in der Cloud Simon Hofinger: Prozessoptimierung durch Datenanalyse & - prognose mit R in der Praxis Bobby Urland: Report-Herausforderungen mit dem BI Publisher 11g - Ein Praxisbericht Rico Haupt: OBIEE 11g Integration mit Oracle Access Manager & MS Active Directory Marco Friebe, Dirk Läderach: ODA "virtualized" - Transformation zur ISV Appliance Di 12:00 12:45 Konferenzraum EG zu Halle 7A Mi 13:00 13:45 Helsinki Do 11:00 11:45 Stockholm Do 15:00 15:45 Oslo Do 16:00 16:45 Hongkong

Referent Simon Hofinger Systemberater T: +49 30 2639292-437 simon.hofinger@robotron.de