Predictive Analytics in der Praxis - Zeitreihenanalyse mit Oracle R Enterprise



Ähnliche Dokumente
Professionelle Seminare im Bereich MS-Office

In konstanten Modellen wird davon ausgegangen, dass die zu prognostizierende Größe sich über die Zeit hinweg nicht verändert.

Kampagnenmanagement mit Siebel Marketing/Oracle BI ein Praxisbericht

Informationsblatt Induktionsbeweis

Anleitung über den Umgang mit Schildern

Nutzung von GiS BasePac 8 im Netzwerk

Word 2010 Schnellbausteine

Primzahlen und RSA-Verschlüsselung

Aufgabe 1: Nehmen Sie Stellung zu den folgenden Behauptungen (richtig/falsch mit stichwortartiger Begründung).

Anton Ochsenkühn. amac BUCH VERLAG. Ecxel für Mac. amac-buch Verlag

Modellbildungssysteme: Pädagogische und didaktische Ziele

Der SAP BW-BPS Web Interface Builder

Zwischenablage (Bilder, Texte,...)

Handbuch. NAFI Online-Spezial. Kunden- / Datenverwaltung. 1. Auflage. (Stand: )

Konfiguration von Igel ThinClients fu r den Zugriff via Netscaler Gateway auf eine Storefront/ XenDesktop 7 Umgebung

QM: Prüfen -1- KN

Würfelt man dabei je genau 10 - mal eine 1, 2, 3, 4, 5 und 6, so beträgt die Anzahl. der verschiedenen Reihenfolgen, in denen man dies tun kann, 60!.

Festigkeit von FDM-3D-Druckteilen

geben. Die Wahrscheinlichkeit von 100% ist hier demnach nur der Gehen wir einmal davon aus, dass die von uns angenommenen

Berechnung der Erhöhung der Durchschnittsprämien

Installation, Einrichtung, Nutzung von PHOCA DOWNLOAD. Download-Links... 2

Kapitel 4 Die Datenbank Kuchenbestellung Seite 1

Grundlagen der Theoretischen Informatik, SoSe 2008

Leseprobe. Wilhelm Kleppmann. Versuchsplanung. Produkte und Prozesse optimieren ISBN: Weitere Informationen oder Bestellungen unter

AGROPLUS Buchhaltung. Daten-Server und Sicherheitskopie. Version vom b

Anwendungshinweise zur Anwendung der Soziometrie

etutor Benutzerhandbuch XQuery Benutzerhandbuch Georg Nitsche

Advoware mit VPN Zugriff lokaler Server / PC auf externe Datenbank

Anzeige von eingescannten Rechnungen

Mean Time Between Failures (MTBF)

Stand: Adressnummern ändern Modulbeschreibung

Wir arbeiten mit Zufallszahlen

Aufgabe 1: [Logische Modellierung]

Arbeitsblätter. Sinnvolle Finanzberichte. Seite 19

Der Leverage-Effekt wirkt sich unter verschiedenen Umständen auf die Eigenkapitalrendite aus.

SQL - Übungen Bearbeitung der Datenbank Personal (1)

OECD Programme for International Student Assessment PISA Lösungen der Beispielaufgaben aus dem Mathematiktest. Deutschland

Erstellen von x-y-diagrammen in OpenOffice.calc

Grundlagen der Videotechnik. Redundanz

Gästeverwaltung. Gästestammdaten. Gäste verwalten. Hotelsoftware für Klein- und Mittelbetriebe

sondern alle Werte gleich behandelt. Wir dürfen aber nicht vergessen, dass Ergebnisse, je länger sie in der Vergangenheit

Info-Veranstaltung zur Erstellung von Zertifikaten

Lineargleichungssysteme: Additions-/ Subtraktionsverfahren

1. Man schreibe die folgenden Aussagen jeweils in einen normalen Satz um. Zum Beispiel kann man die Aussage:

Eine Logikschaltung zur Addition zweier Zahlen

Technical Note Nr. 101

Die Textvorlagen in Microsoft WORD und LibreOffice Writer

LU-Zerlegung. Zusätze zum Gelben Rechenbuch. Peter Furlan. Verlag Martina Furlan. Inhaltsverzeichnis. 1 Definitionen.

Musterlösungen zur Linearen Algebra II Blatt 5

Konzepte der Informatik

Sichere Anleitung Zertifikate / Schlüssel für Kunden der Sparkasse Germersheim-Kandel. Sichere . der

Pflegedossier für die kreisfreie Stadt Frankfurt (Oder)

Informationen zum neuen Studmail häufige Fragen

AUTOMATISIERTE HANDELSSYSTEME

Korrelation (II) Korrelation und Kausalität

Ist Excel das richtige Tool für FMEA? Steve Murphy, Marc Schaeffers

MSXFORUM - Exchange Server 2003 > SMTP Konfiguration von Exchange 2003

So gehts Schritt-für-Schritt-Anleitung

Schleswig-Holstein Kernfach Mathematik

WinWerk. Prozess 6a Rabatt gemäss Vorjahresverbrauch. KMU Ratgeber AG. Inhaltsverzeichnis. Im Ifang Effretikon

50. Mathematik-Olympiade 2. Stufe (Regionalrunde) Klasse Lösung 10 Punkte

Universal Gleismauer Set von SB4 mit Tauschtextur u. integrierten Gleismauerabschlüssen!

Neuerungen der Ck-Schnittstelle in dms.net Rev. 4895

mobilepoi 0.91 Demo Version Anleitung Das Software Studio Christian Efinger Erstellt am 21. Oktober 2005

Erster Prüfungsteil: Aufgabe 1

Hilfe Bearbeitung von Rahmenleistungsverzeichnissen

1 Mathematische Grundlagen

Anhand des bereits hergeleiteten Models erstellen wir nun mit der Formel

Dokumentation IBIS Monitor

Veröffentlichen von Apps, Arbeitsblättern und Storys. Qlik Sense Copyright QlikTech International AB. Alle Rechte vorbehalten.

Behörde für Bildung und Sport Abitur 2008 Lehrermaterialien zum Leistungskurs Mathematik

Outlook. sysplus.ch outlook - mail-grundlagen Seite 1/8. Mail-Grundlagen. Posteingang

Anlage eines neuen Geschäftsjahres in der Office Line

ecaros2 - Accountmanager

Anleitung zum Erstellen eines Freihaltetermins

Lichtbrechung an Linsen

GEVITAS Farben-Reaktionstest

Serienbrieferstellung in Word mit Kunden-Datenimport aus Excel

Prof. Dr.-Ing. Rainer Schmidt 1

Softwareentwicklungspraktikum Sommersemester Grobentwurf

Speicher in der Cloud

Erster Schritt: Antrag um Passwort (s. Rubrik -> techn. Richtlinien/Antrag für Zugangsberechtigung)

Dialyse Benchmark - Online so funktioniert s

mysql - Clients MySQL - Abfragen eine serverbasierenden Datenbank

myfactory.go! - Verkauf

Integrated Services Realtime Remote Network

Informatik Kurs Simulation. Hilfe für den Consideo Modeler

Lineare Gleichungssysteme

Professionelle Diagramme mit Excel 2010 erstellen. Peter Wies. 1. Ausgabe, 2. Aktualisierung, März Themen-Special W-EX2010DI

Performance by Design Wie werden performante ETL-Prozesse erstellt?

Handbuch Fischertechnik-Einzelteiltabelle V3.7.3

Wir machen neue Politik für Baden-Württemberg

FAQ 04/2015. Auswirkung der ISO auf 3SE53/3SF13 Positionsschalter.

Lineare Funktionen. 1 Proportionale Funktionen Definition Eigenschaften Steigungsdreieck 3

WinVetpro im Betriebsmodus Laptop

LDAP Konfiguration nach einem Update auf Version 6.3 Version 1.2 Stand: 23. Januar 2012 Copyright MATESO GmbH

1. Einführung. 2. Alternativen zu eigenen Auswertungen. 3. Erstellen eigener Tabellen-Auswertungen

Erfahrungen mit Hartz IV- Empfängern

Bedienungshinweise für das Smartboard. Basisfunktionen

User Manual Data 24. Login und Layout

Transkript:

Predictive Analytics in der Praxis - Zeitreihenanalyse mit Oracle R Enterprise Marco Nätlitz areto consulting gmbh Köln Schlüsselworte Predictive Analytics, Time Series Analysis, Oracle R Enterprise, Oracle Advanced Analytics Predictive Analytics der Blick in die Zukunft Das Thema Predictive Analytics (PA) ist zurzeit in aller Munde und schafft es immer häufiger auf die Titelseiten der Fachliteratur. Die letzte Finanzkrise, Rückrufaktionen bei Automobilherstellern oder das Winterchaos bei der Bahn sind nur ein paar Beispiele für Ereignisse, die die betroffenen Unternehmen überrascht und in Gefahr gebracht haben. Aus diesem Grund sind heutige Unternehmen verstärkt an Zukunftsprognose und Datenanalysen interessiert, die solche Gefahren erkennen und abwehren. PA ermöglicht diesen Blick in die Zukunft durch vielfältige Methoden und Ansätze. Genauso vielfältig wie die Bandbreite an Verfahren sind allerdings auch die Definitionen von PA, die Mertens und Rässler (2012) umfassend gegenüberstellen und PA abschließend wie folgt definieren 1 : Predictive Analytics bezeichnet ( ) eine Form der Aufbereitung und Auswertung von Daten zur zukunftsorientierten Entscheidungsunterstützung auf allen Unternehmensebenen. Mithilfe von Prognosewerten wird das Data Mining erweitert, um Informationen über die Zukunft zur Entscheidungsfindung zur Verfügung zu stellen. Im Folgenden wird eine beispielhafte und praxisnahe Anwendung einer Zeitreihenanalyse, einem Teilgebiet der PA, sowohl mit R als auch mit Oracle R Enterprise (ORE), dargestellt. Definition von Zeitreihen Eines der zahlreichen Verfahren der PA ist die Zeitreihenanalyse. Gegenstand dieser Analysen sind sogenannte Zeitreihen, die eine Folge von zeitlich geordneten Beobachtungswerten beschreiben. 2 In der Regel wird angenommen, dass diese Beobachtungen diskret und äquidistant sind, also in gleichen zeitlichen Abständen (z.b. täglich, wöchentlich oder monatlich) beobachtet werden können. Als Beispiele für Zeitreihen sind Börsenkurse, Temperaturverläufe aber auch Umsatz- und Absatzzahlen zu nennen. Wie viele Beobachtungswerte die Zeitreihe enthält ist Definitionssache und natürlich abhängig von der Datenlage. Beispielsweise liegen für den DAX ausführliche und historische Informationen vor, wohingegen der Umsatz eines drei Monate jungen Unternehmens aufgrund fehlender historischer Daten nicht hinreichend analysiert werden kann. Die Zerlegung von Zeitreihen Besonders bei ökonomischen Zeitreihen findet man langfristige Veränderungen, die Mustern gleichen. So ist z.b. der Stromverbrauch im Winter größer als im Sommer, ebenso steigt der Absatz im Einzelhandel zur Weihnachtszeit. Zur Beschreibung solcher Muster wurde das Komponentenmodell entwickelt, das diesen Gegebenheiten Rechnung trägt. Es zerlegt eine Zeitreihe in folgende Bestandteile oder Komponenten: 3 1 Vgl. (Mertens und Rässler 2012), S. 522. 2 Vgl. zu diesem Absatz (Stier 2013), S. 1ff. 3 Vgl. (Schlittgen und Streitberg 2001), S. 9f.

Trend eine langfristige systematische Veränderung des mittleren Niveaus der Zeitreihe. Saison eine regelmäßige Schwankung, die sich relativ unverändert z.b. jährlich, monatlich oder in bestimmten zeitlichen Intervallen wiederholt. Rest der nicht zu erklärende Teil der Zeitreihe, der z.b. durch Störungen oder durch Zufall zustande kommt. Als Beispiel soll nun die Zeitreihe des Umsatzes eines Einzelhändlers dienen, die in Abb. 1 dargestellt wird. Der oberste Graph stellt die tatsächliche Zeitreihe dar. In den drei Graphen darunter werden die einzelnen Komponenten Trend, Saison und Rest dargestellt. Stellt man sich eine Zeitreihe als Addition vor, so stellt jeder Punkt des obersten Graphs die Summe aus den drei darunterliegenden Graphen dar. Abb. 1: Dekomposition des Umsatzes eines Einzelhändlers 4 Anhand der Zerlegung einer Zeitreihe lassen sich die Eigenschaften der Zeitreihe ablesen: ein nahezu linear steigender Trend (zweiter Graph von oben) und eine Saisonkomponente (dritter Graph von oben) mit Peaks im März und im Dezember sind Abb. 1 zu entnehmen. Der Anteil der Zeitreihe, der nicht zur Trend- oder Saisonkomponente zugeordnet werden kann, findet sich im Rest wieder. Je kleiner die Rest-Komponente einer Zerlegung ist, desto besser lässt sich die Zeitreihe beschreiben. Enthält die Rest-Komponente hingegen Muster, so ist die Trend- bzw. Saisonkomponente nicht adäquat berechnet worden. Zeitreihenanalyse mit R Die Statistikumgebung R 5 biete zahlreiche Möglichkeiten zur Zeitreihenanalyse. 6 Bevor auf eine umfangreiche Analyse mit ORE eingegangen wird, soll zunächst kurz vorgestellt werden, wie eine Zeitreihenanalyse mit den Bordmitteln von R angegangen werden kann. Als Beispieldatensatz dienen die Umsatzzahlen des Einzelhändlers, die bereits in Abb. 1 dargestellt und beschrieben wurden. 4 Daten via http://robjhyndman.com/tsdldata/data/fancy.dat. 5 Siehe https://www.r-project.org/. 6 Hier ist besonders das R-Paket forecast (https://cran.r-project.org/web/packages/forecast/index.html) und fpp (https://cran.r-project.org/web/packages/fpp/index.html) zu nennen.

Mit folgendem R-Skript wird die Zerlegung in die Komponenten der Zeitreihe aus Abb. 1 erzeugt: fancy = scan("http://robjhyndman.com/tsdldata/data/fancy.dat") fancyts = ts(fancy, frequency=12, start=c(1987,1)) # Zeitreihenobjekt fancylog = log(fancy) # Normalisierung durch Logarithmierung fancylogts = ts(fancylog, frequency=12, start=c(1987,1)) dec_fancy = decompose(fancylogts) # Zerlegung der Komponenten plot(dec_fancy) # Plot der Dekomposition plot.ts(fancylogts, xlab="time", ylab="log(sales $)") # Plot der norm. Zeitreihe Die Umsatzzahlen des Einzelhändlers unterliegen starken Schwankungen, sodass der Umsatz zur Weihnachtszeit signifikant höher ist als in den anderen Monaten des Geschäftsjahres. Damit diese Schwankungen keinen zu starken Einfluss auf ein statistisches Modell haben, müssen diese normalisiert werden. Zur Normalisierung wurde in diesem Beispiel der Logarithmus gewählt. 7 Zur Prognose des nächsten Geschäftsjahres wird das Verfahren nach Holt/Winters gewählt. 8 Das Verfahren beruht auf der Tatsache, dass künftige Beobachtungen eher der jüngeren Vergangenheit gleichen. So kann durch drei Parameter der Einfluss der einzelnen Komponenten einer Zeitreihe auf die Prognose beeinflusst werden. Die rekursive Definition der Funktion sorgt dafür, dass das Gewicht der Glättungsparameter entlang der Zeitreihe in Richtung Vergangenheit abnimmt. So hat beispielsweise der Trend zum Anfang der Zeitreihe eine kleinere Bedeutung für die Prognose als der Trend zum Ende der Zeitreihe. Das Verfahren nach Holt/Winters eignet sich besonders für die Prognose von Zeitreihen mit einer Trend- und Saisonkomponente, weshalb es ein adäquates Prognoseverfahren die Zeitreihe zum Umsatz des Einzelhändlers darstellt. Die mathematischen Details des Verfahrens nach Holt/Winters würde den Umfang dieses Manuskriptes überschreiten, weshalb an dieser Stelle auf die anschaulichen Erklärungen von Hyndman verwiesen wird. In R wird das Verfahren nach Holt/Winters mit der Funktion HoltWinters implementiert. Die optimale Belegung der Glättungsparameter für die einzelnen Komponenten wählt die Funktion dabei selbst. Mit Hilfe der Funktion können Zeitreihen auf simple Art und Weise prognostiziert werden, was folgender R-Code veranschaulicht: fancylogts_train = ts(fancylog, frequency=12, start=c(1987,1), end=c(1992,12)) fit1 = HoltWinters(fancylogts) # Analyse nach Holt/Winters fc1 = forecast.holtwinters(fit1, h=12) # Prognose, 12 Monate plot.forecast(fc1) # Plot mit Legende Die Zeitreihe enthält Daten von Januar 1987 bis Dezember 1993. Für die weitere Analyse wurde das letzte Jahr der Zeitreihe abgeschnitten und als Verifikation für die Prognose herangezogen. Mit Hilfe des Verfahrens nach Holt/Winters wurde anschließend das abgeschnittene Jahr 1993 prognostiziert. Abb. 2 stellt das Ergebnis der Prognose als blaue Linie dar. Die rote Linie im Graph stellt die originalen Zahlen (Normalisiert durch Logarithmieren) dar. Dem Graph in Abb. 2 ist zu entnehmen, dass die Schwankungen der Umsatzzahlen adäquat mit dem gewählten Verfahren vorherzusagen sind und sich die Prognose einer hohen Genauigkeit erfreut: 9 7 Vgl. (Wikipedia 2015). 8 Vgl. zu diesem Abschnitt (Hyndman und Athanasopoulos 2015), Kapitel 7. 9 Coghlan beschreibt ausführlich, wie die Güte einer Prognose einer Zeitreihe statistisch beurteilt werden kann. Vgl. (Coghlan 2015).

Abb. 2: Prognose des Umsatzes nach Holt/Winter Vorstellung von Oracle R Enterprise (ORE) Die bisherigen Ausführungen haben die Zeitreihenanalyse mit einer klassischen R-Instanz beschrieben, die in der Regel auf einem Client-Computer installiert ist. Gerade im Enterprise-Kontext reicht die Leistung solcher Client-Computer nicht aus, weshalb auf leistungsfähigere Server umgestiegen werden muss. Darüber hinaus steigt die Anzahl der Daten und die Komplexität der Berechnungen im Zeitalter von Big Data stetig, weshalb eine performante Datenbank oder ein Data Warehouse als unumgänglich für heutige Unternehmen gilt. Besonders in einem Data Warehouse liegen Daten sehr häufig mit einer zeitlichen Dimension vor, sodass die Zeitreihenanalyse oder - Prognose eine hohe Bedeutung beigemessen wird. Oracle adressiert oben geschildertes Problem mit seiner Lösung Oracle R Enterprise (ORE) als Bestandteil der Oracle Advanced Analytics Option der Oracle Database (Enterprise Edition). 10 Architektonisch erweitert Oracle die Datenbank so, dass performante statistische Analyse integriert ausgeführt werden können. Als Client dient dabei eine R-Instanz, die selbst keine Berechnungen durchführt, sondern lediglich die Berechnungsergebnisse darstellt bzw. die Kommandos an die Datenbank koordiniert. Abb. 3 stellt den Architektonischen Aufbau von ORE dar. Abb. 3: Architektur von Oracle R Enterprise Technisch besteht ORE aus drei Komponenten, die in Verbindung mit Abb. 3 im Folgenden erläutert werden: 10 Vgl. zu diesem Abschnitt (Oracle 2016).

Zunächst ist der ORE Transparency Layer (TL) zu nennen. Der TL ist eine Sammlung von R- Paketen, die alle grundlegenden Datentypen von R auf äquivalente Datentypen der Datenbank mappen. Durch den TL arbeitet der Benutzer, obwohl er R-Code auf seinem Laptop eintippt, direkt auf der Datenbank. Die TL ermöglicht so die Arbeit mit großen Datenmengen und komplexen Berechnungen. Weiter enthält ORE eine Statistics Engine (SE). Die SE ist eine Sammlung von statistischen Funktionen, die als R-Paket in der R-Instanz geladen werden und mit den Datentypen aus dem TL zusammenarbeiten. Das Besondere der SE ist, dass die statistischen Funktionen direkt in der Datenbank ausgeführt werden und ebenfalls keine Ressourcen des Client-Computers belasten. So sind beispielsweise lineare Modelle direkt auf der Datenbank verfügbar. Zuletzt bietet ORE die Funktion der Embedded R. Die Datenbank übernimmt die Kontrolle der Verarbeitung der R-Skripte, die der Benutzer mit TL und SE an die Datenbank überträgt. ORE startet dafür nach Bedarf R-Instanzen, sodass z.b. auch parallel Ausführung komplexer Aufgaben möglich wird. Durch Embedded R ist kein Datentransfer aus der Datenbank erforderlich, da die R-Skripte direkt die Tabellen, Views oder andere Objekte der Datenbank als Ressource verwenden. Zeitreihenanalyse mit Oracle R Enterprise (ORE) Nach der Vorstellung der Funktionsweise von ORE soll nun die bereits durchgeführte Zeitreihenanalyse mit ORE gezeigt werden. Zur Realisierung einer Prognose der Umsatzzahlen des Einzelhändlers (analog zu den bisherigen Beispielen) wurden die Geschäftszahlen in eine Tabelle ( TS_FANCY) auf der Datenbank abgelegt. Diese Tabelle enthält zwei Spalten: in der ersten Spalte ein Datum und der zweiten den Umsatz zum jeweiligen Datum. ORE bietet die Möglichkeit R-Skripte auf ganze Tabellen der Datenbank mit der Funktion ore.tableapply anzuwenden: var_ore1 <- ore.tableapply(ts_fancy[,c("dts","sales")], ore.connect = TRUE, function(dat) { }); library(forecast) salests = ts(dat$sales, start=c(1987,1), frequency=12) # Zeitreihenobjekt hw_fit1 = HoltWinters(salests) # Prognosemodell for_fit1 = predict(hw_fit1, n.ahead=12) # Berechnung der Zukunftswerte as.data.frame(for_fit1) Der oben dargestellt R-Code erzeugt zunächst ein Zeitreihenobjekt und wendet im Anschluss das Verfahren nach Holt/Winters auf dieses Zeitreihenobjekt an. Im Anschluss werden die nächsten 12 Monate der Zeitreihe mit dem Prognosemodell nach Holt/Winters berechnet. Eine Rückgabe in ORE bedeutet konkret die Materialisierung der R-Objekte in der Datenbank, die mit der Referenz var_ore1 im weiteren Verlauf auf Client-Seite abgerufen werden können. Soll nun auf Client-Seite die Berechnung in R fortgeführt werden, so können die mit ore.tableapply generierten Berechnungsergebnisse wie folgt zum Client übertragen werden: lcl_var_ore1 = ore.pull(var_ore1) # Hole die Rückgabe als data.frame summary(lcl_var_ore1[[1]]) Integration von Oracle R Enterprise (ORE) Neben der Ad-hoc-Analyse in R können die Methoden und Verfahren der Predictive Analytics direkt in die Datenbank integriert werden. ORE stellt beispielsweise die PL/SQL-Funktionen

rqscriptcreate zum Speichern und rqtableeval zum Aufruf bereit. Die Speicherung des R- Skriptes zur Umsatzprognose wird wie folgt realisiert: begin end; / sys.rqscriptcreate('salesforecastfunc', 'function(dat) { }'); library(forecast) salests = ts(dat$sales, start=c(1987,1), frequency=12) # Zeitreihenobjekt hw_fit1 = HoltWinters(salests) # Prognosemodell for_fit1 = predict(hw_fit1, n.ahead=12) # Berechnung der Zukunftswerte as.data.frame(for_fit1) Nun ist das R-Skript in der Datenbank gespeichert und kann mit SQL aufgerufen werden, sodass auch auf diesem Wege der TL und die SE von ORE Verwendung findet: select * from table( ); rqtableeval( cursor(select dts, sales from ts_fancy), null, null, 'salesforecastfunc') Die Rückgabe dieser Query enthält 12 Zeilen und beschreibt die prognostizierten Umsätze der kommenden 12 Monate des beispielhaften Einzelhändlers. Weiter kann diese Query als View in der Datenbank hinterlegt werden und so im Rahmen von Reporting- oder ETL-Prozessen integriert werden. Fazit Dieses Dokument zeigt in Ausschnitten die theoretischen Grundlagen der Zeitreihenanalyse und wie diese sowohl mit R als auch mit ORE durchgeführt werden kann. Es wurde gezeigt, dass ORE eine elegante Möglichkeit für statistische Berechnungen auf großen Datenmengen darstellt, die die verfügbaren Ressourcen optimal ausnutzt. Darüber hinaus können R-Skripte in der Datenbank gespeichert und weiterverarbeitet werden, sodass diese entlang der Wertschöpfungskette in BI- Projekten Verwendung finden können. Neben der Zeitreihenanalyse deckt ORE die gesamte Bandbreite der Verfahren der Predictive Analytics ab, weshalb ORE ein fundiertes Werkzeug für Datenanalysen und dessen Prognosen darstellt. Literaturverzeichnis Coghlan, Avril. Using R for Time Series Analysis. 2015. https://a-little-book-of-r-for-timeseries.readthedocs.org/en/latest/src/timeseries.html#holt-winters-exponential-smoothing (Zugriff am 22. 09 2015).

Eckstein, Peter P. Repetitorium Statistik: Deskriptive Statistik - Stochastik - Induktive Statistik. 4. Springer, 2013. Hyndman, Rob J., und George Athanasopoulos. Forecasting: Principles and Practice. otexts.org, 01. 09 2015. Kreiss, Jens-Peter, und Georg Neuhaus. Einführung in die Zeitreihenanalyse: Statistik und ihre Anwendungen. Berlin: Springer, 2006. Mertens, Peter, und Susanne Rässler. Prognoserechnung. Bd. 7. Berlin: Springer, 2012. Oracle. Overview of Oracle R Enterprise. 16. 09 2016. http://docs.oracle.com/cd/e36939_01/doc.13/e36761/intro.htm#oreug109. Schlittgen, Rainer, und Bernd H.J. Streitberg. Zeitreihenanalyse: Lehr- und Handbücher der Statistik. 9. Oldenbourg Verlag, 2001. Schneider, Matti, und Sebastian Mentemeier. Zeitreihenanalyse mit R. 2010. http://wwwmath.unimuenster.de/statistik/lehre/ss10/blockprakzeit/zeitreihenanalyse.pdf. Stier, Winfried. Methoden der Zeitreihenanalyse. Berlin: Springer, 2013. Wikipedia. Data transformation (statistics). 16. 09 2015. https://en.wikipedia.org/wiki/data_transformation_%28statistics%29. Kontaktadresse: Marco Nätlitz areto consulting gmbh Carlswerk, Gebäude Labor 1.7 Schanzenstraße 6-20 51063 Köln Telefon: +49 221 66 95 75-0 Telefax: +49 221 66 95 75-99 Email: Marco.Naetlitz@areto-consulting.de