ETL-Tool Survey Light Ein Vergleich des OWB mit Open Source ETL-Tools Prof. Dr. Reinhold von Schwerin Hochschule Ulm, Fakultät für Informatik 17. November 2011
Prof. Dr. Reinhold von Schwerin ETL-Tool Survey Light 2/24 Inhalt 1 Einleitung 2 Survey 3 Ergebnisse 4 Fazit
Prof. Dr. Reinhold von Schwerin ETL-Tool Survey Light 3/24 Inhalt 1 Einleitung 2 Survey 3 Ergebnisse 4 Fazit
Prof. Dr. Reinhold von Schwerin ETL-Tool Survey Light 4/24 Bachelor Wirtschaftsinformatik Modul Data Warehousing 5. Semester Fallstudie basierend auf DELL DVDStore (siehe [1]) Prüfungsvorleistung formal: wissenschaftliches Paper Inhaltliche Schwerpunkte multidimensionale Konzepte SQL/OLAP (siehe auch [4]) ETL-Prozess (inkl. Stored Procedures)
Prof. Dr. Reinhold von Schwerin ETL-Tool Survey Light 5/24 ETL-Aufgabe der Data Warehousing Fallstudie I
ER Modell DVDStore (OLTP)
ER Modell dvdladen (OLTP)
Snowflake-Schema United DVDs
Prof. Dr. Reinhold von Schwerin ETL-Tool Survey Light 9/24 ETL-Aufgabe der Data Warehousing Fallstudie II ETL-Teilaufgaben [3] Filtern der relevanten Daten Harmonisierung (z.b. Zuordnungs- und Nachschlagetabellen) Auflösung von Schlüsseldisharmonien Synonyme und Kodierungsunterschiede Anreicherungen Studentische Gruppenaufgabe Durchführung des ETL-Prozesses Benutzung eines Open Source Tools und des OWB Durchführung eines Vergleichs
Prof. Dr. Reinhold von Schwerin ETL-Tool Survey Light 10/24 Inhalt 1 Einleitung 2 Survey 3 Ergebnisse 4 Fazit
Prof. Dr. Reinhold von Schwerin ETL-Tool Survey Light 11/24 ETL Tool Survey: Kommerziell Unabhängige Untersuchung http://www.etltool.com/ 19 ETL Tools Kriterienliste Website zeigt verwischte Diagramme Report für 245 e 725 e
Prof. Dr. Reinhold von Schwerin ETL-Tool Survey Light 12/24 ETL Tool Survey Light: WF5 (Hochschule Ulm) Open Source vs. OWB Pentaho Data Integration (PDI) Talend Open Studio (TOS) Clover ETL Oracle Warehouse Builder (OWB)
Prof. Dr. Reinhold von Schwerin ETL-Tool Survey Light 13/24 Vergleichsbasis
Prof. Dr. Reinhold von Schwerin ETL-Tool Survey Light 14/24 Inhalt 1 Einleitung 2 Survey 3 Ergebnisse 4 Fazit
Prof. Dr. Reinhold von Schwerin ETL-Tool Survey Light 15/24 Durchführung Aufteilung 5 Gruppe mit 4 5 Personen immer OWB 2 PDI; 2 TOS; 1 Clover Ergebnis 5 "wissenschaftliche Papers" [2] 5 Toolbewertungen
Prof. Dr. Reinhold von Schwerin ETL-Tool Survey Light 16/24 Ergebnisübersicht des ETL-Toolvergleichs Kriterium \Tool Gewicht PDI TOS Clover OWB ETL-Funktionalität 5 69 72 22 80 Benutzerfreundlichkeit 4 71 52 80 57 Wiederverwendbarkeit 2 64 64 35 72 Debugging 3 89 76 24 90 Konnektivität 4 84 79 17 89 Darstellung gemittelte Prozentwerte
Vergleichsergebnisse (ungewichtet)
Prof. Dr. Reinhold von Schwerin ETL-Tool Survey Light 18/24 Vergleichsergebnisse (gewichtet)
Prof. Dr. Reinhold von Schwerin ETL-Tool Survey Light 19/24 Bewertung Rangfolge 1 OWB: (knapper) Sieger 2 PDI: fast gleichauf; besser bedienbar 3 TOS: starker Konkurrent; Schwächen bei Benutzerfreundlichkeit 4 Clover: nur stark in Benutzerfreundlichkeit, sonst Nachholbedarf Zitat vom ETL Tool Survey Open source ETL tools are worth considering If you combine the good enough factor with an attractive price point and the support delivered by the vendors, open source ETL is certainly worth considering.
Prof. Dr. Reinhold von Schwerin ETL-Tool Survey Light 20/24 Inhalt 1 Einleitung 2 Survey 3 Ergebnisse 4 Fazit
Prof. Dr. Reinhold von Schwerin ETL-Tool Survey Light 21/24 Praxisnahe BI-Ausbildung Beispiel: ETL-Aufgabe realistisches Szenario Open Source Tools gute Mittel für die Lehre Oracle Academy Mitgliedschaft vorteilhaft für Studierende Eignung von Open Source ETL Tools auch durch Studierende bestätigt
Prof. Dr. Reinhold von Schwerin ETL-Tool Survey Light 22/24 The End Vielen Dank für Ihre Aufmerksamkeit!
Prof. Dr. Reinhold von Schwerin ETL-Tool Survey Light 23/24 Quellen I [1] DELL: DELL DVDStore. http://linux.dell.com/dvdstore. Version: 13.12.2008 [2] DIV. VORLESUNGSTEILNEHMER SOMMERSEMESTER 2011, WIRTSCHAFTSINFORMATIK, HOCHSCHULE ULM: A comparison of an OS ETL-Tool with Oracle Warehouse Builder. 2011. Prüfungsvorleistung für das Fach Data Warehousing [3] KEMPER, Hans-Georg ; MEHANNA., Walid ; UNGER, Carsten: Business Intelligence Grundlagen und praktische Anwendungen. 2. Aufl. ViewegTeubner, 2006
Prof. Dr. Reinhold von Schwerin ETL-Tool Survey Light 24/24 Quellen II [4] SCHWERIN, Reinhold von: SQL/OLAP in der Lehre. In: DOAG Konferenz 2008, 2008