Konzeption und Realisierung eines Data Warehouses zur Analyse chirurgischer Workflows

Größe: px
Ab Seite anzeigen:

Download "Konzeption und Realisierung eines Data Warehouses zur Analyse chirurgischer Workflows"

Transkript

1 Konzeption und Realisierung eines Data Warehouses zur Analyse chirurgischer Workflows SS 07 Projekt-Praktikum Universität Konstanz Lehrstuhl: Datenbank & Informationssysteme Prof. Dr. Marc H. Scholl Betreuung: Svetlana Mansmann Matthias Röger; Information Engineering

2 Gliederung Einführung Entwurf und Konzeption eines Schemas zur Aufnahme chirurgischer Workflows Transformation Geschäftsprozess-Beschreibung in das OLAP-System Strukturierung und multidimensionale Perspektiven eines Prozesses Modellierung: Herausforderungen und Lösungen Struktur des Workflow Schemas Pentaho Business Intelligence Plattform Vorstellung Business Intelligence Plattform Pentaho Überblick Pentaho Komponenten / Cube Designer Praktische Vorführung Konkrete Umsetzungen Fazit 2

3 Vorstellung Kooperations-Partner ICCAS Innovationszentrum für computerassistierte Chirurgie (ICCAS) an der medizinischen Fakultät der Universität Leipzig Verfolgt die Vision einer möglichst perfekten Mensch-Maschine-Zusammenarbeit Betreibt interdisziplinäre Forschung in den Disziplinen o Chirurgie o Informatik o Natur- u. Ingenieurwissenschaften Unterziel ICCAS: o Analyse von chirurgischen Prozessen auf Basis von chirurgischen Arbeitsabläufen (Surgical Workflows) um Operationsabläufe verstehen, auswerten und optimieren zu können 3

4 Aufgabenstellung des Praktikums Aufgabenstellung des Praktikums o Entwurf eines Data Warehouses zur Analyse chirurgischer Workflows Rohdaten werden während der OP aufgenommen Konzeption eines multidimensionales Datenmodells zur Datenanalyse Implementierung des Datenmodells und Überführung der Daten in die Datenbanksysteme PostgreSQL bzw. DB2 o Pentaho Business-Intelligence (BI) Plattform Administration der Pentaho-Plattform, des Cube Designers und des Reportings zum Zugriff auf verschiedene Datenbanksysteme Erzeugung des zur Datenanalyse notwendigen Mondrian-Schemas Integration der erzeugten Solution in die Pentaho-Plattform 4

5 Datenaufzeichnung / Ablauf Datenaufzeichnung einer Operation o Aufzeichner: Speziell geschulte Medizinstudenten o Erfolgt über ein graphischen Workflow-Editor auf einem Tablet-PC o o o Aufzeichnungen erfolgen im Normalfall während der OP Daten werden nachbearbeitet, hierzu Unterstützung durch Video-Aufzeichnung Aufzeichnung kann auch komplett auf Basis von Videos erfolgen 5

6 Datenaufzeichnung Welche Daten werden aufgezeichnet o Globale Daten, wie z.b. Ort Zeit Beteiligte Personen Patient Diagnose Therapie Disziplin Typen von Queries o Quantitative (Vorkommen, Dauer..) Wie oft wurde ein bestimmtes Instrument benutzt? o Qualitative (Beziehungen, Muster..) An welcher Struktur wurde welches Instr. benutzt? o Ergonomische (OP-Einrichtung) Blickrichtung des Chirurgen? o o Die eigentliche OP betreffende Daten, wie z.b. OP-Besteck ausgeführte Aktionen von welcher Person an welcher Körperstruktur von wem mit welcher Hand sekundengenaue Aufzeichnung Hinweise des Chirurgen, z.b. fehlendes OP-Besteck 6

7 Anwendungsgebiet Analyse chirurgischer Workflows Anwendungsgebiete der Analyse chirurgischer Workflows: Untersuchung vorausgegangener Referenz-Fälle / Unterstützung chirurgischer Vorbereitungen Suchen von Optimierungspotential hinsichtlich OP-Verfahren, -Besteck und -Geräte Bewertung der operativen Leistungen und chirurgischen Fähigkeiten Verifizierung von medizinischen Hypothesen Bewertung des OP-Saal-Layouts Verbesserung der chirurgischen Ausbildung und von Simulationssystemen... 7

8 Bisheriger Datenfluss Schaubild zeigt bisherigen Datenfluss bis zur Erzeugung des Protokolls als XML-File. Multidimensionale Datenanalyse mit bisherigem Recording Schema nicht möglich Recording Schema / XML-Protokoll wird durch Data Warehouse ersetzt 8

9 Bisheriger Datenfluss XML-Protokoll Aufzeichnungs-Ausschnitte aus dem Protokoll im XML-Format: Allgemeine Informationen einer OP: Informationen einer einzelnen Aktivität: 9

10 OLAP und multidimensionales Datenmodell Konzeption eines Data Warehouses auf dessen Basis die mehrdimensionale Datenanalyse erfolgt. OLAP (OnLine Analytical Processing): Bezeichnung für die Analyse und Auswertung von großen Datenbeständen, welche multidimensional aufbereitet wurden. Durch Multidimensionalität können Daten aus verschiedenen Blickwinkeln betrachtet und analysiert werden. OLAP-Würfel: Grundlage für das mehrdimensionale Datenmodell Kanten des Würfels: Dimensionen Zellen: Kennzahl(en) als Funktion der Dimension 10

11 OLAP und multidimensionales Datenmodell OLAP-Funktionalität: Pivotierung Vertauschen der Dimensionen: Sicht aus verschiedenen Perspektiven Roll-Up Aggregation über vorgegebene Dimensionen Drill-Down Navigation von aggregierten Daten zu Detaildaten nach bestimmten Dimensionen Slicing Herausschneiden einer Hyper-Scheibe : Verringerung der Dimensionalität Dicing Herausschneiden eines Teilwürfels : Erhaltung der Dimensionalität 11

12 Analyse chirurgischer Prozesse Neu entstandenes interdisziplinäres Feld Analyse chirurgischer Prozesse Intelligente Erfassung von Informationen von laufenden chirurgischen Eingriffen zur klinischen und technischen Analyse. Medizinischer Begriff chirurgischer Workflow bezieht sich auf die Beschreibung von chirurgischen Eingriffen und stellt deren Abstraktion dar. Recording-Schema: um die Nutzung der chirurgischen Workflows zu ermöglichen (z.b. Analyse), wird eine wohldefinierte Beschreibung des Eingriffs benötigt. 12

13 Business Process Intelligence (BPI) Neu entstandenes Feld Business Process Intelligence Definition Anwendung von performance-getriebener Management-Technik zwischen Business Intelligence (BI) und Geschäfts-Prozessen. Durch die Annäherung von BI- und BPM-Technologie soll ein Mehrwert erzielt werden, der über die einzelnen jeweiligen Nutzen hinausgeht. Problem Zusammenführung der fluss-orientierten Prozess-Spezifikation und des snapshotbasierten multidimensionalen Designs zur quantitativen Analyse ist nicht trivial, da die Voraussetzungen und Ziele sehr verschieden und z.t. sogar inkompatibel sind. 13

14 Transformation Geschäftsprozess-Beschreibung in das OLAP-System Um Zugang in ein OLAP-System zu erhalten, müssen die Beschreibungen der Geschäftsprozesse eine Transformation durch das zugrunde liegende multidimensionale Datenmodell durchleben. Ein chirurgischer Prozess kann z.b. als Fakt-Eintrag Surgery modelliert werden, welcher durch die Dimensionen Location, Surgeon, Patient und Discipline charakterisiert wird. Die Werte innerhalb einer Dimension werden typischerweise als Hierarchie gespeichert um multiple Granularitäten zu unterstützen. 14

15 Multidimensionale Perspektive eines Prozesses logische/zeitliche und technische Strukturierung Zwei Ansatzarten zur Modellierung von chirurgischen Eingriffen: Logische / zeitliche Strukturierung Aktivitäten (Activities) beschreiben chirurgische Aufgaben oder Arbeitsschritte wie es ein Beobachter aufnehmen würde: o Entfernung von Blut mit Tupfer o Schnitt mit Skalpell Technische Strukturierung Konzept von Event und State kommt zum Einsatz Beschreibt die Status-Änderungen der entsprechenden Subsysteme zusammen mit dem auslösenden Event Zu den Subsystemen gehören z.b.: beteiligte Personen, ausführende Hand, Instrumente, Akteure, Geräte.. 15

16 Multidimensionale Perspektive eines Prozesses Vertikale Zerlegung Gliederung der Prozess-Struktur: Vertikale / Horizontale Zerlegung Vertikale Zerlegung in zwei Granularitätsstufen der Fakten: Surgery: jede einzelne OP mit entsprechenden Attributen und Dimensionen stellen einen Fakt-Typ der obersten Ebene dar. Activity, State, Event: stellen drei Typen von Workflow-Komponenten dar. Jede hat ihre eigene Dimensionen; Behandlung als unabhängige Fakt-Typen. Abb.: vertikale Zerlegung des chirurgischen workflows in eine Fakt-Hierarchie 16

17 Multidimensionale Perspektive eines Prozesses Vertikale Zerlegung Generelle Struktur eines chirurgischen Prozesses in UML-Klassen-Notation: Die Eigenschaften eines Prozesses sind entsprechend einer vertikalen Zerlegung angeordnet: workflow level Enthält charakteristische Beschreibung der OP als Ganzes. work step level Eigenschaften gehören zu einer bestimmten Komponente innerhalb eines Workflows. 17

18 Multidimensionale Perspektive eines Prozesses Horizontale Zerlegung Horizontale Zerlegung in sachliche Perspektiven (analog zur Identifizierung von Dimensionen eines OLAP-Würfels): Tätigkeit (Definiert Sub-Prozesse: gruppiert z.b. Aktivitäten in Phasen) Arbeitsgang (Aktionen mit entsprechenden Instrumenten) Verlauf (Ausführungsfolge) Information (behandelt Daten-Input/-Output der Komponenten, z.b. Bilder, Signale, technische Parameter, Kommunikation..) Organisation (welche Person / Ressource ist für welche Tätigkeit verantwortlich) 18

19 Modellierungs-Herausforderungen Zusätzlich zu klassischen OLAP-Einschränkungen, wie z.b.: Summierbarkeit von Dimensions-Hierarchien Verbot von Nullwerten als Fakt-Einträge bringt BPM folgende Herausforderungen mit: Many-to-Many Beziehung zwischen Fakten und Dimensionen sind häufig Variable Granularität infolge von Ungenauigkeiten z.b. Dimension Diagnose: Bezeichnung kann auf einem mehr oder weniger spezifischen Level erfolgen. 19

20 Modellierungs-Herausforderungen Heterogenität von Fakt-Einträgen. o Prozesse bestehen aus unterschiedlichen Komponenten. o Modelliert man Komponenten als einen Fakt-Typ, führt dies zu einem Verlust der Unterklassen-Eigenschaften. o Mappt man die Subklasse auf verschiedene Fakt-Typen, verliert man die Fähigkeit, alle Komponenten wie eine einzige Klasse zu behandeln (bei den gemeinsamen Eigenschaften). Austauschbarkeit von Kennzahlen und Dimensions-Rollen. o Im konventionellen Data Warehousing: Measure-Attribute sind zur Design- Zeit bekannt. o Geschäftsprozess-Daten als solche besitzen keine expliziten mengenmäßigen Charakteristiken. o Measures variieren von Query zu Query. Wichtig: Möglichkeit, Measures während der Laufzeit von praktisch jedem Attribut spezifizieren zu können. 20

21 Modellierungs-Herausforderungen Austauschbarkeit von Fakt und Dimensions-Rollen o Surgery hat selbst einen dimensionellen Charakter (Location, Patient) und kann daher als Fakt-Typ behandelt werden. o Hinsichtlich einer einzelnen Aktivität spielt Surgery jedoch die Rolle einer Dimension (z.b. Event rolls-up to Surgery). Fakt-Schema ohne Measures o Die Measures können dynamisch definiert werden, d.h. es werden lediglich die Einträge der qualifizierenden Fakt-Einträge gezählt. 21

22 Modellierungs-Lösungen Schema eines chirurgischen Workflows Darstellung ist an das Dimensional Fact Model angelehnt: Fakten Rechtecke Dimensions-Hierarchie Gerichtete Graphen mit runden Kategorie-Knoten roll-up -Beziehung Durchgezogene Pfeile is-a -Beziehung zwischen Fakten Gestrichelte Linien 22

23 Modellierungs-Lösungen Schema eines chirurgischen Workflows Fact constellation Fakt-Tabellen besitzen gemeinsame Dimensionen. Fact hierarchy Vertikale Zerlegung component rolls-up zu surgery. Satellite fact Extraktion jeder m:n-beziehung zwischen Fakt und Dimension in eine sog. bridge-tabelle, z.b. surgery_discipline. Fact generalization Gleichbehandlung von Fakt-Typen activity, state, event in gemeinsamer Superklasse component hinsichtlich gemeinsamer Eigenschaften. 23

24 Relationale Implementierung Star und Snowflake Schema sind die beiden Optionen des relationalen Data Warehouse Designs. Star Schema: Platzierung der gesamten Dimensions-Hierachie in eine einzelne Relation durch pre-joining aller Aggregations-Level. Snowflake Schema: Normalisierte Dimensions-Hierarchien. Einzige Option, wenn dimensionale Hierarchien zu Irregularien führen, wie z.b. Heterogenität, non-strictness, missing values, mixed granularität Realisiert: Galaxy-Schema analog Snowflake Schema; jedoch sind mehrere Faktentabellen vorhanden, die mit denselben Dimensionstabellen verknüpft sind. Erweiterung des herkömmlichen Galaxy-Schema um zusätzliche Tabellen-Typen: Generalisierte Tabellen: Satellite Fact: 24

25 Pentaho Vorstellung Open Source Pentaho Business Intelligence Plattform: Bündelt Open Source BI-Projekte. Stellt breites und integriertes Portfolio unterschiedlicher Open Source BI-Tools zusammen. Zählt zu den 100 populärsten Open Source-Projekten; Marktführer in Open Source BI. Gründung: 2004, Orlando (USA) Gründungsteam: Zusammenschluss ehemaliger Manager und Branchenkenner auf dem BI-Gebiet verschiedener führender BI-Hersteller. Zusätzlich zur Open Source Version wird eine professional edition angeboten. 25

26 Pentaho Vorstellung Software unterstützt flexible Einsatzmöglichkeiten: Komponenten für Entwickler o Nutzung einzelner Komponenten durch Web Service Interfaces. o BI-Funktionalitäten können z.b. in bestehende Applikationen integriert werden. o Auf Kundenbedarf zugeschnittene BI-Lösungen. Out-of-the-box Produkte o Ready-to-deploy Applikationen für Reporting, Analyse, Dashboards, Data Mining und Workflow stehen zur Verfügung. o Können im Paket oder als stand-alone-anwendungen genutzt werden. Komplettes BI-Framework o Alle Ressourcen sind in einem umfassenden BI-Framework mit zentralen Repository, Security und anderen plattformweiten Features integriert. 26

27 Pentaho Open BI Suite Pentaho BI-Projekt umfasst folgende Applikationsbereiche: Reporting (JFreeReport) Analyse o OLAP-Server (Mondrian) o Data Mining (Weka) Dashboards Prozess Management o Datenintegration (Kettle) BI Plattform (Pentaho) 27

28 Pentaho Komponente KETTLE Datenintegration Pentaho Datenintegration: KETTLE Akronym KETTLE: Kettle Extraction, Transformation, Transportation and Loading Environment. In Java geschriebenes ETL-Tool. Enthält eine GUI-Komponente zur Konfiguration von Transformations- und Ladeprozessen. Datenfluss kann mittels drag-and-drop über eine graphische Oberfläche gestaltet werden. Es wird spezifiziert WAS gemacht werden soll, jedoch nicht WIE. Transformations-Bibliothek mit über 70 out-of-the-box Mapping-Objekten. 28

29 Pentaho Komponente KETTLE Datenintegration KETTLE besteht aus mehreren Komponenten: Graphisches Tool zum Erstellen von Transformationen und Jobs. Transformations-Engine, um Daten aus verschiedenen Quellen zu laden, zu transformieren und an das gewünschte Ziel auszugeben. Komponente zur Verwaltung von Jobs, die zu bestimmten Zeiten ausgeführt werden sollen. 29

30 Pentaho Komponente KETTLE Datenintegration Anwendungen Import von Daten in Datenbanken. Quellen reichen von Text-Dateien bis Excel-Tabellen. Export von Datenbanken in Text-Dateien oder andere Datenbanken. Datenmigration zwischen Datenbank-Applikationen. Exploration von Daten in vorhandenen Datenbanken (Tabellen, Views..). Datenbereinigung durch Hinzufügen von komplexen Bedingungen in die Daten- Transformationen. 30

31 Pentaho Komponente Reporting Reporting - Eigenschaften Basiert auf JFreeReport (freie Java Reporting Bibliothek) Flexibler Einsatz o Standalone desktop reporting o Interaktives webbasiertes Reporting Zugriff auf unterschiedliche Datenquellen: o Relationale Datenbanksysteme o XML-basierte Datenquellen o OLAP u.a. Zusammenfassung der Daten aus diversen Quellen 31

32 Pentaho Komponente Reporting Exportmöglichkeit in verschiedenen Formaten: o PDF, HTML, Excel, Word Design Studio o Unterstützung durch Wizzard o Report Layout o Verteilung der Reports (Mail, Durchführungszeit..) o Berichte mit statischen / dynamischen Selektionen Integration in nächste Entwicklerversion von OpenOffice. 32

33 Pentaho Komponente Dashboards Pentaho Dashboards Visuelle Bereitstellung wichtiger Kennzahlen Sofortiger Einblick in individuelle, Abteilungs- oder Unternehmensleistungen Versorgt Unternehmen mit kritischen Informationen Möglichkeit zur Definition und Verfolgung von kritischen Geschäftsmetriken 33

34 Pentaho Komponente Dashboards Interaktive visuelle Displays o Nutzer erkennt sofort, welche Geschäftszahlen im grünen Bereich sind bzw. eine besondere Aufmerksamkeit erfordern. Integration in Pentaho Plattform o Zusammenspiel mit Reporting und Analysis o Steht einer großen Menge von Nutzern zur Verfügung o Integrierte Security, Scheduling Integrierte Alarmierung falls Ausnahmen auftreten sollten. 34

35 Pentaho Komponente WEKA Data Mining Pentaho übernimmt 2006 Data Mining Projekt WEKA WEKA wurde an der University of Waikato, Neuseeland, entwickelt. Quelloffenes Data-Mining-Framework Sammlung von Java-Klassen zur o Datenaufbereitung o Datensammlung o Klassifizierung o Visualisierung 35

36 Pentaho Komponente WEKA Data Mining Unterstützte Data Mining-Verfahren: Clustering Segmentierung Entscheidungsbäume PCA-Analyse Neuronale Netze Unterstützung durch graphische Tools: Data Mining Design Administration Unterstützt neben verschiedenen Data Mining-Verfahren auch das Präprozessing 36

37 Pentaho Komponente MONDRIAN OLAP-Server Einführung Mondrian ist ein OS OLAP-Server. Bietet multidimensionale Sicht der Daten. Programmiert in Java. Zugriff via JDBC auf fast alle relationale Datenbanksysteme. Auswertung erfolgt im Kern mit MDX (Multidimensional Expressions). Die Abfragen werden via HTTP/Tomcat an den Java-Mondrian Server geleitet und ausgeführt. Mit der Bibliothek JPIVOT kann man Mondrian-Abfragen über JSP (Java Server Pages) in Weblösungen integrieren. 37

38 Pentaho Komponente MONDRIAN OLAP-Server Anwendung / Navigation und Datenexploration: Ermöglicht interaktive Analyse großer Datenmengen. Für Analyse in der Pentaho-Plattform muss Anwender kein SQL beherrschen. Webbasierte Frontends oder Excel 38

39 Pentaho Komponente MONDRIAN OLAP-Server Funktionalität Standard-OLAP-Funktionen o Slicing o Dicing o Drill-Down/Roll-up o Pivot Auswahl gewünschter members zur Analyse Filterung / Sortierung von Daten Diagramm-Erzeugung Export aktueller Daten in verschiedenen Formaten Reportingmöglichkeiten (PDF Generierung..) 39

40 Pentaho Komponente MONDRIAN OLAP-Server Realisiert in einer 4-Schichten-Architektur: Präsentationsschicht (Presentation layer) Kalkulationsschicht (Dimensional layer) Aggregationsschicht (Star layer) Speicherschicht (Storage layer) Mondrian Server 1. Schicht: Präsentationsschicht Bestimmt was der Nutzer auf dem Bildschirm sieht. Interaktionsmöglichkeiten zur Formulierung von Anfragen. Große Anzahl an Möglichkeiten zur Darstellung von multidimensionalen Daten, z.b. Pivottabellen, verschiedene Diagramm-Arten, fortgeschrittene Visualisierungen. Gemeinsam ist allen das zugrunde liegende Schema in Form von Dimensionen, Measures und Zellen. Auf dieser Basis werden Anfragen an den OLAP-Server gestellt und von diesem beantwortet. 40

41 Pentaho Komponente MONDRIAN OLAP-Server 2. Schicht: Kalkulationsschicht Parst, validiert und führt MDX-Queries aus. Aus Effizienz-Gründen werden Zellen-Anfragen an die Aggregations-Schicht gesendet. Ein Query-Transformer erlaubt der Anwendung, jede eingehende Query umzuschreiben und von Grund auf neue MDX-Statements zu formulieren. Metadaten beschreiben das dimensionale Modell und wie es auf das relationale Modell gemappt wird ( Mondrian-Schema ). 41

42 Pentaho Komponente MONDRIAN OLAP-Server 3. Schicht: Aggregationsschicht Pflegt die Aggregations-Caches. Eine Aggregation ist ein Satz von Measure-Werten (Zellen) im Speicher. Die Kalkulationsschicht prüft zunächst, ob die von ihr benötigten aggregierten Werte im Cache gehalten werden. Falls Werte nicht im Cache bzw. auch nicht hergeleitet werden können, sendet der Aggregations-Manager eine Anfrage an die Speicherschicht. 4. Schicht: Speicherschicht Ist ein RDBMS und der Zugriff kann über JDBC erfolgen. 42

43 Pentaho Komponente MONDRIAN OLAP-Server Zugriff auf Mondrian Mondrian bietet eine proprietäre API an, damit Client-Applikationen Queries ausführen können. Die Query Language ist MDX (MultiDimensional expressions), um Queries zu spezifizieren. MDX ist in der gleichen Weise eine Anfragesprache für multidimensionale Datenbanken wie SQL für relationale Datenbanken. 43

44 Pentaho Komponente MONDRIAN OLAP-Server MDX-Bestandteile Measures und Dimensions (analog Fakten und Dimensionen im DWH) Dimensionen bestehen aus einer Menge von Members (Klassifikationsknoten) Diese sind in verschiedenen Levels (Klassifikationsstufen) über Multiple Hierarchien (Klassifikationspfade) miteinander verbunden, worüber aggregiert werden kann. MDX-Anfrage (allgemein) SELECT axis ON COLUMNS, axis ON ROWS FROM cube WHERE slice From: Auswahl des Cubes Select: Auswahl Dimensionen u. Klassifikationsstufen Columns/Rows: Abbildung auf verschiedene Achsen der Ergebnis-Tabelle Slice: Auswahl innerhalb der Fakten 44

45 Pentaho Mondrian Schema Mondrian Schema Beschreibung der multidimensionalen Zusammenhänge von Daten. Beinhaltet ein logisches Modell, bestehend aus o Cubes o Hierarchien o Members Mappt das logische Modell auf ein physisches. Logisches Modell Besteht aus den Konstrukten, mit welchen Queries in MDX geschrieben werden: cubes, dimensions, hierarchies, levels und members. Physisches Modell ist eine Datenquelle, welche durch das logische Modell repräsentiert wird. Bsp.: Star-Schema oder Snowflake-Schema (Satz von Tabellen in einer relationalen Datenbank) 45

46 Pentaho Mondrian Schema Schema-Files Mondrian Schema Files werden durch ein XML-File dargestellt. Können von Hand in einem gewöhnlichen Editor erstellt werden. Mit Hilfe des Tools Pentaho Cube Designer wird die Erzeugung dieses Schemas graphisch unterstützt. 46

47 Pentaho Cube Designer Modellierungswerkzeug "Cube Designer" Unterstützung beim Design von OLAP-Anwendungen Wizzard führt Schritt für Schritt durch den Modellierungs-Vorgang: o Verbindung zum relationalen Datenbanksystem o Festlegung der analytischen Dimensionen o Bestimmen von Measures und Angabe der Fakt-Tabelle Bietet graphische Oberfläche, keine Programmierung notwendig 47

48 Pentaho Cube Designer Erzeugt Mondrian Schema, worauf der Mondrian-OLAP-Server zugreift. Befindet sich noch im Entwicklungs-Prozess Einschränkungen vorhanden o Keine geteilten Dimensionen o Keine multiplen Hierarchien o Keine nachträglichen Änderungen o Snowflake-Schema wird nur mangelhaft unterstützt o Erzeugt z.t. fehlerhaften Output o.. Nachbearbeitung der erzeugten Solution notwendig. 48

49 Praktische Vorführung Pentaho Anwendung Pentaho Cube Designer Design eines OLAP-Würfels (Zugriff PostgreSQL) Erzeugung des Mondrian-Schemas Anwendung Pentaho BI-Plattform Integration des Mondrian-Schemas in die Pentaho-Plattform Mehrdimensionale Datenanalyse 49

50 Konkrete Umsetzungen Datenbankentwurf Aufgezeichnete Daten standen im XML-Format ohne Schema zur Verfügung. Auf dieser Basis und weiteren Anforderungen von ICCAS wurden während der konzeptionellen Entwurfsphase Objekte, deren Attribute und Beziehungen sowie entsprechende Kardinalitäten herausgearbeitet. Logischer Entwurf und Umsetzung in das relationale Datenbankschema (Snowflake) Datenbank-Implementierung: PostgreSQL / DB2 Datenbankentwurf erfolgte iterativ und wurde schrittweise neuen Erkenntnissen / Anforderungen angepasst. 50

51 Konkrete Umsetzungen Programmierung Übersetzungsroutine SAX-Parser wurde in Java programmiert und jeweils angepasst, um XML-Daten in entsprechende DB zu transformieren. ETL-Prozess Basis: Simulationsdaten von OPs im CSV-Format Korrektur fehlerhafter Daten Programmierung Java-Routine zur Transformation und zum Ladevorgang in die DB Pentaho Installation / Konfiguration Pentaho (z.b. Treiber, Pfade setzen, Probleme mit neuer jdk-version, Dateien in falschen Verzeichnissen..) Erstellung/Anpassung von XML-Daten zur JNDI Datenbank-Konfiguration für Datenbanksysteme PostgreSQL und DB2 Einrichtung Remote-Zugang 51

52 Konkrete Umsetzungen Cube Designer (CD) und Mondrian Server (MS): Probleme / Lösungen CD unterliegt Einschränkungen und liefert teilweise fehlerhaften Code des Mondrian-Schemas Nachbearbeitung notwendig. CD nicht für Snowflake-Schema geeignet. Liefert z.b. ab dritter Hierarchie-Stufe falschen Code. Lösung: Fehlende Alias-Namen hinzufügen. Ab bestimmten Hierarchie-Ebenen erzeugt CD keine Join-Anweisungen der Tabellen. Lösung: Fehlende Join-Anweisungen ergänzen. Probleme mit Tabellen bei geteilten Dimensionen (MS). Lösung: Für jede mögliche Mehrfachnutzung separate Views erzeugen. 52

53 Konkrete Umsetzungen Verwendung des Datentyps integer anstatt von string bei members führt zu Fehlern während des SQL-Zugriffs. (Kurzfristige) Lösung: Anpassen des Datentyps. Kleinere Probleme: übernimmt man z.b. die vom CD vorgeschlagene Standardbezeichnung eines Levelnamens, führt dies zu einem Fehler beim späteren Zugriff auf die zugrunde liegenden Daten. Dokumentation Vorgehensweise zur Administration der Pentaho-Plattform und des Cube Designers zur Solution-Erzeugung auf Basis einer PostgreSQL-Datenbank Hinweise und Lösungen zu Problemen des Cube Designers bzw. des Mondrian Schemas 53

54 Fazit Modellierung Großer Lernerfolg während der Entwicklung des Datenbank-Entwurfs Interessant, sich mit dem Umfeld der Chirurgie auseinanderzusetzen. Abwechslungsreiche Herausforderungen hinsichtlich der Transformation: Prozesse OLAP Pentaho BI-Plattform Einstieg wird durch die schlechte Dokumentation sehr erschwert, jedoch hilfreiche Community. Sind die vorhandenen Probleme jedoch gelöst, lässt sich mit Pentaho gut arbeiten. OLAP-Server Mondrian stellt einen Großteil der gewünschten Funktionalität zur Verfügung. Zur Modellierung von größeren OLAP-Würfeln ist die Weiterentwicklung des Cube Designers wünschenswert. Pentaho ist für das Kennenlernen einer BI-Plattform auf jeden Fall empfehlenswert. 54

55 Fazit Allgemein Zusätzlich zum Datenbankentwurf konnten zahlreiche praktische Erfahrungen gesammelt werden in den Bereichen Anwendung Datenbanksysteme DB2 und PostgreSQL Modellierung von OLAP-Würfeln Anwendung BI-Plattform SAX-Parser Programmierung Betreuung und Unterstützung während des gesamten Praktikums war sehr gut. Projekt-Praktikum machte großen Spaß und findet Fortsetzung in meiner Masterarbeit. 55

56 Fragen? Besten Dank für Ihre Aufmerksamkeit. 56

Konzeption und Realisierung eines Data Warehouses zur Analyse chirurgischer Workflows

Konzeption und Realisierung eines Data Warehouses zur Analyse chirurgischer Workflows Matthias Röger Konzeption und Realisierung eines Data Warehouses zur Analyse chirurgischer Workflows Diplomica Verlag Matthias Röger Konzeption und Realisierung eines Data Warehouses zur Analyse chirurgischer

Mehr

Asklepius-DA Die intelligente Technologie für die umfassende Analyse medizinischer Daten Leistungsbeschreibung

Asklepius-DA Die intelligente Technologie für die umfassende Analyse medizinischer Daten Leistungsbeschreibung Asklepius-DA Die intelligente Technologie für die umfassende Analyse medizinischer Daten Leistungsbeschreibung Datei: Asklepius DA Flyer_Leistung_2 Seite: 1 von:5 1 Umfassende Datenanalyse Mit Asklepius-DA

Mehr

OLAP und Data Warehouses

OLAP und Data Warehouses OLP und Data Warehouses Überblick Monitoring & dministration Externe Quellen Operative Datenbanken Extraktion Transformation Laden Metadaten- Repository Data Warehouse OLP-Server nalyse Query/Reporting

Mehr

Einführung in OLAP und Business Analysis. Gunther Popp dc soft GmbH

Einführung in OLAP und Business Analysis. Gunther Popp dc soft GmbH Einführung in OLAP und Business Analysis Gunther Popp dc soft GmbH Überblick Wozu Business Analysis mit OLAP? OLAP Grundlagen Endlich... Technischer Background Microsoft SQL 7 & OLAP Services Folie 2 -

Mehr

QUICK-START EVALUIERUNG

QUICK-START EVALUIERUNG Pentaho 30 für 30 Webinar QUICK-START EVALUIERUNG Ressourcen & Tipps Leo Cardinaals Sales Engineer 1 Mit Pentaho Business Analytics haben Sie eine moderne und umfassende Plattform für Datenintegration

Mehr

Studierenden-Kennzahlen im Griff dank flexiblem Reporting und Ad-hoc-Analysen

Studierenden-Kennzahlen im Griff dank flexiblem Reporting und Ad-hoc-Analysen Praxistag für die öffentliche Verwaltung 2012 Titel Präsentation Studierenden-Kennzahlen im Griff dank flexiblem Reporting und Ad-hoc-Analysen Referenten-Info Gerhard Tschantré, Leiter Controllerdienste

Mehr

OLAP und der MS SQL Server

OLAP und der MS SQL Server OLAP und der MS SQL Server OLAP und der MS SQL Server OLAP-Systeme werden wie umfangreiche Berichtssysteme heute nicht mehr von Grund auf neu entwickelt. Stattdessen konzentriert man sich auf die individuellen

Mehr

Modellbasierte Business Intelligence in der Praxis. Nürnberg, 10.11.2009

Modellbasierte Business Intelligence in der Praxis. Nürnberg, 10.11.2009 Modellbasierte Business Intelligence in der Praxis Nürnberg, 10.11.2009 I N H A L T 1. Warum Modelle für Business Intelligence (BI)? 2. Inhalte von Datenmodellen für BI 3. Inhalte von Prozessmodellen 4.

Mehr

Data Warehouse Grundlagen

Data Warehouse Grundlagen Seminarunterlage Version: 2.10 Version 2.10 vom 24. Juli 2015 Dieses Dokument wird durch die veröffentlicht.. Alle Rechte vorbehalten. Alle Produkt- und Dienstleistungs-Bezeichnungen sind Warenzeichen

Mehr

Business Intelligence Praktikum 1

Business Intelligence Praktikum 1 Hochschule Darmstadt Business Intelligence SS 2014 Fachbereich Informatik Praktikumsversuch 1 Prof. Dr. C. Wentzel Dipl. Inf. Dipl. Math. Y. Orkunoglu Datum: 07.05.2014 Business Intelligence Praktikum

Mehr

Business Intelligence und Geovisualisierung in der Gesundheitswirtschaft

Business Intelligence und Geovisualisierung in der Gesundheitswirtschaft Business Intelligence und Geovisualisierung in der Gesundheitswirtschaft Prof. Dr. Anett Mehler-Bicher Fachhochschule Mainz, Fachbereich Wirtschaft Prof. Dr. Klaus Böhm health&media GmbH 2011 health&media

Mehr

Realisierung von OLAP Operatoren in einem visuellen Analysetool. Vortrag von Alexander Spachmann und Thomas Lindemeier

Realisierung von OLAP Operatoren in einem visuellen Analysetool. Vortrag von Alexander Spachmann und Thomas Lindemeier Realisierung von OLAP Operatoren in einem visuellen Analysetool Vortrag von Alexander Spachmann und Thomas Lindemeier Gliederung Ausgangssituation/Motivation Was ist OLAP? Anwendungen Was sind Operatoren?

Mehr

Hetero-Homogene Data Warehouses

Hetero-Homogene Data Warehouses Hetero-Homogene Data Warehouses TDWI München 2011 Christoph Schütz http://hh-dw.dke.uni-linz.ac.at/ Institut für Wirtschaftsinformatik Data & Knowledge Engineering Juni 2011 1 Data-Warehouse-Modellierung

Mehr

Anwendertage WDV2012

Anwendertage WDV2012 Anwendertage WDV2012 28.02.-01.03.2013 in Pferdingsleben Thema: Business Intelligence mit Excel 2010 Referent: Dipl. Wirtsch.-Inf. Torsten Kühn PRAXIS-Consultant Alles ist möglich! 1 Torsten Kühn Dipl.

Mehr

GESCHÄFTSSTELLENERÖFFNUNG HAMBURG, 25. APRIL 2013

GESCHÄFTSSTELLENERÖFFNUNG HAMBURG, 25. APRIL 2013 OPEN SYSTEMS CONSULTING IT-KOMPLETTDIENSTLEISTER IM MITTELSTAND GESCHÄFTSSTELLENERÖFFNUNG HAMBURG, 25. APRIL 2013 Business Analytics Sascha Thielke AGENDA Die Geschichte des Reporting Begriffe im BA Umfeld

Mehr

Business Intelligence Praktikum 1

Business Intelligence Praktikum 1 Hochschule Darmstadt Business Intelligence WS 2013-14 Fachbereich Informatik Praktikumsversuch 1 Prof. Dr. C. Wentzel Dipl. Inf. Dipl. Math. Y. Orkunoglu Datum: 14.10.2013 Business Intelligence Praktikum

Mehr

tdwi E U R D P E OPEN SOURCE BUSINESS INTELLIGENCE HANSER MÖGLICHKEITEN, CHANCEN UND RISIKEN QUELLOFFENER BI-LÖSUNGEN

tdwi E U R D P E OPEN SOURCE BUSINESS INTELLIGENCE HANSER MÖGLICHKEITEN, CHANCEN UND RISIKEN QUELLOFFENER BI-LÖSUNGEN OPEN SOURCE BUSINESS INTELLIGENCE MÖGLICHKEITEN, CHANCEN UND RISIKEN QUELLOFFENER BI-LÖSUNGEN uwehaneke Stephan TRAHASCH tobias HAGEN tobias LAUER (Hrsg.)' tdwi E U R D P E HANSER Vorwort 9 Einführung

Mehr

Fachbereich Informatik Praktikumsversuch 4. Prof. Dr.. S. Karczewski Dipl. Inf. Dipl. Math. Y. Orkunoglu Datum: 11.06.2015

Fachbereich Informatik Praktikumsversuch 4. Prof. Dr.. S. Karczewski Dipl. Inf. Dipl. Math. Y. Orkunoglu Datum: 11.06.2015 Hochschule Darmstadt Data Warehouse SS2015 Fachbereich Informatik Praktikumsversuch 4 Prof. Dr.. S. Karczewski Dipl. Inf. Dipl. Math. Y. Orkunoglu Datum: 11.06.2015 1. Kurzbeschreibung Dieses Praktikum

Mehr

Data Warehouse Definition (1) http://de.wikipedia.org/wiki/data-warehouse

Data Warehouse Definition (1) http://de.wikipedia.org/wiki/data-warehouse Data Warehouse Definition (1) http://de.wikipedia.org/wiki/data-warehouse Ein Data-Warehouse bzw. Datenlager ist eine zentrale Datensammlung (meist eine Datenbank), deren Inhalt sich aus Daten unterschiedlicher

Mehr

Data Warehouse Technologien

Data Warehouse Technologien Veit Köppen Gunter Saake Kai-Uwe Sattler Data Warehouse Technologien Inhaltsverzeichnis Inhaltsverzeichnis vii 1 Einführung in Data-Warehouse-Systeme 1 1.1 Anwendungsszenario Getränkemarkt...............

Mehr

Data Warehousing und Data Mining

Data Warehousing und Data Mining Data Warehousing und Data Mining 2 Cognos Report Net (CRN) Ermöglicht Erstellen von Ad-hoc-Anfragen (Query Studio) Berichten (Report Studio) Backend Data Cube Relationale Daten Übung: Cognos Report Net

Mehr

Cubeware Connectivity for SAP Solutions

Cubeware Connectivity for SAP Solutions Cubeware Connectivity for SAP Solutions Beispiele und Anwendungsfälle 1. Modellierung, Extraction, Transformation und Loading mit Datenquelle SAP R/3 und mysap ERP Mit Hilfe des Cubeware Importers und

Mehr

Intelligence (BI): Von der. Nürnberg, 29. November 2011

Intelligence (BI): Von der. Nürnberg, 29. November 2011 Modelle für Business Intelligence (BI): Von der Anforderung zum Würfel Nürnberg, 29. November 2011 Warum Modelle für Business Intelligence (BI)? Warum Modelle für Business Intelligence (BI)? Bis zur Auswertung

Mehr

BI around the world - Globale Reporting Lösungen bei Continental Automotive

BI around the world - Globale Reporting Lösungen bei Continental Automotive BI around the world - Globale Reporting Lösungen bei Continental Automotive Stefan Hess Trivadis GmbH Stuttgart Herbert Muckenfuss Continental Nürnberg Schlüsselworte: Oracle BI EE, Business Intelligence,

Mehr

Christian Kurze BI-Praktikum IBM WS 2008/09

Christian Kurze BI-Praktikum IBM WS 2008/09 Einführung in die multidimensionale Datenmodellierung e mit ADAPT BI-Praktikum IBM WS 2008/09 1 Gliederung Einführung multidimensionale Datenmodellierung 1. Multidimensionales Modell BI-Praktikum IBM WS

Mehr

Veit Köppen Gunter Saake Kai-Uwe Sattler. 2. Auflage. Data Warehouse Technologien

Veit Köppen Gunter Saake Kai-Uwe Sattler. 2. Auflage. Data Warehouse Technologien Veit Köppen Gunter Saake Kai-Uwe Sattler 2. Auflage Data Warehouse Technologien Inhaltsverzeichnis Inhaltsverzeichnis ix 1 Einführung in Data-Warehouse-Systeme 1 1.1 Anwendungsszenario Getränkemarkt...

Mehr

Oracle 10g und SQL Server 2005 ein Vergleich. Thomas Wächtler 39221

Oracle 10g und SQL Server 2005 ein Vergleich. Thomas Wächtler 39221 Oracle 10g und SQL Server 2005 ein Vergleich Thomas Wächtler 39221 Inhalt 1. Einführung 2. Architektur SQL Server 2005 1. SQLOS 2. Relational Engine 3. Protocol Layer 3. Services 1. Replication 2. Reporting

Mehr

Das Multidimensionale Datenmodell

Das Multidimensionale Datenmodell Das Multidimensionale Datenmodell Konzeptuelle Modellierung Umsetzung des Modells Beispiel ER-Modell 2 / 36 Probleme ER-Modellierung Keine Unterscheidung Klassifikation, Attribute, Kenngrößen Dimension

Mehr

O-BIEE Einführung mit Beispielen aus der Praxis

O-BIEE Einführung mit Beispielen aus der Praxis O-BIEE Einführung mit Beispielen aus der Praxis Stefan Hess Business Intelligence Trivadis GmbH, Stuttgart 2. Dezember 2008 Basel Baden Bern Lausanne Zürich Düsseldorf Frankfurt/M. Freiburg i. Br. Hamburg

Mehr

Einführungsveranstaltung: Data Warehouse

Einführungsveranstaltung: Data Warehouse Einführungsveranstaltung: 1 Anwendungsbeispiele Berichtswesen Analyse Planung Forecasting/Prognose Darstellung/Analyse von Zeitreihen Performancevergleiche (z.b. zwischen Organisationseinheiten) Monitoring

Mehr

Self Service BI mit Office 2013 Raúl B. Heiduk

Self Service BI mit Office 2013 Raúl B. Heiduk 1 Self Service BI mit Office 2013 Raúl B. Heiduk Partner: 2 Agenda Begrüssung Vorstellung Referent Inhalt F&A Weiterführende Kurse 3 Vorstellung Referent Name: Raúl B. Heiduk Ausbildung: Dipl. Ing. (FH),

Mehr

Agenda. Hype oder Mehrwert. Herausforderungen. Methoden Werkzeuge. Kosten Nutzen. Definition Ziele

Agenda. Hype oder Mehrwert. Herausforderungen. Methoden Werkzeuge. Kosten Nutzen. Definition Ziele Agenda Definition Ziele Methoden Werkzeuge Herausforderungen Kosten Nutzen Hype oder Mehrwert Definition / Ziele Google Suche: define:business Intelligence Mit Business Intelligence können alle informationstechnischen

Mehr

Microsoft SQL-Server 2008 R2/2012 Reporting und OLAP

Microsoft SQL-Server 2008 R2/2012 Reporting und OLAP Microsoft SQL-Server 2008 R2/2012 Reporting und OLAP Kompakt-Intensiv-Training OLAP gilt als Schlüsseltechnologie auf dem Gebiet Business Intelligence. In unserer Schulung "Microsoft SQL-Server 2008 R2/2012

Mehr

good. better. outperform.

good. better. outperform. good. better. outperform. Quo Vadis Oracle BI Relational oder besser multidimensional? DOAG 2013 Business Intelligence, 17.04.2013 Dirk Fleischmann Director Business Intelligence & DWH Business Intelligence

Mehr

Logische Modellierung von Data Warehouses

Logische Modellierung von Data Warehouses Logische Modellierung von Data Warehouses Vertiefungsarbeit von Karin Schäuble Gliederung. Einführung. Abgrenzung und Grundlagen. Anforderungen. Logische Modellierung. Methoden.. Star Schema.. Galaxy-Schema..

Mehr

Einführung relationale Datenbanken. Themenblock: Erstellung eines Cube. Schlüssel. Relationenmodell Relationenname Attribut. Problem.

Einführung relationale Datenbanken. Themenblock: Erstellung eines Cube. Schlüssel. Relationenmodell Relationenname Attribut. Problem. Themenblock: Erstellung eines Cube Einführung relationale Datenbanken Problem Verwaltung großer Mengen von Daten Praktikum: Data Warehousing und Data Mining Idee Speicherung der Daten in Form von Tabellen

Mehr

Data Warehouse schnell gemacht Performanceaspekte im Oracle DWH

Data Warehouse schnell gemacht Performanceaspekte im Oracle DWH Data Warehouse schnell gemacht Performanceaspekte im Oracle DWH Dani Schnider Principal Consultant Business Intelligence BI Trilogie, Zürich/Basel 25./26. November 2009 Basel Baden Bern Lausanne Zürich

Mehr

Seminar C02 - Praxisvergleich OLAP Tools

Seminar C02 - Praxisvergleich OLAP Tools C02: Praxisvergleich OLAP Tools Ein Seminar der DWH academy Seminar C02 - Praxisvergleich OLAP Tools Das Seminar "Praxisvergleich OLAP-Tools" bietet den Teilnehmern eine neutrale Einführung in die Technologien

Mehr

BIW - Überblick. Präsentation und Discoverer Demonstration - Teil 1 - Humboldt Universität zu Berlin am 10. Juni 2004

BIW - Überblick. Präsentation und Discoverer Demonstration - Teil 1 - Humboldt Universität zu Berlin am 10. Juni 2004 BIW - Überblick Präsentation und Discoverer Demonstration - Teil 1 - Humboldt Universität zu Berlin am 10. Juni 2004 Annegret Warnecke Senior Sales Consultant Oracle Deutschland GmbH Berlin Agenda Überblick

Mehr

Inhaltsverzeichnis. Teil I OLAP und der Microsoft SQL-Server 1. 1 Theoretische Grundlagen 3

Inhaltsverzeichnis. Teil I OLAP und der Microsoft SQL-Server 1. 1 Theoretische Grundlagen 3 vii Teil I OLAP und der Microsoft SQL-Server 1 1 Theoretische Grundlagen 3 1.1 Was ist OLAP?......................................... 3 1.1.1 Business Intelligence............................... 4 1.1.2

Mehr

Hochschule Darmstadt Business Intelligence WS 2013-14 Fachbereich Informatik Praktikumsversuch 3. Aufgabenstellung

Hochschule Darmstadt Business Intelligence WS 2013-14 Fachbereich Informatik Praktikumsversuch 3. Aufgabenstellung Hochschule Darmstadt Business Intelligence WS 2013-14 Fachbereich Informatik Praktikumsversuch 3 Prof. Dr. C. Wentzel Dipl. Inf. Dipl. Math. Y. Orkunoglu Datum: 18.12.2013 1. Kurzbeschreibung Dieses Praktikum

Mehr

OLAP mit dem SQL-Server

OLAP mit dem SQL-Server Hartmut Messerschmidt Kai Schweinsberg OLAP mit dem SQL-Server Eine Einführung in Theorie und Praxis IIIBibliothek V dpunkt.verlag Teil OLAP undder Microsoft SQL-Server 1 1 Theoretische Grundlagen 3 1.1

Mehr

ENTERBRAIN Reporting & Business Intelligence

ENTERBRAIN Reporting & Business Intelligence Überblick Vorhandene Listen/Analysen in ENTERBRAIN Die Daten in ENTERBRAIN Das Fundament des BI - Hauses Details zur ENTERBRAIN Staging Area Reports und Cubes auf Basis der Staging Area Data Mining mit

Mehr

Themenblock: Erstellung eines Cube

Themenblock: Erstellung eines Cube Themenblock: Erstellung eines Cube Praktikum: Data Warehousing und Data Mining Einführung relationale Datenbanken Problem Verwaltung großer Mengen von Daten Idee Speicherung der Daten in Form von Tabellen

Mehr

Komponenten und Architekturen von Analytischen Informationssystemen (AIS)

Komponenten und Architekturen von Analytischen Informationssystemen (AIS) Komponenten und Architekturen von Analytischen Informationssystemen (AIS) Melanie Pfoh Konsultation 27. Juni 2013 Hinweis Diese Folien ersetzen keinesfalls den Übungsstoff des zugehörigen e-learning-kurses.

Mehr

Die Microsoft-Komplettlösung für Datawarehousing, Big Data und Business Intelligence im Überblick. Volker.Hinz@microsoft.com

Die Microsoft-Komplettlösung für Datawarehousing, Big Data und Business Intelligence im Überblick. Volker.Hinz@microsoft.com Die Microsoft-Komplettlösung für Datawarehousing, Big Data und Business Intelligence im Überblick Volker.Hinz@microsoft.com Was sagt der Markt? Fakten Meinung der Analysten zu Microsofts Angeboten Nutzen

Mehr

Datenbanktechnologie für Data-Warehouse-Systeme

Datenbanktechnologie für Data-Warehouse-Systeme Wolfgang Lehner Datenbanktechnologie für Data-Warehouse-Systeme Konzepte und Methoden dpunkt.verlag 1 1.1 1.2 1.3 1.4 1. 5 2 2.1 2.2 2.3 Einleitung 1 Betriebswirtschaftlicher Ursprung des Data Warehousing...

Mehr

Multidimensionales Datenmodell, Cognos

Multidimensionales Datenmodell, Cognos Data Warehousing (II): Multidimensionales Datenmodell, Cognos Praktikum: Data Warehousing und Mining Praktikum Data Warehousing und Mining, Sommersemester 2010 Vereinfachte Sicht auf die Referenzarchitektur

Mehr

Pivotieren. Themenblock: Anfragen auf dem Cube. Roll-up und Drill-down. Slicing und Dicing. Praktikum: Data Warehousing und Data Mining. Produkt.

Pivotieren. Themenblock: Anfragen auf dem Cube. Roll-up und Drill-down. Slicing und Dicing. Praktikum: Data Warehousing und Data Mining. Produkt. Zeit Pivotieren Themenblock: Anfragen auf dem Cube Praktikum: Data Warehousing und Data Mining Zeit Zeit 2 Roll-up und Drill-down Slicing und Dicing Drill-down Januar 2 3 33 1. Quartal 11 36 107 Februar

Mehr

Wann nutze ich welchen semantischen Layer im Kontext von SAP HANA? [B3] Francis Fink Uetliberg, 16.09.2014 www.boak.ch

Wann nutze ich welchen semantischen Layer im Kontext von SAP HANA? [B3] Francis Fink Uetliberg, 16.09.2014 www.boak.ch Wann nutze ich welchen semantischen Layer im Kontext von SAP HANA? [B3] Francis Fink Uetliberg, 16.09.2014 www.boak.ch Obwohl mit der Verwendung von SAP HANA ein neuer semantischer Layer zum Einsatz kommt,

Mehr

Open Source BI mit Pentaho BI Suite und MySQL - Eine Alternative?

Open Source BI mit Pentaho BI Suite und MySQL - Eine Alternative? Open Source BI mit Pentaho BI Suite und MySQL - Eine Alternative? Schlüsselworte: Volker Herbort, Reinhold von Schwerin Hochschule Ulm Pentaho, Business Intelligence, Open Source, Sun, Java, MySQL, Agiles

Mehr

Modellbasierte Business Intelligence- Praxiserfahrungen in einem komplexen Data Warehouse Umfeld. München, 26. Januar 2010

Modellbasierte Business Intelligence- Praxiserfahrungen in einem komplexen Data Warehouse Umfeld. München, 26. Januar 2010 Modellbasierte Business Intelligence- Praxiserfahrungen in einem komplexen Data Warehouse Umfeld München, 26. Januar 2010 I N H A L T 1. Warum Modelle für Business Intelligence (BI)? 2. Inhalte von Datenmodellen

Mehr

SOLISYON GMBH TOBIAS GRUBER BEN WEISSMAN. Analyse von Dimensions-Schlüsselfehlern bei der Aufbereitung von SSAS Datenbanken

SOLISYON GMBH TOBIAS GRUBER BEN WEISSMAN. Analyse von Dimensions-Schlüsselfehlern bei der Aufbereitung von SSAS Datenbanken WEITER BLICKEN. MEHR ERKENNEN. BESSER ENTSCHEIDEN. Analyse von Dimensions-Schlüsselfehlern bei der Aufbereitung von SSAS Datenbanken SOLISYON GMBH TOBIAS GRUBER BEN WEISSMAN ANALYSE VON OLAP-AUFBEREITUNGSFEHLERN

Mehr

Vorwort zur zweiten Auflage...V. Vorwort zur ersten Auflage... VIII

Vorwort zur zweiten Auflage...V. Vorwort zur ersten Auflage... VIII Vorwort zur zweiten Auflage...V Vorwort zur ersten Auflage... VIII 1 Management Support Systeme und Business Intelligence Anwendungssysteme zur Unterstützung von Managementaufgaben...1 1.1 Computergestützte

Mehr

Integrationskonzepte für die HP Quality Center Plattform. Vivit 2009

Integrationskonzepte für die HP Quality Center Plattform. Vivit 2009 Integrationskonzepte für die HP Quality Center Plattform Thomas Jähnig Vivit 2009 Gliederung Einführung HP QualityCenter Synchronizer Plattform Implementierung eigener Adapter Alternativen Excel Import/Export

Mehr

Data Cube. Aggregation in SQL. Beispiel: Autoverkäufe. On-line Analytical Processing (OLAP) 1. Einführung. 2. Aggregation in SQL, GROUP BY

Data Cube. Aggregation in SQL. Beispiel: Autoverkäufe. On-line Analytical Processing (OLAP) 1. Einführung. 2. Aggregation in SQL, GROUP BY Data Cube On-line Analytical Processing (OLAP). Einführung Ziel: Auffinden interessanter Muster in großen Datenmengen 2. Aggregation in SQL, GROUP BY 3. Probleme mit GROUP BY 4. Der Cube-Operator! Formulierung

Mehr

good. better. outperform.

good. better. outperform. good. better. outperform. Analytic mit Oracle BI relational oder besser multidimensional? 8. Oracle BI & DWH Konferenz, 20.03.2013 Dirk Fleischmann Director Business Intelligence & DWH Business Intelligence

Mehr

HMS. Statistiken mit SAS ins Internet. HMS Analytical Software GmbH - Johannes Lang

HMS. Statistiken mit SAS ins Internet. HMS Analytical Software GmbH - Johannes Lang HMS Statistiken mit SAS ins Internet HMS Analytical Software GmbH - Johannes Lang Schweizer Tage der öffentlichen Statistik, Davos 08.09. 10.09.2008 1 Agenda Vorstellung Inhaltliche Einleitung Statische

Mehr

MS SQL Server 2012 (4)

MS SQL Server 2012 (4) MS SQL Server 2012 (4) Data Mining, Analyse und multivariate Verfahren Marco Skulschus Jan Tittel Marcus Wiederstein Webseite zum Buch: http://vvwvv.comelio-medien.com/buch-kataiog/ms sql_server/ms sql

Mehr

Business Intelligence im Krankenhaus

Business Intelligence im Krankenhaus Business Intelligence im Krankenhaus Dr. Thomas Lux Holger Raphael IT-Trends in der Medizin 03.September 2008 Essen Gliederung Herausforderungen für das Management im Krankenhaus Business Intelligence

Mehr

Datenbanken. Produkte Dienstleistungen Referenzen

Datenbanken. Produkte Dienstleistungen Referenzen Datenbanken Produkte Dienstleistungen Referenzen Produkte: MS SQL Server MS SQL Server 2005 Datenbankmodul Berichtssysteme mit Reporting Services Data Warehousing/Data Mining mit Analysis Services Schnittstellen

Mehr

RE.one. Self Service Information Management für die Fachabteilung

RE.one. Self Service Information Management für die Fachabteilung RE.one Self Service Information Management für die Fachabteilung Das Ziel Verwertbare Informationen aus Daten gewinnen Unsere Vision Daten Info Data Warehousing radikal vereinfachen in einem Tool Die Aufgabe

Mehr

Open Source BI Trends. 11. Dezember 2009 Wien Konstantin Böhm

Open Source BI Trends. 11. Dezember 2009 Wien Konstantin Böhm Open Source BI Trends 11. Dezember 2009 Wien Konstantin Böhm Profil Folie 2 JAX 2009 11.12.2009 Gründung 2002, Nürnberg 50 Mitarbeiter Innovative Kunden Spezialisiert auf Open Source Integration Open Source

Mehr

Survival Guide für Ihr Business Intelligence-Projekt

Survival Guide für Ihr Business Intelligence-Projekt Survival Guide für Ihr Business Intelligence-Projekt Sven Bosinger Solution Architect BI Survival Guide für Ihr BI-Projekt 1 Agenda Was ist Business Intelligence? Leistungsumfang Prozesse Erfolgsfaktoren

Mehr

Semtation GmbH SemTalk

Semtation GmbH SemTalk Semtation GmbH SemTalk Christian Fillies Was ist SemTalk? Prozessmodellierung mit Visio2003 Viele Methoden (EPK, PROMET, FlowChart, KSA ), einfach an Kundenbedürfnisse anzupassen und zu erweitern HTML

Mehr

Seminar in der Seminarreihe Business Intelligence 1. OLAP und Datawarehousing

Seminar in der Seminarreihe Business Intelligence 1. OLAP und Datawarehousing Seminar in der Seminarreihe Business Intelligence 1 OLAP und Datawarehousing OLAP & Warehousing Die wichtigsten Produkte Die Gliederung Produkt Bewertung & Vergleiche Die Marktentwicklung Der aktuelle

Mehr

Data Lineage goes Traceability - oder was Requirements Engineering von Business Intelligence lernen kann

Data Lineage goes Traceability - oder was Requirements Engineering von Business Intelligence lernen kann Data Lineage goes Traceability - oder was Requirements Engineering von Business Intelligence lernen kann Andreas Ditze MID GmbH Kressengartenstraße 10 90402 Nürnberg a.ditze@mid.de Abstract: Data Lineage

Mehr

Star-Schema-Modellierung mit ERwin - eine kritische Reflexion der Leistungspotentiale und Anwendungsmöglichkeiten

Star-Schema-Modellierung mit ERwin - eine kritische Reflexion der Leistungspotentiale und Anwendungsmöglichkeiten Star-Schema-Modellierung mit ERwin - eine kritische Reflexion der Leistungspotentiale und Anwendungsmöglichkeiten Michael Hahne T&I GmbH Workshop MSS-2000 Bochum, 24. März 2000 Folie 1 Worum es geht...

Mehr

Business Intelligence Data Warehouse. Jan Weinschenker

Business Intelligence Data Warehouse. Jan Weinschenker Business Intelligence Data Warehouse Jan Weinschenker 28.06.2005 Inhaltsverzeichnis Einleitung eines Data Warehouse Data Warehouse im Zusammenfassung Fragen 3 Einleitung Definition: Data Warehouse A data

Mehr

Data Mining Standards am Beispiel von PMML. Data Mining Standards am Beispiel von PMML

Data Mining Standards am Beispiel von PMML. Data Mining Standards am Beispiel von PMML Data Mining Standards am Beispiel von PMML Allgemeine Definitionen im Data Mining Data Mining (DM) Ein Prozess, um interessante neue Muster, Korrelationen und Trends in großen Datenbeständen zu entdecken,

Mehr

Diplomarbeit: GOMMA: Eine Plattform zur flexiblen Verwaltung und Analyse von Ontologie Mappings in der Bio-/Medizininformatik

Diplomarbeit: GOMMA: Eine Plattform zur flexiblen Verwaltung und Analyse von Ontologie Mappings in der Bio-/Medizininformatik Diplomarbeit: GOMMA: Eine Plattform zur flexiblen Verwaltung und Analyse von Ontologie Mappings in der Bio-/Medizininformatik Bearbeiter: Shuangqing He Betreuer: Toralf Kirsten, Michael Hartung Universität

Mehr

DWH Szenarien. www.syntegris.de

DWH Szenarien. www.syntegris.de DWH Szenarien www.syntegris.de Übersicht Syntegris Unser Synhaus. Alles unter einem Dach! Übersicht Data-Warehouse und BI Projekte und Kompetenzen für skalierbare BI-Systeme. Vom Reporting auf operativen

Mehr

Logische Modelle für OLAP. Burkhard Schäfer

Logische Modelle für OLAP. Burkhard Schäfer Logische Modelle für OLAP Burkhard Schäfer Übersicht Einführung in OLAP Multidimensionale Daten: Hypercubes Operationen Formale Grundlagen Zusammenfassung Einführung in OLAP Verfahren zur Analyse großer

Mehr

Der Java Server beinhaltet Container für EJB, Servlet und JSP, darüber hinaus unterstützt er diejee 1.3 Version.

Der Java Server beinhaltet Container für EJB, Servlet und JSP, darüber hinaus unterstützt er diejee 1.3 Version. hehuvlfkw Oracle 9iApplication Server (9iAS) fasst in einem einzigen integrierten Produkt alle Middleware-Funktionen zusammen, die bisher nur mit mehreren Produkten unterschiedlicher Anbieter erreicht

Mehr

Fachbereich Informatik Praktikumsversuch 6. Prof. Dr. S. Karczewski Dipl. Inf. Dipl. Math. Y. Orkunoglu Christoph Gerold, B. Sc. Datum: 02.07.

Fachbereich Informatik Praktikumsversuch 6. Prof. Dr. S. Karczewski Dipl. Inf. Dipl. Math. Y. Orkunoglu Christoph Gerold, B. Sc. Datum: 02.07. Hochschule Darmstadt Data Warehouse Fachbereich Informatik Praktikumsversuch 6 Prof. Dr. S. Karczewski Dipl. Inf. Dipl. Math. Y. Orkunoglu Christoph Gerold, B. Sc. Datum: 02.07.2013 Einleitung Data Warehouse

Mehr

Best Practices: BI mit Open-Source-Tools

Best Practices: BI mit Open-Source-Tools Best Practices: BI mit Open-Source-Tools Alf Hellmund - GIUA 2009 Seite 1 Agenda Einleitung Best Practices Fazit Vorstellung & Motivation Vorteile Architektur & Entwurf Datenmodellierung ETL Reporting

Mehr

Innovative Ansätze für den Gesundheitsmarkt. Mainz, 10. Mai 2011

Innovative Ansätze für den Gesundheitsmarkt. Mainz, 10. Mai 2011 Business Intelligence und Geovisualisierung Innovative Ansätze für den Gesundheitsmarkt Mainz, 10. Mai 2011 Prof. Dr. Anett Mehler-Bicher Prof. Dr. Klaus Böhm Inhalt Ausgangssituation und Motivation Motivation

Mehr

Mala Bachmann September 2000

Mala Bachmann September 2000 Mala Bachmann September 2000 Wein-Shop (1) Umsatz pro Zeit und Produkt Umsatz Jan Feb Mrz Q1 Apr 2000 Merlot 33 55 56 144 18 760 Cabernet-S. 72 136 117 325 74 1338 Shiraz 85 128 99 312 92 1662 Rotweine

Mehr

The integration of business intelligence and knowledge management

The integration of business intelligence and knowledge management The integration of business intelligence and knowledge management Seminar: Business Intelligence Ketevan Karbelashvili Master IE, 3. Semester Universität Konstanz Inhalt Knowledge Management Business intelligence

Mehr

BI für Jedermann. Neue Möglichkeiten durch die Oracle BI-Suite Enterprise Edition

BI für Jedermann. Neue Möglichkeiten durch die Oracle BI-Suite Enterprise Edition BI für Jedermann Neue Möglichkeiten durch die Oracle BI-Suite Enterprise Edition Wolfgang Rütter Bereichsleiter Informationssysteme OPITZ CONSULTING Gummersbach GmbH 1 Warum BI für Jedermann? 1. Historie

Mehr

SAP Business Intelligence

SAP Business Intelligence SAP Business Intelligence Helmut Roos Diplom-Ingenieur Unternehmensberater Grundlagen zu Netweaver 7.0 D-67067 Ludwigshafen +49 (621) 5 29 44 65 Data Acquisition Common Read / Write Interface Open Interface

Mehr

Modellierung und Implementierung einer End-to-End BI Lösung

Modellierung und Implementierung einer End-to-End BI Lösung IBM Software Group Modellierung und Implementierung einer End-to-End BI Lösung DB2 Information Management Software Martin Clement, mclement@de.ibm.com Otto Görlich, ogoerlich@de.ibm.com Stefan Sander,

Mehr

C09: Einsatz SAP BW im Vergleich zur Best-of-Breed-Produktauswahl

C09: Einsatz SAP BW im Vergleich zur Best-of-Breed-Produktauswahl C09: Einsatz SAP BW im Vergleich zur Best-of-Breed-Produktauswahl Ein Seminar der DWH academy Seminar C09 Einsatz SAP BW im Vergleich zur Best-of-Breed- Produktauswahl Befasst man sich im DWH mit der Auswahl

Mehr

Business Intelligence für Controller

Business Intelligence für Controller Controllers Best Practice Fachbuch Business Intelligence für Controller Hermann Hebben und Dr. Markus Kottbauer Verlag für ControllingWissen ÄG, Freiburg und Wörthsee Ein Unternehmen der Haufe Mediengruppe

Mehr

Inhaltsverzeichnis. Holger Schrödl. Business Intelligence mit Microsoft SQL Server 2008. BI-Projekte erfolgreich umsetzen ISBN: 978-3-446-41210-1

Inhaltsverzeichnis. Holger Schrödl. Business Intelligence mit Microsoft SQL Server 2008. BI-Projekte erfolgreich umsetzen ISBN: 978-3-446-41210-1 sverzeichnis Holger Schrödl Business Intelligence mit Microsoft SQL Server 2008 BI-Projekte erfolgreich umsetzen ISBN: 978-3-446-41210-1 Weitere Informationen oder Bestellungen unter http://www.hanser.de/978-3-446-41210-1

Mehr

Seminar im Sommersemester 2004 an der Universität Karlsruhe (TH)

Seminar im Sommersemester 2004 an der Universität Karlsruhe (TH) Seminar im Sommersemester 2004 an der Universität Karlsruhe (TH) Verteilung und Integration von Informationen im Verkehrsbereich Thema: OLAP in verteilten Data-Warehouse- Umgebungen Vortrag: Christian

Mehr

Information-Design-Tool

Information-Design-Tool Zusatzkapitel Information-Design-Tool zum Buch»HR-Reporting mit SAP «von Richard Haßmann, Anja Marxsen, Sven-Olaf Möller, Victor Gabriel Saiz Castillo Galileo Press, Bonn 2013 ISBN 978-3-8362-1986-0 Bonn

Mehr

BI Konsolidierung: Anspruch & Wirklichkeit. Jacqueline Bloemen. in Kooperation mit

BI Konsolidierung: Anspruch & Wirklichkeit. Jacqueline Bloemen. in Kooperation mit BI Konsolidierung: Anspruch & Wirklichkeit Jacqueline Bloemen in Kooperation mit Agenda: Anspruch BI Konsolidierung Treiber Was sind die aktuellen Treiber für ein Konsolidierungsvorhaben? Kimball vs. Inmon

Mehr

Configuration Management mit Verbosy 17.04.2013 OSDC 2013. Eric Lippmann www.netways.de

Configuration Management mit Verbosy 17.04.2013 OSDC 2013. Eric Lippmann www.netways.de Configuration Management mit Verbosy 17.04.2013 OSDC 2013 Eric Lippmann Kurzvorstellung NETWAYS Expertise OPEN SOURCE SYSTEMS MANAGEMENT OPEN SOURCE DATA CENTER Monitoring & Reporting Configuration Management

Mehr

Jump Project. Softwarelösungen für professionelles Projektmanagement

Jump Project. Softwarelösungen für professionelles Projektmanagement Jump Project Softwarelösungen für professionelles Projektmanagement Jump Project Office Übersichtliche Dokumentenstruktur und schneller Zugriff auf alle wichtigen Funktionen. Steuern Sie Ihre Projekte

Mehr

Data Warehouse. für den Microsoft SQL SERVER 2000/2005

Data Warehouse. für den Microsoft SQL SERVER 2000/2005 Warehouse für den Microsoft SQL SERVER 2000/2005 Begriffe 1 DWH ( Warehouse) ist eine fachübergreifende Zusammenfassung von Datentabellen. Mart ist die Gesamtheit aller Datentabellen für einen fachlich

Mehr

Architekturen. Von der DB basierten zur Multi-Tier Anwendung. DB/CRM (C) J.M.Joller 2002 131

Architekturen. Von der DB basierten zur Multi-Tier Anwendung. DB/CRM (C) J.M.Joller 2002 131 Architekturen Von der DB basierten zur Multi-Tier Anwendung DB/CRM (C) J.M.Joller 2002 131 Lernziele Sie kennen Design und Architektur Patterns, welche beim Datenbankzugriff in verteilten Systemen verwendet

Mehr

So erstellen Sie wichtige Berichte mit Microsoft Technologie Tipps für PMO und IT

So erstellen Sie wichtige Berichte mit Microsoft Technologie Tipps für PMO und IT TPG Webinar-Serie 2016 zum PPM Paradise Thema 2.2 So erstellen Sie wichtige Berichte mit Microsoft Technologie Tipps für PMO und IT Mit Peter Huemayer Agenda Welche Berichte machen Sinn? Welche Daten haben

Mehr

Vorlesung 30.03.2009 1) Einführung

Vorlesung 30.03.2009 1) Einführung Vorlesung 30.03.2009 1) Einführung Was versteht man unter dem Begriff Datenbank? - Eine Datenbank ist eine Struktur zur Speicherung von Daten mit lesendem und schreibendem Zugriff - Allgemein meint man

Mehr

Marketing Intelligence Vorstellung der Softwarekomponenten. Josef Kolbitsch Manuela Reinisch

Marketing Intelligence Vorstellung der Softwarekomponenten. Josef Kolbitsch Manuela Reinisch Marketing Intelligence Vorstellung der Softwarekomponenten Josef Kolbitsch Manuela Reinisch Übersicht Übersicht über die Systemlandschaft Übersicht über die Werkzeuge Workshop Systemlandschaft 1/8 Klassische

Mehr

Ein subjektiver Vergleich zwischen SSIS und Kettle mit Ausblick auf die Generierung von BI-Lösungen

Ein subjektiver Vergleich zwischen SSIS und Kettle mit Ausblick auf die Generierung von BI-Lösungen Ein subjektiver Vergleich zwischen SSIS und Kettle mit Ausblick auf die Generierung von BI-Lösungen vorgestellt am 29.09.2008 in der PASS Regionalgruppe Karlsruhe Michael Riedmüller inovex GmbH Project

Mehr

SQL PASS Treffen RG KA. Überblick Microsoft Power BI Tools. Stefan Kirner Karlsruhe, 27.05.2014

SQL PASS Treffen RG KA. Überblick Microsoft Power BI Tools. Stefan Kirner Karlsruhe, 27.05.2014 SQL PASS Treffen RG KA Überblick Microsoft Power BI Tools Stefan Kirner Karlsruhe, 27.05.2014 Agenda Die wichtigsten Neuerungen in SQL 2012 und Power BI http://office.microsoft.com/en-us/office365-sharepoint-online-enterprise-help/power-bi-for-office-365-overview-andlearning-ha104103581.aspx

Mehr

BI Publisher Berichtswesen einfach und sicher. Alexander Klauss Centric IT Solutions GmbH

BI Publisher Berichtswesen einfach und sicher. Alexander Klauss Centric IT Solutions GmbH BI Publisher Berichtswesen einfach und sicher Alexander Klauss Centric IT Solutions GmbH Agenda Ziele der BI Publisher Module Anwendung und Vorgehensweise der BI Publisher Module Voraussetzungen BI Publisher

Mehr

INVEST projects. Besseres Investitionscontrolling mit INVESTprojects

INVEST projects. Besseres Investitionscontrolling mit INVESTprojects Besseres Investitionscontrolling mit Der Investitionsprozess Singuläres Projekt Idee, Planung Bewertung Genehmigung Realisierung Kontrolle 0 Zeit Monate, Jahre Perioden Der Investitionsprozess Singuläres

Mehr