Data Warehouse (DW) Online Analytical Processing (OLAP) Data Mining

Größe: px
Ab Seite anzeigen:

Download "Data Warehouse (DW) Online Analytical Processing (OLAP) Data Mining"

Transkript

1 Analytische Informationssysteme Data Warehouse (DW) Online Analytical Processing (OLAP) Data Mining Seit mehr als 30 Jahren wird versucht, den betrieblichen Fach- und Führungskräften angemessene DV-Werkzeuge zu bieten, die ihnen bei ihren Planungs- und Entscheidungsaufgaben adäquate Hilfe geben können. 1) Zahlreiche Systeme wurden entwickelt, doch selten erfüllten sie die in sie gesetzten Erwartungen. Das lag in den 70-er Jahren teilweise an der geringen Rechenleistung und der mangelnden Erfahrung der Entwickler, aber auch an den überzogenen Erwartungen an die damals so genannten Management Information Systems (MIS). Mit dem Aufkommen graphischer Benutzeroberflächen wurde ein neuer Versuch unternommen. Unter den Begriffen Executive Information System (EIS) und Decision Support System (DSS). kamen neue Systeme auf den Markt. Obwohl damit leistungsfähige Werkzeuge zur Verfügung standen, fehlte es oftmals an DV-mündigen Nutzern, welche die teilweise starren Systeme nutzbringend einsetzen konnten. In den letzten Jahren ist es gelungen, Technik und betriebliche Anforderungen so zu strukturieren, dass die erforderliche Flexibilität erreicht werden kann. Die dem technischen Wandel und der unternehmerischen Mode unterliegenden Systeme wurden und werden abgesehen von stark divergierendem Leistungs- und Funktionsumfang unter einer Vielzahl von Namen angeboten. Als Abgrenzung zu den operativen, transaktionsorientierten System haben sie jedoch eines gemeinsam: sie dienen der Unterstützung dispositiver und analytische Tätigkeiten. Daher verwenden wir die Sammelbegriff Analytisches Informationssystem (AIS) bzw. Führungsinformationssystem (FIS) 2) für alle Ausprägungen der MIS, DSS, EUS, EIS, DW 3), OLAP und Data Mining Systeme. 1) P. Chamoni, P. Gluchowski (Hrsg.), Analytische Informationssysteme, 1999 Springer 2) vgl. Vorlesung Prof. A. Roth, Führungsinformationssysteme 3) zur Definition der Abkürzungen siehe Vorlesung Prof. A. Roth, Führungsinformationssysteme (c), F. Laux, Wirtschaftsinformatik 1

2 Inhalt 1. Einführung 2. Grundlagen 3. Der BI-Prozess 4. Architekturen 1 Einführung 2 Grundlagen 3 Der BI-Prozess 4 Architekturen 5. Datenmodelle 6. Data Mining 5 Datenmodelle 6 Data Mining 2 /58 Entsprechend der Ausrichtung der Veranstaltung wird in der Einführung das Thema aus DVtechnischer Sicht motiviert. Dazu werden die Unterschiede zu operativen Systemen aufgezeigt und die Herausforderungen an Analytische Informationssysteme identifiziert. Die betriebswirtschaftlichen Aspekte werden in der begleitenden Veranstaltung Führungsinformationssysteme 2) behandelt. Zu den Grundlagen gehören neben der mathematischen Fundierung des Informationsmodells die Definition der Begriffswelt, um die Elemente, Funktionen, Präsentationsmöglichkeiten und Arbeitstechniken analytischer Informationssysteme (AIS) zu präzisieren. Viele Details bei der Vorbereitung analytischer Auswertungen sind nicht automatisierbar. Ein klares, systematisches Vorgehen ist die Voraussetzung für die erfolgreiche Arbeit mit analytischen Informationssystemen. Die Etappen des AIS-Prozesses: Auswahl der Datenquellen, Datenbereinigung, Data Warehouse Modellierung, Auswertungen und Präsentation werden zunächst vorgestellt und in den folgenden Kapiteln dieser Vorlesung vertieft. Die physische Aufteilung der Komponenten im Intranet, ihre Funktionalität und Performance wird durch die Architektur eines AIS bestimmt Das bei den operativen Datenbanksystemen dominierende relationale Datenmodell erweist sich als nicht optimal, deshalb wird nach neuen Modellen und Metaphern gesucht. Die dafür angeboten Datenmodelle werden kritisch untersucht. Nicht offensichtliche Zusammenhänge zwischen den Daten können durch Algorithmen des Data Minings entdeckt werden. Dazu werden Hilfsmittel der Statistik, des maschinellen Lernens oder der Künstlichen Intelligenz eingesetzt. Je nach Verfahren arbeiten diese mit oder ohne Benutzerinteraktion. 2) Vorlesung Prof. A. Roth, Führungsinformationssysteme (c), F. Laux, Wirtschaftsinformatik 2

3 1.1 Begriffliche Einordnung Aspekte Technologische Sicht Betriebliche Sicht Marktsicht Marktsicht Marktsicht Data Mining OLAP Data Warehouse EIS EIS Betriebliche Betriebliche Sicht Sicht DSS DSS FIS Transaktionssysteme Operative Operative Systeme Systeme AIS DV-technische Sicht 3 /58 We're drowning in information and starving for knowledge. (Rutherford D. Rogers, Yale, 1985) Die Begriffsbildungen im Bereich analytischer Informationssysteme lassen sich unter verschiedenen Blickwinkeln einordnen. Die betriebswirtschaftliche Sicht (innerbetriebliche, Markt- und Organisationssicht) erfolgt in der Veranstaltung Führungsinformationssysteme 2). In dieser Vorlesung analytische Informationssysteme werden wir uns auf die DV-technische Sicht konzentrieren. Die Transaktionssysteme sind die operativen Systeme eines Unternehmens. Sie zeichnen sich durch eine transaktionsgesteuerte (Alles-oder-Nichts-Prinzip) und satzorientierte Verarbeitung aus. Diese Systeme werden wir als gegeben und bekannt 1) voraussetzen. Definitionen: Eine Datenbasis, die neben operativen, betrieblichen Daten auch historische und aggregierte Werte sowie externe Daten umfasst, bezeichnen wir als Data Warehouse (DW) 3). Ein DV-System, das multidimensionale Sichten auf die Daten eines DW bereitstellt und analytische Auswertungen ermöglicht, heißt Online Analytical Processing (OLAP). Unter Data Mining (ein besserer und umfassenderer Begriff wäre Wissensentdeckung in Datenbanken (Knowledge Discovery in Databases)) versteht man sowohl die automatische Mustererkennung als auch die benutzergesteuerte (navigierende) Entdeckung von Information. Die Informationssuche beim Data Mining basiert nicht auf Modellannahmen oder einer Hypothese, d.h. sie erfolgt ohne präzise Fragestellung unter Verwendung nichttrivialer Algorithmen und Methoden. 1) vgl. Vorlesung F. Laux, Datenbanken 2) Vorlesung A. Roth, Führungsinformationssysteme 3)Inmon gibt ebenfalls eine technische Definition: A data warehouse is a subject-oriented, integrated, time-varying, non-volatile collection of data in support of the management s decision-making process. Siehe in Lehner, Wolfgang (2003) Datenbanktechnologie für Data-Warehouse-Systeme Konzepte und Methoden, 1. Aufl., Heidelberg (dpunkt), S. 9: (c), F. Laux, Wirtschaftsinformatik 3

4 1.2 Ausgangslage große operative Datenbestände ungünstige Strukturierung für Analysen Auswertung nur nach expliziter Information Select Kunde, Betrag from Auftrag where Region. Order by RDBS tabellarische oder Listendarstellung Kunde 1 Kunde 2 Kunde eindimensionale graphische Präsentation 4 /58 Zur Einführung wollen wir zunächst die Ausgangslage analysieren. Die Hauptdatenquelle für betriebliche Informationssysteme bilden die operativen Datenbestände des Unternehmens. Warum können diese nicht zu einem AIS erweitert werden? Dafür gibt es mehrere Gründe: 1. Die Speicherungsform ist für aggregierte Daten ungeeignet und die Datenbestände enthalten keine historische Daten. Sie sind ausschließlich vorgangs- bzw. transaktionsorientiert. Geschäftsspezifische Kennzahlen (z.b. Gewinnmarge, Ladenhüter, Cash Flow, Absatzprognose, etc) sind nicht enthalten. Für AIS sind neue Datenmodelle notwendig. 2. Es kann nur nach expliziter (in den Datenbanken gespeicherter) Information gesucht werden. Versteckte Zusammenhänge können daher nicht entdeckt werden. Komplexe Berechnungen für Kennzahlen sind nicht möglich, da sie zu einem unzulässigen Leistungsabfall der operativen Funktionen führen würden. Komplexe Analysen erfordern von den operative Systemen getrennte, auf Auswertungen spezialisierte Systeme. 3. Komplexe betriebswirtschaftliche Abhängigkeiten können mit operativen Werkzeugen nicht geeignet visualisiert werden. Die Darstellung ist meist tabellarisch und damit wenig einprägsam. Durch die lineare Darstellung sind Abhängigkeiten von mehr als einer Einflussgröße kaum erkennbar. Dieser Mangel wird auch durch bunte Linien-, Balken- oder Kuchengraphiken wegen ihrer Eindimensionalität nicht wesentlich verbessert. Notwendig wären mehrdimensionale Darstellungen, die interaktiv gestaltet werden können. (c), F. Laux, Wirtschaftsinformatik 4

5 1.3 Multifunktionale Abhängigkeiten viele Einflussgrößen (Dimensionen) Zeit, Verkäufer, Kunde, Modell, Vertragstyp, Region,... unabhängige Dimensionen Produkt Zeit, Kunde Verkäufer, Produkt > Verkäufer? Aggregate Produkt Komponente Einzelteil (exogen) Jahr Monate Wochen Tage (exogen) Klassifikation Warengruppe Marke Produkt (exogen) Profitcenter Produkt (exogen) 5 /58 Gruppierungen ABC-Analyse, Warenkorbanalyse (endogen) Für planerische und analytische Aufgaben ist die gleichzeitige Untersuchung mehreren Einflussgrößen notwendig. So kann z.b. bei einer Absatzanalyse nicht nur nach Produkten differenziert werden, sondern es sind auch regionale und temporale Gesichtspunkte wichtig. In industriellen Projekten kann die Zahl der Dimensionen leicht in der Größenordnung von 50 liegen. Das CRM-Warehouse der Fa. Breuninger enthält ca. 200 Dimensionen. 1) Diese Einflussgrößen (Dimensionen) sind i.a. unabhängig voneinander. Beispielweise gibt es unabhängig von der Jahreszeit und unabhängig von der Region Pkws zu kaufen. Im Gegensatz hierzu kann bei bestimmten Unternehmen von einem Produkt auf den bzw. die möglichen Verkäufer geschlossen werden (funktionale resp. mehrwertige Abhängigkeit der Dimensionen). Nicht alle Dimensionen weisen die gleiche Struktur auf. Produkte können verschieden klassifiziert und in Hierarchien geordnet werden. Im Unterschied zur Gruppierung ist hier wesentlich, dass die Hierarchie bzw. die Klassifikation vorbestimmt ist. Dies drückt sich dadurch aus, dass z.b. die Komponenten eines Fahrzeugs durch die Stückliste im voraus festliegen (exogen), unabhängig davon, ob ein solches Fahrzeug bereits existiert. Im Gegensatz hierzu werden Gruppierungen einer Grundmenge anhand der Ähnlichkeit ihrer Objekte oder durch ihre Beziehungen untereinander (endogen) vorgenommen. Zur dynamischen Gruppierung zählt demnach auch die ABC-Analyse. ÜA1: Versuchen Sie eine ABC-Analyse in SQL zu formulieren. Verschiedene Formen der Dimensionshierarchien und daraus resultierende Probleme zeigt die folgende Folie. 1) Quelle: Computer Zeitung, Oktober 2003 (c), F. Laux, Wirtschaftsinformatik 5

6 1.4 Hierarchische Dimensionen (nicht) balancierte Hierarchien Parallele Hierarchien Heterarchien Kfz Pkw Nutzfz T 250D Benziner Mittelkl. Diesel Oberkl. A 160 C 220 D 180 E 280 S /58 Hierarchisch strukturierte Dimensionen zeigen in der Praxis äußerst komplexe Ausprägungen. Die Zweige einer Hierarchie können verschiedene Länge aufweisen (d.h. nicht balanciert sein), Knoten können zu verschiedenen Generalisierungen der gleichen Hierarchie (Heterarchie) oder zu verschiedenen, parallelen Hierarchien gehören. Daraus folgt eine Potenzierung der Fakten (Messwerte) für jede Dimensionsvariante und eine zunehmende Komplexität der Navigation. Die Struktur der Dimensionen bestimmt die Navigations- und Aggregationsmöglichkeiten. Navigationswege können mehrdeutig und von unterschiedlicher Tiefe sein (Orientierungsproblem!). Dies bedeutet für ein Informationssystem, dass eine Dimension unter verschiedenen Aspekten betrachtet werden kann und verschiedene Dimensionen i.a. auch unterschiedliche Generalisierungen und Zusammenfassungen gestatten. Moderne Datenmodelle für analytische Informationssysteme müssen durch geeignete Metadaten diese Semantik berücksichtigen. ÜA2: Erstellen Sie die Klassen Hierarchie und Knoten mit den zugehörigen Methoden (Algorithmen) für das Durchlaufen (Traversieren) der Hierarchie nach Tiefen- und Breitensuche. (c), F. Laux, Wirtschaftsinformatik 6

7 1.5 Analyseverfahren Berechnete Werte (Analyse, Prognose) Zeitreihenanalyse, Absatzprognose? Zusammenhänge erkennen (Korrelation) Regressionsrechnungen Diskriminanzanalyse Mustererkennung (KI-Verfahren) Clusteranalyse Neuronale Netze Produkt 7 /58 Zeit Region Die Kennzahlen, welche ein AIS liefert, werden durch Datenanalysen gewonnen. Charakteristisch für diese Analysen sind die Berechnung neuer Werte aus bereits vorhandenen. Dies kann so trivial wie eine Summen- oder Mittelwertbildung sein, aber auch komplexe Berechnungen sind möglich: Beispielsweise können mit Hilfe einer Zeitreihenanalyse Regelmäßigkeiten im zeitlichen Verhalten erkannt werden. Daraus können mit Hilfe einer Extrapolation die zukünftigen Daten vorhergesagt werden. So zeigen sich beim Verkauf von z.b. Badebekleidung offenbar saisonale Einflüsse, die eine Prognose bezüglich des zu erwartenden Absatzes erlauben. Mit Hilfe der Regressionsrechnung lassen sich statistische Zusammenhänge ermitteln. Dabei ist jedoch wichtig zu wissen, dass diese Abhängigkeiten rein statistisch sind und auch ohne kausalen Zusammenhang existieren können (Scheinkorrelation). Eine andere mögliche statistische Gefahr ist, dass bei großer Datenbasis seltene Ereignisse auch wirklich eintreten, ohne dass diese jedoch eine inhaltliche Aussagekraft besitzen. Zum Beispiel: Aus der Tatsache, dass fast jede Woche ein Millionengewinn in der Lotterie erzielt wird, darf nicht geschlossen werden, dass mir selbst auch dieses Glück innerhalb meiner Lebensspanne zuteil wird. Diskriminanz- und Clusteranalyse finden Gemeinsamkeiten bzw. erklären Unterschiede in Datenmengen. Die dazu verwendeten Konzepte basieren auf statistischen Methoden, Entscheidungsbäumen oder auch Künstlichen Neuronalen Netzen, wobei die letzteren erst trainiert werden müssen (überwachtes lernen), um brauchbare Ergebnisse zu erhalten. (c), F. Laux, Wirtschaftsinformatik 7

8 2 Grundlagen Daten Dimension := unabhängige Variable (Einflussgröße) Fakt := abhängige Größe, zu untersuchender Wert Dimensionen und Fakten besitzen einen Datentyp Funktionen Fakten = f(dimensionen) Navigation F1 +f(δ) = f(d1 + Δ) Präsentation Graphik Fakt f(δ) F1 8 /58 D1 Δ } Dimension In Kapitel 2 werden die grundlegenden Konzepte analytischer Informationssysteme behandelt. Zunächst definieren wir die verwendeten Begriffe, dann werden darauf aufbauend die Zusammenhänge untereinander untersucht. Trotz umfangreicher Datenmengen und Abhängigkeiten ist das Prinzip einfach. Es handelt sich um funktionale Abhängigkeiten, wobei die Funktion leider nicht im voraus bekannt ist, sondern erst durch aufwändige Analysen ermittelt werden muss. Bei den Auswertungen ist es vielfach notwendig, in den Datenbeständen interaktiv zu navigieren und die (Zwischen)ergebnisse optisch aussagekräftig zu präsentieren, um das weitere Vorgehen festlegen zu können. Auf die prinzipielle Grenzen der Vorstellungskraft wird bei den Präsentationsmöglichkeiten hingewiesen. (c), F. Laux, Wirtschaftsinformatik 8

9 2.1 Daten Dimension (Variable) unabhängige Variablen Hierarchisch oder intervallartig Strukturiert Bestimmt die Navigation Erzeugt abgeleitete bzw. berechnete Werte Dimensionsattribute Fakten (Werte) verschiedenedatentypen Taxonomie der Typen Analysen erfordern meistens quantitative Werte Skalierung 9 /58 Beziehungen (Links) Navigierbare Verbindung Intra-, extra-dimensonal, inhaltsorientiert Definition: Unter einer Dimension versteht man eine unabhängige Variable, welche die zu untersuchenden Werte (Fakten) beeinflusst. Eine Dimension kann in sich strukturiert sein. Hierarchische und Intervallstrukturen unterstützen so genannte Verdichtungen, die als Generalisierung, Intervallbildung oder Gruppierung realisiert werden. Diese bestimmen die Navigationsmöglichkeiten. So kann man sich bei einer hierarchischen Dimension von einer Position ausgehend zum übergeordneten (parent), zum untergeordneten (child) oder zum nächsten gleichrangigen Begriff (sibling) bewegen. Den Wert einer Aggregatdimension erhält man aus den Werten seiner Komponenten. Aus den Summenwerten der zugehörigen Fakten ergeben sich die Umsätze (Wert) des Aggregats (z.b. eines Monats (Zeitintervall = spezielles Aggregat). Achtung: Nicht alle numerischen Fakten lassen sich sinnvoll addieren! Dies hängt vom Datentyp des Faktums ab (siehe 2.1a Taxonomie der Fakten). Eine Dimension kann mit Attributen versehen sein, welche die Dimensionsobjekte näher beschreiben. Betrachten wir als Beispiel die Dimension Verkaufsstelle, so können wir diese mit den Attributen Adresse, Fläche, Mitarbeiter etc. versehen. Diese Attribute ermöglichen ihrerseits eine weitere Strukturierung der Dimension. Definition: Eine zu untersuchende Größe (Aspekt einer Situation) heißt Fakt. Fakten werden als Funktionswerte von Einflussgrößen (Dimensionen) aufgefasst und dementsprechend ist ihre Abhängigkeit von den Dimensionen von Bedeutung. Die Fakten sind meistens Unternehmensdaten (interne Fakten), die aus operativen Daten oder Planzahlen entstammen. Eine weitere Datenquelle sind die volkswirtschaftliche Zahlen (externe Fakten), welche private und öffentliche Organisationen zusammentragen und publizieren. Der Datentyp eines Faktums ist nicht nur auf numerische Werte beschränkt, sondern kann auch von nominalem Typ sein. (siehe 2.1a Taxonomie der Fakten). In diesen Fällen muss eine Transformation der Fakten auf numerische Werte vorgenommen werden, um bestimmte Analysen (z.b. statistische Kenngrößen) vornehmen zu können. Definition: Ein Link bezeichnet eine navigierbare (ansteuerbare) Verbindung zwischen zwei Elementen (Dimension, Fakt, Attribut, Datentyp,...). Die Verbindung kann innerhalb einer Dimension (strukturell), zwischen Dimensionen (dimensionsorientiert), zwischen Fakten (inhaltsorientiert) und in gemischter Kombination auftreten. ÜA3: Finden Sie Beispiele für numerische Fakten, die sich nicht sinnvoll addieren lassen. (c), F. Laux, Wirtschaftsinformatik 9

10 2.1a Taxonomie der Fakten 10 /58 Fakten können durch unterschiedliche Datentypen dargestellt werden. Entsprechend der gewählten Taxonomie (Struktur der Begriffe eines Fachgebietes) können wir zwischen quantitativen und kategorialen Fakten unterscheiden. Auf den Werten der quantitativer Fakten können Rechenoperationen durchgeführt werden. Wenn die Werte uneingeschränkt addiert oder subtrahiert werden können (d.h. dabei sinnvolle Werte liefern), handelt es sich um additive Fakten. Diese Eigenschaft ist für die Aggregatbildung notwendig. Beispiele additiver Fakten sind z.b. Umsatz, Einkommen, Erlöse und verkaufte Stückzahl. Gilt die Addierbarkeit nicht für jede Dimension, so handelt es sich um eine Semi- Additivität. Beispiele dafür sind der Lagerbestand bezüglich der Dimension Artikel und die Anzahl Mitarbeiter über der Zeit. Es ist unbedingt notwendig, dass die Semantik eindeutig klar ist, sonst kann es zu unsinnigen Rechenoperationen kommen (z.b. z.b. dürfen die Mitarbeiter nicht über der Zeit, wohl aber über die Abteilungen summiert werden). Temporale Größen, wie das Datum, die Zeit oder ein Zeitintervall sind spezielle Formen semi-additiver Daten. Kategoriale Fakten (z.b. Noten, Sprachkenntnisse, Gehaltsklasse, etc) sind nicht additiv, d.h. die Werte dürfen auch wenn sie numerisch sind nicht addiert werden (z.b. Noten). Wenn die Werte vergleichbar sind (z.b. Kundenbewertung, Rangordnung, Prozentwerte), spricht man von ordinalen Werten. Für diese Werte existiert eine Ordnungsrelation (z.b. < oder > ). Beispielsweise ist die Note 1 besser als die Note 2. Wenn zusätzlich ein Distanzbegriff definiert ist, darf auch ein Mittelwert gebildet werden. Mit nominalen Werten (z.b. Geschlecht, Ausbildung, Personalnummer) darf keine mathematische Operation durchgeführt werden. ÜA4: Finden Sie Beispiele für additive, semi-additive und nicht additive Fakten. ÜA5: Entwerfen Sie auf Grund der oben stehenden Taxonomie eine Klassenhierarchie in UML- Notation für Faktenklassen. Hinweis: Smalltalk Klassenhierarchie Magnitude (c), F. Laux, Wirtschaftsinformatik 10

11 2.2 Multidimensionale Funktionen OLAP Abbildung: Dimensionen Di -> Fakten Bi allgemeine, mehrdimensionale Abbildung X Di -> X Bi f: (x 1,x 2,..., x n ) -> (y 1,y 2,..., y m ) (x 1,x 2,..., x n ) (y 1,y 2,..., y m ) n-dimensionale Abb. mit eindimensionalem Bildraum (Kennzahl) X Di -> B f: (x 1,x 2,..., x n ) -> y (x 1,x 2,..., x n ) 11 /58 eindimensionale Abb. in m-dimensionalen Bildraum (Tabelle, Slicing) D -> X Bi f: x -> (y 1,y 2,..., y m ) (y 1,y 2,..., y m ) Beim OLAP geht es um die Analyse bzw. die funktionalen Abhängigkeiten der Fakten in Bezug auf die Dimensionen. Diese Aufgabe kann durch eine multidimensionale Funktion beschrieben werden. Unter einer Funktion (Abbildung) versteht man die eindeutige Zuordnung eines Wertes (Fakt) aus einer Wertemenge (XBi Bildbereich) für jedes Element (Vektor aus Variablen [Dimensionen]) eines Definitionsbereiches (XDi). Aufgabe der AIS ist es, die funktionalen Abhängigkeiten zwischen Einflussgrößen (Dimensionen) und diskreten Messergebnissen (Fakten) zu ermitteln. Die dabei gewonnene Funktion stellt das mathematische Modell für die betriebswirtschaftlichen Zusammenhänge dar. Auf dieser Basis sind Analysen und Prognosen möglich. Im allgemeinen Fall handelt es sich um eine multidimensionale Abbildung. Mehrere Variablen x1, x2,...,xn (Dimensionsvektor) bestimmen mehrere Fakten y1, y2,...,ym (Bildvektor). Zur Verbesserung der Übersichtlichkeit kann der Bildvektor in seine Vektorelemente zerlegt werden. Wir erhalten dann m n-dimensionale Abbildungen mit eindimensionalem Bildraum. Dieser Kunstgriff erleichtert es, den Zusammenhang zwischen den Dimensionen und einem Fakt zu erkennen. Für die gleichzeitige Analyse mehrerer Fakten (z.b. Clusteranalyse) ist diese Darstellung ungeeignet. Häufig werden alle Dimensionen bis auf eine fixiert um die Auswirkung einer Dimension auf die Fakten zu studieren. Eine solche Abbildung lässt sich als Tabelle oder Kurvenschar einer Variablen darstellen. x 1 (y 1,y 2,..., y m ) y 1 y 2 y n x 1 (c), F. Laux, Wirtschaftsinformatik 11

12 2.3 Präsentation Liste Graphik Pivottabelle 12 /58 die menschliche Vorstellungskraft ist auf 3 räumliche Dimensionen begrenzt Um die Zusammenhänge zwischen Dimensionen und Fakten zu veranschaulichen, benötigen AIS eine Visualisierungskomponente. Die einfachste und meist auch unübersichtlichste Präsentationsform ist eine Liste mit den alphanumerisch dargestellten Werten. Dies entspricht einer eindimensionalen Abbildung in einen m-dimensionalen Raum (Tabelle). Dabei wird die unabhängige Variable vertikal (fortlaufend) dargestellt. Die Faktenwerte erscheinen in den Spalten. Eine Pivottabelle stellt eine 2-dimensionale Funktion in einen eindimensionalen Raum dar. Die Dimensionen verlaufen horizontal und vertikal, das Faktum wird als alphanumerischer Wert in die Kreuzungspunkte der Matrix eingetragen. Graphiken können in einer Ebene 3 räumliche Dimensionen darstellen und durch weitere Gestaltungsmittel (Farbe, Piktogramme, etc.) weitere Dimensionen oder Fakten visualisieren. Die Vorstellungskraft wird dabei umso mehr strapaziert, je mehr Dimensionen gleichzeitig dargestellt werden. Darüber hinaus können die Abhängigkeiten auf verschiedenen Hierarchieebenen (z.b. Aggregationen) untersucht werden. Dazu muss der Benutzer in den Dimensionen navigieren (siehe nächste Seite). Durch Fixieren von Dimensionen bzw. Ausblenden von Fakten, wird die Verständlichkeit verbessert, aber gleichzeitig der Zusammenhang verschleiert. ÜA6: Stellen Sie folgende zweidimensionale Funktion als Liste dar: (Umsatz_Produkt_A, SUM(alle_Varianten_des_Produkts_A) = f(kunde, Zeitraum_JJJJMM). Verwenden Sie als Basis die Tabelle Umsatzfakten (Produkt, Datum, Variante, Kunde, Preis). Erstellen Sie ein SQL-Skript, welches die geforderte Liste erzeugt. (c), F. Laux, Wirtschaftsinformatik 12

13 2.4 Navigation hierarchisch Kfz Pkw Nutzfz C220 A180 dimensions-übergreifend Prod. A 180 C 220 E /58 deklarativ Select * from cube where year = 1999 and product = A 180 ; Für die interaktive Analyse mehrdimensionaler Daten ist eine geeignete Navigation (zielgerichtete Bewegung innerhalb der Daten) notwendig. Die Bewegung erfolgt in natürlicher Weise innerhalb einer Dimension entlang von Dimensionshierarchien (roll up, drill down). Von einer Dimension kann in eine andere gewechselt werden, um die Fakten bezüglich dieser zu studieren. Durch Austauschen (pivotieren) von Dimensionen kann der Blickwinkel geändert und dadurch die Übersichtlichkeit von Zusammenhängen verbessert werden. Durch diese Art der Ansteuerung innerhalb der Fakten können unerwartete Zusammenhänge und Ergebnisse entdeckt werden. Wird mindestens eine Dimension festgehalten (fixiert), so spricht man von Slicing. Dadurch wird die Anzahl der darzustellenden Dimensionen und die Komplexität der Analyse reduziert. x z Slice bei dem Dim. z fixiert ist Soll eine Vermutung (Hypothese) bestätigt (verifiziert) oder widerlegt (falsifiziert) werden, ist eine deklarative Auswertung vorzuziehen. Durch die deklarative Steuerung können gewünschte oder vermutete Zusammenhänge und Faktenausschnitte direkt (d.h. ohne interaktive Navigation) ermittelt werden. ÜA7: Starten Sie die Analysis-Services für den MS SQL-Server. Ermitteln Sie, wie viele Dimensionen es im Cube Sales des Foodmart Beispiels gibt? Wie viele Hierarchieebenen hat die Dimension Store? Welche Elementattribute besitzt Store? Formulieren Sie eine einfache Abfrage mit zwei Dimensionen (Store, Product). y (c), F. Laux, Wirtschaftsinformatik 13

14 3 Der Business Intelligence Prozess Data Sources Data Warehouse Cubes, Data Marts Analysis xls OLAP DBS stats ETL Data Mining WWW WWW 14 /58 Build up Product Design (Goal oriented) Time Region In diesem Kapitel wird der Weg von den operativen Datenbeständen über das Data Warehouse bis zu den Auswertungen und Präsentationen vorgestellt. Jede Phase ist sorgfältig zu planen und durchzuführen, damit man am Ende wertvolle Ergebnisse erhält. Jede Phase dieses Prozesses ist entscheidend für die Qualität der Ergebnisse, denn wenn auch nur ein Prozessschritt fehlerhaft durchgeführt wurde, ist das Ergebnis fragwürdig. Bei ungeeigneter oder falscher Wahl der Ausgangsdaten ist eine bestimmte Analyse wegen fehlender Daten überhaupt nicht möglich (z.b. ohne Absatzzahlen ist eine Absatzprognose durch Zeitreihenanalyse unmöglich. Daher müssen schon bei der Datenbeschaffung der Datenbedarf der möglichen Auswertungen berücksichtigt werden. Auf den folgenden Seiten werden die einzelnen Schritte zur Wissensentdeckung behandelt, wichtige Aufgaben für die Prozessschritte identifiziert und exemplarisch einzelne Situationen vorgestellt. Glossary of terms: Data Source := The origin of raw data ETL (Extraction, Transformation, Loading) := The process of selecting, adapting and integrating data from Data Sources into a Data Warehouse Data Warehouse := Is a subject-oriented, integrated, time-variant, nonvolatile collection of data in support of management s decision-making process (Inmon, 1996) Data Mart := A subset of a Data Warehouse, designated to specific analysis Cube, Hypercube := Metaphor for data with multivariate dependencies, i.e. a function of multiple parameters. OLAP (Online Analytical Processing) := The interactive analysis of data from a Cube. Data Mining := The mostly automatic and hypothesis-free analysis of large data collections that discovers business relevant information not previously known (narrow definition). Any kind of algorithm that finds new information from a data collection (broad definition). (c), F. Laux, Wirtschaftsinformatik 14

15 3.1 Datenquellen Statische Quellen Zeit Geografie operative Systeme Stammdaten Bewegungsdaten Dimensionen Plandaten Zielwerte (für Umsatz, Gewinn, etc) externe Daten Volkswirtschaftl. Zahlen + Prognosen Statist. Bundesamt Fakten 15 /58 Neben den statischen Informationen wie Zeit und Geografie sind vor allem die Stammdaten eines Unternehmens Kandidaten für die Dimensionen eines DW. Die Bewegungsdaten der operativen Systeme sind die Hauptdatenquelle für die Fakten. Planzahlen und externe Daten ergänzen und rücken die operativen Zahlen ins richtige Verhältnis zueinander. Die Qualität (Korrektheit) der Daten ist für die nachfolgenden Auswertungen entscheidend, denn auch hier gilt der Ausspruch: Garbage in, garbage out! *) *) Dieser Ausspruch ist nicht als mathematische Implikation zu verstehen, sondern er soll aussagen, dass man kein gutes Ergebnis erwarten kann, wenn die Daten nicht die erforderliche Qualität und notwendige Aussagekraft besitzen. Mathematisch gesehen können aus einer falschen Voraussetzung beliebige Schlüsse gezogen werden, die mathematisch wahr sind. (c), F. Laux, Wirtschaftsinformatik 15

16 Selektieren Bereinigen 3.2 Transformation welche Daten werden benötigt? wo sind die Nutzdaten? Umrechnen haben die Fakten die gleiche Einheit, Codierung und Granularität? Harmonisieren gibt es Syn- und Homonyme? Anpassen konsistent? sind Gruppierung und Klassifikation Korrigieren sind die Daten korrekt? 16 /58 Ergänzen sind die Daten vollständig? Analytische Informationssysteme leben von der Aktualität der Daten. In regelmäßigen Abständen sind Extraktions-, Transformations- und Ladeprozesse (ETL) durchzuführen: Dazu gehören die Selektion und Extraktion der Daten (z.b. Auswahl der Systeme und Datenfelder, Einrichtung einer Zugriffserlaubnis) die Bereinigung der Daten von syntaktischen Mängeln (z.b. Elimination von Sonder- und Steuerzeichen für z.b. Stornobuchungen, Satzendemarken, etc) die Umrechnung in vergleichbare Größeneinheiten (z.b. alle Preise in, die Energie nur in kwh, alle Gewichte in kg, alle Längenangaben in m und alle Flüssigkeiten in Liter), eine einheitliche Codierung (w = weiblich, m = männlich, ø = unbekannt, n = ohne Geschlecht), und die gleiche Granularität (pro Artikel, pro Kunde, pro Tag). das Harmonisieren der betriebswirtschaftlichen Notation [Synonyme, Homonyme] (z.b. verschiedene Attributnamen für die gleiche Semantik (Artikelnummer, Materialnummer, Teilenummer; Auftrag, Kundenauftrag, interner Auftrag) die Anpassung von Gruppierungen und Klassifikationen (z.b. Zeitintervalle (Tag, Woche, Monat, Jahr), Artikelklassifikation, Berechnung von Aggregatwerten) die Korrektur fehlerhafter Daten (z.b. Plausibilitätskontrolle um Ausreißerwerte zu erkennen und zu korrigieren, aus redundanten bzw. ähnlichen Daten berechnen) das Ergänzen fehlender Werte (z.b. durch Defaultwerte (Standardwert), Fehlmarken (unbekannter Wert), geschätzter Wert, Planzahl, etc.) (c), F. Laux, Wirtschaftsinformatik 16

17 3.3 Data Warehouse Modell auswählen Architektur erstellen welches Modell wird unterstützt? wie strukturieren wir das DW? Speichertechniken optimieren Daten laden bzw. aktualisieren wie verbessern wir die Geschwindigkeit und verringern den Speicherbedarf? wie aktuell müssen die Daten sein? welche Zeit steht zur Verfügung? 17 /58 Die Wahl einer geeigneten Struktur für das Data Warehouse (DW) bestimmt seine Flexibilität hinsichtlich der Auswertemöglichkeiten. Zunächst ist ein Modell auszuwählen, das auch vom eingesetzten Datenbanksystem unterstützt wird. Die Dimensionen und ihre Attribute sind festzulegen. Die zur Verfügung stehenden Fakten sind für diese Variablen (Dimensionen) hinsichtlich ihrer Auflösung (Granularität) zu wählen. Nach der konzeptionellen Modellierung ist die Speichertechnik festzulegen und zu optimieren. Dazu gehört die Speicherorganisation für dünn besetzt Datenbestände (sparsity management). Logische Datenlücken entstehen durch bestimmte Datenkonstellationen, wenn z.b. eine gewisse Produktgruppe nur an bestimmte Kundengruppen abgesetzt wird. Enthält eine oder mehrere Dimensionen Wiederholgruppen, so lassen sich die Daten leicht zusammenfassen und nur einmal speichern. Je nach Präferenz (Speicher- bzw. Zugriffsoptimierung) kommen Direktadressierung, Hashing, Indizierung, Datenkompression, Bitmap- und Separationstechniken oder orthogonale Listen in Frage. *) Der Lade- bzw. Aktualisierungsvorgang stellt für große Datenmengen eine starke Belastung der Systemressourcen dar. Daher wird dieser Vorgang außerhalb der normalen Arbeitszeiten (z.b. am Wochenende) durchgeführt, um den operativen Betrieb möglichst wenig zu stören. *) G. Wiederhold: Datenbanken, Band 1: Dateisysteme, Oldenbourg V (c), F. Laux, Wirtschaftsinformatik 17

18 3.4 Laden großer Datenmengen 1. Selektieren,. lesen, bereinigen 2. Aufspalten, umrechnen 3. Klassifizieren, plausibilisieren, harmonisieren Präselektion 4. Schreiben Quelle DW Log Satzabweisung Satzabweisung 18 /58 Quelle: U. Knuplesch, Forum WI 2000 Das Laden des Data Warehouse (DW) erfolgt in 4 Schritten: 1. Selektieren, lesen, bereinigen und formatieren 2. Aufspalten in Datenbereiche (Tabellen, Marts) und umrechnen der Daten 3. Klassifizieren, harmonisieren, plausibilisieren (korrigieren und ergänzen) 4. Schreiben der Dimensionen und dann der Fakten. Bei großen Datenmengen ist der Ladevorgang in n parallele Datenströme aufzuteilen. Die Daten müssen eine Reihe von Filter passieren, mit denen Konsistenzprüfungen durchgeführt werden. Die Daten, welche die Konsistenzbedingungen nicht erfüllen, werden zur manuellen Nachbehandlung abgewiesen. Durch eine geeignete Verteilung singulärer Tabellen (Replizierung) kann die Performance verbessert werden. Die Präselektion aller Daten aus dem DW, die einen Bezug zu den neuen Ladedaten haben, beschleunigt die Aktualisierungsoperationen.. Beim eigentlichen Ladevorgang ist auf die gleichmäßige Ausnutzung aller Ressourcen des Rechners (CPUs, Diskprozesse, Partitionierung der Speicher,...) zu achten, um den Durchsatz zu optimieren. Dabei können unabhängige Teilschritte gleichzeitig ausgeführt werden. Schnelle Zugriffsmethoden zum Lesen und Schreiben von Daten (Load Append, blockweises Einlesen, sequential Insert,...) 1) verkürzen die Ladezeiten. 1) (c), F. Laux, Wirtschaftsinformatik 18

19 3.5 Interaktive Auswertungen (OLAP) Datenstrukturierung OLAP Hyperkubus Navigation Ein-/Ausblenden von Dimensionen (slice) Pivotieren von Dimensionen Teilkubus bilden (dice) Aggregation (roll-up)/ Detaillierung (drill down) Statistische Funktionen Zeitreihen Korrelationen 19 /58 Identifikation von Hot Spots Detailsichten Für die interaktive Analyse der Daten ist ein Online Analytical System (OLAP) notwendig. OLAP Server basieren auf dem Kubenstrukturmodell. Die Strukturierung entscheidet über die Auswertemöglichkeiten. Daher ist es i.a. notwendig, mehr als einen Kubus zu definieren, um alle gewünschten Auswertungen durchführen zu können. In Abhängigkeit von der Datenmenge erfolgt die Speicherung als ROLAP (relationale Struktur mit virtuellen Würfeln, die dynamisch durch eine Abfrage erstellt werden). MOLAP (multidimensionale Zellstruktur [Matrix], welche die Fakten aufnehmen; die Dimensionen sind hierarchisch strukturiert) oder HOLAP (die ursprünglichen Daten werden in Tabellen, die Aggregationen jedoch in einem multidimensionalen Format gespeichert). Auf die Funktionalität hat die Speichertechnik keinen Einfluss, lediglich die Leistung (Performance) wird damit bestimmt: Die ROLAP-Technik ist nicht sehr performant, sie eignet sich vor allem für große Datenbanken oder Legacy-Daten, die nur selten abgefragt werden. Durch MOLAP kann die beste Abfrageleistung erzielt werden, da dieses Speicherformat spezifisch für multidimensionale Datenabfragen konzipiert wurde. Die MOLAP-Speicherung eignet sich wegen des hohen Arbeitsspeicherbedarfs für Datenmengen (Datasets) von kleiner und mittlerer Größe. HOLAP stellt die Konnektivität mit großen Datasets in relationalen Tabellen zur Verfügung und nutzt gleichzeitig die schnellere Leistung der multidimensionalen Speicherung von aggregierten Dimensionen. Der Ressourcenbedarf ist beachtlich. Die Navigation innerhalb eines multidimensionalen Kubus erfolgt entlang der Dimensionen und ihrer Struktur. Aggregation in einer Dimension wird als Hierarchie realisiert. Die Navigationsmöglichkeiten entsprechen denen von Kap. 2.4 (Folie 13). Durch die Fixierung von Dimensionen reduzieren sich die funktionalen Abhängigkeiten und erleichtern damit die Darstellung. Die Visualisierung beim OLAP erfolgt überwiegend durch Matrizen oder 3D-Diagramme (siehe Beispiel auf der nächsten Seite). Extrema ( Hot Spots ) können farblich hervorgehoben werden. (c), F. Laux, Wirtschaftsinformatik 19

20 3.5a Beispiel (Excel 2000) 20 /58 Das obige Beispiel stellt ein dreidimensionales Balkendiagrammen für die Umsätze (unit sales) mit Kunden in Abhängigkeit von der Ausbildung, dem Geschlecht und dem jährlichen Einkommen dar. Man beachte, dass das Einkommen falsch (nach Zeichenketten) sortiert wurde und nicht nach dem Einkommensintervall. Dies ist eine Folge mangelhafter Semantik der Dimension Jahreseinkommen (Yearly Income). So erstellen Sie in Excel eine Pivot-Tabelle für einen OLAP-Kubus: Menü: Daten/PivotTable- und PivotChart-Bericht, Assistent: 1) *externe DatenQuelle *PivotTabelle, 2) Daten importieren, Datenquelle auswählen, Register: OLAP Cubes, neue Datenquelle (ok), Name: Sales, OLAP-Anbieter: MS OLE DB Provider for OLAP Services, Verbinden * Analysis Server: <rechnername> oder LOCALHOST, multidimensionale DB auswählen: Foodmart, Fertigstellen, OLAP-Cube wählen: Sales, ok Datenquelle: Sales selektieren, OK, weiter 3) In bestehendes Arbeitsblatt einfügen und fertig stellen (c), F. Laux, Wirtschaftsinformatik 20

OLAP und der MS SQL Server

OLAP und der MS SQL Server OLAP und der MS SQL Server OLAP und der MS SQL Server OLAP-Systeme werden wie umfangreiche Berichtssysteme heute nicht mehr von Grund auf neu entwickelt. Stattdessen konzentriert man sich auf die individuellen

Mehr

OLAP und Data Warehouses

OLAP und Data Warehouses OLP und Data Warehouses Überblick Monitoring & dministration Externe Quellen Operative Datenbanken Extraktion Transformation Laden Metadaten- Repository Data Warehouse OLP-Server nalyse Query/Reporting

Mehr

Seminar im Sommersemester 2004 an der Universität Karlsruhe (TH)

Seminar im Sommersemester 2004 an der Universität Karlsruhe (TH) Seminar im Sommersemester 2004 an der Universität Karlsruhe (TH) Verteilung und Integration von Informationen im Verkehrsbereich Thema: OLAP in verteilten Data-Warehouse- Umgebungen Vortrag: Christian

Mehr

Einführungsveranstaltung: Data Warehouse

Einführungsveranstaltung: Data Warehouse Einführungsveranstaltung: 1 Anwendungsbeispiele Berichtswesen Analyse Planung Forecasting/Prognose Darstellung/Analyse von Zeitreihen Performancevergleiche (z.b. zwischen Organisationseinheiten) Monitoring

Mehr

Einführung in OLAP und Business Analysis. Gunther Popp dc soft GmbH

Einführung in OLAP und Business Analysis. Gunther Popp dc soft GmbH Einführung in OLAP und Business Analysis Gunther Popp dc soft GmbH Überblick Wozu Business Analysis mit OLAP? OLAP Grundlagen Endlich... Technischer Background Microsoft SQL 7 & OLAP Services Folie 2 -

Mehr

Online Analytical Processing

Online Analytical Processing Online Analytical Processing Online Analytical Processing Online Analytical Processing (OLAP) ermöglicht die multidimensionale Betrachtung von Daten zwecks E rmittlung eines entscheidungsunterstützenden

Mehr

Online Analytical Processing

Online Analytical Processing Online Analytical Processing Online Analytical Processing Online Analytical Processing (OLAP) ermöglicht die mu l- tidimensionale Betrachtung von Daten zwecks Ermit t- lung eines entscheidungsunterstützenden

Mehr

Seminar Business Intelligence Teil II. Data Mining & Knowledge Discovery

Seminar Business Intelligence Teil II. Data Mining & Knowledge Discovery Seminar Business Intelligence Teil II Data Mining & Knowledge Discovery Was ist Data Mining? Sabine Queckbörner Was ist Data Mining? Data Mining Was ist Data Mining? Nach welchen Mustern wird gesucht?

Mehr

Data Warehouse Definition (1) http://de.wikipedia.org/wiki/data-warehouse

Data Warehouse Definition (1) http://de.wikipedia.org/wiki/data-warehouse Data Warehouse Definition (1) http://de.wikipedia.org/wiki/data-warehouse Ein Data-Warehouse bzw. Datenlager ist eine zentrale Datensammlung (meist eine Datenbank), deren Inhalt sich aus Daten unterschiedlicher

Mehr

Business Intelligence Data Warehouse. Jan Weinschenker

Business Intelligence Data Warehouse. Jan Weinschenker Business Intelligence Data Warehouse Jan Weinschenker 28.06.2005 Inhaltsverzeichnis Einleitung eines Data Warehouse Data Warehouse im Zusammenfassung Fragen 3 Einleitung Definition: Data Warehouse A data

Mehr

MIS by Franziska Täschler, Winformation GmbH ftaeschler@winformation-gmbh.ch Ausgabe 01/2001

MIS by Franziska Täschler, Winformation GmbH ftaeschler@winformation-gmbh.ch Ausgabe 01/2001 MIS Glossar by Franziska Täschler, Winformation GmbH ftaeschler@winformation-gmbh.ch Ausgabe 01/2001 Aggregat Data Cube Data Marts Data Mining Data Warehouse (DWH) Daten Decision Support Systeme (DSS)

Mehr

Umsetzung der Anforderungen - analytisch

Umsetzung der Anforderungen - analytisch Umsetzung der Anforderungen - analytisch Titel des Lernmoduls: Umsetzung der Anforderungen - analytisch Themengebiet: New Economy Gliederungspunkt im Curriculum: 4.2.5.5 Zum Inhalt: In diesem Modul wird

Mehr

Komponenten und Architekturen von Analytischen Informationssystemen (AIS)

Komponenten und Architekturen von Analytischen Informationssystemen (AIS) Komponenten und Architekturen von Analytischen Informationssystemen (AIS) Melanie Pfoh Konsultation 27. Juni 2013 Hinweis Diese Folien ersetzen keinesfalls den Übungsstoff des zugehörigen e-learning-kurses.

Mehr

Data Warehouse Technologien

Data Warehouse Technologien Veit Köppen Gunter Saake Kai-Uwe Sattler Data Warehouse Technologien Inhaltsverzeichnis Inhaltsverzeichnis vii 1 Einführung in Data-Warehouse-Systeme 1 1.1 Anwendungsszenario Getränkemarkt...............

Mehr

Erstellen von Business Intelligence mit Office XP und SQL 2000 Analysis Services

Erstellen von Business Intelligence mit Office XP und SQL 2000 Analysis Services Erstellen von Business Intelligence mit Office XP und SQL 2000 Analysis Services (Engl. Originaltitel: Building Business Intelligence with Office XP and SQL 2000 Analysis Services) In diesem Artikel wird

Mehr

Das Multidimensionale Datenmodell

Das Multidimensionale Datenmodell Das Multidimensionale Datenmodell Konzeptuelle Modellierung Umsetzung des Modells Beispiel ER-Modell 2 / 36 Probleme ER-Modellierung Keine Unterscheidung Klassifikation, Attribute, Kenngrößen Dimension

Mehr

Veit Köppen Gunter Saake Kai-Uwe Sattler. 2. Auflage. Data Warehouse Technologien

Veit Köppen Gunter Saake Kai-Uwe Sattler. 2. Auflage. Data Warehouse Technologien Veit Köppen Gunter Saake Kai-Uwe Sattler 2. Auflage Data Warehouse Technologien Inhaltsverzeichnis Inhaltsverzeichnis ix 1 Einführung in Data-Warehouse-Systeme 1 1.1 Anwendungsszenario Getränkemarkt...

Mehr

Data Mining-Modelle und -Algorithmen

Data Mining-Modelle und -Algorithmen Data Mining-Modelle und -Algorithmen Data Mining-Modelle und -Algorithmen Data Mining ist ein Prozess, bei dem mehrere Komponenten i n- teragieren. Sie greifen auf Datenquellen, um diese zum Training,

Mehr

Data Mining Standards am Beispiel von PMML. Data Mining Standards am Beispiel von PMML

Data Mining Standards am Beispiel von PMML. Data Mining Standards am Beispiel von PMML Data Mining Standards am Beispiel von PMML Allgemeine Definitionen im Data Mining Data Mining (DM) Ein Prozess, um interessante neue Muster, Korrelationen und Trends in großen Datenbeständen zu entdecken,

Mehr

The integration of business intelligence and knowledge management

The integration of business intelligence and knowledge management The integration of business intelligence and knowledge management Seminar: Business Intelligence Ketevan Karbelashvili Master IE, 3. Semester Universität Konstanz Inhalt Knowledge Management Business intelligence

Mehr

Business Intelligence und Geovisualisierung in der Gesundheitswirtschaft

Business Intelligence und Geovisualisierung in der Gesundheitswirtschaft Business Intelligence und Geovisualisierung in der Gesundheitswirtschaft Prof. Dr. Anett Mehler-Bicher Fachhochschule Mainz, Fachbereich Wirtschaft Prof. Dr. Klaus Böhm health&media GmbH 2011 health&media

Mehr

eevolution Business Intelligence Oliver Rzeniecki COMPRA GmbH Programmierer & Datenbankadministrator

eevolution Business Intelligence Oliver Rzeniecki COMPRA GmbH Programmierer & Datenbankadministrator eevolution Business Intelligence Oliver Rzeniecki COMPRA GmbH Programmierer & Datenbankadministrator Agenda Was ist Business Intelligence? Was ist OLAP? Unterschied zwischen OLAP und OLTP? Bestandteile

Mehr

Christian Kurze BI-Praktikum IBM WS 2008/09

Christian Kurze BI-Praktikum IBM WS 2008/09 Einführung in die multidimensionale Datenmodellierung e mit ADAPT BI-Praktikum IBM WS 2008/09 1 Gliederung Einführung multidimensionale Datenmodellierung 1. Multidimensionales Modell BI-Praktikum IBM WS

Mehr

Seminar in der Seminarreihe Business Intelligence 1. OLAP und Datawarehousing

Seminar in der Seminarreihe Business Intelligence 1. OLAP und Datawarehousing Seminar in der Seminarreihe Business Intelligence 1 OLAP und Datawarehousing OLAP & Warehousing Die wichtigsten Produkte Die Gliederung Produkt Bewertung & Vergleiche Die Marktentwicklung Der aktuelle

Mehr

1 Einleitung. Betriebswirtschaftlich administrative Systeme

1 Einleitung. Betriebswirtschaftlich administrative Systeme 1 1 Einleitung Data Warehousing hat sich in den letzten Jahren zu einem der zentralen Themen der Informationstechnologie entwickelt. Es wird als strategisches Werkzeug zur Bereitstellung von Informationen

Mehr

Auswertung für Warenwirtschaft/ERP, Interbase und ODBC... 2

Auswertung für Warenwirtschaft/ERP, Interbase und ODBC... 2 Cubix O.L.A.P... 2 Auswertung für Warenwirtschaft/ERP, Interbase und ODBC... 2 Datenverbindung über ODBC... 4 Datenbereitstellung über SQL... 5 Festlegung der Dimensionen... 6 Festlegung der Summen...

Mehr

MS SQL Server 2012 (4)

MS SQL Server 2012 (4) MS SQL Server 2012 (4) Data Mining, Analyse und multivariate Verfahren Marco Skulschus Jan Tittel Marcus Wiederstein Webseite zum Buch: http://vvwvv.comelio-medien.com/buch-kataiog/ms sql_server/ms sql

Mehr

Entscheidungsunterstützungssysteme

Entscheidungsunterstützungssysteme Vorlesung WS 2013/2014 Christian Schieder Professur Wirtschaftsinformatik II cschie@tu-chemnitz.eu Literatur zur Vorlesung Gluchowski, P.; Gabriel, R.; Dittmar, C.: Management Support Systeme und Business

Mehr

Vorwort zur 5. Auflage... 15 Über den Autor... 16

Vorwort zur 5. Auflage... 15 Über den Autor... 16 Vorwort zur 5. Auflage...................................... 15 Über den Autor............................................ 16 Teil I Grundlagen.............................................. 17 1 Einführung

Mehr

Data Lineage goes Traceability - oder was Requirements Engineering von Business Intelligence lernen kann

Data Lineage goes Traceability - oder was Requirements Engineering von Business Intelligence lernen kann Data Lineage goes Traceability - oder was Requirements Engineering von Business Intelligence lernen kann Andreas Ditze MID GmbH Kressengartenstraße 10 90402 Nürnberg a.ditze@mid.de Abstract: Data Lineage

Mehr

Vorwort zur zweiten Auflage...V. Vorwort zur ersten Auflage... VIII

Vorwort zur zweiten Auflage...V. Vorwort zur ersten Auflage... VIII Vorwort zur zweiten Auflage...V Vorwort zur ersten Auflage... VIII 1 Management Support Systeme und Business Intelligence Anwendungssysteme zur Unterstützung von Managementaufgaben...1 1.1 Computergestützte

Mehr

Folien zum Textbuch. Kapitel 6: Managementunterstützungssysteme. Teil 2: Textbuch-Seiten 794-825

Folien zum Textbuch. Kapitel 6: Managementunterstützungssysteme. Teil 2: Textbuch-Seiten 794-825 Folien zum Textbuch Kapitel 6: Managementunterstützungssysteme Teil 2: Managementunterstützung auf strategischer Ebene Datenverwaltung und -auswertung Textbuch-Seiten 794-825 WI 1 MUS MUS auf strategischer

Mehr

Data Warehouse schnell gemacht Performanceaspekte im Oracle DWH

Data Warehouse schnell gemacht Performanceaspekte im Oracle DWH Data Warehouse schnell gemacht Performanceaspekte im Oracle DWH Dani Schnider Principal Consultant Business Intelligence BI Trilogie, Zürich/Basel 25./26. November 2009 Basel Baden Bern Lausanne Zürich

Mehr

Data Warehouse ??? Ein Data Warehouse ist keine von der Stange zu kaufende Standardsoftware, sondern immer eine unternehmensindividuelle

Data Warehouse ??? Ein Data Warehouse ist keine von der Stange zu kaufende Standardsoftware, sondern immer eine unternehmensindividuelle ??? Zusammenfassung, Ergänzung, Querverbindungen, Beispiele A.Kaiser; WU-Wien MIS 188 Data Warehouse Ein Data Warehouse ist keine von der Stange zu kaufende Standardsoftware, sondern immer eine unternehmensindividuelle

Mehr

Data Warehouse und Data Mining

Data Warehouse und Data Mining Data Warehouse und Data Mining Marktführende Produkte im Vergleich von Dr. Heiko Schinzer, Carsten Bange und Holger Mertens 2., völlig überarbeitete und erweiterte Auflage -. - Verlag Franz Vahlen München

Mehr

Klassifikation von Integrationskonflikten

Klassifikation von Integrationskonflikten Klassifikation von Integrationskonflikten Christiane Telöken 1 Inhaltsverzeichnis 1. Was bedeutet Integration? 2. Strukturelle Heterogenitätskonflikte 2.1 Konflikte bei bilateralen Korrespondenzen 2.2

Mehr

Data Warehouse Grundlagen

Data Warehouse Grundlagen Seminarunterlage Version: 2.10 Version 2.10 vom 24. Juli 2015 Dieses Dokument wird durch die veröffentlicht.. Alle Rechte vorbehalten. Alle Produkt- und Dienstleistungs-Bezeichnungen sind Warenzeichen

Mehr

ARCO SQL T5 - Business Intelligence

ARCO SQL T5 - Business Intelligence ARCO SQL T5 - Business Intelligence Um die ARCO Business Intelligence Funktionen nutzen zu können, werden diese unter MS Excel eingerichtet. Es handelt sich um strukturierte Auswertungen bezüglich Umsätzen,

Mehr

Data Mining mit Microsoft SQL-Server 2005/2008

Data Mining mit Microsoft SQL-Server 2005/2008 Data Mining mit Microsoft SQL-Server 2005/2008 Marcel Winkel Hochschule für Technik, Wirtschaft und Kultur Leipzig Fachbereich Informatik, Mathematik und Naturwissenschaften 19. Mai 2010 1 2 Klassifikationsalgorithmen

Mehr

Kapitel 33. Der xml-datentyp. In diesem Kapitel: Der xml-datentyp 996 Abfragen aus xml-datentypen 1001 XML-Indizierung 1017 Zusammenfassung 1023

Kapitel 33. Der xml-datentyp. In diesem Kapitel: Der xml-datentyp 996 Abfragen aus xml-datentypen 1001 XML-Indizierung 1017 Zusammenfassung 1023 Kapitel 33 Der xml-datentyp In diesem Kapitel: Der xml-datentyp 996 Abfragen aus xml-datentypen 1001 XML-Indizierung 1017 Zusammenfassung 1023 995 996 Kapitel 33: Der xml-datentyp Eine der wichtigsten

Mehr

Modellbasierte Business Intelligence in der Praxis. Nürnberg, 10.11.2009

Modellbasierte Business Intelligence in der Praxis. Nürnberg, 10.11.2009 Modellbasierte Business Intelligence in der Praxis Nürnberg, 10.11.2009 I N H A L T 1. Warum Modelle für Business Intelligence (BI)? 2. Inhalte von Datenmodellen für BI 3. Inhalte von Prozessmodellen 4.

Mehr

Star-Schema-Modellierung mit ERwin - eine kritische Reflexion der Leistungspotentiale und Anwendungsmöglichkeiten

Star-Schema-Modellierung mit ERwin - eine kritische Reflexion der Leistungspotentiale und Anwendungsmöglichkeiten Star-Schema-Modellierung mit ERwin - eine kritische Reflexion der Leistungspotentiale und Anwendungsmöglichkeiten Michael Hahne T&I GmbH Workshop MSS-2000 Bochum, 24. März 2000 Folie 1 Worum es geht...

Mehr

Neuerungen Analysis Services

Neuerungen Analysis Services Neuerungen Analysis Services Neuerungen Analysis Services Analysis Services ermöglicht Ihnen das Entwerfen, Erstellen und Visualisieren von Data Mining-Modellen. Diese Mining-Modelle können aus anderen

Mehr

Intelligence (BI): Von der. Nürnberg, 29. November 2011

Intelligence (BI): Von der. Nürnberg, 29. November 2011 Modelle für Business Intelligence (BI): Von der Anforderung zum Würfel Nürnberg, 29. November 2011 Warum Modelle für Business Intelligence (BI)? Warum Modelle für Business Intelligence (BI)? Bis zur Auswertung

Mehr

BIW - Überblick. Präsentation und Discoverer Demonstration - Teil 1 - Humboldt Universität zu Berlin am 10. Juni 2004

BIW - Überblick. Präsentation und Discoverer Demonstration - Teil 1 - Humboldt Universität zu Berlin am 10. Juni 2004 BIW - Überblick Präsentation und Discoverer Demonstration - Teil 1 - Humboldt Universität zu Berlin am 10. Juni 2004 Annegret Warnecke Senior Sales Consultant Oracle Deutschland GmbH Berlin Agenda Überblick

Mehr

Business Intelligence. Data Warehouse / Analyse Sven Elvers 2005-07-06

Business Intelligence. Data Warehouse / Analyse Sven Elvers 2005-07-06 Business Intelligence Data Warehouse / Analyse Sven Elvers 2005-07-06 Einleitung Dieses Dokument beschreibt einen für das Verständnis relevanten Teil der Präsentation. Business Intelligence Motivation

Mehr

Analyse alt- und mittelpaläolithischer Steinartefaktinventare mittels Parallelkoordinatenplots

Analyse alt- und mittelpaläolithischer Steinartefaktinventare mittels Parallelkoordinatenplots Einleitung Analyse alt- und mittelpaläolithischer Steinartefaktinventare mittels Parallelkoordinatenplots von Irmela Herzog Im Rahmen der Herbsttagung der AG DANK (Datenanalyse und Numerische Klassifikation)

Mehr

Objektorientierte Datenbanken

Objektorientierte Datenbanken OODB 11 Slide 1 Objektorientierte Datenbanken Vorlesung 11 vom 01.07.2004 Dr. Sebastian Iwanowski FH Wedel OODB 11 Slide 2 Inhalt heute: Datenbanken in betriebswirtschaftlichen Anwendungen OTLP (SAP) Data

Mehr

Data Warehousing und Data Mining

Data Warehousing und Data Mining Data Warehousing und Data Mining 2 Cognos Report Net (CRN) Ermöglicht Erstellen von Ad-hoc-Anfragen (Query Studio) Berichten (Report Studio) Backend Data Cube Relationale Daten Übung: Cognos Report Net

Mehr

30. Juni 2006 - Technische Universität Kaiserslautern. Paul R. Schilling

30. Juni 2006 - Technische Universität Kaiserslautern. Paul R. Schilling 30. Juni 2006 - Technische Universität Kaiserslautern Paul R. Schilling ! " #$% & '( ( ) *+, - '. / 0 1 2("$ DATEN SIND ALLGEGENWÄRTIG Bill Inmon, father of data warehousing Unternehmen In einer vollkommenen

Mehr

Data Mining mit der SEMMA Methodik. Reinhard Strüby, SAS Institute Stephanie Freese, Herlitz PBS AG

Data Mining mit der SEMMA Methodik. Reinhard Strüby, SAS Institute Stephanie Freese, Herlitz PBS AG Data Mining mit der SEMMA Methodik Reinhard Strüby, SAS Institute Stephanie Freese, Herlitz PBS AG Data Mining Data Mining: Prozeß der Selektion, Exploration und Modellierung großer Datenmengen, um Information

Mehr

Mit Transbase Hypercube Data Warehouse Anwendungen effizient betreiben. Die Hypercube-Technologie

Mit Transbase Hypercube Data Warehouse Anwendungen effizient betreiben. Die Hypercube-Technologie Mit Transbase Hypercube Data Warehouse Anwendungen effizient betreiben Transbase Hypercube ist eine Transbase -Option, die die innovative Hypercube-Technologie für komplexe analytische Anwendungen (OLAP)

Mehr

Zusammenspiel von Business Intelligence mit betrieblicher Anwendungssoftware Falk Neubert, Universität Osnabrück

Zusammenspiel von Business Intelligence mit betrieblicher Anwendungssoftware Falk Neubert, Universität Osnabrück Zusammenspiel von Business Intelligence mit betrieblicher Anwendungssoftware 14. März 2013, IHK Osnabrück-Emsland-Grafschaft Bentheim Geschichte Kassenbuch des Liederkranz, 1886 Hutmachergesangvereins

Mehr

Logische Modellierung von Data Warehouses

Logische Modellierung von Data Warehouses Logische Modellierung von Data Warehouses Vertiefungsarbeit von Karin Schäuble Gliederung. Einführung. Abgrenzung und Grundlagen. Anforderungen. Logische Modellierung. Methoden.. Star Schema.. Galaxy-Schema..

Mehr

Methoden Quantitative Datenanalyse

Methoden Quantitative Datenanalyse Leitfaden Universität Zürich ISEK - Andreasstrasse 15 CH-8050 Zürich Telefon +41 44 635 22 11 Telefax +41 44 635 22 19 www.isek.uzh.ch 11. September 2014 Methoden Quantitative Datenanalyse Vorbereitung

Mehr

ENTERBRAIN Reporting & Business Intelligence

ENTERBRAIN Reporting & Business Intelligence Überblick Vorhandene Listen/Analysen in ENTERBRAIN Die Daten in ENTERBRAIN Das Fundament des BI - Hauses Details zur ENTERBRAIN Staging Area Reports und Cubes auf Basis der Staging Area Data Mining mit

Mehr

Vergleich von Open-Source und kommerziellen Programmen zur Durchführung eines ETL-Prozesses

Vergleich von Open-Source und kommerziellen Programmen zur Durchführung eines ETL-Prozesses Vergleich von Open-Source und kommerziellen Programmen zur Durchführung eines ETL-Prozesses Exposé zur Diplomarbeit Humboldt-Universität zu Berlin Mathematisch-Naturwissenschaftliche Fakultät II Institut

Mehr

2 Datenbanksysteme, Datenbankanwendungen und Middleware... 45

2 Datenbanksysteme, Datenbankanwendungen und Middleware... 45 Vorwort 15 Teil I Grundlagen 19 i Einführung In das Thema Datenbanken 21 I.I Warum ist Datenbankdesign wichtig? 26 i.2 Dateisystem und Datenbanken 28 1.2.1 Historische Wurzeln 29 1.2.2 Probleme bei der

Mehr

Datenbanktechnologie für Data-Warehouse-Systeme

Datenbanktechnologie für Data-Warehouse-Systeme Wolfgang Lehner Datenbanktechnologie für Data-Warehouse-Systeme Konzepte und Methoden dpunkt.verlag 1 1.1 1.2 1.3 1.4 1. 5 2 2.1 2.2 2.3 Einleitung 1 Betriebswirtschaftlicher Ursprung des Data Warehousing...

Mehr

Komponenten und Architekturen von Analytischen Informationssystemen (AIS)

Komponenten und Architekturen von Analytischen Informationssystemen (AIS) Komponenten und Architekturen von Analytischen Informationssystemen (AIS) Melanie Pfoh Konsultation Zusammenfassung OPAL 6. Übung Juni 2015 Agenda Hinweise zur Klausur Zusammenfassung OPAL Übungen / Kontrollfragen

Mehr

Data Warehousing und Data Mining

Data Warehousing und Data Mining 2 Data Warehousing und Data Mining Kapitel 1: Data-Warehousing-Architektur von Geschäftsprozessen Mögliche Fragestellungen Wie entwickelt sich unser Umsatz im Vergleich zum letzten Jahr? In welchen Regionen

Mehr

Einführung relationale Datenbanken. Themenblock: Erstellung eines Cube. Schlüssel. Relationenmodell Relationenname Attribut. Problem.

Einführung relationale Datenbanken. Themenblock: Erstellung eines Cube. Schlüssel. Relationenmodell Relationenname Attribut. Problem. Themenblock: Erstellung eines Cube Einführung relationale Datenbanken Problem Verwaltung großer Mengen von Daten Praktikum: Data Warehousing und Data Mining Idee Speicherung der Daten in Form von Tabellen

Mehr

Data Mining Anwendungen und Techniken

Data Mining Anwendungen und Techniken Data Mining Anwendungen und Techniken Knut Hinkelmann DFKI GmbH Entdecken von Wissen in banken Wissen Unternehmen sammeln ungeheure mengen enthalten wettbewerbsrelevantes Wissen Ziel: Entdecken dieses

Mehr

Performance by Design Wie werden performante ETL-Prozesse erstellt?

Performance by Design Wie werden performante ETL-Prozesse erstellt? Performance by Design Wie werden performante ETL-Prozesse erstellt? Reinhard Mense ARETO Consulting Bergisch Gladbach Schlüsselworte: DWH, Data Warehouse, ETL-Prozesse, Performance, Laufzeiten, Partitionierung,

Mehr

Themenblock: Erstellung eines Cube

Themenblock: Erstellung eines Cube Themenblock: Erstellung eines Cube Praktikum: Data Warehousing und Data Mining Einführung relationale Datenbanken Problem Verwaltung großer Mengen von Daten Idee Speicherung der Daten in Form von Tabellen

Mehr

SQL PASS Treffen RG KA. Überblick Microsoft Power BI Tools. Stefan Kirner Karlsruhe, 27.05.2014

SQL PASS Treffen RG KA. Überblick Microsoft Power BI Tools. Stefan Kirner Karlsruhe, 27.05.2014 SQL PASS Treffen RG KA Überblick Microsoft Power BI Tools Stefan Kirner Karlsruhe, 27.05.2014 Agenda Die wichtigsten Neuerungen in SQL 2012 und Power BI http://office.microsoft.com/en-us/office365-sharepoint-online-enterprise-help/power-bi-for-office-365-overview-andlearning-ha104103581.aspx

Mehr

David gegen Goliath Excel 2010 in Verbindung mit Datawarehouse und im Vergleich zu Business Objects

David gegen Goliath Excel 2010 in Verbindung mit Datawarehouse und im Vergleich zu Business Objects Thema: David gegen Goliath Excel 2010 in Verbindung mit Datawarehouse und im Vergleich zu Business Objects Autor: Dipl. Wirtsch.-Inf. Torsten Kühn PRAXIS-Consultant PRAXIS EDV- Betriebswirtschaft- und

Mehr

Data Cube. Aggregation in SQL. Beispiel: Autoverkäufe. On-line Analytical Processing (OLAP) 1. Einführung. 2. Aggregation in SQL, GROUP BY

Data Cube. Aggregation in SQL. Beispiel: Autoverkäufe. On-line Analytical Processing (OLAP) 1. Einführung. 2. Aggregation in SQL, GROUP BY Data Cube On-line Analytical Processing (OLAP). Einführung Ziel: Auffinden interessanter Muster in großen Datenmengen 2. Aggregation in SQL, GROUP BY 3. Probleme mit GROUP BY 4. Der Cube-Operator! Formulierung

Mehr

Pivotieren. Themenblock: Anfragen auf dem Cube. Roll-up und Drill-down. Slicing und Dicing. Praktikum: Data Warehousing und Data Mining. Produkt.

Pivotieren. Themenblock: Anfragen auf dem Cube. Roll-up und Drill-down. Slicing und Dicing. Praktikum: Data Warehousing und Data Mining. Produkt. Zeit Pivotieren Themenblock: Anfragen auf dem Cube Praktikum: Data Warehousing und Data Mining Zeit Zeit 2 Roll-up und Drill-down Slicing und Dicing Drill-down Januar 2 3 33 1. Quartal 11 36 107 Februar

Mehr

W.WIINM32.11 (Datawarehousing) W.WIMAT03.13 (Statistik)

W.WIINM32.11 (Datawarehousing) W.WIMAT03.13 (Statistik) Modulbeschrieb Business Intelligence and Analytics 16.10.2013 Seite 1/5 Modulcode Leitidee Art der Ausbildung Studiengang Modultyp W.WIINM42.13 Information ist eine derart wichtige Komponente bei der Entscheidungsfindung,

Mehr

Ein Beispiel. Ein Unternehmen will Internettechnologien im Rahmen des E- Business nutzen Welche Geschäftsprozesse?

Ein Beispiel. Ein Unternehmen will Internettechnologien im Rahmen des E- Business nutzen Welche Geschäftsprozesse? Ein Beispiel Ein Unternehmen will Internettechnologien im Rahmen des E- Business nutzen Welche Geschäftsprozesse? Dipl.-Kfm. Claus Häberle WS 2015 /16 # 42 XML (vereinfacht) visa

Mehr

Was ist Data Mining... in der Fundraising Praxis?

Was ist Data Mining... in der Fundraising Praxis? Was ist Data Mining...... in der Fundraising Praxis? Erkennen von unbekannten Mustern in sehr grossen Datenbanken (> 1000 GB) wenige und leistungsfähige Verfahren Automatisierung Erkennen von unbekannten

Mehr

Kapitel 2 Terminologie und Definition

Kapitel 2 Terminologie und Definition Kapitel 2 Terminologie und Definition In zahlreichen Publikationen und Fachzeitschriften tauchen die Begriffe Data Warehouse, Data Warehousing, Data-Warehouse-System, Metadaten, Dimension, multidimensionale

Mehr

Mala Bachmann September 2000

Mala Bachmann September 2000 Mala Bachmann September 2000 Wein-Shop (1) Umsatz pro Zeit und Produkt Umsatz Jan Feb Mrz Q1 Apr 2000 Merlot 33 55 56 144 18 760 Cabernet-S. 72 136 117 325 74 1338 Shiraz 85 128 99 312 92 1662 Rotweine

Mehr

Data Mining und Knowledge Discovery in Databases

Data Mining und Knowledge Discovery in Databases Data Mining und Knowledge Discovery in Databases Begriffsabgrenzungen... Phasen der KDD...3 3 Datenvorverarbeitung...4 3. Datenproblematik...4 3. Möglichkeiten der Datenvorverarbeitung...4 4 Data Mining

Mehr

Asklepius-DA Die intelligente Technologie für die umfassende Analyse medizinischer Daten Leistungsbeschreibung

Asklepius-DA Die intelligente Technologie für die umfassende Analyse medizinischer Daten Leistungsbeschreibung Asklepius-DA Die intelligente Technologie für die umfassende Analyse medizinischer Daten Leistungsbeschreibung Datei: Asklepius DA Flyer_Leistung_2 Seite: 1 von:5 1 Umfassende Datenanalyse Mit Asklepius-DA

Mehr

Data Warehouse. für den Microsoft SQL SERVER 2000/2005

Data Warehouse. für den Microsoft SQL SERVER 2000/2005 Warehouse für den Microsoft SQL SERVER 2000/2005 Begriffe 1 DWH ( Warehouse) ist eine fachübergreifende Zusammenfassung von Datentabellen. Mart ist die Gesamtheit aller Datentabellen für einen fachlich

Mehr

Business Intelligence. Business Intelligence Seminar, WS 2007/08

Business Intelligence. Business Intelligence Seminar, WS 2007/08 Business Intelligence Seminar, WS 2007/08 Prof. Dr. Knut Hinkelmann Fachhochschule Nordwestschweiz knut.hinkelmann@fhnw.ch Business Intelligence Entscheidungsorientierte Sammlung, Aufbereitung und Darstellung

Mehr

Business Intelligence Praktikum 1

Business Intelligence Praktikum 1 Hochschule Darmstadt Business Intelligence SS 2014 Fachbereich Informatik Praktikumsversuch 1 Prof. Dr. C. Wentzel Dipl. Inf. Dipl. Math. Y. Orkunoglu Datum: 07.05.2014 Business Intelligence Praktikum

Mehr

Oracle-Statistiken im Data Warehouse effizient nutzen

Oracle-Statistiken im Data Warehouse effizient nutzen Oracle-Statistiken im Data Warehouse effizient nutzen Reinhard Mense ARETO Consulting Köln Schlüsselworte: DWH, Data Warehouse, Statistiken, Optimizer, Performance, Laufzeiten Einleitung Für die performante

Mehr

Kapitel II. Datenbereitstellung 2004 AIFB / FZI 1. Vorlesung Knowledge Discovery

Kapitel II. Datenbereitstellung 2004 AIFB / FZI 1. Vorlesung Knowledge Discovery Kapitel II Datenbereitstellung 2004 AIFB / FZI 1 II. Datenbereitstellung 2004 AIFB / FZI 2 II. Datenbereitstellung Collect Initial Data identify relevant attributes identify inconsistencies between sources

Mehr

Hinweise zur Klausur Zusammenfassung OPAL-Übungen / Kontrollfragen Fragen Vertiefung Modellierung

Hinweise zur Klausur Zusammenfassung OPAL-Übungen / Kontrollfragen Fragen Vertiefung Modellierung Komponenten und Architekturen von Analytischen Informationssystemen (AIS) Melanie Pfoh Konsultation Zusammenfassung OPAL 24. Juni 2014 Agenda Hinweise zur Klausur Zusammenfassung OPAL-Übungen / Kontrollfragen

Mehr

Definition Informationssystem

Definition Informationssystem Definition Informationssystem Informationssysteme (IS) sind soziotechnische Systeme, die menschliche und maschinelle Komponenten umfassen. Sie unterstützen die Sammlung, Verarbeitung, Bereitstellung, Kommunikation

Mehr

ANALYTICS, RISK MANAGEMENT & FINANCE ARCHITECTURE. NoSQL Datenbanksysteme Übersicht, Abgrenzung & Charakteristik

ANALYTICS, RISK MANAGEMENT & FINANCE ARCHITECTURE. NoSQL Datenbanksysteme Übersicht, Abgrenzung & Charakteristik ARFA ANALYTICS, RISK MANAGEMENT & FINANCE ARCHITECTURE NoSQL Datenbanksysteme Übersicht, Abgrenzung & Charakteristik Ralf Leipner Domain Architect Analytics, Risk Management & Finance 33. Berner Architekten

Mehr

Softwaretool Data Delivery Designer

Softwaretool Data Delivery Designer Softwaretool Data Delivery Designer 1. Einführung 1.1 Ausgangslage In Unternehmen existieren verschiedene und häufig sehr heterogene Informationssysteme die durch unterschiedliche Softwarelösungen verwaltet

Mehr

Fachgruppe Statistik, Risikoanalyse & Computing. STAT672 Data Mining. Sommersemester 2007. Prof. Dr. R. D. Reiß

Fachgruppe Statistik, Risikoanalyse & Computing. STAT672 Data Mining. Sommersemester 2007. Prof. Dr. R. D. Reiß Fachgruppe Statistik, Risikoanalyse & Computing STAT672 Data Mining Sommersemester 2007 Prof. Dr. R. D. Reiß Überblick Data Mining Begrifflichkeit Unter Data Mining versteht man die Computergestützte Suche

Mehr

ANTARES Informations-Systeme GmbH Stuttgarter Strasse 99 D-73312 Geislingen Tel. +49 73 31 / 30 76-0 Fax +49 73 31 / 30 76-76 www.antares-is.

ANTARES Informations-Systeme GmbH Stuttgarter Strasse 99 D-73312 Geislingen Tel. +49 73 31 / 30 76-0 Fax +49 73 31 / 30 76-76 www.antares-is. ANTARES Informations-Systeme GmbH Stuttgarter Strasse 99 D-73312 Geislingen Tel. +49 73 31 / 30 76-0 Fax +49 73 31 / 30 76-76 www.antares-is.de insight und dynasight sind eingetragene Markenzeichen der

Mehr

Verschiedene Arten des Datenbankeinsatzes

Verschiedene Arten des Datenbankeinsatzes 1 Beispiele kommerzieller DBMS: Kapitelinhalt Was charakterisiert und unterscheidet verschiedene Einsatzbereiche für. Welche prinzipiell unterschiedlichen Anforderungen ergeben sich für das DBMS bei Ein-

Mehr

Business Intelligence

Business Intelligence Business Intelligence Anwendungssysteme (BIAS) Lösung Aufgabe 1 Übung WS 2012/13 Business Intelligence Erläutern Sie den Begriff Business Intelligence. Gehen Sie bei der Definition von Business Intelligence

Mehr

Business Intelligence im Krankenhaus

Business Intelligence im Krankenhaus Business Intelligence im Krankenhaus Dr. Thomas Lux Holger Raphael IT-Trends in der Medizin 03.September 2008 Essen Gliederung Herausforderungen für das Management im Krankenhaus Business Intelligence

Mehr

Modellierung von OLAP- und Data- Warehouse-Systemen

Modellierung von OLAP- und Data- Warehouse-Systemen Andreas Totok Modellierung von OLAP- und Data- Warehouse-Systemen Mit einem Geleitwort von Prof. Dr. Burkhard Huch Deutscher Universitäts-Verlag Inhaltsverzeichnis Abbildungsverzeichnis Tabellenverzeichnis

Mehr

3.17 Zugriffskontrolle

3.17 Zugriffskontrolle 3. Der SQL-Standard 3.17. Zugriffskontrolle Seite 1 3.17 Zugriffskontrolle Datenbanken enthalten häufig vertrauliche Informationen, die nicht jedem Anwender zur Verfügung stehen dürfen. Außerdem wird man

Mehr

Oracle BI EE mit großen Datenmengen

Oracle BI EE mit großen Datenmengen Oracle BI EE mit großen Datenmengen Christian Casek Riverland Solutions GmbH München Schlüsselworte: Oracle BI EE, Oracle BI Applications, Informatica, RPD, große Datenmengen, Performance, Performanceoptimierung,

Mehr

Die Bedeutung der Prozessmodellierung bei der Weiterentwicklung des DWHs der DAK Der Innovator als Missing Link

Die Bedeutung der Prozessmodellierung bei der Weiterentwicklung des DWHs der DAK Der Innovator als Missing Link Die Bedeutung der Prozessmodellierung bei der Weiterentwicklung des DWHs der DAK Der Innovator als Missing Link Konrad Linner, solvistas GmbH Nürnberg, 20.November 2012 Inhaltsverzeichnis Vorstellung solvistas

Mehr

Self Service BI mit Office 2013 Raúl B. Heiduk

Self Service BI mit Office 2013 Raúl B. Heiduk 1 Self Service BI mit Office 2013 Raúl B. Heiduk Partner: 2 Agenda Begrüssung Vorstellung Referent Inhalt F&A Weiterführende Kurse 3 Vorstellung Referent Name: Raúl B. Heiduk Ausbildung: Dipl. Ing. (FH),

Mehr

Dominik Pretzsch TU Chemnitz 2011

Dominik Pretzsch TU Chemnitz 2011 Dominik Pretzsch TU Chemnitz 2011 Wir leben im Informationszeitalter und merken es daran, dass wir uns vor Information nicht mehr retten können. Nicht der überwältigende Nutzen der Information, sondern

Mehr

10. Vorlesung: Datenorganisation SS 2007

10. Vorlesung: Datenorganisation SS 2007 10. Vorlesung: Datenorganisation SS 2007 8 Parallele Transaktionen 9 9.1 Drei-Ebenen Ebenen-Architektur 9.2 Verteilte Datenbanken 9.3 Client-Server Server-Datenbanken 9.4 Föderierte Datenbanken 9.5 Das

Mehr

Data Mining als Arbeitsprozess

Data Mining als Arbeitsprozess Data Mining als Arbeitsprozess Hagen Knaf Studiengang Angewandte Mathematik Hochschule RheinMain 31. Dezember 2015 In Unternehmen werden umfangreichere Aktivitäten oder Projekte im Bereich des Data Mining

Mehr

Studierenden-Kennzahlen im Griff dank flexiblem Reporting und Ad-hoc-Analysen

Studierenden-Kennzahlen im Griff dank flexiblem Reporting und Ad-hoc-Analysen Praxistag für die öffentliche Verwaltung 2012 Titel Präsentation Studierenden-Kennzahlen im Griff dank flexiblem Reporting und Ad-hoc-Analysen Referenten-Info Gerhard Tschantré, Leiter Controllerdienste

Mehr

CAS genesisworld.exchange connect Abgleich von Adressen und Terminen

CAS genesisworld.exchange connect Abgleich von Adressen und Terminen Abgleich von Adressen und Terminen Stand Juni 2004 Was ist CAS genesisworld.exchange connect? Inhalt 1 Was ist CAS genesisworld.exchange connect?... 3 2 Systemvoraussetzungen... 5 2.1 Software...5 2.2

Mehr