Data Warehouse (DW) Online Analytical Processing (OLAP) Data Mining

Größe: px
Ab Seite anzeigen:

Download "Data Warehouse (DW) Online Analytical Processing (OLAP) Data Mining"

Transkript

1 Analytische Informationssysteme Data Warehouse (DW) Online Analytical Processing (OLAP) Data Mining Seit mehr als 30 Jahren wird versucht, den betrieblichen Fach- und Führungskräften angemessene DV-Werkzeuge zu bieten, die ihnen bei ihren Planungs- und Entscheidungsaufgaben adäquate Hilfe geben können. 1) Zahlreiche Systeme wurden entwickelt, doch selten erfüllten sie die in sie gesetzten Erwartungen. Das lag in den 70-er Jahren teilweise an der geringen Rechenleistung und der mangelnden Erfahrung der Entwickler, aber auch an den überzogenen Erwartungen an die damals so genannten Management Information Systems (MIS). Mit dem Aufkommen graphischer Benutzeroberflächen wurde ein neuer Versuch unternommen. Unter den Begriffen Executive Information System (EIS) und Decision Support System (DSS). kamen neue Systeme auf den Markt. Obwohl damit leistungsfähige Werkzeuge zur Verfügung standen, fehlte es oftmals an DV-mündigen Nutzern, welche die teilweise starren Systeme nutzbringend einsetzen konnten. In den letzten Jahren ist es gelungen, Technik und betriebliche Anforderungen so zu strukturieren, dass die erforderliche Flexibilität erreicht werden kann. Die dem technischen Wandel und der unternehmerischen Mode unterliegenden Systeme wurden und werden abgesehen von stark divergierendem Leistungs- und Funktionsumfang unter einer Vielzahl von Namen angeboten. Als Abgrenzung zu den operativen, transaktionsorientierten System haben sie jedoch eines gemeinsam: sie dienen der Unterstützung dispositiver und analytische Tätigkeiten. Daher verwenden wir die Sammelbegriff Analytisches Informationssystem (AIS) bzw. Führungsinformationssystem (FIS) 2) für alle Ausprägungen der MIS, DSS, EUS, EIS, DW 3), OLAP und Data Mining Systeme. 1) P. Chamoni, P. Gluchowski (Hrsg.), Analytische Informationssysteme, 1999 Springer 2) vgl. Vorlesung Prof. A. Roth, Führungsinformationssysteme 3) zur Definition der Abkürzungen siehe Vorlesung Prof. A. Roth, Führungsinformationssysteme (c), F. Laux, Wirtschaftsinformatik 1

2 Inhalt 1. Einführung 2. Grundlagen 3. Der BI-Prozess 4. Architekturen 1 Einführung 2 Grundlagen 3 Der BI-Prozess 4 Architekturen 5. Datenmodelle 6. Data Mining 5 Datenmodelle 6 Data Mining 2 /58 Entsprechend der Ausrichtung der Veranstaltung wird in der Einführung das Thema aus DVtechnischer Sicht motiviert. Dazu werden die Unterschiede zu operativen Systemen aufgezeigt und die Herausforderungen an Analytische Informationssysteme identifiziert. Die betriebswirtschaftlichen Aspekte werden in der begleitenden Veranstaltung Führungsinformationssysteme 2) behandelt. Zu den Grundlagen gehören neben der mathematischen Fundierung des Informationsmodells die Definition der Begriffswelt, um die Elemente, Funktionen, Präsentationsmöglichkeiten und Arbeitstechniken analytischer Informationssysteme (AIS) zu präzisieren. Viele Details bei der Vorbereitung analytischer Auswertungen sind nicht automatisierbar. Ein klares, systematisches Vorgehen ist die Voraussetzung für die erfolgreiche Arbeit mit analytischen Informationssystemen. Die Etappen des AIS-Prozesses: Auswahl der Datenquellen, Datenbereinigung, Data Warehouse Modellierung, Auswertungen und Präsentation werden zunächst vorgestellt und in den folgenden Kapiteln dieser Vorlesung vertieft. Die physische Aufteilung der Komponenten im Intranet, ihre Funktionalität und Performance wird durch die Architektur eines AIS bestimmt Das bei den operativen Datenbanksystemen dominierende relationale Datenmodell erweist sich als nicht optimal, deshalb wird nach neuen Modellen und Metaphern gesucht. Die dafür angeboten Datenmodelle werden kritisch untersucht. Nicht offensichtliche Zusammenhänge zwischen den Daten können durch Algorithmen des Data Minings entdeckt werden. Dazu werden Hilfsmittel der Statistik, des maschinellen Lernens oder der Künstlichen Intelligenz eingesetzt. Je nach Verfahren arbeiten diese mit oder ohne Benutzerinteraktion. 2) Vorlesung Prof. A. Roth, Führungsinformationssysteme (c), F. Laux, Wirtschaftsinformatik 2

3 1.1 Begriffliche Einordnung Aspekte Technologische Sicht Betriebliche Sicht Marktsicht Marktsicht Marktsicht Data Mining OLAP Data Warehouse EIS EIS Betriebliche Betriebliche Sicht Sicht DSS DSS FIS Transaktionssysteme Operative Operative Systeme Systeme AIS DV-technische Sicht 3 /58 We're drowning in information and starving for knowledge. (Rutherford D. Rogers, Yale, 1985) Die Begriffsbildungen im Bereich analytischer Informationssysteme lassen sich unter verschiedenen Blickwinkeln einordnen. Die betriebswirtschaftliche Sicht (innerbetriebliche, Markt- und Organisationssicht) erfolgt in der Veranstaltung Führungsinformationssysteme 2). In dieser Vorlesung analytische Informationssysteme werden wir uns auf die DV-technische Sicht konzentrieren. Die Transaktionssysteme sind die operativen Systeme eines Unternehmens. Sie zeichnen sich durch eine transaktionsgesteuerte (Alles-oder-Nichts-Prinzip) und satzorientierte Verarbeitung aus. Diese Systeme werden wir als gegeben und bekannt 1) voraussetzen. Definitionen: Eine Datenbasis, die neben operativen, betrieblichen Daten auch historische und aggregierte Werte sowie externe Daten umfasst, bezeichnen wir als Data Warehouse (DW) 3). Ein DV-System, das multidimensionale Sichten auf die Daten eines DW bereitstellt und analytische Auswertungen ermöglicht, heißt Online Analytical Processing (OLAP). Unter Data Mining (ein besserer und umfassenderer Begriff wäre Wissensentdeckung in Datenbanken (Knowledge Discovery in Databases)) versteht man sowohl die automatische Mustererkennung als auch die benutzergesteuerte (navigierende) Entdeckung von Information. Die Informationssuche beim Data Mining basiert nicht auf Modellannahmen oder einer Hypothese, d.h. sie erfolgt ohne präzise Fragestellung unter Verwendung nichttrivialer Algorithmen und Methoden. 1) vgl. Vorlesung F. Laux, Datenbanken 2) Vorlesung A. Roth, Führungsinformationssysteme 3)Inmon gibt ebenfalls eine technische Definition: A data warehouse is a subject-oriented, integrated, time-varying, non-volatile collection of data in support of the management s decision-making process. Siehe in Lehner, Wolfgang (2003) Datenbanktechnologie für Data-Warehouse-Systeme Konzepte und Methoden, 1. Aufl., Heidelberg (dpunkt), S. 9: (c), F. Laux, Wirtschaftsinformatik 3

4 1.2 Ausgangslage große operative Datenbestände ungünstige Strukturierung für Analysen Auswertung nur nach expliziter Information Select Kunde, Betrag from Auftrag where Region. Order by RDBS tabellarische oder Listendarstellung Kunde 1 Kunde 2 Kunde eindimensionale graphische Präsentation 4 /58 Zur Einführung wollen wir zunächst die Ausgangslage analysieren. Die Hauptdatenquelle für betriebliche Informationssysteme bilden die operativen Datenbestände des Unternehmens. Warum können diese nicht zu einem AIS erweitert werden? Dafür gibt es mehrere Gründe: 1. Die Speicherungsform ist für aggregierte Daten ungeeignet und die Datenbestände enthalten keine historische Daten. Sie sind ausschließlich vorgangs- bzw. transaktionsorientiert. Geschäftsspezifische Kennzahlen (z.b. Gewinnmarge, Ladenhüter, Cash Flow, Absatzprognose, etc) sind nicht enthalten. Für AIS sind neue Datenmodelle notwendig. 2. Es kann nur nach expliziter (in den Datenbanken gespeicherter) Information gesucht werden. Versteckte Zusammenhänge können daher nicht entdeckt werden. Komplexe Berechnungen für Kennzahlen sind nicht möglich, da sie zu einem unzulässigen Leistungsabfall der operativen Funktionen führen würden. Komplexe Analysen erfordern von den operative Systemen getrennte, auf Auswertungen spezialisierte Systeme. 3. Komplexe betriebswirtschaftliche Abhängigkeiten können mit operativen Werkzeugen nicht geeignet visualisiert werden. Die Darstellung ist meist tabellarisch und damit wenig einprägsam. Durch die lineare Darstellung sind Abhängigkeiten von mehr als einer Einflussgröße kaum erkennbar. Dieser Mangel wird auch durch bunte Linien-, Balken- oder Kuchengraphiken wegen ihrer Eindimensionalität nicht wesentlich verbessert. Notwendig wären mehrdimensionale Darstellungen, die interaktiv gestaltet werden können. (c), F. Laux, Wirtschaftsinformatik 4

5 1.3 Multifunktionale Abhängigkeiten viele Einflussgrößen (Dimensionen) Zeit, Verkäufer, Kunde, Modell, Vertragstyp, Region,... unabhängige Dimensionen Produkt Zeit, Kunde Verkäufer, Produkt > Verkäufer? Aggregate Produkt Komponente Einzelteil (exogen) Jahr Monate Wochen Tage (exogen) Klassifikation Warengruppe Marke Produkt (exogen) Profitcenter Produkt (exogen) 5 /58 Gruppierungen ABC-Analyse, Warenkorbanalyse (endogen) Für planerische und analytische Aufgaben ist die gleichzeitige Untersuchung mehreren Einflussgrößen notwendig. So kann z.b. bei einer Absatzanalyse nicht nur nach Produkten differenziert werden, sondern es sind auch regionale und temporale Gesichtspunkte wichtig. In industriellen Projekten kann die Zahl der Dimensionen leicht in der Größenordnung von 50 liegen. Das CRM-Warehouse der Fa. Breuninger enthält ca. 200 Dimensionen. 1) Diese Einflussgrößen (Dimensionen) sind i.a. unabhängig voneinander. Beispielweise gibt es unabhängig von der Jahreszeit und unabhängig von der Region Pkws zu kaufen. Im Gegensatz hierzu kann bei bestimmten Unternehmen von einem Produkt auf den bzw. die möglichen Verkäufer geschlossen werden (funktionale resp. mehrwertige Abhängigkeit der Dimensionen). Nicht alle Dimensionen weisen die gleiche Struktur auf. Produkte können verschieden klassifiziert und in Hierarchien geordnet werden. Im Unterschied zur Gruppierung ist hier wesentlich, dass die Hierarchie bzw. die Klassifikation vorbestimmt ist. Dies drückt sich dadurch aus, dass z.b. die Komponenten eines Fahrzeugs durch die Stückliste im voraus festliegen (exogen), unabhängig davon, ob ein solches Fahrzeug bereits existiert. Im Gegensatz hierzu werden Gruppierungen einer Grundmenge anhand der Ähnlichkeit ihrer Objekte oder durch ihre Beziehungen untereinander (endogen) vorgenommen. Zur dynamischen Gruppierung zählt demnach auch die ABC-Analyse. ÜA1: Versuchen Sie eine ABC-Analyse in SQL zu formulieren. Verschiedene Formen der Dimensionshierarchien und daraus resultierende Probleme zeigt die folgende Folie. 1) Quelle: Computer Zeitung, Oktober 2003 (c), F. Laux, Wirtschaftsinformatik 5

6 1.4 Hierarchische Dimensionen (nicht) balancierte Hierarchien Parallele Hierarchien Heterarchien Kfz Pkw Nutzfz T 250D Benziner Mittelkl. Diesel Oberkl. A 160 C 220 D 180 E 280 S /58 Hierarchisch strukturierte Dimensionen zeigen in der Praxis äußerst komplexe Ausprägungen. Die Zweige einer Hierarchie können verschiedene Länge aufweisen (d.h. nicht balanciert sein), Knoten können zu verschiedenen Generalisierungen der gleichen Hierarchie (Heterarchie) oder zu verschiedenen, parallelen Hierarchien gehören. Daraus folgt eine Potenzierung der Fakten (Messwerte) für jede Dimensionsvariante und eine zunehmende Komplexität der Navigation. Die Struktur der Dimensionen bestimmt die Navigations- und Aggregationsmöglichkeiten. Navigationswege können mehrdeutig und von unterschiedlicher Tiefe sein (Orientierungsproblem!). Dies bedeutet für ein Informationssystem, dass eine Dimension unter verschiedenen Aspekten betrachtet werden kann und verschiedene Dimensionen i.a. auch unterschiedliche Generalisierungen und Zusammenfassungen gestatten. Moderne Datenmodelle für analytische Informationssysteme müssen durch geeignete Metadaten diese Semantik berücksichtigen. ÜA2: Erstellen Sie die Klassen Hierarchie und Knoten mit den zugehörigen Methoden (Algorithmen) für das Durchlaufen (Traversieren) der Hierarchie nach Tiefen- und Breitensuche. (c), F. Laux, Wirtschaftsinformatik 6

7 1.5 Analyseverfahren Berechnete Werte (Analyse, Prognose) Zeitreihenanalyse, Absatzprognose? Zusammenhänge erkennen (Korrelation) Regressionsrechnungen Diskriminanzanalyse Mustererkennung (KI-Verfahren) Clusteranalyse Neuronale Netze Produkt 7 /58 Zeit Region Die Kennzahlen, welche ein AIS liefert, werden durch Datenanalysen gewonnen. Charakteristisch für diese Analysen sind die Berechnung neuer Werte aus bereits vorhandenen. Dies kann so trivial wie eine Summen- oder Mittelwertbildung sein, aber auch komplexe Berechnungen sind möglich: Beispielsweise können mit Hilfe einer Zeitreihenanalyse Regelmäßigkeiten im zeitlichen Verhalten erkannt werden. Daraus können mit Hilfe einer Extrapolation die zukünftigen Daten vorhergesagt werden. So zeigen sich beim Verkauf von z.b. Badebekleidung offenbar saisonale Einflüsse, die eine Prognose bezüglich des zu erwartenden Absatzes erlauben. Mit Hilfe der Regressionsrechnung lassen sich statistische Zusammenhänge ermitteln. Dabei ist jedoch wichtig zu wissen, dass diese Abhängigkeiten rein statistisch sind und auch ohne kausalen Zusammenhang existieren können (Scheinkorrelation). Eine andere mögliche statistische Gefahr ist, dass bei großer Datenbasis seltene Ereignisse auch wirklich eintreten, ohne dass diese jedoch eine inhaltliche Aussagekraft besitzen. Zum Beispiel: Aus der Tatsache, dass fast jede Woche ein Millionengewinn in der Lotterie erzielt wird, darf nicht geschlossen werden, dass mir selbst auch dieses Glück innerhalb meiner Lebensspanne zuteil wird. Diskriminanz- und Clusteranalyse finden Gemeinsamkeiten bzw. erklären Unterschiede in Datenmengen. Die dazu verwendeten Konzepte basieren auf statistischen Methoden, Entscheidungsbäumen oder auch Künstlichen Neuronalen Netzen, wobei die letzteren erst trainiert werden müssen (überwachtes lernen), um brauchbare Ergebnisse zu erhalten. (c), F. Laux, Wirtschaftsinformatik 7

8 2 Grundlagen Daten Dimension := unabhängige Variable (Einflussgröße) Fakt := abhängige Größe, zu untersuchender Wert Dimensionen und Fakten besitzen einen Datentyp Funktionen Fakten = f(dimensionen) Navigation F1 +f(δ) = f(d1 + Δ) Präsentation Graphik Fakt f(δ) F1 8 /58 D1 Δ } Dimension In Kapitel 2 werden die grundlegenden Konzepte analytischer Informationssysteme behandelt. Zunächst definieren wir die verwendeten Begriffe, dann werden darauf aufbauend die Zusammenhänge untereinander untersucht. Trotz umfangreicher Datenmengen und Abhängigkeiten ist das Prinzip einfach. Es handelt sich um funktionale Abhängigkeiten, wobei die Funktion leider nicht im voraus bekannt ist, sondern erst durch aufwändige Analysen ermittelt werden muss. Bei den Auswertungen ist es vielfach notwendig, in den Datenbeständen interaktiv zu navigieren und die (Zwischen)ergebnisse optisch aussagekräftig zu präsentieren, um das weitere Vorgehen festlegen zu können. Auf die prinzipielle Grenzen der Vorstellungskraft wird bei den Präsentationsmöglichkeiten hingewiesen. (c), F. Laux, Wirtschaftsinformatik 8

9 2.1 Daten Dimension (Variable) unabhängige Variablen Hierarchisch oder intervallartig Strukturiert Bestimmt die Navigation Erzeugt abgeleitete bzw. berechnete Werte Dimensionsattribute Fakten (Werte) verschiedenedatentypen Taxonomie der Typen Analysen erfordern meistens quantitative Werte Skalierung 9 /58 Beziehungen (Links) Navigierbare Verbindung Intra-, extra-dimensonal, inhaltsorientiert Definition: Unter einer Dimension versteht man eine unabhängige Variable, welche die zu untersuchenden Werte (Fakten) beeinflusst. Eine Dimension kann in sich strukturiert sein. Hierarchische und Intervallstrukturen unterstützen so genannte Verdichtungen, die als Generalisierung, Intervallbildung oder Gruppierung realisiert werden. Diese bestimmen die Navigationsmöglichkeiten. So kann man sich bei einer hierarchischen Dimension von einer Position ausgehend zum übergeordneten (parent), zum untergeordneten (child) oder zum nächsten gleichrangigen Begriff (sibling) bewegen. Den Wert einer Aggregatdimension erhält man aus den Werten seiner Komponenten. Aus den Summenwerten der zugehörigen Fakten ergeben sich die Umsätze (Wert) des Aggregats (z.b. eines Monats (Zeitintervall = spezielles Aggregat). Achtung: Nicht alle numerischen Fakten lassen sich sinnvoll addieren! Dies hängt vom Datentyp des Faktums ab (siehe 2.1a Taxonomie der Fakten). Eine Dimension kann mit Attributen versehen sein, welche die Dimensionsobjekte näher beschreiben. Betrachten wir als Beispiel die Dimension Verkaufsstelle, so können wir diese mit den Attributen Adresse, Fläche, Mitarbeiter etc. versehen. Diese Attribute ermöglichen ihrerseits eine weitere Strukturierung der Dimension. Definition: Eine zu untersuchende Größe (Aspekt einer Situation) heißt Fakt. Fakten werden als Funktionswerte von Einflussgrößen (Dimensionen) aufgefasst und dementsprechend ist ihre Abhängigkeit von den Dimensionen von Bedeutung. Die Fakten sind meistens Unternehmensdaten (interne Fakten), die aus operativen Daten oder Planzahlen entstammen. Eine weitere Datenquelle sind die volkswirtschaftliche Zahlen (externe Fakten), welche private und öffentliche Organisationen zusammentragen und publizieren. Der Datentyp eines Faktums ist nicht nur auf numerische Werte beschränkt, sondern kann auch von nominalem Typ sein. (siehe 2.1a Taxonomie der Fakten). In diesen Fällen muss eine Transformation der Fakten auf numerische Werte vorgenommen werden, um bestimmte Analysen (z.b. statistische Kenngrößen) vornehmen zu können. Definition: Ein Link bezeichnet eine navigierbare (ansteuerbare) Verbindung zwischen zwei Elementen (Dimension, Fakt, Attribut, Datentyp,...). Die Verbindung kann innerhalb einer Dimension (strukturell), zwischen Dimensionen (dimensionsorientiert), zwischen Fakten (inhaltsorientiert) und in gemischter Kombination auftreten. ÜA3: Finden Sie Beispiele für numerische Fakten, die sich nicht sinnvoll addieren lassen. (c), F. Laux, Wirtschaftsinformatik 9

10 2.1a Taxonomie der Fakten 10 /58 Fakten können durch unterschiedliche Datentypen dargestellt werden. Entsprechend der gewählten Taxonomie (Struktur der Begriffe eines Fachgebietes) können wir zwischen quantitativen und kategorialen Fakten unterscheiden. Auf den Werten der quantitativer Fakten können Rechenoperationen durchgeführt werden. Wenn die Werte uneingeschränkt addiert oder subtrahiert werden können (d.h. dabei sinnvolle Werte liefern), handelt es sich um additive Fakten. Diese Eigenschaft ist für die Aggregatbildung notwendig. Beispiele additiver Fakten sind z.b. Umsatz, Einkommen, Erlöse und verkaufte Stückzahl. Gilt die Addierbarkeit nicht für jede Dimension, so handelt es sich um eine Semi- Additivität. Beispiele dafür sind der Lagerbestand bezüglich der Dimension Artikel und die Anzahl Mitarbeiter über der Zeit. Es ist unbedingt notwendig, dass die Semantik eindeutig klar ist, sonst kann es zu unsinnigen Rechenoperationen kommen (z.b. z.b. dürfen die Mitarbeiter nicht über der Zeit, wohl aber über die Abteilungen summiert werden). Temporale Größen, wie das Datum, die Zeit oder ein Zeitintervall sind spezielle Formen semi-additiver Daten. Kategoriale Fakten (z.b. Noten, Sprachkenntnisse, Gehaltsklasse, etc) sind nicht additiv, d.h. die Werte dürfen auch wenn sie numerisch sind nicht addiert werden (z.b. Noten). Wenn die Werte vergleichbar sind (z.b. Kundenbewertung, Rangordnung, Prozentwerte), spricht man von ordinalen Werten. Für diese Werte existiert eine Ordnungsrelation (z.b. < oder > ). Beispielsweise ist die Note 1 besser als die Note 2. Wenn zusätzlich ein Distanzbegriff definiert ist, darf auch ein Mittelwert gebildet werden. Mit nominalen Werten (z.b. Geschlecht, Ausbildung, Personalnummer) darf keine mathematische Operation durchgeführt werden. ÜA4: Finden Sie Beispiele für additive, semi-additive und nicht additive Fakten. ÜA5: Entwerfen Sie auf Grund der oben stehenden Taxonomie eine Klassenhierarchie in UML- Notation für Faktenklassen. Hinweis: Smalltalk Klassenhierarchie Magnitude (c), F. Laux, Wirtschaftsinformatik 10

11 2.2 Multidimensionale Funktionen OLAP Abbildung: Dimensionen Di -> Fakten Bi allgemeine, mehrdimensionale Abbildung X Di -> X Bi f: (x 1,x 2,..., x n ) -> (y 1,y 2,..., y m ) (x 1,x 2,..., x n ) (y 1,y 2,..., y m ) n-dimensionale Abb. mit eindimensionalem Bildraum (Kennzahl) X Di -> B f: (x 1,x 2,..., x n ) -> y (x 1,x 2,..., x n ) 11 /58 eindimensionale Abb. in m-dimensionalen Bildraum (Tabelle, Slicing) D -> X Bi f: x -> (y 1,y 2,..., y m ) (y 1,y 2,..., y m ) Beim OLAP geht es um die Analyse bzw. die funktionalen Abhängigkeiten der Fakten in Bezug auf die Dimensionen. Diese Aufgabe kann durch eine multidimensionale Funktion beschrieben werden. Unter einer Funktion (Abbildung) versteht man die eindeutige Zuordnung eines Wertes (Fakt) aus einer Wertemenge (XBi Bildbereich) für jedes Element (Vektor aus Variablen [Dimensionen]) eines Definitionsbereiches (XDi). Aufgabe der AIS ist es, die funktionalen Abhängigkeiten zwischen Einflussgrößen (Dimensionen) und diskreten Messergebnissen (Fakten) zu ermitteln. Die dabei gewonnene Funktion stellt das mathematische Modell für die betriebswirtschaftlichen Zusammenhänge dar. Auf dieser Basis sind Analysen und Prognosen möglich. Im allgemeinen Fall handelt es sich um eine multidimensionale Abbildung. Mehrere Variablen x1, x2,...,xn (Dimensionsvektor) bestimmen mehrere Fakten y1, y2,...,ym (Bildvektor). Zur Verbesserung der Übersichtlichkeit kann der Bildvektor in seine Vektorelemente zerlegt werden. Wir erhalten dann m n-dimensionale Abbildungen mit eindimensionalem Bildraum. Dieser Kunstgriff erleichtert es, den Zusammenhang zwischen den Dimensionen und einem Fakt zu erkennen. Für die gleichzeitige Analyse mehrerer Fakten (z.b. Clusteranalyse) ist diese Darstellung ungeeignet. Häufig werden alle Dimensionen bis auf eine fixiert um die Auswirkung einer Dimension auf die Fakten zu studieren. Eine solche Abbildung lässt sich als Tabelle oder Kurvenschar einer Variablen darstellen. x 1 (y 1,y 2,..., y m ) y 1 y 2 y n x 1 (c), F. Laux, Wirtschaftsinformatik 11

12 2.3 Präsentation Liste Graphik Pivottabelle 12 /58 die menschliche Vorstellungskraft ist auf 3 räumliche Dimensionen begrenzt Um die Zusammenhänge zwischen Dimensionen und Fakten zu veranschaulichen, benötigen AIS eine Visualisierungskomponente. Die einfachste und meist auch unübersichtlichste Präsentationsform ist eine Liste mit den alphanumerisch dargestellten Werten. Dies entspricht einer eindimensionalen Abbildung in einen m-dimensionalen Raum (Tabelle). Dabei wird die unabhängige Variable vertikal (fortlaufend) dargestellt. Die Faktenwerte erscheinen in den Spalten. Eine Pivottabelle stellt eine 2-dimensionale Funktion in einen eindimensionalen Raum dar. Die Dimensionen verlaufen horizontal und vertikal, das Faktum wird als alphanumerischer Wert in die Kreuzungspunkte der Matrix eingetragen. Graphiken können in einer Ebene 3 räumliche Dimensionen darstellen und durch weitere Gestaltungsmittel (Farbe, Piktogramme, etc.) weitere Dimensionen oder Fakten visualisieren. Die Vorstellungskraft wird dabei umso mehr strapaziert, je mehr Dimensionen gleichzeitig dargestellt werden. Darüber hinaus können die Abhängigkeiten auf verschiedenen Hierarchieebenen (z.b. Aggregationen) untersucht werden. Dazu muss der Benutzer in den Dimensionen navigieren (siehe nächste Seite). Durch Fixieren von Dimensionen bzw. Ausblenden von Fakten, wird die Verständlichkeit verbessert, aber gleichzeitig der Zusammenhang verschleiert. ÜA6: Stellen Sie folgende zweidimensionale Funktion als Liste dar: (Umsatz_Produkt_A, SUM(alle_Varianten_des_Produkts_A) = f(kunde, Zeitraum_JJJJMM). Verwenden Sie als Basis die Tabelle Umsatzfakten (Produkt, Datum, Variante, Kunde, Preis). Erstellen Sie ein SQL-Skript, welches die geforderte Liste erzeugt. (c), F. Laux, Wirtschaftsinformatik 12

13 2.4 Navigation hierarchisch Kfz Pkw Nutzfz C220 A180 dimensions-übergreifend Prod. A 180 C 220 E /58 deklarativ Select * from cube where year = 1999 and product = A 180 ; Für die interaktive Analyse mehrdimensionaler Daten ist eine geeignete Navigation (zielgerichtete Bewegung innerhalb der Daten) notwendig. Die Bewegung erfolgt in natürlicher Weise innerhalb einer Dimension entlang von Dimensionshierarchien (roll up, drill down). Von einer Dimension kann in eine andere gewechselt werden, um die Fakten bezüglich dieser zu studieren. Durch Austauschen (pivotieren) von Dimensionen kann der Blickwinkel geändert und dadurch die Übersichtlichkeit von Zusammenhängen verbessert werden. Durch diese Art der Ansteuerung innerhalb der Fakten können unerwartete Zusammenhänge und Ergebnisse entdeckt werden. Wird mindestens eine Dimension festgehalten (fixiert), so spricht man von Slicing. Dadurch wird die Anzahl der darzustellenden Dimensionen und die Komplexität der Analyse reduziert. x z Slice bei dem Dim. z fixiert ist Soll eine Vermutung (Hypothese) bestätigt (verifiziert) oder widerlegt (falsifiziert) werden, ist eine deklarative Auswertung vorzuziehen. Durch die deklarative Steuerung können gewünschte oder vermutete Zusammenhänge und Faktenausschnitte direkt (d.h. ohne interaktive Navigation) ermittelt werden. ÜA7: Starten Sie die Analysis-Services für den MS SQL-Server. Ermitteln Sie, wie viele Dimensionen es im Cube Sales des Foodmart Beispiels gibt? Wie viele Hierarchieebenen hat die Dimension Store? Welche Elementattribute besitzt Store? Formulieren Sie eine einfache Abfrage mit zwei Dimensionen (Store, Product). y (c), F. Laux, Wirtschaftsinformatik 13

14 3 Der Business Intelligence Prozess Data Sources Data Warehouse Cubes, Data Marts Analysis xls OLAP DBS stats ETL Data Mining WWW WWW 14 /58 Build up Product Design (Goal oriented) Time Region In diesem Kapitel wird der Weg von den operativen Datenbeständen über das Data Warehouse bis zu den Auswertungen und Präsentationen vorgestellt. Jede Phase ist sorgfältig zu planen und durchzuführen, damit man am Ende wertvolle Ergebnisse erhält. Jede Phase dieses Prozesses ist entscheidend für die Qualität der Ergebnisse, denn wenn auch nur ein Prozessschritt fehlerhaft durchgeführt wurde, ist das Ergebnis fragwürdig. Bei ungeeigneter oder falscher Wahl der Ausgangsdaten ist eine bestimmte Analyse wegen fehlender Daten überhaupt nicht möglich (z.b. ohne Absatzzahlen ist eine Absatzprognose durch Zeitreihenanalyse unmöglich. Daher müssen schon bei der Datenbeschaffung der Datenbedarf der möglichen Auswertungen berücksichtigt werden. Auf den folgenden Seiten werden die einzelnen Schritte zur Wissensentdeckung behandelt, wichtige Aufgaben für die Prozessschritte identifiziert und exemplarisch einzelne Situationen vorgestellt. Glossary of terms: Data Source := The origin of raw data ETL (Extraction, Transformation, Loading) := The process of selecting, adapting and integrating data from Data Sources into a Data Warehouse Data Warehouse := Is a subject-oriented, integrated, time-variant, nonvolatile collection of data in support of management s decision-making process (Inmon, 1996) Data Mart := A subset of a Data Warehouse, designated to specific analysis Cube, Hypercube := Metaphor for data with multivariate dependencies, i.e. a function of multiple parameters. OLAP (Online Analytical Processing) := The interactive analysis of data from a Cube. Data Mining := The mostly automatic and hypothesis-free analysis of large data collections that discovers business relevant information not previously known (narrow definition). Any kind of algorithm that finds new information from a data collection (broad definition). (c), F. Laux, Wirtschaftsinformatik 14

15 3.1 Datenquellen Statische Quellen Zeit Geografie operative Systeme Stammdaten Bewegungsdaten Dimensionen Plandaten Zielwerte (für Umsatz, Gewinn, etc) externe Daten Volkswirtschaftl. Zahlen + Prognosen Statist. Bundesamt Fakten 15 /58 Neben den statischen Informationen wie Zeit und Geografie sind vor allem die Stammdaten eines Unternehmens Kandidaten für die Dimensionen eines DW. Die Bewegungsdaten der operativen Systeme sind die Hauptdatenquelle für die Fakten. Planzahlen und externe Daten ergänzen und rücken die operativen Zahlen ins richtige Verhältnis zueinander. Die Qualität (Korrektheit) der Daten ist für die nachfolgenden Auswertungen entscheidend, denn auch hier gilt der Ausspruch: Garbage in, garbage out! *) *) Dieser Ausspruch ist nicht als mathematische Implikation zu verstehen, sondern er soll aussagen, dass man kein gutes Ergebnis erwarten kann, wenn die Daten nicht die erforderliche Qualität und notwendige Aussagekraft besitzen. Mathematisch gesehen können aus einer falschen Voraussetzung beliebige Schlüsse gezogen werden, die mathematisch wahr sind. (c), F. Laux, Wirtschaftsinformatik 15

16 Selektieren Bereinigen 3.2 Transformation welche Daten werden benötigt? wo sind die Nutzdaten? Umrechnen haben die Fakten die gleiche Einheit, Codierung und Granularität? Harmonisieren gibt es Syn- und Homonyme? Anpassen konsistent? sind Gruppierung und Klassifikation Korrigieren sind die Daten korrekt? 16 /58 Ergänzen sind die Daten vollständig? Analytische Informationssysteme leben von der Aktualität der Daten. In regelmäßigen Abständen sind Extraktions-, Transformations- und Ladeprozesse (ETL) durchzuführen: Dazu gehören die Selektion und Extraktion der Daten (z.b. Auswahl der Systeme und Datenfelder, Einrichtung einer Zugriffserlaubnis) die Bereinigung der Daten von syntaktischen Mängeln (z.b. Elimination von Sonder- und Steuerzeichen für z.b. Stornobuchungen, Satzendemarken, etc) die Umrechnung in vergleichbare Größeneinheiten (z.b. alle Preise in, die Energie nur in kwh, alle Gewichte in kg, alle Längenangaben in m und alle Flüssigkeiten in Liter), eine einheitliche Codierung (w = weiblich, m = männlich, ø = unbekannt, n = ohne Geschlecht), und die gleiche Granularität (pro Artikel, pro Kunde, pro Tag). das Harmonisieren der betriebswirtschaftlichen Notation [Synonyme, Homonyme] (z.b. verschiedene Attributnamen für die gleiche Semantik (Artikelnummer, Materialnummer, Teilenummer; Auftrag, Kundenauftrag, interner Auftrag) die Anpassung von Gruppierungen und Klassifikationen (z.b. Zeitintervalle (Tag, Woche, Monat, Jahr), Artikelklassifikation, Berechnung von Aggregatwerten) die Korrektur fehlerhafter Daten (z.b. Plausibilitätskontrolle um Ausreißerwerte zu erkennen und zu korrigieren, aus redundanten bzw. ähnlichen Daten berechnen) das Ergänzen fehlender Werte (z.b. durch Defaultwerte (Standardwert), Fehlmarken (unbekannter Wert), geschätzter Wert, Planzahl, etc.) (c), F. Laux, Wirtschaftsinformatik 16

17 3.3 Data Warehouse Modell auswählen Architektur erstellen welches Modell wird unterstützt? wie strukturieren wir das DW? Speichertechniken optimieren Daten laden bzw. aktualisieren wie verbessern wir die Geschwindigkeit und verringern den Speicherbedarf? wie aktuell müssen die Daten sein? welche Zeit steht zur Verfügung? 17 /58 Die Wahl einer geeigneten Struktur für das Data Warehouse (DW) bestimmt seine Flexibilität hinsichtlich der Auswertemöglichkeiten. Zunächst ist ein Modell auszuwählen, das auch vom eingesetzten Datenbanksystem unterstützt wird. Die Dimensionen und ihre Attribute sind festzulegen. Die zur Verfügung stehenden Fakten sind für diese Variablen (Dimensionen) hinsichtlich ihrer Auflösung (Granularität) zu wählen. Nach der konzeptionellen Modellierung ist die Speichertechnik festzulegen und zu optimieren. Dazu gehört die Speicherorganisation für dünn besetzt Datenbestände (sparsity management). Logische Datenlücken entstehen durch bestimmte Datenkonstellationen, wenn z.b. eine gewisse Produktgruppe nur an bestimmte Kundengruppen abgesetzt wird. Enthält eine oder mehrere Dimensionen Wiederholgruppen, so lassen sich die Daten leicht zusammenfassen und nur einmal speichern. Je nach Präferenz (Speicher- bzw. Zugriffsoptimierung) kommen Direktadressierung, Hashing, Indizierung, Datenkompression, Bitmap- und Separationstechniken oder orthogonale Listen in Frage. *) Der Lade- bzw. Aktualisierungsvorgang stellt für große Datenmengen eine starke Belastung der Systemressourcen dar. Daher wird dieser Vorgang außerhalb der normalen Arbeitszeiten (z.b. am Wochenende) durchgeführt, um den operativen Betrieb möglichst wenig zu stören. *) G. Wiederhold: Datenbanken, Band 1: Dateisysteme, Oldenbourg V (c), F. Laux, Wirtschaftsinformatik 17

18 3.4 Laden großer Datenmengen 1. Selektieren,. lesen, bereinigen 2. Aufspalten, umrechnen 3. Klassifizieren, plausibilisieren, harmonisieren Präselektion 4. Schreiben Quelle DW Log Satzabweisung Satzabweisung 18 /58 Quelle: U. Knuplesch, Forum WI 2000 Das Laden des Data Warehouse (DW) erfolgt in 4 Schritten: 1. Selektieren, lesen, bereinigen und formatieren 2. Aufspalten in Datenbereiche (Tabellen, Marts) und umrechnen der Daten 3. Klassifizieren, harmonisieren, plausibilisieren (korrigieren und ergänzen) 4. Schreiben der Dimensionen und dann der Fakten. Bei großen Datenmengen ist der Ladevorgang in n parallele Datenströme aufzuteilen. Die Daten müssen eine Reihe von Filter passieren, mit denen Konsistenzprüfungen durchgeführt werden. Die Daten, welche die Konsistenzbedingungen nicht erfüllen, werden zur manuellen Nachbehandlung abgewiesen. Durch eine geeignete Verteilung singulärer Tabellen (Replizierung) kann die Performance verbessert werden. Die Präselektion aller Daten aus dem DW, die einen Bezug zu den neuen Ladedaten haben, beschleunigt die Aktualisierungsoperationen.. Beim eigentlichen Ladevorgang ist auf die gleichmäßige Ausnutzung aller Ressourcen des Rechners (CPUs, Diskprozesse, Partitionierung der Speicher,...) zu achten, um den Durchsatz zu optimieren. Dabei können unabhängige Teilschritte gleichzeitig ausgeführt werden. Schnelle Zugriffsmethoden zum Lesen und Schreiben von Daten (Load Append, blockweises Einlesen, sequential Insert,...) 1) verkürzen die Ladezeiten. 1) (c), F. Laux, Wirtschaftsinformatik 18

19 3.5 Interaktive Auswertungen (OLAP) Datenstrukturierung OLAP Hyperkubus Navigation Ein-/Ausblenden von Dimensionen (slice) Pivotieren von Dimensionen Teilkubus bilden (dice) Aggregation (roll-up)/ Detaillierung (drill down) Statistische Funktionen Zeitreihen Korrelationen 19 /58 Identifikation von Hot Spots Detailsichten Für die interaktive Analyse der Daten ist ein Online Analytical System (OLAP) notwendig. OLAP Server basieren auf dem Kubenstrukturmodell. Die Strukturierung entscheidet über die Auswertemöglichkeiten. Daher ist es i.a. notwendig, mehr als einen Kubus zu definieren, um alle gewünschten Auswertungen durchführen zu können. In Abhängigkeit von der Datenmenge erfolgt die Speicherung als ROLAP (relationale Struktur mit virtuellen Würfeln, die dynamisch durch eine Abfrage erstellt werden). MOLAP (multidimensionale Zellstruktur [Matrix], welche die Fakten aufnehmen; die Dimensionen sind hierarchisch strukturiert) oder HOLAP (die ursprünglichen Daten werden in Tabellen, die Aggregationen jedoch in einem multidimensionalen Format gespeichert). Auf die Funktionalität hat die Speichertechnik keinen Einfluss, lediglich die Leistung (Performance) wird damit bestimmt: Die ROLAP-Technik ist nicht sehr performant, sie eignet sich vor allem für große Datenbanken oder Legacy-Daten, die nur selten abgefragt werden. Durch MOLAP kann die beste Abfrageleistung erzielt werden, da dieses Speicherformat spezifisch für multidimensionale Datenabfragen konzipiert wurde. Die MOLAP-Speicherung eignet sich wegen des hohen Arbeitsspeicherbedarfs für Datenmengen (Datasets) von kleiner und mittlerer Größe. HOLAP stellt die Konnektivität mit großen Datasets in relationalen Tabellen zur Verfügung und nutzt gleichzeitig die schnellere Leistung der multidimensionalen Speicherung von aggregierten Dimensionen. Der Ressourcenbedarf ist beachtlich. Die Navigation innerhalb eines multidimensionalen Kubus erfolgt entlang der Dimensionen und ihrer Struktur. Aggregation in einer Dimension wird als Hierarchie realisiert. Die Navigationsmöglichkeiten entsprechen denen von Kap. 2.4 (Folie 13). Durch die Fixierung von Dimensionen reduzieren sich die funktionalen Abhängigkeiten und erleichtern damit die Darstellung. Die Visualisierung beim OLAP erfolgt überwiegend durch Matrizen oder 3D-Diagramme (siehe Beispiel auf der nächsten Seite). Extrema ( Hot Spots ) können farblich hervorgehoben werden. (c), F. Laux, Wirtschaftsinformatik 19

20 3.5a Beispiel (Excel 2000) 20 /58 Das obige Beispiel stellt ein dreidimensionales Balkendiagrammen für die Umsätze (unit sales) mit Kunden in Abhängigkeit von der Ausbildung, dem Geschlecht und dem jährlichen Einkommen dar. Man beachte, dass das Einkommen falsch (nach Zeichenketten) sortiert wurde und nicht nach dem Einkommensintervall. Dies ist eine Folge mangelhafter Semantik der Dimension Jahreseinkommen (Yearly Income). So erstellen Sie in Excel eine Pivot-Tabelle für einen OLAP-Kubus: Menü: Daten/PivotTable- und PivotChart-Bericht, Assistent: 1) *externe DatenQuelle *PivotTabelle, 2) Daten importieren, Datenquelle auswählen, Register: OLAP Cubes, neue Datenquelle (ok), Name: Sales, OLAP-Anbieter: MS OLE DB Provider for OLAP Services, Verbinden * Analysis Server: <rechnername> oder LOCALHOST, multidimensionale DB auswählen: Foodmart, Fertigstellen, OLAP-Cube wählen: Sales, ok Datenquelle: Sales selektieren, OK, weiter 3) In bestehendes Arbeitsblatt einfügen und fertig stellen (c), F. Laux, Wirtschaftsinformatik 20

Einführungsveranstaltung: Data Warehouse

Einführungsveranstaltung: Data Warehouse Einführungsveranstaltung: 1 Anwendungsbeispiele Berichtswesen Analyse Planung Forecasting/Prognose Darstellung/Analyse von Zeitreihen Performancevergleiche (z.b. zwischen Organisationseinheiten) Monitoring

Mehr

OLAP und Data Warehouses

OLAP und Data Warehouses OLP und Data Warehouses Überblick Monitoring & dministration Externe Quellen Operative Datenbanken Extraktion Transformation Laden Metadaten- Repository Data Warehouse OLP-Server nalyse Query/Reporting

Mehr

Einführung in OLAP und Business Analysis. Gunther Popp dc soft GmbH

Einführung in OLAP und Business Analysis. Gunther Popp dc soft GmbH Einführung in OLAP und Business Analysis Gunther Popp dc soft GmbH Überblick Wozu Business Analysis mit OLAP? OLAP Grundlagen Endlich... Technischer Background Microsoft SQL 7 & OLAP Services Folie 2 -

Mehr

MIS by Franziska Täschler, Winformation GmbH ftaeschler@winformation-gmbh.ch Ausgabe 01/2001

MIS by Franziska Täschler, Winformation GmbH ftaeschler@winformation-gmbh.ch Ausgabe 01/2001 MIS Glossar by Franziska Täschler, Winformation GmbH ftaeschler@winformation-gmbh.ch Ausgabe 01/2001 Aggregat Data Cube Data Marts Data Mining Data Warehouse (DWH) Daten Decision Support Systeme (DSS)

Mehr

Komponenten und Architekturen von Analytischen Informationssystemen (AIS)

Komponenten und Architekturen von Analytischen Informationssystemen (AIS) Komponenten und Architekturen von Analytischen Informationssystemen (AIS) Melanie Pfoh Konsultation 27. Juni 2013 Hinweis Diese Folien ersetzen keinesfalls den Übungsstoff des zugehörigen e-learning-kurses.

Mehr

The integration of business intelligence and knowledge management

The integration of business intelligence and knowledge management The integration of business intelligence and knowledge management Seminar: Business Intelligence Ketevan Karbelashvili Master IE, 3. Semester Universität Konstanz Inhalt Knowledge Management Business intelligence

Mehr

Seminar Business Intelligence Teil II. Data Mining & Knowledge Discovery

Seminar Business Intelligence Teil II. Data Mining & Knowledge Discovery Seminar Business Intelligence Teil II Data Mining & Knowledge Discovery Was ist Data Mining? Sabine Queckbörner Was ist Data Mining? Data Mining Was ist Data Mining? Nach welchen Mustern wird gesucht?

Mehr

Business Intelligence Data Warehouse. Jan Weinschenker

Business Intelligence Data Warehouse. Jan Weinschenker Business Intelligence Data Warehouse Jan Weinschenker 28.06.2005 Inhaltsverzeichnis Einleitung eines Data Warehouse Data Warehouse im Zusammenfassung Fragen 3 Einleitung Definition: Data Warehouse A data

Mehr

Data Warehouse Definition (1) http://de.wikipedia.org/wiki/data-warehouse

Data Warehouse Definition (1) http://de.wikipedia.org/wiki/data-warehouse Data Warehouse Definition (1) http://de.wikipedia.org/wiki/data-warehouse Ein Data-Warehouse bzw. Datenlager ist eine zentrale Datensammlung (meist eine Datenbank), deren Inhalt sich aus Daten unterschiedlicher

Mehr

Umsetzung der Anforderungen - analytisch

Umsetzung der Anforderungen - analytisch Umsetzung der Anforderungen - analytisch Titel des Lernmoduls: Umsetzung der Anforderungen - analytisch Themengebiet: New Economy Gliederungspunkt im Curriculum: 4.2.5.5 Zum Inhalt: In diesem Modul wird

Mehr

Data Mining mit Microsoft SQL-Server 2005/2008

Data Mining mit Microsoft SQL-Server 2005/2008 Data Mining mit Microsoft SQL-Server 2005/2008 Marcel Winkel Hochschule für Technik, Wirtschaft und Kultur Leipzig Fachbereich Informatik, Mathematik und Naturwissenschaften 19. Mai 2010 1 2 Klassifikationsalgorithmen

Mehr

Data Warehouse und Data Mining

Data Warehouse und Data Mining Data Warehouse und Data Mining Marktführende Produkte im Vergleich von Dr. Heiko Schinzer, Carsten Bange und Holger Mertens 2., völlig überarbeitete und erweiterte Auflage -. - Verlag Franz Vahlen München

Mehr

Themenblock: Erstellung eines Cube

Themenblock: Erstellung eines Cube Themenblock: Erstellung eines Cube Praktikum: Data Warehousing und Data Mining Einführung relationale Datenbanken Problem Verwaltung großer Mengen von Daten Idee Speicherung der Daten in Form von Tabellen

Mehr

Business Intelligence. Data Warehouse / Analyse Sven Elvers 2005-07-06

Business Intelligence. Data Warehouse / Analyse Sven Elvers 2005-07-06 Business Intelligence Data Warehouse / Analyse Sven Elvers 2005-07-06 Einleitung Dieses Dokument beschreibt einen für das Verständnis relevanten Teil der Präsentation. Business Intelligence Motivation

Mehr

Data Warehouse Grundlagen

Data Warehouse Grundlagen Seminarunterlage Version: 2.10 Version 2.10 vom 24. Juli 2015 Dieses Dokument wird durch die veröffentlicht.. Alle Rechte vorbehalten. Alle Produkt- und Dienstleistungs-Bezeichnungen sind Warenzeichen

Mehr

Data Mining-Modelle und -Algorithmen

Data Mining-Modelle und -Algorithmen Data Mining-Modelle und -Algorithmen Data Mining-Modelle und -Algorithmen Data Mining ist ein Prozess, bei dem mehrere Komponenten i n- teragieren. Sie greifen auf Datenquellen, um diese zum Training,

Mehr

Christian Kurze BI-Praktikum IBM WS 2008/09

Christian Kurze BI-Praktikum IBM WS 2008/09 Einführung in die multidimensionale Datenmodellierung e mit ADAPT BI-Praktikum IBM WS 2008/09 1 Gliederung Einführung multidimensionale Datenmodellierung 1. Multidimensionales Modell BI-Praktikum IBM WS

Mehr

Vergleich von Open-Source und kommerziellen Programmen zur Durchführung eines ETL-Prozesses

Vergleich von Open-Source und kommerziellen Programmen zur Durchführung eines ETL-Prozesses Vergleich von Open-Source und kommerziellen Programmen zur Durchführung eines ETL-Prozesses Exposé zur Diplomarbeit Humboldt-Universität zu Berlin Mathematisch-Naturwissenschaftliche Fakultät II Institut

Mehr

Mit Transbase Hypercube Data Warehouse Anwendungen effizient betreiben. Die Hypercube-Technologie

Mit Transbase Hypercube Data Warehouse Anwendungen effizient betreiben. Die Hypercube-Technologie Mit Transbase Hypercube Data Warehouse Anwendungen effizient betreiben Transbase Hypercube ist eine Transbase -Option, die die innovative Hypercube-Technologie für komplexe analytische Anwendungen (OLAP)

Mehr

Logische Modellierung von Data Warehouses

Logische Modellierung von Data Warehouses Logische Modellierung von Data Warehouses Vertiefungsarbeit von Karin Schäuble Gliederung. Einführung. Abgrenzung und Grundlagen. Anforderungen. Logische Modellierung. Methoden.. Star Schema.. Galaxy-Schema..

Mehr

Data Mining und Knowledge Discovery in Databases

Data Mining und Knowledge Discovery in Databases Data Mining und Knowledge Discovery in Databases Begriffsabgrenzungen... Phasen der KDD...3 3 Datenvorverarbeitung...4 3. Datenproblematik...4 3. Möglichkeiten der Datenvorverarbeitung...4 4 Data Mining

Mehr

Kapitel 2 Terminologie und Definition

Kapitel 2 Terminologie und Definition Kapitel 2 Terminologie und Definition In zahlreichen Publikationen und Fachzeitschriften tauchen die Begriffe Data Warehouse, Data Warehousing, Data-Warehouse-System, Metadaten, Dimension, multidimensionale

Mehr

SQL PASS Treffen RG KA. Überblick Microsoft Power BI Tools. Stefan Kirner Karlsruhe, 27.05.2014

SQL PASS Treffen RG KA. Überblick Microsoft Power BI Tools. Stefan Kirner Karlsruhe, 27.05.2014 SQL PASS Treffen RG KA Überblick Microsoft Power BI Tools Stefan Kirner Karlsruhe, 27.05.2014 Agenda Die wichtigsten Neuerungen in SQL 2012 und Power BI http://office.microsoft.com/en-us/office365-sharepoint-online-enterprise-help/power-bi-for-office-365-overview-andlearning-ha104103581.aspx

Mehr

Business Intelligence. Business Intelligence Seminar, WS 2007/08

Business Intelligence. Business Intelligence Seminar, WS 2007/08 Business Intelligence Seminar, WS 2007/08 Prof. Dr. Knut Hinkelmann Fachhochschule Nordwestschweiz knut.hinkelmann@fhnw.ch Business Intelligence Entscheidungsorientierte Sammlung, Aufbereitung und Darstellung

Mehr

1 Einleitung. Betriebswirtschaftlich administrative Systeme

1 Einleitung. Betriebswirtschaftlich administrative Systeme 1 1 Einleitung Data Warehousing hat sich in den letzten Jahren zu einem der zentralen Themen der Informationstechnologie entwickelt. Es wird als strategisches Werkzeug zur Bereitstellung von Informationen

Mehr

Star-Schema-Modellierung mit ERwin - eine kritische Reflexion der Leistungspotentiale und Anwendungsmöglichkeiten

Star-Schema-Modellierung mit ERwin - eine kritische Reflexion der Leistungspotentiale und Anwendungsmöglichkeiten Star-Schema-Modellierung mit ERwin - eine kritische Reflexion der Leistungspotentiale und Anwendungsmöglichkeiten Michael Hahne T&I GmbH Workshop MSS-2000 Bochum, 24. März 2000 Folie 1 Worum es geht...

Mehr

Analyse alt- und mittelpaläolithischer Steinartefaktinventare mittels Parallelkoordinatenplots

Analyse alt- und mittelpaläolithischer Steinartefaktinventare mittels Parallelkoordinatenplots Einleitung Analyse alt- und mittelpaläolithischer Steinartefaktinventare mittels Parallelkoordinatenplots von Irmela Herzog Im Rahmen der Herbsttagung der AG DANK (Datenanalyse und Numerische Klassifikation)

Mehr

Komponenten und Architekturen von Analytischen Informationssystemen (AIS)

Komponenten und Architekturen von Analytischen Informationssystemen (AIS) Komponenten und Architekturen von Analytischen Informationssystemen (AIS) Melanie Pfoh Konsultation Zusammenfassung OPAL 6. Übung Juni 2015 Agenda Hinweise zur Klausur Zusammenfassung OPAL Übungen / Kontrollfragen

Mehr

Business Intelligence und Geovisualisierung in der Gesundheitswirtschaft

Business Intelligence und Geovisualisierung in der Gesundheitswirtschaft Business Intelligence und Geovisualisierung in der Gesundheitswirtschaft Prof. Dr. Anett Mehler-Bicher Fachhochschule Mainz, Fachbereich Wirtschaft Prof. Dr. Klaus Böhm health&media GmbH 2011 health&media

Mehr

Auswertung für Warenwirtschaft/ERP, Interbase und ODBC... 2

Auswertung für Warenwirtschaft/ERP, Interbase und ODBC... 2 Cubix O.L.A.P... 2 Auswertung für Warenwirtschaft/ERP, Interbase und ODBC... 2 Datenverbindung über ODBC... 4 Datenbereitstellung über SQL... 5 Festlegung der Dimensionen... 6 Festlegung der Summen...

Mehr

BIW - Überblick. Präsentation und Discoverer Demonstration - Teil 1 - Humboldt Universität zu Berlin am 10. Juni 2004

BIW - Überblick. Präsentation und Discoverer Demonstration - Teil 1 - Humboldt Universität zu Berlin am 10. Juni 2004 BIW - Überblick Präsentation und Discoverer Demonstration - Teil 1 - Humboldt Universität zu Berlin am 10. Juni 2004 Annegret Warnecke Senior Sales Consultant Oracle Deutschland GmbH Berlin Agenda Überblick

Mehr

Hinweise zur Klausur Zusammenfassung OPAL-Übungen / Kontrollfragen Fragen Vertiefung Modellierung

Hinweise zur Klausur Zusammenfassung OPAL-Übungen / Kontrollfragen Fragen Vertiefung Modellierung Komponenten und Architekturen von Analytischen Informationssystemen (AIS) Melanie Pfoh Konsultation Zusammenfassung OPAL 24. Juni 2014 Agenda Hinweise zur Klausur Zusammenfassung OPAL-Übungen / Kontrollfragen

Mehr

Vorwort zur zweiten Auflage...V. Vorwort zur ersten Auflage... VIII

Vorwort zur zweiten Auflage...V. Vorwort zur ersten Auflage... VIII Vorwort zur zweiten Auflage...V Vorwort zur ersten Auflage... VIII 1 Management Support Systeme und Business Intelligence Anwendungssysteme zur Unterstützung von Managementaufgaben...1 1.1 Computergestützte

Mehr

Data Warehouse. für den Microsoft SQL SERVER 2000/2005

Data Warehouse. für den Microsoft SQL SERVER 2000/2005 Warehouse für den Microsoft SQL SERVER 2000/2005 Begriffe 1 DWH ( Warehouse) ist eine fachübergreifende Zusammenfassung von Datentabellen. Mart ist die Gesamtheit aller Datentabellen für einen fachlich

Mehr

Data Mining mit der SEMMA Methodik. Reinhard Strüby, SAS Institute Stephanie Freese, Herlitz PBS AG

Data Mining mit der SEMMA Methodik. Reinhard Strüby, SAS Institute Stephanie Freese, Herlitz PBS AG Data Mining mit der SEMMA Methodik Reinhard Strüby, SAS Institute Stephanie Freese, Herlitz PBS AG Data Mining Data Mining: Prozeß der Selektion, Exploration und Modellierung großer Datenmengen, um Information

Mehr

Kapitel II. Datenbereitstellung 2004 AIFB / FZI 1. Vorlesung Knowledge Discovery

Kapitel II. Datenbereitstellung 2004 AIFB / FZI 1. Vorlesung Knowledge Discovery Kapitel II Datenbereitstellung 2004 AIFB / FZI 1 II. Datenbereitstellung 2004 AIFB / FZI 2 II. Datenbereitstellung Collect Initial Data identify relevant attributes identify inconsistencies between sources

Mehr

eevolution Business Intelligence Oliver Rzeniecki COMPRA GmbH Programmierer & Datenbankadministrator

eevolution Business Intelligence Oliver Rzeniecki COMPRA GmbH Programmierer & Datenbankadministrator eevolution Business Intelligence Oliver Rzeniecki COMPRA GmbH Programmierer & Datenbankadministrator Agenda Was ist Business Intelligence? Was ist OLAP? Unterschied zwischen OLAP und OLTP? Bestandteile

Mehr

Data Cube. Aggregation in SQL. Beispiel: Autoverkäufe. On-line Analytical Processing (OLAP) 1. Einführung. 2. Aggregation in SQL, GROUP BY

Data Cube. Aggregation in SQL. Beispiel: Autoverkäufe. On-line Analytical Processing (OLAP) 1. Einführung. 2. Aggregation in SQL, GROUP BY Data Cube On-line Analytical Processing (OLAP). Einführung Ziel: Auffinden interessanter Muster in großen Datenmengen 2. Aggregation in SQL, GROUP BY 3. Probleme mit GROUP BY 4. Der Cube-Operator! Formulierung

Mehr

MS SQL Server 2012 (4)

MS SQL Server 2012 (4) MS SQL Server 2012 (4) Data Mining, Analyse und multivariate Verfahren Marco Skulschus Jan Tittel Marcus Wiederstein Webseite zum Buch: http://vvwvv.comelio-medien.com/buch-kataiog/ms sql_server/ms sql

Mehr

Kapitel 6 Einführung in Data Warehouses

Kapitel 6 Einführung in Data Warehouses Kapitel 6 Einführung in Data Warehouses Skript zur Vorlesung: Datenbanksysteme II Sommersemester 2008, LMU München 2008 Dr. Peer Kröger Dieses Skript basiert zu einem Teil auf dem Skript zur Vorlesung

Mehr

Entscheidungsunterstützungssysteme

Entscheidungsunterstützungssysteme Vorlesung WS 2013/2014 Christian Schieder Professur Wirtschaftsinformatik II cschie@tu-chemnitz.eu Literatur zur Vorlesung Gluchowski, P.; Gabriel, R.; Dittmar, C.: Management Support Systeme und Business

Mehr

9 Resümee. Resümee 216

9 Resümee. Resümee 216 Resümee 216 9 Resümee In der vorliegenden Arbeit werden verschiedene Methoden der Datenreduktion auf ihre Leistungsfähigkeit im sozialwissenschaftlichstatistischen Umfeld anhand eines konkreten Anwendungsfalls

Mehr

Management Support Systeme

Management Support Systeme Folie 1 Management Support Systeme Literatur zur Vorlesung MSS Gluchowski, Peter; Gabriel, Roland; Chamoni, Peter (1997): Management Support Systeme. Computergestützte Informationssysteme für Führungskräfte

Mehr

Prognosen via Datenanalyse Predictive Analytics: Darauf müssen Unternehmen achten

Prognosen via Datenanalyse Predictive Analytics: Darauf müssen Unternehmen achten Prognosen via Datenanalyse Predictive Analytics: Darauf müssen Unternehmen achten von Jürgen Mauerer Foto: Avantum Consult AG Seite 1 von 21 Inhalt Mehrwert aufzeigen nach Analyse des Geschäftsmodells...

Mehr

2. Microsoft Innovationstag Nord Integrierte Lösungen in der Öffentlichen Verwaltung

2. Microsoft Innovationstag Nord Integrierte Lösungen in der Öffentlichen Verwaltung 2. Microsoft Innovationstag Nord Integrierte Lösungen in der Öffentlichen Verwaltung Reporting, Analyse und Data Mining André Henkel, initions AG 22. und 23. Oktober 2013 in Hamburg

Mehr

Data Warehousing. Fragen des Marketingleiters. Beispiel: : Amazon. Technisch... Amazon weltweit... Datenbank. Aufbau eines DWH OLAP <-> OLTP Datacube

Data Warehousing. Fragen des Marketingleiters. Beispiel: : Amazon. Technisch... Amazon weltweit... Datenbank. Aufbau eines DWH OLAP <-> OLTP Datacube Fragen des Marketingleiters Data Warehousing Wie viele Bestellungen haben wir jeweils im Monat vor Weihnachten, aufgeschlüsselt nach? Aufbau eines DWH OLAP OLTP Datacube Beispiel: : Amazon Technisch

Mehr

Dominik Pretzsch TU Chemnitz 2011

Dominik Pretzsch TU Chemnitz 2011 Dominik Pretzsch TU Chemnitz 2011 Wir leben im Informationszeitalter und merken es daran, dass wir uns vor Information nicht mehr retten können. Nicht der überwältigende Nutzen der Information, sondern

Mehr

Data Lineage goes Traceability - oder was Requirements Engineering von Business Intelligence lernen kann

Data Lineage goes Traceability - oder was Requirements Engineering von Business Intelligence lernen kann Data Lineage goes Traceability - oder was Requirements Engineering von Business Intelligence lernen kann Andreas Ditze MID GmbH Kressengartenstraße 10 90402 Nürnberg a.ditze@mid.de Abstract: Data Lineage

Mehr

BARC-Studie Data Warehousing und Datenintegration

BARC-Studie Data Warehousing und Datenintegration Ergebnisse der BARC-Studie Data Warehouse Plattformen Dr. Carsten Bange BARC-Studie Data Warehousing und Datenintegration Data-Warehouse -Plattformen und Datenintegrationswerkzeuge im direkten Vergleich

Mehr

Data Mining Anwendungen und Techniken

Data Mining Anwendungen und Techniken Data Mining Anwendungen und Techniken Knut Hinkelmann DFKI GmbH Entdecken von Wissen in banken Wissen Unternehmen sammeln ungeheure mengen enthalten wettbewerbsrelevantes Wissen Ziel: Entdecken dieses

Mehr

Zusammenspiel von Business Intelligence mit betrieblicher Anwendungssoftware Falk Neubert, Universität Osnabrück

Zusammenspiel von Business Intelligence mit betrieblicher Anwendungssoftware Falk Neubert, Universität Osnabrück Zusammenspiel von Business Intelligence mit betrieblicher Anwendungssoftware 14. März 2013, IHK Osnabrück-Emsland-Grafschaft Bentheim Geschichte Kassenbuch des Liederkranz, 1886 Hutmachergesangvereins

Mehr

Business Intelligence im Krankenhaus

Business Intelligence im Krankenhaus Business Intelligence im Krankenhaus Dr. Thomas Lux Holger Raphael IT-Trends in der Medizin 03.September 2008 Essen Gliederung Herausforderungen für das Management im Krankenhaus Business Intelligence

Mehr

Oracle 10g und SQL Server 2005 ein Vergleich. Thomas Wächtler 39221

Oracle 10g und SQL Server 2005 ein Vergleich. Thomas Wächtler 39221 Oracle 10g und SQL Server 2005 ein Vergleich Thomas Wächtler 39221 Inhalt 1. Einführung 2. Architektur SQL Server 2005 1. SQLOS 2. Relational Engine 3. Protocol Layer 3. Services 1. Replication 2. Reporting

Mehr

Neuerungen Analysis Services

Neuerungen Analysis Services Neuerungen Analysis Services Neuerungen Analysis Services Analysis Services ermöglicht Ihnen das Entwerfen, Erstellen und Visualisieren von Data Mining-Modellen. Diese Mining-Modelle können aus anderen

Mehr

2.8. Business Intelligence

2.8. Business Intelligence 2.8. Zulieferer BeschaffungProduktion Kunde E-Procurement Customer Relationship (CRM) Supply Chain (SCM) Enterprise Resource Planning (ERP) Executive Information (EIS) Executive Support (ESS) Chef-Informations-

Mehr

Kapitel 6 Managementunterstützungssysteme und Business Intelligence

Kapitel 6 Managementunterstützungssysteme und Business Intelligence ProKSy - EBSS Institut AIFB WS 2013/2014 Programmierung kommerzieller Systeme Einsatz betrieblicher Standardsoftware (ProKSy EBSS) Kapitel 6 Managementunterstützungssysteme und Business Intelligence Institut

Mehr

Realisierung von OLAP Operatoren in einem visuellen Analysetool. Vortrag von Alexander Spachmann und Thomas Lindemeier

Realisierung von OLAP Operatoren in einem visuellen Analysetool. Vortrag von Alexander Spachmann und Thomas Lindemeier Realisierung von OLAP Operatoren in einem visuellen Analysetool Vortrag von Alexander Spachmann und Thomas Lindemeier Gliederung Ausgangssituation/Motivation Was ist OLAP? Anwendungen Was sind Operatoren?

Mehr

Vertrautmachen mit Daten

Vertrautmachen mit Daten Kapitel III Vertrautmachen mit Daten 2004 AIFB / FZI 1 III Vertrautmachen mit Daten (see also Data Preparation ) 2004 AIFB / FZI 2 III Vertrautmachen mit Daten III.1 OLAP III.1.1 Einführung in OLAP Wie

Mehr

Methoden Quantitative Datenanalyse

Methoden Quantitative Datenanalyse Leitfaden Universität Zürich ISEK - Andreasstrasse 15 CH-8050 Zürich Telefon +41 44 635 22 11 Telefax +41 44 635 22 19 www.isek.uzh.ch 11. September 2014 Methoden Quantitative Datenanalyse Vorbereitung

Mehr

Fachbereich Informatik Praktikum 1

Fachbereich Informatik Praktikum 1 Hochschule Darmstadt DATA WAREHOUSE SS2015 Fachbereich Informatik Praktikum 1 Prof. Dr. S. Karczewski Dipl. Inf. Dipl. Math. Y. Orkunoglu Datum: 14.April.2015 1. Kurzbeschreibung In diesem Praktikum geht

Mehr

WAHLPFLICHTBEREICH WIRTSCHAFTSINFORMATIK 'DATA WAREHOUSE'

WAHLPFLICHTBEREICH WIRTSCHAFTSINFORMATIK 'DATA WAREHOUSE' Take control of your decision support WAHLPFLICHTBEREICH WIRTSCHAFTSINFORMATIK 'DATA WAREHOUSE' Sommersemester 2008 Gliederung Business Intelligence und Data Warehousing On-Line Analytical Processing Ziel

Mehr

SAP Business Intelligence

SAP Business Intelligence SAP Business Intelligence Helmut Roos Diplom-Ingenieur Unternehmensberater Grundlagen zu Netweaver 7.0 D-67067 Ludwigshafen +49 (621) 5 29 44 65 Data Acquisition Common Read / Write Interface Open Interface

Mehr

Business Intelligence Praktikum 1

Business Intelligence Praktikum 1 Hochschule Darmstadt Business Intelligence SS 2014 Fachbereich Informatik Praktikumsversuch 1 Prof. Dr. C. Wentzel Dipl. Inf. Dipl. Math. Y. Orkunoglu Datum: 07.05.2014 Business Intelligence Praktikum

Mehr

Data Warehouse Technologien

Data Warehouse Technologien mitp Professional Data Warehouse Technologien von Veit Köppen, Gunter Saake, Kai-Uwe Sattler 2. Auflage 2014 Data Warehouse Technologien Köppen / Saake / Sattler schnell und portofrei erhältlich bei beck-shop.de

Mehr

Kapitel II. Datenbereitstellung. II. Datenbereitstellung. II.1 Grundlagen. II. Datenbereitstellung. Collect Initial Data. II.

Kapitel II. Datenbereitstellung. II. Datenbereitstellung. II.1 Grundlagen. II. Datenbereitstellung. Collect Initial Data. II. II. bereitstellung Kapitel II bereitstellung 1 2 II. bereitstellung II.1 Grundlagen Collect Initial Data identify relevant attributes identify inconsistencies between sources Describe Data characterize

Mehr

ENTERBRAIN Reporting & Business Intelligence

ENTERBRAIN Reporting & Business Intelligence Überblick Vorhandene Listen/Analysen in ENTERBRAIN Die Daten in ENTERBRAIN Das Fundament des BI - Hauses Details zur ENTERBRAIN Staging Area Reports und Cubes auf Basis der Staging Area Data Mining mit

Mehr

Data Warehousing. Kapitel 1: Data-Warehousing-Architektur. Folien teilweise übernommen von Matthias Gimbel

Data Warehousing. Kapitel 1: Data-Warehousing-Architektur. Folien teilweise übernommen von Matthias Gimbel Data Warehousing Kapitel 1: Data-Warehousing-Architektur Folien teilweise übernommen von Matthias Gimbel 2 Analyse von Geschäftsprozessen Mögliche Fragestellungen Wie entwickelt sich unser Umsatz im Vergleich

Mehr

David gegen Goliath Excel 2010 in Verbindung mit Datawarehouse und im Vergleich zu Business Objects

David gegen Goliath Excel 2010 in Verbindung mit Datawarehouse und im Vergleich zu Business Objects Thema: David gegen Goliath Excel 2010 in Verbindung mit Datawarehouse und im Vergleich zu Business Objects Autor: Dipl. Wirtsch.-Inf. Torsten Kühn PRAXIS-Consultant PRAXIS EDV- Betriebswirtschaft- und

Mehr

Was ist Data Mining... in der Fundraising Praxis?

Was ist Data Mining... in der Fundraising Praxis? Was ist Data Mining...... in der Fundraising Praxis? Erkennen von unbekannten Mustern in sehr grossen Datenbanken (> 1000 GB) wenige und leistungsfähige Verfahren Automatisierung Erkennen von unbekannten

Mehr

Data Warehouse. Kapitel 17. Abbildung 17.1: Zusammenspiel zwischen OLTP und OLAP. Man unterscheidet zwei Arten von Datenbankanwendungen:

Data Warehouse. Kapitel 17. Abbildung 17.1: Zusammenspiel zwischen OLTP und OLAP. Man unterscheidet zwei Arten von Datenbankanwendungen: Kapitel 17 Data Warehouse OLTP Online Transaction Processing OLAP Online Analytical Processing Decision Support-Anfragen Data Mining opera- tionale DB opera- tionale DB opera- tionale DB Data Warehouse

Mehr

Datenbanktechnologie für Data-Warehouse-Systeme

Datenbanktechnologie für Data-Warehouse-Systeme Wolfgang Lehner Datenbanktechnologie für Data-Warehouse-Systeme Konzepte und Methoden dpunkt.verlag 1 1.1 1.2 1.3 1.4 1. 5 2 2.1 2.2 2.3 Einleitung 1 Betriebswirtschaftlicher Ursprung des Data Warehousing...

Mehr

Data Mining (ehem. Entscheidungsunterstützungssysteme)

Data Mining (ehem. Entscheidungsunterstützungssysteme) Data Mining (ehem. Entscheidungsunterstützungssysteme) Melanie Pfoh Anja Tetzner Christian Schieder Übung WS 2014/15 AGENDA TEIL 1 Aufgabe 1 (Wiederholung OPAL / Vorlesungsinhalte) ENTSCHEIDUNG UND ENTSCHEIDUNGSTHEORIE

Mehr

Visual KPI: Echtzeitdaten & -information zu jeder Zeit, an jedem Ort! Dietmar Ort Sales MEGLA GmbH

Visual KPI: Echtzeitdaten & -information zu jeder Zeit, an jedem Ort! Dietmar Ort Sales MEGLA GmbH Visual KPI: Echtzeitdaten & -information zu jeder Zeit, an jedem Ort! Dietmar Ort Sales MEGLA GmbH Visual KPI Die individuelle KPI Software Einfach bereitzustellende Daten aus PI, AF, Microsoft SQL Server,

Mehr

Business Intelligence

Business Intelligence Business Intelligence Anwendungssysteme (BIAS) Lösung Aufgabe 1 Übung WS 2012/13 Business Intelligence Erläutern Sie den Begriff Business Intelligence. Gehen Sie bei der Definition von Business Intelligence

Mehr

Multidimensionales Datenmodell, Cognos

Multidimensionales Datenmodell, Cognos Data Warehousing (II): Multidimensionales Datenmodell, Cognos Praktikum: Data Warehousing und Mining Praktikum Data Warehousing und Mining, Sommersemester 2010 Vereinfachte Sicht auf die Referenzarchitektur

Mehr

Solution for Business Intelligence. MID Insight 2013

Solution for Business Intelligence. MID Insight 2013 Solution for Business Intelligence MID Insight 2013 A G E N D A 1. Solution für Business Intelligence (BI) 2. Die Gründe und Hintergründe 3. Die Methode 4. Vorteile MID GmbH 2013 2 Solution für Business

Mehr

Data Warehousing: Anwendungsbeispiel

Data Warehousing: Anwendungsbeispiel Frühjahrsemester 2012 cs242 Data Warehousing / cs243 Datenbanken Kapitel 1: Einführung H. Schuldt Data Warehousing: Anwendungsbeispiel Tresgros Tresgros Tresgros Filiale Muttenz Filiale Allschwil Filiale

Mehr

Agile Analytics Neue Anforderungen an die Systemarchitektur

Agile Analytics Neue Anforderungen an die Systemarchitektur www.immobilienscout24.de Agile Analytics Neue Anforderungen an die Systemarchitektur Kassel 20.03.2013 Thorsten Becker & Bianca Stolz ImmobilienScout24 Teil einer starken Gruppe Scout24 ist der führende

Mehr

Verschiedene Arten des Datenbankeinsatzes

Verschiedene Arten des Datenbankeinsatzes 1 Beispiele kommerzieller DBMS: Kapitelinhalt Was charakterisiert und unterscheidet verschiedene Einsatzbereiche für. Welche prinzipiell unterschiedlichen Anforderungen ergeben sich für das DBMS bei Ein-

Mehr

bersicht Datenbanken und Datawarehouses Datenbank Datenbanksysteme Niels Schršter

bersicht Datenbanken und Datawarehouses Datenbank Datenbanksysteme Niels Schršter bersicht Niels Schršter EinfŸhrung GROUP BY Roll UpÔs Kreuztabellen Cubes Datenbank Ansammlung von Tabellen, die einen ãausschnitt der WeltÒ fÿr eine Benutzergruppe beschreiben. Sie beschreiben die funktionalen

Mehr

Menschen entscheiden über Geschäftserfolg

Menschen entscheiden über Geschäftserfolg 1C01 Die Microsoft Business Intelligence- Plattform: SQL Server 2005, das 2007 Office System und Office Business Applications Steffen Krause Technologieberater Microsoft Deutschland GmbH http://blogs.technet.com/steffenk

Mehr

Fundamentals of Software Engineering 1

Fundamentals of Software Engineering 1 Folie a: Name Fundamentals of Software Engineering 1 Grundlagen der Programmentwurfstechnik 1 Sommersemester 2012 Dr.-Ing. Stefan Werner Fakultät für Ingenieurwissenschaften Folie 1 Inhaltsverzeichnis

Mehr

eevolution Business Intelligence

eevolution Business Intelligence eevolution Business Intelligence Haben Sie sich schon häufig gefragt, warum Ihr Berichtswesen so kompliziert sein muss? Warum Sie nicht einfach mit wenigen Handgriffen Ihr Berichtswesen einrichten und

Mehr

Aufbau eines Data Warehouse für den Lebensmitteleinzelhandel

Aufbau eines Data Warehouse für den Lebensmitteleinzelhandel Die Fallstudie aus der Wirtschaftsinformatik: Aufbau eines Data Warehouse für den Lebensmitteleinzelhandel Dipl.-Kfm. Carsten Bange, Dr. Heiko Schinzer, Würzburg 1. Ausgangssituation Der hohe Wettbewerbsdruck

Mehr

Data Warehouses und Moderne Betriebliche Anwendungen von Datenbanksystemen

Data Warehouses und Moderne Betriebliche Anwendungen von Datenbanksystemen Data Warehouses und Moderne Betriebliche Anwendungen von Datenbanksystemen (Folien von A. Kemper zum Buch 'Datenbanksysteme') Online Transaction Processing Betriebswirtschaftliche Standard- Software (SAP

Mehr

Data Warehousing. Sommersemester 2005. Ulf Leser Wissensmanagement in der Bioinformatik

Data Warehousing. Sommersemester 2005. Ulf Leser Wissensmanagement in der Bioinformatik Data Warehousing Sommersemester 2005 Ulf Leser Wissensmanagement in der Bioinformatik ... Der typische Walmart Kaufagent verwendet täglich mächtige Data Mining Werkzeuge, um die Daten der 300 Terabyte

Mehr

Motivation. Themenblock: Data Preprocessing. Einsatzgebiete für Data Mining I. Modell von Gianotti und Pedreschi

Motivation. Themenblock: Data Preprocessing. Einsatzgebiete für Data Mining I. Modell von Gianotti und Pedreschi Motivation Themenblock: Data Preprocessing We are drowning in information, but starving for knowledge! (John Naisbett) Was genau ist Datenanalyse? Praktikum: Data Warehousing und Data Mining Was ist Data

Mehr

MultiProvider. Logische Reporting- Schicht. Abb. 9 21 Einsatz von MultiProvidern als logische Reporting- Schicht

MultiProvider. Logische Reporting- Schicht. Abb. 9 21 Einsatz von MultiProvidern als logische Reporting- Schicht MultiProvider 243 MultiProvider MultiProvider sind virtuelle InfoProvider ohne eigene Datenhaltung, deren Hauptaufgabe die Grundlage für die Datenanalyse und -planung ist. Dabei nimmt der MultiProvider

Mehr

Das Knowledge Grid. Eine Architektur für verteiltes Data Mining

Das Knowledge Grid. Eine Architektur für verteiltes Data Mining Das Knowledge Grid Eine Architektur für verteiltes Data Mining 1 Gliederung 1. Motivation 2. KDD und PDKD Systeme 3. Knowledge Grid Services 4. TeraGrid Projekt 5. Das Semantic Web 2 Motivation Rapide

Mehr

Matrikelnr: Name: Vorname: Aufgabe 1 2 3 4 Summe Maximal erreichbare 20 30 30 20 100 Punktzahl Erreichte Punktzahl. Note:

Matrikelnr: Name: Vorname: Aufgabe 1 2 3 4 Summe Maximal erreichbare 20 30 30 20 100 Punktzahl Erreichte Punktzahl. Note: Fakultät für Wirtschaftswissenschaft Matrikelnr: Name: Vorname: : Modul 32711 Business Intelligence Termin: 28.03.2014, 9:00 11:00 Uhr Prüfer: Univ.-Prof. Dr. U. Baumöl Aufbau und Bewertung der Aufgabe

Mehr

Die Microsoft-Komplettlösung für Datawarehousing, Big Data und Business Intelligence im Überblick. Volker.Hinz@microsoft.com

Die Microsoft-Komplettlösung für Datawarehousing, Big Data und Business Intelligence im Überblick. Volker.Hinz@microsoft.com Die Microsoft-Komplettlösung für Datawarehousing, Big Data und Business Intelligence im Überblick Volker.Hinz@microsoft.com Was sagt der Markt? Fakten Meinung der Analysten zu Microsofts Angeboten Nutzen

Mehr

ISTEC.MIP Messdaten-Integrations-Plattform

ISTEC.MIP Messdaten-Integrations-Plattform ISTEC.MIP Messdaten-Integrations-Plattform Dr.-Ing. Carsten Folie 1 ISTEC Firmenprofil unabhängiges Software- und Systemhaus seit 1982 erfolgreich am Markt ca. 60 festangestellte Mitarbeiter (Informatiker,

Mehr

Visual Business Intelligence Eine Forschungsperspektive

Visual Business Intelligence Eine Forschungsperspektive Visual Business Intelligence Eine Forschungsperspektive Dr. Jörn Kohlhammer Fraunhofer-Institut für Graphische Datenverarbeitung IGD Fraunhoferstraße 5 64283 Darmstadt Tel.: +49 6151 155 646 Fax.: +49

Mehr

SAP BW + Microsoft Excel Viel genutzt, oft unterschätzt

SAP BW + Microsoft Excel Viel genutzt, oft unterschätzt Corporate Performance Management SAP BW + Microsoft Excel Viel genutzt, oft unterschätzt Martin Krejci, Manager CPM Matthias Schmidt, BI Consultant Kristian Rümmelin, Senior BI Consultant Braincourt GmbH

Mehr

1 Einführung. Unbekannte Begriffe: Business Intelligence, Knowledge Management, Unternehmensportale, Information Warehouse.

1 Einführung. Unbekannte Begriffe: Business Intelligence, Knowledge Management, Unternehmensportale, Information Warehouse. 1 Einführung mysap Business Intelligence stellt mit Hilfe von Knowledge Management die Verbindung zwischen denen, die etwas wissen und denen, die etwas wissen müssen her. mysap Business Intelligence integriert

Mehr

Fachgruppe Statistik, Risikoanalyse & Computing. STAT672 Data Mining. Sommersemester 2007. Prof. Dr. R. D. Reiß

Fachgruppe Statistik, Risikoanalyse & Computing. STAT672 Data Mining. Sommersemester 2007. Prof. Dr. R. D. Reiß Fachgruppe Statistik, Risikoanalyse & Computing STAT672 Data Mining Sommersemester 2007 Prof. Dr. R. D. Reiß Überblick Data Mining Begrifflichkeit Unter Data Mining versteht man die Computergestützte Suche

Mehr

Informationssysteme für das Management

Informationssysteme für das Management FHBB l Departement Wirtschaft l Informationssysteme für das Management Michael Pülz, Hanspeter Knechtli Lernziele Den Unterschied zwischen operativen und analytischen Informationssystemen beschreiben können

Mehr

Steuerungsverfahren und ihre Datenstrukturen 02 - Datenmanagement

Steuerungsverfahren und ihre Datenstrukturen 02 - Datenmanagement Steuerungsverfahren und ihre Datenstrukturen 02 - Datenmanagement 1 Übersicht - Datenmanagement 1 Übersicht - Datenmanagement...1 2 Übersicht: Datenbanken - Datawarehouse...2 3 Übersicht: Data Mining...11

Mehr

Agenda. Themenblock: Data Warehousing (I) Referenzarchitektur. Eigenschaften eines Data Warehouse. Einführung Data Warehouse Data Access mit SQL

Agenda. Themenblock: Data Warehousing (I) Referenzarchitektur. Eigenschaften eines Data Warehouse. Einführung Data Warehouse Data Access mit SQL Themenblock: Data Warehousing (I) Praktikum: Data Warehousing und Data Mining 2 Eigenschaften eines Data Warehouse Referenzarchitektur Integrierte Sicht auf beliebige Daten aus verschieden Datenbanken

Mehr