André Maurer Wirtschaftsinformatik FH 2.5 Fachhochschule Solothurn, Olten

Größe: px
Ab Seite anzeigen:

Download "02.08.2002 André Maurer andre@maurer.name www.andre.maurer.name Wirtschaftsinformatik FH 2.5 Fachhochschule Solothurn, Olten"

Transkript

1 Data Warehousing und Data Mining Zusammenfassung André Maurer www. Wirtschaftsinformatik FH 2.5 Fachhochschule Solothurn, Olten

2 Inhaltsverzeichnis Inhaltsverzeichnis 1 Einführung Entscheidungen Datengrundlage eines EUS Interne Analyse Externe Analyse Herkunft der Daten für EUS / FIS Data Warehouse vs operative Systeme Gründe für die Trennung von DaWa und operativen Systemen: Data Mining Arten von Data Mining Problemen Methoden des Data Mining Prozessschritte der Wissensentdeckung Business Inteligence 7 2 Data Warehousing Probleme beim Data Warehouse Inhalt eines Data Warehouse Architektur Zentralisierte Architektur Data Marts Modularisierung: Enterprise Data Mart Enterprise Data Warehouse (EDaWa) Entwicklung von DM und DW Ladeprozess Datentransformation Logische Transformation Physische Transformation Analyseprozesse in Data Warehouses Standardberichte und anfragen Anfragen an Übersichtstabellen, OLAP Data Mining auf Detail-Daten Schnittstellen zu anderen Anwendungen Zugriffe auf operative und analytische Daten Modellierung von Data Warehouses Objekte eines analytischen Datenmodells Modellierungsebenen 22 zf_dw_dm.doc Seite I

3 Inhaltsverzeichnis Mehrdimensionale und Multirelationale Datenbanken Entwicklung und Betrieb von Data Warehouses Performanceprobleme 28 3 Data Mining Klassifikation (Methoden) Entscheidungsbäume Neuronale Netze K Nearest Neighbour (knn) Batch Nested Generized Exemplars (BNGE) Clusteranalyse Clustermethoden Assoziationsregeln Transaktionen und Assoziationsregeln Kennzahlen für Assoziationen Prinzip des Assoziationsregellernens Sequenzmuster Prinzip der Sequenzmuster-Erkennung Data Mining Prozess CRISP-DM Das CRISP-DM Referenzmodell Web-Mining Clickstream als Datenquelle Mögliche Dimensionen der Analyse Design der Website zur Unterstützung des Web Usage Mining Clickstream Data Mart 41 4 Literaturverzeichnis Abbildungs- / Tabellenverzeichnis zf_dw_dm.doc Seite II

4 1 Einführung Ziel von Data Warehousing und Data Mining ist es aus Unternehmensdaten entscheidungsrelevantes Wissen herleiten zu können. 1.1 Entscheidungen Eine Entscheidung ist eine rationale Wahl einer Aktion in einer gegebenen Umwelt. Ein Entscheidungsprozess ist nur rational, wenn er auf sinnvollen Kriterien und gültigen Daten basiert. Das Ergebnis einer Entscheidung ist eine Aktion oder Strategie. Entscheidungsunterstützende Systeme (EUS) helfen den Entscheidungsträgern bei der Lösung komplexer Probleme: Führungsinformationssystem (FIS) Bereitstellung der relevanten Informationen zur Vorbereitung einer Entscheidung Entscheidungsunterstützende Systeme (EUS) Zusätzlich zum FIS stehen Methoden und Modelle für Planungs-, Entscheidungs- und Kontrollprozesse zur Verfügung. Entscheidungen können in verschiedene Kategorien unterteilt werden: Reichweite Neuigkeitsgrad Strukturierungsgrad Automatisierbarkeit Informationssysteme Langfristig (strategisch) mittelfristig (taktisch) Kurzfristig (operativ) Innovativ Schlecht strukturiert Niedrig EUS, FIS (eingeschränkt) Adaptiv Semi-strukturiert Mittel EUS Routiniert Wohl-strukturiert hoch administrative / dispositive Systeme Tabelle 1: Kategorien von Entscheidungen 1.2 Datengrundlage eines EUS Ein EUS benötigt interne und Externe Daten Interne Analyse Daten die aus der Unternehmung kommen: z.b. Kapazitätsauslastung, technischer Stand, Personalentwicklung, Finanzsituation, Betriebsergebnis. Die Internen Daten können folgendes sein: Mengen (Erzeugungen, Verbrauche, Bestände, techn. Kapazitäten) Werte (Umsätze, Kosten, Betriebsergebnisse, Deckungsbeiträge) Personal (Anzahl, Einsatz, Qualifikation, Altersstruktur) Kennzahlen (Verknüpfung von Mengen-, Wert-, und Personaldaten) Gliederungszahlen (Prozentanteile) (z.b. Anteile der Entwicklungskosten an Gesamtkosten eines Produkts) Beziehungszahlen (z.b. Fr./Kopf, Materialverbrauch/Artikel) zf_dw_dm.doc Seite 1

5 Das EUS macht aus internen Daten folgende Auswertungen: Funktionsübergreifende Berechnungen (Cross Referencing) (z.b. Personalkosten pro Produkt) Zeitbezogene Auswertungen (z.b. Verkäufe pro Woche, Monat, Quartal ) Vergleichswerte über längere Zeiträume (z.b. Verkäufe jeweils im 1. Quartal der letzten 4 Jahre) Funktionsübergreifende Berechnungen über Zeiträume (z.b. Auswirkung einer Marketingkampagne auf die Verkäufe der vergangenen sechs Monate) Externe Analyse Externe Daten sind z.b. Marktentwicklung, Konjunkturverlauf, Käufereinstellung, Konkurrenzverhalten, technologische Innovation, Rohstoffpreise, politische Entscheidungen (Zinspolitik, Steuergesetzgebung ), soziologische Einflüsse Herkunft der Daten für EUS / FIS Direkter Zugriff Das EUS / FIS greift direkt auf operative Informationsquellen zu: Operative Anwendungen Operative Anwendungen Datenbankverwaltungssystem(e) Datenbanken operative Systeme EUS- Anwendungen EUS- Anwendungen Nachteile: Zu Viele Daten werden gespeichert lange Berechnungszeiten für Auswertungen Behinderung des operativen Geschäfts während Auswertungen durch das EUS Zu grosse Datenmengen Keine einheitlichen Formate Abbildung 1: Zugriff auf operative Informationsquellen Data Warehouse Zur Verhinderung der Nachteile aus dem direkten Zugriff dient ein Data Warehouse (DaWa). Ein DaWa macht eine Selektion (Auswahl) und Aggregation (Verdichtung nach Dimensionen) aller für das EUS relevanten Daten in einer eigenen Datenbank. Die Übernahme aus operativen Systemen erfolgt bei Erreichen eines stabilen Zustandes oder zyklisch (täglich, wöchentlich ) bei sich ständig ändernden Daten. Die Trennung operativer Daten von Analysedaten ist ein fundamentales Konzept eines DaWa. zf_dw_dm.doc Seite 2

6 Operative Anwendungen EUS- Anwendungen Datenbankverwaltungssystem(e) Datenbankverwaltungssystem Datenabruf aus externen Quellen Datenbanken operativer Systeme Periodische Selektion und Transformation Data Warehouse Manuelle Eingabe Abbildung 2: Daten aus dem DaWa 1.3 Data Warehouse vs operative Systeme Administrations- und Dispositionssysteme Entscheidungsunterstützende Systeme Datenbestand Operative Daten: In der Regel aktuelle Daten Oft nur für abgegrenzten Unternehmens- und Funktionsbereich Datenformate Datenbestände oft unkoordiniert gewachsen Unterschiedliche Formate Kein einheitliches Datenmodell Datenzugriff Sehr häufige Transaktionen Kurze Transaktionszeiten Tabelle 2: Anforderungen: DaWa - operative Systeme Analysedaten: Kombination von Daten mehrerer Systeme Daten über längeren Zeitraum Einheitliches Datenmodell Einheitliches Format Semantisch angepasst Langfristige aufwendige Analysen und Berechnungen Ein DaWa vereinigt Daten mehrerer operativer Systeme (z.b. mehrerer Abteilungen, Filialen, Tochtergesellschaften ). Die Formate müssen bei der Übernahme aus operativen Systemen transformiert werden. Die Semantische Integration muss vorgenommen werden (z.b. Ein Kunde wird in verschiedenen Systemen mit versch. Kd-Nr. geführt, im DaWa muss der Kunde unter einer einheitlichen Kd-Nr. geführt werden.) Daten im DaWa sind beständig Im Gegensatz zu operativen Systemen werden die Daten im DaWa nur in Ausnahmefällen geändert oder gelöscht. In operativen Systemen gibt es unbeständige Daten (z.b. Lagerbestand) Es ist nicht sinnvoll, dynamische Daten im DaWa zu verwalten Erst bei Erreichen eines stabilen Zustands Oder durch periodische Schnappschüsse bei sich ständig ändernden Daten. In operativen Systemen gibt es Transaktionen, im DaWa Analyseprozesse Transaktionen sind in operativen Systemen häufig Der Umfang an Transaktionen ist gut abschätzbar zf_dw_dm.doc Seite 3

7 Analyseprozesse sind teilweise sehr aufwendig sind betreffen grosse Datenmengen verschiedener Bereiche haben keinen von vornherein abschätzbaren Aufwand Die Analyse auf operativen Datenbanken gefährdet deren Performance Daten im DaWa werden über einen längeren Zeitraum aufbewahrt Grosse Mengen inaktiver Daten verringern die Performance. Deshalb werden Daten in operativen Systemen gelöscht bzw. archiviert. Ein DaWa benötigt Daten über einen langen Zeitraum (>5 Jahre) Die Speicherkosten im DaWa sind relativ gering. Die meisten Kosten (ca %) entstehen bei der Datenübernahme und bereinigung Gründe für die Trennung von DaWa und operativen Systemen: Unterschiedliche Performance-Anforderungen Kombination von Daten mehrerer Anwendungen Daten sind beständig Speicherung der Daten über längeren Zeitraum 1.4 Data Mining Mit Data Mining (DaMi) bedeutet die Identifikation von wettbewerbsrelevantem Wissen aus grossen Datenmengen. Vorhersagen Automatische Extraktion von Informationen zu Vorhersage von Trends und Verhalten z.b. Marketing auf Basis kundenindividueller Informationen, Lebensversicherung, Kreditbeurteilung Mustererkennung Automatische Erkennung vorher unbekannter Muster z.b. Typisches Kundenverhalten, Betrugserkennung Data Mining ist jedoch nicht Data Warehousing Ad hoc Anfragen / Reportgenerierung Online Analytic Processing (OLAP siehe 2.5.5) (das die Frage WAS passiert beantwortet) Datenvisualisierung Software Agenten Data Mining dient der Vereinfachung und Automatisierung statischer Prozesse (Datenanalyse, Anwendung der Modelle). Mittels DaMi können nicht bekannte Zusammenhänge erkannt werden. Data Mining sagt, WARUM Dinge passiert sind. zf_dw_dm.doc Seite 4

8 1.4.1 Arten von Data Mining Problemen Klassifikation Clustering Lernen einer Menge von Regeln, die Objekte aufgrund ihrer Attribute vorgegebenen Klassen zuordnen. Aufteilung einer Datenmenge in disjunkte Gruppen (Gruppen ohne gemeinsame Teilmenge) ähnlicher Objekte: Anders als bei der Klassifikation sind keine Klassen vorgegeben Ähnliche Datensätze bilden eine Klasse Möglichst grosse Ähnlichkeit mit anderen Objekten der Klasse Möglichst geringe Ähnlichkeit mit Objekten ausserhalb der Klasse. x x x x x x x x x x x x x x x x x x x x x x x x x x x x x xx x x x x x x x x xx xx x x x x x x x x x x x x x x x x x x x x x x x xx x x xx x x x x x x x x x x x x x x x Abbildung 3: Clustering Regression (Vorhersage) Lernen der Beziehungen einer Zielvariable von Ausgangsvariablen. Daten Januar 2001 Historische Daten ( ) Data Mining System Modell Vorhersage Februar 2001 Abbildung 4: Entstehung und Nutzung von Vorhersagemodellen Assoziationen (Warenkorbanalyse) Abweichungs- und Änderungsentdeckung Zeitreihenanalyse Lernen von Abhängigkeiten zwischen Daten, z.b. welche Gruppen von Werten kommen in Transaktionen gemeinsam vor. Entdecken von Unterschieden zu früher aufgezeichneten Daten oder vorgegebenen normativen Werten. Lernen von Regeln für typische Abläufe zur Prognose zeitlicher Veränderungen. zf_dw_dm.doc Seite 5

9 1.4.2 Methoden des Data Mining Entscheidungsbäume Grafische Darstellung einer Menge von Regeln für ein Klassifikationsproblem: Knoten = Entscheidungen Blätter = Klassen Neuronale Netze Regelinduktion 1 IF... THEN... Nearest Neighbor Genetsiche Algorithmen Die Verschiedenen Methoden / Modelle unterscheiden sich bezüglich ihrer Verständlichkeit Genauigkeit Entscheidungsbäume Einfach verständlich Weniger genau Regelinduktion Mittel verständlich Mittel genau Neuronale Netze Schwer verständlich Sehr genau Tabelle 3: Verständlichkeit, Genauigkeit der MiMa-Methoden Ein Modell kann verschieden genutzt werden: Qualitativ Gibt dem Marketing ein Verständnis über die Kunden und den Markt Erfordert Interaktionsmöglichkeiten und gute Visualisierung Quantitativ Automatisierter Prozess Es gibt verschiedene Typen von Datenanalyse: Beaufsichtigt (Supervised): Problemlösung Getrieben durch konkrete Probleme Analytiker gibt Untersuchungsrichtung vor Anwendung z.b. zur Optimierung eines gegebenen Marktes Unbeaufsichtigt (Unsupervised): Erkundigung Relevanz erkennen Nützlich um neue (unerwartete) Zusammenhänge zu erkunden 1 Induzieren: Ableiten, folgern, schliessen, herleiten zf_dw_dm.doc Seite 6

10 1.4.3 Prozessschritte der Wissensentdeckung periodischer Update Auswahl Vorverarbeitung Zieldaten Transformation Data Warehouse Data Mining Transformierte Daten Interpretation/ Evaluation Muster Wissen Daten Abbildung 5: Zusammenhang DaWa und DaMi Auswahl Fokussierung, Auswahl relevanter Daten Vorverarbeitung Bereinigung der Daten (z.b. was tun mit leeren Feldern) Transformation Verdichtung der Daten durch Datenreduktion und projektion Datenformat vereinheitlichen Data Mining Auswahl von Techniken und Methoden Evtl. viele Testläufe mit verschiedenen Parametern Interpretation / Evaluierung Beurteilung der Ergebnisse bzgl. festgelegter Kriterien Dokumentation, Visualisierung der Ergebnisse Überführung in die Anwendung 1.5 Business Inteligence Data Mining und Data Warehousing bietet Beispielsweise folgende Anwendungen: Customer Relationship Management Kundenprofile erstellen Zusätzliche Kundenkontaktpunkte (z.b. Call Center, ebusiness) Efficient Consumer Response Optimierung von Logistikprozessen / Regal- und Lagerflächen Marketing Database Marketing (Zielgruppenorientierte Aktionen) Typisches Kundenverhalten Cross Selling Bearbeitung von Geschäftsprozessen Klassifikationskriterien für Bonitätsbeurteilung Risikoanalyse von Versicherungen Betrugserkennung (z.b. Kreditkartenbetrug) Qualitätsanalyse (z.b. Schadensursache identifizieren) zf_dw_dm.doc Seite 7

11 2 Data Warehousing Das Data Warehousing ist die Gedächtnisfunktion von EUS Das Data Mining ist die Beurteilungsfunktion von EUS Definition 1: Ein DaWa (dt. Lagerhaus Daten einlagern) ist eine Datenbank, die strategische Entscheidungen unterstützt, indem sie umfangreiche und regelmässige Auszüge aus operativen Datenbanken periodenbezogen und oft aggregiert (zusammengefasst) Endbenutzern auch zur ad hoc-analyse (unvorbereitet) bereitstellt. Definition 2: Dt.: Datenlager Ein Data-Warehouse umfasst eine spezielle Datenbank, in die Daten aus vielen einzelnen (firmeninternen wie -externen) Datenbanken einfliessen, sowie ein Management-Informationssystems (MIS) zur Verarbeitung dieser Daten für einzelne Verwaltungsebenen. Das Data-Warehouse dient dazu, Führungskräften die Informationen zukommen zu lassen, die sie zur Kontrolle interner Abläufe und zur Entscheidungsfindung benötigen. Die Basisdaten müssen vor dem Transfer in das Data-Warehouse in ein einheitliches Format konvertiert werden, wobei so genannte Meta-Daten festhalten, welche Daten woher stammen und wie sie aufbereitet wurden. Danach erst kann der Gesamtbestand der Daten analysiert und ausgewertet werden. Ein Vorteil eines solchen Data-Warehouse ist, dass Mitarbeiter ohne Kenntnisse der "Standard Query Language" (SQL) oder anderer Abfragesprachen über eine grafische Benutzeroberfläche (GUI) ermitteln können, woher die einzelnen Daten stammen und wie sie bearbeitet wurden. Der Datenbestand kann nach Kriterien wie Zeitreihenanalyse und Trendermittlung ausgewertet werden. Solche Informationen finden in der Entscheidungsfindung des Unternehmensmanagements Verwendung. Als Erfinder des Data Warehouse gilt Bill Inmon, der den Begriff 1992 für ein solches System prägte, das er bei IBM entwickelt hat. Definition 3: Ein DaWa ist eine Themenorientierte, integrierte, zeitbezogene und nicht flüchtige Sammlung von Daten zur Unterstützung der Entscheidungen des Managements. Das DaWa ist themenbezogen und erhält Daten von vielen operationalen Systemen. Die Daten werden nach dem betriebswirtschaftlichen Umfeld des Unternehmens organisiert. Im Gegensatz zum DaWa sind operationelle Systeme prozessorientiert und werden durch ein System verwaltet. Das DaWa wird aus einer Vielzahl interner und externer Datenquellen gefüllt. Dabei spielt die Datenqualität eine wesentliche Rolle. zf_dw_dm.doc Seite 8

12 Im Gegensatz zum DaWa werden in operationellen Systemen DBs und Anwendungen unabhängig voneinander (und über lange Zeit) entwickelt. Daten eines DaWa werden langfristig gespeichert. Zeitreihenanalysen stellen den Hauptteil der Analysen dar. Die Daten werden persistent (Dauerhaftig) gespeichert. Auf ein DaWa wird nur lesend zugegriffen. Das Data Warehousing und Data Mining dient der Operativen Planung (Ausschöpfung vorhandener Erfolgspotentiale) mittels operativen Daten Strategischen Planung (Aufbau langfristiger Erfolgspotentiale) mittels strategischen Daten Data Warehouses sind analytische Datenbanken die Berichtsgeneratoren und Abfrage- und Analysewerkzeuge zur Verfügung stellen. Sie dienen Managern zur Entscheidungsunterstützung und zum nachträglichen Monitoring von Entscheidungen. Zudem dienen sie den Spezialisten zum Data Mining. Produktionsdatenbank (operative DB) Data Warehouse (analytische DB) Daten operativ Daten vollständig Daten detailliert Daten redundanzarm (fortschreibungsfreundlich) Daten änderungsintensiv Schlüssel i.d.r. natürlich meist Auswahlabfragen Abfragen häufig ad hoc Daten strategisch Daten periodenbezogen Daten oft abgeleitet (v.a. zusammenfassend) Endbenutzerorientiert / abfrageorientiert Schlüssel i.d.r. künstlich Tabelle 4: Operative vs. Analytische Datenbanken 2.1 Probleme beim Data Warehouse Betriebswirtschaftliche Probleme Datenauswahl Datenpräsentation Datenmodellierung Informationstechnische Probleme Unterschiedliche Datenformate bei operativen und analytischen Daten zf_dw_dm.doc Seite 9

13 Verbindung von Transaktionssystemen (oft Grossrechner) und Data Warehouse (oft Client-Server) Zeitpunkt für Datenauszüge Datenvolumen 2.2 Inhalt eines Data Warehouse Typisch für ein DaWa ist die Unterscheidung von Fakten (Indikatoren, Kennzahlen, Business Measure) Betriebswirtschaftlicher Erfolgsfaktor Aggregierbar Meist numerisches und kontinuierliches Attribut Erlaubt mehrdimensionale Messung Benötigen grosses Datenvolumen (ca. 70% des DaWa) Primärschlüssel aus den Fremdschlüsseln der Dimensionen z.b. Mengenumsatz, Geldumsatz, Kundenzahl Dimensionen Kriterien der Beurteilung Meist symbolisches und diskretes Attribut Erlaubt eine Auswahl, Zusammenfassung und Navigation eines Indikators Sind Primärschlüssel Nicht immer eindeutig erkennbar z.b. Periode, Standort, Produkt, Organisationseinheit, Kunden, Lieferanten Dimensionen und Fakten werden in einem Würfel (Cube bzw. Hypercube) vereinigt: Mehrdimensionale Datenstruktur, welche die gleichzeitige Analyse mehrerer Indikatoren und Dimensionen ermöglicht. Aufgabe eines DaWa ist es, einen Indikator nach seinen Dimensionen zu messen. z.b. wie hoch ist der Umsatz (Indikator) nach Periode, Produkt und Region (Dimensionen)? Region Haidhausen Schwabing Zentrum Juli Juni Mai Zeit Racer Future Tria- Racer Racer Junior Produkt zf_dw_dm.doc Seite 10

14 Abbildung 6: Mehrdimensionaler Würfel (Hypercube) 2.3 Architektur Operative Daten Externe Daten Ladeprozess Auswahl Transformation Integration Konkurrenz Branche Konjunkturentwicklung Demographische Daten Daten Data Warehouse Einzelheiten Zusammenfassungen Metadaten (Daten über Daten) 1 Information Zugriffswerkzeuge Berichtsgenerator Zweidimensionale Abfrage Mehrdimensionale Abfrage (OLAP) Data Mining... Endbenutzerzugriff 1 z.b. über Attribut Umsatz Fakt oder Dimension Aggergierbar (JA / NEIN) Wie aggregierbar Berechnungsformel Quelldaten Update, Periodizität Speicherformat Entscheidung Abbildung 7: Architektur eines DaWa Zentralisierte Architektur Datenbanken operativer Systeme Data Warehouse Alle analytischen Daten sind auf einer Plattform bedeutet: Geringe Redundanz 2 Hardwareersparnis Die Entwicklung eines zentralen DaWa ist jedoch Für die meisten Unternehmungen zu komplex Nur für kleinere Unternehmen geeignet Für heterogene Benutzerkreise zu benutzerunfreundlich und abfrageineffizient Abbildung 8: Zentralisierte DaWa-Architektur 2 Redundanz: Anteil einer Nachricht, der keine Information vermittelt ist überflüssig. zf_dw_dm.doc Seite 11

15 2.3.2 Data Marts Definition DM Datenbanken operativer Systeme Ein Data Mart (DM) ist ein lokales Data Warehouse, das sich auf die Daten eines Funktionsbereichs, einer Abteilung, einer Arbeitsgruppe oder einer komplexen Anwendung beschränkt. DM Abbildung 9: Data Mart DM Vorteile Entwicklungskomplexität kleiner Endbenutzerbeteiligung wahrscheinlicher Flexibilität grösser Datenmodell einfacher Abfrageeffizienz grösser Probleme Nicht immer skalierbar (keine lineare Zunahme der Antwortzeiten) Probleme bei Integration in Enterprise Data Warehouse Redundanzen sind schwer kontrollierbar Eventuelle Inkonsistenz unter Data Marts Höhere Entwicklungs- und Wartungskosten Modularisierung: Enterprise Data Mart DM Datenbanken operativer Systeme DM DM Koordination Abbildung 10: Enterprise Data Mart Verteilung analyt. Daten auf mehrere DM Vorteile Benutzeradäquate Werkzeuge Leicht verständliches Datenmodell Effizienter Zugriff Problem Übergreifende Analysen Koordination Ladezyklen Datenmodell: Attribute mit gleicher Bedeutung verwenden in allen DM die gleiche Bezeichner, Datentypen, Schlüssel und Datenquellen. Ziele Intramodulare Bindung maximieren Benutzer so homogen, dass: Antwortzeiten minimal Benutzerfreundlichkeit maximal Werkzeug an Anforderungen angepasst Intermodulare Koppelung minimieren Schnittstellen zwischen DM so schmal, dass DM-übergreifende Abfragen selten werden. zf_dw_dm.doc Seite 12

16 2.3.4 Enterprise Data Warehouse (EDaWa) EDaWa Zentrales DaWa Zentrales DaWa oder Vereinigung von Data Marts, das die unternehmensweite Information verteilt. DaWa, das operative Daten transformiert und koordiniert Data Marts zur Verfügung stellt. DM Datenbanken operativer Systeme Zentrales Data Warehouse DM DM Abbildung 11: Hierarchische Architektur Koordination lokaler DM durch ein EDaWa Ziel Extraktion, Integration und Verteilung der Daten Ziel der DM Abfrage und Analysen auf Teilen der Daten Anpassung an Bedürfnisse einer Organisationseinheit Datenverteilung Zeitgesteuert Ereignisorientiert auf Verlangen Koordinierte Attribute über EDaWa Voraussetzungen zur Koordination von DM: Fakten und Dimensionen müssen gleiche Bedeutung haben Gleich benennen (Synonyme vermeiden) Mit den gleichen Attributen beschreiben Fakten und Dimensionen mit unterschiedlicher Bedeutung Verschieden benennen (Homonyme vermeiden) Architektur Zentrales DW Data Marts Koordinierte DM Zentralisiert: auf einer Plattform Hierarchisch: edawa übernimmt Extraktion, Integration und Verteilung der Daten Koordiniert: Koordination versch. DMs Unkoordiniert: Keine Koordination zw. DMs Tabelle 5: Architekturen im Vergleich Unkoordinierte Architekturen führen zu Unkontrollierten Redundanzen Inkonsistenz Hohem Entwicklungsaufwand Ungenügender Skalierbarkeit 3 3 Skalierbarkeit: Ausbaubarkeit von Clients, Servern und Netz zf_dw_dm.doc Seite 13

17 2.3.5 Entwicklung von DM und DW operative Daten top- down bottom- up Zentrales Data Warehouse DM Abbildung 12: Entwicklungsmethoden Bottom-up: Aus der Verknüpfung mehrerer DM entsteht ein zentrales DaWa, das die untergeordneten DM mit koordinierten Daten beliefert. Probleme: Koordination: Redundanzen und Inkonsistenzen versch. DM Verträglichkeit der lokal entstehenden Datenmodelle Skalierbarkeit (Anpassung der Werkzeuge für grössere Datenmengen) Top-Down: Aus einem bestehenden DaWa werden DM herausgelöst. Parallel: Koordinierte Entwicklung von DM und EDaWa Data Mart (DM) EDW Ähnliche Begriffe lokales DW globales DW Hauptziel Modularisierung lokaler Daten und Abfragen redundanzarmes Unternehmungsdatenmodell für EUS Domäne Abteilung oder Anwendung Unternehmung Entwicklung / Betrieb Fachabteilung IT-Zentrale Grössenordnung bis 100 Gb (10 9 Byte) bis Terabytes (10 12 Byte, oft grösser als Produktionsdaten) Datenquelle EDW oder operative DB operative DB Granularität (Datendetail) oft gross (eher aus Aggregaten) meist klein (viele Transaktionsdetails) Normalisierungsgrad klein gross Hauptzugriffsart OLAP (meist ad hoc) SQL (oft vordefiniert) Entwicklung gut überblickbar aufwendig Typische Plattform mehrdimensionaler oder relationaler Datenbankserver RDBMS auf Unix-, Windows NToder Grossrechner Abbildung 13: Data Marts vs. EDaWa 2.4 Ladeprozess Datentransformation Die Datenübernahme aus den operativen Systemen in das DaWa erfolgt in periodischen Selektionen und Transformationen. Vor der Übernahme werden die Daten transformiert: Einheitliches Format Einheitliche Bezeichner Semantische Integration zf_dw_dm.doc Seite 14

18 Dazu werden die Daten in einen oder mehrere Zwischenspeicher (Data Staging Area), bearbeitet und dann erst in das DaWa übernommen. Werkzeuge zur Datentransformation nennt man ETL-Werkzeuge (Extract Transform Load) Nicht alle Zustandswechsel werden in das DaWa übertragen. Daten werden in das DaWa übernommen, sobald ein Endzustand erreicht ist Für Bestandesdaten werden periodische Schnappschüsse übertragen Logische Transformation Operationale Datenbanken sind normalisiert, um Redundanzen und Inkonsistenzen bei Datenveränderungen zu vermeiden. Die Transformation für das DaWa beinhaltet auch eine De-Normalisierung: Performancesteigerung Beziehungen im DaWa sind statisch Vergangene Zusammenhänge sollen erhalten bleiben (z.b. Preise zur Zeit der Auftragsbearbeitung) Order processing Customer Product orders price Available Inventory Product Price/inventory Product price Product Inventory Product Price changes De-normalized data Transform State Data Warehouse Customers Products Orders Product Inventory Product Price Marketing Customer Profile Product price Marketing programs Abbildung 14: De-Normalisierung Physische Transformation Einheitliche Begriffe Einheitliche Datentypen für das gleiche Datenelement Konsistente Verwendung von Attributwerten Behandlung unvollständiger Datensätze, Ersatzwerte Oft werden einfache Übersichten und Berichte schon bei der Transformation berechnet. Dies ergibt einen Effizienzgewinn (kürzere Rechnungszeiten) bei der Analyse. Anfragen und Berichte reichen von einfachen Aggragetionen / Summen bis zu komplexen Berechnungen Berechnung der Übersichten kann sehr aufwendig sein (z.b. Joins über mehrere Tabellen) Übersichtstabellen sind nicht nur einfache Berechnungen sondern basieren auf Geschäftsregeln (z.b. Was wird als Verkauf angesehen, was fällt unter Wartung) zf_dw_dm.doc Seite 15

19 Übersichten verstecken die Komplexität der Detaildaten und der Berechnungen. Der Anwender muss die Geschäftsregeln nicht kennen. 2.5 Analyseprozesse in Data Warehouses Standardberichte und anfragen Standerdberichte und anfragen werden für verschiedene Benutzer periodisch generiert. Sie sind nützlich für aufwendige Berechnungen und mehrfache Nutzung. Der DaWa-Administrator legt fest, was zu einem Standardbericht werden soll, indem er nachsieht welche Anfragen häufig durch die User gemacht werden und welche Anfragen die DB am meisten belasten. Der DaWa-User hat ebenfalls die Möglichkeiten einen Standardbericht zusammenzustellen Anfragen an Übersichtstabellen, OLAP Übersichtstabellen entstehen aus Detaildaten durch Filterung (z.b. Verkaufszahlen ausgewählter Warengruppen) Summierung (Aggregation) (z.b. Umsatz mit Produkt X) Übersichtstabellen sind die Grundlage der meisten Analysen im DaWa: Übertragung in multidimensionale Datenmodelle (z.b. Umsätze pro Jahr, Region, Produktegruppe) Data Mining auf Detail-Daten Die weitreichendste und nützlichste Analyse erfolgt auf Detaildaten Anfragen an Übersichtstabellen beantworten Fragen nach dem WAS Tiefergehende Detailanalyse kann Antworten geben auf Fragen nach dem WARUM und WIE Data Mining beginnt ebenso wie OLAP (siehe Kapitel 2.5.5) oft mit aggregierten Daten und verwendet die detaillierten Daten um Hypothesen zu verifizieren Gründe für Entdeckungen zu finden Analysen auf Detaildaten kommen nur für einen kleinen Teil der DaWa-Nutzer in Frage Schnittstellen zu anderen Anwendungen Schnittstellen zu anderen Anwendungen bieten die vierte Möglichkeit um Auswertungen zu machen. Wird auch für Data Mining benötitgt Zugriffe auf operative und analytische Daten Programmierte Berichte (erfordern oft Codeänderungen und sind zeitintensiv). zf_dw_dm.doc Seite 16

20 Abfrage- und Berichtssprachen wie SQL und QBE sind standardisiert und mächtig, aber für gelegentliche Benutzer zu schwierig. OLAP-Werkezuge erlauben auch dem gelegentlichen Benutzer flexible multidimensionale Abfragen. Abfragesprachen Prozedurale Abfragen (sind flexibler) Navigation meist Satzweise Anweisungsreihenfolge wichtig z.b. Visual Basic, Cobol, dbase Nichtporzedurale (deklarative) sind komfortabler Navigation tabellenweise Einzelne verbale oder grafische Anweisung z.b. QBE, SQL Grobübersicht SQL (Structured Query Language): Datenbankobjekte definieren create Datenbankobjekte manipulieren insert, update, delete Datenbankobjekte abfragen select Datananken schützen grant SQL-Kategorie Zweck Anweisungen Data Definition Language (DDL) Data Manipulation Language (DML) Data Control Language (DCL) Tabelle 6: SQL-Teilsprachen Definition von Datenbankobjekten Abfrage Änderung Transaktion Schutz / Sicherheit create, alter, drop, table, view, index select insert, delete, update lock, commit, rollback grant, revoke Mehrdimensionale SQL-Abfragen sind benutzerunfreundlich, weil oft Anweisungen zahlreich vorkommen müssen Anweisungen komplex sind (Mehrtabellenverbund, Aggregationen, Sortieren, Views) Zeitreihenanalyse aufwendig sind Rechenfunktion unzureichend ist (z.b. finanzmathematische, statische) OnLine Analytical Processing OLAP Definition OLAP ist eine Abfragemethode, die Endbenutzern einen mehrdimensionalen, schnellen Zugriff und eine benutzerfreundliche interaktive Analyse auf Data Marts ermöglicht. OLAP ist Mehrdimensional (weil es Indikatoren nach ihren Dimensionen analysiert) Endbenutzerfreundlich weil Direkte Manipulation möglich ist Ergebnisse einfach dargestellt und visualisiert werden zf_dw_dm.doc Seite 17

21 Detaillierend und zusammenfassend (weil Daten übersichtlich zusammengefasst und nur auf Verlangen detailliert sind) Analysierend und synthetisieren (weil der Benutzer Dimensionen einfach hinzufügen und weglassen kann) Schnell (weil es ad hoc-abfragen in Sekunden beantwortet und aufwendige ad-hoc-berechnungen durch Voraggregationen vermeidet) Data-Mart-orientiert Mit dem FASMI-Test kann mit 5 Kriterien getestet werden ob ein Produkt ein OLAP-Werkzeug ist: Fast Kommt die Antwort innert weniger Sekunden? Analysis Sind betriebswirtschaftliche und statistische Analysen sowie ad-hoc Berechnungen ohne Programmierkenntnisse möglich? Shared Ist Mehrbenutzerbetrieb möglich, Zugriffsrechte geregelt? Multidimensional Sind Multidimensionale Anfragen möglich? Information Werden alle relevanten Informationen, unabhängig vom Umfang und Inhalt verarbeitet? SQL sucht nach Details, OLAP fasst zusammen und vergleicht (im Hintergrund generieren OLAP-Werkzeuge allerdings auch SQL-Abfragen). Zusammenfassung (Aggregation) Vergleich Absoluter Vergleich Relativer Vergleich (Prozentualer Teil ) In OLAP-Werkzeugen stehen folgende Browsing-Möglichkeiten zur Verfügung: Drilling Down Detaillieren. Zu kleine Fallzahlen können bei mehrdimensionalen Analysen zu Informationsverlusten führen. Drilling Up Drilling Through Drilling Across Filtern Slicing Dicing / Pivoting Zusammenfassen (aggregieren). Eine Aggrgation kann zu Informationsverlusten führen. Detailzugriff auf operative Datenbanken (meist über vordefinierte SQL-Anweisungen) Zugriff auf mehrere Data Marts Wertauswahl Von einem Würfel sind auf einer zweidimensionalen Oberfläche nur zwei Dimensionen zu sehen (z.b. als Tabelle). Ein OLAP-Würfel ist in der Regel ein mehrdimensionaler Würfel mit mehr als drei Dimensionen Mittels Slicing (Slice = Scheibe) wird der Würfel um Dimensionen reduziert (in Scheiben geschnitten). Mittels Dicing (würfeln) wird der Würfel zum Anzeigen anderer Dimensionen gedreht (Rotation der Resultate um andere zf_dw_dm.doc Seite 18

Business Intelligence. Business Intelligence Seminar, WS 2007/08

Business Intelligence. Business Intelligence Seminar, WS 2007/08 Business Intelligence Seminar, WS 2007/08 Prof. Dr. Knut Hinkelmann Fachhochschule Nordwestschweiz knut.hinkelmann@fhnw.ch Business Intelligence Entscheidungsorientierte Sammlung, Aufbereitung und Darstellung

Mehr

Data Warehouse Definition (1) http://de.wikipedia.org/wiki/data-warehouse

Data Warehouse Definition (1) http://de.wikipedia.org/wiki/data-warehouse Data Warehouse Definition (1) http://de.wikipedia.org/wiki/data-warehouse Ein Data-Warehouse bzw. Datenlager ist eine zentrale Datensammlung (meist eine Datenbank), deren Inhalt sich aus Daten unterschiedlicher

Mehr

Data Mining Anwendungen und Techniken

Data Mining Anwendungen und Techniken Data Mining Anwendungen und Techniken Knut Hinkelmann DFKI GmbH Entdecken von Wissen in banken Wissen Unternehmen sammeln ungeheure mengen enthalten wettbewerbsrelevantes Wissen Ziel: Entdecken dieses

Mehr

OLAP und Data Warehouses

OLAP und Data Warehouses OLP und Data Warehouses Überblick Monitoring & dministration Externe Quellen Operative Datenbanken Extraktion Transformation Laden Metadaten- Repository Data Warehouse OLP-Server nalyse Query/Reporting

Mehr

Vorwort zur 5. Auflage... 15 Über den Autor... 16

Vorwort zur 5. Auflage... 15 Über den Autor... 16 Vorwort zur 5. Auflage...................................... 15 Über den Autor............................................ 16 Teil I Grundlagen.............................................. 17 1 Einführung

Mehr

Online Analytical Processing

Online Analytical Processing Online Analytical Processing Online Analytical Processing Online Analytical Processing (OLAP) ermöglicht die mu l- tidimensionale Betrachtung von Daten zwecks Ermit t- lung eines entscheidungsunterstützenden

Mehr

Online Analytical Processing

Online Analytical Processing Online Analytical Processing Online Analytical Processing Online Analytical Processing (OLAP) ermöglicht die multidimensionale Betrachtung von Daten zwecks E rmittlung eines entscheidungsunterstützenden

Mehr

Logische Modellierung von Data Warehouses

Logische Modellierung von Data Warehouses Logische Modellierung von Data Warehouses Vertiefungsarbeit von Karin Schäuble Gliederung. Einführung. Abgrenzung und Grundlagen. Anforderungen. Logische Modellierung. Methoden.. Star Schema.. Galaxy-Schema..

Mehr

Data Warehouse ??? Ein Data Warehouse ist keine von der Stange zu kaufende Standardsoftware, sondern immer eine unternehmensindividuelle

Data Warehouse ??? Ein Data Warehouse ist keine von der Stange zu kaufende Standardsoftware, sondern immer eine unternehmensindividuelle ??? Zusammenfassung, Ergänzung, Querverbindungen, Beispiele A.Kaiser; WU-Wien MIS 188 Data Warehouse Ein Data Warehouse ist keine von der Stange zu kaufende Standardsoftware, sondern immer eine unternehmensindividuelle

Mehr

Einführungsveranstaltung: Data Warehouse

Einführungsveranstaltung: Data Warehouse Einführungsveranstaltung: 1 Anwendungsbeispiele Berichtswesen Analyse Planung Forecasting/Prognose Darstellung/Analyse von Zeitreihen Performancevergleiche (z.b. zwischen Organisationseinheiten) Monitoring

Mehr

Seminar Business Intelligence Teil II. Data Mining & Knowledge Discovery

Seminar Business Intelligence Teil II. Data Mining & Knowledge Discovery Seminar Business Intelligence Teil II Data Mining & Knowledge Discovery Was ist Data Mining? Sabine Queckbörner Was ist Data Mining? Data Mining Was ist Data Mining? Nach welchen Mustern wird gesucht?

Mehr

Einführung in OLAP und Business Analysis. Gunther Popp dc soft GmbH

Einführung in OLAP und Business Analysis. Gunther Popp dc soft GmbH Einführung in OLAP und Business Analysis Gunther Popp dc soft GmbH Überblick Wozu Business Analysis mit OLAP? OLAP Grundlagen Endlich... Technischer Background Microsoft SQL 7 & OLAP Services Folie 2 -

Mehr

2 Datenbanksysteme, Datenbankanwendungen und Middleware... 45

2 Datenbanksysteme, Datenbankanwendungen und Middleware... 45 Vorwort 15 Teil I Grundlagen 19 i Einführung In das Thema Datenbanken 21 I.I Warum ist Datenbankdesign wichtig? 26 i.2 Dateisystem und Datenbanken 28 1.2.1 Historische Wurzeln 29 1.2.2 Probleme bei der

Mehr

MIS by Franziska Täschler, Winformation GmbH ftaeschler@winformation-gmbh.ch Ausgabe 01/2001

MIS by Franziska Täschler, Winformation GmbH ftaeschler@winformation-gmbh.ch Ausgabe 01/2001 MIS Glossar by Franziska Täschler, Winformation GmbH ftaeschler@winformation-gmbh.ch Ausgabe 01/2001 Aggregat Data Cube Data Marts Data Mining Data Warehouse (DWH) Daten Decision Support Systeme (DSS)

Mehr

Die Grundbegriffe Die Daten Die Informationen

Die Grundbegriffe Die Daten Die Informationen Die Grundbegriffe Die Daten sind diejenigen Elemente, die vom Computer verarbeitet werden. Die Informationen sind Wissenselemente, welche durch die Analyse von Daten erhalten werden können. Die Daten haben

Mehr

Einführung. Informationssystem als Abbild der realen Welt

Einführung. Informationssystem als Abbild der realen Welt Was ist ein Datenbanksystem? Anwendungsgrundsätze Betrieb von Datenbanksystemen Entwicklung von Datenbanksystemen Seite 1 Informationssystem als Abbild der realen Welt Modellierung (Abstraktion) Sachverhalte

Mehr

Data Cube. Aggregation in SQL. Beispiel: Autoverkäufe. On-line Analytical Processing (OLAP) 1. Einführung. 2. Aggregation in SQL, GROUP BY

Data Cube. Aggregation in SQL. Beispiel: Autoverkäufe. On-line Analytical Processing (OLAP) 1. Einführung. 2. Aggregation in SQL, GROUP BY Data Cube On-line Analytical Processing (OLAP). Einführung Ziel: Auffinden interessanter Muster in großen Datenmengen 2. Aggregation in SQL, GROUP BY 3. Probleme mit GROUP BY 4. Der Cube-Operator! Formulierung

Mehr

Objektorientierte Datenbanken

Objektorientierte Datenbanken OODB 11 Slide 1 Objektorientierte Datenbanken Vorlesung 11 vom 01.07.2004 Dr. Sebastian Iwanowski FH Wedel OODB 11 Slide 2 Inhalt heute: Datenbanken in betriebswirtschaftlichen Anwendungen OTLP (SAP) Data

Mehr

Komponenten und Architekturen von Analytischen Informationssystemen (AIS)

Komponenten und Architekturen von Analytischen Informationssystemen (AIS) Komponenten und Architekturen von Analytischen Informationssystemen (AIS) Melanie Pfoh Konsultation 27. Juni 2013 Hinweis Diese Folien ersetzen keinesfalls den Übungsstoff des zugehörigen e-learning-kurses.

Mehr

10. Vorlesung: Datenorganisation SS 2007

10. Vorlesung: Datenorganisation SS 2007 10. Vorlesung: Datenorganisation SS 2007 8 Parallele Transaktionen 9 9.1 Drei-Ebenen Ebenen-Architektur 9.2 Verteilte Datenbanken 9.3 Client-Server Server-Datenbanken 9.4 Föderierte Datenbanken 9.5 Das

Mehr

Business Intelligence und Geovisualisierung in der Gesundheitswirtschaft

Business Intelligence und Geovisualisierung in der Gesundheitswirtschaft Business Intelligence und Geovisualisierung in der Gesundheitswirtschaft Prof. Dr. Anett Mehler-Bicher Fachhochschule Mainz, Fachbereich Wirtschaft Prof. Dr. Klaus Böhm health&media GmbH 2011 health&media

Mehr

XAMPP-Systeme. Teil 3: My SQL. PGP II/05 MySQL

XAMPP-Systeme. Teil 3: My SQL. PGP II/05 MySQL XAMPP-Systeme Teil 3: My SQL Daten Eine Wesenseigenschaft von Menschen ist es, Informationen, in welcher Form sie auch immer auftreten, zu ordnen, zu klassifizieren und in strukturierter Form abzulegen.

Mehr

Informationssysteme für das Management

Informationssysteme für das Management FHBB l Departement Wirtschaft l Informationssysteme für das Management Michael Pülz, Hanspeter Knechtli Lernziele Den Unterschied zwischen operativen und analytischen Informationssystemen beschreiben können

Mehr

Data Mining-Modelle und -Algorithmen

Data Mining-Modelle und -Algorithmen Data Mining-Modelle und -Algorithmen Data Mining-Modelle und -Algorithmen Data Mining ist ein Prozess, bei dem mehrere Komponenten i n- teragieren. Sie greifen auf Datenquellen, um diese zum Training,

Mehr

eevolution Business Intelligence Oliver Rzeniecki COMPRA GmbH Programmierer & Datenbankadministrator

eevolution Business Intelligence Oliver Rzeniecki COMPRA GmbH Programmierer & Datenbankadministrator eevolution Business Intelligence Oliver Rzeniecki COMPRA GmbH Programmierer & Datenbankadministrator Agenda Was ist Business Intelligence? Was ist OLAP? Unterschied zwischen OLAP und OLTP? Bestandteile

Mehr

Zusammenspiel von Business Intelligence mit betrieblicher Anwendungssoftware Falk Neubert, Universität Osnabrück

Zusammenspiel von Business Intelligence mit betrieblicher Anwendungssoftware Falk Neubert, Universität Osnabrück Zusammenspiel von Business Intelligence mit betrieblicher Anwendungssoftware 14. März 2013, IHK Osnabrück-Emsland-Grafschaft Bentheim Geschichte Kassenbuch des Liederkranz, 1886 Hutmachergesangvereins

Mehr

Das Multidimensionale Datenmodell

Das Multidimensionale Datenmodell Das Multidimensionale Datenmodell Konzeptuelle Modellierung Umsetzung des Modells Beispiel ER-Modell 2 / 36 Probleme ER-Modellierung Keine Unterscheidung Klassifikation, Attribute, Kenngrößen Dimension

Mehr

Data Warehouse Technologien

Data Warehouse Technologien Veit Köppen Gunter Saake Kai-Uwe Sattler Data Warehouse Technologien Inhaltsverzeichnis Inhaltsverzeichnis vii 1 Einführung in Data-Warehouse-Systeme 1 1.1 Anwendungsszenario Getränkemarkt...............

Mehr

Data Warehouse Grundlagen

Data Warehouse Grundlagen Seminarunterlage Version: 2.10 Version 2.10 vom 24. Juli 2015 Dieses Dokument wird durch die veröffentlicht.. Alle Rechte vorbehalten. Alle Produkt- und Dienstleistungs-Bezeichnungen sind Warenzeichen

Mehr

Datenbanken 16.1.2008. Die Entwicklung der Datenbanksysteme ist eng an die der Hardware gekoppelt und wird wie jene in Generationen eingeteilt:

Datenbanken 16.1.2008. Die Entwicklung der Datenbanksysteme ist eng an die der Hardware gekoppelt und wird wie jene in Generationen eingeteilt: Datenbanksysteme Entwicklung der Datenbanksysteme Die Entwicklung der Datenbanksysteme ist eng an die der Hardware gekoppelt und wird wie jene in Generationen eingeteilt: 1. Generation: In den fünfziger

Mehr

Einführung relationale Datenbanken. Themenblock: Erstellung eines Cube. Schlüssel. Relationenmodell Relationenname Attribut. Problem.

Einführung relationale Datenbanken. Themenblock: Erstellung eines Cube. Schlüssel. Relationenmodell Relationenname Attribut. Problem. Themenblock: Erstellung eines Cube Einführung relationale Datenbanken Problem Verwaltung großer Mengen von Daten Praktikum: Data Warehousing und Data Mining Idee Speicherung der Daten in Form von Tabellen

Mehr

DATENBANKEN SQL UND SQLITE VON MELANIE SCHLIEBENER

DATENBANKEN SQL UND SQLITE VON MELANIE SCHLIEBENER DATENBANKEN SQL UND SQLITE VON MELANIE SCHLIEBENER INHALTSVERZEICHNIS 1. Datenbanken 2. SQL 1.1 Sinn und Zweck 1.2 Definition 1.3 Modelle 1.4 Relationales Datenbankmodell 2.1 Definition 2.2 Befehle 3.

Mehr

Veit Köppen Gunter Saake Kai-Uwe Sattler. 2. Auflage. Data Warehouse Technologien

Veit Köppen Gunter Saake Kai-Uwe Sattler. 2. Auflage. Data Warehouse Technologien Veit Köppen Gunter Saake Kai-Uwe Sattler 2. Auflage Data Warehouse Technologien Inhaltsverzeichnis Inhaltsverzeichnis ix 1 Einführung in Data-Warehouse-Systeme 1 1.1 Anwendungsszenario Getränkemarkt...

Mehr

Themenblock: Erstellung eines Cube

Themenblock: Erstellung eines Cube Themenblock: Erstellung eines Cube Praktikum: Data Warehousing und Data Mining Einführung relationale Datenbanken Problem Verwaltung großer Mengen von Daten Idee Speicherung der Daten in Form von Tabellen

Mehr

Inhaltsverzeichnis. jetzt lerne ich

Inhaltsverzeichnis. jetzt lerne ich Inhaltsverzeichnis jetzt lerne ich Einführung 15 1 Erste Schritte 21 1.1 Datenbanken und Datenbank-Managementsysteme 21 1.2 Zugriff auf Datenbanken 22 1.3 Was der Großvater noch wusste... 22 1.4 Einordnung

Mehr

SQL (Structured Query Language) Schemata Datentypen

SQL (Structured Query Language) Schemata Datentypen 2 SQL Sprachelemente Grundlegende Sprachelemente von SQL. 2.1 Übersicht Themen des Kapitels SQL Sprachelemente Themen des Kapitels SQL (Structured Query Language) Schemata Datentypen Im Kapitel SQL Sprachelemente

Mehr

Data Mining Standards am Beispiel von PMML. Data Mining Standards am Beispiel von PMML

Data Mining Standards am Beispiel von PMML. Data Mining Standards am Beispiel von PMML Data Mining Standards am Beispiel von PMML Allgemeine Definitionen im Data Mining Data Mining (DM) Ein Prozess, um interessante neue Muster, Korrelationen und Trends in großen Datenbeständen zu entdecken,

Mehr

Aufgaben zur fachwissenschaftlichen Prüfung Modul 3 Daten erfassen, ordnen, verarbeiten und austauschen: Schwerpunkt Datenbanken

Aufgaben zur fachwissenschaftlichen Prüfung Modul 3 Daten erfassen, ordnen, verarbeiten und austauschen: Schwerpunkt Datenbanken Aufgaben zur fachwissenschaftlichen Prüfung Modul 3 Daten erfassen, ordnen, verarbeiten und austauschen: Schwerpunkt Datenbanken 30 Wozu dient ein Primärschlüssel? Mit dem Primärschlüssel wird ein Datenfeld

Mehr

Performance by Design Wie werden performante ETL-Prozesse erstellt?

Performance by Design Wie werden performante ETL-Prozesse erstellt? Performance by Design Wie werden performante ETL-Prozesse erstellt? Reinhard Mense ARETO Consulting Bergisch Gladbach Schlüsselworte: DWH, Data Warehouse, ETL-Prozesse, Performance, Laufzeiten, Partitionierung,

Mehr

1 Einleitung. Betriebswirtschaftlich administrative Systeme

1 Einleitung. Betriebswirtschaftlich administrative Systeme 1 1 Einleitung Data Warehousing hat sich in den letzten Jahren zu einem der zentralen Themen der Informationstechnologie entwickelt. Es wird als strategisches Werkzeug zur Bereitstellung von Informationen

Mehr

Arbeiten mit ACCESS 2013

Arbeiten mit ACCESS 2013 Dipl.-Hdl., Dipl.-Kfm. Werner Geers Arbeiten mit ACCESS 2013 Datenbanken mit Datenmodellierung Tabellen, Abfragen, Formularen und Berichten Beziehungen Makros Datenaustausch SQL Structured Query Language

Mehr

Folien zum Textbuch. Kapitel 6: Managementunterstützungssysteme. Teil 2: Textbuch-Seiten 794-825

Folien zum Textbuch. Kapitel 6: Managementunterstützungssysteme. Teil 2: Textbuch-Seiten 794-825 Folien zum Textbuch Kapitel 6: Managementunterstützungssysteme Teil 2: Managementunterstützung auf strategischer Ebene Datenverwaltung und -auswertung Textbuch-Seiten 794-825 WI 1 MUS MUS auf strategischer

Mehr

Analyse von unstrukturierten Daten. Peter Jeitschko, Nikolaus Schemel Oracle Austria

Analyse von unstrukturierten Daten. Peter Jeitschko, Nikolaus Schemel Oracle Austria Analyse von unstrukturierten Daten Peter Jeitschko, Nikolaus Schemel Oracle Austria Evolution von Business Intelligence Manuelle Analyse Berichte Datenbanken (strukturiert) Manuelle Analyse Dashboards

Mehr

BI Konsolidierung: Anspruch & Wirklichkeit. Jacqueline Bloemen. in Kooperation mit

BI Konsolidierung: Anspruch & Wirklichkeit. Jacqueline Bloemen. in Kooperation mit BI Konsolidierung: Anspruch & Wirklichkeit Jacqueline Bloemen in Kooperation mit Agenda: Anspruch BI Konsolidierung Treiber Was sind die aktuellen Treiber für ein Konsolidierungsvorhaben? Kimball vs. Inmon

Mehr

Datenbanken. Dateien und Datenbanken:

Datenbanken. Dateien und Datenbanken: Dateien und Datenbanken: Professionelle Anwendungen benötigen dauerhaft verfügbare, persistent gespeicherte Daten. Datenbank-Systeme bieten die Möglichkeit, Daten persistent zu speichern. Wesentliche Aspekte

Mehr

Business and Data Understanding. Business und Data Understanding

Business and Data Understanding. Business und Data Understanding Business und Data Understanding Gliederung 1. Grundlagen 2. Von Data Warehouse zu Data Mining 3. Das CRISP-DM Referenzmodell 4. Die Phasen Business- und Data Understanding 5. Überblick der weiteren Phasen

Mehr

Profilbezogene informatische Bildung in den Klassenstufen 9 und 10. Schwerpunktthema Daten und Datenbanken

Profilbezogene informatische Bildung in den Klassenstufen 9 und 10. Schwerpunktthema Daten und Datenbanken Profilbezogene informatische Bildung in den Klassenstufen 9 und 10 Schwerpunktthema Robby Buttke Fachberater für Informatik RSA Chemnitz Fachliche Einordnung Phasen relationaler Modellierung Fachlichkeit

Mehr

Einführung in SQL Datenbanken bearbeiten

Einführung in SQL Datenbanken bearbeiten Einführung in SQL Datenbanken bearbeiten Jürgen Thomas Entstanden als Wiki-Buch Bibliografische Information Diese Publikation ist bei der Deutschen Nationalbibliothek registriert. Detaillierte Angaben

Mehr

Star-Schema-Modellierung mit ERwin - eine kritische Reflexion der Leistungspotentiale und Anwendungsmöglichkeiten

Star-Schema-Modellierung mit ERwin - eine kritische Reflexion der Leistungspotentiale und Anwendungsmöglichkeiten Star-Schema-Modellierung mit ERwin - eine kritische Reflexion der Leistungspotentiale und Anwendungsmöglichkeiten Michael Hahne T&I GmbH Workshop MSS-2000 Bochum, 24. März 2000 Folie 1 Worum es geht...

Mehr

30. Juni 2006 - Technische Universität Kaiserslautern. Paul R. Schilling

30. Juni 2006 - Technische Universität Kaiserslautern. Paul R. Schilling 30. Juni 2006 - Technische Universität Kaiserslautern Paul R. Schilling ! " #$% & '( ( ) *+, - '. / 0 1 2("$ DATEN SIND ALLGEGENWÄRTIG Bill Inmon, father of data warehousing Unternehmen In einer vollkommenen

Mehr

Marketing Intelligence Übersicht über Business Intelligence. Josef Kolbitsch Manuela Reinisch

Marketing Intelligence Übersicht über Business Intelligence. Josef Kolbitsch Manuela Reinisch Marketing Intelligence Übersicht über Business Intelligence Josef Kolbitsch Manuela Reinisch Übersicht Beispiel: Pantara Holding Der Begriff Business Intelligence Übersicht über ein klassisches BI-System

Mehr

Data Warehouse. für den Microsoft SQL SERVER 2000/2005

Data Warehouse. für den Microsoft SQL SERVER 2000/2005 Warehouse für den Microsoft SQL SERVER 2000/2005 Begriffe 1 DWH ( Warehouse) ist eine fachübergreifende Zusammenfassung von Datentabellen. Mart ist die Gesamtheit aller Datentabellen für einen fachlich

Mehr

Modellbasierte Business Intelligence in der Praxis. Nürnberg, 10.11.2009

Modellbasierte Business Intelligence in der Praxis. Nürnberg, 10.11.2009 Modellbasierte Business Intelligence in der Praxis Nürnberg, 10.11.2009 I N H A L T 1. Warum Modelle für Business Intelligence (BI)? 2. Inhalte von Datenmodellen für BI 3. Inhalte von Prozessmodellen 4.

Mehr

Seminar in der Seminarreihe Business Intelligence 1. OLAP und Datawarehousing

Seminar in der Seminarreihe Business Intelligence 1. OLAP und Datawarehousing Seminar in der Seminarreihe Business Intelligence 1 OLAP und Datawarehousing OLAP & Warehousing Die wichtigsten Produkte Die Gliederung Produkt Bewertung & Vergleiche Die Marktentwicklung Der aktuelle

Mehr

The integration of business intelligence and knowledge management

The integration of business intelligence and knowledge management The integration of business intelligence and knowledge management Seminar: Business Intelligence Ketevan Karbelashvili Master IE, 3. Semester Universität Konstanz Inhalt Knowledge Management Business intelligence

Mehr

1 Einführung. Unbekannte Begriffe: Business Intelligence, Knowledge Management, Unternehmensportale, Information Warehouse.

1 Einführung. Unbekannte Begriffe: Business Intelligence, Knowledge Management, Unternehmensportale, Information Warehouse. 1 Einführung mysap Business Intelligence stellt mit Hilfe von Knowledge Management die Verbindung zwischen denen, die etwas wissen und denen, die etwas wissen müssen her. mysap Business Intelligence integriert

Mehr

Definition Informationssystem

Definition Informationssystem Definition Informationssystem Informationssysteme (IS) sind soziotechnische Systeme, die menschliche und maschinelle Komponenten umfassen. Sie unterstützen die Sammlung, Verarbeitung, Bereitstellung, Kommunikation

Mehr

Relationale Datenbanken Datenbankgrundlagen

Relationale Datenbanken Datenbankgrundlagen Datenbanksystem Ein Datenbanksystem (DBS) 1 ist ein System zur elektronischen Datenverwaltung. Die wesentliche Aufgabe eines DBS ist es, große Datenmengen effizient, widerspruchsfrei und dauerhaft zu speichern

Mehr

Mit Transbase Hypercube Data Warehouse Anwendungen effizient betreiben. Die Hypercube-Technologie

Mit Transbase Hypercube Data Warehouse Anwendungen effizient betreiben. Die Hypercube-Technologie Mit Transbase Hypercube Data Warehouse Anwendungen effizient betreiben Transbase Hypercube ist eine Transbase -Option, die die innovative Hypercube-Technologie für komplexe analytische Anwendungen (OLAP)

Mehr

Contents. Ebenen. Data Warehouse - ETL Prozess Version: July 10, 2007. 1 Ebenen. Andreas Geyer-Schulz und Anke Thede. 2 Problemquelle Quellsysteme 4

Contents. Ebenen. Data Warehouse - ETL Prozess Version: July 10, 2007. 1 Ebenen. Andreas Geyer-Schulz und Anke Thede. 2 Problemquelle Quellsysteme 4 Contents Data Warehouse - ETL Prozess Version: July 10, 2007 Andreas Geyer-Schulz und Anke Thede Schroff-Stiftungslehrstuhl Informationsdienste und Elektronische Märkte Fakultät für Wirtschaftswissenschaften

Mehr

Gliederung Datenbanksysteme

Gliederung Datenbanksysteme Gliederung Datenbanksysteme 5. Datenbanksprachen 1. Datendefinitionsbefehle 2. Datenmanipulationsbefehle 3. Grundlagen zu SQL 6. Metadatenverwaltung 7. DB-Architekturen 1. 3-Schema-Modell 2. Verteilte

Mehr

In die Zeilen würden die Daten einer Adresse geschrieben werden. Das Ganze könnte in etwa folgendermaßen aussehen:

In die Zeilen würden die Daten einer Adresse geschrieben werden. Das Ganze könnte in etwa folgendermaßen aussehen: 1 Einführung in Datenbanksysteme Fast jeder kennt Excel und hat damit in seinem Leben schon einmal gearbeitet. In Excel gibt es Arbeitsblätter, die aus vielen Zellen bestehen, in die man verschiedene Werte

Mehr

Data Warehouses und Moderne Betriebliche Anwendungen von Datenbanksystemen

Data Warehouses und Moderne Betriebliche Anwendungen von Datenbanksystemen Data Warehouses und Moderne Betriebliche Anwendungen von Datenbanksystemen (Folien von A. Kemper zum Buch 'Datenbanksysteme') Online Transaction Processing Betriebswirtschaftliche Standard- Software (SAP

Mehr

Marketing Intelligence Architektur und Konzepte. Josef Kolbitsch Manuela Reinisch

Marketing Intelligence Architektur und Konzepte. Josef Kolbitsch Manuela Reinisch Marketing Intelligence Architektur und Konzepte Josef Kolbitsch Manuela Reinisch Übersicht Mehrstufiges BI-System Architektur eines Data Warehouses Architektur eines Reporting-Systems Benutzerrollen in

Mehr

Oracle 10g und SQL Server 2005 ein Vergleich. Thomas Wächtler 39221

Oracle 10g und SQL Server 2005 ein Vergleich. Thomas Wächtler 39221 Oracle 10g und SQL Server 2005 ein Vergleich Thomas Wächtler 39221 Inhalt 1. Einführung 2. Architektur SQL Server 2005 1. SQLOS 2. Relational Engine 3. Protocol Layer 3. Services 1. Replication 2. Reporting

Mehr

Seminar im Sommersemester 2004 an der Universität Karlsruhe (TH)

Seminar im Sommersemester 2004 an der Universität Karlsruhe (TH) Seminar im Sommersemester 2004 an der Universität Karlsruhe (TH) Verteilung und Integration von Informationen im Verkehrsbereich Thema: OLAP in verteilten Data-Warehouse- Umgebungen Vortrag: Christian

Mehr

Performanceoptimierung mit Exadata Verarbeitung extremer Datenmengen mit PL/SQL basierter Datenbewirtschaftung (Erfahrungsbericht)

Performanceoptimierung mit Exadata Verarbeitung extremer Datenmengen mit PL/SQL basierter Datenbewirtschaftung (Erfahrungsbericht) Performanceoptimierung mit Exadata Verarbeitung extremer Datenmengen mit PL/SQL basierter Datenbewirtschaftung (Erfahrungsbericht) Christian Haag, DATA MART Consulting Consulting Manager Oracle DWH Team

Mehr

Studierenden-Kennzahlen im Griff dank flexiblem Reporting und Ad-hoc-Analysen

Studierenden-Kennzahlen im Griff dank flexiblem Reporting und Ad-hoc-Analysen Praxistag für die öffentliche Verwaltung 2012 Titel Präsentation Studierenden-Kennzahlen im Griff dank flexiblem Reporting und Ad-hoc-Analysen Referenten-Info Gerhard Tschantré, Leiter Controllerdienste

Mehr

Agenda. Hype oder Mehrwert. Herausforderungen. Methoden Werkzeuge. Kosten Nutzen. Definition Ziele

Agenda. Hype oder Mehrwert. Herausforderungen. Methoden Werkzeuge. Kosten Nutzen. Definition Ziele Agenda Definition Ziele Methoden Werkzeuge Herausforderungen Kosten Nutzen Hype oder Mehrwert Definition / Ziele Google Suche: define:business Intelligence Mit Business Intelligence können alle informationstechnischen

Mehr

Einführung. Kapitel 1 2 / 508

Einführung. Kapitel 1 2 / 508 Kapitel 1 Einführung 2 / 508 Einführung Was ist ein Datenbanksystem (DBS)? Ein System zum Speichern und Verwalten von Daten. Warum kein herkömmliches Dateisystem verwenden? Ausfallsicherheit und Skalierbarkeit

Mehr

Data Warehouse und Data Mining

Data Warehouse und Data Mining Einführungsseminar Data Mining Seminarvortrag zum Thema: Data Warehouse und Data Mining Von gehalten am Betreuer: Dr. M. Grabert Einführung Problemstellung Seite 2 Einführung Unternehmen bekommen eine

Mehr

Data Warehousing und Data Mining

Data Warehousing und Data Mining Data Warehousing und Data Mining 2 Cognos Report Net (CRN) Ermöglicht Erstellen von Ad-hoc-Anfragen (Query Studio) Berichten (Report Studio) Backend Data Cube Relationale Daten Übung: Cognos Report Net

Mehr

Intelligence (BI): Von der. Nürnberg, 29. November 2011

Intelligence (BI): Von der. Nürnberg, 29. November 2011 Modelle für Business Intelligence (BI): Von der Anforderung zum Würfel Nürnberg, 29. November 2011 Warum Modelle für Business Intelligence (BI)? Warum Modelle für Business Intelligence (BI)? Bis zur Auswertung

Mehr

Asklepius-DA Die intelligente Technologie für die umfassende Analyse medizinischer Daten Leistungsbeschreibung

Asklepius-DA Die intelligente Technologie für die umfassende Analyse medizinischer Daten Leistungsbeschreibung Asklepius-DA Die intelligente Technologie für die umfassende Analyse medizinischer Daten Leistungsbeschreibung Datei: Asklepius DA Flyer_Leistung_2 Seite: 1 von:5 1 Umfassende Datenanalyse Mit Asklepius-DA

Mehr

Vorlesung 30.03.2009 1) Einführung

Vorlesung 30.03.2009 1) Einführung Vorlesung 30.03.2009 1) Einführung Was versteht man unter dem Begriff Datenbank? - Eine Datenbank ist eine Struktur zur Speicherung von Daten mit lesendem und schreibendem Zugriff - Allgemein meint man

Mehr

RE.one. Self Service Information Management für die Fachabteilung

RE.one. Self Service Information Management für die Fachabteilung RE.one Self Service Information Management für die Fachabteilung Das Ziel Verwertbare Informationen aus Daten gewinnen Unsere Vision Daten Info Data Warehousing radikal vereinfachen in einem Tool Die Aufgabe

Mehr

Data Warehouse. Kapitel 17. Abbildung 17.1: Zusammenspiel zwischen OLTP und OLAP. Man unterscheidet zwei Arten von Datenbankanwendungen:

Data Warehouse. Kapitel 17. Abbildung 17.1: Zusammenspiel zwischen OLTP und OLAP. Man unterscheidet zwei Arten von Datenbankanwendungen: Kapitel 17 Data Warehouse OLTP Online Transaction Processing OLAP Online Analytical Processing Decision Support-Anfragen Data Mining opera- tionale DB opera- tionale DB opera- tionale DB Data Warehouse

Mehr

Integration Services Übersicht

Integration Services Übersicht Integration Services Übersicht Integration Services Übersicht Integration Services stellt umfangreiche integrierte Tasks, Container, Transformationen und Datenadapter für die En t- wicklung von Geschäftsanwendungen

Mehr

Oracle-Statistiken im Data Warehouse effizient nutzen

Oracle-Statistiken im Data Warehouse effizient nutzen Oracle-Statistiken im Data Warehouse effizient nutzen Reinhard Mense ARETO Consulting Köln Schlüsselworte: DWH, Data Warehouse, Statistiken, Optimizer, Performance, Laufzeiten Einleitung Für die performante

Mehr

BARC-Studie Data Warehousing und Datenintegration

BARC-Studie Data Warehousing und Datenintegration Ergebnisse der BARC-Studie Data Warehouse Plattformen Dr. Carsten Bange BARC-Studie Data Warehousing und Datenintegration Data-Warehouse -Plattformen und Datenintegrationswerkzeuge im direkten Vergleich

Mehr

Auswertung für Warenwirtschaft/ERP, Interbase und ODBC... 2

Auswertung für Warenwirtschaft/ERP, Interbase und ODBC... 2 Cubix O.L.A.P... 2 Auswertung für Warenwirtschaft/ERP, Interbase und ODBC... 2 Datenverbindung über ODBC... 4 Datenbereitstellung über SQL... 5 Festlegung der Dimensionen... 6 Festlegung der Summen...

Mehr

Übersicht über Datenbanken

Übersicht über Datenbanken Übersicht über Datenbanken Vergleich zwischen normaler Datenorganisation und Datenbanken Definition einer Datenbank Beispiel (inkl. Zugriff) Der Datenbankadministrator Relationale Datenbanken Transaktionen

Mehr

Data Warehousing und Data Mining

Data Warehousing und Data Mining 2 Data Warehousing und Data Mining Kapitel 1: Data-Warehousing-Architektur von Geschäftsprozessen Mögliche Fragestellungen Wie entwickelt sich unser Umsatz im Vergleich zum letzten Jahr? In welchen Regionen

Mehr

BIW - Überblick. Präsentation und Discoverer Demonstration - Teil 1 - Humboldt Universität zu Berlin am 10. Juni 2004

BIW - Überblick. Präsentation und Discoverer Demonstration - Teil 1 - Humboldt Universität zu Berlin am 10. Juni 2004 BIW - Überblick Präsentation und Discoverer Demonstration - Teil 1 - Humboldt Universität zu Berlin am 10. Juni 2004 Annegret Warnecke Senior Sales Consultant Oracle Deutschland GmbH Berlin Agenda Überblick

Mehr

Zukunftsträchtige Potentiale: Predictive Analysis mit SAP HANA & SAP BO

Zukunftsträchtige Potentiale: Predictive Analysis mit SAP HANA & SAP BO innovation@work Zukunftsträchtige Potentiale: Predictive Analysis mit SAP HANA & SAP BO thinkbetter AG Florian Moosmann 8. Mai 2013 1 Agenda Prädiktive Analyse Begriffsdefinition Herausforderungen Schwerpunktbereiche

Mehr

Carl-Engler-Schule Karlsruhe Datenbank 1 (5)

Carl-Engler-Schule Karlsruhe Datenbank 1 (5) Carl-Engler-Schule Karlsruhe Datenbank 1 (5) Informationen zur Datenbank 1. Definition 1.1 Datenbank-Basis Eine Datenbank-Basis ist eine Sammlung von Informationen über Objekte (z.b Musikstücke, Einwohner,

Mehr

Teil VI. Datenbanken

Teil VI. Datenbanken Teil VI Datenbanken Überblick 1 Grundlegende Begriffe Motivation 2 Relationale Datenbanksysteme Das Relationale Datenmodell SQL 3 Entwurf von Datenbanken Das Enity Relationship (ER) Modell Abbildung von

Mehr

Von der spezialisierten Eigenentwicklung zum universellen Analysetool. Das Controlling-Informationssystem der WestLB Systems

Von der spezialisierten Eigenentwicklung zum universellen Analysetool. Das Controlling-Informationssystem der WestLB Systems Von der spezialisierten Eigenentwicklung zum universellen Analysetool Das Controlling-Informationssystem der WestLB Systems Begriffe und Definitionen Data Warehouse - Datensammlung oder Konzept?! Data

Mehr

Einführung in Hauptspeicherdatenbanken

Einführung in Hauptspeicherdatenbanken Einführung in Hauptspeicherdatenbanken Harald Zankl Probevorlesung 13. 01., 13:15 14:00, HS C Inhaltsverzeichnis Organisation Überblick Konklusion Harald Zankl (LFU) Hauptspeicherdatenbanken 2/16 Organisation

Mehr

Vorwort zur zweiten Auflage...V. Vorwort zur ersten Auflage... VIII

Vorwort zur zweiten Auflage...V. Vorwort zur ersten Auflage... VIII Vorwort zur zweiten Auflage...V Vorwort zur ersten Auflage... VIII 1 Management Support Systeme und Business Intelligence Anwendungssysteme zur Unterstützung von Managementaufgaben...1 1.1 Computergestützte

Mehr

Dominik Pretzsch TU Chemnitz 2011

Dominik Pretzsch TU Chemnitz 2011 Dominik Pretzsch TU Chemnitz 2011 Wir leben im Informationszeitalter und merken es daran, dass wir uns vor Information nicht mehr retten können. Nicht der überwältigende Nutzen der Information, sondern

Mehr

Einteilung von Datenbanken

Einteilung von Datenbanken Datenbanksysteme (c) A.Kaiser; WU-Wien 1 Einteilung von Datenbanken 1. formatierte Datenbanken 2. unformatierte Datenbanken Information Retrieval Systeme 2 Wozu Datenbanken? Speicherung und Verwaltung

Mehr

David gegen Goliath Excel 2010 in Verbindung mit Datawarehouse und im Vergleich zu Business Objects

David gegen Goliath Excel 2010 in Verbindung mit Datawarehouse und im Vergleich zu Business Objects Thema: David gegen Goliath Excel 2010 in Verbindung mit Datawarehouse und im Vergleich zu Business Objects Autor: Dipl. Wirtsch.-Inf. Torsten Kühn PRAXIS-Consultant PRAXIS EDV- Betriebswirtschaft- und

Mehr

Zeitgemäße Verfahren für ganzheitliche Auswertungen

Zeitgemäße Verfahren für ganzheitliche Auswertungen Intelligente Vernetzung von Unternehmensbereichen Zeitgemäße Verfahren für ganzheitliche Auswertungen Sächsische Industrie- und Technologiemesse Chemnitz, 27. Juni 2012, Markus Blum 2012 TIQ Solutions

Mehr

Fachbericht zum Thema: Anforderungen an ein Datenbanksystem

Fachbericht zum Thema: Anforderungen an ein Datenbanksystem Fachbericht zum Thema: Anforderungen an ein Datenbanksystem von André Franken 1 Inhaltsverzeichnis 1 Inhaltsverzeichnis 1 2 Einführung 2 2.1 Gründe für den Einsatz von DB-Systemen 2 2.2 Definition: Datenbank

Mehr

Analytisches CRM in der Automobilindustrie

Analytisches CRM in der Automobilindustrie Analytisches CRM in der Automobilindustrie Dr. Frank Säuberlich Practice Manager European Customer Solutions Urban Science International GmbH Automobilhersteller müssen neue Wege gehen Anforderungen in

Mehr

Data Mining mit der SEMMA Methodik. Reinhard Strüby, SAS Institute Stephanie Freese, Herlitz PBS AG

Data Mining mit der SEMMA Methodik. Reinhard Strüby, SAS Institute Stephanie Freese, Herlitz PBS AG Data Mining mit der SEMMA Methodik Reinhard Strüby, SAS Institute Stephanie Freese, Herlitz PBS AG Data Mining Data Mining: Prozeß der Selektion, Exploration und Modellierung großer Datenmengen, um Information

Mehr

Data Warehousing Grundbegriffe und Problemstellung

Data Warehousing Grundbegriffe und Problemstellung Data Warehousing Grundbegriffe und Problemstellung Dr. Andrea Kennel, Trivadis AG, Glattbrugg, Schweiz Andrea.Kennel@trivadis.com Schlüsselworte Data Warehouse, Cube, Data Mart, Bitmap Index, Star Queries,

Mehr

Neuerungen Analysis Services

Neuerungen Analysis Services Neuerungen Analysis Services Neuerungen Analysis Services Analysis Services ermöglicht Ihnen das Entwerfen, Erstellen und Visualisieren von Data Mining-Modellen. Diese Mining-Modelle können aus anderen

Mehr

Unterstützung des PersonalControlling durch flexible IuK-Technologie Präsentation für die Tagung der IuK-Leiter am 23.09.2003

Unterstützung des PersonalControlling durch flexible IuK-Technologie Präsentation für die Tagung der IuK-Leiter am 23.09.2003 Data-Warehouse Unterstützung des PersonalControlling durch flexible IuK-Technologie Präsentation für die Tagung der IuK-Leiter am 23.09.2003 23.09.2003, Folie: 1 Data Warehouse Historie Architekturprinzip

Mehr