Data-Wa re house-systeme



Ähnliche Dokumente
Data-Warehouse-Systeme

Data-Warehouse-Systeme

Data-Warehouse- Systeme

xiii Inhaltsverzeichnis Teil I Architektur 1 1 Abgrenzung und Einordnung 5

Veit Köppen Gunter Saake Kai-Uwe Sattler. 2. Auflage. Data Warehouse Technologien

Data Warehouse Technologien

Data Warehouse Technologien

Datenqualität erfolgreich steuern

erfolgreich steuern Datenqualität rä dpunkt.verlag Ldwi Praxislösungen für Business-Intelligence-Projekte Rüdiger Eberlein Edition TDWI

Seminar C02 - Praxisvergleich OLAP Tools

Datenbanktechnologie für Data-Warehouse-Systeme

xiii Inhaltsverzeichnis 1 Einführung 1

Modellierung von OLAP- und Data- Warehouse-Systemen

Data Warehousing. Sommersemester Ulf Leser Wissensmanagement in der Bioinformatik

Andreas Heuer Gunter Saake Kai-Uwe Sattler. Datenbanken. kompakt

Inhaltsverzeichnis 1 Einleitung 2 Ansätze in Forschung und Praxis

C09: Einsatz SAP BW im Vergleich zur Best-of-Breed-Produktauswahl

Model Driven SOA. < J Springer. Anwendungsorientierte Methodik und Vorgehen in der Praxis. Gerhard Rempp Mark Akermann Martin Löffler Jens Lehmann

Vorwort Azure Cloud Computing mit Microsoft Danksagungen Kontakt zum Autor... 13

Architektur eines Data Warehouse Systems. Mario Jandeck

Einführung in das Software-Qualitätsmanagement

tdwi E U R D P E OPEN SOURCE BUSINESS INTELLIGENCE HANSER MÖGLICHKEITEN, CHANCEN UND RISIKEN QUELLOFFENER BI-LÖSUNGEN

Management von IT-Architekturen

Entwicklung von Data-Warehouse-Systemen

Inhaltsverzeichnis. Herausgebervorwort VII. Autorenvorwort. Abbildungsverzeichnis XIX. Tabellenverzeichnis XXI. Abkürzungsverzeichnis.

Funktionale Sicherheit in der Praxis

11 Inhaltsübersicht. c M. Scholl, 2005/06 Informationssysteme: 11. Inhaltsübersicht 11-1

Kapitel 14 Verteilte DBMS

Vorwort zur zweiten Auflage...V. Vorwort zur ersten Auflage... VIII

Quelle: Daten nach Russom, Philip: Taking Data Quality to the Enterprise through Data Governance, TDWI Report Series, The Data Warehouse Institute,

Grundkurs Geschäftsprozess Management

Inhaltsverzeichnis. xiii

Prozessorientierte Organisation des Metadatenmanagements für Data-Warehouse-Systeme

Inhaltsübersicht... V. Inhaltsverzeichnis... VI. Abbildungsverzeichnis... XIII. Tabellenverzeichnis... XVII. Abkürzungsverzeichnis...

Multidimensionale Datenbanksysteme

Informationstechnik in der Kreditwirtschaft

Inhaltsverzeichnis. Frank Schönefeld. Praxisleitfaden Enterprise 2.0

Project Scorecard - Ein Instrument zur Unterstützung des Managements von strategischen Projekten

Managementprozesse und Performance

Customer Information Management

Strategisches Multiprojektmanagement

Inhaltsübersicht INHALTSVERZEICHNIS...III ABBILDUNGSVERZEICHNIS... X TABELLENVERZEICHNIS... XII ABKÜRZUNGSVERZEICHNIS...XIII 1 EINLEITUNG...

Geleitwort... V. Vorwort... VII. Inhaltsverzeichnis... IX. Abbildungsverzeichnis...XIV. Tabellenverzeichnis...XVI. Abkürzungsverzeichnis...

Prozessmanagement für Dienstleistungen

Seminar C16 - Datenmodellierung für SAP BW

XML in der betrieblichen Praxis

Fragenkatalog zum Kurs 1666 (Datenbanken in Rechnernetzen) Kurstext von SS 96

Agenda. Lösungsentwicklungsprozess Rahmenbedingungen für arvato SPL Entwicklungsarchitektur

Wirtschaftsförderung im 21. Jahrhundert

Business Intelligence Data Warehouse. Jan Weinschenker

Reihe: Supply Chain, Logistics and Operations Management Band 1. Herausgegeben von Prof. Dr. Dr. h. c. Wolfgang Kersten, Hamburg

2.1 Ist-Anwendungslandschaften Programme zur Gestaltung von Anwendungslandschaften

INFORMATION LIFECYCLE MANAGEMENT

Objektorientierte Systementwicklung

Datenbanken. Prof. Dr. Bernhard Schiefer.

Data Warehouse ??? Ein Data Warehouse ist keine von der Stange zu kaufende Standardsoftware, sondern immer eine unternehmensindividuelle

DW42: DWH-Strategie, Design und Technik

Werkstudent Qualitätssicherung (m/w) (627468)

OLAP und Data Warehouses

Referent: Alessandro Arrigo AAM1. Professor: Prof. Dr. Heindl. Furtwangen,

Möglichkeiten für bestehende Systeme

ORACLE PROFIL UND REFERENZEN

Basiswissen Software-Projektmanagement

Strategisches und operatives Kundenbeziehungs- Controlling 38

Vorwort zur 5. Auflage Über den Autor... 16

Immobiliencontrolling durch Business Intelligence

Office-basierte CAQ-Systeme - am Beispiel der Integration von Prüfplanung, FMEA und Reklamationsmanagement. Dissertation. Doktoringenieur (Dr.-Ing.

Wi rtschaftsi nfor mati k

BI Konsolidierung: Anspruch & Wirklichkeit. Jacqueline Bloemen. in Kooperation mit

Jürgen Schwab, debis Systemhaus

Wertschöpfungskonfiguration im internationalen Kontext

Basiswissen Software- Projektmanagement

Wolfgang Martin (Hrsg.) Data Warehousing. Data Mining - OLAP. An International Thomson Publishing Company

Java Enterprise Architekturen Willkommen in der Realität

Data/Information Quality Management

Von der spezialisierten Eigenentwicklung zum universellen Analysetool. Das Controlling-Informationssystem der WestLB Systems

2 Datenbanksysteme, Datenbankanwendungen und Middleware... 45

Workflow-Management für CORBA-basierte Anwendungen

Geleitwort... III. Danksagung... V. Inhaltsverzeichnis...VII. Abkürzungsverzeichnis... XIII. Abbildungsverzeichnis... XV. Tabellenverzeichnis...

Wolfgang Drews. Social Media. Market Intelligence

Software- Qualitätssicherung

Inhaltsverzeichnis. Dirk Stähler, Ingo Meier, Rolf Scheuch, Christian Schmülling, Daniel Somssich

TEIL A: GRUNDLAGEN. 1 Einleitung Ausgangslage und Problemstellung 1

Model Driven Architecture (MDA)

Teil A Grundlagen und Methoden 1. 1 Customer Relationship Management ein Bezugsrahmen 3

Erfassung von Umgebungskontext und Kontextmanagement

Erfolgsfaktoren von Customer Relationship Management Strategien

Datenmanagement. Simone Unfried, Passau Vitaly Aleev, Passau Claus Schönleber, Passau. Strategisches Informationsmanagement 1 (01/2006)

TRACK II Datenmanagement Strategien & Big Data Speicherkonzepte BI Operations Erfolgsfaktoren für einen effizienten Data Warehouse Betrieb

Adaptive Business- Intelligence-Systeme

1 Einführung SAP Business Information Warehouse BW Version Architekturplanung... 9

Jo Weilbach, Mario Herger SAP xapps - Architektur und Entwicklung mit dem Composite Application Framework. Galileo Press

Customer Relationship Ana lyt ics

Wirtschaftsinformatik Eine Einführung

Thorsten Winsemann. Bewertung von Datenpersistenz in. mithilfe multikriterieller. Entscheidungsmodelle

Enterprise Application Integration

Inhaltsverzeichnis. Christian Wischki. ITIL V2, ITIL V3 und ISO/IEC Gegenüberstellung und Praxisleitfaden für die Einführung oder den Umstieg

Transkript:

P Andreas Bauer + Holger Günzel (Hrsg.) Data-Wa re house-systeme Architektur Entwicklung Anwendung 2., überarbeitete und aktualisierte Auflage dpun kt.verlag

I n ha I t sve rzeic h n is Teil I 1 1.1 1.2 1.3 1.4 1.5 2 2.1 2.2 2.3 2.4 2.5 2.6.. 2.7 Architektur 1 Abgrenzung und Einordnung 5 Begriffliche Einordnung... 5 1.1.1 1.1.2 Definitionen... 7 Abgrenzung von transaktionalen Systemen... 8 Historie des Themenbereichs... 11 Anwendungsbereiche... 13 1.3.1 Informationsorientierte Anwendungen... 14 1.3.2 Analyseorientierte Anwendungen... 17 1.3.3 Planungsorientierte Anwendungen... 21 1.3.4 Kampagnenorientierte Anwendungen... 23 Einführung in das Beispiel Star *Kauf... 25 Überblick über das Buch... 28 Referenzarchitektur 31 Aspekte einer Referenzarchitektur... 31 2.1.1 Referenzmodell für die Architektur von Data-Warehouse-Systemen... 32 2.1.2 Beschreibung der Referenzarchitektur... 34 Data-Warehouse-Manager... 37 Datenquelle... 38 2.3.1 Bestimmung der Datenquellen... 39 2.3.2 Datenqualität... 43 2.3.3 Klassifikation der Quelldaten... 45 Monitor... 47 Arbeitsbereich... 48 Extraktionskomponente... 49 Transformationskomponente... 50

Ix Inhaltsverzeichnis 2.8 2.9 2.10 2.11 2.12 2.13 2.14 3 3.1 3.2 3.3 3.4 3.5 3.6 4 4.1 Ladekomponente... 51 Basisdatenbank... 51 2.9.1 Charakterisierung. Aufgaben und Abgrenzung... 52 2.9.2 Aktualisierungsalternativen der Basisdatenbank... 55 2.9.3 Qualität der Daten in des Basisdatenbank... 55 Data Warehouse... 57 2.1 0.1 2.10.2 2.10.3 Unterstützung des Ladeprozesses... 58 Unterstützung des Analyseprozesses... 58 Data Marts - Verteilung des Data Warehouse... 59 Analyse... 63 2.11.1 Darstellungsformen... 64 2.11.2 Funktionalität... 65 2.1 1.3 Realisierung... 66 2.11.4 Plattformen... 68 Repositorium... 68 Metadatenmanager... 70 Zusammenfassung... 71 Phasen des Data Warehousing 75 Monitoring... 75 3.1.1 Realisierungen des Monitoring... 76 3.1.2 Monitoring-Techniken... 77 Extraktionsphase... 81 Transformationsphase... 83 3.3.1 Datenintegration... 83 3.3.2 Bereinigung... 89 Ladephase... 94 Analysephase... 97 3.5.1 Data Access... 97 3.5.2 Online Analytical Processing (OLAP)... 97 3.5.3 Data Mining... 109 Zusammenfassung... 117 Physische Architektur 119 Speicherarchitekturen für das Data Warehouse und die Basisdatenbank... 119 Architektur eines Datenbankverwaltungssystems... 120 Speichermodelle für Daten... 120 4.1.1 4.1.2

Inhaltsverzeichnis 7 4.2 Schichtenarchitekturen... 122 4.2.1 Einschichtenarchitektur... 124 4.2.2 Zweischichtenarchitektur... 124 4.2.3 Dreischichtenarchitektur... 126 4.2.4 N-Schichtenarchitektur... 126 4.2.5 Web-basierte Architektur... 127 4.3 Middleware... 132 4.3.1 Normen und Spezifikationen... 132 4.3.2 Middleware-Systeme... 132 4.3.3 Common Object Request Broker Architecture (CORBA). 134 4.3.4 Web-Services... 136 4.3.5 Distributed Component Object Model (DCOM)... 138 4.3.6. NET... 139 4.3.7 Java 2 Enterprise Edition... 141 4.4 Schnittstellen... 143 4.4.1 Klassifikation von Schnittstellen... 143 4.4.2 Techniken und Standards... 144 4.4.3 Datenaustauschformate... 146 4.5 Sicherheit... 148 4.5.1 Kommunikationssicherheit... 149 4.5.2 Benutzeridentifikation und Authentifizierung... 151 4.5.3 Auditing... 152 4.5.4 Zugriffskontrolle... 153 4.6 Zusammenfassung... 155 Teil II Entwicklung 157 5 Das multidimensionale Datenmodell 161 5.1 Konzeptuelle Modellierung... 162 5.1.1 Verschiedene Vorgehensweisen zur Definition einer Methodik... 164 5.1.2 Vorstellung verschiedener Designnotationen... 165 5.2 Logische Modellierung... 174 5.2.1 Notwendigkeit der Formalisierung des multidirnensionalen Modells... 175 5.2.2 Struktur des multidimensionalen Datenmodells... 176 5.2.3 Fehlende Werte in Würfelzellen (Nullwerte)... 180 5.2.4 Operatoren des multidimensionalen Modells... 181 5.2.5 Weitere Ansätze zur Forrnalisierung... 185 5.2.6 Grenzen und Erweiterungen des multidimensionalen Datenmodells... 187

(xii Inhaltsverzeichnis 5.3 5.4 6 6.1 6.2 6.3 6.4 7 7.1 7.2 7.3 7.4 Unterstützung von Veränderungen... 188 5.3.1 Zeitaspekte... 188 5.3.2 Aspekte der Klassifikationsveränderungen... 190 5.3.3 Aspekte der Schemaänderung... 193 Zusammenfassung... 200 Umsetzung des multidimensionalen Datenmodells 201 Relationale Speicherung... 202 6.1.1 Abbildungsmöglichkeiten auf Relationen... 202 6.1.2 Relationale Umsetzung multidimensionaler Anfragen... 214 6.1.3 Relationale Versionierungs- und Evolutionsaspekte... 220 Multidimensionale Speicherung... 225 6.2.1 Datenstrukturen... 226 6.2.2 Speicherung multidimensionaler Daten... 235 6.2.3 Dateneingabe... 239 6.2.4 Grenzen der multidimensionalen Datenhaltung... 241 6.2.5 Hybride Speicherung: Hybrides OLAP (HOLAP)... 242 Realisierung der Zugriffskontrolle... 243 6.3.1 Zugriffskontrollanforderungen... 244 6.3.2 Realisierungskonzepte... 248 Zusammenfassung... 252 Optimierung 253 Anfragen im multidimensionalen Modell... 254 Indexstrukturen... 255 7.2.1 Klassifikation der Indexstrukturen... 256 7.2.2 Eindimensionale Baumindexstrukturen... 258 7.2.3 Mehrdimensionale Baumindexstrukturen... 263 7.2.4 Bitmap-Indizes... 269 7.2.5 Vergleich der Indizierungstechniken... 275 Partitionierung... 277 7.3.1 Horizontale Partitionierung... 277 7.3.2 Vertikale Partitionierung... 280 7.3.3 Mini-Dimensionen als Spezialfall vertikaler Partitionierung... 281 7.3.4 Partitionierungssteuerung... 282 Relationale Optimierung von Star-Joins... 283

Inhaltsverzeichnis 4 7.5 Einsatz materialisierter Sichten... 286 7.5.1 Verwendung materialisierter Sichten... 288 7.5.2 Bestimmung des Auswertekontextes für Aggregatanfragen... 292 7.5.3 Statische Auswahl materialisierter Sichten... 297 7.5.4 Dynamische Auswahl materialisierter Sichten... 305 7.5.5 Aktualisierung materialisierter Sichten... 308 7.6 Optimierung eines multidimensionalen Datenbanksystems... 318 7.6.1 Partitionierung... 319 7.6.2 Speicherung der Zellen... 323 7.6.3 Datenblockindizierung... 324 7.7 Zusammenfassung... 325 8 Metadaten 327 8.1 Die Rolle von Metadaten beim Data Warehousing... 327 8.2 Metadatenmanagement... 330 8.2.1 Anforderungen an Data-Warehouse-Repositorien... 330 8.2.2 Repositorium- und Metadatenaustauschstandards... 333 8.3 Data-Warehouse-Metadatenschemata... 335 8.3.1 Eine Klassifikation für Metadaten... 336 8.3.2 Standards und Referenzmodelle... 338 8.4 Entwurf eines Schemas zur Verwaltung von Data-Warehouse-Metadaten... 342 8.4.1 Funktionale Aspekte... 343 8.4.2 Personen, Organisation und Aufgaben... 345 8.4.3 Business-Metadaten... 345 8.4.4 Abstraktionsstufen... 346 8.5 Zusammenfassung... 347 Teil 111 Anwendung 349 9 Vorgehensweise beim Aufbau eines Data-Warehouse-Systems 353 9.1 Data-Warehouse-Strategie... 353 9.1.1 IT-Strategie... 354 9.1.2 Data-Warehouse-Strategie... 356 9.1.3 Rolle des Data Warehousing innerhalb der IT-Strategie.. 356 9.2 Ableitung der Data-Warehouse-Architektur... 357 9.2.1 Data-Warehouse-Rahmenwerk als gesamtheitliche Vorgabe... 358 9.2.2 Umgang mit mehreren Data-Warehouse-Systemen... 361 9.2.3 Architekturüberlegungen in der Praxis... 364 9.2.4 Umgebungen im Hinblick auf Entwicklung, Test, Produktion und Wartung... 366

E Inhaltsverzeichnis 9.3 Data-Warehouse-Vorgehensweise... 368 9.3.1 Phasenkonzept... 369 9.3.2 Vorgehensweisen bei der Einführung... 372 9.3.3 Machbarkeitsbetrachtung zum Data Warehousing... 376 9.3.4 Analysephase... 377 9.3.5 Designphase... 381 9.3.6 Implementierungsphase... 382 9.4 Zusammenfassung... 385 10 Das Data-Warehouse-Projekt 387 10.1 Data-Warehouse-Projektorganisation... 387 10.1.1 Projektrollen und Projektsteuerung... 388 10.1.2 Projektteam und Rollenverständnis... 389 10.1.3 Kommunikation... 392 10.1.4 Konfliktmanagement... 393 20.1.5 Qualitätssicherung... 394 10.1.6 Dokumentation... 395 10.2 Softwareauswahl... 396 10.2.1 Nutzen und Notwendigkeit der Produktauswahl... 396 10.2.2 Klassifikation der Produkte anhand der Referenzarchitektur... 397 10.2.3 Vorgehensweise zur Produktauswahl... 399 10.2.4 Allgemeine Kriterien für die Produktauswahl... 406 10.2.5 Kriterien für Datenbeschaffungswerkzeuge... 407 10.2.6 Kriterien für OLAP-Produkte... 412 10.3 Hardwareauswahl... 417 10.3.1 Auswahlbestimmende Faktoren... 418 10.3.2 Datenspeicherung... 419 10.3.3 Archivspeichermedien... 420 10.3.4 Multiprozessorsysteme... 421 10.3.5 Fehlertoleranz als Planungsziel... 423 10.3.6 Flaschenhälse und Fallstricke... 424 10.3.7 Backup-Strategien und Notfallpläne... 424 10.4 Erfolgsfaktoren beim Aufbau eines Data-Warehouse-Systems... 426 10.4.1 Institutionelle Aufgaben des Projektmanagements: Projektorganisation... 426 10.4.2 Funktionale Aufgaben des Projektmanagements: Projektabwicklung... 428 Empfehlungen für ein Data-Warehouse-Projekt... 430 10.4.3 10.5 Wirtschaftlichkeitsbetrachtungen... 431 10.5.1 Kostenbetrachtung... 432 10.5.2 Nutzenbetrachtung... 433 10.6 Zusaßhmenfassung... 437

Inhaltsverzeichnis 7 11 11.1 11.2 11.3 11.4 11.5 11.6 11.7 Betrieb eines Data-Warehousedystems 439 Administration... 439 11.1.1 Anforderungen und resultierende Aufgaben... 440 11.1.2 Organisationsformen für den Betrieb... 447 Iterativer Datenbeschaffungsprozess... 449 Performanz-Tuning von Data-Warehouse-Systemen... 455 11.3.1 Der Performanz-Tuning-Prozess... 455 11.3.2 Maßnahmen aus Sicht des Informationsmanagements... 456 11.3.3 Maßnahmen aus Sicht des Datenbankdesigns... 457 11.3.4 Maßnahmen aus Sicht der Applikationsumgebung... 460 11.3.5 Maßnahmen aus Sicht der Datenbankzugriffe... 462 11.3.6 Maßnahmen aus Sicht der Datenbankkonfiguration... 463 11.3.7 Maßnahmen aus Sicht des Betriebssystems... 465 11.3.8 Maßnahmen aus Sicht des Netzwerks... 466 11.3.9 Maßnahmen aus Sicht des Hardwaresystems... 467 Analyseprozess... 468 11.4.1 Schere zwischen Systemleistung und Anwendererwartungen... 468 11.4.2 Anwenderbetreuung... 471 11.4.3 Tipps und Tricks im Umgang mit Anwendern... 473 Rolle des Repositoriums... 473 Sicherungsmanagement... 475 11.6.1 Backup und Recovery... 475 11.6.2 Entsorgung von Daten... 477 11.6.3 Datenbank- und Systemverfügbarkeit... 479 11.6.4 Phasen eines Recovery-Plans... 480 Zusammenfassung... 481 12 Praxisbeispiele 483 12.1 Data Warehousing in der Gesundheitsberichterstattung... 484 12.1.1 Das Epidemiologische Krebsregister Niedersachsen (EKN)... 484 12.1.2 Unterstützung umweltbezogener epidemiologischer Forschung durch modernes Data Warehousing... 485 12.1.3 Fazit... 491 12.2 Praxisbeispiel aus dem Verlagswesen... 491 12.2.1 Vorstellung des Axel Springer Verlags... 492 12.2.2 Das Data-Warehouse-Projekt im Anzeigenbereich... 492 12.2.3 Fazit... 497

Inhaltsverzeichnis 12.3 Panelorientierte Marktforschung... 498 12.3.1 Das Unternehmen GfK AG und die GfK Marketing Services GmbH... 499 12.3.2 Data Warehousing in der panelorientierten Marktforschung... 499 12.3.3 Fazit... 504 12.4 Grundlagenforschung: Geowissenschaften... 505 12.4.1 12.4.2 Data Warehousing in den Geowissenschaften... 506 Das ICDP-Projekt und sein Träger... 505 12.4.3 Fazit... 511 12.5 Chemie: Distribution von Produktdaten... 512 12.5.1 12.5.2 Das Unternehmen Merck KGaA... 512 Data Warehousing für Produktdaten... 513 12.5.3 Fazit... 517 12.6 Zusammenfassung... 518 Anhang 519 A Abkürzungen 521 B Glossar 525 C Autorenverzeichnis 531 D Autorenzuordnung 541 E Literatur und Web-Referenzen Stichwortverzeichnis 545 5 77