Ergebnisse der BARC-Studie Data Warehouse Plattformen Dr. Carsten Bange BARC-Studie Data Warehousing und Datenintegration Data-Warehouse -Plattformen und Datenintegrationswerkzeuge im direkten Vergleich Jahr Zugriff auf Studie und Aktualisierungen im Web verf ügbar ab Mai 006 fortlaufende Erweiterung und Aktualisierung Preis:.9 Euro IBM Microsoft NCR Oracle SAP SAS Sybase Bewertung folgender Lösungen: DB Data Warehouse Edition Ab Initio SQL Server 00 Business Objects Teradata Group Oracle 0g R IBM NetWeaver00s BI IWay SAS 9 Informatica Adaptive Server IQ Solonde Co>Operating System Data Integrator Sagent Solution DataStage ETL Manager PowerCenter TransformOnDemand
Ausgewählte Ergebnisse der neuen BARC-Studie Begrüßung, Softwaremarkt Vorstellung, Erwartungen Architektur und Komponenten Applikationen Information Lifecycle Management Fazit Markt Etablierte DWH-Anbieter IBM, NCR Teradata, Oracle, SAS Shooting-Star SAP Herausforderer Microsoft DataAllegro, Exasol, Netezza, Sybase, SAND Keimling: Open Source mysql, Postgres
Preise Preise sinken Weiterhin starker Wettbewerb der etablierten Anbieter Microsoft als Herausforderer Neue Wettbewerber mit speziellen Technologien Open Source Bündelangebote inkl. ETL, Frontends, etc. Mittelstandsangebote vieler Anbieter Ausgewählte Ergebnisse der neuen BARC-Studie Begrüßung, Softwaremarkt Vorstellung, Erwartungen Architektur und Komponenten Applikationen Information Lifecycle Management Fazit 6
Systemplattformen Linux-Unterstützung inzwischen weit verbreitet Breitere Unterstützung von 6-bit Plattformen Möglichkeit zum Einsatz preiswerterer Hardware Lizenzmodelle für Dual-Core Prozessoren und Virtualisierung teilweise noch nicht ausgereift 7 Architekturvarianten und Performance Keine etablierte Standardarchitektur, sondern weiterhin Vielfalt SMP, MPP, Grid, shared disk, shared nothing, TCO-Betrachtung am konkreten Fall notwendig 8
Parameter für Skalierbarkeit und Performance Abfrage-Komplexität Anzahl Queriespro Tag Anzahl User Real-Time Modellupdate Data Mining und Statistik 0000 < 000 > 000 > 000 Analyse und Planung < 000 > 00 Ad-Hoc Berichtswesen < 00 > 00 Standardberichtswesen < 00 > 0 Einfaches Star Schema < 00 GB Produktgruppe / Woche Verknüpftes Star Schema Normalisiert + Data Marts Mandantenfähigkeit Modellgetriebene Architektur > 00 GB >, TB > TB > 0 TB Produkt / Tag Rechnung / Tag Einzelposition / mehrf. täglich Einzelposition / Real-Time Datenmodell-Komplexität Datenmenge Datengranularität 9 Speicherung und Zugriff auf mehrdimensionale Daten MDX etabliert sich als Abfragesprache für analytische Zwecke Hersteller bieten unterschiedliche Zugriffswege auf dimensionale Daten MDX MDX SQL SQL Hyperion Essbase Microsoft UDM SAP Microsoft SAS Oracle (kein MDX) IBM NCR Teradata Sybase 0
Funktionserweiterung zu DWH-Plattformen Steigerung der Datenbankautonomie Monitoring, Self-Healing, Selbst-Administration, Erweiterung der Daten- und Speichertypen relational, mehrdimensional, XML, BLOB/CLOB Werkzeuge für Datenintegration und Datenqualitätsmanagement Funktionen für Data Mining, Reporting Ausgewählte Ergebnisse der neuen BARC-Studie Begrüßung, Softwaremarkt Vorstellung, Erwartungen Architektur und Komponenten Applikationen Information Lifecycle Management Fazit 6
Analytische Applikationen Analytische Applikationen bieten vorkonfigurierte Komponenten auf allen Ebenen eines Data-Warehouse- Systems Datenmodelle mit Dimensionen und Kennzahlen Datenintegration aus Standardsystemen Standardberichte und Analysecockpits Horizontale analytische Applikationen für Funktionen Vertikale analytische Applikationen für Branchen Wesentliche Anforderungen Abdeckungsgrad der Anforderungen Erweiterungsfähigkeit Integration zwischen verschiedenen Modellen zu einem Enterprise Data Warehouse Applikationen und vordefinierte Datenmodelle SAP und SAS schon lange mit vordefinierten Inhalten (Content) und Applikationen im Markt Starker Ausbau bei IBM Oracle NCR Teradata (Zukauf DecisionPoint) Weitere Angebote bei ETL- und Frontendanbietern wie Business Objects oder Cognos 7
Ausgewählte Ergebnisse der neuen BARC-Studie Begrüßung, Softwaremarkt Vorstellung, Erwartungen Architektur und Komponenten Applikationen Information Lifecycle Management Fazit Datenexplosion Terabyte.000 900 800 700 600 00 00 00 00 00 0 Datenmenge im Data Warehouse von Wal Mart 7 0 000 99 99 996 998 000 00 00 006 008 Q: NCR, Information Week 6 8
Ansprüche wachsen Verfügbarkeit Weltweit, x7 x7 Einsatzbereiche Unternehmensweit & -übergreifend Historisierung Langfristige Aufbewahrung Granularität Zugriff auf auf detaillierte Daten Aktualität Echtzeit-Daten 7 Was passiert mit der Datenmenge? Verfügbarkeit Weltweit, x7 x7 Einsatzbereiche Unternehmensweit & -übergreifend Historisierung Langfristige Aufbewahrung Granularität Zugriff auf auf detaillierte Daten Aktualität Echtzeit-Daten 0 9 8 7 6 Lineare Skala 8 9
Was passiert mit der Datenmenge? Verfügbarkeit 7.000.000 0.000.000 6.000.000.000.000 Weltweit, x7 x7 Logarithmische Skala.000.000 00.000.000.000 Einsatzbereiche 0.000.000.000.000 Unternehmensweit & -übergreifend.000.000.000.000 00 0 Historisierung 0 Ausgangslage Ausgangslage eine Dimension zwei drei Langfristige Dimension Aufbewahrung Dimensionen Dimensionen Granularität Zugriff auf auf detaillierte Daten Aktualität eine Echtzeit-Daten zwei drei vier Dimensionen Dimensionen Dimensionen Dimensionen Beispieldaten: Erhöhung des Detailgrades einer Dimension bei 0x mehr Werten auf einer Detailebene tiefer 9 Was passiert mit der Datenmenge? Aktualisierung monatlich Verfügbarkeit Werte pro Monat Weltweit, x7 x7 Einsatzbereiche Unternehmensweit & -übergreifend Logarithmische Skala 00.000 0.000.000 Historisierung 00 Langfristige Aufbewahrung 0 Granularität Zugriff auf auf detaillierte Daten monatlich wöchentlich täglich stündlich minütlich Aktualität Echtzeit-Daten wöchentlich täglich stündlich 8 67 minütlich 0.0 sekündlich.9.00 0 0
Information Lifecycle Management Stark wachsende Datenmengen in Data Warehouses sind typisch Wichtig: Design und Planung von Datenmodell und Systemarchitektur Hilfreich: Archivierung und Near-Line Storage für selten benutzte Daten aktiv genutzt unregelmäßig genutzt Quelle: Inmon: ILM for Data Warehouses Ausgewählte Ergebnisse der neuen BARC-Studie Begrüßung, Softwaremarkt Vorstellung, Erwartungen Architektur und Komponenten Applikationen Information Lifecycle Management Fazit
Fazit Weiterhin dynamischer Softwaremarkt Skalierbarkeit und Performance bleiben die Kernherausforderungen bei wachsenden Datenmengen und Komplexität Gesamtkosten für Einführung und Betrieb müssen weiter sinken Technologie entwickelt sich mit den Ansprüchen (aber selten schneller als diese) Ihr Ansprechpartner DR. CARSTEN BANGE Geschäftsführer BARC GmbH Wiesenweg D-9708 Würzburg Tel. +9 (0)9/8806-0 E-Mail: cbange@barc.de Fax +9 (0)9/8806-8 Internet: www.barc.de
BARC-Studien Aktuelle Produktvergleiche aus dem BARC-Labor OLAP und Business Intelligence 7 Multidimensionale Datenbanken 7 Reporting und Analyse-Werkzeuge Frontends für SAP BW BI-Tools für Microsoft SQL-Server Betriebswirtschaftliche Anwendungen 8 Planungswerkzeuge Konsolidierungswerkzeuge 0 Balanced-Scorecard Anwendungen 0 Lösungen für analytisches CRM Data Management 8 Datenintegrationswerkzeuge 7 Data-Warehouse-Werkzeuge Lösungen für Datenqualitätsmanagement Dokumentenmanagement Dokumentenmanagement-Systeme Anzahl verglichener Werkzeuge In der jeweiligen Studie