André Maurer Wirtschaftsinformatik FH 2.5 Fachhochschule Solothurn, Olten
|
|
- Mathias Grosse
- vor 8 Jahren
- Abrufe
Transkript
1 Data Warehousing und Data Mining Zusammenfassung André Maurer www. Wirtschaftsinformatik FH 2.5 Fachhochschule Solothurn, Olten
2 Inhaltsverzeichnis Inhaltsverzeichnis 1 Einführung Entscheidungen Datengrundlage eines EUS Interne Analyse Externe Analyse Herkunft der Daten für EUS / FIS Data Warehouse vs operative Systeme Gründe für die Trennung von DaWa und operativen Systemen: Data Mining Arten von Data Mining Problemen Methoden des Data Mining Prozessschritte der Wissensentdeckung Business Inteligence 7 2 Data Warehousing Probleme beim Data Warehouse Inhalt eines Data Warehouse Architektur Zentralisierte Architektur Data Marts Modularisierung: Enterprise Data Mart Enterprise Data Warehouse (EDaWa) Entwicklung von DM und DW Ladeprozess Datentransformation Logische Transformation Physische Transformation Analyseprozesse in Data Warehouses Standardberichte und anfragen Anfragen an Übersichtstabellen, OLAP Data Mining auf Detail-Daten Schnittstellen zu anderen Anwendungen Zugriffe auf operative und analytische Daten Modellierung von Data Warehouses Objekte eines analytischen Datenmodells Modellierungsebenen 22 zf_dw_dm.doc Seite I
3 Inhaltsverzeichnis Mehrdimensionale und Multirelationale Datenbanken Entwicklung und Betrieb von Data Warehouses Performanceprobleme 28 3 Data Mining Klassifikation (Methoden) Entscheidungsbäume Neuronale Netze K Nearest Neighbour (knn) Batch Nested Generized Exemplars (BNGE) Clusteranalyse Clustermethoden Assoziationsregeln Transaktionen und Assoziationsregeln Kennzahlen für Assoziationen Prinzip des Assoziationsregellernens Sequenzmuster Prinzip der Sequenzmuster-Erkennung Data Mining Prozess CRISP-DM Das CRISP-DM Referenzmodell Web-Mining Clickstream als Datenquelle Mögliche Dimensionen der Analyse Design der Website zur Unterstützung des Web Usage Mining Clickstream Data Mart 41 4 Literaturverzeichnis Abbildungs- / Tabellenverzeichnis zf_dw_dm.doc Seite II
4 1 Einführung Ziel von Data Warehousing und Data Mining ist es aus Unternehmensdaten entscheidungsrelevantes Wissen herleiten zu können. 1.1 Entscheidungen Eine Entscheidung ist eine rationale Wahl einer Aktion in einer gegebenen Umwelt. Ein Entscheidungsprozess ist nur rational, wenn er auf sinnvollen Kriterien und gültigen Daten basiert. Das Ergebnis einer Entscheidung ist eine Aktion oder Strategie. Entscheidungsunterstützende Systeme (EUS) helfen den Entscheidungsträgern bei der Lösung komplexer Probleme: Führungsinformationssystem (FIS) Bereitstellung der relevanten Informationen zur Vorbereitung einer Entscheidung Entscheidungsunterstützende Systeme (EUS) Zusätzlich zum FIS stehen Methoden und Modelle für Planungs-, Entscheidungs- und Kontrollprozesse zur Verfügung. Entscheidungen können in verschiedene Kategorien unterteilt werden: Reichweite Neuigkeitsgrad Strukturierungsgrad Automatisierbarkeit Informationssysteme Langfristig (strategisch) mittelfristig (taktisch) Kurzfristig (operativ) Innovativ Schlecht strukturiert Niedrig EUS, FIS (eingeschränkt) Adaptiv Semi-strukturiert Mittel EUS Routiniert Wohl-strukturiert hoch administrative / dispositive Systeme Tabelle 1: Kategorien von Entscheidungen 1.2 Datengrundlage eines EUS Ein EUS benötigt interne und Externe Daten Interne Analyse Daten die aus der Unternehmung kommen: z.b. Kapazitätsauslastung, technischer Stand, Personalentwicklung, Finanzsituation, Betriebsergebnis. Die Internen Daten können folgendes sein: Mengen (Erzeugungen, Verbrauche, Bestände, techn. Kapazitäten) Werte (Umsätze, Kosten, Betriebsergebnisse, Deckungsbeiträge) Personal (Anzahl, Einsatz, Qualifikation, Altersstruktur) Kennzahlen (Verknüpfung von Mengen-, Wert-, und Personaldaten) Gliederungszahlen (Prozentanteile) (z.b. Anteile der Entwicklungskosten an Gesamtkosten eines Produkts) Beziehungszahlen (z.b. Fr./Kopf, Materialverbrauch/Artikel) zf_dw_dm.doc Seite 1
5 Das EUS macht aus internen Daten folgende Auswertungen: Funktionsübergreifende Berechnungen (Cross Referencing) (z.b. Personalkosten pro Produkt) Zeitbezogene Auswertungen (z.b. Verkäufe pro Woche, Monat, Quartal ) Vergleichswerte über längere Zeiträume (z.b. Verkäufe jeweils im 1. Quartal der letzten 4 Jahre) Funktionsübergreifende Berechnungen über Zeiträume (z.b. Auswirkung einer Marketingkampagne auf die Verkäufe der vergangenen sechs Monate) Externe Analyse Externe Daten sind z.b. Marktentwicklung, Konjunkturverlauf, Käufereinstellung, Konkurrenzverhalten, technologische Innovation, Rohstoffpreise, politische Entscheidungen (Zinspolitik, Steuergesetzgebung ), soziologische Einflüsse Herkunft der Daten für EUS / FIS Direkter Zugriff Das EUS / FIS greift direkt auf operative Informationsquellen zu: Operative Anwendungen Operative Anwendungen Datenbankverwaltungssystem(e) Datenbanken operative Systeme EUS- Anwendungen EUS- Anwendungen Nachteile: Zu Viele Daten werden gespeichert lange Berechnungszeiten für Auswertungen Behinderung des operativen Geschäfts während Auswertungen durch das EUS Zu grosse Datenmengen Keine einheitlichen Formate Abbildung 1: Zugriff auf operative Informationsquellen Data Warehouse Zur Verhinderung der Nachteile aus dem direkten Zugriff dient ein Data Warehouse (DaWa). Ein DaWa macht eine Selektion (Auswahl) und Aggregation (Verdichtung nach Dimensionen) aller für das EUS relevanten Daten in einer eigenen Datenbank. Die Übernahme aus operativen Systemen erfolgt bei Erreichen eines stabilen Zustandes oder zyklisch (täglich, wöchentlich ) bei sich ständig ändernden Daten. Die Trennung operativer Daten von Analysedaten ist ein fundamentales Konzept eines DaWa. zf_dw_dm.doc Seite 2
6 Operative Anwendungen EUS- Anwendungen Datenbankverwaltungssystem(e) Datenbankverwaltungssystem Datenabruf aus externen Quellen Datenbanken operativer Systeme Periodische Selektion und Transformation Data Warehouse Manuelle Eingabe Abbildung 2: Daten aus dem DaWa 1.3 Data Warehouse vs operative Systeme Administrations- und Dispositionssysteme Entscheidungsunterstützende Systeme Datenbestand Operative Daten: In der Regel aktuelle Daten Oft nur für abgegrenzten Unternehmens- und Funktionsbereich Datenformate Datenbestände oft unkoordiniert gewachsen Unterschiedliche Formate Kein einheitliches Datenmodell Datenzugriff Sehr häufige Transaktionen Kurze Transaktionszeiten Tabelle 2: Anforderungen: DaWa - operative Systeme Analysedaten: Kombination von Daten mehrerer Systeme Daten über längeren Zeitraum Einheitliches Datenmodell Einheitliches Format Semantisch angepasst Langfristige aufwendige Analysen und Berechnungen Ein DaWa vereinigt Daten mehrerer operativer Systeme (z.b. mehrerer Abteilungen, Filialen, Tochtergesellschaften ). Die Formate müssen bei der Übernahme aus operativen Systemen transformiert werden. Die Semantische Integration muss vorgenommen werden (z.b. Ein Kunde wird in verschiedenen Systemen mit versch. Kd-Nr. geführt, im DaWa muss der Kunde unter einer einheitlichen Kd-Nr. geführt werden.) Daten im DaWa sind beständig Im Gegensatz zu operativen Systemen werden die Daten im DaWa nur in Ausnahmefällen geändert oder gelöscht. In operativen Systemen gibt es unbeständige Daten (z.b. Lagerbestand) Es ist nicht sinnvoll, dynamische Daten im DaWa zu verwalten Erst bei Erreichen eines stabilen Zustands Oder durch periodische Schnappschüsse bei sich ständig ändernden Daten. In operativen Systemen gibt es Transaktionen, im DaWa Analyseprozesse Transaktionen sind in operativen Systemen häufig Der Umfang an Transaktionen ist gut abschätzbar zf_dw_dm.doc Seite 3
7 Analyseprozesse sind teilweise sehr aufwendig sind betreffen grosse Datenmengen verschiedener Bereiche haben keinen von vornherein abschätzbaren Aufwand Die Analyse auf operativen Datenbanken gefährdet deren Performance Daten im DaWa werden über einen längeren Zeitraum aufbewahrt Grosse Mengen inaktiver Daten verringern die Performance. Deshalb werden Daten in operativen Systemen gelöscht bzw. archiviert. Ein DaWa benötigt Daten über einen langen Zeitraum (>5 Jahre) Die Speicherkosten im DaWa sind relativ gering. Die meisten Kosten (ca %) entstehen bei der Datenübernahme und bereinigung Gründe für die Trennung von DaWa und operativen Systemen: Unterschiedliche Performance-Anforderungen Kombination von Daten mehrerer Anwendungen Daten sind beständig Speicherung der Daten über längeren Zeitraum 1.4 Data Mining Mit Data Mining (DaMi) bedeutet die Identifikation von wettbewerbsrelevantem Wissen aus grossen Datenmengen. Vorhersagen Automatische Extraktion von Informationen zu Vorhersage von Trends und Verhalten z.b. Marketing auf Basis kundenindividueller Informationen, Lebensversicherung, Kreditbeurteilung Mustererkennung Automatische Erkennung vorher unbekannter Muster z.b. Typisches Kundenverhalten, Betrugserkennung Data Mining ist jedoch nicht Data Warehousing Ad hoc Anfragen / Reportgenerierung Online Analytic Processing (OLAP siehe 2.5.5) (das die Frage WAS passiert beantwortet) Datenvisualisierung Software Agenten Data Mining dient der Vereinfachung und Automatisierung statischer Prozesse (Datenanalyse, Anwendung der Modelle). Mittels DaMi können nicht bekannte Zusammenhänge erkannt werden. Data Mining sagt, WARUM Dinge passiert sind. zf_dw_dm.doc Seite 4
8 1.4.1 Arten von Data Mining Problemen Klassifikation Clustering Lernen einer Menge von Regeln, die Objekte aufgrund ihrer Attribute vorgegebenen Klassen zuordnen. Aufteilung einer Datenmenge in disjunkte Gruppen (Gruppen ohne gemeinsame Teilmenge) ähnlicher Objekte: Anders als bei der Klassifikation sind keine Klassen vorgegeben Ähnliche Datensätze bilden eine Klasse Möglichst grosse Ähnlichkeit mit anderen Objekten der Klasse Möglichst geringe Ähnlichkeit mit Objekten ausserhalb der Klasse. x x x x x x x x x x x x x x x x x x x x x x x x x x x x x xx x x x x x x x x xx xx x x x x x x x x x x x x x x x x x x x x x x x xx x x xx x x x x x x x x x x x x x x x Abbildung 3: Clustering Regression (Vorhersage) Lernen der Beziehungen einer Zielvariable von Ausgangsvariablen. Daten Januar 2001 Historische Daten ( ) Data Mining System Modell Vorhersage Februar 2001 Abbildung 4: Entstehung und Nutzung von Vorhersagemodellen Assoziationen (Warenkorbanalyse) Abweichungs- und Änderungsentdeckung Zeitreihenanalyse Lernen von Abhängigkeiten zwischen Daten, z.b. welche Gruppen von Werten kommen in Transaktionen gemeinsam vor. Entdecken von Unterschieden zu früher aufgezeichneten Daten oder vorgegebenen normativen Werten. Lernen von Regeln für typische Abläufe zur Prognose zeitlicher Veränderungen. zf_dw_dm.doc Seite 5
9 1.4.2 Methoden des Data Mining Entscheidungsbäume Grafische Darstellung einer Menge von Regeln für ein Klassifikationsproblem: Knoten = Entscheidungen Blätter = Klassen Neuronale Netze Regelinduktion 1 IF... THEN... Nearest Neighbor Genetsiche Algorithmen Die Verschiedenen Methoden / Modelle unterscheiden sich bezüglich ihrer Verständlichkeit Genauigkeit Entscheidungsbäume Einfach verständlich Weniger genau Regelinduktion Mittel verständlich Mittel genau Neuronale Netze Schwer verständlich Sehr genau Tabelle 3: Verständlichkeit, Genauigkeit der MiMa-Methoden Ein Modell kann verschieden genutzt werden: Qualitativ Gibt dem Marketing ein Verständnis über die Kunden und den Markt Erfordert Interaktionsmöglichkeiten und gute Visualisierung Quantitativ Automatisierter Prozess Es gibt verschiedene Typen von Datenanalyse: Beaufsichtigt (Supervised): Problemlösung Getrieben durch konkrete Probleme Analytiker gibt Untersuchungsrichtung vor Anwendung z.b. zur Optimierung eines gegebenen Marktes Unbeaufsichtigt (Unsupervised): Erkundigung Relevanz erkennen Nützlich um neue (unerwartete) Zusammenhänge zu erkunden 1 Induzieren: Ableiten, folgern, schliessen, herleiten zf_dw_dm.doc Seite 6
10 1.4.3 Prozessschritte der Wissensentdeckung periodischer Update Auswahl Vorverarbeitung Zieldaten Transformation Data Warehouse Data Mining Transformierte Daten Interpretation/ Evaluation Muster Wissen Daten Abbildung 5: Zusammenhang DaWa und DaMi Auswahl Fokussierung, Auswahl relevanter Daten Vorverarbeitung Bereinigung der Daten (z.b. was tun mit leeren Feldern) Transformation Verdichtung der Daten durch Datenreduktion und projektion Datenformat vereinheitlichen Data Mining Auswahl von Techniken und Methoden Evtl. viele Testläufe mit verschiedenen Parametern Interpretation / Evaluierung Beurteilung der Ergebnisse bzgl. festgelegter Kriterien Dokumentation, Visualisierung der Ergebnisse Überführung in die Anwendung 1.5 Business Inteligence Data Mining und Data Warehousing bietet Beispielsweise folgende Anwendungen: Customer Relationship Management Kundenprofile erstellen Zusätzliche Kundenkontaktpunkte (z.b. Call Center, ebusiness) Efficient Consumer Response Optimierung von Logistikprozessen / Regal- und Lagerflächen Marketing Database Marketing (Zielgruppenorientierte Aktionen) Typisches Kundenverhalten Cross Selling Bearbeitung von Geschäftsprozessen Klassifikationskriterien für Bonitätsbeurteilung Risikoanalyse von Versicherungen Betrugserkennung (z.b. Kreditkartenbetrug) Qualitätsanalyse (z.b. Schadensursache identifizieren) zf_dw_dm.doc Seite 7
11 2 Data Warehousing Das Data Warehousing ist die Gedächtnisfunktion von EUS Das Data Mining ist die Beurteilungsfunktion von EUS Definition 1: Ein DaWa (dt. Lagerhaus Daten einlagern) ist eine Datenbank, die strategische Entscheidungen unterstützt, indem sie umfangreiche und regelmässige Auszüge aus operativen Datenbanken periodenbezogen und oft aggregiert (zusammengefasst) Endbenutzern auch zur ad hoc-analyse (unvorbereitet) bereitstellt. Definition 2: Dt.: Datenlager Ein Data-Warehouse umfasst eine spezielle Datenbank, in die Daten aus vielen einzelnen (firmeninternen wie -externen) Datenbanken einfliessen, sowie ein Management-Informationssystems (MIS) zur Verarbeitung dieser Daten für einzelne Verwaltungsebenen. Das Data-Warehouse dient dazu, Führungskräften die Informationen zukommen zu lassen, die sie zur Kontrolle interner Abläufe und zur Entscheidungsfindung benötigen. Die Basisdaten müssen vor dem Transfer in das Data-Warehouse in ein einheitliches Format konvertiert werden, wobei so genannte Meta-Daten festhalten, welche Daten woher stammen und wie sie aufbereitet wurden. Danach erst kann der Gesamtbestand der Daten analysiert und ausgewertet werden. Ein Vorteil eines solchen Data-Warehouse ist, dass Mitarbeiter ohne Kenntnisse der "Standard Query Language" (SQL) oder anderer Abfragesprachen über eine grafische Benutzeroberfläche (GUI) ermitteln können, woher die einzelnen Daten stammen und wie sie bearbeitet wurden. Der Datenbestand kann nach Kriterien wie Zeitreihenanalyse und Trendermittlung ausgewertet werden. Solche Informationen finden in der Entscheidungsfindung des Unternehmensmanagements Verwendung. Als Erfinder des Data Warehouse gilt Bill Inmon, der den Begriff 1992 für ein solches System prägte, das er bei IBM entwickelt hat. Definition 3: Ein DaWa ist eine Themenorientierte, integrierte, zeitbezogene und nicht flüchtige Sammlung von Daten zur Unterstützung der Entscheidungen des Managements. Das DaWa ist themenbezogen und erhält Daten von vielen operationalen Systemen. Die Daten werden nach dem betriebswirtschaftlichen Umfeld des Unternehmens organisiert. Im Gegensatz zum DaWa sind operationelle Systeme prozessorientiert und werden durch ein System verwaltet. Das DaWa wird aus einer Vielzahl interner und externer Datenquellen gefüllt. Dabei spielt die Datenqualität eine wesentliche Rolle. zf_dw_dm.doc Seite 8
12 Im Gegensatz zum DaWa werden in operationellen Systemen DBs und Anwendungen unabhängig voneinander (und über lange Zeit) entwickelt. Daten eines DaWa werden langfristig gespeichert. Zeitreihenanalysen stellen den Hauptteil der Analysen dar. Die Daten werden persistent (Dauerhaftig) gespeichert. Auf ein DaWa wird nur lesend zugegriffen. Das Data Warehousing und Data Mining dient der Operativen Planung (Ausschöpfung vorhandener Erfolgspotentiale) mittels operativen Daten Strategischen Planung (Aufbau langfristiger Erfolgspotentiale) mittels strategischen Daten Data Warehouses sind analytische Datenbanken die Berichtsgeneratoren und Abfrage- und Analysewerkzeuge zur Verfügung stellen. Sie dienen Managern zur Entscheidungsunterstützung und zum nachträglichen Monitoring von Entscheidungen. Zudem dienen sie den Spezialisten zum Data Mining. Produktionsdatenbank (operative DB) Data Warehouse (analytische DB) Daten operativ Daten vollständig Daten detailliert Daten redundanzarm (fortschreibungsfreundlich) Daten änderungsintensiv Schlüssel i.d.r. natürlich meist Auswahlabfragen Abfragen häufig ad hoc Daten strategisch Daten periodenbezogen Daten oft abgeleitet (v.a. zusammenfassend) Endbenutzerorientiert / abfrageorientiert Schlüssel i.d.r. künstlich Tabelle 4: Operative vs. Analytische Datenbanken 2.1 Probleme beim Data Warehouse Betriebswirtschaftliche Probleme Datenauswahl Datenpräsentation Datenmodellierung Informationstechnische Probleme Unterschiedliche Datenformate bei operativen und analytischen Daten zf_dw_dm.doc Seite 9
13 Verbindung von Transaktionssystemen (oft Grossrechner) und Data Warehouse (oft Client-Server) Zeitpunkt für Datenauszüge Datenvolumen 2.2 Inhalt eines Data Warehouse Typisch für ein DaWa ist die Unterscheidung von Fakten (Indikatoren, Kennzahlen, Business Measure) Betriebswirtschaftlicher Erfolgsfaktor Aggregierbar Meist numerisches und kontinuierliches Attribut Erlaubt mehrdimensionale Messung Benötigen grosses Datenvolumen (ca. 70% des DaWa) Primärschlüssel aus den Fremdschlüsseln der Dimensionen z.b. Mengenumsatz, Geldumsatz, Kundenzahl Dimensionen Kriterien der Beurteilung Meist symbolisches und diskretes Attribut Erlaubt eine Auswahl, Zusammenfassung und Navigation eines Indikators Sind Primärschlüssel Nicht immer eindeutig erkennbar z.b. Periode, Standort, Produkt, Organisationseinheit, Kunden, Lieferanten Dimensionen und Fakten werden in einem Würfel (Cube bzw. Hypercube) vereinigt: Mehrdimensionale Datenstruktur, welche die gleichzeitige Analyse mehrerer Indikatoren und Dimensionen ermöglicht. Aufgabe eines DaWa ist es, einen Indikator nach seinen Dimensionen zu messen. z.b. wie hoch ist der Umsatz (Indikator) nach Periode, Produkt und Region (Dimensionen)? Region Haidhausen Schwabing Zentrum Juli Juni Mai Zeit Racer Future Tria- Racer Racer Junior Produkt zf_dw_dm.doc Seite 10
14 Abbildung 6: Mehrdimensionaler Würfel (Hypercube) 2.3 Architektur Operative Daten Externe Daten Ladeprozess Auswahl Transformation Integration Konkurrenz Branche Konjunkturentwicklung Demographische Daten Daten Data Warehouse Einzelheiten Zusammenfassungen Metadaten (Daten über Daten) 1 Information Zugriffswerkzeuge Berichtsgenerator Zweidimensionale Abfrage Mehrdimensionale Abfrage (OLAP) Data Mining... Endbenutzerzugriff 1 z.b. über Attribut Umsatz Fakt oder Dimension Aggergierbar (JA / NEIN) Wie aggregierbar Berechnungsformel Quelldaten Update, Periodizität Speicherformat Entscheidung Abbildung 7: Architektur eines DaWa Zentralisierte Architektur Datenbanken operativer Systeme Data Warehouse Alle analytischen Daten sind auf einer Plattform bedeutet: Geringe Redundanz 2 Hardwareersparnis Die Entwicklung eines zentralen DaWa ist jedoch Für die meisten Unternehmungen zu komplex Nur für kleinere Unternehmen geeignet Für heterogene Benutzerkreise zu benutzerunfreundlich und abfrageineffizient Abbildung 8: Zentralisierte DaWa-Architektur 2 Redundanz: Anteil einer Nachricht, der keine Information vermittelt ist überflüssig. zf_dw_dm.doc Seite 11
15 2.3.2 Data Marts Definition DM Datenbanken operativer Systeme Ein Data Mart (DM) ist ein lokales Data Warehouse, das sich auf die Daten eines Funktionsbereichs, einer Abteilung, einer Arbeitsgruppe oder einer komplexen Anwendung beschränkt. DM Abbildung 9: Data Mart DM Vorteile Entwicklungskomplexität kleiner Endbenutzerbeteiligung wahrscheinlicher Flexibilität grösser Datenmodell einfacher Abfrageeffizienz grösser Probleme Nicht immer skalierbar (keine lineare Zunahme der Antwortzeiten) Probleme bei Integration in Enterprise Data Warehouse Redundanzen sind schwer kontrollierbar Eventuelle Inkonsistenz unter Data Marts Höhere Entwicklungs- und Wartungskosten Modularisierung: Enterprise Data Mart DM Datenbanken operativer Systeme DM DM Koordination Abbildung 10: Enterprise Data Mart Verteilung analyt. Daten auf mehrere DM Vorteile Benutzeradäquate Werkzeuge Leicht verständliches Datenmodell Effizienter Zugriff Problem Übergreifende Analysen Koordination Ladezyklen Datenmodell: Attribute mit gleicher Bedeutung verwenden in allen DM die gleiche Bezeichner, Datentypen, Schlüssel und Datenquellen. Ziele Intramodulare Bindung maximieren Benutzer so homogen, dass: Antwortzeiten minimal Benutzerfreundlichkeit maximal Werkzeug an Anforderungen angepasst Intermodulare Koppelung minimieren Schnittstellen zwischen DM so schmal, dass DM-übergreifende Abfragen selten werden. zf_dw_dm.doc Seite 12
16 2.3.4 Enterprise Data Warehouse (EDaWa) EDaWa Zentrales DaWa Zentrales DaWa oder Vereinigung von Data Marts, das die unternehmensweite Information verteilt. DaWa, das operative Daten transformiert und koordiniert Data Marts zur Verfügung stellt. DM Datenbanken operativer Systeme Zentrales Data Warehouse DM DM Abbildung 11: Hierarchische Architektur Koordination lokaler DM durch ein EDaWa Ziel Extraktion, Integration und Verteilung der Daten Ziel der DM Abfrage und Analysen auf Teilen der Daten Anpassung an Bedürfnisse einer Organisationseinheit Datenverteilung Zeitgesteuert Ereignisorientiert auf Verlangen Koordinierte Attribute über EDaWa Voraussetzungen zur Koordination von DM: Fakten und Dimensionen müssen gleiche Bedeutung haben Gleich benennen (Synonyme vermeiden) Mit den gleichen Attributen beschreiben Fakten und Dimensionen mit unterschiedlicher Bedeutung Verschieden benennen (Homonyme vermeiden) Architektur Zentrales DW Data Marts Koordinierte DM Zentralisiert: auf einer Plattform Hierarchisch: edawa übernimmt Extraktion, Integration und Verteilung der Daten Koordiniert: Koordination versch. DMs Unkoordiniert: Keine Koordination zw. DMs Tabelle 5: Architekturen im Vergleich Unkoordinierte Architekturen führen zu Unkontrollierten Redundanzen Inkonsistenz Hohem Entwicklungsaufwand Ungenügender Skalierbarkeit 3 3 Skalierbarkeit: Ausbaubarkeit von Clients, Servern und Netz zf_dw_dm.doc Seite 13
17 2.3.5 Entwicklung von DM und DW operative Daten top- down bottom- up Zentrales Data Warehouse DM Abbildung 12: Entwicklungsmethoden Bottom-up: Aus der Verknüpfung mehrerer DM entsteht ein zentrales DaWa, das die untergeordneten DM mit koordinierten Daten beliefert. Probleme: Koordination: Redundanzen und Inkonsistenzen versch. DM Verträglichkeit der lokal entstehenden Datenmodelle Skalierbarkeit (Anpassung der Werkzeuge für grössere Datenmengen) Top-Down: Aus einem bestehenden DaWa werden DM herausgelöst. Parallel: Koordinierte Entwicklung von DM und EDaWa Data Mart (DM) EDW Ähnliche Begriffe lokales DW globales DW Hauptziel Modularisierung lokaler Daten und Abfragen redundanzarmes Unternehmungsdatenmodell für EUS Domäne Abteilung oder Anwendung Unternehmung Entwicklung / Betrieb Fachabteilung IT-Zentrale Grössenordnung bis 100 Gb (10 9 Byte) bis Terabytes (10 12 Byte, oft grösser als Produktionsdaten) Datenquelle EDW oder operative DB operative DB Granularität (Datendetail) oft gross (eher aus Aggregaten) meist klein (viele Transaktionsdetails) Normalisierungsgrad klein gross Hauptzugriffsart OLAP (meist ad hoc) SQL (oft vordefiniert) Entwicklung gut überblickbar aufwendig Typische Plattform mehrdimensionaler oder relationaler Datenbankserver RDBMS auf Unix-, Windows NToder Grossrechner Abbildung 13: Data Marts vs. EDaWa 2.4 Ladeprozess Datentransformation Die Datenübernahme aus den operativen Systemen in das DaWa erfolgt in periodischen Selektionen und Transformationen. Vor der Übernahme werden die Daten transformiert: Einheitliches Format Einheitliche Bezeichner Semantische Integration zf_dw_dm.doc Seite 14
18 Dazu werden die Daten in einen oder mehrere Zwischenspeicher (Data Staging Area), bearbeitet und dann erst in das DaWa übernommen. Werkzeuge zur Datentransformation nennt man ETL-Werkzeuge (Extract Transform Load) Nicht alle Zustandswechsel werden in das DaWa übertragen. Daten werden in das DaWa übernommen, sobald ein Endzustand erreicht ist Für Bestandesdaten werden periodische Schnappschüsse übertragen Logische Transformation Operationale Datenbanken sind normalisiert, um Redundanzen und Inkonsistenzen bei Datenveränderungen zu vermeiden. Die Transformation für das DaWa beinhaltet auch eine De-Normalisierung: Performancesteigerung Beziehungen im DaWa sind statisch Vergangene Zusammenhänge sollen erhalten bleiben (z.b. Preise zur Zeit der Auftragsbearbeitung) Order processing Customer Product orders price Available Inventory Product Price/inventory Product price Product Inventory Product Price changes De-normalized data Transform State Data Warehouse Customers Products Orders Product Inventory Product Price Marketing Customer Profile Product price Marketing programs Abbildung 14: De-Normalisierung Physische Transformation Einheitliche Begriffe Einheitliche Datentypen für das gleiche Datenelement Konsistente Verwendung von Attributwerten Behandlung unvollständiger Datensätze, Ersatzwerte Oft werden einfache Übersichten und Berichte schon bei der Transformation berechnet. Dies ergibt einen Effizienzgewinn (kürzere Rechnungszeiten) bei der Analyse. Anfragen und Berichte reichen von einfachen Aggragetionen / Summen bis zu komplexen Berechnungen Berechnung der Übersichten kann sehr aufwendig sein (z.b. Joins über mehrere Tabellen) Übersichtstabellen sind nicht nur einfache Berechnungen sondern basieren auf Geschäftsregeln (z.b. Was wird als Verkauf angesehen, was fällt unter Wartung) zf_dw_dm.doc Seite 15
19 Übersichten verstecken die Komplexität der Detaildaten und der Berechnungen. Der Anwender muss die Geschäftsregeln nicht kennen. 2.5 Analyseprozesse in Data Warehouses Standardberichte und anfragen Standerdberichte und anfragen werden für verschiedene Benutzer periodisch generiert. Sie sind nützlich für aufwendige Berechnungen und mehrfache Nutzung. Der DaWa-Administrator legt fest, was zu einem Standardbericht werden soll, indem er nachsieht welche Anfragen häufig durch die User gemacht werden und welche Anfragen die DB am meisten belasten. Der DaWa-User hat ebenfalls die Möglichkeiten einen Standardbericht zusammenzustellen Anfragen an Übersichtstabellen, OLAP Übersichtstabellen entstehen aus Detaildaten durch Filterung (z.b. Verkaufszahlen ausgewählter Warengruppen) Summierung (Aggregation) (z.b. Umsatz mit Produkt X) Übersichtstabellen sind die Grundlage der meisten Analysen im DaWa: Übertragung in multidimensionale Datenmodelle (z.b. Umsätze pro Jahr, Region, Produktegruppe) Data Mining auf Detail-Daten Die weitreichendste und nützlichste Analyse erfolgt auf Detaildaten Anfragen an Übersichtstabellen beantworten Fragen nach dem WAS Tiefergehende Detailanalyse kann Antworten geben auf Fragen nach dem WARUM und WIE Data Mining beginnt ebenso wie OLAP (siehe Kapitel 2.5.5) oft mit aggregierten Daten und verwendet die detaillierten Daten um Hypothesen zu verifizieren Gründe für Entdeckungen zu finden Analysen auf Detaildaten kommen nur für einen kleinen Teil der DaWa-Nutzer in Frage Schnittstellen zu anderen Anwendungen Schnittstellen zu anderen Anwendungen bieten die vierte Möglichkeit um Auswertungen zu machen. Wird auch für Data Mining benötitgt Zugriffe auf operative und analytische Daten Programmierte Berichte (erfordern oft Codeänderungen und sind zeitintensiv). zf_dw_dm.doc Seite 16
20 Abfrage- und Berichtssprachen wie SQL und QBE sind standardisiert und mächtig, aber für gelegentliche Benutzer zu schwierig. OLAP-Werkezuge erlauben auch dem gelegentlichen Benutzer flexible multidimensionale Abfragen. Abfragesprachen Prozedurale Abfragen (sind flexibler) Navigation meist Satzweise Anweisungsreihenfolge wichtig z.b. Visual Basic, Cobol, dbase Nichtporzedurale (deklarative) sind komfortabler Navigation tabellenweise Einzelne verbale oder grafische Anweisung z.b. QBE, SQL Grobübersicht SQL (Structured Query Language): Datenbankobjekte definieren create Datenbankobjekte manipulieren insert, update, delete Datenbankobjekte abfragen select Datananken schützen grant SQL-Kategorie Zweck Anweisungen Data Definition Language (DDL) Data Manipulation Language (DML) Data Control Language (DCL) Tabelle 6: SQL-Teilsprachen Definition von Datenbankobjekten Abfrage Änderung Transaktion Schutz / Sicherheit create, alter, drop, table, view, index select insert, delete, update lock, commit, rollback grant, revoke Mehrdimensionale SQL-Abfragen sind benutzerunfreundlich, weil oft Anweisungen zahlreich vorkommen müssen Anweisungen komplex sind (Mehrtabellenverbund, Aggregationen, Sortieren, Views) Zeitreihenanalyse aufwendig sind Rechenfunktion unzureichend ist (z.b. finanzmathematische, statische) OnLine Analytical Processing OLAP Definition OLAP ist eine Abfragemethode, die Endbenutzern einen mehrdimensionalen, schnellen Zugriff und eine benutzerfreundliche interaktive Analyse auf Data Marts ermöglicht. OLAP ist Mehrdimensional (weil es Indikatoren nach ihren Dimensionen analysiert) Endbenutzerfreundlich weil Direkte Manipulation möglich ist Ergebnisse einfach dargestellt und visualisiert werden zf_dw_dm.doc Seite 17
21 Detaillierend und zusammenfassend (weil Daten übersichtlich zusammengefasst und nur auf Verlangen detailliert sind) Analysierend und synthetisieren (weil der Benutzer Dimensionen einfach hinzufügen und weglassen kann) Schnell (weil es ad hoc-abfragen in Sekunden beantwortet und aufwendige ad-hoc-berechnungen durch Voraggregationen vermeidet) Data-Mart-orientiert Mit dem FASMI-Test kann mit 5 Kriterien getestet werden ob ein Produkt ein OLAP-Werkzeug ist: Fast Kommt die Antwort innert weniger Sekunden? Analysis Sind betriebswirtschaftliche und statistische Analysen sowie ad-hoc Berechnungen ohne Programmierkenntnisse möglich? Shared Ist Mehrbenutzerbetrieb möglich, Zugriffsrechte geregelt? Multidimensional Sind Multidimensionale Anfragen möglich? Information Werden alle relevanten Informationen, unabhängig vom Umfang und Inhalt verarbeitet? SQL sucht nach Details, OLAP fasst zusammen und vergleicht (im Hintergrund generieren OLAP-Werkzeuge allerdings auch SQL-Abfragen). Zusammenfassung (Aggregation) Vergleich Absoluter Vergleich Relativer Vergleich (Prozentualer Teil ) In OLAP-Werkzeugen stehen folgende Browsing-Möglichkeiten zur Verfügung: Drilling Down Detaillieren. Zu kleine Fallzahlen können bei mehrdimensionalen Analysen zu Informationsverlusten führen. Drilling Up Drilling Through Drilling Across Filtern Slicing Dicing / Pivoting Zusammenfassen (aggregieren). Eine Aggrgation kann zu Informationsverlusten führen. Detailzugriff auf operative Datenbanken (meist über vordefinierte SQL-Anweisungen) Zugriff auf mehrere Data Marts Wertauswahl Von einem Würfel sind auf einer zweidimensionalen Oberfläche nur zwei Dimensionen zu sehen (z.b. als Tabelle). Ein OLAP-Würfel ist in der Regel ein mehrdimensionaler Würfel mit mehr als drei Dimensionen Mittels Slicing (Slice = Scheibe) wird der Würfel um Dimensionen reduziert (in Scheiben geschnitten). Mittels Dicing (würfeln) wird der Würfel zum Anzeigen anderer Dimensionen gedreht (Rotation der Resultate um andere zf_dw_dm.doc Seite 18
Data Warehouse Definition (1) http://de.wikipedia.org/wiki/data-warehouse
Data Warehouse Definition (1) http://de.wikipedia.org/wiki/data-warehouse Ein Data-Warehouse bzw. Datenlager ist eine zentrale Datensammlung (meist eine Datenbank), deren Inhalt sich aus Daten unterschiedlicher
MehrFachbericht zum Thema: Anforderungen an ein Datenbanksystem
Fachbericht zum Thema: Anforderungen an ein Datenbanksystem von André Franken 1 Inhaltsverzeichnis 1 Inhaltsverzeichnis 1 2 Einführung 2 2.1 Gründe für den Einsatz von DB-Systemen 2 2.2 Definition: Datenbank
MehrData Warehouse ??? Ein Data Warehouse ist keine von der Stange zu kaufende Standardsoftware, sondern immer eine unternehmensindividuelle
??? Zusammenfassung, Ergänzung, Querverbindungen, Beispiele A.Kaiser; WU-Wien MIS 188 Data Warehouse Ein Data Warehouse ist keine von der Stange zu kaufende Standardsoftware, sondern immer eine unternehmensindividuelle
MehrData Cube. Aggregation in SQL. Beispiel: Autoverkäufe. On-line Analytical Processing (OLAP) 1. Einführung. 2. Aggregation in SQL, GROUP BY
Data Cube On-line Analytical Processing (OLAP). Einführung Ziel: Auffinden interessanter Muster in großen Datenmengen 2. Aggregation in SQL, GROUP BY 3. Probleme mit GROUP BY 4. Der Cube-Operator! Formulierung
MehrSeminar Business Intelligence Teil II. Data Mining & Knowledge Discovery
Seminar Business Intelligence Teil II Data Mining & Knowledge Discovery Was ist Data Mining? Sabine Queckbörner Was ist Data Mining? Data Mining Was ist Data Mining? Nach welchen Mustern wird gesucht?
MehrBusiness Intelligence. Business Intelligence Seminar, WS 2007/08
Business Intelligence Seminar, WS 2007/08 Prof. Dr. Knut Hinkelmann Fachhochschule Nordwestschweiz knut.hinkelmann@fhnw.ch Business Intelligence Entscheidungsorientierte Sammlung, Aufbereitung und Darstellung
MehrData Mining Anwendungen und Techniken
Data Mining Anwendungen und Techniken Knut Hinkelmann DFKI GmbH Entdecken von Wissen in banken Wissen Unternehmen sammeln ungeheure mengen enthalten wettbewerbsrelevantes Wissen Ziel: Entdecken dieses
MehrData Mining-Modelle und -Algorithmen
Data Mining-Modelle und -Algorithmen Data Mining-Modelle und -Algorithmen Data Mining ist ein Prozess, bei dem mehrere Komponenten i n- teragieren. Sie greifen auf Datenquellen, um diese zum Training,
MehrXAMPP-Systeme. Teil 3: My SQL. PGP II/05 MySQL
XAMPP-Systeme Teil 3: My SQL Daten Eine Wesenseigenschaft von Menschen ist es, Informationen, in welcher Form sie auch immer auftreten, zu ordnen, zu klassifizieren und in strukturierter Form abzulegen.
MehrEinführung. Informationssystem als Abbild der realen Welt
Was ist ein Datenbanksystem? Anwendungsgrundsätze Betrieb von Datenbanksystemen Entwicklung von Datenbanksystemen Seite 1 Informationssystem als Abbild der realen Welt Modellierung (Abstraktion) Sachverhalte
MehrDATENBANKEN SQL UND SQLITE VON MELANIE SCHLIEBENER
DATENBANKEN SQL UND SQLITE VON MELANIE SCHLIEBENER INHALTSVERZEICHNIS 1. Datenbanken 2. SQL 1.1 Sinn und Zweck 1.2 Definition 1.3 Modelle 1.4 Relationales Datenbankmodell 2.1 Definition 2.2 Befehle 3.
MehrOPERATIONEN AUF EINER DATENBANK
Einführung 1 OPERATIONEN AUF EINER DATENBANK Ein Benutzer stellt eine Anfrage: Die Benutzer einer Datenbank können meist sowohl interaktiv als auch über Anwendungen Anfragen an eine Datenbank stellen:
MehrDatenbanken. Prof. Dr. Bernhard Schiefer. bernhard.schiefer@fh-kl.de http://www.fh-kl.de/~schiefer
Datenbanken Prof. Dr. Bernhard Schiefer bernhard.schiefer@fh-kl.de http://www.fh-kl.de/~schiefer Wesentliche Inhalte Begriff DBS Datenbankmodelle Datenbankentwurf konzeptionell, logisch und relational
MehrHandbuch ECDL 2003 Basic Modul 5: Datenbank Grundlagen von relationalen Datenbanken
Handbuch ECDL 2003 Basic Modul 5: Datenbank Grundlagen von relationalen Datenbanken Dateiname: ecdl5_01_00_documentation_standard.doc Speicherdatum: 14.02.2005 ECDL 2003 Basic Modul 5 Datenbank - Grundlagen
Mehrpro4controlling - Whitepaper [DEU] Whitepaper zur CfMD-Lösung pro4controlling Seite 1 von 9
Whitepaper zur CfMD-Lösung pro4controlling Seite 1 von 9 1 Allgemeine Beschreibung "Was war geplant, wo stehen Sie jetzt und wie könnte es noch werden?" Das sind die typischen Fragen, mit denen viele Unternehmer
MehrVorwort zur 5. Auflage... 15 Über den Autor... 16
Vorwort zur 5. Auflage...................................... 15 Über den Autor............................................ 16 Teil I Grundlagen.............................................. 17 1 Einführung
MehrSuche schlecht beschriftete Bilder mit Eigenen Abfragen
Suche schlecht beschriftete Bilder mit Eigenen Abfragen Ist die Bilderdatenbank über einen längeren Zeitraum in Benutzung, so steigt die Wahrscheinlichkeit für schlecht beschriftete Bilder 1. Insbesondere
Mehreevolution Business Intelligence Oliver Rzeniecki COMPRA GmbH Programmierer & Datenbankadministrator
eevolution Business Intelligence Oliver Rzeniecki COMPRA GmbH Programmierer & Datenbankadministrator Agenda Was ist Business Intelligence? Was ist OLAP? Unterschied zwischen OLAP und OLTP? Bestandteile
MehrOLAP und Data Warehouses
OLP und Data Warehouses Überblick Monitoring & dministration Externe Quellen Operative Datenbanken Extraktion Transformation Laden Metadaten- Repository Data Warehouse OLP-Server nalyse Query/Reporting
Mehr7. Übung - Datenbanken
7. Übung - Datenbanken Informatik I für Verkehrsingenieure Aufgaben inkl. Beispiellösungen 1. Aufgabe: DBS a Was ist die Kernaufgabe von Datenbanksystemen? b Beschreiben Sie kurz die Abstraktionsebenen
MehrÜbersicht über Datenbanken
Übersicht über Datenbanken Vergleich zwischen normaler Datenorganisation und Datenbanken Definition einer Datenbank Beispiel (inkl. Zugriff) Der Datenbankadministrator Relationale Datenbanken Transaktionen
Mehr2 Datenbanksysteme, Datenbankanwendungen und Middleware... 45
Vorwort 15 Teil I Grundlagen 19 i Einführung In das Thema Datenbanken 21 I.I Warum ist Datenbankdesign wichtig? 26 i.2 Dateisystem und Datenbanken 28 1.2.1 Historische Wurzeln 29 1.2.2 Probleme bei der
MehrSQL (Structured Query Language) Schemata Datentypen
2 SQL Sprachelemente Grundlegende Sprachelemente von SQL. 2.1 Übersicht Themen des Kapitels SQL Sprachelemente Themen des Kapitels SQL (Structured Query Language) Schemata Datentypen Im Kapitel SQL Sprachelemente
MehrFragenkatalog zum Kurs 1666 (Datenbanken in Rechnernetzen) Kurstext von SS 96
Fragenkatalog zum Kurs 1666 (Datenbanken in Rechnernetzen) Kurstext von SS 96 Dieser Fragenkatalog wurde aufgrund das Basistextes und zum Teil aus den Prüfungsprotokollen erstellt, um sich auf mögliche
MehrCarl-Christian Kanne. Einführung in Datenbanken p.1/513
Einführung in Datenbanken Carl-Christian Kanne Einführung in Datenbanken p.1/513 Kapitel 1 Einführung Einführung in Datenbanken p.2/513 Einführung Was ist ein Datenbanksystem (DBS)? Ein System zum Speichern
MehrOP-LOG www.op-log.de
Verwendung von Microsoft SQL Server, Seite 1/18 OP-LOG www.op-log.de Anleitung: Verwendung von Microsoft SQL Server 2005 Stand Mai 2010 1 Ich-lese-keine-Anleitungen 'Verwendung von Microsoft SQL Server
MehrAuswertung für Warenwirtschaft/ERP, Interbase und ODBC... 2
Cubix O.L.A.P... 2 Auswertung für Warenwirtschaft/ERP, Interbase und ODBC... 2 Datenverbindung über ODBC... 4 Datenbereitstellung über SQL... 5 Festlegung der Dimensionen... 6 Festlegung der Summen...
MehrAufgabe 1: [Logische Modellierung]
Aufgabe 1: [Logische Modellierung] a) Entwerfen Sie für das von Ihnen entworfene Modell aus Aufgabe 2 des 1. Übungsblattes ein Star-Schema. b) Entwerfen Sie für das vorangegangene Modell einen Teil eines
MehrBusiness Intelligence Praktikum 1
Hochschule Darmstadt Business Intelligence WS 2013-14 Fachbereich Informatik Praktikumsversuch 1 Prof. Dr. C. Wentzel Dipl. Inf. Dipl. Math. Y. Orkunoglu Datum: 14.10.2013 Business Intelligence Praktikum
MehrAufgaben zur fachwissenschaftlichen Prüfung Modul 3 Daten erfassen, ordnen, verarbeiten und austauschen: Schwerpunkt Datenbanken
Aufgaben zur fachwissenschaftlichen Prüfung Modul 3 Daten erfassen, ordnen, verarbeiten und austauschen: Schwerpunkt Datenbanken 30 Wozu dient ein Primärschlüssel? Mit dem Primärschlüssel wird ein Datenfeld
MehrData Quality Management: Abgleich großer, redundanter Datenmengen
Data Quality Management: Abgleich großer, redundanter Datenmengen Westendstr. 14 809 München Tel 089-5100 907 Fax 089-5100 9087 E-Mail Datras@Datras.de Redundanz und relationales Datenbankmodell Redundanz:
MehrBI Konsolidierung: Anspruch & Wirklichkeit. Jacqueline Bloemen. in Kooperation mit
BI Konsolidierung: Anspruch & Wirklichkeit Jacqueline Bloemen in Kooperation mit Agenda: Anspruch BI Konsolidierung Treiber Was sind die aktuellen Treiber für ein Konsolidierungsvorhaben? Kimball vs. Inmon
MehrArbeiten mit einem lokalen PostgreSQL-Server
Arbeiten mit einem lokalen PostgreSQL-Server Download für das Betriebssystem Windows PostgreSQL-Server und pgadmin: http://www.enterprisedb.com/products-servicestraining/pgdownload#windows pgadmin: http://www.pgadmin.org/download/windows.php
MehrDatenbanken 16.1.2008. Die Entwicklung der Datenbanksysteme ist eng an die der Hardware gekoppelt und wird wie jene in Generationen eingeteilt:
Datenbanksysteme Entwicklung der Datenbanksysteme Die Entwicklung der Datenbanksysteme ist eng an die der Hardware gekoppelt und wird wie jene in Generationen eingeteilt: 1. Generation: In den fünfziger
MehrIhre Interessentendatensätze bei inobroker. 1. Interessentendatensätze
Ihre Interessentendatensätze bei inobroker Wenn Sie oder Ihre Kunden die Prozesse von inobroker nutzen, werden Interessentendatensätze erzeugt. Diese können Sie direkt über inobroker bearbeiten oder mit
MehrDefinition Informationssystem
Definition Informationssystem Informationssysteme (IS) sind soziotechnische Systeme, die menschliche und maschinelle Komponenten umfassen. Sie unterstützen die Sammlung, Verarbeitung, Bereitstellung, Kommunikation
MehrBusiness Intelligence Praktikum 1
Hochschule Darmstadt Business Intelligence SS 2014 Fachbereich Informatik Praktikumsversuch 1 Prof. Dr. C. Wentzel Dipl. Inf. Dipl. Math. Y. Orkunoglu Datum: 07.05.2014 Business Intelligence Praktikum
MehrIntegration mit. Wie AristaFlow Sie in Ihrem Unternehmen unterstützen kann, zeigen wir Ihnen am nachfolgenden Beispiel einer Support-Anfrage.
Integration mit Die Integration der AristaFlow Business Process Management Suite (BPM) mit dem Enterprise Information Management System FILERO (EIMS) bildet die optimale Basis für flexible Optimierung
MehrWir beraten Sie. Wir unterstützen Sie. Wir schaffen Lösungen. Wir bringen Qualität. Wir beraten Sie. Wir unterstützen Sie. Wir schaffen Lösungen
Was bedeutet es, ein Redaktionssystem einzuführen? Vorgehensmodell für die Einführung eines Redaktionssystems Die Bedeutung Fast alle Arbeitsabläufe in der Abteilung werden sich verändern Die inhaltliche
Mehr2. Einrichtung der ODBC-Schnittstelle aus orgamax (für 32-bit-Anwendungen)
1. Einführung: Über den ODBC-Zugriff können Sie bestimmte Daten aus Ihren orgamax-mandanten in anderen Anwendungen (beispielsweise Microsoft Excel oder Microsoft Access) einlesen. Dies bietet sich beispielsweise
MehrData Mining-Projekte
Data Mining-Projekte Data Mining-Projekte Data Mining stellt normalerweise kein ei nmaliges Projekt dar, welches Erkenntnisse liefert, die dann nur einmal verwendet werden, sondern es soll gewöhnlich ein
MehrAllgemeines zu Datenbanken
Allgemeines zu Datenbanken Was ist eine Datenbank? Datensatz Zusammenfassung von Datenelementen mit fester Struktur Z.B.: Kunde Alois Müller, Hegenheimerstr. 28, Basel Datenbank Sammlung von strukturierten,
MehrEntwurf einer einfachen Datenbank zur Wunschzettel- Verwaltung
Entwurf einer einfachen Datenbank zur Wunschzettel- Verwaltung Prof. Dr. Alfred Holl, Georg Simon Ohm University of Applied Sciences, Nuremberg, Germany 29.03.2014/1 Entwurf einer einfachen Datenbank zur
Mehr1 PIVOT TABELLEN. 1.1 Das Ziel: Basisdaten strukturiert darzustellen. 1.2 Wozu können Sie eine Pivot-Tabelle einsetzen?
Pivot Tabellen PIVOT TABELLEN. Das Ziel: Basisdaten strukturiert darzustellen Jeden Tag erhalten wir umfangreiche Informationen. Aber trotzdem haben wir oft das Gefühl, Entscheidungen noch nicht treffen
MehrProfessionelle Seminare im Bereich MS-Office
Der Name BEREICH.VERSCHIEBEN() ist etwas unglücklich gewählt. Man kann mit der Funktion Bereiche zwar verschieben, man kann Bereiche aber auch verkleinern oder vergrößern. Besser wäre es, die Funktion
MehrBusiness Analytics im E-Commerce
Business Analytics im E-Commerce Kunde, Kontext und sein Verhalten verstehen für personalisierte Kundenansprache Janusz Michalewicz CEO Über die Firma Crehler Erstellung von Onlineshops Analyse von Transaktionsdaten
MehrArtikel Schnittstelle über CSV
Artikel Schnittstelle über CSV Sie können Artikeldaten aus Ihrem EDV System in das NCFOX importieren, dies geschieht durch eine CSV Schnittstelle. Dies hat mehrere Vorteile: Zeitersparnis, die Karteikarte
MehrCarl-Engler-Schule Karlsruhe Datenbank 1 (5)
Carl-Engler-Schule Karlsruhe Datenbank 1 (5) Informationen zur Datenbank 1. Definition 1.1 Datenbank-Basis Eine Datenbank-Basis ist eine Sammlung von Informationen über Objekte (z.b Musikstücke, Einwohner,
MehrInformatik 12 Datenbanken SQL-Einführung
Informatik 12 Datenbanken SQL-Einführung Gierhardt Vorbemerkungen Bisher haben wir Datenbanken nur über einzelne Tabellen kennen gelernt. Stehen mehrere Tabellen in gewissen Beziehungen zur Beschreibung
MehrOracle GridControl Tuning Pack. best Open Systems Day April 2010. Unterföhring. Marco Kühn best Systeme GmbH marco.kuehn@best.de
Oracle GridControl Tuning Pack best Open Systems Day April 2010 Unterföhring Marco Kühn best Systeme GmbH marco.kuehn@best.de Agenda GridControl Overview Tuning Pack 4/26/10 Seite 2 Overview Grid Control
MehrStar-Schema-Modellierung mit ERwin - eine kritische Reflexion der Leistungspotentiale und Anwendungsmöglichkeiten
Star-Schema-Modellierung mit ERwin - eine kritische Reflexion der Leistungspotentiale und Anwendungsmöglichkeiten Michael Hahne T&I GmbH Workshop MSS-2000 Bochum, 24. März 2000 Folie 1 Worum es geht...
MehrDatenbanken SQL Einführung Datenbank in MySQL einrichten mit PhpMyAdmin
Datenbanken SQL Einführung Datenbank in MySQL einrichten mit PhpMyAdmin PhpMyAdmin = grafsches Tool zur Verwaltung von MySQL-Datenbanken Datenbanken erzeugen und löschen Tabellen und Spalten einfügen,
MehrOUTSOURCING ADVISOR. Analyse von SW-Anwendungen und IT-Dienstleistungen auf ihre Global Sourcing Eignung. Bewertung von Dienstleistern und Standorten
Outsourcing Advisor Bewerten Sie Ihre Unternehmensanwendungen auf Global Sourcing Eignung, Wirtschaftlichkeit und wählen Sie den idealen Dienstleister aus. OUTSOURCING ADVISOR Der Outsourcing Advisor ist
MehrAblaufbeschreibung für das neu Aufsetzen von Firebird und Interbase Datenbanken mit der IBOConsole
Lavid-F.I.S. Ablaufbeschreibung für das neu Aufsetzen von Firebird und Interbase Datenbanken mit der Lavid Software GmbH Dauner Straße 12, D-41236 Mönchengladbach http://www.lavid-software.net Support:
MehrMS Access 2010 Kompakt
2 ABFRAGEN Eine Abfrage ist im Wesentlichen der Filterung eines Datenbestandes sehr ähnlich. Auch hier werden aus einer Menge von Informationen nur jene Datensätze ausgewählt, die einem vorher definierten
MehrSo importieren Sie einen KPI mithilfe des Assistenten zum Erstellen einer Scorecard
1 von 6 102013 18:09 SharePoint 2013 Veröffentlicht: 16.07.2012 Zusammenfassung: Hier erfahren Sie, wie Sie einen KPI (Key Performance Indicator) mithilfe des PerformancePoint Dashboard Designer in SharePoint
MehrOrdner Berechtigung vergeben Zugriffsrechte unter Windows einrichten
Ordner Berechtigung vergeben Zugriffsrechte unter Windows einrichten Was sind Berechtigungen? Unter Berechtigungen werden ganz allgemein die Zugriffsrechte auf Dateien und Verzeichnisse (Ordner) verstanden.
MehrTask: Nmap Skripte ausführen
Task: Nmap Skripte ausführen Inhalt Einfache Netzwerkscans mit NSE Ausführen des Scans Anpassung der Parameter Einleitung Copyright 2009-2015 Greenbone Networks GmbH Herkunft und aktuellste Version dieses
MehrMuster-Angebotsinformation
Muster-Angebotsinformation Einsatzanalyse SAP Berechtigungs-Management & Compliance 3-Tages Proof-of-Concept Seite 1 Inhalt 1 Management Summary... 3 1.1 Technische Rahmenbedingungen... 3 1.2 Ziele der
MehrEin Beispiel. Ein Unternehmen will Internettechnologien im Rahmen des E- Business nutzen Welche Geschäftsprozesse?
Ein Beispiel Ein Unternehmen will Internettechnologien im Rahmen des E- Business nutzen Welche Geschäftsprozesse? Dipl.-Kfm. Claus Häberle WS 2015 /16 # 42 XML (vereinfacht) visa
MehrBusiness Intelligence und Geovisualisierung in der Gesundheitswirtschaft
Business Intelligence und Geovisualisierung in der Gesundheitswirtschaft Prof. Dr. Anett Mehler-Bicher Fachhochschule Mainz, Fachbereich Wirtschaft Prof. Dr. Klaus Böhm health&media GmbH 2011 health&media
MehrStuPro-Seminar Dokumentation in der Software-Wartung. StuPro-Seminar Probleme und Schwierigkeiten in der Software-Wartung.
StuPro-Seminar Dokumentation in der Software-Wartung StuPro-Seminar Probleme und Schwierigkeiten in der Software-Wartung Folie 1/xx Software-Wartung: theoretisch Ausgangslage eigentlich simpel: fertige
MehrVon der spezialisierten Eigenentwicklung zum universellen Analysetool. Das Controlling-Informationssystem der WestLB Systems
Von der spezialisierten Eigenentwicklung zum universellen Analysetool Das Controlling-Informationssystem der WestLB Systems Begriffe und Definitionen Data Warehouse - Datensammlung oder Konzept?! Data
MehrDatenmanagement. Simone Unfried, Passau Vitaly Aleev, Passau Claus Schönleber, Passau. Strategisches Informationsmanagement 1 (01/2006)
Simone Unfried, Passau Vitaly Aleev, Passau Claus Schönleber, Passau (01/2006) Strategisches Informationsmanagement 1 Definition Notwendige Vermaischung der Daten in der Vorstufe zur Destillation von hochprozentiger
MehrThemen. M. Duffner: Datenbanksysteme
Datenbanksysteme Themen Theorie Einführung Datenbank, Datenbankmanagementsystem (DBMS), Aufgaben eines DBMS Relationale Datenbanken Daten als Tabellen Datenbankentwurf im Entity-Relationship-Modell Abfragesprache
MehrIst Excel das richtige Tool für FMEA? Steve Murphy, Marc Schaeffers
Ist Excel das richtige Tool für FMEA? Steve Murphy, Marc Schaeffers Ist Excel das richtige Tool für FMEA? Einleitung Wenn in einem Unternehmen FMEA eingeführt wird, fangen die meisten sofort damit an,
Mehr3. GLIEDERUNG. Aufgabe:
3. GLIEDERUNG Aufgabe: In der Praxis ist es für einen Ausdruck, der nicht alle Detaildaten enthält, häufig notwendig, Zeilen oder Spalten einer Tabelle auszublenden. Auch eine übersichtlichere Darstellung
MehrMultichannel Challenge: Integration von Vertriebsorganisation und Contact Center in der Versicherung
Philip Michel CRM Project Manager 23 June 2011 Multichannel Challenge: Integration von Vertriebsorganisation und Contact Center in der Versicherung 2009 IBM Corporation Die Multichannel Challenge eines
MehrRelationale Datenbanken Datenbankgrundlagen
Datenbanksystem Ein Datenbanksystem (DBS) 1 ist ein System zur elektronischen Datenverwaltung. Die wesentliche Aufgabe eines DBS ist es, große Datenmengen effizient, widerspruchsfrei und dauerhaft zu speichern
MehrMengenvergleiche: Alle Konten außer das, mit dem größten Saldo.
Mengenvergleiche: Mehr Möglichkeiten als der in-operator bietet der θany und der θall-operator, also der Vergleich mit irgendeinem oder jedem Tupel der Unteranfrage. Alle Konten außer das, mit dem größten
MehrUrlaubsregel in David
Urlaubsregel in David Inhaltsverzeichnis KlickDown Beitrag von Tobit...3 Präambel...3 Benachrichtigung externer Absender...3 Erstellen oder Anpassen des Anworttextes...3 Erstellen oder Anpassen der Auto-Reply-Regel...5
Mehr3. Das Relationale Datenmodell
3. Das Relationale Datenmodell Das Relationale Datenmodell geht zurück auf Codd (1970): E. F. Codd: A Relational Model of Data for Large Shared Data Banks. Comm. of the ACM 13(6): 377-387(1970) DBMS wie
MehrIntegration verteilter Datenquellen in GIS-Datenbanken
Integration verteilter Datenquellen in GIS-Datenbanken Seminar Verteilung und Integration von Verkehrsdaten Am IPD Lehrstuhl für Systeme der Informationsverwaltung Sommersemester 2004 Christian Hennings
MehrKampagnenmanagement mit Siebel Marketing/Oracle BI ein Praxisbericht
Kampagnenmanagement mit Siebel Marketing/Oracle BI ein Praxisbericht Thomas Kreuzer ec4u expert consulting ag Karlsruhe Schlüsselworte: Kampagnenmanagement Praxisbericht Siebel Marketing Oracle BI - ec4u
MehrAgile Software Verteilung
Agile Software Verteilung Vortrag: René Steg Steg IT-Engineering, Zürich (Schweiz) Gründe für Agile Software-Verteilung Wenn Sie Hunderte von Servern mit vielen Anwendungen betreiben Verteilte Anwendungen
MehrInformation-Design-Tool
Zusatzkapitel Information-Design-Tool zum Buch»HR-Reporting mit SAP «von Richard Haßmann, Anja Marxsen, Sven-Olaf Möller, Victor Gabriel Saiz Castillo Galileo Press, Bonn 2013 ISBN 978-3-8362-1986-0 Bonn
MehrDISKUSSIONSBEITRÄGE DER FAKULTÄT FÜR BETRIEBSWIRTSCHAFTSLEHRE MERCATOR SCHOOL OF MANAGEMENT UNIVERSITÄT DUISBURG-ESSEN. Nr. 374
DISKUSSIONSBEITRÄGE DER FAKULTÄT FÜR BETRIEBSWIRTSCHAFTSLEHRE MERCATOR SCHOOL OF MANAGEMENT UNIVERSITÄT DUISBURG-ESSEN Nr. 374 Eignung von Verfahren der Mustererkennung im Process Mining Sabrina Kohne
MehrDie Dateiablage Der Weg zur Dateiablage
Die Dateiablage In Ihrem Privatbereich haben Sie die Möglichkeit, Dateien verschiedener Formate abzulegen, zu sortieren, zu archivieren und in andere Dateiablagen der Plattform zu kopieren. In den Gruppen
MehrDatenbanksysteme 2 Frühjahr-/Sommersemester 2014 28. Mai 2014
Lehrstuhl für Praktische Informatik III Prof. Dr. Guido Moerkotte Email: moer@db.informatik.uni-mannheim.de Marius Eich Email: marius.eich@uni-mannheim.de Datenbanksysteme 2 8. Übungsblatt Frühjahr-/Sommersemester
MehrMarketing Intelligence Schwierigkeiten bei der Umsetzung. Josef Kolbitsch Manuela Reinisch
Marketing Intelligence Schwierigkeiten bei der Umsetzung Josef Kolbitsch Manuela Reinisch Übersicht Schwierigkeiten bei der Umsetzung eines BI-Systems Schwierigkeiten der Umsetzung 1/13 Strategische Ziele
MehrDas Multidimensionale Datenmodell
Das Multidimensionale Datenmodell Konzeptuelle Modellierung Umsetzung des Modells Beispiel ER-Modell 2 / 36 Probleme ER-Modellierung Keine Unterscheidung Klassifikation, Attribute, Kenngrößen Dimension
MehrOnline Analytical Processing
Online Analytical Processing Online Analytical Processing Online Analytical Processing (OLAP) ermöglicht die multidimensionale Betrachtung von Daten zwecks E rmittlung eines entscheidungsunterstützenden
MehrGeyer & Weinig: Service Level Management in neuer Qualität.
Geyer & Weinig: Service Level Management in neuer Qualität. Verantwortung statt Versprechen: Qualität permanent neu erarbeiten. Geyer & Weinig ist der erfahrene Spezialist für Service Level Management.
MehrBarrierefreie Webseiten erstellen mit TYPO3
Barrierefreie Webseiten erstellen mit TYPO3 Alternativtexte Für jedes Nicht-Text-Element ist ein äquivalenter Text bereitzustellen. Dies gilt insbesondere für Bilder. In der Liste der HTML 4-Attribute
MehrMicrosoft SharePoint 2013 Designer
Microsoft SharePoint 2013 Designer Was ist SharePoint? SharePoint Designer 2013 Vorteile SharePoint Designer Funktionen.Net 4.0 Workflow Infrastruktur Integration von Stages Visuelle Designer Copy & Paste
MehrDokumentation IBIS Monitor
Dokumentation IBIS Monitor Seite 1 von 16 11.01.06 Inhaltsverzeichnis 1. Allgemein 2. Installation und Programm starten 3. Programmkonfiguration 4. Aufzeichnung 4.1 Aufzeichnung mitschneiden 4.1.1 Inhalt
MehrWas ist Analyse? Hannover, CeBIT 2014 Patrick Keller
Was ist? Hannover, CeBIT 2014 Patrick Keller Business Application Research Center Historie 1994: Beginn der Untersuchung von Business-Intelligence-Software am Lehrstuhl Wirtschaftsinformatik der Universität
MehrDatenübernahme easyjob 3.0 zu easyjob 4.0
Datenübernahme easyjob 3.0 zu easyjob 4.0 Einführung...3 Systemanforderung easyjob 4.0...3 Vorgehensweise zur Umstellung zu easyjob 4.0...4 Installation easyjob 4.0 auf dem Server und Arbeitsstationen...4
MehrNovell Client. Anleitung. zur Verfügung gestellt durch: ZID Dezentrale Systeme. Februar 2015. ZID Dezentrale Systeme
Novell Client Anleitung zur Verfügung gestellt durch: ZID Dezentrale Systeme Februar 2015 Seite 2 von 8 Mit der Einführung von Windows 7 hat sich die Novell-Anmeldung sehr stark verändert. Der Novell Client
MehrTransparente Hausverwaltung Marketingschmäh oder doch: eine neue Dimension der Dienstleistung?
Transparente Hausverwaltung Marketingschmäh oder doch: eine neue Dimension der Dienstleistung? INTERNET Geschäftsführer Biletti Immobilien GmbH 24/7 WEB Server Frankgasse 2, 1090 Wien E-mail: udo.weinberger@weinberger-biletti.at
MehrInhalt. 1 Übersicht. 2 Anwendungsbeispiele. 3 Einsatzgebiete. 4 Systemanforderungen. 5 Lizenzierung. 6 Installation. 7 Key Features.
Inhalt 1 Übersicht 2 Anwendungsbeispiele 3 Einsatzgebiete 4 Systemanforderungen 5 Lizenzierung 6 Installation 7 Key Features Seite 2 von 11 1. Übersicht MIK.mobile for ipad ist eine Business Intelligence
MehrBusiness Intelligence
Business Intelligence Anwendungssysteme (BIAS) Lösung Aufgabe 1 Übung WS 2012/13 Business Intelligence Erläutern Sie den Begriff Business Intelligence. Gehen Sie bei der Definition von Business Intelligence
MehrUmstellung News-System auf cms.sn.schule.de
Umstellung News-System auf cms.sn.schule.de Vorbemerkungen Hinweis: Sollten Sie bisher noch kein News-System verwendet haben, nutzen Sie die Anleitung unter http://cms.sn.schule.de/admin/handbuch/grundlagen/page/25/
MehrSharePoint Demonstration
SharePoint Demonstration Was zeigt die Demonstration? Diese Demonstration soll den modernen Zugriff auf Daten und Informationen veranschaulichen und zeigen welche Vorteile sich dadurch in der Zusammenarbeit
MehrMS Excel 2010 Kompakt
MS Excel 00 Kompakt FILTERN Aus einem großen Datenbestand sollen nur jene Datensätze (Zeilen) angezeigt werden, die einem bestimmten Eintrag eines Feldes (Spalte) entsprechen. Excel unterstützt Filterungen
MehrSurvival Guide für Ihr Business Intelligence-Projekt
Survival Guide für Ihr Business Intelligence-Projekt Sven Bosinger Solution Architect BI Survival Guide für Ihr BI-Projekt 1 Agenda Was ist Business Intelligence? Leistungsumfang Prozesse Erfolgsfaktoren
MehrAgile Vorgehensmodelle in der Softwareentwicklung: Scrum
C A R L V O N O S S I E T Z K Y Agile Vorgehensmodelle in der Softwareentwicklung: Scrum Johannes Diemke Vortrag im Rahmen der Projektgruppe Oldenburger Robot Soccer Team im Wintersemester 2009/2010 Was
MehrProfilbezogene informatische Bildung in den Klassenstufen 9 und 10. Schwerpunktthema Daten und Datenbanken
Profilbezogene informatische Bildung in den Klassenstufen 9 und 10 Schwerpunktthema Robby Buttke Fachberater für Informatik RSA Chemnitz Fachliche Einordnung Phasen relationaler Modellierung Fachlichkeit
MehrEr musste so eingerichtet werden, dass das D-Laufwerk auf das E-Laufwerk gespiegelt
Inhaltsverzeichnis Aufgabe... 1 Allgemein... 1 Active Directory... 1 Konfiguration... 2 Benutzer erstellen... 3 Eigenes Verzeichnis erstellen... 3 Benutzerkonto erstellen... 3 Profil einrichten... 5 Berechtigungen
MehrDie Softwareentwicklungsphasen!
Softwareentwicklung Die Softwareentwicklungsphasen! Die Bezeichnungen der Phasen sind keine speziellen Begriffe der Informatik, sondern den allgemeinen Prinzipien zur Produktion integrierter Systeme entliehen.
Mehr