Kapitel 10: Exploration des Data Cubes

Größe: px
Ab Seite anzeigen:

Download "Kapitel 10: Exploration des Data Cubes"

Transkript

1 Kapitel 10: Exploration des Data Cubes Data Warehousing und Mining: Exploration des Data Cubes 1 WEin möglicher Ansatz zur Beschreibung einer Tabelle, anhand eines Beispiels Relation R(Part, City, Year, Month, Cost, Sale), Dimensionen Attribute Schema der Tabelle: Sales=<{Category, Time}, {Part, City, Year, Month, Cost, Sale}, par> mit par(category)={part, City} und par(time)={year, Month} Im Gegensatz zur Verwendung des Begriffs Dimension vorher werden jetzt mehrere Attribute zu einer Dimension (mit neuem Namen) zusammengefaßt. par identifiziert die Bestandteile der Dimensionen. SALES TIME Year Month Jan Feb Jan Feb CATEGORY Part City (Cost, Sale) PC Montreal (5,6) (5,7) (4,6) (4,8) Toronto (5,7) (5,8) (4,8) (4,9) Inkjet Montreal (7,8) (7,9) (6,9) (6,8) New York (6,9) (6,9) (5,8) (5,9) Data Warehousing und Mining: Exploration des Data Cubes 2 W Beispiel 2: Gleiche Relation, andere Tabelle Schema der Tabelle: Sales=<{Location, Component}, {Part, City, Year, Month, Cost, Sale}, par> mit par(location)={city} und par(component)={part} Dimensionen, Attribute, par identifiziert die Bestandteile der Dimensionen. W Data Cube - Repräsentation aggregierter Werte Marke Opel Audi SALES COMPONENT Part PC Inkjet LOCA- TION City (Year,Month, Cost,Sale) Montreal (1996, Jan, 5, 6) (1996, Jan, 5, 6) Montreal (1996, Jan, 5, 7) (1996, Jan, 5, 7) Montreal (1997, Jan, 4, 6) (1997, Jan, 4, 6) Montreal (1997, Feb, 4, 8) (1997, Feb, 4, 8) Toronto (1997, Jan, 5,7) / Toronto (1996, Feb, 5, 8) / BMW Hessen Bayern Saarland Bundesland Datum Bundesland Anzahl Hessen 131 Bayern 240 Saarland 141 GroupBy-Operator berechnet Punkte in einer Hyperebene. Data Warehousing und Mining: Exploration des Data Cubes 3 Data Warehousing und Mining: Exploration des Data Cubes 4

2 W Data Cube - Repräsentation aggregierter Werte (2) W Consolidation Paths Marke Saarland Bayern Hessen Bundesland Opel Audi BMW Datum Marke Bundesland Anzahl BMW Hessen 28 BMW Bayern 37 BMW Saarland 41 Opel Hessen 48 Opel Bayern 62 Opel Saarland 100 Audi Hessen 55 Audi Bayern 141 Wofür steht Zahl im Ursprung? Marke Datum Bundesland Anzahl BMW Hessen 28 BMW Bayern 37 BMW Saarland 41 Opel Hessen 48 Opel Bayern 62 Opel Saarland 5 Opel Saarland 95 Audi Hessen 55 Audi Bayern 52 Audi Bayern 27 Audi Bayern 62 Marke Bundesland Anzahl BMW Hessen 28 BMW Bayern 37 BMW Saarland 41 Opel Hessen 48 Opel Bayern 62 Opel Saarland 100 Audi Hessen 55 Audi Bayern 141 BM B Bundesland Anzahl Hessen 131 Bayern 240 Saarland 141 BDM BD D none DM M Data Warehousing und Mining: Exploration des Data Cubes 5 Data Warehousing und Mining: Exploration des Data Cubes 6 W Consolidation Paths (2) W Consolidation Paths (3) Marke Datum Bundesland Anzahl BMW Hessen 28 BMW Bayern 37 BMW Saarland 41 Opel Hessen 48 Opel Bayern 62 Opel Saarland 5 Opel Saarland 95 Audi Hessen 55 Audi Bayern 52 Audi Bayern 27 Audi Bayern 62 Marke Bundesland Anzahl BMW Hessen 28 BMW Bayern 37 BMW Saarland 41 Opel Hessen 48 Opel Bayern 62 Opel Saarland 100 Audi Hessen 55 Audi Bayern 141 BM B Bundesland Anzahl Hessen 131 Bayern 240 Saarland 141 BDM BD D none DM M Roll-up (Drill-up) Drill-down Konsolidierung ist nicht nur möglich, indem man Dimensionen ausblendet, sondern auch durch das Zusammenfassen von Werten. Woche Tag keine Monat Jahr Konzepthierarchie Data Warehousing und Mining: Exploration des Data Cubes 7 Data Warehousing und Mining: Exploration des Data Cubes 8

3 W Consolidation Marke W Consolidation Paths (4) BDM - Bundesland - Datum - Marke Opel T BDM Audi W Mo J BM B BD D DM M BMW none BDM none Hessen Bayern Datum BMW BMMo DM BD Saarland Bundesland BM BW MW BMJ MMo BMo D... Anzahl Ebenen? Data Warehousing und Mining: Exploration des Data Cubes 9 Data Warehousing und Mining: Exploration des Data Cubes 10 W Consolidation Paths (5) Vorangegangene Folie verdeutlicht zweierlei: Kombinierbarkeit, sehr viele Kombinationsmöglichkeiten. Was bedeutet Drill-Down im Kontext dieses Interfaces? Data Warehousing und Mining: Exploration des Data Cubes 11 Data Warehousing und Mining: Exploration des Data Cubes 12

4 Motivation Motivation Navigieren im Data Cube ist nur auf den ersten Blick leicht. Bei vielen Dimensionen ist die Suche nach hilfreicher Information mühsam. Anwender hat natürlich meist nicht exakte Hypothese. Exploration des Data Cubes: Finden von, Herausfinden, warum sich ergeben. Operatoren wie Drilldown sind zwar nützlich, Benutzer muß aber interessante Zusammenhänge von Hand entdecken. Ziel im folgenden: Benutzer durch den Cube führen, Navigationsmöglichkeiten anzeigen, die zu interessanten Zusammenhängen führen. Beispiel: Region all Product Jan Feb Mar Apr Mai Jun Jul Aug Sep Okt Nov Dez Beer 10% -7% 3% -4% 15% -12% -3% 1% 42% -14% -10% -1% 2% 3% 4% 9% 4% 1% -11% -8% -2% 7% Diet-S 2% -1% 0% 0% 4% 2% 4% -9% 5% -3% 0% Data Warehousing und Mining: Exploration des Data Cubes 13 Data Warehousing und Mining: Exploration des Data Cubes 14 Wann ist Zusammenhang interessant? Beispiel: Mobiltelefone im Monat Dezember im Media Markt Eschborn Umsatzplus 50%. Kein int santer Zusammenhang, da auch für andere Waren und Standorte Umsatz im Dezember hochgeht ( Weihnachtsgeschäft ). Int santer Zusammenhang ist also auf anderer Ebene, nämlich Monat Dezember, aber Abstraktion von restlichen Dimensionen. der Beispiel x Irchel Brot x Milch Tee x Produkt x x x Datum Punkt ist Zusammenfassung oder Abstraktion eines anderen Punkts. Tatsächlicher Wert vs. erwarteter Wert. Central Wipkingen x Filiale x Elementar- Position Data Warehousing und Mining: Exploration des Data Cubes 15 Data Warehousing und Mining: Exploration des Data Cubes 16

5 Subcube von bestimmter Position (1) 300 Umsatz Subcube von bestimmter Position (2) 300 Umsatz Datum Datum MA-Anzahl Bei mehr Dimensionen hat Subcube höhere Dimensionalität MA-Anzahl Bei mehr Dimensionen hat Subcube höhere Dimensionalität. Data Warehousing und Mining: Exploration des Data Cubes 17 Data Warehousing und Mining: Exploration des Data Cubes 18 Drill-Down an bestimmter Position Umsatz Datum MA-Anzahl Bei mehr Dimensionen mehr mögliche Drill-Downs. Realisierter Ansatz Für jede Zelle eines erwarteten Werts ŷ über mehrere Dimensionen. Abweichung des tatsächlichen Wertes y vom erwarteten Wert ŷ bestimmt den "Überraschungswert" der Zelle. von drei Überraschungswerten (Indikatoren) je Zelle: SelfExp, InExp, je Dimension: PathExp. Region all Product Jan Feb Mar Apr Mai Jun Jul Aug Sep Okt Nov Dez Beer 10% -7% 3% -4% 15% -12% -3% 1% 42% -14% -10% -1% 2% 3% 4% 9% 4% 1% -11% -8% -2% 7% Diet-S 2% -1% 0% 0% 4% 2% 4% -9% 5% -3% 0% Data Warehousing und Mining: Exploration des Data Cubes 19 Data Warehousing und Mining: Exploration des Data Cubes 20

6 Beispiel (1) Beispiel (2) Product all Region all Jan Feb Mar Apr May Jun Jul Aug Sep Oct Nov Dec Total 2% 0% 2% 2% 4% 3% 0% -8% 0% -3% 4% Product all Region all Jan Feb Mar Apr May Jun Jul Aug Sep Oct Nov Dec Total 2% 0% 2% 2% 4% 3% 0% -8% 0% -3% 4% SelfExp - "Überraschungswert" als Ergebnis eines Vergleichs mit den anderen Zellen auf gleicher Aggregationsstufe, InExp - max(selfexp) für die durch Drill-Down erreichbaren Zellen (oben dargestellt), PathExp - max(selfexp) aller erreichbarer Zellen entlang eines ausgewählten Pfades. Im Beispiel: Überraschung größer bei Drill-Down entlang Product, verglichen mit Drill-Down entlang Region. PR P PRT PT R none RT T P Product, R Region, T Time. Welcher Position im Cuboid entspricht die Tabelle oben? Data Warehousing und Mining: Exploration des Data Cubes 21 Data Warehousing und Mining: Exploration des Data Cubes 22 Beispiel (3) der (1) Product all Region all Jan Feb Mar Apr May Jun Jul Aug Sep Oct Nov Dec Total 2% 0% 2% 2% 4% 3% 0% -8% 0% -3% 4% Region all Product Jan Feb Mar Apr Mai Jun Jul Aug Sep Okt Nov Dez Beer 10% -7% 3% -4% 15% -12% -3% 1% 42% -14% -10% -1% 2% 3% 4% 9% 4% 1% -11% -8% -2% 7% Diet-S 2% -1% 0% 0% 4% 2% 4% -9% 5% -3% 0% Abweichung des tatsächlichen vom erwarteten Wert muß größer als ein Schwellenwert sein (nach Normalisierung): y i1,...,i n tatsächlicher Wert der Zelle i 1...i n, ŷ i1,...,i n erwarteter Wert dieser Zelle, σ Skalierungsfaktor, θ Schwellenwert, Ausnahme liegt vor, falls y - ŷ / σ > θ. Product Diet-S Region Jan Feb Mar Apr Mai Jun Jul Aug Sep Okt Nov Dez C 0% -2% 0% 1% 4% 1% 5% -6% 2% -2% -2% E 0% 2% -8% 7% 0% 5% -40% 10% -33% 2% 8% z Data Warehousing und Mining: Exploration des Data Cubes 23 Data Warehousing und Mining: Exploration des Data Cubes 24

7 der (2) der (3) total Beispiel: (, ) = total Anteil Kunden an Bevölkerung Anteil Kunden an trinkender Bevölkerung + ( total) + ( total) Anteil Kunden in Beispiel 2: (, ) total = total total total Anteil Kunden an Bevölkerung Anteil Kunden an trinkender Bevölkerung Anteil Kunden in Data Warehousing und Mining: Exploration des Data Cubes 25 Data Warehousing und Mining: Exploration des Data Cubes 26 der (4) Beispiel: (, ) = total + ( total) + ( total) Koeffizienten stehen für den Beitrag jeder Zelle zu den erwarteten Werten der Zellen darunter, produkt produkt z. B. oder γ ŷ=f Aggregation (γ i ) γ _ ort _ Beispiel (wie oben): (, ) = γ 1 + γ 2 + γ 3 (, ) = total + ( - total) + ( - total) total der (5) ŷ=f Aggregation (γ i ) Festlegen von f: additiv f(γ1,γ2) = γ1 + γ2, multiplikativ f(γ1, γ2) = γ1 γ2 Bestimmen der γ i aus dem Ausgangsdatenbestand: Mittelwert bzw. trimmed-mean (Verallgemeinerung von trunc_avg). Data Warehousing und Mining: Exploration des Data Cubes 27 Data Warehousing und Mining: Exploration des Data Cubes 28

8 Beispiel Implementierung Filialen Produkte γ = + ( ) + ( ) = ,1 = Filialen All Produkte SelfExp InExp All SelfExp InExp außerdem Normalisierung 1. der Aggregate und Mittelwerte: Für alle GroupBys wird Aggregation und Mittelwert berechnet der Beiträge γ i zu f, von f und SelfExp γ3 = Mittelwert(3) γ21 = Mittelwert(2) - Mittelwert(3), analog γ22, γ23 γ11 = Mittelwert(1) - γ21 γ22 γ3, analog γ12, γ13 3. von InExp und PathExp. Data Warehousing und Mining: Exploration des Data Cubes 29 Data Warehousing und Mining: Exploration des Data Cubes 30 Zusammenfassung bis hierhin Viele Möglichkeiten, mit dem Data Cube zu interagieren. Abweichung des tatsächlichen vom erwarteten Wert ist interessant. Methode für effektives Navigieren in großen Datacubes wurde vorgestellt. "Führen" des Benutzers zu interessanten Datenregionen mittels vorberechneter Indikatoren. Fundament: zum Identifizieren der Abweichungen, Entwicklung eines Algorithmus zur der verschiedenen Indikatoren. Von quantitativer zu qualitativer Datenanalyse Die bis jetzt besprochene Methode identifiziert Ausnahme-Zellen. Hilfreich wäre Unterstützung bei der Suche nach Erklärungen für. Mit herkömmlichen Mechanismen macht der Benutzer von der Ausnahme-Zelle aus Drill-Downs, um Erklärungen zu finden. Data Warehousing und Mining: Exploration des Data Cubes 31 Data Warehousing und Mining: Exploration des Data Cubes 32

9 Illustration Relevanter Ausschnitt des Raums (1) Opel Audi BMW Hessen Marke Datum Geography Sum of Revenue Time Prod_Category Cross Ind. Apps Home software Other Apps Vertical Apps Platform Product Bayern Saarland Time Bundesland Begrifflichkeit für das Folgende: Elementarposition. Prod_Category Data Warehousing und Mining: Exploration des Data Cubes 33 Data Warehousing und Mining: Exploration des Data Cubes 34 Relevanter Ausschnitt des Raums (2) Motivation für den DIFF Operator Sum of Revenue Time Prod_Category Cross Ind. Apps Home software Other Apps Vertical Apps Der angezeigte Ausschnitt des Data Cubes steht für konkreten Wert entlang mancher Dimensionen, für andere Dimensionen ist der Wert (ALL). Wir betrachten im folgenden die Subcubes über die Dimensionen, entlang denen Drill-Down noch möglich ist. C a Subcube mit erster Zelle, C b dto. zweite Zelle. C a und C b haben gleiche Struktur. Geography Sum of Revenue Time Prod_Category Cross Ind. Apps Home software Other Apps Vertical Apps Prod_Category Platform Product Zelle 1 Zelle 2 Time Erklärung für die Differenz von über 5000? Data Warehousing und Mining: Exploration des Data Cubes 35 Data Warehousing und Mining: Exploration des Data Cubes 36

10 Illustration Zellpaar Detail-N Ansatz (1) Platform Platform Product Product Geography Geography Subcube für 1992 Subcube für 1993 Data Warehousing und Mining: Exploration des Data Cubes 37 Mögliches Ergebnis des DIFF-Operators: N Zellpaare mit maximalem Detaillierungsgrad. Sie sollen am Aggregat beteiligt sein und möglichst großen Teil der Differenz ausmachen. Detail-N Antwort erklärt im Beispiel eine Differenz von knapp Product Geography Platform Year_92 Year_93 Ratio Other Vert. ApWestern Europe Multiuser Minicomputer 5,2 99,9 19,2 Other Vert. ApAsia/Pacific Singleuser MacOS 3,7 92,5 25 Other Vert. ApRest of World Multiuser Mainframe 2,8 88,1 31,4 Other Vert. ApWestern Europe Singleuser UNIX 7,3 96,3 13,1 Other Vert. ApUnited States Multiuser Minicomputer 2,9 97,2 33,5 Other Vert. ApRest of World Multiuser Minicomputer 12 99,5 8,29 Other Vert. ApAsia/Pacific Multiuser UNIX 1,7 99,6 41,3 EDA Western Europe Multiuser Mainframe 192,6 277,8 1,44 ManufacturingUnited States Multiuser Minicomputer 6,3 88,4 13,9 Health Care United States Multiuser Mainframe 2,4 88,2 30,5 236,9 1127,5 - Zahlen stimmen nicht, nur Illustration - Data Warehousing und Mining: Exploration des Data Cubes 38 Detail-N Ansatz (2) Detail-N Ansatz (3) Verbesserung: Nicht nur auf der detailliertesten Ebene arbeiten, sondern auf der aussagekräftigsten. D. h. Zeilen zusammenfassen, die unterschiedlichen Zellen entsprechen. Zugrundeliegende Annahme: Benutzer will nur bestimmte Anzahl von Zeilen sehen, z. B. eine Bildschirmseite voll. Platform Platform Product Product Geography Geography Subcube für 1992 Subcube für 1993 Data Warehousing und Mining: Exploration des Data Cubes 39 Data Warehousing und Mining: Exploration des Data Cubes 40

11 Ergebnis des DIFF Operators (1) Bessere Antwort erklärt eine Differenz von über Product Geography Platform Year_92 Year_93 Ratio Abw. (All)- (All)- (All) Manufacturing - Pro(All) (All) Other V. A. (All)- (All) Other V. A. United States (All) Other V. A. Western Europe(All) Manufacturing - Dis(All) (All) Health Care (All)- (All) Health Care United States Multiuser Banking/Finance United States (All) Mechanical CAD United States (All) Ergebnis des DIFF-Operators (2) Product Geography Platform Year_92 Year_93 Ratio Abw. (All)- (All)- (All) Manufacturing - Pro(All) (All) Other V. A. (All)- (All) Other V. A. United States (All) Other V. A. Western Europe(All) Manufacturing - Dis(All) (All) Health Care (All)- (All) Health Care United States Multiuser Banking/Finance United States (All) Mechanical CAD United States (All) Erläuterungen: Abkürzung für diese Tabelle: A Jede Zeile entspricht einer Position im Raum. Erste Zeile entspricht den markierten Zellen abzüglich der Werte, die explizit aufgelistet sind. Minuszeichen hinter (ALL) bedeutet, daß es sich nicht um Summe aller Werte handelt, sondern daß Zeile folgt, die für speziellere Zelle steht. Data Warehousing und Mining: Exploration des Data Cubes 41 Data Warehousing und Mining: Exploration des Data Cubes 42 Wie kommt man auf die Ratios? (1) Wie kommt man auf die Ratios? (2) Rot unterlegte Zellen klar. Sonstige Zellen nicht ganz so offensichtlich. Angenommen, A beschreibt Unterschied zwischen 1992 und A hat zwei Zeilen: Filialen A 2,5 B C Produkte 0,5 Tabelle für 1992: A B C Tabelle für 1993: A??? B??? C??? Ratio einer Zelle ergibt sich aus Ratio der unmittelbarsten Vorgängerzelle und den bekannten Ratios von Nachbarzellen. Data Warehousing und Mining: Exploration des Data Cubes 43 Data Warehousing und Mining: Exploration des Data Cubes 44

12 Wie kommt man auf die Ratios? (3) Ergebnis des DIFF-Operators (3) Es handelt sich um eine Möglichkeit, die Ratios zu interpretieren. Andere Interpretationen sind denkbar (z. B. auch teilweise Berücksichtigung der Nachbarzellen). Führt aber zu zusätzlichen Parametern, kompliziert. Product Geography Platform Year_92 Year_93 Ratio Abw. (All)- (All)- (All) Manufacturing - Pro(All) (All) Other V. A. (All)- (All) Other V. A. United States (All) Other V. A. Western Europe(All) Manufacturing - Dis(All) (All) Health Care (All)- (All) Health Care United States Multiuser Banking/Finance United States (All) Mechanical CAD United States (All) Error ( Abw. ) Erläuterung: Reflektiert, inwieweit der Verhältnis-Wert ( Ratio ) auch für die Kinder gilt, die nicht explizit aufgeführt sind. Großer Error: Im Mittel starke Abweichung der einzelnen Kinder. Formel hier: Wurzel der Summen der Abweichung jeder Detail-Zeile zum Quadrat, d. h. L2-Norm. Data Warehousing und Mining: Exploration des Data Cubes 45 Data Warehousing und Mining: Exploration des Data Cubes 46 Beispiel für großen und kleinen Error Tradeoff Großer Error: Product Geography Platform Year_92 Year_93 Health Care United States (All) Health Care United States Multiuser Health Care United States Single-User Health Care United States Palm Health Care United States Xbox Kleiner Error: Product Geography Platform Year_92 Year_93 Health Care United States (All) Health Care United States Multiuser Health Care United States Single-User Health Care United States Palm Welche Zeilen? DIFF-Ergebnis mit wenigen Zeilen, die Großteil der Differenz erklären, hat i. a. recht großen Fehler ( zu allgemeine Aussagen ). DIFF-Ergebnis mit kleinem Fehler ist i. a. zu ausführlich ( zu detaillierte Aussagen ), bzw. reicht vorgegebene Zeilenanzahl nicht aus. Ziel daher: Zusammenfassen von Zeilen, die ähnliches Verhältnis haben. Bei großem Unterschied explizit aufführen. Motiviert informationstheoretische Behandlung des Sachverhalts. Data Warehousing und Mining: Exploration des Data Cubes 47 Data Warehousing und Mining: Exploration des Data Cubes 48

13 (1) (2) Angenommen, wir wollen jemandem, der C a kennt, mitteilen, wie sich C b von C a unterscheidet. Möglich, C b zu schicken. Aber aufwendig. Stattdessen ungefähre, aber möglichst gute Zusammenfassung der Differenz. Tabelle A Filialen A 2,5 B C Produkte 0,5 Anzahl der Zeilen der Tabelle zunächst von außen vorgegeben. A so wählen, daß Fehler minimal. Tabelle für 1992 C a : A B C Tabelle für 1993 C b : A 25 2,5 2,5 B 2,5 2,5 2,5 C 2,5 2,5 2,5 Data Warehousing und Mining: Exploration des Data Cubes 49 Data Warehousing und Mining: Exploration des Data Cubes 50 Fehler Illustration (3) Tabelle für 1992 C a : A B C A Filialen A 2,5 B C Produkte 0,5 Fehler = Anzahl der Bits, die für Übermittlung des Fehlers erforderlich wären, wenn man A statt C b überträgt. Vorhersage für C b : A 2,5 0,25 0,25 B 0,25 0,25 0,25 C 0,25 0,25 0,25 Tabelle für 1993 C b : A 2,5 0,1 0,25 B 0,25 0,3 0,2 C 0,25 0,4 0,25 Data Warehousing und Mining: Exploration des Data Cubes 51 Data Warehousing und Mining: Exploration des Data Cubes 52

14 Fehlerwahrscheinlichkeit (4) Angenommen, tatsächliche Werte normalverteilt um Vorhersagewert. WS(Differenz zwischen tatsächlichem und Vorhersagewert 0) = 1 WS(Differenz zwischen tatsächlichem und Vorhersagewert δ) = c δ Anzahl der Bits für Fehlerübermittlung mit Hilfe dieser Wahrscheinlichkeit berechenbar. dieser Anzahl der Bits gemäß Theorem (s. b. folgende Folie). Data Warehousing und Mining: Exploration des Data Cubes 53 Data Warehousing und Mining: Exploration des Data Cubes 54 Wie groß ist der Fehler? Aussage zu Codierungsaufwand Informationstheoretisches Theorem (Shannon). Sei x eine Aussage. Sei M ein. Wieviele Bits reichen, um x in M zu codieren? Gemäß Theorem sind es -log Pr[x M] Bits. (Pr [x M] WS, daß x eintritt, gegeben M.) Filialen A 2,5 B C Produkte 0,5 M x Zur der WS vergleichen wir tatsächlichen Wert in C b mit erwartetem Wert gemäß C a und A für jede Elementar-Position. Ausgehend von WS-Verteilung (z. B. Normalvert.) um erwarteten Wert; cost(v)=-logpr[tatsächlicher Wert erwarteter Wert] Codierungsaufwand, d. h. Abweichung von A = Summe der Kosten für jede Elementar-Position. Tabelle für 1992 C a : A B C Tabelle für 1993 C b : A 2,5 0,1 0,25 B 0,25 0,3 0,2 C 0,25 0,4 0,25 Data Warehousing und Mining: Exploration des Data Cubes 55 Data Warehousing und Mining: Exploration des Data Cubes 56

15 der Anzahl Bits forall (v ist Detail-Zeile von C b ) if (v ist Bestandteil von A) WS = 1; cost(v)=0; else finde unmittelbarsten Vorgänger p in A; r = Ratio von p; erwarteter Wert v b von v in C b ist r v a ; ausgehend von WS-Verteilung um r v a ; cost(v)=-logpr[v b r v a ] // Normalverteilung meist OK inkrementiere Gesamtanzahl Bits um cost(v) (5) Anzahl der Zeilen N war bis jetzt gegeben, kann aber miteinbezogen werden, indem wir Kosten des Transfers von A explizit machen. Kosten einer Zeile: Σ(log(n i +1))+log c n i Kardinalität der Dimension i von C a. Summand 1 berücksichtigt, daß auch (ALL) möglich ist. c Verhältnis selbst muß auch kodiert werden. Product Geography Platform Year_92 Year_93 Ratio Abw. (All)- (All)- (All) Manufacturing - Pro(All) (All) Other V. A. (All)- (All) Other V. A. United States (All) Other V. A. Western Europe(All) Manufacturing - Dis(All) (All) Health Care (All)- (All) Health Care United States Multiuser Banking/Finance United States (All) Mechanical CAD United States (All) Data Warehousing und Mining: Exploration des Data Cubes 57 Data Warehousing und Mining: Exploration des Data Cubes 58 (1) (2) Jetzt müßte noch besprochen werden: Schneller Algorithmus, der das A bestimmt, Umgang mit fehlenden Werten. Ansatz nicht darauf beschränkt, daß Zellen sich nur in einer Dimension unterscheiden. Es muß aber gemeinsame Subcubes geben. Kapitel hat behandelt: Motivation für das Sichtbarmachen von, unterschiedliche Überraschungswerte, unterschiedliche Definitionen auf der technischen Ebene, Motivation für das Zusammenfassen von Unterschieden zwischen Subcubes, Vorgehen, um zu aussagekräftiger, aber prägnanter Zusammenfassung zu kommen. Insgesamt: Sinnvolle Maßnahmen zur Unterstützung der Exploration des Cubes; generisches Interface bietet zuviele Interaktionsmöglichkeiten. Data Warehousing und Mining: Exploration des Data Cubes 59 Data Warehousing und Mining: Exploration des Data Cubes 60

16 Literatur Sunita Sarawagi, Rakesh Agrawal, Nimrod Megiddo, Discovery-driven Exploration of OLAP Data Cubes, Proc. of the Sixth Int'l Conference on Extending Database Technology (EDBT), Valencia, Spain, March Sunita Sarawagi, Explaining Differences in Multidimensional Aggregates, Proc. of the 25 th Int l Conference on Very Large Databases, Prüfungsfragen, beispielhaft Was bedeutet 'erwarteter Wert' im multidimensionalen? Wie kann man ihn berechnen? Was bedeutet 'Ausnahme' gemäß der Vorlesung im multidimensionalen? Wie kann man zur Verbesserung der Visualisierung des Data Cubes verwenden? Erklären Sie den DIFF-Operator (Motivation, Umsetzung). Data Warehousing und Mining: Exploration des Data Cubes 61 Data Warehousing und Mining: Exploration des Data Cubes 62

Kapitel 5: Vom relationalen zum multidimensionalen Datenmodell

Kapitel 5: Vom relationalen zum multidimensionalen Datenmodell Data Warehousing, Gliederung Kapitel 5: Vom relationalen zum multidimensionalen Datenmodell Dimensionen und Measures Schematypen für Data Warehousing Groupy und Data Cubes Operatoren für den Data Cube

Mehr

Data Cube. Aggregation in SQL. Beispiel: Autoverkäufe. On-line Analytical Processing (OLAP) 1. Einführung. 2. Aggregation in SQL, GROUP BY

Data Cube. Aggregation in SQL. Beispiel: Autoverkäufe. On-line Analytical Processing (OLAP) 1. Einführung. 2. Aggregation in SQL, GROUP BY Data Cube On-line Analytical Processing (OLAP). Einführung Ziel: Auffinden interessanter Muster in großen Datenmengen 2. Aggregation in SQL, GROUP BY 3. Probleme mit GROUP BY 4. Der Cube-Operator! Formulierung

Mehr

Vertrautmachen mit Daten

Vertrautmachen mit Daten Kapitel III Vertrautmachen mit Daten 2004 AIFB / FZI 1 III Vertrautmachen mit Daten (see also Data Preparation ) 2004 AIFB / FZI 2 III Vertrautmachen mit Daten III.1 OLAP III.1.1 Einführung in OLAP Wie

Mehr

Wärmepumpe Stromverbrauch Wärmepumpe. Jahresüberblick Kosten pro Monat [ ] Monatsdurchschnittstemperatur [ C]

Wärmepumpe Stromverbrauch Wärmepumpe. Jahresüberblick Kosten pro Monat [ ] Monatsdurchschnittstemperatur [ C] Wärmepumpe 27 Jahresüberblick 27 25 3, 2 15 157 138 133 149 191 25, 2, 15, 1 92 9 1, 5 58 39 31 34 3 24 5,, Jan Feb Mar Apr Mai Jun Jul Aug Sep Okt Nov Dez Ø -5, Kosten pro Monat [ ] Monatsdurchschnittstemperatur

Mehr

CHECK24-Autokreditatlas. Analyse der Autokredit-Anfragen aller CHECK24-Kunden aus 2011 & 2012

CHECK24-Autokreditatlas. Analyse der Autokredit-Anfragen aller CHECK24-Kunden aus 2011 & 2012 CHECK24-Autokreditatlas Analyse der Autokredit-Anfragen aller CHECK24-Kunden aus 2011 & 2012 Stand: März 2013 CHECK24 2013 Agenda 1. Methodik 2. Zusammenfassung 3. Autokredite 2011 vs. 2012 4. Kredit,

Mehr

6.6 Vorlesung: Von OLAP zu Mining

6.6 Vorlesung: Von OLAP zu Mining 6.6 Vorlesung: Von OLAP zu Mining Definition des Begriffs Data Mining. Wichtige Data Mining-Problemstellungen, Zusammenhang zu Data Warehousing,. OHO - 1 Definition Data Mining Menge von Techniken zum

Mehr

Kap. 6 Data Warehouse

Kap. 6 Data Warehouse 1 Kap. 6 Data Warehouse 6.1 Was ist ein Data Warehouse, Motivation? 6.2 Data Cube und Cube-Operationen 6.3 Workshop: MS SQL Server, Cube Operationen 6.4 Physischer Entwurf, Implementierung von Cubes 6.5

Mehr

Hard- und Software Entwicklung von Videogames zur Entertainment-Plattform

Hard- und Software Entwicklung von Videogames zur Entertainment-Plattform Hard- und Software Entwicklung von Videogames zur Entertainment-Plattform Manfred Gerdes Senior Vice President Sony Computer Entertainment Europe Biografie Manfred Gerdes kam am 1. Januar 1996 als Verkaufsdirektor

Mehr

Monat Datum Veranstaltung Veranstalter Mietkosten Bestätigung Vertrag Bezahlt

Monat Datum Veranstaltung Veranstalter Mietkosten Bestätigung Vertrag Bezahlt Monat Datum Veranstaltung Veranstalter Mietkosten Bestätigung Vertrag Bezahlt Januar Mi, 01.Jan.14 Do, 02.Jan.14 Fr, 03.Jan.14 Sa, 04.Jan.14 So, 05.Jan.14 Mo, 06.Jan.14 Di, 07.Jan.14 Mi, 08.Jan.14 Do,

Mehr

bersicht Datenbanken und Datawarehouses Datenbank Datenbanksysteme Niels Schršter

bersicht Datenbanken und Datawarehouses Datenbank Datenbanksysteme Niels Schršter bersicht Niels Schršter EinfŸhrung GROUP BY Roll UpÔs Kreuztabellen Cubes Datenbank Ansammlung von Tabellen, die einen ãausschnitt der WeltÒ fÿr eine Benutzergruppe beschreiben. Sie beschreiben die funktionalen

Mehr

Externer Meilenstein. Manueller Sammelrollup Unterbrechung. Inaktiver Vorgang. Inaktiver Meilenstein Inaktiver Sammelvorgang

Externer Meilenstein. Manueller Sammelrollup Unterbrechung. Inaktiver Vorgang. Inaktiver Meilenstein Inaktiver Sammelvorgang Nr. Vorgasname Dauer Anfang Fertig stellen VorgWer 1 Kick Off 0 Tage Di 05.02.13 Di 05.02.13 Alle 2 Grobkonzept erstellen 20 Tage Di 05.02.13 Mo 04.03.131 CN 3 Vorauswahl Shopsysteme 21 Tage Di 05.02.13

Mehr

Prozesse beim Data Mining. Relevante Fachgebiete für Data Mining. Beispiel: Datenquelle (relationale DB) Architektur eines Data Mining Systems

Prozesse beim Data Mining. Relevante Fachgebiete für Data Mining. Beispiel: Datenquelle (relationale DB) Architektur eines Data Mining Systems Relevante Fachgebiete für Data Mining Prozesse beim Data Mining 1. Data cleaning: Datensäuberung von Rauschen & Inkonsistenz 2. Data integration: Datenintegration aus multiplen Quellen 3. Data selection:

Mehr

Kurstage Geprüfte(r) Technischer Fachwirt(-in) IHK

Kurstage Geprüfte(r) Technischer Fachwirt(-in) IHK Kurstage Geprüfte(r) Technischer Fachwirt(-in) IHK 18.10.2015 Sonntag WÜ 19.02.2016 Freitag WÜ Vertiefungstag 24.10.2015 Samstag WÜ 20.02.2016 Samstag WÜ Vertiefungstag 14.11.2015 Samstag WÜ 21.02.2016

Mehr

Kurstage Geprüfte(r) Technischer Fachwirt(-in) IHK

Kurstage Geprüfte(r) Technischer Fachwirt(-in) IHK Kurstage Geprüfte(r) Technischer Fachwirt(-in) IHK 06.10.2012 Samstag MD 15.02.2013 Freitag MD Vertiefungstag 20.10.2012 Samstag MD 16.02.2013 Samstag MD Vertiefungstag 03.11.2012 Samstag MD 17.02.2013

Mehr

Marktreport Strukturierte Produkte Monatsbericht

Marktreport Strukturierte Produkte Monatsbericht Marktreport Strukturierte Produkte Monatsbericht Juli 215 Schweizerischer Verband für Strukturierte Produkte SVSP Marktreport SVSP Juli 215 Schweizerischer Verband für Strukturierte Produkte SVSP www.svsp-verband.ch

Mehr

Einleitung. ROLLUP, CUBE und GROUPING. Markus Jägle (markus.jaegle@trivadis.com) Art der Info Technische Background Info (April 2002)

Einleitung. ROLLUP, CUBE und GROUPING. Markus Jägle (markus.jaegle@trivadis.com) Art der Info Technische Background Info (April 2002) Betrifft Autör: GROUPING_ID Markus Jägle (markus.jaegle@trivadis.com) Art der Info Technische Background Info (April 2002) Quelle Aus dem Oracle9i Data Warehousing Guide und den Kursen New Features Oracle9i

Mehr

Kurstage Geprüfte(r) Technischer Fachwirt(-in) IHK

Kurstage Geprüfte(r) Technischer Fachwirt(-in) IHK Kurstage Geprüfte(r) Technischer Fachwirt(-in) IHK 17.10.2015 Samstag N 19.02.2016 Freitag N Vertiefungstag 24.10.2015 Samstag N Reserve 1) 20.02.2016 Samstag N Vertiefungstag 25.10.2015 Sonntag N 21.02.2016

Mehr

Webergänzung zu Kapitel 10

Webergänzung zu Kapitel 10 Webergänzung zu Kapitel 10 10.1.4 Varianzanalyse (ANOVA: analysis of variance) Im Kapitel 10 haben wir uns hauptsächlich mit Forschungsbeispielen beschäftigt, die nur zwei Ergebnissätze hatten (entweder

Mehr

Contents. Datenanalysemethoden im analytischen CRM. Data Warehouse - OLAP Version: July 17, 2007. 1 Datenanalysemethoden im analytischen CRM

Contents. Datenanalysemethoden im analytischen CRM. Data Warehouse - OLAP Version: July 17, 2007. 1 Datenanalysemethoden im analytischen CRM Contents Data Warehouse - OLAP Version: July 17, 7 Andreas Geyer-Schulz und Anke Thede Schroff-Stiftungslehrstuhl Informationsdienste und Elektronische Märkte Fakultät für Wirtschaftswissenschaften Gebäude

Mehr

Auswertung von Grundinformationen zu den Jugendleiter/innen Juleica-Daten

Auswertung von Grundinformationen zu den Jugendleiter/innen Juleica-Daten Auswertung von Grundinformationen zu den Jugendleiter/innen Juleica-Daten Stand: Februar bzw. April 2 1 Arbeitsstelle Kinder- und Jugendhilfestatistik im für den Deutschen Bundesjugendring FACHBEREICH

Mehr

Projektmanagement für Ingenieure

Projektmanagement für Ingenieure Springer Vieweg PLUS Zusatzinformationen zu Medien von Springer Vieweg Projektmanagement für Ingenieure Ein praxisnahes Lehrbuch für den systematischen Projekterfolg 2013 2. Auflage Kapitel 9 Lösungen

Mehr

Relevante Fachgebiete für Data Mining

Relevante Fachgebiete für Data Mining Relevante Fachgebiete für Data Mining 1 Prozesse beim Data Mining 1. Data cleaning: Datensäuberung von Rauschen & Inkonsistenz 2. Data integration: Datenintegration aus multiplen Quellen 3. Data selection:

Mehr

Highlights der AllFacebook Developer Conference 23. November 2012, Berlin

Highlights der AllFacebook Developer Conference 23. November 2012, Berlin Highlights der AllFacebook Developer Conference 23. November 2012, Berlin René Milzarek 1 Konferenz Programm OPENING KEYNOTE Inside Open Graph: How to connect all the things! Michael Kamleitner (Die Socialisten)

Mehr

Statistik I. Übungklausur. Prof. Dr. H. Toutenburg

Statistik I. Übungklausur. Prof. Dr. H. Toutenburg Statistik I Übungklausur Prof. Dr. H. Toutenburg Hinweis: Die Zeitangaben sollen Ihnen aufzeigen wieviel Zeit Ihnen für eine Aufgabe von gewissem Umfang eingeräumt wird. Die Punktzahlen für die einzelnen

Mehr

Chronologie Jan 02: Otto-Katalog Okt 04: Fingerabdrücke USA Dez 04: EU-Parlament und -Rat Jun 05: epass-kabinettsbeschluß Jul 05: Bundesratsbeschluß Aug 05: BioP2-Studie Nov 05: Einführung epass Forschungsprojekt

Mehr

Realisierung von OLAP Operatoren in einem visuellen Analysetool. Vortrag von Alexander Spachmann und Thomas Lindemeier

Realisierung von OLAP Operatoren in einem visuellen Analysetool. Vortrag von Alexander Spachmann und Thomas Lindemeier Realisierung von OLAP Operatoren in einem visuellen Analysetool Vortrag von Alexander Spachmann und Thomas Lindemeier Gliederung Ausgangssituation/Motivation Was ist OLAP? Anwendungen Was sind Operatoren?

Mehr

Januar 2016. Deadline und Abrechnungsdetails. Zeichnungen. Rücknahmen. Deadline CET. Deadline CET. Valuta Titellieferung. Valuta Geldüberweisung

Januar 2016. Deadline und Abrechnungsdetails. Zeichnungen. Rücknahmen. Deadline CET. Deadline CET. Valuta Titellieferung. Valuta Geldüberweisung und sdetails Januar 2016 CH0017403509 1'740'350 Reichmuth Himalaja CHF 25. Jan 16 12.00 25. Jan 16 1) 29. Jan 16 17. Feb 16 1. Feb 16 3) CH0017403574 1'740'357 Reichmuth Himalaja EUR 25. Jan 16 12.00 25.

Mehr

Kurstage Geprüfte(r) Technischer Fachwirt(-in) IHK

Kurstage Geprüfte(r) Technischer Fachwirt(-in) IHK Kurstage Geprüfte(r) Technischer Fachwirt(-in) IHK 17.10.2015 Samstag HN 19.02.2016 Freitag HN Vertiefungstag 24.10.2015 Samstag HN 20.02.2016 Samstag HN Vertiefungstag 01.11.2015 Sonntag HN 21.02.2016

Mehr

PV Marktdaten Update Juni 2015

PV Marktdaten Update Juni 2015 PV Marktdaten Update Juni 2015 Stand 31.07.2015 Alle Angaben ohne Gewähr 1 Vorwort zur Datenerhebung Juni 2015 Monatliche Veröffentlichung der PV-Meldezahlen Die Bundesnetzagentur veröffentlicht gemäß

Mehr

Motivation. Themenblock: Klassifikation. Binäre Entscheidungsbäume. Ansätze. Praktikum: Data Warehousing und Data Mining.

Motivation. Themenblock: Klassifikation. Binäre Entscheidungsbäume. Ansätze. Praktikum: Data Warehousing und Data Mining. Motivation Themenblock: Klassifikation Praktikum: Data Warehousing und Data Mining Ziel Item hat mehrere Attribute Anhand von n Attributen wird (n+)-tes vorhergesagt. Zusätzliches Attribut erst später

Mehr

LMS Training Services - Contact Info

LMS Training Services - Contact Info Siemens Industry Sector Siemens Industry Software NV Interleuvenlaan 68 Researchpark Haasrode Z1 B 3001 Leuven [] T +32 16 384 200 F +32 16 384 350 www.siemens.com/plm LMS Training Services - Contact Info

Mehr

Bayes sches Lernen: Übersicht

Bayes sches Lernen: Übersicht Bayes sches Lernen: Übersicht Bayes sches Theorem MAP, ML Hypothesen MAP Lernen Minimum Description Length Principle Bayes sche Klassifikation Naive Bayes Lernalgorithmus Teil 5: Naive Bayes + IBL (V.

Mehr

Motivation. Themenblock: Data Preprocessing. Einsatzgebiete für Data Mining I. Modell von Gianotti und Pedreschi

Motivation. Themenblock: Data Preprocessing. Einsatzgebiete für Data Mining I. Modell von Gianotti und Pedreschi Motivation Themenblock: Data Preprocessing We are drowning in information, but starving for knowledge! (John Naisbett) Was genau ist Datenanalyse? Praktikum: Data Warehousing und Data Mining Was ist Data

Mehr

Daniel Heß. Donnerstag, den 16. November 2006. Verein zur Förderung der privaten Internet Nutzung e.v. Wie funktioniert das Internet? dh@ping.

Daniel Heß. Donnerstag, den 16. November 2006. Verein zur Förderung der privaten Internet Nutzung e.v. Wie funktioniert das Internet? dh@ping. Daniel Heß Verein zur Förderung der privaten Internet Nutzung e.v. Donnerstag, den 16. November 2006 Was ist Ein globales Netzwerk von Computern und Kommunikationsgeräten Quelle für eine fast unendliche

Mehr

Vorgang Unterbrechung In Arbeit. Meilenstein Sammelvorgang Projektsammelvorgang. Externe Vorgänge Externer Meilenstein Stichtag

Vorgang Unterbrechung In Arbeit. Meilenstein Sammelvorgang Projektsammelvorgang. Externe Vorgänge Externer Meilenstein Stichtag Nr. sname Dauer Anfang Ende Vorgänger Ressourcennamen 06. Jan '14 13. Jan '14 M D M D F S S M D M D F S S 1 AdA nach AEVO (IHK Vorbereitung) 10 Tage Mo 06.01.14 Fr 17.01.14 AdA nach AEVO (IHK Vorbereitung)

Mehr

Disclosure of shareholdings

Disclosure of shareholdings Disclosure of shareholdings Credit Suisse Group AG announces a change in the composition of the Group that holds shares in Zurich Financial Services Ltd Zurich Financial Services Ltd Mythenquai 2 8022

Mehr

Meilenstein. Sammelvorgang. Projektsammelvorgang. Seite 1

Meilenstein. Sammelvorgang. Projektsammelvorgang. Seite 1 Nr. sname Dauer Anfang Ende 1 Urteilsspruch (Annahme) 0 Tage Mo 01.06.09 Mo 01.06.09 2 3 Konzept Zwischenphase 33 Tage Mi 15.04.09 Fr 29.05.09 4 Vorbereitung und Start 3 Tage Mi 15.04.09 Fr 17.04.09 5

Mehr

SWISS Verkehrszahlen Juli 2007

SWISS Verkehrszahlen Juli 2007 SWISS Verkehrszahlen Juli 2007 SWISS im Juli mit höherer Auslastung SWISS konnte ihre Auslastung im Juli weiter steigern: Der durchschnittliche Sitzladefaktor (SLF) lag bei 85% gegenüber 84.2% im Vorjahr.

Mehr

Data Warehousing. Fragen des Marketingleiters. Beispiel: : Amazon. Technisch... Amazon weltweit... Datenbank. Aufbau eines DWH OLAP <-> OLTP Datacube

Data Warehousing. Fragen des Marketingleiters. Beispiel: : Amazon. Technisch... Amazon weltweit... Datenbank. Aufbau eines DWH OLAP <-> OLTP Datacube Fragen des Marketingleiters Data Warehousing Wie viele Bestellungen haben wir jeweils im Monat vor Weihnachten, aufgeschlüsselt nach? Aufbau eines DWH OLAP OLTP Datacube Beispiel: : Amazon Technisch

Mehr

TreffpunktWALD Alle Veranstaltungen rund um den Wald! TreffpunktWALD (MeetingpointFOREST)

TreffpunktWALD Alle Veranstaltungen rund um den Wald! TreffpunktWALD (MeetingpointFOREST) TreffpunktWALD (MeetingpointFOREST) 1 a platform for forest communication: TreffpunktWALD What? 1. internal organization of activities of its members 2. online calendar of events in the forest (www.treffpunktwald.de)

Mehr

Mala Bachmann September 2000

Mala Bachmann September 2000 Mala Bachmann September 2000 Wein-Shop (1) Umsatz pro Zeit und Produkt Umsatz Jan Feb Mrz Q1 Apr 2000 Merlot 33 55 56 144 18 760 Cabernet-S. 72 136 117 325 74 1338 Shiraz 85 128 99 312 92 1662 Rotweine

Mehr

Präventionsbericht 2007

Präventionsbericht 2007 Bericht über die Präventionsarbeit der Informationszentrale gegen Vergiftungen des Landes Nordrhein-Westfalen mittels Internetpräsenz am Zentrum für Kinderheilkunde des Universitätsklinikums Bonn für das

Mehr

Kurstage Geprüfte(r) Technischer Fachwirt(-in) IHK

Kurstage Geprüfte(r) Technischer Fachwirt(-in) IHK Kurstage Geprüfte(r) Technischer Fachwirt(-in) IHK 16.04.2016 Samstag H 22.10.2016 Samstag H 23.04.2016 Samstag H 05.11.2016 Samstag H 24.04.2016 Sonntag H 19.11.2016 Samstag H 30.04.2016 Samstag H 26.11.2016

Mehr

Kurstage Geprüfte(r) Technischer Fachwirt(-in) IHK

Kurstage Geprüfte(r) Technischer Fachwirt(-in) IHK Kurstage Geprüfte(r) Technischer Fachwirt(-in) IHK 31.10.2015 Samstag MD 19.02.2016 Freitag MD Vertiefungstag 01.11.2015 Sonntag MD 20.02.2016 Samstag MD Vertiefungstag 07.11.2015 Samstag MD 21.02.2016

Mehr

Entwicklung des deutschen PV-Marktes Auswertung und grafische Darstellung der Meldedaten der Bundesnetzagentur nach 16 (2) EEG 2009 Stand 31.3.

Entwicklung des deutschen PV-Marktes Auswertung und grafische Darstellung der Meldedaten der Bundesnetzagentur nach 16 (2) EEG 2009 Stand 31.3. Entwicklung des deutschen PV-Marktes Auswertung und grafische Darstellung der Meldedaten der Bundesnetzagentur nach 16 (2) EEG 29 Stand 31.3.215 PV-Meldedaten Jan. Feb. 215 Bundesverband Solarwirtschaft

Mehr

Aufgaben zu Kapitel 9

Aufgaben zu Kapitel 9 Aufgaben zu Kapitel 9 Aufgabe 1 Für diese Aufgabe benötigen Sie den Datensatz Nominaldaten.sav. a) Sie arbeiten für eine Marktforschungsfirma und sollen überprüfen, ob die in diesem Datensatz untersuchte

Mehr

Kurstage IT Fachwirt(-in) IHK

Kurstage IT Fachwirt(-in) IHK Kurstage IT Fachwirt(-in) IHK 21.05.2016 Samstag H 23.09.2016 Freitag H Vertiefungstag 28.05.2016 Samstag H 24.09.2016 Samstag H Vertiefungstag 11.06.2016 Samstag H 25.09.2016 Sonntag H Vertiefungstag

Mehr

Veräußerung von Emissionsberechtigungen in Deutschland

Veräußerung von Emissionsberechtigungen in Deutschland Veräußerung von Emissionsberechtigungen in Deutschland Monatsbericht September 2008 Berichtsmonat September 2008 Die KfW hat im Zeitraum vom 1. September 2008 bis zum 30. September 2008 3,95 Mio. EU-Emissionsberechtigungen

Mehr

Contracts for Difference (CFDs) Kennzahlen Q2 2009

Contracts for Difference (CFDs) Kennzahlen Q2 2009 RESEARCH CENTER FOR FINANCIAL SERVICES Contracts for Difference (CFDs) Kennzahlen Q2 29 Statistik im Auftrag des Contracts for Difference Verband e. V. München, im Juli 29 Steinbeis Research Center for

Mehr

Intelligence (BI): Von der. Nürnberg, 29. November 2011

Intelligence (BI): Von der. Nürnberg, 29. November 2011 Modelle für Business Intelligence (BI): Von der Anforderung zum Würfel Nürnberg, 29. November 2011 Warum Modelle für Business Intelligence (BI)? Warum Modelle für Business Intelligence (BI)? Bis zur Auswertung

Mehr

Kurstage Geprüfte(r) Technischer Fachwirt(-in) IHK

Kurstage Geprüfte(r) Technischer Fachwirt(-in) IHK Kurstage Geprüfte(r) Technischer Fachwirt(-in) IHK 15.11.2015 Sonntag OS 19.02.2016 Freitag OS Vertiefungstag 21.11.2015 Samstag OS 20.02.2016 Samstag OS Vertiefungstag 22.11.2015 Sonntag OS Reserve 1)

Mehr

5 Zusammenhangsmaße, Korrelation und Regression

5 Zusammenhangsmaße, Korrelation und Regression 5 Zusammenhangsmaße, Korrelation und Regression 5.1 Zusammenhangsmaße und Korrelation Aufgabe 5.1 In einem Hauptstudiumsseminar des Lehrstuhls für Wirtschafts- und Sozialstatistik machten die Teilnehmer

Mehr

SiteAudit Analyzer. Ein kurzer Überblick. Audit und Flotten-Management Flottenanalyse und Berichtswesen Kompatibel mit allen Umgebungen

SiteAudit Analyzer. Ein kurzer Überblick. Audit und Flotten-Management Flottenanalyse und Berichtswesen Kompatibel mit allen Umgebungen Das fortschrittliche Tool für MPS- Berichtswesen Bestand Flottenalter Flottenmix Volumenmix Volumenentwicklung Auslastung Füllstände Nachfüllung Materialverschwendung Flottenzustand Probleme im Bestand

Mehr

731 Lindau - Friedrichshafen - Radolfzell Bodensee-Gürtelbahn

731 Lindau - Friedrichshafen - Radolfzell Bodensee-Gürtelbahn 731 Lindau - Friedrichshaen - Radolzell Bodensee-Gürtelbahn 731 Von Kressbronn bis Sipplingen Verbundtari Bodensee-Oberschwaben Verkehrsverbund (bodo) Von Überlingen-Nußdor bis Singen (Hohentwiel) Verbundtari

Mehr

Pivotieren. Themenblock: Anfragen auf dem Cube. Roll-up und Drill-down. Slicing und Dicing. Praktikum: Data Warehousing und Data Mining. Produkt.

Pivotieren. Themenblock: Anfragen auf dem Cube. Roll-up und Drill-down. Slicing und Dicing. Praktikum: Data Warehousing und Data Mining. Produkt. Zeit Pivotieren Themenblock: Anfragen auf dem Cube Praktikum: Data Warehousing und Data Mining Zeit Zeit 2 Roll-up und Drill-down Slicing und Dicing Drill-down Januar 2 3 33 1. Quartal 11 36 107 Februar

Mehr

4PLAN Managed Service HR Controlling Prozess und Leistungen

4PLAN Managed Service HR Controlling Prozess und Leistungen World Class HR Controlling 4PLAN Managed Service HR Controlling Prozess und Leistungen Autor: Hanns- Dirk Brinkmann Version: 1.0 1 Einleitung... 3 2 Phasen im Überblick... 3 3 Leistungen... 4 3.1 Monatliche

Mehr

PV Marktdaten Update Februar 2016

PV Marktdaten Update Februar 2016 Stand 31.03.2016 Alle Angaben ohne Gewähr 1 Vorwort zur Datenerhebung Februar 2016 ➊ Monatliche Veröffentlichung der PV- Meldezahlen Die Bundesnetzagentur veröffentlicht gemäß dem Erneuerbare- Energien-

Mehr

Parameter. Inhalt. Analyse zur Vertriebssteuerung. National. Regionenvergleich. Einzelauswertungen je Region. aus dem biovista Handels-Panel

Parameter. Inhalt. Analyse zur Vertriebssteuerung. National. Regionenvergleich. Einzelauswertungen je Region. aus dem biovista Handels-Panel Analyse zur Vertriebssteuerung aus dem biovista Handels-Panel für die Marke Muster Parameter Regionsart Marke Artikelgruppe Betrachtungszeitraum Vergleichszeitraum Handelsgruppen Ihre Individuellen Vertriebsregionen

Mehr

2. Datenvorverarbeitung

2. Datenvorverarbeitung Kurzreferat Das Ziel beim Clustering ist es möglichst gleich Datensätze zu finden und diese in Gruppen, sogenannte Cluster zu untergliedern. In dieser Dokumentation werden die Methoden k-means und Fuzzy

Mehr

Data Warehousing. DWH Projekte. Ulf Leser Wissensmanagement in der Bioinformatik

Data Warehousing. DWH Projekte. Ulf Leser Wissensmanagement in der Bioinformatik Data Warehousing DWH Projekte Ulf Leser Wissensmanagement in der Bioinformatik Inhalt DWH Projekte Spezifika Die kritischen Punkte Warum scheitern DWH Projekte? Ulf Leser: Data Warehousing, Vorlesung,

Mehr

Data Warehouse. Kapitel 17. Abbildung 17.1: Zusammenspiel zwischen OLTP und OLAP. Man unterscheidet zwei Arten von Datenbankanwendungen:

Data Warehouse. Kapitel 17. Abbildung 17.1: Zusammenspiel zwischen OLTP und OLAP. Man unterscheidet zwei Arten von Datenbankanwendungen: Kapitel 17 Data Warehouse OLTP Online Transaction Processing OLAP Online Analytical Processing Decision Support-Anfragen Data Mining opera- tionale DB opera- tionale DB opera- tionale DB Data Warehouse

Mehr

Energieeffizienz und ihre Umsetzung am Beispiel einer Kraft-Wärme- Kopplungsanlage

Energieeffizienz und ihre Umsetzung am Beispiel einer Kraft-Wärme- Kopplungsanlage Energieeffizienz und ihre Umsetzung am Beispiel einer Kraft-Wärme- Kopplungsanlage 1 Mein Werdegang 1961 geboren in Berlin 1989 Dipl.-Ing. Energie- und Verfahrenstechnik, TU- Berlin, Studentische Hilfskraft

Mehr

Data Warehousing und Data Mining

Data Warehousing und Data Mining Data Warehousing und Data Mining 2 Cognos Report Net (CRN) Ermöglicht Erstellen von Ad-hoc-Anfragen (Query Studio) Berichten (Report Studio) Backend Data Cube Relationale Daten Übung: Cognos Report Net

Mehr

Chi-Quadrat Verfahren

Chi-Quadrat Verfahren Chi-Quadrat Verfahren Chi-Quadrat Verfahren werden bei nominalskalierten Daten verwendet. Die einzige Information, die wir bei Nominalskalenniveau zur Verfügung haben, sind Häufigkeiten. Die Quintessenz

Mehr

Logische Modelle für OLAP. Burkhard Schäfer

Logische Modelle für OLAP. Burkhard Schäfer Logische Modelle für OLAP Burkhard Schäfer Übersicht Einführung in OLAP Multidimensionale Daten: Hypercubes Operationen Formale Grundlagen Zusammenfassung Einführung in OLAP Verfahren zur Analyse großer

Mehr

Kapitel 5: Einfaktorielle Varianzanalyse

Kapitel 5: Einfaktorielle Varianzanalyse Rasch, Friese, Hofmann & Naumann (006). Quantitative Methoden. Band (. Auflage). Heidelberg: Springer. Kapitel 5: Einfaktorielle Varianzanalyse Berechnen der Teststärke a priori bzw. Stichprobenumfangsplanung

Mehr

Portfoliorisiko und Minimum Varianz Hedge

Portfoliorisiko und Minimum Varianz Hedge ortfoliorisiko und Minimum Varianz Hedge Vertiefungsstudium Finanzwirtschaft rof. Dr. Mark Wahrenburg Überblick Messung von Risiko ortfoliodiversifikation Minimum Varianz ortfolios ortfolioanalyse und

Mehr

Kurstage Geprüfte(r) Technischer Fachwirt(-in) IHK

Kurstage Geprüfte(r) Technischer Fachwirt(-in) IHK Kurstage Geprüfte(r) Technischer Fachwirt(-in) IHK 27.11.2015 Freitag HH 26.02.2016 Freitag HH Vertiefungstag 28.11.2015 Samstag HH 27.02.2016 Samstag HH Vertiefungstag 29.11.2015 Sonntag HH Reserve 1)

Mehr

SPÄNGLER IQAM COMMODITY INDEX. Handbuch

SPÄNGLER IQAM COMMODITY INDEX. Handbuch SPÄNGLER IQAM COMMODITY INDEX Handbuch Februar 2014 1. INVESTMENT PHILOSOPHIE DES SPÄNGLER IQAM COMMODITY INDEX Die Investment Philosophie des Index basiert auf wissenschaftlichen Erkenntnissen, aufgrund

Mehr

Die Friseur-Branche. Anzahl der Betriebsstätten ,0% Jahr Jahr 2000

Die Friseur-Branche. Anzahl der Betriebsstätten ,0% Jahr Jahr 2000 Die Friseur-Branche Anzahl der Betriebsstätten + 24,0% 78.522 Jahr 2010 63.317 Jahr 2000 Quelle: Deutscher Handwerkskammertag (DHKT) / Stand 2011 Die Friseur-Branche Zu- und Abgänge der Betriebsstätten

Mehr

Presse-Telefonkonferenz Q1-Ergebnisse 2014 15. Mai 2014

Presse-Telefonkonferenz Q1-Ergebnisse 2014 15. Mai 2014 Presse-Telefonkonferenz Q1-Ergebnisse 2014 15. Mai 2014 Zusammenfassung der Ergebnisse des 1. Quartals Key Highlights Q1 2014 Turbine-Programm sorgte für deutliche Kostensenkungen Kosten pro angebotenen

Mehr

Lineare Modelle in R: Einweg-Varianzanalyse

Lineare Modelle in R: Einweg-Varianzanalyse Lineare Modelle in R: Einweg-Varianzanalyse Achim Zeileis 2009-02-20 1 Datenaufbereitung Wie schon in der Vorlesung wollen wir hier zur Illustration der Einweg-Analyse die logarithmierten Ausgaben der

Mehr

Production Intelligence Big-Data-Analyse und Predictive Maintenance auf Inline-Sensordaten. Business Driven Intelligence

Production Intelligence Big-Data-Analyse und Predictive Maintenance auf Inline-Sensordaten. Business Driven Intelligence Production Intelligence Big-Data-Analyse und Predictive Maintenance auf Inline-Sensordaten Peter Strohm Business Driven Intelligence 8 Fakten zur AG 2002 gegründet in Freiburg 40% durchschnittliche Wachstumsrate

Mehr

Herzlich Willkommen! FO-FORUMEXPERTENRUNDE MOBILE MEDIA. Gehören ipads, Apps & Co. die Zukunft?

Herzlich Willkommen! FO-FORUMEXPERTENRUNDE MOBILE MEDIA. Gehören ipads, Apps & Co. die Zukunft? Herzlich Willkommen! Jürg Konrad Vorsitzender der Geschäftsleitung FO Print & Media AG Roger Sommerhalder Berater Online- & Mobile Kommunikation, netzbarkeit partner of the brandinghouse network Meike

Mehr

Usability Metrics. Related Work. Von Torsten Rauschan (torsten.rauschan@haw-hamburg.de) HAW Hamburg M-Inf2 Anwendungen 2 Betreuer: Prof. Dr.

Usability Metrics. Related Work. Von Torsten Rauschan (torsten.rauschan@haw-hamburg.de) HAW Hamburg M-Inf2 Anwendungen 2 Betreuer: Prof. Dr. Usability Metrics Related Work Von Torsten Rauschan (torsten.rauschan@haw-hamburg.de) HAW Hamburg M-Inf2 Anwendungen 2 Betreuer: Prof. Dr. Zukunft Agenda Rückblick AW1 Motivation Related work QUIM SUM

Mehr

Valuation Policy: Praktische Erfahrungen mit Bewertungsdifferenzen

Valuation Policy: Praktische Erfahrungen mit Bewertungsdifferenzen Valuation Policy: Praktische Erfahrungen mit Dr. Beat Moser, UBS Investment Management UBS Global Wealth Management & Swiss Bank Investment Management GIPS Aperitif der Schweizerischen Bankiervereinigung

Mehr

Übungen zu Logik und Künstliche Intelligenz Blatt 8

Übungen zu Logik und Künstliche Intelligenz Blatt 8 Heilbronn, den 14.5.2010 Prof. Dr. V. Stahl WS 10/11 Übungen zu Logik und Künstliche Intelligenz Blatt 8 Aufgabe 1. Überlegen Sie, wie man folgende Relationen R grafisch darstellen könnte und entscheiden

Mehr

RACE Reporting and Analysis of Communication Efficiency

RACE Reporting and Analysis of Communication Efficiency RACE Reporting and Analysis of Communication Efficiency Niedersächsischen PR Forum Lingen (Ems) / Fachhochschule Osnabrück 17. März 26 Frank Herkenhoff,, M.A. PLEON Kohtes Klewes München Sonnenstrasse

Mehr

Lead User-Projekt. Dr. Theo Schöller-Stiftungslehrstuhl für Technologieund Innovationsmanagement Prof. Dr. Joachim Henkel

Lead User-Projekt. Dr. Theo Schöller-Stiftungslehrstuhl für Technologieund Innovationsmanagement Prof. Dr. Joachim Henkel Technische Universität München Lead User-Projekt Dr. Theo Schöller-Stiftungslehrstuhl für Technologieund Innovationsmanagement Prof. Dr. Joachim Henkel Technische Universität München Übersicht 1 2 3 Lead

Mehr

Joolap- Benutzerhandbuch

Joolap- Benutzerhandbuch Joolap- Benutzerhandbuch Autor Meikel Bisping Kontakt info@mbisping.de www.joolap.de Bearbeitungsstand 12.04.2011 Kurzbeschreibung Diese Dokument informiert anhand praktischer Beispiele über die Arbeit

Mehr

Anforderungen, Erfahrungen und Rolle der Marktforschung im Social Media Monitoring bei der TARGOBANK

Anforderungen, Erfahrungen und Rolle der Marktforschung im Social Media Monitoring bei der TARGOBANK Berufsverband Deutscher Markt- und Sozialforscher e.v. Anforderungen, Erfahrungen und Rolle der Marktforschung im Social Media Monitoring bei der TARGOBANK Frankfurt, 14. November 2011 Agenda 1 Wer sind

Mehr

Die Entwicklung der deutschen Demokratie seit 1989 unter Berücksichtigung der Entwicklung der Europäischen Union

Die Entwicklung der deutschen Demokratie seit 1989 unter Berücksichtigung der Entwicklung der Europäischen Union Die Entwicklung der deutschen Demokratie seit 1989 unter Berücksichtigung der Entwicklung der Europäischen Union Prof. Dr. Gary S. Schaal Helmut-Schmidt-Universität Hamburg Abb. 1:Wie sehr sind Sie grundsätzlich

Mehr

Thomas Behr. 17. November 2011

Thomas Behr. 17. November 2011 in in Fakultät für Mathematik und Informatik Datenbanksysteme für neue Anwendungen FernUniversität in Hagen 17. November 2011 c 2011 FernUniversität in Hagen Outline in 1 2 3 4 5 6 - Was ist das? in über

Mehr

Entwicklung des deutschen PV-Marktes Auswertung und grafische Darstellung der Meldedaten der Bundesnetzagentur nach 16 (2) EEG 2009 Stand 30.9.

Entwicklung des deutschen PV-Marktes Auswertung und grafische Darstellung der Meldedaten der Bundesnetzagentur nach 16 (2) EEG 2009 Stand 30.9. Entwicklung des deutschen PV-Marktes Auswertung und grafische Darstellung der Meldedaten der Bundesnetzagentur nach 16 (2) EEG 2009 Stand 30.9.2013 PV-Meldedaten Jan. Aug. 2013 Bundesverband Solarwirtschaft

Mehr

Dokumenten-Clustering. Norbert Fuhr

Dokumenten-Clustering. Norbert Fuhr Dokumenten-Clustering Norbert Fuhr Dokumenten-Clustering (Dokumenten-)Cluster: Menge von ähnlichen Dokumenten Ausgangspunkt Cluster-Hypothese : die Ähnlichkeit der relevanten Dokumente untereinander und

Mehr

Dimensionale Modellierung mit Oracle BI EE und Oracle OLAP Tipps und Tricks aus der Praxis

Dimensionale Modellierung mit Oracle BI EE und Oracle OLAP Tipps und Tricks aus der Praxis Dimensionale Modellierung mit Oracle BI EE und Oracle OLAP Tipps und Tricks aus der Praxis DOAG Konferenz 2010 Claus Jordan Senior Consultant, Trivadis GmbH 16.11.2010 Basel Bern Lausanne Zürich Düsseldorf

Mehr

FOCUS Werbebilanz Februar 2016

FOCUS Werbebilanz Februar 2016 FOCUS Werbebilanz Februar 2016 FASTER BETTER EFFICIENT FOCUS 2016 1 Werbebilanz 2/2016 FASTER BETTER EFFICIENT FOCUS 2016 2 Werbeentwicklung Februar 2016 % Veränderung zum Vorjahresmonat 12 10,6 10 9,4

Mehr

Kapitel 2: Mathematik- und Informatik-Grundlagen

Kapitel 2: Mathematik- und Informatik-Grundlagen Kapite 2: Mathematik- und Informatik-Grundagen einer Menge gibt an, wie zufäig die Daten in einer Menge verteit sind (bzw. wie zufäig die Ausprägung eines Attributs in einer Menge von Objekten ist), auch

Mehr

Model Klausel - Der Excel-Killer von Oracle?

Model Klausel - Der Excel-Killer von Oracle? Model Klausel - Der Excel-Killer von Oracle? Andrea Kennel Trivadis AG Glattbrugg, Schweiz Schlüsselworte: Model Klausel, SQL, Data Warehousing, OLAP Zusammenfassung Ein Data Mart kann als ein Würfel mit

Mehr

Aufgabe 1: [Logische Modellierung]

Aufgabe 1: [Logische Modellierung] Aufgabe 1: [Logische Modellierung] a) Entwerfen Sie für das von Ihnen entworfene Modell aus Aufgabe 2 des 1. Übungsblattes ein Star-Schema. b) Entwerfen Sie für das vorangegangene Modell einen Teil eines

Mehr

Betriebliches Gesundheitsmanagement. Soziales Gesundheit Bildung Kultur Umwelt Heimatpflege

Betriebliches Gesundheitsmanagement. Soziales Gesundheit Bildung Kultur Umwelt Heimatpflege Betriebliches Gesundheitsmanagement Soziales Gesundheit Bildung Kultur Umwelt Heimatpflege Seite 1 05.06.2014 Referat 14 Betriebliches Gesundheitsmanagement beim Bezirk Oberbayern Konzeption der Vorgehensweise,

Mehr

Was die Fachhändler bewegt: Schlagworte der Händler zur Umsatzmeldung UMSATZENTWICKLUNG-MAI: +3,8% UMSATZENTWICKLUNG-KUMULIERT: +1,3%

Was die Fachhändler bewegt: Schlagworte der Händler zur Umsatzmeldung UMSATZENTWICKLUNG-MAI: +3,8% UMSATZENTWICKLUNG-KUMULIERT: +1,3% Was die Fachhändler bewegt: Schlagworte der Händler zur Umsatzmeldung UMSATZENTWICKLUNG-MAI: +3,8% UMSATZENTWICKLUNG-KUMULIERT: +1,3% Regionale Umsatzentwicklung in % gegenüber dem Vorjahresmonat und relevante

Mehr

Auswirkungen der Finanzkrise auf die Pensionskassen

Auswirkungen der Finanzkrise auf die Pensionskassen Auswirkungen der Finanzkrise auf die Pensionskassen Mai 2009 Benjamin Brandenberger Inhalt Ausgewählte Wirkungszusammenhänge der Vorsorgefinanzierung Spuren der Finanzkrise in ausgewählten Anlagekategorien

Mehr

SEMINARTERMINE 2016 2017

SEMINARTERMINE 2016 2017 Grundlagenseminar Ort LG Nr. Dauer Nürnberg PM GL 16 01 22. Feb 16 Mo 25. Feb 16 Do München PM GL 16 02 11. Apr 16 Mo 14. Apr 16 Do Nürnberg PM GL 16 03 06. Jun 16 Mo 09. Jun 16 Do Berlin PM GL 16 04 05.

Mehr

Terminplan der Leistungsnachweise im 1. und 2. Halbjahr 2012/13

Terminplan der Leistungsnachweise im 1. und 2. Halbjahr 2012/13 KW Datum Jahrgang 11 Jahrgang Q3A Jahrgang Q3B 33 Mo 13.Aug 12 Di 14.Aug 12 Mi 15.Aug 12 Do 16.Aug 12 Fr 17.Aug 12 34 Mo 20.Aug 12 Di 21.Aug 12 Mi 22.Aug 12 Do 23.Aug 12 Fr 24.Aug 12 35 Mo 27.Aug 12 Di

Mehr

Inhalte der Zellen A1 bis A3 addieren

Inhalte der Zellen A1 bis A3 addieren Grundrechenarten 10 und 5 addieren =10+5 3 von 10 subtrahieren =10-3 11 mit 2 multiplizieren =11*2 12 durch 4 dividieren =12/4 Excelspezifische Grundrechenarten Inhalte der Zellen A1 bis A3 addieren =SUMME(A1:A3)

Mehr

Fortgeschrittene OLAP Analysemodelle

Fortgeschrittene OLAP Analysemodelle Fortgeschrittene OLAP Analysemodelle Jens Kübler Imperfektion und erweiterte Konzepte im Data Warehousing 2 Grundlagen - Datenanalyse Systemmodell Datenmodell Eingaben System Schätzer Datentypen Datenoperationen

Mehr

Herzlich Willkommen beim Seminar Powertrading mit den Elliott-Wellen

Herzlich Willkommen beim Seminar Powertrading mit den Elliott-Wellen Herzlich Willkommen beim Seminar Powertrading mit den Elliott-Wellen Ralph Nelson Elliott 7 -. August "The Wave Principle". Impuls Korrektur numerische Phase b a c alphabetische Phase b a c Die richtige

Mehr

Data Warehouse. Kapitel 16. Abbildung 16.1: Zusammenspiel zwischen OLTP und OLAP. Man unterscheidet zwei Arten von Datenbankanwendungen:

Data Warehouse. Kapitel 16. Abbildung 16.1: Zusammenspiel zwischen OLTP und OLAP. Man unterscheidet zwei Arten von Datenbankanwendungen: Kapitel 16 Data Warehouse OLTP Online Transaction Processing OLAP Online Analytical Processing Decision Support-Anfragen Data Mining operationale DB operationale DB operationale DB Data Warehouse operationale

Mehr