Kapitel 10: Exploration des Data Cubes
|
|
- Björn Kappel
- vor 7 Jahren
- Abrufe
Transkript
1 Kapitel 10: Exploration des Data Cubes Data Warehousing und Mining: Exploration des Data Cubes 1 WEin möglicher Ansatz zur Beschreibung einer Tabelle, anhand eines Beispiels Relation R(Part, City, Year, Month, Cost, Sale), Dimensionen Attribute Schema der Tabelle: Sales=<{Category, Time}, {Part, City, Year, Month, Cost, Sale}, par> mit par(category)={part, City} und par(time)={year, Month} Im Gegensatz zur Verwendung des Begriffs Dimension vorher werden jetzt mehrere Attribute zu einer Dimension (mit neuem Namen) zusammengefaßt. par identifiziert die Bestandteile der Dimensionen. SALES TIME Year Month Jan Feb Jan Feb CATEGORY Part City (Cost, Sale) PC Montreal (5,6) (5,7) (4,6) (4,8) Toronto (5,7) (5,8) (4,8) (4,9) Inkjet Montreal (7,8) (7,9) (6,9) (6,8) New York (6,9) (6,9) (5,8) (5,9) Data Warehousing und Mining: Exploration des Data Cubes 2 W Beispiel 2: Gleiche Relation, andere Tabelle Schema der Tabelle: Sales=<{Location, Component}, {Part, City, Year, Month, Cost, Sale}, par> mit par(location)={city} und par(component)={part} Dimensionen, Attribute, par identifiziert die Bestandteile der Dimensionen. W Data Cube - Repräsentation aggregierter Werte Marke Opel Audi SALES COMPONENT Part PC Inkjet LOCA- TION City (Year,Month, Cost,Sale) Montreal (1996, Jan, 5, 6) (1996, Jan, 5, 6) Montreal (1996, Jan, 5, 7) (1996, Jan, 5, 7) Montreal (1997, Jan, 4, 6) (1997, Jan, 4, 6) Montreal (1997, Feb, 4, 8) (1997, Feb, 4, 8) Toronto (1997, Jan, 5,7) / Toronto (1996, Feb, 5, 8) / BMW Hessen Bayern Saarland Bundesland Datum Bundesland Anzahl Hessen 131 Bayern 240 Saarland 141 GroupBy-Operator berechnet Punkte in einer Hyperebene. Data Warehousing und Mining: Exploration des Data Cubes 3 Data Warehousing und Mining: Exploration des Data Cubes 4
2 W Data Cube - Repräsentation aggregierter Werte (2) W Consolidation Paths Marke Saarland Bayern Hessen Bundesland Opel Audi BMW Datum Marke Bundesland Anzahl BMW Hessen 28 BMW Bayern 37 BMW Saarland 41 Opel Hessen 48 Opel Bayern 62 Opel Saarland 100 Audi Hessen 55 Audi Bayern 141 Wofür steht Zahl im Ursprung? Marke Datum Bundesland Anzahl BMW Hessen 28 BMW Bayern 37 BMW Saarland 41 Opel Hessen 48 Opel Bayern 62 Opel Saarland 5 Opel Saarland 95 Audi Hessen 55 Audi Bayern 52 Audi Bayern 27 Audi Bayern 62 Marke Bundesland Anzahl BMW Hessen 28 BMW Bayern 37 BMW Saarland 41 Opel Hessen 48 Opel Bayern 62 Opel Saarland 100 Audi Hessen 55 Audi Bayern 141 BM B Bundesland Anzahl Hessen 131 Bayern 240 Saarland 141 BDM BD D none DM M Data Warehousing und Mining: Exploration des Data Cubes 5 Data Warehousing und Mining: Exploration des Data Cubes 6 W Consolidation Paths (2) W Consolidation Paths (3) Marke Datum Bundesland Anzahl BMW Hessen 28 BMW Bayern 37 BMW Saarland 41 Opel Hessen 48 Opel Bayern 62 Opel Saarland 5 Opel Saarland 95 Audi Hessen 55 Audi Bayern 52 Audi Bayern 27 Audi Bayern 62 Marke Bundesland Anzahl BMW Hessen 28 BMW Bayern 37 BMW Saarland 41 Opel Hessen 48 Opel Bayern 62 Opel Saarland 100 Audi Hessen 55 Audi Bayern 141 BM B Bundesland Anzahl Hessen 131 Bayern 240 Saarland 141 BDM BD D none DM M Roll-up (Drill-up) Drill-down Konsolidierung ist nicht nur möglich, indem man Dimensionen ausblendet, sondern auch durch das Zusammenfassen von Werten. Woche Tag keine Monat Jahr Konzepthierarchie Data Warehousing und Mining: Exploration des Data Cubes 7 Data Warehousing und Mining: Exploration des Data Cubes 8
3 W Consolidation Marke W Consolidation Paths (4) BDM - Bundesland - Datum - Marke Opel T BDM Audi W Mo J BM B BD D DM M BMW none BDM none Hessen Bayern Datum BMW BMMo DM BD Saarland Bundesland BM BW MW BMJ MMo BMo D... Anzahl Ebenen? Data Warehousing und Mining: Exploration des Data Cubes 9 Data Warehousing und Mining: Exploration des Data Cubes 10 W Consolidation Paths (5) Vorangegangene Folie verdeutlicht zweierlei: Kombinierbarkeit, sehr viele Kombinationsmöglichkeiten. Was bedeutet Drill-Down im Kontext dieses Interfaces? Data Warehousing und Mining: Exploration des Data Cubes 11 Data Warehousing und Mining: Exploration des Data Cubes 12
4 Motivation Motivation Navigieren im Data Cube ist nur auf den ersten Blick leicht. Bei vielen Dimensionen ist die Suche nach hilfreicher Information mühsam. Anwender hat natürlich meist nicht exakte Hypothese. Exploration des Data Cubes: Finden von, Herausfinden, warum sich ergeben. Operatoren wie Drilldown sind zwar nützlich, Benutzer muß aber interessante Zusammenhänge von Hand entdecken. Ziel im folgenden: Benutzer durch den Cube führen, Navigationsmöglichkeiten anzeigen, die zu interessanten Zusammenhängen führen. Beispiel: Region all Product Jan Feb Mar Apr Mai Jun Jul Aug Sep Okt Nov Dez Beer 10% -7% 3% -4% 15% -12% -3% 1% 42% -14% -10% -1% 2% 3% 4% 9% 4% 1% -11% -8% -2% 7% Diet-S 2% -1% 0% 0% 4% 2% 4% -9% 5% -3% 0% Data Warehousing und Mining: Exploration des Data Cubes 13 Data Warehousing und Mining: Exploration des Data Cubes 14 Wann ist Zusammenhang interessant? Beispiel: Mobiltelefone im Monat Dezember im Media Markt Eschborn Umsatzplus 50%. Kein int santer Zusammenhang, da auch für andere Waren und Standorte Umsatz im Dezember hochgeht ( Weihnachtsgeschäft ). Int santer Zusammenhang ist also auf anderer Ebene, nämlich Monat Dezember, aber Abstraktion von restlichen Dimensionen. der Beispiel x Irchel Brot x Milch Tee x Produkt x x x Datum Punkt ist Zusammenfassung oder Abstraktion eines anderen Punkts. Tatsächlicher Wert vs. erwarteter Wert. Central Wipkingen x Filiale x Elementar- Position Data Warehousing und Mining: Exploration des Data Cubes 15 Data Warehousing und Mining: Exploration des Data Cubes 16
5 Subcube von bestimmter Position (1) 300 Umsatz Subcube von bestimmter Position (2) 300 Umsatz Datum Datum MA-Anzahl Bei mehr Dimensionen hat Subcube höhere Dimensionalität MA-Anzahl Bei mehr Dimensionen hat Subcube höhere Dimensionalität. Data Warehousing und Mining: Exploration des Data Cubes 17 Data Warehousing und Mining: Exploration des Data Cubes 18 Drill-Down an bestimmter Position Umsatz Datum MA-Anzahl Bei mehr Dimensionen mehr mögliche Drill-Downs. Realisierter Ansatz Für jede Zelle eines erwarteten Werts ŷ über mehrere Dimensionen. Abweichung des tatsächlichen Wertes y vom erwarteten Wert ŷ bestimmt den "Überraschungswert" der Zelle. von drei Überraschungswerten (Indikatoren) je Zelle: SelfExp, InExp, je Dimension: PathExp. Region all Product Jan Feb Mar Apr Mai Jun Jul Aug Sep Okt Nov Dez Beer 10% -7% 3% -4% 15% -12% -3% 1% 42% -14% -10% -1% 2% 3% 4% 9% 4% 1% -11% -8% -2% 7% Diet-S 2% -1% 0% 0% 4% 2% 4% -9% 5% -3% 0% Data Warehousing und Mining: Exploration des Data Cubes 19 Data Warehousing und Mining: Exploration des Data Cubes 20
6 Beispiel (1) Beispiel (2) Product all Region all Jan Feb Mar Apr May Jun Jul Aug Sep Oct Nov Dec Total 2% 0% 2% 2% 4% 3% 0% -8% 0% -3% 4% Product all Region all Jan Feb Mar Apr May Jun Jul Aug Sep Oct Nov Dec Total 2% 0% 2% 2% 4% 3% 0% -8% 0% -3% 4% SelfExp - "Überraschungswert" als Ergebnis eines Vergleichs mit den anderen Zellen auf gleicher Aggregationsstufe, InExp - max(selfexp) für die durch Drill-Down erreichbaren Zellen (oben dargestellt), PathExp - max(selfexp) aller erreichbarer Zellen entlang eines ausgewählten Pfades. Im Beispiel: Überraschung größer bei Drill-Down entlang Product, verglichen mit Drill-Down entlang Region. PR P PRT PT R none RT T P Product, R Region, T Time. Welcher Position im Cuboid entspricht die Tabelle oben? Data Warehousing und Mining: Exploration des Data Cubes 21 Data Warehousing und Mining: Exploration des Data Cubes 22 Beispiel (3) der (1) Product all Region all Jan Feb Mar Apr May Jun Jul Aug Sep Oct Nov Dec Total 2% 0% 2% 2% 4% 3% 0% -8% 0% -3% 4% Region all Product Jan Feb Mar Apr Mai Jun Jul Aug Sep Okt Nov Dez Beer 10% -7% 3% -4% 15% -12% -3% 1% 42% -14% -10% -1% 2% 3% 4% 9% 4% 1% -11% -8% -2% 7% Diet-S 2% -1% 0% 0% 4% 2% 4% -9% 5% -3% 0% Abweichung des tatsächlichen vom erwarteten Wert muß größer als ein Schwellenwert sein (nach Normalisierung): y i1,...,i n tatsächlicher Wert der Zelle i 1...i n, ŷ i1,...,i n erwarteter Wert dieser Zelle, σ Skalierungsfaktor, θ Schwellenwert, Ausnahme liegt vor, falls y - ŷ / σ > θ. Product Diet-S Region Jan Feb Mar Apr Mai Jun Jul Aug Sep Okt Nov Dez C 0% -2% 0% 1% 4% 1% 5% -6% 2% -2% -2% E 0% 2% -8% 7% 0% 5% -40% 10% -33% 2% 8% z Data Warehousing und Mining: Exploration des Data Cubes 23 Data Warehousing und Mining: Exploration des Data Cubes 24
7 der (2) der (3) total Beispiel: (, ) = total Anteil Kunden an Bevölkerung Anteil Kunden an trinkender Bevölkerung + ( total) + ( total) Anteil Kunden in Beispiel 2: (, ) total = total total total Anteil Kunden an Bevölkerung Anteil Kunden an trinkender Bevölkerung Anteil Kunden in Data Warehousing und Mining: Exploration des Data Cubes 25 Data Warehousing und Mining: Exploration des Data Cubes 26 der (4) Beispiel: (, ) = total + ( total) + ( total) Koeffizienten stehen für den Beitrag jeder Zelle zu den erwarteten Werten der Zellen darunter, produkt produkt z. B. oder γ ŷ=f Aggregation (γ i ) γ _ ort _ Beispiel (wie oben): (, ) = γ 1 + γ 2 + γ 3 (, ) = total + ( - total) + ( - total) total der (5) ŷ=f Aggregation (γ i ) Festlegen von f: additiv f(γ1,γ2) = γ1 + γ2, multiplikativ f(γ1, γ2) = γ1 γ2 Bestimmen der γ i aus dem Ausgangsdatenbestand: Mittelwert bzw. trimmed-mean (Verallgemeinerung von trunc_avg). Data Warehousing und Mining: Exploration des Data Cubes 27 Data Warehousing und Mining: Exploration des Data Cubes 28
8 Beispiel Implementierung Filialen Produkte γ = + ( ) + ( ) = ,1 = Filialen All Produkte SelfExp InExp All SelfExp InExp außerdem Normalisierung 1. der Aggregate und Mittelwerte: Für alle GroupBys wird Aggregation und Mittelwert berechnet der Beiträge γ i zu f, von f und SelfExp γ3 = Mittelwert(3) γ21 = Mittelwert(2) - Mittelwert(3), analog γ22, γ23 γ11 = Mittelwert(1) - γ21 γ22 γ3, analog γ12, γ13 3. von InExp und PathExp. Data Warehousing und Mining: Exploration des Data Cubes 29 Data Warehousing und Mining: Exploration des Data Cubes 30 Zusammenfassung bis hierhin Viele Möglichkeiten, mit dem Data Cube zu interagieren. Abweichung des tatsächlichen vom erwarteten Wert ist interessant. Methode für effektives Navigieren in großen Datacubes wurde vorgestellt. "Führen" des Benutzers zu interessanten Datenregionen mittels vorberechneter Indikatoren. Fundament: zum Identifizieren der Abweichungen, Entwicklung eines Algorithmus zur der verschiedenen Indikatoren. Von quantitativer zu qualitativer Datenanalyse Die bis jetzt besprochene Methode identifiziert Ausnahme-Zellen. Hilfreich wäre Unterstützung bei der Suche nach Erklärungen für. Mit herkömmlichen Mechanismen macht der Benutzer von der Ausnahme-Zelle aus Drill-Downs, um Erklärungen zu finden. Data Warehousing und Mining: Exploration des Data Cubes 31 Data Warehousing und Mining: Exploration des Data Cubes 32
9 Illustration Relevanter Ausschnitt des Raums (1) Opel Audi BMW Hessen Marke Datum Geography Sum of Revenue Time Prod_Category Cross Ind. Apps Home software Other Apps Vertical Apps Platform Product Bayern Saarland Time Bundesland Begrifflichkeit für das Folgende: Elementarposition. Prod_Category Data Warehousing und Mining: Exploration des Data Cubes 33 Data Warehousing und Mining: Exploration des Data Cubes 34 Relevanter Ausschnitt des Raums (2) Motivation für den DIFF Operator Sum of Revenue Time Prod_Category Cross Ind. Apps Home software Other Apps Vertical Apps Der angezeigte Ausschnitt des Data Cubes steht für konkreten Wert entlang mancher Dimensionen, für andere Dimensionen ist der Wert (ALL). Wir betrachten im folgenden die Subcubes über die Dimensionen, entlang denen Drill-Down noch möglich ist. C a Subcube mit erster Zelle, C b dto. zweite Zelle. C a und C b haben gleiche Struktur. Geography Sum of Revenue Time Prod_Category Cross Ind. Apps Home software Other Apps Vertical Apps Prod_Category Platform Product Zelle 1 Zelle 2 Time Erklärung für die Differenz von über 5000? Data Warehousing und Mining: Exploration des Data Cubes 35 Data Warehousing und Mining: Exploration des Data Cubes 36
10 Illustration Zellpaar Detail-N Ansatz (1) Platform Platform Product Product Geography Geography Subcube für 1992 Subcube für 1993 Data Warehousing und Mining: Exploration des Data Cubes 37 Mögliches Ergebnis des DIFF-Operators: N Zellpaare mit maximalem Detaillierungsgrad. Sie sollen am Aggregat beteiligt sein und möglichst großen Teil der Differenz ausmachen. Detail-N Antwort erklärt im Beispiel eine Differenz von knapp Product Geography Platform Year_92 Year_93 Ratio Other Vert. ApWestern Europe Multiuser Minicomputer 5,2 99,9 19,2 Other Vert. ApAsia/Pacific Singleuser MacOS 3,7 92,5 25 Other Vert. ApRest of World Multiuser Mainframe 2,8 88,1 31,4 Other Vert. ApWestern Europe Singleuser UNIX 7,3 96,3 13,1 Other Vert. ApUnited States Multiuser Minicomputer 2,9 97,2 33,5 Other Vert. ApRest of World Multiuser Minicomputer 12 99,5 8,29 Other Vert. ApAsia/Pacific Multiuser UNIX 1,7 99,6 41,3 EDA Western Europe Multiuser Mainframe 192,6 277,8 1,44 ManufacturingUnited States Multiuser Minicomputer 6,3 88,4 13,9 Health Care United States Multiuser Mainframe 2,4 88,2 30,5 236,9 1127,5 - Zahlen stimmen nicht, nur Illustration - Data Warehousing und Mining: Exploration des Data Cubes 38 Detail-N Ansatz (2) Detail-N Ansatz (3) Verbesserung: Nicht nur auf der detailliertesten Ebene arbeiten, sondern auf der aussagekräftigsten. D. h. Zeilen zusammenfassen, die unterschiedlichen Zellen entsprechen. Zugrundeliegende Annahme: Benutzer will nur bestimmte Anzahl von Zeilen sehen, z. B. eine Bildschirmseite voll. Platform Platform Product Product Geography Geography Subcube für 1992 Subcube für 1993 Data Warehousing und Mining: Exploration des Data Cubes 39 Data Warehousing und Mining: Exploration des Data Cubes 40
11 Ergebnis des DIFF Operators (1) Bessere Antwort erklärt eine Differenz von über Product Geography Platform Year_92 Year_93 Ratio Abw. (All)- (All)- (All) Manufacturing - Pro(All) (All) Other V. A. (All)- (All) Other V. A. United States (All) Other V. A. Western Europe(All) Manufacturing - Dis(All) (All) Health Care (All)- (All) Health Care United States Multiuser Banking/Finance United States (All) Mechanical CAD United States (All) Ergebnis des DIFF-Operators (2) Product Geography Platform Year_92 Year_93 Ratio Abw. (All)- (All)- (All) Manufacturing - Pro(All) (All) Other V. A. (All)- (All) Other V. A. United States (All) Other V. A. Western Europe(All) Manufacturing - Dis(All) (All) Health Care (All)- (All) Health Care United States Multiuser Banking/Finance United States (All) Mechanical CAD United States (All) Erläuterungen: Abkürzung für diese Tabelle: A Jede Zeile entspricht einer Position im Raum. Erste Zeile entspricht den markierten Zellen abzüglich der Werte, die explizit aufgelistet sind. Minuszeichen hinter (ALL) bedeutet, daß es sich nicht um Summe aller Werte handelt, sondern daß Zeile folgt, die für speziellere Zelle steht. Data Warehousing und Mining: Exploration des Data Cubes 41 Data Warehousing und Mining: Exploration des Data Cubes 42 Wie kommt man auf die Ratios? (1) Wie kommt man auf die Ratios? (2) Rot unterlegte Zellen klar. Sonstige Zellen nicht ganz so offensichtlich. Angenommen, A beschreibt Unterschied zwischen 1992 und A hat zwei Zeilen: Filialen A 2,5 B C Produkte 0,5 Tabelle für 1992: A B C Tabelle für 1993: A??? B??? C??? Ratio einer Zelle ergibt sich aus Ratio der unmittelbarsten Vorgängerzelle und den bekannten Ratios von Nachbarzellen. Data Warehousing und Mining: Exploration des Data Cubes 43 Data Warehousing und Mining: Exploration des Data Cubes 44
12 Wie kommt man auf die Ratios? (3) Ergebnis des DIFF-Operators (3) Es handelt sich um eine Möglichkeit, die Ratios zu interpretieren. Andere Interpretationen sind denkbar (z. B. auch teilweise Berücksichtigung der Nachbarzellen). Führt aber zu zusätzlichen Parametern, kompliziert. Product Geography Platform Year_92 Year_93 Ratio Abw. (All)- (All)- (All) Manufacturing - Pro(All) (All) Other V. A. (All)- (All) Other V. A. United States (All) Other V. A. Western Europe(All) Manufacturing - Dis(All) (All) Health Care (All)- (All) Health Care United States Multiuser Banking/Finance United States (All) Mechanical CAD United States (All) Error ( Abw. ) Erläuterung: Reflektiert, inwieweit der Verhältnis-Wert ( Ratio ) auch für die Kinder gilt, die nicht explizit aufgeführt sind. Großer Error: Im Mittel starke Abweichung der einzelnen Kinder. Formel hier: Wurzel der Summen der Abweichung jeder Detail-Zeile zum Quadrat, d. h. L2-Norm. Data Warehousing und Mining: Exploration des Data Cubes 45 Data Warehousing und Mining: Exploration des Data Cubes 46 Beispiel für großen und kleinen Error Tradeoff Großer Error: Product Geography Platform Year_92 Year_93 Health Care United States (All) Health Care United States Multiuser Health Care United States Single-User Health Care United States Palm Health Care United States Xbox Kleiner Error: Product Geography Platform Year_92 Year_93 Health Care United States (All) Health Care United States Multiuser Health Care United States Single-User Health Care United States Palm Welche Zeilen? DIFF-Ergebnis mit wenigen Zeilen, die Großteil der Differenz erklären, hat i. a. recht großen Fehler ( zu allgemeine Aussagen ). DIFF-Ergebnis mit kleinem Fehler ist i. a. zu ausführlich ( zu detaillierte Aussagen ), bzw. reicht vorgegebene Zeilenanzahl nicht aus. Ziel daher: Zusammenfassen von Zeilen, die ähnliches Verhältnis haben. Bei großem Unterschied explizit aufführen. Motiviert informationstheoretische Behandlung des Sachverhalts. Data Warehousing und Mining: Exploration des Data Cubes 47 Data Warehousing und Mining: Exploration des Data Cubes 48
13 (1) (2) Angenommen, wir wollen jemandem, der C a kennt, mitteilen, wie sich C b von C a unterscheidet. Möglich, C b zu schicken. Aber aufwendig. Stattdessen ungefähre, aber möglichst gute Zusammenfassung der Differenz. Tabelle A Filialen A 2,5 B C Produkte 0,5 Anzahl der Zeilen der Tabelle zunächst von außen vorgegeben. A so wählen, daß Fehler minimal. Tabelle für 1992 C a : A B C Tabelle für 1993 C b : A 25 2,5 2,5 B 2,5 2,5 2,5 C 2,5 2,5 2,5 Data Warehousing und Mining: Exploration des Data Cubes 49 Data Warehousing und Mining: Exploration des Data Cubes 50 Fehler Illustration (3) Tabelle für 1992 C a : A B C A Filialen A 2,5 B C Produkte 0,5 Fehler = Anzahl der Bits, die für Übermittlung des Fehlers erforderlich wären, wenn man A statt C b überträgt. Vorhersage für C b : A 2,5 0,25 0,25 B 0,25 0,25 0,25 C 0,25 0,25 0,25 Tabelle für 1993 C b : A 2,5 0,1 0,25 B 0,25 0,3 0,2 C 0,25 0,4 0,25 Data Warehousing und Mining: Exploration des Data Cubes 51 Data Warehousing und Mining: Exploration des Data Cubes 52
14 Fehlerwahrscheinlichkeit (4) Angenommen, tatsächliche Werte normalverteilt um Vorhersagewert. WS(Differenz zwischen tatsächlichem und Vorhersagewert 0) = 1 WS(Differenz zwischen tatsächlichem und Vorhersagewert δ) = c δ Anzahl der Bits für Fehlerübermittlung mit Hilfe dieser Wahrscheinlichkeit berechenbar. dieser Anzahl der Bits gemäß Theorem (s. b. folgende Folie). Data Warehousing und Mining: Exploration des Data Cubes 53 Data Warehousing und Mining: Exploration des Data Cubes 54 Wie groß ist der Fehler? Aussage zu Codierungsaufwand Informationstheoretisches Theorem (Shannon). Sei x eine Aussage. Sei M ein. Wieviele Bits reichen, um x in M zu codieren? Gemäß Theorem sind es -log Pr[x M] Bits. (Pr [x M] WS, daß x eintritt, gegeben M.) Filialen A 2,5 B C Produkte 0,5 M x Zur der WS vergleichen wir tatsächlichen Wert in C b mit erwartetem Wert gemäß C a und A für jede Elementar-Position. Ausgehend von WS-Verteilung (z. B. Normalvert.) um erwarteten Wert; cost(v)=-logpr[tatsächlicher Wert erwarteter Wert] Codierungsaufwand, d. h. Abweichung von A = Summe der Kosten für jede Elementar-Position. Tabelle für 1992 C a : A B C Tabelle für 1993 C b : A 2,5 0,1 0,25 B 0,25 0,3 0,2 C 0,25 0,4 0,25 Data Warehousing und Mining: Exploration des Data Cubes 55 Data Warehousing und Mining: Exploration des Data Cubes 56
15 der Anzahl Bits forall (v ist Detail-Zeile von C b ) if (v ist Bestandteil von A) WS = 1; cost(v)=0; else finde unmittelbarsten Vorgänger p in A; r = Ratio von p; erwarteter Wert v b von v in C b ist r v a ; ausgehend von WS-Verteilung um r v a ; cost(v)=-logpr[v b r v a ] // Normalverteilung meist OK inkrementiere Gesamtanzahl Bits um cost(v) (5) Anzahl der Zeilen N war bis jetzt gegeben, kann aber miteinbezogen werden, indem wir Kosten des Transfers von A explizit machen. Kosten einer Zeile: Σ(log(n i +1))+log c n i Kardinalität der Dimension i von C a. Summand 1 berücksichtigt, daß auch (ALL) möglich ist. c Verhältnis selbst muß auch kodiert werden. Product Geography Platform Year_92 Year_93 Ratio Abw. (All)- (All)- (All) Manufacturing - Pro(All) (All) Other V. A. (All)- (All) Other V. A. United States (All) Other V. A. Western Europe(All) Manufacturing - Dis(All) (All) Health Care (All)- (All) Health Care United States Multiuser Banking/Finance United States (All) Mechanical CAD United States (All) Data Warehousing und Mining: Exploration des Data Cubes 57 Data Warehousing und Mining: Exploration des Data Cubes 58 (1) (2) Jetzt müßte noch besprochen werden: Schneller Algorithmus, der das A bestimmt, Umgang mit fehlenden Werten. Ansatz nicht darauf beschränkt, daß Zellen sich nur in einer Dimension unterscheiden. Es muß aber gemeinsame Subcubes geben. Kapitel hat behandelt: Motivation für das Sichtbarmachen von, unterschiedliche Überraschungswerte, unterschiedliche Definitionen auf der technischen Ebene, Motivation für das Zusammenfassen von Unterschieden zwischen Subcubes, Vorgehen, um zu aussagekräftiger, aber prägnanter Zusammenfassung zu kommen. Insgesamt: Sinnvolle Maßnahmen zur Unterstützung der Exploration des Cubes; generisches Interface bietet zuviele Interaktionsmöglichkeiten. Data Warehousing und Mining: Exploration des Data Cubes 59 Data Warehousing und Mining: Exploration des Data Cubes 60
16 Literatur Sunita Sarawagi, Rakesh Agrawal, Nimrod Megiddo, Discovery-driven Exploration of OLAP Data Cubes, Proc. of the Sixth Int'l Conference on Extending Database Technology (EDBT), Valencia, Spain, March Sunita Sarawagi, Explaining Differences in Multidimensional Aggregates, Proc. of the 25 th Int l Conference on Very Large Databases, Prüfungsfragen, beispielhaft Was bedeutet 'erwarteter Wert' im multidimensionalen? Wie kann man ihn berechnen? Was bedeutet 'Ausnahme' gemäß der Vorlesung im multidimensionalen? Wie kann man zur Verbesserung der Visualisierung des Data Cubes verwenden? Erklären Sie den DIFF-Operator (Motivation, Umsetzung). Data Warehousing und Mining: Exploration des Data Cubes 61 Data Warehousing und Mining: Exploration des Data Cubes 62
Kapitel 5: Vom relationalen zum multidimensionalen Datenmodell
Data Warehousing, Gliederung Kapitel 5: Vom relationalen zum multidimensionalen Datenmodell Dimensionen und Measures Schematypen für Data Warehousing Groupy und Data Cubes Operatoren für den Data Cube
MehrData Cube. Aggregation in SQL. Beispiel: Autoverkäufe. On-line Analytical Processing (OLAP) 1. Einführung. 2. Aggregation in SQL, GROUP BY
Data Cube On-line Analytical Processing (OLAP). Einführung Ziel: Auffinden interessanter Muster in großen Datenmengen 2. Aggregation in SQL, GROUP BY 3. Probleme mit GROUP BY 4. Der Cube-Operator! Formulierung
MehrVertrautmachen mit Daten
Kapitel III Vertrautmachen mit Daten 2004 AIFB / FZI 1 III Vertrautmachen mit Daten (see also Data Preparation ) 2004 AIFB / FZI 2 III Vertrautmachen mit Daten III.1 OLAP III.1.1 Einführung in OLAP Wie
MehrWärmepumpe Stromverbrauch Wärmepumpe. Jahresüberblick Kosten pro Monat [ ] Monatsdurchschnittstemperatur [ C]
Wärmepumpe 27 Jahresüberblick 27 25 3, 2 15 157 138 133 149 191 25, 2, 15, 1 92 9 1, 5 58 39 31 34 3 24 5,, Jan Feb Mar Apr Mai Jun Jul Aug Sep Okt Nov Dez Ø -5, Kosten pro Monat [ ] Monatsdurchschnittstemperatur
MehrCHECK24-Autokreditatlas. Analyse der Autokredit-Anfragen aller CHECK24-Kunden aus 2011 & 2012
CHECK24-Autokreditatlas Analyse der Autokredit-Anfragen aller CHECK24-Kunden aus 2011 & 2012 Stand: März 2013 CHECK24 2013 Agenda 1. Methodik 2. Zusammenfassung 3. Autokredite 2011 vs. 2012 4. Kredit,
Mehr6.6 Vorlesung: Von OLAP zu Mining
6.6 Vorlesung: Von OLAP zu Mining Definition des Begriffs Data Mining. Wichtige Data Mining-Problemstellungen, Zusammenhang zu Data Warehousing,. OHO - 1 Definition Data Mining Menge von Techniken zum
MehrKap. 6 Data Warehouse
1 Kap. 6 Data Warehouse 6.1 Was ist ein Data Warehouse, Motivation? 6.2 Data Cube und Cube-Operationen 6.3 Workshop: MS SQL Server, Cube Operationen 6.4 Physischer Entwurf, Implementierung von Cubes 6.5
MehrHard- und Software Entwicklung von Videogames zur Entertainment-Plattform
Hard- und Software Entwicklung von Videogames zur Entertainment-Plattform Manfred Gerdes Senior Vice President Sony Computer Entertainment Europe Biografie Manfred Gerdes kam am 1. Januar 1996 als Verkaufsdirektor
MehrMonat Datum Veranstaltung Veranstalter Mietkosten Bestätigung Vertrag Bezahlt
Monat Datum Veranstaltung Veranstalter Mietkosten Bestätigung Vertrag Bezahlt Januar Mi, 01.Jan.14 Do, 02.Jan.14 Fr, 03.Jan.14 Sa, 04.Jan.14 So, 05.Jan.14 Mo, 06.Jan.14 Di, 07.Jan.14 Mi, 08.Jan.14 Do,
Mehrbersicht Datenbanken und Datawarehouses Datenbank Datenbanksysteme Niels Schršter
bersicht Niels Schršter EinfŸhrung GROUP BY Roll UpÔs Kreuztabellen Cubes Datenbank Ansammlung von Tabellen, die einen ãausschnitt der WeltÒ fÿr eine Benutzergruppe beschreiben. Sie beschreiben die funktionalen
MehrExterner Meilenstein. Manueller Sammelrollup Unterbrechung. Inaktiver Vorgang. Inaktiver Meilenstein Inaktiver Sammelvorgang
Nr. Vorgasname Dauer Anfang Fertig stellen VorgWer 1 Kick Off 0 Tage Di 05.02.13 Di 05.02.13 Alle 2 Grobkonzept erstellen 20 Tage Di 05.02.13 Mo 04.03.131 CN 3 Vorauswahl Shopsysteme 21 Tage Di 05.02.13
MehrProzesse beim Data Mining. Relevante Fachgebiete für Data Mining. Beispiel: Datenquelle (relationale DB) Architektur eines Data Mining Systems
Relevante Fachgebiete für Data Mining Prozesse beim Data Mining 1. Data cleaning: Datensäuberung von Rauschen & Inkonsistenz 2. Data integration: Datenintegration aus multiplen Quellen 3. Data selection:
MehrKurstage Geprüfte(r) Technischer Fachwirt(-in) IHK
Kurstage Geprüfte(r) Technischer Fachwirt(-in) IHK 18.10.2015 Sonntag WÜ 19.02.2016 Freitag WÜ Vertiefungstag 24.10.2015 Samstag WÜ 20.02.2016 Samstag WÜ Vertiefungstag 14.11.2015 Samstag WÜ 21.02.2016
MehrKurstage Geprüfte(r) Technischer Fachwirt(-in) IHK
Kurstage Geprüfte(r) Technischer Fachwirt(-in) IHK 06.10.2012 Samstag MD 15.02.2013 Freitag MD Vertiefungstag 20.10.2012 Samstag MD 16.02.2013 Samstag MD Vertiefungstag 03.11.2012 Samstag MD 17.02.2013
MehrMarktreport Strukturierte Produkte Monatsbericht
Marktreport Strukturierte Produkte Monatsbericht Juli 215 Schweizerischer Verband für Strukturierte Produkte SVSP Marktreport SVSP Juli 215 Schweizerischer Verband für Strukturierte Produkte SVSP www.svsp-verband.ch
MehrEinleitung. ROLLUP, CUBE und GROUPING. Markus Jägle (markus.jaegle@trivadis.com) Art der Info Technische Background Info (April 2002)
Betrifft Autör: GROUPING_ID Markus Jägle (markus.jaegle@trivadis.com) Art der Info Technische Background Info (April 2002) Quelle Aus dem Oracle9i Data Warehousing Guide und den Kursen New Features Oracle9i
MehrKurstage Geprüfte(r) Technischer Fachwirt(-in) IHK
Kurstage Geprüfte(r) Technischer Fachwirt(-in) IHK 17.10.2015 Samstag N 19.02.2016 Freitag N Vertiefungstag 24.10.2015 Samstag N Reserve 1) 20.02.2016 Samstag N Vertiefungstag 25.10.2015 Sonntag N 21.02.2016
MehrWebergänzung zu Kapitel 10
Webergänzung zu Kapitel 10 10.1.4 Varianzanalyse (ANOVA: analysis of variance) Im Kapitel 10 haben wir uns hauptsächlich mit Forschungsbeispielen beschäftigt, die nur zwei Ergebnissätze hatten (entweder
MehrContents. Datenanalysemethoden im analytischen CRM. Data Warehouse - OLAP Version: July 17, 2007. 1 Datenanalysemethoden im analytischen CRM
Contents Data Warehouse - OLAP Version: July 17, 7 Andreas Geyer-Schulz und Anke Thede Schroff-Stiftungslehrstuhl Informationsdienste und Elektronische Märkte Fakultät für Wirtschaftswissenschaften Gebäude
MehrAuswertung von Grundinformationen zu den Jugendleiter/innen Juleica-Daten
Auswertung von Grundinformationen zu den Jugendleiter/innen Juleica-Daten Stand: Februar bzw. April 2 1 Arbeitsstelle Kinder- und Jugendhilfestatistik im für den Deutschen Bundesjugendring FACHBEREICH
MehrProjektmanagement für Ingenieure
Springer Vieweg PLUS Zusatzinformationen zu Medien von Springer Vieweg Projektmanagement für Ingenieure Ein praxisnahes Lehrbuch für den systematischen Projekterfolg 2013 2. Auflage Kapitel 9 Lösungen
MehrRelevante Fachgebiete für Data Mining
Relevante Fachgebiete für Data Mining 1 Prozesse beim Data Mining 1. Data cleaning: Datensäuberung von Rauschen & Inkonsistenz 2. Data integration: Datenintegration aus multiplen Quellen 3. Data selection:
MehrHighlights der AllFacebook Developer Conference 23. November 2012, Berlin
Highlights der AllFacebook Developer Conference 23. November 2012, Berlin René Milzarek 1 Konferenz Programm OPENING KEYNOTE Inside Open Graph: How to connect all the things! Michael Kamleitner (Die Socialisten)
MehrStatistik I. Übungklausur. Prof. Dr. H. Toutenburg
Statistik I Übungklausur Prof. Dr. H. Toutenburg Hinweis: Die Zeitangaben sollen Ihnen aufzeigen wieviel Zeit Ihnen für eine Aufgabe von gewissem Umfang eingeräumt wird. Die Punktzahlen für die einzelnen
MehrChronologie Jan 02: Otto-Katalog Okt 04: Fingerabdrücke USA Dez 04: EU-Parlament und -Rat Jun 05: epass-kabinettsbeschluß Jul 05: Bundesratsbeschluß Aug 05: BioP2-Studie Nov 05: Einführung epass Forschungsprojekt
MehrRealisierung von OLAP Operatoren in einem visuellen Analysetool. Vortrag von Alexander Spachmann und Thomas Lindemeier
Realisierung von OLAP Operatoren in einem visuellen Analysetool Vortrag von Alexander Spachmann und Thomas Lindemeier Gliederung Ausgangssituation/Motivation Was ist OLAP? Anwendungen Was sind Operatoren?
MehrJanuar 2016. Deadline und Abrechnungsdetails. Zeichnungen. Rücknahmen. Deadline CET. Deadline CET. Valuta Titellieferung. Valuta Geldüberweisung
und sdetails Januar 2016 CH0017403509 1'740'350 Reichmuth Himalaja CHF 25. Jan 16 12.00 25. Jan 16 1) 29. Jan 16 17. Feb 16 1. Feb 16 3) CH0017403574 1'740'357 Reichmuth Himalaja EUR 25. Jan 16 12.00 25.
MehrKurstage Geprüfte(r) Technischer Fachwirt(-in) IHK
Kurstage Geprüfte(r) Technischer Fachwirt(-in) IHK 17.10.2015 Samstag HN 19.02.2016 Freitag HN Vertiefungstag 24.10.2015 Samstag HN 20.02.2016 Samstag HN Vertiefungstag 01.11.2015 Sonntag HN 21.02.2016
MehrPV Marktdaten Update Juni 2015
PV Marktdaten Update Juni 2015 Stand 31.07.2015 Alle Angaben ohne Gewähr 1 Vorwort zur Datenerhebung Juni 2015 Monatliche Veröffentlichung der PV-Meldezahlen Die Bundesnetzagentur veröffentlicht gemäß
MehrMotivation. Themenblock: Klassifikation. Binäre Entscheidungsbäume. Ansätze. Praktikum: Data Warehousing und Data Mining.
Motivation Themenblock: Klassifikation Praktikum: Data Warehousing und Data Mining Ziel Item hat mehrere Attribute Anhand von n Attributen wird (n+)-tes vorhergesagt. Zusätzliches Attribut erst später
MehrLMS Training Services - Contact Info
Siemens Industry Sector Siemens Industry Software NV Interleuvenlaan 68 Researchpark Haasrode Z1 B 3001 Leuven [] T +32 16 384 200 F +32 16 384 350 www.siemens.com/plm LMS Training Services - Contact Info
MehrBayes sches Lernen: Übersicht
Bayes sches Lernen: Übersicht Bayes sches Theorem MAP, ML Hypothesen MAP Lernen Minimum Description Length Principle Bayes sche Klassifikation Naive Bayes Lernalgorithmus Teil 5: Naive Bayes + IBL (V.
MehrMotivation. Themenblock: Data Preprocessing. Einsatzgebiete für Data Mining I. Modell von Gianotti und Pedreschi
Motivation Themenblock: Data Preprocessing We are drowning in information, but starving for knowledge! (John Naisbett) Was genau ist Datenanalyse? Praktikum: Data Warehousing und Data Mining Was ist Data
MehrDaniel Heß. Donnerstag, den 16. November 2006. Verein zur Förderung der privaten Internet Nutzung e.v. Wie funktioniert das Internet? dh@ping.
Daniel Heß Verein zur Förderung der privaten Internet Nutzung e.v. Donnerstag, den 16. November 2006 Was ist Ein globales Netzwerk von Computern und Kommunikationsgeräten Quelle für eine fast unendliche
MehrVorgang Unterbrechung In Arbeit. Meilenstein Sammelvorgang Projektsammelvorgang. Externe Vorgänge Externer Meilenstein Stichtag
Nr. sname Dauer Anfang Ende Vorgänger Ressourcennamen 06. Jan '14 13. Jan '14 M D M D F S S M D M D F S S 1 AdA nach AEVO (IHK Vorbereitung) 10 Tage Mo 06.01.14 Fr 17.01.14 AdA nach AEVO (IHK Vorbereitung)
MehrDisclosure of shareholdings
Disclosure of shareholdings Credit Suisse Group AG announces a change in the composition of the Group that holds shares in Zurich Financial Services Ltd Zurich Financial Services Ltd Mythenquai 2 8022
MehrMeilenstein. Sammelvorgang. Projektsammelvorgang. Seite 1
Nr. sname Dauer Anfang Ende 1 Urteilsspruch (Annahme) 0 Tage Mo 01.06.09 Mo 01.06.09 2 3 Konzept Zwischenphase 33 Tage Mi 15.04.09 Fr 29.05.09 4 Vorbereitung und Start 3 Tage Mi 15.04.09 Fr 17.04.09 5
MehrSWISS Verkehrszahlen Juli 2007
SWISS Verkehrszahlen Juli 2007 SWISS im Juli mit höherer Auslastung SWISS konnte ihre Auslastung im Juli weiter steigern: Der durchschnittliche Sitzladefaktor (SLF) lag bei 85% gegenüber 84.2% im Vorjahr.
MehrData Warehousing. Fragen des Marketingleiters. Beispiel: : Amazon. Technisch... Amazon weltweit... Datenbank. Aufbau eines DWH OLAP <-> OLTP Datacube
Fragen des Marketingleiters Data Warehousing Wie viele Bestellungen haben wir jeweils im Monat vor Weihnachten, aufgeschlüsselt nach? Aufbau eines DWH OLAP OLTP Datacube Beispiel: : Amazon Technisch
MehrTreffpunktWALD Alle Veranstaltungen rund um den Wald! TreffpunktWALD (MeetingpointFOREST)
TreffpunktWALD (MeetingpointFOREST) 1 a platform for forest communication: TreffpunktWALD What? 1. internal organization of activities of its members 2. online calendar of events in the forest (www.treffpunktwald.de)
MehrMala Bachmann September 2000
Mala Bachmann September 2000 Wein-Shop (1) Umsatz pro Zeit und Produkt Umsatz Jan Feb Mrz Q1 Apr 2000 Merlot 33 55 56 144 18 760 Cabernet-S. 72 136 117 325 74 1338 Shiraz 85 128 99 312 92 1662 Rotweine
MehrPräventionsbericht 2007
Bericht über die Präventionsarbeit der Informationszentrale gegen Vergiftungen des Landes Nordrhein-Westfalen mittels Internetpräsenz am Zentrum für Kinderheilkunde des Universitätsklinikums Bonn für das
MehrKurstage Geprüfte(r) Technischer Fachwirt(-in) IHK
Kurstage Geprüfte(r) Technischer Fachwirt(-in) IHK 16.04.2016 Samstag H 22.10.2016 Samstag H 23.04.2016 Samstag H 05.11.2016 Samstag H 24.04.2016 Sonntag H 19.11.2016 Samstag H 30.04.2016 Samstag H 26.11.2016
MehrKurstage Geprüfte(r) Technischer Fachwirt(-in) IHK
Kurstage Geprüfte(r) Technischer Fachwirt(-in) IHK 31.10.2015 Samstag MD 19.02.2016 Freitag MD Vertiefungstag 01.11.2015 Sonntag MD 20.02.2016 Samstag MD Vertiefungstag 07.11.2015 Samstag MD 21.02.2016
MehrEntwicklung des deutschen PV-Marktes Auswertung und grafische Darstellung der Meldedaten der Bundesnetzagentur nach 16 (2) EEG 2009 Stand 31.3.
Entwicklung des deutschen PV-Marktes Auswertung und grafische Darstellung der Meldedaten der Bundesnetzagentur nach 16 (2) EEG 29 Stand 31.3.215 PV-Meldedaten Jan. Feb. 215 Bundesverband Solarwirtschaft
MehrAufgaben zu Kapitel 9
Aufgaben zu Kapitel 9 Aufgabe 1 Für diese Aufgabe benötigen Sie den Datensatz Nominaldaten.sav. a) Sie arbeiten für eine Marktforschungsfirma und sollen überprüfen, ob die in diesem Datensatz untersuchte
MehrKurstage IT Fachwirt(-in) IHK
Kurstage IT Fachwirt(-in) IHK 21.05.2016 Samstag H 23.09.2016 Freitag H Vertiefungstag 28.05.2016 Samstag H 24.09.2016 Samstag H Vertiefungstag 11.06.2016 Samstag H 25.09.2016 Sonntag H Vertiefungstag
MehrVeräußerung von Emissionsberechtigungen in Deutschland
Veräußerung von Emissionsberechtigungen in Deutschland Monatsbericht September 2008 Berichtsmonat September 2008 Die KfW hat im Zeitraum vom 1. September 2008 bis zum 30. September 2008 3,95 Mio. EU-Emissionsberechtigungen
MehrContracts for Difference (CFDs) Kennzahlen Q2 2009
RESEARCH CENTER FOR FINANCIAL SERVICES Contracts for Difference (CFDs) Kennzahlen Q2 29 Statistik im Auftrag des Contracts for Difference Verband e. V. München, im Juli 29 Steinbeis Research Center for
MehrIntelligence (BI): Von der. Nürnberg, 29. November 2011
Modelle für Business Intelligence (BI): Von der Anforderung zum Würfel Nürnberg, 29. November 2011 Warum Modelle für Business Intelligence (BI)? Warum Modelle für Business Intelligence (BI)? Bis zur Auswertung
MehrKurstage Geprüfte(r) Technischer Fachwirt(-in) IHK
Kurstage Geprüfte(r) Technischer Fachwirt(-in) IHK 15.11.2015 Sonntag OS 19.02.2016 Freitag OS Vertiefungstag 21.11.2015 Samstag OS 20.02.2016 Samstag OS Vertiefungstag 22.11.2015 Sonntag OS Reserve 1)
Mehr5 Zusammenhangsmaße, Korrelation und Regression
5 Zusammenhangsmaße, Korrelation und Regression 5.1 Zusammenhangsmaße und Korrelation Aufgabe 5.1 In einem Hauptstudiumsseminar des Lehrstuhls für Wirtschafts- und Sozialstatistik machten die Teilnehmer
MehrSiteAudit Analyzer. Ein kurzer Überblick. Audit und Flotten-Management Flottenanalyse und Berichtswesen Kompatibel mit allen Umgebungen
Das fortschrittliche Tool für MPS- Berichtswesen Bestand Flottenalter Flottenmix Volumenmix Volumenentwicklung Auslastung Füllstände Nachfüllung Materialverschwendung Flottenzustand Probleme im Bestand
Mehr731 Lindau - Friedrichshafen - Radolfzell Bodensee-Gürtelbahn
731 Lindau - Friedrichshaen - Radolzell Bodensee-Gürtelbahn 731 Von Kressbronn bis Sipplingen Verbundtari Bodensee-Oberschwaben Verkehrsverbund (bodo) Von Überlingen-Nußdor bis Singen (Hohentwiel) Verbundtari
MehrPivotieren. Themenblock: Anfragen auf dem Cube. Roll-up und Drill-down. Slicing und Dicing. Praktikum: Data Warehousing und Data Mining. Produkt.
Zeit Pivotieren Themenblock: Anfragen auf dem Cube Praktikum: Data Warehousing und Data Mining Zeit Zeit 2 Roll-up und Drill-down Slicing und Dicing Drill-down Januar 2 3 33 1. Quartal 11 36 107 Februar
Mehr4PLAN Managed Service HR Controlling Prozess und Leistungen
World Class HR Controlling 4PLAN Managed Service HR Controlling Prozess und Leistungen Autor: Hanns- Dirk Brinkmann Version: 1.0 1 Einleitung... 3 2 Phasen im Überblick... 3 3 Leistungen... 4 3.1 Monatliche
MehrPV Marktdaten Update Februar 2016
Stand 31.03.2016 Alle Angaben ohne Gewähr 1 Vorwort zur Datenerhebung Februar 2016 ➊ Monatliche Veröffentlichung der PV- Meldezahlen Die Bundesnetzagentur veröffentlicht gemäß dem Erneuerbare- Energien-
MehrParameter. Inhalt. Analyse zur Vertriebssteuerung. National. Regionenvergleich. Einzelauswertungen je Region. aus dem biovista Handels-Panel
Analyse zur Vertriebssteuerung aus dem biovista Handels-Panel für die Marke Muster Parameter Regionsart Marke Artikelgruppe Betrachtungszeitraum Vergleichszeitraum Handelsgruppen Ihre Individuellen Vertriebsregionen
Mehr2. Datenvorverarbeitung
Kurzreferat Das Ziel beim Clustering ist es möglichst gleich Datensätze zu finden und diese in Gruppen, sogenannte Cluster zu untergliedern. In dieser Dokumentation werden die Methoden k-means und Fuzzy
MehrData Warehousing. DWH Projekte. Ulf Leser Wissensmanagement in der Bioinformatik
Data Warehousing DWH Projekte Ulf Leser Wissensmanagement in der Bioinformatik Inhalt DWH Projekte Spezifika Die kritischen Punkte Warum scheitern DWH Projekte? Ulf Leser: Data Warehousing, Vorlesung,
MehrData Warehouse. Kapitel 17. Abbildung 17.1: Zusammenspiel zwischen OLTP und OLAP. Man unterscheidet zwei Arten von Datenbankanwendungen:
Kapitel 17 Data Warehouse OLTP Online Transaction Processing OLAP Online Analytical Processing Decision Support-Anfragen Data Mining opera- tionale DB opera- tionale DB opera- tionale DB Data Warehouse
MehrEnergieeffizienz und ihre Umsetzung am Beispiel einer Kraft-Wärme- Kopplungsanlage
Energieeffizienz und ihre Umsetzung am Beispiel einer Kraft-Wärme- Kopplungsanlage 1 Mein Werdegang 1961 geboren in Berlin 1989 Dipl.-Ing. Energie- und Verfahrenstechnik, TU- Berlin, Studentische Hilfskraft
MehrData Warehousing und Data Mining
Data Warehousing und Data Mining 2 Cognos Report Net (CRN) Ermöglicht Erstellen von Ad-hoc-Anfragen (Query Studio) Berichten (Report Studio) Backend Data Cube Relationale Daten Übung: Cognos Report Net
MehrChi-Quadrat Verfahren
Chi-Quadrat Verfahren Chi-Quadrat Verfahren werden bei nominalskalierten Daten verwendet. Die einzige Information, die wir bei Nominalskalenniveau zur Verfügung haben, sind Häufigkeiten. Die Quintessenz
MehrLogische Modelle für OLAP. Burkhard Schäfer
Logische Modelle für OLAP Burkhard Schäfer Übersicht Einführung in OLAP Multidimensionale Daten: Hypercubes Operationen Formale Grundlagen Zusammenfassung Einführung in OLAP Verfahren zur Analyse großer
MehrKapitel 5: Einfaktorielle Varianzanalyse
Rasch, Friese, Hofmann & Naumann (006). Quantitative Methoden. Band (. Auflage). Heidelberg: Springer. Kapitel 5: Einfaktorielle Varianzanalyse Berechnen der Teststärke a priori bzw. Stichprobenumfangsplanung
MehrPortfoliorisiko und Minimum Varianz Hedge
ortfoliorisiko und Minimum Varianz Hedge Vertiefungsstudium Finanzwirtschaft rof. Dr. Mark Wahrenburg Überblick Messung von Risiko ortfoliodiversifikation Minimum Varianz ortfolios ortfolioanalyse und
MehrKurstage Geprüfte(r) Technischer Fachwirt(-in) IHK
Kurstage Geprüfte(r) Technischer Fachwirt(-in) IHK 27.11.2015 Freitag HH 26.02.2016 Freitag HH Vertiefungstag 28.11.2015 Samstag HH 27.02.2016 Samstag HH Vertiefungstag 29.11.2015 Sonntag HH Reserve 1)
MehrSPÄNGLER IQAM COMMODITY INDEX. Handbuch
SPÄNGLER IQAM COMMODITY INDEX Handbuch Februar 2014 1. INVESTMENT PHILOSOPHIE DES SPÄNGLER IQAM COMMODITY INDEX Die Investment Philosophie des Index basiert auf wissenschaftlichen Erkenntnissen, aufgrund
MehrDie Friseur-Branche. Anzahl der Betriebsstätten ,0% Jahr Jahr 2000
Die Friseur-Branche Anzahl der Betriebsstätten + 24,0% 78.522 Jahr 2010 63.317 Jahr 2000 Quelle: Deutscher Handwerkskammertag (DHKT) / Stand 2011 Die Friseur-Branche Zu- und Abgänge der Betriebsstätten
MehrPresse-Telefonkonferenz Q1-Ergebnisse 2014 15. Mai 2014
Presse-Telefonkonferenz Q1-Ergebnisse 2014 15. Mai 2014 Zusammenfassung der Ergebnisse des 1. Quartals Key Highlights Q1 2014 Turbine-Programm sorgte für deutliche Kostensenkungen Kosten pro angebotenen
MehrLineare Modelle in R: Einweg-Varianzanalyse
Lineare Modelle in R: Einweg-Varianzanalyse Achim Zeileis 2009-02-20 1 Datenaufbereitung Wie schon in der Vorlesung wollen wir hier zur Illustration der Einweg-Analyse die logarithmierten Ausgaben der
MehrProduction Intelligence Big-Data-Analyse und Predictive Maintenance auf Inline-Sensordaten. Business Driven Intelligence
Production Intelligence Big-Data-Analyse und Predictive Maintenance auf Inline-Sensordaten Peter Strohm Business Driven Intelligence 8 Fakten zur AG 2002 gegründet in Freiburg 40% durchschnittliche Wachstumsrate
MehrHerzlich Willkommen! FO-FORUMEXPERTENRUNDE MOBILE MEDIA. Gehören ipads, Apps & Co. die Zukunft?
Herzlich Willkommen! Jürg Konrad Vorsitzender der Geschäftsleitung FO Print & Media AG Roger Sommerhalder Berater Online- & Mobile Kommunikation, netzbarkeit partner of the brandinghouse network Meike
MehrUsability Metrics. Related Work. Von Torsten Rauschan (torsten.rauschan@haw-hamburg.de) HAW Hamburg M-Inf2 Anwendungen 2 Betreuer: Prof. Dr.
Usability Metrics Related Work Von Torsten Rauschan (torsten.rauschan@haw-hamburg.de) HAW Hamburg M-Inf2 Anwendungen 2 Betreuer: Prof. Dr. Zukunft Agenda Rückblick AW1 Motivation Related work QUIM SUM
MehrValuation Policy: Praktische Erfahrungen mit Bewertungsdifferenzen
Valuation Policy: Praktische Erfahrungen mit Dr. Beat Moser, UBS Investment Management UBS Global Wealth Management & Swiss Bank Investment Management GIPS Aperitif der Schweizerischen Bankiervereinigung
MehrÜbungen zu Logik und Künstliche Intelligenz Blatt 8
Heilbronn, den 14.5.2010 Prof. Dr. V. Stahl WS 10/11 Übungen zu Logik und Künstliche Intelligenz Blatt 8 Aufgabe 1. Überlegen Sie, wie man folgende Relationen R grafisch darstellen könnte und entscheiden
MehrRACE Reporting and Analysis of Communication Efficiency
RACE Reporting and Analysis of Communication Efficiency Niedersächsischen PR Forum Lingen (Ems) / Fachhochschule Osnabrück 17. März 26 Frank Herkenhoff,, M.A. PLEON Kohtes Klewes München Sonnenstrasse
MehrLead User-Projekt. Dr. Theo Schöller-Stiftungslehrstuhl für Technologieund Innovationsmanagement Prof. Dr. Joachim Henkel
Technische Universität München Lead User-Projekt Dr. Theo Schöller-Stiftungslehrstuhl für Technologieund Innovationsmanagement Prof. Dr. Joachim Henkel Technische Universität München Übersicht 1 2 3 Lead
MehrJoolap- Benutzerhandbuch
Joolap- Benutzerhandbuch Autor Meikel Bisping Kontakt info@mbisping.de www.joolap.de Bearbeitungsstand 12.04.2011 Kurzbeschreibung Diese Dokument informiert anhand praktischer Beispiele über die Arbeit
MehrAnforderungen, Erfahrungen und Rolle der Marktforschung im Social Media Monitoring bei der TARGOBANK
Berufsverband Deutscher Markt- und Sozialforscher e.v. Anforderungen, Erfahrungen und Rolle der Marktforschung im Social Media Monitoring bei der TARGOBANK Frankfurt, 14. November 2011 Agenda 1 Wer sind
MehrDie Entwicklung der deutschen Demokratie seit 1989 unter Berücksichtigung der Entwicklung der Europäischen Union
Die Entwicklung der deutschen Demokratie seit 1989 unter Berücksichtigung der Entwicklung der Europäischen Union Prof. Dr. Gary S. Schaal Helmut-Schmidt-Universität Hamburg Abb. 1:Wie sehr sind Sie grundsätzlich
MehrThomas Behr. 17. November 2011
in in Fakultät für Mathematik und Informatik Datenbanksysteme für neue Anwendungen FernUniversität in Hagen 17. November 2011 c 2011 FernUniversität in Hagen Outline in 1 2 3 4 5 6 - Was ist das? in über
MehrEntwicklung des deutschen PV-Marktes Auswertung und grafische Darstellung der Meldedaten der Bundesnetzagentur nach 16 (2) EEG 2009 Stand 30.9.
Entwicklung des deutschen PV-Marktes Auswertung und grafische Darstellung der Meldedaten der Bundesnetzagentur nach 16 (2) EEG 2009 Stand 30.9.2013 PV-Meldedaten Jan. Aug. 2013 Bundesverband Solarwirtschaft
MehrDokumenten-Clustering. Norbert Fuhr
Dokumenten-Clustering Norbert Fuhr Dokumenten-Clustering (Dokumenten-)Cluster: Menge von ähnlichen Dokumenten Ausgangspunkt Cluster-Hypothese : die Ähnlichkeit der relevanten Dokumente untereinander und
MehrDimensionale Modellierung mit Oracle BI EE und Oracle OLAP Tipps und Tricks aus der Praxis
Dimensionale Modellierung mit Oracle BI EE und Oracle OLAP Tipps und Tricks aus der Praxis DOAG Konferenz 2010 Claus Jordan Senior Consultant, Trivadis GmbH 16.11.2010 Basel Bern Lausanne Zürich Düsseldorf
MehrFOCUS Werbebilanz Februar 2016
FOCUS Werbebilanz Februar 2016 FASTER BETTER EFFICIENT FOCUS 2016 1 Werbebilanz 2/2016 FASTER BETTER EFFICIENT FOCUS 2016 2 Werbeentwicklung Februar 2016 % Veränderung zum Vorjahresmonat 12 10,6 10 9,4
MehrKapitel 2: Mathematik- und Informatik-Grundlagen
Kapite 2: Mathematik- und Informatik-Grundagen einer Menge gibt an, wie zufäig die Daten in einer Menge verteit sind (bzw. wie zufäig die Ausprägung eines Attributs in einer Menge von Objekten ist), auch
MehrModel Klausel - Der Excel-Killer von Oracle?
Model Klausel - Der Excel-Killer von Oracle? Andrea Kennel Trivadis AG Glattbrugg, Schweiz Schlüsselworte: Model Klausel, SQL, Data Warehousing, OLAP Zusammenfassung Ein Data Mart kann als ein Würfel mit
MehrAufgabe 1: [Logische Modellierung]
Aufgabe 1: [Logische Modellierung] a) Entwerfen Sie für das von Ihnen entworfene Modell aus Aufgabe 2 des 1. Übungsblattes ein Star-Schema. b) Entwerfen Sie für das vorangegangene Modell einen Teil eines
MehrBetriebliches Gesundheitsmanagement. Soziales Gesundheit Bildung Kultur Umwelt Heimatpflege
Betriebliches Gesundheitsmanagement Soziales Gesundheit Bildung Kultur Umwelt Heimatpflege Seite 1 05.06.2014 Referat 14 Betriebliches Gesundheitsmanagement beim Bezirk Oberbayern Konzeption der Vorgehensweise,
MehrWas die Fachhändler bewegt: Schlagworte der Händler zur Umsatzmeldung UMSATZENTWICKLUNG-MAI: +3,8% UMSATZENTWICKLUNG-KUMULIERT: +1,3%
Was die Fachhändler bewegt: Schlagworte der Händler zur Umsatzmeldung UMSATZENTWICKLUNG-MAI: +3,8% UMSATZENTWICKLUNG-KUMULIERT: +1,3% Regionale Umsatzentwicklung in % gegenüber dem Vorjahresmonat und relevante
MehrAuswirkungen der Finanzkrise auf die Pensionskassen
Auswirkungen der Finanzkrise auf die Pensionskassen Mai 2009 Benjamin Brandenberger Inhalt Ausgewählte Wirkungszusammenhänge der Vorsorgefinanzierung Spuren der Finanzkrise in ausgewählten Anlagekategorien
MehrSEMINARTERMINE 2016 2017
Grundlagenseminar Ort LG Nr. Dauer Nürnberg PM GL 16 01 22. Feb 16 Mo 25. Feb 16 Do München PM GL 16 02 11. Apr 16 Mo 14. Apr 16 Do Nürnberg PM GL 16 03 06. Jun 16 Mo 09. Jun 16 Do Berlin PM GL 16 04 05.
MehrTerminplan der Leistungsnachweise im 1. und 2. Halbjahr 2012/13
KW Datum Jahrgang 11 Jahrgang Q3A Jahrgang Q3B 33 Mo 13.Aug 12 Di 14.Aug 12 Mi 15.Aug 12 Do 16.Aug 12 Fr 17.Aug 12 34 Mo 20.Aug 12 Di 21.Aug 12 Mi 22.Aug 12 Do 23.Aug 12 Fr 24.Aug 12 35 Mo 27.Aug 12 Di
MehrInhalte der Zellen A1 bis A3 addieren
Grundrechenarten 10 und 5 addieren =10+5 3 von 10 subtrahieren =10-3 11 mit 2 multiplizieren =11*2 12 durch 4 dividieren =12/4 Excelspezifische Grundrechenarten Inhalte der Zellen A1 bis A3 addieren =SUMME(A1:A3)
MehrFortgeschrittene OLAP Analysemodelle
Fortgeschrittene OLAP Analysemodelle Jens Kübler Imperfektion und erweiterte Konzepte im Data Warehousing 2 Grundlagen - Datenanalyse Systemmodell Datenmodell Eingaben System Schätzer Datentypen Datenoperationen
MehrHerzlich Willkommen beim Seminar Powertrading mit den Elliott-Wellen
Herzlich Willkommen beim Seminar Powertrading mit den Elliott-Wellen Ralph Nelson Elliott 7 -. August "The Wave Principle". Impuls Korrektur numerische Phase b a c alphabetische Phase b a c Die richtige
MehrData Warehouse. Kapitel 16. Abbildung 16.1: Zusammenspiel zwischen OLTP und OLAP. Man unterscheidet zwei Arten von Datenbankanwendungen:
Kapitel 16 Data Warehouse OLTP Online Transaction Processing OLAP Online Analytical Processing Decision Support-Anfragen Data Mining operationale DB operationale DB operationale DB Data Warehouse operationale
Mehr