Angewandte Multivariate Statistik Prof. Dr. Ostap Okhrin

Größe: px
Ab Seite anzeigen:

Download "Angewandte Multivariate Statistik Prof. Dr. Ostap Okhrin"

Transkript

1 Angewandte Multivariate Statistik Angewandte Multivariate Statistik Prof. Dr. Ostap Okhrin Ostap Okhrin 1 of 58

2 Angewandte Multivariate Statistik Correspondence Analysis Motivation Korrespondenzanalyse Kategoriale Skalen Haltungen, Meinungen und demografische Charakteristiken, z. B. Geschlecht, Rasse, soziale Schicht öffentliche Gesundheit, Ökologie, Bildung, Marketing Qualitätskontrolle: Wie gut eine Fabrik aufgestellt ist, wie gut ein Produkt schmeckt oder wie einfach ein Arbeiter eine bestimmte Aufgabe findet. Ostap Okhrin 2 of 58

3 Angewandte Multivariate Statistik Correspondence Analysis Motivation Zweiweg-Kontingenztabelle Variable Z hat I Level Variable Y hat J Level Dies ergibt IJ Kombinationen von Z und Y Zähle die Rückmeldungen (Z, Y ) und stelle diese Information in einer rechteckigen Tabelle mit I Zeilen und J Spalten dar. In jeder Zelle ist die Anzahl der Subjekte mit der Kombination von Z und Y gegeben. Ostap Okhrin 3 of 58

4 Example X = Finanz Energie Hightech Frankfurt Berlin München multivariate Verteilung: π ij = P(Z = i, Y = j) ist die Wahrscheinlichkeit, dass Z und i und gleichzeitig Y und j gleich sind. Randverteilung von Z: π i - Wahrscheinlichkeit, dass Z und i gleich sind. Randverteilung von Y : π j - Wahrscheinlichkeit, dass Y und j gleich sind.

5 Angewandte Multivariate Statistik Correspondence Analysis Motivation Unabhängigkeit Die Assoziation zwischen Z und Y ist durch ihre multivariate Verteilung gegeben: die cdtl-verteilung von Z für gegebenes Y oder die cdtl-verteilung von Y für gegebenes Z. Z und Y sind unabhängig, falls für alle i und j: π i j = π ij /π j = π i, π j i = π ji /π i = π j, or π ij = π i π j. π ij bezeichnet die unbekannten wahren Wahrscheinlichkeiten. Die relativen Häufigkeiten der Stichprobe werden durch p ij = x ij /x abgebildet, wobei x ij die absoluten Häufigkeiten und x die Stichprobengröße ist. Ostap Okhrin 5 of 58

6 Angewandte Multivariate Statistik Correspondence Analysis Motivation Unabhängigkeitsmaße Vergleiche die Rückmeldung zweier Zeilen (Wahrscheinlichkeit, dass Z = 1): 1. Differenz von Proportionen π 1i π 1h 2. Relatives Risiko π 1i /π 1h 3. Odds-Verhältnis (π 11 /π 12 )/(π 21 /π 22 ) Unabhängigkeit impliziert, dass die Differenz der Proportionen = 0, relatives Risiko = 1, und Odds-Verhältnis = 1. Ostap Okhrin 6 of 58

7 Angewandte Multivariate Statistik Correspondence Analysis Motivation Stichprobenverteilungen Die Tests sind oft, jedoch nicht immer, identisch für alle Arten von Stichproben. Poisson-Sampling (alles ist zufällig) Multinomial-Sampling (Gesamtzahl der beobachteten Subjekte ist fest) Unabhängiges Multinomial-Sampling (Anzahl der Subjekte ist fest für jede Zeile oder Spalte) Ostap Okhrin 7 of 58

8 Angewandte Multivariate Statistik Correspondence Analysis Motivation Maximum-Likelihood-Schätzungen Abhängig von der Stichprobenverteilung erhalten wir unterschiedliche Likelihood-Funktionen (Poisson- oder multinomiale Verteilungen). Die ML-Schätzung von π ij ist gegeben durch die relative Häufigkeit p ij = x ij /x. Unter Unabhängigkeit sind die ML-Schätzungen der Zellenwahrscheinlichkeiten gegeben durch ˆπ ij = p i p j = (x i x j )/x 2. Mit Algebra erhalten wir den Likelihood-Ratio Test für Unabhängigkeit. Ostap Okhrin 8 of 58

9 Angewandte Multivariate Statistik Correspondence Analysis Motivation Likelihood-Ratio Test für Unabhängigkeit Der Likelihood-Ratio Test für Unabhängigkeit ist identisch zu G = 2 log Λ = 2 log i x x j (x i x j ) x ij i j x x ij ij = 2 I i=1 j=1 J log(x ij /E ij ), E ij def = (x i x j )/x (1) Die Theorie ergibt, dass 2 log Λ unter Annahme der Nullhypothese eine asymptotische χ 2 -Verteilung mit (I 1)(J 1) Freiheitsgraden hat. Ostap Okhrin 9 of 58

10 Angewandte Multivariate Statistik Correspondence Analysis Motivation Pearson Chi-Quadrat Test Mit den Schätzern für die erwarteten Häufigkeiten E ij t = I J (x ij E ij ) 2 i=1 j=1 E ij. (2) Unter Annahme der Nullhypothese ist die Teststatistik eine χ 2 -Verteilung mit (I 1)(J 1) Freiheitsgraden. Ostap Okhrin 10 of 58

11 Angewandte Multivariate Statistik Correspondence Analysis Motivation Idee des Beweises: Nehme an, dass x ij unabhängige Poissongrößen sind. E [x ij ] = e ij. Die standardisierten z ij = (x ij e ij )/ e ij haben eine asymptotische N(0, 1), deshalb gehorcht z 2 ij einer asymptotischen χ 2 -Verteilung mit IJ 1 Freiheitsgraden. Man ersetze e ij durch ihre Schätzungen E ij. Dann erhält man die Pearson χ 2 -Statistik t, siehe (2), und verliert (I 1) + (J 1) Freiheitsgrade. Ostap Okhrin 11 of 58

12 Angewandte Multivariate Statistik Correspondence Analysis Motivation Example (Augen-Haar-Beispiel) Das klassischste aller Beispiele. EYE/HAIR black brown red blond SUM d.brown l.brown green blue SUM Ostap Okhrin 12 of 58

13 Angewandte Multivariate Statistik Correspondence Analysis Motivation Example Originaltabelle und -werte unter erwarteter Unabhängigkeit. [,1] [,2] [,3] [,4] [1,] [2,] [3,] [4,] [,1] [,2] [,3] [,4] [1,] [2,] [3,] [4,] Ostap Okhrin 13 of 58

14 Angewandte Multivariate Statistik Correspondence Analysis Motivation Example Beiträge zur Chi-Quadrat-Statistik und ihre Summe > (E - X) ^ 2 / E [,1] [,2] [,3] [,4] [1,] [2,] [3,] [4,] > Chi2 [1] Pearson Chi-Quadrat t hat χ 2 (9) cdf kritischer Wert (α = 0.05) ist Ostap Okhrin 14 of 58

15 Angewandte Multivariate Statistik Correspondence Analysis Motivation Example (Fahrzeugdaten) X 3 : Reparaturen 1978 (5 beste,..., 1 schlechteste) X 4 : Reparaturen 1977 X 13 : Unternehmenssitz (1 US, 2 Japan, 3 Europa) Fragestellung: Gibt es einen Zusammenhang zwischen den Unternehmenssitzen und Reparaturen? Ostap Okhrin 15 of 58

16 Angewandte Multivariate Statistik Correspondence Analysis Motivation Example > X3X4 [,1] [,2] [,3] [,4] [,5] [1,] [2,] [3,] [4,] [5,] > Chi2_X3X4 [1] Kritischer Wert ist (α = 0.05) Ostap Okhrin 16 of 58

17 Angewandte Multivariate Statistik Correspondence Analysis Motivation Example > X3X13 [,1] [,2] [,3] [1,] [2,] [3,] [4,] [5,] > Chi2_X3X13 [1] Kritischer Wert ist (α = 0.05) Ostap Okhrin 17 of 58

18 Angewandte Multivariate Statistik Correspondence Analysis Motivation Example > X4X13 [,1] [,2] [,3] [1,] [2,] [3,] [4,] [5,] > Chi2_X4X13 [1] Kritischer Wert ist (α = 0.05) Ostap Okhrin 18 of 58

19 Angewandte Multivariate Statistik Correspondence Analysis Motivation Korrespondenzanalyse Die Unabhängigkeitstests mit Kontingenztabellen liefern keine Informationen über die Struktur der Abhängigkeit der Daten in der Tabelle. Wir können feststellen, dass eine Abhängigkeit besteht, es ist jedoch unmöglich zu sagen, wie die Zeilenkategorien diejenigen der Spalten beeinflussen. Das Ziel der Korrespondenzanalyse ist es, Zusammenhänge (Assoziation) zwischen zwei diskreten Variablen durch die Bestimmung der Zeilen- und Spaltenindizes aus der Kontingenztabelle zu untersuchen. Ostap Okhrin 19 of 58

20 Angewandte Multivariate Statistik Correspondence Analysis Motivation Example Die französischen Bachelordaten: Region (z.b. Ile-de-France) und Fächer (z.b. Philosophie) Frage: Ziehen Studierende in einigen Regionen bestimmte Fächer vor oder umgekehrt? Anteil der acht Fächer für die Lorraine-Region: A B C D E F G H Ostap Okhrin 20 of 58

21 Angewandte Multivariate Statistik Correspondence Analysis Motivation Example Anteil der acht Fächer für alle Regionen. A B C D E F G H Lorraine scheint in den Fächern E, F, G über- und in den Fächern A, B, C, D unterrepräsentiert zu sein. Entwicklung eines Index für die Region, sodass die Über- und Unterrepräsentation mit einiger einzigen Zahl gemessen werden kann. Wie können wir die Regionen gewichten, sodass wir sehen können, in welchen Regionen welche Fächer präferiert werden? Ostap Okhrin 21 of 58

22 Angewandte Multivariate Statistik Correspondence Analysis Motivation Example n Typen von Unternehmen und p Orte. Kontingenztabelle x 11 x 12 x 1p x 1 x 21 x 22 x 2p x x n1 x n2 x np x n x 1 x 2 x p x Ostap Okhrin 22 of 58

23 Angewandte Multivariate Statistik Correspondence Analysis Motivation Example Nehme an, dass n = 3, p = 3 und X = Finanz Energie High-Tech Frankfurt Berlin München Ostap Okhrin 23 of 58

24 Angewandte Multivariate Statistik Correspondence Analysis Motivation Example Ortsindex: s j n i=1 r i x ij x j r = (r 1,..., r n ) mit dem (Unternehmens-)Gewichtsvektor Unternehmensindex: p mit dem (Orts-)Gewichtsvektor s = ( s1,..., s p r i sj j=1 x ij x i Finde gleichzeitig r = (r 1,..., r n ) und s = (s 1,..., s p ), sodass die Proximität (Abstand) zwischen r i und s j eine positive oder negative Assoziation zwischen der i ten Zeile und der j ten Spalte. ) Ostap Okhrin 24 of 58

25 Angewandte Multivariate Statistik Correspondence Analysis Motivation Zusammenfassung: Korresponzanalyse Das Ziel der Korrespondenzanalyse ist es, Indizes zu entwickeln, die Zusammenhänge zwischen den Variablen in einer Kontingenztabelle zeigen. Die gemeinsame Repräsentation dieser Indizes deckt Zusammenhänge zwischen den Variablen auf. Ostap Okhrin 25 of 58

26 χ 2 -Zerlegung χ 2 -Teststatistik für Unabhängigkeit in einer zweidimensionalen Kontigenztabelle n p t = (x ij E ij ) 2 /E ij i=1 j=1 wobei E ij (1) die erwartete Häufigkeit in Zelle (i, j) unter Unabhängigkeit ist: E ij = x i x j x Ostap Okhrin 26 of 58

27 Mit der Unabhängigkeitshypothese: t gehorcht χ 2 (n 1)(p 1) - Verteilung. Die Abweichung von der Unabhängigkeit kann mittels der Matrix C bestimmt werden, deren Elemente definiert sind durch Notation c ij = (x ij E ij )/E 1/2 ij (3) A = diag(x i ), B = diag(x j ) Die Randzeilen und -spalten-häufigkeiten sind a = A1 n, b = B1 n. C b = 0, C a = 0 Ostap Okhrin 27 of 58

28 Singulärwertzerlegung (SWZ) von C R = rank(c) min(n 1, p 1) Λ = diag(λ 1/2 1,..., λ 1/2 R ) λ j Erwartungswert von CC. c ij = C = ΓΛ. R k=1 λ 1/2 k γ ik δ jk tr(cc ) = R λ k = 1 i cij 2 = t. j SWZ zerlegt χ 2 -Wert und nicht die Totalvarianz. Ostap Okhrin 28 of 58

29 Erinnerung: Kapitel Zerlegung von Datenmatrizen durch Faktoren. Dualitätsrelationen: δ k = λ 1 2 k C γ k γ k = λ 1 2 k Cδ k Projektionen auf Zeilen und Spalten: Cδ k = λ k γ k C γ k = λ k δ k Folglich haben die Eigenvektoren δ k und γ k fast dieselben Eigenschaften wie die Indizes r k und s k, die wir erhalten möchten. Ostap Okhrin 29 of 58

30 Angenommen λ 1 ist vorherrschend, sodass c ij λ 1/2 1 γ i1 δ j1. Die Matrix der Abweichungen von der Unabhängigkeit kann durch ein Paar von Eigenvektoren beschrieben werden. Ähnlich wie in PCA oder kanonischer Korrelationsanalyse korrespondieren die Eigenwerte zur erklärten Varianz. Oft sind λ 1, λ 2 vorherrschend Anteil von χ 2, der durch γ 1, γ 2 und δ 1, δ 2 erklärt wird, ist groß. Ostap Okhrin 30 of 58

31 Definiere und beobachte r k = A 1/2 Cδ k s k = B 1/2 C γ k r k = 1 λk A 1/2 CB 1/2 s k s k = 1 λk B 1/2 C A 1/2 r k r k und s k werden Zeilen- bzw. Spaltenfaktor bezeichnet. Ostap Okhrin 31 of 58

32 Eigenschaften der Faktoren und r k = 1 x r k a = 0 s k = 1 x s k b = 0 Var(r k ) = λ k x = Var(s k ) λ k / i λ i ist der Anteil der Varianz, die durch Faktor k erklärt wird. C a (i, r k ) = x i r 2 ki /λ k ist der Beitrag von Zeile i zur Varianz von (Zeilen-)Faktor r k. Ostap Okhrin 32 of 58

33 Example In Belgien wurde eine Umfrage durchgeführt, um Menschen, die regelmäßig Zeitschriften lesen, zu erfassen. Die Antworten wurden bezüglich der Wohnregionen und der Sprache der Zeitschriften (Flämisch, Französisch oder beides) klassifiziert. Es gibt 10 Regionen: Antwerpen, Westflandern, Ostflandern, Hainant, Liège, Limburg, Luxemburg, Flämisch-Brabant, Wallon-Brabant, Brüssel. Die Sprache der Zeitschrift wird durch den ersten Buchstaben angegeben: v: Flämisch (Vlaams) f: Franzözisch (Francais) b: beide Insgesamt gibt es 15 Zeitschriften. Ostap Okhrin 33 of 58

34 λ j % Varianz kumuliert % Repräsentationen in zwei Dimensionen werden zufriedenstellend sein. (81 % der Varianz). Ostap Okhrin 34 of 58

35 C a (i, r 1 ) C a (i, r 2 ) C a (i, r 3 ) v a v b v c v d v e f f f g f h f Total Absoluter Beitrag des Zeilenfaktors r k Ostap Okhrin 35 of 58

36 C a (j, s 1 ) C a (j, s 2 ) C a (j, s 3 ) brw bxl anv brf foc for hai lig lim lux Total Absoluter Beitrag des Spaltenfaktors Ostap Okhrin 36 of 58

37 Example Die Tabelle zeigt beispielsweise die wichtige Rolle von Antwerpen und der Zeitschrift vb für die Bestimmung der Varianz beider Faktoren. Die erste Achse zeigt klar die Unterschiede zwischen den drei Teilen von Belgien, die zweite Achse zeigt eine höhere Dispersion zwischen den flämischen Regionen als in den französischsprachigen Regionen. Ostap Okhrin 37 of 58

38 Correspondence Analysis Journal Data 0.5 ve lim foc vc brf vd r 2, s 2 0 for va vm bj bl bk bxl ff fh hai fn fi brw fg lig fo lux -0.5 anv -1 vb r, s 1 1 Abbildung: Projektion der Zeilen (die 15 Zeitschriften) und der Spalten (die Regionen) Figure 14.1: Projection of rows (the 15 newspapers) and columns (the 10 regions) MVAcorrjourn C a (i, r 1 ) C a (i, r 2 ) C a (i, r 3 ) v a Ostap Okhrin 38 of 58

39 Example (Interpretation) Hohe Assoziation zwischen den Regionen und der Art der Zeitschrift. Insbesondere wird vb (Gazet of Antwerp) in Antwerpen gelesen (Extreme im Graph). Die Punkte auf der linken Seite gehören zu Flandern, während diejenigen auf der rechten Seite zur Wallonischen Region gehören. Es sei angemerkt, dass Wallon-Brabant und Flämisch-Brabant nicht weit von Brüssel entfernt sind. Brüssel ist zentral und eher durchschnittlich. Ostap Okhrin 39 of 58

40 Example Wende die Korrespondenz-Analyse auf französische Bachelordaten an. A: Philosophie, B: Ökonomie und soziale Wissenschaften, C: Mathematik und Physik, D: Mathematik und Naturwissenschaften, E: Mathematik und Technik, F: Industrietechnik, G: Ökonomietechnik, H: Computertechnik. Die Daten wurden in 22 Regionen (bezeichnet durch Codes aus 4 Buchstaben) erfasst. Es gibt Beobachtungen in einer 22 8 Kontingenztabelle. Die Analyse wurde zweimal (mit und ohne Korsika), da die Grafik andeutete, dass Korsika ein Ausreißer ist. Ostap Okhrin 40 of 58

41 Angewandte Multivariate Statistik lux Correspondence Analysis Dekomposition Total Table 14.3: Absolute contributions of column factors s k. Baccalaureat Data 0.5 cors r 2,s laro ildf B C pcha aqui A prov bnor payl midi D cham G frac pica cent auve bret rhoa limo hnor H nopc bour lorr E alsa F r 1,s 1 Abbildung: Korrespondenzanalyse mit Korsika Figure 14.2: Correspondence analysis including Corsica MVAcorrbac eigenvalues λ percentage of variances cumulated percentage Ostap Okhrin of 58

42 Correspondence Analysis Baccalaureat Data 0.1 alsaf nopc C 0.05 lorre bour H hnor limo rhoa bret ildf B r 2,s frac G auve cent pica cham D midi Aprov bnor payl laro aqui pcha r,s 1 1 Abbildung: Korrespondenzanalyse ohne Korsika Figure 14.3: Correspondence analysis excluding Corsica. MVAcorrbac eigenvalues λ percentage of variances cumulated percentage Ostap Okhrin of 58

43 Example Eigenwerte λ % Varianzen % kumulierte Varianz Eigenwerte mit Korsika. Ostap Okhrin 43 of 58

44 Example Eigenwerte λ % Varianzen % kumulierte Varianz Eigenwerte ohne Korsika. Ostap Okhrin 44 of 58

45 Example Region r 1 r 2 r 3 C a(i, r 1 ) C a(i, r 2 ) C a(i, r 3 ) ILDF CHAM PICA HNOR CENT BNOR BOUR NOPC LORR ALSA FRAC PAYL BRET PCHA AQUI MIDI LIMO RHOA AUVE LARO PROV Ostap Okhrin 45 of 58

46 Example s 1 s 2 s 3 C a (j, s 1 ) C a (j, s 2 ) C a (j, s 3 ) A B C D E F G H Ostap Okhrin 46 of 58

47 Example (Interpretation) Die Bachelors B auf der einen und F auf der anderen Seite sind hauptsächlich verantwortlich für die Variation auf der ersten Achse. Die zweite Achse charakterisiert einen Widerspruch zwischen Bachelors A und C. Bezüglich der Regionen spielt Ile de France eine wichtige Rolle für jede Achse. Auf der ersten Achse ist sie gegensinnig zu Lorraine und Alsace, während sie auf der zweiten Achse zu Poitou-Charentes und Aquitaine widersprüchlich ist. Rechts sind die klassischen Bachelors und links eher die technischorientierten. Die Regionen auf der linken Seite haben folglich größere Gewichte im Bereich der technischorientierten Bachelors. Ostap Okhrin 47 of 58

48 Example Bemerke weiterhin, dass der Großteil der südlichen Regionen von Frankreich im unteren Bereich der Grafik, in der Nähe zur Bachelor A, konzentriert sind. Schlussendlich wird die dritte Achse durch Bachelor D (negatives Vorzeichen) und ebenso, in einem geringeren Ausmaß, durch Bachelor E (negativ) (Im Gegensatz zu A (positiv)) dominiert. Die dominierenden Regionen sind HWOR (positiv) (im Gegensatz zu NPAC (negatives Vorzeichen)). Beispielsweise ist HWOR arm an Bachelorabschlüssen D. Ostap Okhrin 48 of 58

49 Example US-Kriminalitätsdaten: Für ein Jahr (1985) wurden die gemeldeten Kriminalitätsfälle in den 50 Bundesstaaten aufgezeichnet. 7 Kategorien wurden unterschieden: Mord, Vergewaltigung, Raub, Überfall, Einbruch, Diebstahl and Autodiebstahl. λ j % Varianz kumulierte % Varianz Ostap Okhrin 49 of 58

50 Table 14.8: Eigenvalues and explained proportion of variance, Example US Crime Data mur 0.4 MS NC ass AR AL r 2,s ND SD ID WY MT IA UT WI SCrap VW TN FL LA VT GA TXbur ME NMOK MI OR VA MD KS WA AZ KY MO lar CA NH CO DE NV NE IL PA AK INCT OH MN NJ HI NY rob -0.2 RI aut MA r,s 1 1 Abbildung: Projektion von Zeilen (50 Bundesstaaten) und Spalten (die 7 Figure 14.4: Projection of rows (the 50 states) and columns (the 7 crime categories). Kategorien) MVAcorrcrime Looking at the absolute contributions (not reproduced here, see Exercise 14.6), it appears that the first axis is robbery (+) versus larceny (-) and auto-theft (-) axis and that the second Ostap Okhrin 50 of 58

51 Example (Interpretation) Es scheint so, dass auf der ersten Achse Raub (+) den Diebstählen (-) und den Autodiebstähle (-) gegenübersteht. Der zweite Faktor vergleicht Überfälle (-) mit Autodiebstählen. Die dominierenden Regionen der ersten Achse sind die nordöstlichen Bundesstaaten MA (+) und NY (+), verglichen mit den westlichen Bundesstaaten WY (-) und ID (-). Auf der zweiten Achse besteht ein Widerspruch zwischen den nördlichen Bundesstaaten (MA (+) und RI (+)) zu den südlichen Bundesstaaten AL (-), MS (-) und AR (-). Ostap Okhrin 51 of 58

52 Example (Arten von Unternehmen) Erinnerung: Die Zeilen entsprechen den Finanz-, Energie, Hightech-Branchen und Spalten den Orte Frankfurt, Berlin und München Wir wollen die Zeilen- und Spaltenindizes, sodass s j n r i p j=1 s j x ij x i. i=1 r i x ij x j und Ostap Okhrin 52 of 58

53 Example Companies HiTech Munich Finance Frankfurt Berlin Energy Abbildung: Beispiele für die Arten von Unternehmen. Ostap Okhrin 53 of 58

54 Biplots Biplots ist eine niedrigdimensionale Darstellungsform für eine Datenmatrix X, wobei die Zeilen und Spalten durch Punkte repräsentiert werden. Beispiel (10 5) Datenmatrix X Finde 10 Zeilenpunkte q i R k, k < p, i = 1,..., 10 und 5 Spaltenpunkte t j R k, j = 1,..., 5, sodass die 50 Skalarprodukte zwischen den Zeilen- und Spaltenvektoren angenähert die 50 korrespondieren Elemente der Datenmatrix ergeben. x ij = q i + ε ij Was ist die Verbindung zwischen der Korrespondenzanalyse und Biplots? Ostap Okhrin 54 of 58

55 Wiederherstellungsformel Erinnerung: (3) und überprüfe x ij = E ij 1 + R k=1 λ 1 2 k γ ik δ jk xi x j x Daraus erhalten wir Unterschiede zwischen den Zeilenprofilen und durchschnittlichen Zeilenprofilen. ( xij x ) j = x i x R k=1 ( ) λ 1 2 x j k γ ik δ jk x i x Der entsprechende Ausdruck gilt ebenso für die Spaltenprofile. Ostap Okhrin 55 of 58

56 Falls λ 1 λ 2 λ 3... gilt, können die Summen durch K-Terme approximiert werden: ( xij x ) j = x i x ( xij x ) i = x j x K k=1 K k=1 ( x j λk x s kj ) r ki + ε ij ( x i λk x r ki ) s kj + ε ij. Dabei entsprechen ε ij und ε ij den Fehlertermen. Das zeigt die Unterschiede zwischen den Zeilenprofilen und den mittleren Profilen. Ostap Okhrin 56 of 58

57 Zusammenfassung: Korrespondenzanalyse Korrespondenzanalyse ist eine faktorielle Zerlegung von Kontigenztabellen. Die p-dimensionalen Individuen und die n-dimensionalen Variablen können durch deren Projektionen auf Räume mit geringerer Dimension grafisch repräsentiert werden. Die Korrespondenzanalyse liefert eine grafische Darstellung des Assoziationsmaßes c ij = (x ij E ij ) 2 /E ij. Ostap Okhrin 57 of 58

58 Zusammenfassung: Korrespondenzanalyse Die praktische Berechnung besteht aus einer spektralen Zerlegung von A 1 X B 1 X und B 1 X A 1 X, deren erste p Eigenvektoren identisch sind. Die grafische Darstellung ist der Plot von λ 1 r 1 vs. λ 2 r 2 und λ 1 s 1 vs. λ 2 s 2. Beide Plots können im selben Graph dargestellt werden, wobei die Orientierung der Eigenvektoren r i, s j berücksichtigt wird. Ostap Okhrin 58 of 58

Multinomiale logistische Regression

Multinomiale logistische Regression Multinomiale logistische Regression Die multinomiale logistische Regression dient zur Schätzung von Gruppenzugehörigkeiten bzw. einer entsprechenden Wahrscheinlichkeit hierfür, wobei als abhänginge Variable

Mehr

12. Vergleich mehrerer Stichproben

12. Vergleich mehrerer Stichproben 12. Vergleich mehrerer Stichproben Dr. Antje Kiesel Institut für Angewandte Mathematik WS 2011/2012 Häufig wollen wir verschiedene Populationen, Verfahren, usw. miteinander vergleichen. Beipiel: Vergleich

Mehr

9. Schätzen und Testen bei unbekannter Varianz

9. Schätzen und Testen bei unbekannter Varianz 9. Schätzen und Testen bei unbekannter Varianz Dr. Antje Kiesel Institut für Angewandte Mathematik WS 2011/2012 Schätzen und Testen bei unbekannter Varianz Wenn wir die Standardabweichung σ nicht kennen,

Mehr

klar. Um die zweite Bedingung zu zeigen, betrachte u i U i mit u i = 0. Das mittlere -Zeichen liefert s

klar. Um die zweite Bedingung zu zeigen, betrachte u i U i mit u i = 0. Das mittlere -Zeichen liefert s Nachtrag zur allgemeinen Vektorraum-Theorie. 1.5.15. Direkte Summen. Sei V ein Vektorraum, seien U 1,..., U t Unterräume, wir schreiben V = U 1 U 2 U t = t i=1 U i falls die folgenden beiden Bedingungen

Mehr

Analog zu Aufgabe 16.1 werden die Daten durch folgenden Befehl eingelesen: > kredit<-read.table("c:\\compaufg\\kredit.

Analog zu Aufgabe 16.1 werden die Daten durch folgenden Befehl eingelesen: > kredit<-read.table(c:\\compaufg\\kredit. Lösung 16.3 Analog zu Aufgabe 16.1 werden die Daten durch folgenden Befehl eingelesen: > kredit

Mehr

3.2 Bivariate Verteilungen

3.2 Bivariate Verteilungen 3.2 Bivariate Verteilungen zwei Variablen X, Y werden gemeinsam betrachtet (an jedem Objekt i, i = 1,..., n, werden gleichzeitig zwei Merkmale beobachtet) Beobachtungswerte sind Paare/Kombinationen von

Mehr

Statistische Verfahren für das Data Mining in einem Industrieprojekt

Statistische Verfahren für das Data Mining in einem Industrieprojekt Statistische Verfahren für das Data Mining in einem Industrieprojekt Thorsten Dickhaus Forschungszentrum Jülich GmbH Zentralinstitut für Angewandte Mathematik Telefon: 02461/61-4193 E-Mail: th.dickhaus@fz-juelich.de

Mehr

Tutorial: Homogenitätstest

Tutorial: Homogenitätstest Tutorial: Homogenitätstest Eine Bank möchte die Kreditwürdigkeit potenzieller Kreditnehmer abschätzen. Einerseits lebt die Bank ja von der Vergabe von Krediten, andererseits verursachen Problemkredite

Mehr

KAPITEL 4. Lineare Ausgleichsrechnung Beispiel 4.1. Das Ohmsche Gesetz: U = RI. Eine Meßreihe von Daten:

KAPITEL 4. Lineare Ausgleichsrechnung Beispiel 4.1. Das Ohmsche Gesetz: U = RI. Eine Meßreihe von Daten: KAPITEL 4 Lineare Ausgleichsrechnung Beispiel 41 Das Ohmsche Gesetz: Eine Meßreihe von Daten: U = RI (U i, I i ) (Spannung, Stromstärke), i = 1,, m Aufgabe: man bestimme aus diesen Meßdaten den Widerstand

Mehr

Kapitel 4: Binäre Regression

Kapitel 4: Binäre Regression Kapitel 4: Binäre Regression Steffen Unkel (basierend auf Folien von Nora Fenske) Statistik III für Nebenfachstudierende WS 2013/2014 4.1 Motivation Ausgangssituation Gegeben sind Daten (y i, x i1,...,

Mehr

Kontingenzkoeffizient (nach Pearson)

Kontingenzkoeffizient (nach Pearson) Assoziationsmaß für zwei nominale Merkmale misst die Unabhängigkeit zweier Merkmale gibt keine Richtung eines Zusammenhanges an 46 o jl beobachtete Häufigkeiten der Kombination von Merkmalsausprägungen

Mehr

Multivariate Verfahren

Multivariate Verfahren Multivariate Verfahren Lineare Reression Zweck: Vorhersae Dimensionsreduktion Klassifizierun Hauptkomponentenanalyse Korrespondenzanalyse Clusteranalyse Diskriminanzanalyse Eienschaften: nicht-linear verteilunsfrei

Mehr

Analyse bivariater Kontingenztafeln

Analyse bivariater Kontingenztafeln Analyse bivariater Kontingenztafeln Werden zwei kategoriale Merkmale mit nicht zu vielen möglichen Ausprägungen gemeinsam analysiert, so kommen zur Beschreibung der gemeinsamen Verteilung im allgemeinen

Mehr

Seminararbeit für das SE Reine Mathematik- Graphentheorie

Seminararbeit für das SE Reine Mathematik- Graphentheorie Seminararbeit für das SE Reine Mathematik- Graphentheorie Der binäre Rang, der symplektische Graph, die Spektralzerlegung und rationale Funktionen Vortrag am 24.01.2012 Heike Farkas 0410052 Inhaltsverzeichnis

Mehr

Beispiel 48. 4.3.2 Zusammengesetzte Zufallsvariablen

Beispiel 48. 4.3.2 Zusammengesetzte Zufallsvariablen 4.3.2 Zusammengesetzte Zufallsvariablen Beispiel 48 Ein Würfel werde zweimal geworfen. X bzw. Y bezeichne die Augenzahl im ersten bzw. zweiten Wurf. Sei Z := X + Y die Summe der gewürfelten Augenzahlen.

Mehr

Stochastische Analysis. Zufallsmatrizen. Roland Speicher Queen s University Kingston, Kanada

Stochastische Analysis. Zufallsmatrizen. Roland Speicher Queen s University Kingston, Kanada Stochastische Analysis für Zufallsmatrizen Roland Speicher Queen s University Kingston, Kanada Was ist eine Zufallsmatrix? Zufallsmatrix = Matrix mit zufälligen Einträgen A : Ω M N (C) Was ist eine Zufallsmatrix?

Mehr

Einführung in die Vektor- und Matrizenrechnung. Matrizen

Einführung in die Vektor- und Matrizenrechnung. Matrizen Einführung in die Vektor- und Matrizenrechnung Matrizen Definition einer Matrix Unter einer (reellen) m x n Matrix A versteht man ein rechteckiges Schema aus reellen Zahlen, die wie folgt angeordnet sind:

Mehr

Log-lineare Analyse I

Log-lineare Analyse I 1 Log-lineare Analyse I Einleitung Die log-lineare Analysemethode wurde von L.A. Goodman in den 60er und 70er Jahren entwickelt. Sie dient zur Analyse von Zusammenhängen in mehrdimensionalen Kontingenztafeln

Mehr

3.3 Eigenwerte und Eigenräume, Diagonalisierung

3.3 Eigenwerte und Eigenräume, Diagonalisierung 3.3 Eigenwerte und Eigenräume, Diagonalisierung Definition und Lemma 3.3.1. Sei V ein K-Vektorraum, φ End K (V ), λ K. Wir defnieren den zu λ gehörigen Eigenraum von φ als Dies ist ein Unterraum von V.

Mehr

Grundlagen der Inferenzstatistik: Was Ihnen nicht erspart bleibt!

Grundlagen der Inferenzstatistik: Was Ihnen nicht erspart bleibt! Grundlagen der Inferenzstatistik: Was Ihnen nicht erspart bleibt! 1 Einführung 2 Wahrscheinlichkeiten kurz gefasst 3 Zufallsvariablen und Verteilungen 4 Theoretische Verteilungen (Wahrscheinlichkeitsfunktion)

Mehr

Abhängigkeit zweier Merkmale

Abhängigkeit zweier Merkmale Abhängigkeit zweier Merkmale Johannes Hain Lehrstuhl für Mathematik VIII Statistik 1/33 Allgemeine Situation Neben der Untersuchung auf Unterschiede zwischen zwei oder mehreren Untersuchungsgruppen hinsichtlich

Mehr

4. Relationen. Beschreibung einer binären Relation

4. Relationen. Beschreibung einer binären Relation 4. Relationen Relationen spielen bei Datenbanken eine wichtige Rolle. Die meisten Datenbanksysteme sind relational. 4.1 Binäre Relationen Eine binäre Relation (Beziehung) R zwischen zwei Mengen A und B

Mehr

Risikomessung und Value at Risk Wintersemester 2013/14

Risikomessung und Value at Risk Wintersemester 2013/14 Risikomessung und Value at Risk Wintersemester 2013/14 Walter Sanddorf-Köhle Statistik und Ökonometrie Foliensatz Nr. 11 Version vom 24. Januar 2014 1 / 45 6.5.1 Bisherige Vorgehensweise zur Berechnung

Mehr

Kapitel 3. Zufallsvariable. Wahrscheinlichkeitsfunktion, Dichte und Verteilungsfunktion. Erwartungswert, Varianz und Standardabweichung

Kapitel 3. Zufallsvariable. Wahrscheinlichkeitsfunktion, Dichte und Verteilungsfunktion. Erwartungswert, Varianz und Standardabweichung Kapitel 3 Zufallsvariable Josef Leydold c 2006 Mathematische Methoden III Zufallsvariable 1 / 43 Lernziele Diskrete und stetige Zufallsvariable Wahrscheinlichkeitsfunktion, Dichte und Verteilungsfunktion

Mehr

16. All Pairs Shortest Path (ASPS)

16. All Pairs Shortest Path (ASPS) . All Pairs Shortest Path (ASPS) All Pairs Shortest Path (APSP): Eingabe: Gewichteter Graph G=(V,E) Ausgabe: Für jedes Paar von Knoten u,v V die Distanz von u nach v sowie einen kürzesten Weg a b c d e

Mehr

Elemente der Analysis II

Elemente der Analysis II Elemente der Analysis II Kapitel 3: Lineare Abbildungen und Gleichungssysteme Informationen zur Vorlesung: http://www.mathematik.uni-trier.de/ wengenroth/ J. Wengenroth () 15. Mai 2009 1 / 35 3.1 Beispiel

Mehr

Statistik und Wahrscheinlichkeitsrechnung

Statistik und Wahrscheinlichkeitsrechnung Statistik und Wahrscheinlichkeitsrechnung Übung 2 28.02.2008 1 Inhalt der heutigen Übung Beschreibende Statistik Gemeinsames Lösen der Übungsaufgaben 2.1: Häufigkeitsverteilung 2.2: Tukey Boxplot 25:Korrelation

Mehr

Varianzanalyse * (1) Varianzanalyse (2)

Varianzanalyse * (1) Varianzanalyse (2) Varianzanalyse * (1) Einfaktorielle Varianzanalyse (I) Die Varianzanalyse (ANOVA = ANalysis Of VAriance) wird benutzt, um Unterschiede zwischen Mittelwerten von drei oder mehr Stichproben auf Signifikanz

Mehr

1,11 1,12 1,13 1,14 1,15 1,16 1,17 1,17 1,17 1,18

1,11 1,12 1,13 1,14 1,15 1,16 1,17 1,17 1,17 1,18 3. Deskriptive Statistik Ziel der deskriptiven (beschreibenden) Statistik (explorativen Datenanalyse) ist die übersichtliche Darstellung der wesentlichen in den erhobenen Daten enthaltene Informationen

Mehr

Messgeräte: Mess-System-Analyse und Messmittelfähigkeit

Messgeräte: Mess-System-Analyse und Messmittelfähigkeit Messgeräte: Mess-System-Analyse und Messmittelfähigkeit Andreas Berlin 14. Juli 2009 Bachelor-Seminar: Messen und Statistik Inhalt: 1 Aspekte einer Messung 2 Mess-System-Analyse 2.1 ANOVA-Methode 2.2 Maße

Mehr

Diskriminanzanalyse Beispiel

Diskriminanzanalyse Beispiel Diskriminanzanalyse Ziel bei der Diskriminanzanalyse ist die Analyse von Gruppenunterschieden, d. h. der Untersuchung von zwei oder mehr Gruppen hinsichtlich einer Vielzahl von Variablen. Diese Methode

Mehr

1.5 Folgerungen aus dem Kolmogoroff- Axiomensystem P( ) = 0.

1.5 Folgerungen aus dem Kolmogoroff- Axiomensystem P( ) = 0. 1.5 Folgerungen aus dem Kolmogoroff- Axiomensystem Folg. 2 Sei (Ω, E, P) W.-raum. Seien A, B,A 1,...,A n Ereignisse. Es gelten die folgenden Aussagen: 1. P(A) = 1 P(A). 2. Für das unmögliche Ereignis gilt:

Mehr

Bachelorabschlussseminar Dipl.-Kfm. Daniel Cracau

Bachelorabschlussseminar Dipl.-Kfm. Daniel Cracau 1 Einführung in die statistische Datenanalyse Bachelorabschlussseminar Dipl.-Kfm. Daniel Cracau 2 Gliederung 1.Grundlagen 2.Nicht-parametrische Tests a. Mann-Whitney-Wilcoxon-U Test b. Wilcoxon-Signed-Rank

Mehr

8. Methoden der klassischen multivariaten Statistik

8. Methoden der klassischen multivariaten Statistik 8. Methoden der klassischen multivariaten Statistik 8.1. Darstellung von Daten Voraussetzungen auch in diesem Kapitel: Grundgesamtheit (Datenraum) Ω von Objekten (Fällen, Instanzen), denen J-Tupel von

Mehr

Anhang A: Fragebögen und sonstige Unterlagen

Anhang A: Fragebögen und sonstige Unterlagen Anhang Anhang A: Fragebögen und sonstige Unterlagen A.: Flyer zur Probandenrekrutierung 46 A.: Fragebogen zur Meditationserfahrung 47 48 A.3: Fragebogen Angaben zur Person 49 5 5 A.4: Termin- und Einladungsschreiben

Mehr

Auswertung und Darstellung wissenschaftlicher Daten (1)

Auswertung und Darstellung wissenschaftlicher Daten (1) Auswertung und Darstellung wissenschaftlicher Daten () Mag. Dr. Andrea Payrhuber Zwei Schritte der Auswertung. Deskriptive Darstellung aller Daten 2. analytische Darstellung (Gruppenvergleiche) SPSS-Andrea

Mehr

Internationale Erfahrungen der aktiven. Einbindung der Nachfrage. Input für die deutsche Diskussion. Berliner Energietage 2013

Internationale Erfahrungen der aktiven. Einbindung der Nachfrage. Input für die deutsche Diskussion. Berliner Energietage 2013 Internationale Erfahrungen der aktiven Einbindung der Nachfrage Input für die deutsche Diskussion Berliner Energietage 2013 Meg Gottstein /Andreas Jahn 15. Mai 2013 The Regulatory Assistance Project Rosenstrasse

Mehr

Willkommen zur Vorlesung Statistik

Willkommen zur Vorlesung Statistik Willkommen zur Vorlesung Statistik Thema dieser Vorlesung: Varianzanalyse Prof. Dr. Wolfgang Ludwig-Mayerhofer Universität Siegen Philosophische Fakultät, Seminar für Sozialwissenschaften Prof. Dr. Wolfgang

Mehr

Grundlagen von Versuchsmethodik und Datenanalyse

Grundlagen von Versuchsmethodik und Datenanalyse Grundlagen von Versuchsmethodik und Datenanalyse Der Anfang: Hypothesen über Ursache-Wirkungs-Zusammenhänge Ursache Wirkung Koffein verbessert Kurzzeitgedächtnis Gewaltfilme führen zu aggressivem Verhalten

Mehr

Übungen zur Ingenieur-Mathematik III WS 2009/10 Blatt 10 21.12.2009

Übungen zur Ingenieur-Mathematik III WS 2009/10 Blatt 10 21.12.2009 Übungen zur Ingenieur-Mathematik III WS 2009/10 Blatt 10 21.12.2009 Aufgabe 35: Thema: Singulärwertzerlegung und assoziierte Unterräume Sei A eine m n Matrix mit Rang r und A = UDV T ihre Singulärwertzerlegung.

Mehr

Statistische Maßzahlen. Statistik Vorlesung, 10. März, 2010. Beispiel. Der Median. Beispiel. Der Median für klassifizierte Werte.

Statistische Maßzahlen. Statistik Vorlesung, 10. März, 2010. Beispiel. Der Median. Beispiel. Der Median für klassifizierte Werte. Statistik Vorlesug,. ärz, Statistische aßzahle Iformatio zu verdichte, Besoderheite hervorzuhebe ittelwerte Aufgabe: die Lage der Verteilug auf der Abszisse zu zeige. Der odus: derjeige Wert, der im Häufigste

Mehr

6. METRISCHE UND KATEGORIALE MERKMALE

6. METRISCHE UND KATEGORIALE MERKMALE 6. METRISCHE UND KATEGORIALE MERKMALE wenn an einer Beobachtungseinheit eine (oder mehrere) metrische und eine (oder mehrere) kategoriale Variable(n) erhoben wurden Beispiel: Haushaltsarbeit von Teenagern

Mehr

Kommentierter SPSS-Ausdruck zur logistischen Regression

Kommentierter SPSS-Ausdruck zur logistischen Regression Daten: POK V AG 3 (POKV_AG3_V07.SAV) Kommentierter SPSS-Ausdruck zur logistischen Regression Fragestellung: Welchen Einfluss hat die Fachnähe und das Geschlecht auf die interpersonale Attraktion einer

Mehr

Projektive Moduln. Lemma/Definition 1.1. Folgende Aussagen für einen R-Modul P sind äquivalent: (i) P erfüllt folgende Liftungseigenschaft:

Projektive Moduln. Lemma/Definition 1.1. Folgende Aussagen für einen R-Modul P sind äquivalent: (i) P erfüllt folgende Liftungseigenschaft: Seminar Summen von Quadraten und K-Theorie Projektive Moduln Im Folgenden sei R ein assoziativer Ring mit Eins, nicht notwendigerweise kommutativ. R-Modul ist im Folgenden stets ein Rechts-R-Modul. Ein

Mehr

Schätzer (vgl. Kapitel 1): Stichprobenmittel X N. Stichprobenmedian X N

Schätzer (vgl. Kapitel 1): Stichprobenmittel X N. Stichprobenmedian X N Prof. Dr. J. Franke Statistik II für Wirtschaftswissenschaftler 8.1 Schätzer für Lage- und Skalenparameter und Verteilungsmodellwahl Lageparameter (l(x + a) = l(x) + a): Erwartungswert EX Median von X

Mehr

2. Korrelation, lineare Regression und multiple Regression

2. Korrelation, lineare Regression und multiple Regression multiple 2.2 Lineare 2.2 Lineare 1 / 130 2.2 Lineare 2 / 130 2.1 Beispiel: Arbeitsmotivation Untersuchung zur Motivation am Arbeitsplatz in einem Chemie-Konzern 25 Personen werden durch Arbeitsplatz zufällig

Mehr

Multivariate Statistik

Multivariate Statistik Hermann Singer Multivariate Statistik 1 Auflage 15 Oktober 2012 Seite: 12 KAPITEL 1 FALLSTUDIEN Abbildung 12: Logistische Regression: Geschätzte Wahrscheinlichkeit für schlechte und gute Kredite (rot/blau)

Mehr

Verteilungsanalyse. Johannes Hain. Lehrstuhl für Mathematik VIII Statistik 1/31

Verteilungsanalyse. Johannes Hain. Lehrstuhl für Mathematik VIII Statistik 1/31 Verteilungsanalyse Johannes Hain Lehrstuhl für Mathematik VIII Statistik 1/31 Datentypen Als Sammeln von Daten bezeichnet man in der Statistik das Aufzeichnen von Fakten. Erhobene Daten klassifziert man

Mehr

Einführung in MATLAB

Einführung in MATLAB Kapitel 4 Einführung in MATLAB 41 Allgemeines MATLAB ist eine kommerzielle mathematische Software zur Lösung mathematischer Probleme und zur graphischen Darstellung der Ergebnisse Die Verfahren in MATLAB

Mehr

25. Januar 2010. Ruhr-Universität Bochum. Methodenlehre III, WS 2009/2010. Prof. Dr. Holger Dette. 4. Multivariate Mittelwertvergleiche

25. Januar 2010. Ruhr-Universität Bochum. Methodenlehre III, WS 2009/2010. Prof. Dr. Holger Dette. 4. Multivariate Mittelwertvergleiche Ruhr-Universität Bochum 25. Januar 2010 1 / 75 2 / 75 4.1 Beispiel: Vergleich von verschiedenen Unterrichtsmethoden Zwei Zufallsstichproben (A und B) mit je 10 Schülern und 8 Schülern Gruppe A wird nach

Mehr

Multivariate Analyse: FS 2012. Ergänzungen zur Mitschrift der Vorlesung über Multivariate Datenanalyse von Prof. A. Barbour

Multivariate Analyse: FS 2012. Ergänzungen zur Mitschrift der Vorlesung über Multivariate Datenanalyse von Prof. A. Barbour Multivariate Analyse: FS 2012 Ergänzungen zur Mitschrift der Vorlesung über Multivariate Datenanalyse von Prof. A. Barbour by PD Dr. Daniel Mandallaz Chair of Land Use Engineering Department of Environmental

Mehr

OPERATIONS-RESEARCH (OR)

OPERATIONS-RESEARCH (OR) OPERATIONS-RESEARCH (OR) Man versteht darunter die Anwendung mathematischer Methoden und Modelle zur Vorbereitung optimaler Entscheidungen bei einem Unternehmen. Andere deutsche und englische Bezeichnungen:

Mehr

Beispiel: Sonntagsfrage. Einführung in die induktive Statistik. Statistische Tests. Statistische Tests

Beispiel: Sonntagsfrage. Einführung in die induktive Statistik. Statistische Tests. Statistische Tests Beispiel: Sonntagsfrage Vier Wochen vor der österreichischen Nationalratswahl 1999 wurde 499 Haushalten die Sonntagsfrage gestellt: Falls nächsten Sonntag Wahlen wären, welche Partei würden Sie wählen?

Mehr

Bisher angenommen: jeder Spieler kennt alle Teile des Spiels. - Diskontfaktor des Verhandlungspartners

Bisher angenommen: jeder Spieler kennt alle Teile des Spiels. - Diskontfaktor des Verhandlungspartners 1 KAP 15. Spiele unter unvollständiger Information Bisher angenommen: jeder Spieler kennt alle Teile des Spiels seine Gegenspieler, deren Aktionen, deren Nutzen, seinen eigenen Nutzen etc. Oft kennt man

Mehr

Untersuchungen zum Thema Tracking Error

Untersuchungen zum Thema Tracking Error Untersuchungen zum Thema Tracking Error J. Fulmek 24. August 2003 1 Einleitung Im Folgenden werden folgende Punkte untersucht: 1. verschiedene in der Literatur übliche Definitionen des Tracking Errors

Mehr

5.3 Sampling-Algorithmen

5.3 Sampling-Algorithmen 5.3 Sampling-Algorithmen Vorgehensweise in der Statistik: Gesamtheit von Werten durch kleine, möglichst repräsentative Stichprobe darstellen. (Vgl. z. B. Hochrechnungen für Wahlergebnisse.) Genauer: Gegeben

Mehr

IBM SPSS Categories 22

IBM SPSS Categories 22 IBM SPSS Categories 22 Hinweis Vor Verwendung dieser Informationen und des darin beschriebenen Produkts sollten die Informationen unter Bemerkungen auf Seite 57 gelesen werden. Produktinformation Diese

Mehr

Absolute Stetigkeit von Maßen

Absolute Stetigkeit von Maßen Absolute Stetigkeit von Maßen Definition. Seien µ und ν Maße auf (X, Ω). Dann heißt ν absolut stetig bezüglich µ (kurz ν µ ), wenn für alle A Ω mit µ(a) = 0 auch gilt dass ν(a) = 0. Lemma. Sei ν ein endliches

Mehr

Commercial Banking Übung 1 Kreditscoring

Commercial Banking Übung 1 Kreditscoring Commercial Banking Übung Kreditscoring Dr. Peter Raupach raupach@wiwi.uni-frankfurt.de Sprechzeit Dienstag 6-7:00 Uhr Raum 603 B Kreditscoring Gliederung Grundanliegen Das Sample Modellspezifikation Diskriminanzanalyse

Mehr

Institut für Soziologie. Methoden 2. Regressionsanalyse I: Einfache lineare Regression

Institut für Soziologie. Methoden 2. Regressionsanalyse I: Einfache lineare Regression Institut für Soziologie Methoden 2 Regressionsanalyse I: Einfache lineare Regression Programm Anwendungsbereich Vorgehensweise Interpretation Annahmen Zusammenfassung Übungsaufgabe Literatur # 2 Anwendungsbereich

Mehr

Data Mining und Statistik: Gemeinsamkeiten und Unterschiede

Data Mining und Statistik: Gemeinsamkeiten und Unterschiede Universität Ulm Seminararbeit zum Thema Data Mining und Statistik: Gemeinsamkeiten und Unterschiede vorgelegt von: Daniel Meschenmoser betreut von: Dr. Tomas Hrycej Dr. Matthias Grabert Ulm, im Februar

Mehr

Methoden Quantitative Datenanalyse

Methoden Quantitative Datenanalyse Leitfaden Universität Zürich ISEK - Andreasstrasse 15 CH-8050 Zürich Telefon +41 44 635 22 11 Telefax +41 44 635 22 19 www.isek.uzh.ch 11. September 2014 Methoden Quantitative Datenanalyse Vorbereitung

Mehr

(λ Ri I A+BR)v Ri = 0. Lässt sich umstellen zu

(λ Ri I A+BR)v Ri = 0. Lässt sich umstellen zu Herleitung der oppenecker-formel (Wiederholung) Für ein System ẋ Ax + Bu (B habe Höchstrang) wird eine Zustandsregelung u x angesetzt. Der geschlossene egelkreis gehorcht der Zustands-Dgl. ẋ (A B)x. Die

Mehr

PageRank-Algorithmus

PageRank-Algorithmus Proseminar Algorithms and Data Structures Gliederung Gliederung 1 Einführung 2 PageRank 3 Eziente Berechnung 4 Zusammenfassung Motivation Motivation Wir wollen eine Suchmaschine bauen, die das Web durchsucht.

Mehr

Lineare Algebra - alles was man wissen muß

Lineare Algebra - alles was man wissen muß Statistik für Bioinformatiker SoSe 3 Rainer Spang Lineare Algebra - alles was man wissen muß Der Titel ist natürlich gelogen, aber was wir hier zusammengetragen haben ist zumindest ein Anfang. Weniger

Mehr

Wirtschaftswissenschaften - MBA-Programme in den USA

Wirtschaftswissenschaften - MBA-Programme in den USA Universität / Schule Arizona State University, W. P. Carey School of Business, Tempe, AZ E-mail: wpcareymba@asu.edu Babson College, F.W. Olin Graduate School of Business, Wellesley, MA E-mail: mbaadmission@babson.edu

Mehr

Approximationsalgorithmen: Klassiker I. Kombinatorische Optimierung Absolute Gütegarantie Graph-Coloring Clique Relative Gütegarantie Scheduling

Approximationsalgorithmen: Klassiker I. Kombinatorische Optimierung Absolute Gütegarantie Graph-Coloring Clique Relative Gütegarantie Scheduling Approximationsalgorithmen: Klassiker I Kombinatorische Optimierung Absolute Gütegarantie Graph-Coloring Clique Relative Gütegarantie Scheduling VO Approximationsalgorithmen WiSe 2011/12 Markus Chimani

Mehr

CORNELIUS DÄMMRICH AUSBILDUNG / KÖNNEN 01 / 09 ICH BIN 24 JAHRE ALT UND LEBE IN KÖLN.NACH ABSOLVIERTE ICH 2012 EIN BACHELORSTUDIUM UNFOLD 3D

CORNELIUS DÄMMRICH AUSBILDUNG / KÖNNEN 01 / 09 ICH BIN 24 JAHRE ALT UND LEBE IN KÖLN.NACH ABSOLVIERTE ICH 2012 EIN BACHELORSTUDIUM UNFOLD 3D 01 / 09 CORNELIUS DÄMMRICH AUSBILDUNG / KÖNNEN ICH BIN 24 JAHRE ALT UND LEBE IN KÖLN.NACH S O F T WA R E MEINER P H O T O S H O P, I N D E S I G N, A F T E R E F F E C T S, P R E M I E R E AUSBILDUNG ZUM

Mehr

Austausch- bzw. Übergangsprozesse und Gleichgewichtsverteilungen

Austausch- bzw. Übergangsprozesse und Gleichgewichtsverteilungen Austausch- bzw. Übergangsrozesse und Gleichgewichtsverteilungen Wir betrachten ein System mit verschiedenen Zuständen, zwischen denen ein Austausch stattfinden kann. Etwa soziale Schichten in einer Gesellschaft:

Mehr

Statistische Analyse von Ereigniszeiten

Statistische Analyse von Ereigniszeiten Statistische Analyse von Survival Analysis VO Biostatistik im WS 2006/2007 1 2 3 : Leukemiedaten (unzensiert) 33 Patienten mit Leukemie; Zielvariable Überlebenszeit. Alle Patienten verstorben und Überlebenszeit

Mehr

5. Verschiedene Repräsentanten

5. Verschiedene Repräsentanten 5. Verschiedene Repräsentanten 5.1. Die Sätze Hall und König Sei I := {1,...,n}, und sei A(I) = (A 1,...,A n ) eine Familie von Teilmengen einer endlichen Menge E. Zu K I seien A(K) := (A i : i K) und

Mehr

$ % + 0 sonst. " p für X =1 $

$ % + 0 sonst.  p für X =1 $ 31 617 Spezielle Verteilungen 6171 Bernoulli Verteilung Wir beschreiben zunächst drei diskrete Verteilungen und beginnen mit einem Zufallsexperiment, indem wir uns für das Eintreffen eines bestimmten Ereignisses

Mehr

Übungsserie Nr. 10 mit Lösungen

Übungsserie Nr. 10 mit Lösungen Übungsserie Nr. 10 mit Lösungen 1 Ein Untersuchungsdesign sieht einen multivariaten Vergleich einer Stichprobe von Frauen mit einer Stichprobe von Männern hinsichtlich der Merkmale X1, X2 und X3 vor (Codierung:

Mehr

Statistik im Bachelor-Studium der BWL und VWL

Statistik im Bachelor-Studium der BWL und VWL Max C. Wewel Statistik im Bachelor-Studium der BWL und VWL Methoden, Anwendung, Interpretation Mit herausnehmbarer Formelsammlung ein Imprint von Pearson Education München Boston San Francisco Harlow,

Mehr

Umsetzung von DEA in Excel

Umsetzung von DEA in Excel Umsetzung von DEA in Excel Thorsten Poddig Armin Varmaz 30. November 2005 1 Vorbemerkungen In diesem Dokument, das als Begleitmaterial zum in der Zeitschrift,,Controlling, Heft 10, 2005 veröffentlichten

Mehr

Computer Vision: 3D-Geometrie. D. Schlesinger () Computer Vision: 3D-Geometrie 1 / 17

Computer Vision: 3D-Geometrie. D. Schlesinger () Computer Vision: 3D-Geometrie 1 / 17 Computer Vision: 3D-Geometrie D. Schlesinger () Computer Vision: 3D-Geometrie 1 / 17 Lochkamera Modell C Projektionszentrum, Optische Achse, Bildebene, P Hauptpunkt (optische Achse kreuzt die Bildebene),

Mehr

Webergänzung zu Kapitel 10

Webergänzung zu Kapitel 10 Webergänzung zu Kapitel 10 10.1.4 Varianzanalyse (ANOVA: analysis of variance) Im Kapitel 10 haben wir uns hauptsächlich mit Forschungsbeispielen beschäftigt, die nur zwei Ergebnissätze hatten (entweder

Mehr

Einfache Statistiken in Excel

Einfache Statistiken in Excel Einfache Statistiken in Excel Dipl.-Volkswirtin Anna Miller Bergische Universität Wuppertal Schumpeter School of Business and Economics Lehrstuhl für Internationale Wirtschaft und Regionalökonomik Raum

Mehr

1 Das Lemma von Burnside und seine Anwendungen

1 Das Lemma von Burnside und seine Anwendungen Das Lemma von Burnside und seine Anwendungen Mit dem Lemma von Burnside lassen sich Zählprobleme lösen, bei denen Symmetrien eine Rolle spielen. Betrachten wir als einführendes Beispiel die Anzahl der

Mehr

Codierungstheorie Rudolf Scharlau, SoSe 2006 9

Codierungstheorie Rudolf Scharlau, SoSe 2006 9 Codierungstheorie Rudolf Scharlau, SoSe 2006 9 2 Optimale Codes Optimalität bezieht sich auf eine gegebene Quelle, d.h. eine Wahrscheinlichkeitsverteilung auf den Symbolen s 1,..., s q des Quellalphabets

Mehr

Also kann nur A ist roter Südler und B ist grüner Nordler gelten.

Also kann nur A ist roter Südler und B ist grüner Nordler gelten. Aufgabe 1.1: (4 Punkte) Der Planet Og wird von zwei verschiedenen Rassen bewohnt - dem grünen und dem roten Volk. Desweiteren sind die Leute, die auf der nördlichen Halbkugel geboren wurden von denen auf

Mehr

Multivariate Verfahren

Multivariate Verfahren Selbstkontrollarbeit 2 Multivariate Verfahren Musterlösung Aufgabe 1 (28 Punkte) Der Marketing-Leiter einer Lebensmittelherstellers möchte herausfinden, mit welchem Richtpreis eine neue Joghurt-Marke auf

Mehr

6 Symmetrische Matrizen und quadratische Formen

6 Symmetrische Matrizen und quadratische Formen Mathematik für Ingenieure II, SS 9 Freitag. $Id: quadrat.tex,v.5 9//5 ::59 hk Exp $ $Id: orthogonal.tex,v.4 9// ::54 hk Exp $ $Id: fourier.tex,v. 9// :: hk Exp $ Symmetrische Matrizen und quadratische

Mehr

Molekularfeldtheorie (MFT)

Molekularfeldtheorie (MFT) 29.06.2006 Motivation Anwendungen der MFT MFT-Herleitung mittels Variationsansatz und Anwendung Grenzen der Anwendung der MFT Motivation Meisten Probleme nur unter Berücksichtigung von Wechselwirkungen

Mehr

Java Einführung Operatoren Kapitel 2 und 3

Java Einführung Operatoren Kapitel 2 und 3 Java Einführung Operatoren Kapitel 2 und 3 Inhalt dieser Einheit Operatoren (unär, binär, ternär) Rangfolge der Operatoren Zuweisungsoperatoren Vergleichsoperatoren Logische Operatoren 2 Operatoren Abhängig

Mehr

Varianzanalyse ANOVA

Varianzanalyse ANOVA Varianzanalyse ANOVA Johannes Hain Lehrstuhl für Mathematik VIII Statistik 1/23 Einfaktorielle Varianzanalyse (ANOVA) Bisher war man lediglich in der Lage, mit dem t-test einen Mittelwertsvergleich für

Mehr

Biostatistik, Winter 2011/12

Biostatistik, Winter 2011/12 Biostatistik, Winter 2011/12 Vergleich zweier Stichproben, nichtparametrische Tests Prof. Dr. Achim Klenke http://www.aklenke.de 11. Vorlesung: 27.01.2012 1/86 Inhalt 1 Tests t-test 2 Vergleich zweier

Mehr

Non-Deterministische CFD Simulationen in FINE /Turbo

Non-Deterministische CFD Simulationen in FINE /Turbo Non-Deterministische CFD Simulationen in FINE /Turbo Dipl.-Ing. (FH) Peter Thiel Dr.-Ing. Thomas Hildebrandt NUMECA Ingenieurbüro NUMECA, a New Wave in Fluid Dynamics Überblick 1. Motivation: Warum non-deterministische

Mehr

194 Beweis eines Satzes von Tschebyschef. Von P. E RDŐS in Budapest. Für den zuerst von T SCHEBYSCHEF bewiesenen Satz, laut dessen es zwischen einer natürlichen Zahl und ihrer zweifachen stets wenigstens

Mehr

Einführung in die Java- Programmierung

Einführung in die Java- Programmierung Einführung in die Java- Programmierung Dr. Volker Riediger Tassilo Horn riediger horn@uni-koblenz.de WiSe 2012/13 1 Wichtig... Mittags Pommes... Praktikum A 230 C 207 (Madeleine) F 112 F 113 (Kevin) E

Mehr

Grundlagen quantitativer Sozialforschung Interferenzstatistische Datenanalyse in MS Excel

Grundlagen quantitativer Sozialforschung Interferenzstatistische Datenanalyse in MS Excel Grundlagen quantitativer Sozialforschung Interferenzstatistische Datenanalyse in MS Excel 16.11.01 MP1 - Grundlagen quantitativer Sozialforschung - (4) Datenanalyse 1 Gliederung Datenanalyse (inferenzstatistisch)

Mehr

Häufigkeitstabellen. Balken- oder Kreisdiagramme. kritischer Wert für χ2-test. Kontingenztafeln

Häufigkeitstabellen. Balken- oder Kreisdiagramme. kritischer Wert für χ2-test. Kontingenztafeln Häufigkeitstabellen Menüpunkt Data PivotTable Report (bzw. entsprechendes Icon): wähle Data Range (Zellen, die die Daten enthalten + Zelle mit Variablenname) wähle kategoriale Variable für Spalten- oder

Mehr

Kategoriale abhängige Variablen: Logit- und Probit -Modelle. Statistik II

Kategoriale abhängige Variablen: Logit- und Probit -Modelle. Statistik II Kategoriale abhängige Variablen: Logit- und Probit -Modelle Statistik II Wiederholung Literatur Annahmen und Annahmeverletzungen Funktionen Exponenten, Wurzeln usw. Das Problem Das binäre Logit-Modell

Mehr

Inhaltsverzeichnis. Fragestellungen und Methoden 11. Vorwort 15. Kapitel 1 Einführung 17. Kapitel 2 Statistische Grundbegriffe 23

Inhaltsverzeichnis. Fragestellungen und Methoden 11. Vorwort 15. Kapitel 1 Einführung 17. Kapitel 2 Statistische Grundbegriffe 23 Fragestellungen und Methoden 11 Vorwort 15 Kapitel 1 Einführung 17 1.1 KonzeptiondesBuchs... 18 1.2 AufbaudesBuchs... 19 1.3 Programmversionen von PASW bzw. SPSS..... 20 1.4 WiekanndiesesBuchverwendetwerden?...

Mehr

Auswertung mit dem Statistikprogramm SPSS: 30.11.05

Auswertung mit dem Statistikprogramm SPSS: 30.11.05 Auswertung mit dem Statistikprogramm SPSS: 30.11.05 Seite 1 Einführung SPSS Was ist eine Fragestellung? Beispiel Welche statistische Prozedur gehört zu welcher Hypothese? Statistische Berechnungen mit

Mehr

14.01.14 DAS THEMA: INFERENZSTATISTIK II. Standardfehler Konfidenzintervalle Signifikanztests. Standardfehler

14.01.14 DAS THEMA: INFERENZSTATISTIK II. Standardfehler Konfidenzintervalle Signifikanztests. Standardfehler DAS THEMA: INFERENZSTATISTIK II INFERENZSTATISTISCHE AUSSAGEN Standardfehler Konfidenzintervalle Signifikanztests Standardfehler der Standardfehler Interpretation Verwendung 1 ZUR WIEDERHOLUNG... Ausgangspunkt:

Mehr

Verteilungsanalyse. Johannes Hain. Lehrstuhl für Mathematik VIII Statistik 1/35

Verteilungsanalyse. Johannes Hain. Lehrstuhl für Mathematik VIII Statistik 1/35 Verteilungsanalyse Johannes Hain Lehrstuhl für Mathematik VIII Statistik 1/35 Datentypen Als Sammeln von Daten bezeichnet man in der Statistik das Aufzeichnen von Fakten. Erhobene Daten klassifziert man

Mehr

Fortsetzung zu Binswanger2 Überlegungen zu Geld, Kredit und Wirtschaftswachstum

Fortsetzung zu Binswanger2 Überlegungen zu Geld, Kredit und Wirtschaftswachstum Fortsetzung zu Binswanger2 Überlegungen zu Geld, Kredit und Wirtschaftswachstum Peter Fleissner (Version 05.02.2008) Bisher wurde die Rechung nur mit zirkulierendem konstantem Kapital durchgeführt. Die

Mehr

Methoden der empirischen Sozialforschung I

Methoden der empirischen Sozialforschung I Methoden der empirischen Sozialforschung I Annelies Blom, PhD TU Kaiserslautern Wintersemester 2011/12 Übersicht Quantitative Datenauswertung: deskriptive und induktive Statistik Wiederholung: Die wichtigsten

Mehr

Übungsaufgaben zu Kapitel 5. Aufgabe 101. Inhaltsverzeichnis:

Übungsaufgaben zu Kapitel 5. Aufgabe 101. Inhaltsverzeichnis: Inhaltsverzeichnis: Übungsaufgaben zu Kapitel 5... 1 Aufgabe 101... 1 Aufgabe 102... 2 Aufgabe 103... 2 Aufgabe 104... 2 Aufgabe 105... 3 Aufgabe 106... 3 Aufgabe 107... 3 Aufgabe 108... 4 Aufgabe 109...

Mehr