3.1 Zusammenhang zwischen einem qualitativen und einem quantitativen Merkmal

Größe: px
Ab Seite anzeigen:

Download "3.1 Zusammenhang zwischen einem qualitativen und einem quantitativen Merkmal"

Transkript

1 Kapitel 3 Bivariate Analyse In Kapitel 2 haben wir gesehen, wie man ein Merkmal auswertet. Mit Hilfe statistischer Verfahren kann man aber auch untersuchen, ob zwischen mehreren Merkmalen Abhängigkeiten bestehen. Wir wollen hier nur zwei Merkmale betrachten. Ist eines mindestens eines der beiden Merkmale qualitativ, so kann auf Basis dieses oder eines dieser qualitativen Merkmale Gruppen bilden, wobei alle Merkmalsträger einer Gruppe die gleiche Merkmalsausprägung aufweisen. Ist zum Beispiel das qualitative Merkmal das Geschlecht, so enthält die eine Gruppe die Frauen und die andere die Männer. Man vergleicht die Verteilung des anderen Merkmals in den Gruppe. Beide Merkmale können aber auch quantitativ sein sein. In diesem Fall will man die Abhängigkeitsstruktur zwischen den beiden Merkmalen durch eine geeignete Maßzahl beschreiben. 3.1 Zusammenhang zwischen einem qualitativen und einem quantitativen Merkmal Wir wollen untersuchen, ob sich die Verteilung eines quantitativen Merkmals in zwei Gruppen unterscheidet. In der ersten Gruppe liegt die Urliste x 1,...,x m und in der zweiten Gruppe die Urliste y 1,...,y n vor. Die Anzahl der Beobachtungen in den beiden Gruppen muss nicht identisch sein. Insgesamt werden die Werte von N = m + n Merkmalsträgern erhoben. Wir können die Verteilung des Merkmals in beiden Gruppen mit Maßzahlen oder grafischen Darstellungen vergleichen. Wollen wir die Lage überprüfen, so vergleichen wir den Mittelwert x oder Median x 0.5 der ersten Gruppe mit dem Mittelwert ȳ oder Median y 0.5 der zweiten Gruppe, während die Stichprobenvarianzen s 2 X und s2 Y zeigen, ob sich die Verteilungen hinsichtlich 65

2 66 KAPITEL 3. BIVARIATE ANALYSE der Streuung unterscheiden. Beispiel 15 Wir schauen uns noch einmal das Beispiel 1 auf Seite 1 an und betrachten das nominalskalierte Merkmal Geschlecht und das quantitative Merkmal Alter. Wir vergleichen das Alter der weiblichen Teilnehmer mit dem Alter der männlichen Teilnehmer. Das Alter der weiblichen Teilnehmer beträgt: und das der Männer Wir bezeichnen das Alter der i-ten Frau mit x i und das Alter des j-ten Mannes mit y j. Es gilt also speziell x 3 = 31 und y 1 = 30. Es gilt x =27.8und y =30.5. Die Frauen sind also im Mittel 2.7 Jahre jünger als die Männer. Die Mediane sind x 0.5 = 28 und y 0.5 =29.5. Die Differenz der Mediane ist nicht so groß wie die Differenz der Mittelwerte. Wir betrachten nun auch noch die Varianzen der beiden Gruppen. Es gilt s 2 x =16.5und s 2 y =24.3. Wir sehen, dass die Werte der Männer stärker streuen als die der Frauen. Den besten Überblick über die Unterscheide zwischen den beiden Verteilungen liefert ein vergleichender Boxplot. Bei diesem werden die Boxplots der beiden Gruppen nebeneinander gezeichnet. Beispiel 15 (fortgesetzt von Seite 66) Tabelle 3.1 zeigt x (1), x 0.25, x 0.5, x 0.75 und x (n) bei den Frauen und den Männern. Tabelle 3.1: Charakteristika der verteilung des Alters bei Männern und Frauen x (1) x 0.25 x 0.5 x 0.75 x (n) Frauen Männer Abbildung 3.1 zeigt die Boxplots des Merkmals Alter bei den Frauen und den Männern. An dieser Graphik kann man nun sehr viel erkennen. Die

3 3.1. QUANTITATIV UND QUALITATIV 67 beiden Verteilungen unterscheiden sich bezüglich der Lage. Die Streuung des Alters der Männer ist viel größer als die Streuung des Alters der Frauen. Die Verteilung des Alters der Männer ist symmetrisch, die des Alters der Frauen schief. Außerdem tritt bei den Frauen ein Ausreißer auf. Abbildung 3.1: Boxplots des Merkmals Alter bei den Frauen und den Männern Maenner Frauen Eine andere graphische Darstellung erhält man dadurch, dass man die beiden Histogramme gegenüberstellt. Man erhält ein sogenanntes vergleichendes Histogramm. Schraffiert man noch die Bereiche, in denen das jeweilige Geschlecht häufiger auftritt, so ist der Vergleich perfekt. Beispiel 15 (fortgesetzt) Abbildung 3.2 zeigt das vergleichende Histogramm des Alters der Frauen und der Männer mit Schraffur. Abbildung 3.2: Vergleichendes Histogramm des Alters der Frauen und der Männer Frauen Maenner

4 68 KAPITEL 3. BIVARIATE ANALYSE Wir sehen, dass in den unteren Altersklassen ein Frauenüberschuss herrscht, während in den oberen Altersklassen die Männer häufiger auftreten. In der Bevölkerungsstatistik heißt diese Darstellung eine Bevölkerungspyramide. Hier wird für jedes Alter die Anzahl der Frauen und Männer durch Säulen visualisiert. 3.2 Zusammenhang zwischen zwei qualitativen Merkmalen Wir wollen nun zwei qualitative Merkmale A und B betrachten. Dabei bezeichnen wir die Merkmalsausprägungen von A mit A 1,A 2,...,A I und die Merkmalsausprägungen von B mit B 1,B 2,...,B J. Bei der i-ten Person erhalten wir einen Wert x i für das Merkmal A und einen Wert y i für das Merkmal B. Diese können zusammenfassen zu (x i,y i ). Beispiel 16 Wir schauen uns noch einmal das Beispiel 1 auf Seite 1 an und betrachten die nominalskalierten Merkmale Geschlecht und Titanic. Die Ausprägungsmöglichkeiten des Geschlechts sind w und m und die des Merkmals Titanic j und n. Dabei nimmt das Merkmals Titanic die Merkmalsausprägung j an, wenn die Person den Film Titanic gesehen hat. Es gibt insgesamt vier mögliche Ausprägungen (A i,b j ), i =1, 2, j =1, 2, wenn wir beide Merkmale gemeinsam betrachten: Die Person ist weiblich und hat den Film gesehen: Die Person ist weiblich und hat den Film nicht gesehen: Die Person ist männlich und hat den Film gesehen: Die Person ist männlich und hat den Film nicht gesehen: (w,j). (w,n). (m,j). (m,n). Die Daten stehen in Tabelle 1.2 auf Seite 9 in der zweiten und vierten Spalte. Wie im univariaten Fall bestimmen wir absolute Häufigkeiten, wobei wir aber die beiden Merkmale gemeinsam betrachten. Sei n ij die Anzahl der Objekte, die beim Merkmal A die Ausprägung A i und beim Merkmal B die Ausprägung B j aufweisen. Wir stellen die absoluten Häufigkeiten in einer sogenannten Kontingenztabelle zusammen. Eine Kontingenztabelle ist nichts anderes als eine Häufigkeitstabelle mehrerer qualitativer Merkmale. Tabelle 3.2 zeigt den allgemeinen Aufbau einer zweidimensionalen Kontingenztabelle. Die Tabelle besteht aus einem Zentrum und einem Rand.

5 3.2. ZWEI QUALITATIVE MERKMALE 69 Im Zentrum der Tabelle stehen die absoluten Häufigkeiten der Merkmalsausprägungen (A i,b j ). Am Rand der i-ten Zeile steht die Summe n i. der absoluten Häufigkeiten der i-ten Zeile: n i. = J j=1 n ij Am Rand der j-ten Spalte steht die Summe n.j der absoluten Häufigkeiten der j-ten Spalte: I n.j = n ij Tabelle 3.2: Allgemeiner Aufbau einer zweidimensionalen Kontingenztabelle A B B 1 B 2... B J A 1 n 11 n 12 n 1J n 1. A 2 n 21 n 22 n 2J n A I n I1 n I2 n IJ n I. n.1 n.2 n.j n Beispiel 16 (fortgesetzt von Seite 68) Es gilt Geschlecht Titanic j n w m Durch die Ausprägungsmöglichkeiten des Merkmals Geschlecht werden zwei Gruppen gebildet. Wir wollen untersuchen, ob sich die Verteilung des Merkmals Titanic in den beiden Gruppen unterscheidet. Hierzu schauen wir

6 70 KAPITEL 3. BIVARIATE ANALYSE uns die bedingten relativen Häufigkeiten an. Dies bedeutet, dass man unter der Bedingung, dass die einzelnen Kategorien des Merkmals A gegeben sind, die Verteilung des Merkmals B bestimmt. Für die bedingte relative Häufigkeit der Merkmalsausprägung B j unter der Bedingung, dass die Merkmalsausprägung A i gegeben ist, schreiben wir h j i. Es gilt h j i = n ij. n i. Den allgemeinen Aufbau einer Tabelle mit bedingten relativen Häufigkeiten zeigt Tabelle 3.3. Tabelle 3.3: Allgemeiner Aufbau einer Kontingenztabelle mit bedingten relativen Häufigkeiten A B B 1 B 2... B J A 1 h 1 1 h 2 1 h J 1 A 2 h 1 2 h 2 2 h J A I h 1 I h 2 I h J I Die Zeilen dieser Tabelle bezeichnet man auch als Profile. Beispiel 16 (fortgesetzt von Seite 69) Wir betrachten zunächst nur die Frauen. Von den 13 Frauen haben 12 den Film Titanic gesehen, also 92.3 Prozent. Von den 12 Männern haben 5 den Film Titanic gesehen, also 41.7 Prozent. Unter den Frauen ist der Anteil derjenigen, die den Film gesehen haben, viel größer als unter den Männern. Wir erhalten die bedingten relativen Häufigkeiten in Tabelle 3.4. Tabelle 3.4: Kontingenztabelle der Merkmale Geschlecht und MatheLK mit bedingten relativen Häufigkeiten Geschlecht Titanic j n w m

7 3.2. ZWEI QUALITATIVE MERKMALE 71 Wir können die Verteilungen der beiden Gruppen auch grafisch mit einem vergleichenden Paretodiagramm vergleichen. Dabei zeichnen wir zwei Diagramme nebeneinander, wobei das erste das Paretodiagramm der Verteilung des Merkmals B ist, wenn das Merkmal A die Merkmalsausprägung A 1 annimmt. Das zweite ist nun ein Stabdiagramm der Häufigkeitsverteilung des Merkmals B, wenn das Merkmal A die Merkmalsausprägung A 2 annimmt. Bei diesem Stabdiagramm werden die Merkmalsausprägungen von B in der gleichen Reihenfolge abgetragen wie beim ersten Paretodiagramm. Hierdurch ist ein direkter Vergleich möglich. Beispiel 16 (fortgesetzt von Seite 70) Abbildung 3.3 zeigt das vergleichende Paretodiagramm. Abbildung 3.3: Vergleichendes Paretodiagramm j n Frauen Maenner Wir können sehr schön erkennen, dass fast alle Frauen, aber nur die Hälfte der Männer den Film gesehen hat. Bei zwei Merkmalsausprägungen ist ein vergleichendes Paretodiagramm nicht unbedingt notwendig. Das folgende Beispiel mit sechs Merkmalsausprägungen zeigt, dass der Vergleich durch ein vergleichendes Paretodiagramm bedeutend erleichtert wird.

8 72 KAPITEL 3. BIVARIATE ANALYSE Beispiel 17 Die Anfangssemester des Wintersemesters 1996/1997 wurden befragt, welche Partei sie wählen würden. Die Werte sind in Tabelle 3.5 zu finden. Tabelle 3.5: Geschlecht und Wahlverhalten von Studienanfängern CDU SPD FDP GRUENE keine weiß nicht weiblich männlich Die bedingten relativen Häufigkeiten bei den Frauen und Männern sind in der Tabelle 3.6 zu finden. Tabelle 3.6: Verteilung des Wahlverhalten weiblicher und männlicher Studienanfänger CDU SPD FDP GRUENE keine weiß nicht weiblich 0,20 0,15 0,05 0,17 0,08 0,35 männlich 0,29 0,16 0,11 0,13 0,13 0,19 Abbildung 3.4 zeigt das vergleichende Paretodiagramm. Abbildung 3.4: Vergleichendes Paretodiagramm weiss nicht CDU GRUENE SPD keine FDP w m

9 3.2. ZWEI QUALITATIVE MERKMALE 73 Wir sehen nun auf einen Blick, dass das Wahlverhalten der Studentinnen sich beträchtlich von dem der Studenten unterscheidet. Die häufigste Kategorie bei den Frauen ist weiß nicht,während bei den Männern die CDU präferiert wird. Es gibt aber noch weitere Möglichkeiten, die bedingten Verteilungen zu vergleichen. Man kann die bedingten relativen Häufigkeiten der einzelnen Merkmalsausprägungen nebeneinander zeichnen. Beispiel 17 (fortgesetzt von Seite 71) Abbildung 3.5 zeigt den direkten Vergleich der bedingten relativen Häufigkeiten. Abbildung 3.5: Grafischer Vergleich bedingter Verteilungen 0.35 w m weiss nicht CDU GRUENE SPD keine FDP Bei den bisher betrachteten Grafiken kann man nicht feststellen, wie sich die Besetzungszahlen der Gruppen unterscheiden. Diese Möglichkeit bietet der Mosaikplot. Bei diesem wird für jede Zelle der Kontingenztabelle ein Rechteck gezeichnet, dessen Fläche proportional zur absoluten Häufigkeit der Zelle ist. Die Zellen der Zeilen bilden dabei die Spalten des Mosaikplots. Die Summen der vertikalen Seiten der Rechtecke ist in jeder Spalte der Kontingenztabelle konstant. Die Breiten der Rechtecke sind proportional zu den jeweiligen Spaltensummen. An einem Mosaikplot kann man die absoluten Häufigkeiten der Zeilen erkennen. Diese zeigen sich in den Breiten der Rechtecke. Außerdem kann man die bedingten relativen Häufigkeiten der Merkmalsausprägung einer Zeile an den Längen der vertikalen Seiten der Rechtecke erkennen.

10 j n m w 74 KAPITEL 3. BIVARIATE ANALYSE Beispiel 16 (fortgesetzt von Seite 71) Abbildung 3.6 zeigt den Mosaikplot. Abbildung 3.6: Mosaikplot h Titanic Geschlecht Wir sehen, dass die Anzahl von Männern und Frauen ungefähr gleichgroß ist. Außerdem sieht man auf einen Blick, dass sich die bedingten Verteilungen stark unterscheiden. Beispiel 16 (fortgesetzt von Seite 73) Abbildung 3.7 zeigt den Mosaikplot. Wir sehen, dass die Anzahl von Männern und Frauen sich stark unterscheidet. Außerdem sieht man auf einen Blick, dass sich die bedingten Verteilungen stark unterscheiden. Abbildung 3.7: Mosaikplot w m CDU SPD FDP Wahl GRUENE keine weiss nicht Geschlecht

11 weiss nicht CDU GRUENE SPD keine FDP w m 3.3. ZWEI QUANTITATIVE MERKMALE 75 Ordnen wir die Spalten entsprechend der Häufigkeit der Ausprägungen des Merkmals Wahlverhalten bei den Frauen, so erkennen wir die Unterschiede zwischen den bedingten Verteilungen noch besser. Dies zeigt Abbildung 3.8. Abbildung 3.8: Mosaikplot Wahl Geschlecht 3.3 Zusammenhang zwischen zwei quantitativen Merkmalen Wir wollen nun zwei quantitative Merkmale betrachten. Hierbei werden wir uns mit Maßzahlen beschäftigen, die die Stärke des Zusammenhangs zwischen den beiden Merkmalen beschreiben Der Korrelationskoeffizient von Bravais-Pearson Ausgangspunkt sind die quantitativen Merkmale X und Y, die an jedem von n Merkmalsträgern erhoben wurden. Beim i-ten Merkmalsträger beobachten wir einen Wert x i des Merkmals X und einen Wert y i des Merkmals Y. Wir fassen diese zu einem Vektor (x i,y i )zusammen. Um uns ein Bild vom Zusammenhang zwischen den beiden Merkmalen zu machen, stellen wir die Punktepaare in einem Streudiagramm dar. Die beiden Merkmale bilden die Achsen in einem kartesischen Koordinatensystem. Die Werte jedes Objekts werden als Punkt in dieses Koordinatensystem eingetragen. Beispiel 17 Hierzu betrachten wir die Daten in Tabelle 1.1 auf Seite 4. Es gilt z.b. (x 2,y 2 )=(40, 520). Abbildung 3.9 zeigt das Streudiagramm der Kaltmiete und der Fläche der Wohnungen.

12 76 KAPITEL 3. BIVARIATE ANALYSE Abbildung 3.9: Streudiagramm der Kaltmiete und der Fläche der Wohnungen Miete Flaeche Wir sehen, dass zwischen der Miete und der Fläche ein positiver Zusammenhang besteht. Mit wachsender Fläche der Wohnung nimmt die Miete zu. Wir wollen nun eine Maßzahl für den Zusammenhang zwischen zwei quantitativen Merkmalen bestimmen. Schauen wir uns unter diesem Aspekt noch einmal das Streudiagramm der Merkmale Flaeche und Miete in Abbildung 3.9 auf Seite 76 an. Wir sehen, dass bei Wohnungen mit großer Fläche auch die Miete hoch ist. Wohnungen mit kleiner Fläche haben in der Regel auch eine niedrige Miete. Ist eine Wohnung also über dem Durchschnitt bei einem Merkmal, so ist sie in der Regel auch über dem Durchschnitt bei dem anderen Merkmal. Dies wird auch am Streudiagramm deutlich, wenn wir die Mittelwerte der beiden Merkmale in diesem berücksichtigen. Hierzu zeichnen wir eine Gerade parallel zur Ordinate in Höhe des Mittelwerts der Fläche und eine Gerade parallel zur Abszisse in Höhe des Mittelwerts der Miete. Abbildung 3.10 veranschaulicht dies. Abbildung 3.10: Streudiagramm der Merkmale Fläche und Miete, aufgeteilt in 4 Quadranten II I Miete III IV Flaeche

13 3.3. ZWEI QUANTITATIVE MERKMALE 77 Hierdurch erhalten wir 4 Quadranten, die in der Graphik durchnummeriert sind. Im ersten Quadranten sind die Wohnungen, deren Fläche und Miete über dem Durchschnitt liegen, während sich im dritten Quadranten die Wohnungen befinden, deren Fläche und Miete unter dem Durchschnitt liegen. Im zweiten Quadranten sind die Wohnungen, deren Miete über dem Durchschnitt und deren Fläche unter dem Durchschnitt liegt, während sich im vierten Quadranten die Wohnungen befinden, deren Miete unter dem Durchschnitt und deren Fläche über dem Durchschnitt liegt. Besteht ein positiver Zusammenhang zwischen den beiden Merkmalen, so werden wir die meisten Beobachtungen in den Quadranten I und III erwarten, während wir bei einem negativen Zusammenhang die meisten in den Quadranten II und IV erwarten. Verteilen sich die Punkte gleichmäßig über die Quadranten, so liegt kein Zusammenhang zwischen den Merkmalen vor. Um den soeben veranschaulichten Sachverhalt in eine geeignete Maßzahl für den Zusammenhang zwischen den beiden Merkmalen umzusetzen, gehen wir davon aus, dass das Merkmal X auf der Abszisse und das Merkmal Y auf der Ordinate stehe. Sei x i die Ausprägung des Merkmals X beim i-ten Objekt und y i die Ausprägung des Merkmals Y beim i-ten Objekt. Dann gilt in den einzelnen Quadranten: Quadrant I: x i > x, y i > y, Quadrant II: x i < x, y i > y, Quadrant III: x i < x, y i < y, Quadrant IV: x i > x, y i < y. Eine einfache Maßzahl für den Zusammenhang zwischen den beiden Merkmalen erhalten witr, indem wir zählen. Sei n i die Anzahl der Punkte im i-ten Quadranten. Wir bilden n 1 + n 3 n 2 n 4 n 1 + n 2 + n 3 + n 4 (3.1) Beispiel 17 (fortgesetzt) Es gilt n 1 =3 n 2 =0 n 3 =3 n 4 =0 Also folgt n 1 + n 3 n 2 n 4 = n 1 + n 2 + n 3 + n =1 Der Koeffizient in Gleichung (3.1) ist positiv, wenn die Mehrzahl der Punkte im ersten und dritten Quadranten liegt, er ist negativ, wenn die Mehrzahl

14 78 KAPITEL 3. BIVARIATE ANALYSE der Punkte im zweiten und vierten Quadranten liegt, und er liegt in der Nähe von 0,wenn sich die Punkte gleichmäßig auf die vier Quadranten verteilen. Er nimmt genau dann den Wert 1 an, wenn alle Punkte im ersten und dritten Quadranten liegen, und er nimmt genau dann den Wert 1 an, wenn alle Punkte im zweiten und vierten Quadranten liegen. Somit bildet er ein sinnvolles Maß für den Zusammenhang zwischen den Merkmalen, das zudem noch normiert ist. Er hat aber den Nachteil, dass er nicht angibt, wie gut der Zusammenhang durch eine Funktion beschrieben werden kann. So nimmt er beim Streudiagramm in Abbildung 3.10 auf Seite 76 und dem Streudiagramm in Abbildung 3.11 den gleichen Wert an. Der positive Zusammenhang ist in Abbildung 3.11 aber viel stärker. Abbildung 3.11: Streudiagramm der Merkmale Fläche und Miete, aufgeteilt in 4 Quadranten II I Miete III IV Flaeche Wir sollten also nicht nur zählen, sondern auch die Werte selber in Betracht ziehen. Wir schauen uns die Abweichungen der Beobachtungen vom Mittelwert an. Wir bilden also x i x und y i y für i =1,...,n. In den 4 Quadranten gilt: Quadrant I: Quadrant II: Quadrant III: Quadrant IV: x i x>0,y i y>0, x i x<0,y i y>0, x i x<0,y i y<0, x i x>0,y i y<0.

15 3.3. ZWEI QUANTITATIVE MERKMALE 79 Betrachten wir das Produkt (x i x)(y i y), so ist dieses im ersten und dritten Quadranten positiv, während es im zweiten und vierten Quadranten negativ ist. Addieren wir die Produkte, so werden wir einen positiven Wert erhalten, wenn die meisten Punkte im ersten und dritten Quadranten liegen, einen negativen Wert, wenn die meisten Punkte im zweiten und vierten Quadranten liegen, und ungefähr 0 als Summe, wenn die Punkte sich gleichmäßig auf die vier Quadranten verteilen. Es liegt also nahe, als Maßzahl für den Zusammenhang zwischen den beiden Merkmalen folgende Größe zu betrachten: d x,y = 1 n (x i x) (y i y) (3.2) Man nennt diese Zahl auch die Kovarianz. Beispiel 17 (fortgesetzt) Wir wollen nun die Kovarianz berechnen. Tabelle 3.7 enthält die relevanten Hilfsgrößen zur Berechnung. Tabelle 3.7: Hilfstabelle zur Bestimmung der Kovarianz und des Korrelationskoeffizienten i x i y i x i x y i y (x i x) (y i y) (x i x) 2 (y i y) Aus der sechsten Spalte erhält man die wichtige Größe durch Addition. (x i x) (y i y) = 3050 Also gilt d x,y = =

16 80 KAPITEL 3. BIVARIATE ANALYSE Man kann die Kovarianz wie auch die Kovarianz einfacher berechnen. Es gilt d x,y = xy x y (3.3) mit xy = 1 n x i y i Dies sieht man folgendermaßen: d x,y = 1 n = 1 n (x i x) (y i y) = 1 n x i y i 1 n = xy y 1 n x i y 1 n x i x 1 n (x i y i x i y xy i + x y) xy i + 1 n y i + 1 n n x y = xy y x x y + x y = xy x y x y Beispiel 17 (fortgesetzt) Wir bestimmen die Kovarianz mit Formal (3.3) berechnen. Tabelle 3.8 enthält die relevanten Hilfsgrößen zur Berechnung. Tabelle 3.8: Hilfstabelle zur Bestimmung der Kovatrianz i x i y i x i y i

17 3.3. ZWEI QUANTITATIVE MERKMALE 81 Wir erhalten xy = 1 n x i y i = 1 ( ) = Mit x =36.5 und y = 510 gilt somit d x,y = xy x y = = Die Kovarianz kann beliebig groß werden, so dass man mit Hilfe der Kovarianz nicht angeben kann, ob ein Zusammenhang stark oder schwach ist. Wenn wir die Kovarianz normieren, erhalten den Korrelationskoeffizienten von Bravais-Pearson: r x,y = 1 n 1 n (x i x) (y i y) (x i x) 2 1 n (y i y) 2 = d x,y d 2 x d 2 y (3.4) Multiplizieren wir Zähler und Nenner des Bruches in Gleichung (3.4) mit n, so gilt: r x,y = n (x i x) (y i y) (x i x) 2 (y i y) 2 Beispiel 17 (fortgesetzt) Da im Zähler des Korrelationskoeffizienten die Kovarianz steht, müssen wir nur die beiden Größen im Nenner bestimmen. Dazu benutzen wir die siebte und achte Spalte der Tabelle 3.7. Es gilt (x i x) 2 = und (y i y) 2 =

18 82 KAPITEL 3. BIVARIATE ANALYSE Also gilt r x,y = , 5 =0, 607 Die beiden Merkmale sind also stark positiv miteinander korreliert. Für den Korrelationskoeffizienten r x,y gilt: 1. 1 r x,y 1, 2. r x,y = 1 genau dann, wenn zwischen den beiden Merkmalen ein exakter linearer Zusammenhang mit positiver Steigung besteht, 3. r x,y = 1 genau dann, wenn zwischen den beiden Merkmalen ein exakter linearer Zusammenhang mit negativer Steigung besteht. Die erste Eigenschaft besagt, dass der empirische Korrelationskoeffizient Werte zwischen 1 und 1 annimmt, während die beiden anderen Eigenschaften erklären, wie wir die Werte des empirischen Korrelationskoeffizienten zu interpretieren haben. Liegt der Wert des empirischen Korrelationskoeffizienten in der Nähe von 1, so liegt ein positiver linearer Zusammenhang zwischen den beiden Merkmalen vor, während ein Wert in der Nähe von 1 auf einen negativen linearen Zusammenhang hindeutet. Ein Wert in der Nähe von 0 spricht dafür, dass kein linearer Zusammenhang zwischen den beiden Merkmalen vorliegt. Dies bedeutet aber nicht notwendigerweise, dass gar kein Zusammenhang zwischen den beiden Merkmalen besteht. Beispiel 18 Tabelle 3.9 zeigt die Realisationen von zwei Merkmalen. Tabelle 3.9: Werte der Merkmale x und y i x i y i x i x y i y (x i x) (y i y) Es gilt d x,y = 1 ( )=0 5

19 3.3. ZWEI QUANTITATIVE MERKMALE 83 Der Wert des Kovarianz ist also gleich 0. Somit ist auch der Wert des Korrelationskoeffizienten gleich 0. Schaut man sich die Werte in der Tabelle genauer an, so stellt man fest, dass y i = x 2 i gilt. Zwischen den beiden Merkmalen besteht also ein funktionaler Zusammenhang. Ist der Wert des Korrelationskoeffizienten gleich 0, so besteht kein linearer Zusammenhang zwischen den Merkmalen. Es kann aber durchaus ein anderer funktionaler Zusammenhang bestehen. Beispiel 19 In der Süddeutschen Zeitung wurden Ende Juli 1999 im Anzeigenteil 33 VW- Golf 3 angeboten. Abbildung 3.12 zeigt das Streudiagramm zwischen dem Alter eines VW-Golf 3 und den zurückgelegten Kilometern. Abbildung 3.12: Streudiagramm zwischen dem Alter eines VW-Golf 3 und den zurückgelegten Kilometern Angebotspreis Kilometer (in 1000) Wie zu erwarten war, ist der Angebotspreis um so niedriger, je mehr Kilometer das Autos zurückgelegt hat. Zwischen den Merkmalen besteht also eine negative Korrelation.Der Wert des Korrelationskoeffizienten beträgt Beispiel 20 Abbildung 3.13 zeigt die Körpergröße von Studienanfängern in Abhängigkeit vom Alter. Das Bild deutet auf keinen Zusammenhang zwischen den Merkmalen hin. Der Wert des Korrelationskoeffizienten beträgt 0.16.

20 84 KAPITEL 3. BIVARIATE ANALYSE Abbildung 3.13: Körpergröße von Studienanfängern in Abhängigkeit vom Alter Groesse Alter Der Rangkorrelationskoeffizient von Spearman Der Korrelationskoeffizient von Bravais-Pearson ist ein Maß für den linearen Zusammenhang zwischen X und Y. Ein monotoner Zusammenhang zwischen X und Y liegt vor, wenn für zwei beliebige Punkte (x i,y i ) und (x j,y j )entweder x i <x j y i <y j oder x i <x j y i >y j gilt. Eine Maßzahl für einen monotonen Zusammenhang erhält man, indem man die Beobachtungen jedes Merkmals durch die Ränge ersetzt. Dabei gibt der Rang r i der Beobachtung x i an, an der wievielten Stelle x i in der geordneten Stichprobe steht. Wir können auch zählen, wie viele der Beobachtungen kleiner oder gleich x i sind. Beispiel 21 Wir betrachten die Daten in Tabelle 1.1 auf Seite 4. Schauen wir uns zunächst die Fläche der Wohnungen an. Es gilt x 1 =55 x 2 =40 x 3 =30 x 4 =23 x 5 =26 x 6 =45 Die kleinste Beobachtung ist x 4 = 23. Also gilt r 4 = 1. Die zweitkleinste Beobachtung ist x 5 = 26. Also gilt r 5 = 2. Entsprechend erhalten wir r 1 =6 r 2 =4 r 3 =3 r 6 =5.

21 3.3. ZWEI QUANTITATIVE MERKMALE 85 Auch für die y i können wir die Ränge bestimmen. Wir bezeichnen sie mit s i und erhalten: s 1 =5 s 2 =4 s 3 =1 s 4 =3 s 5 =2 s 6 =6. Sind Beobachtungen identisch, so weisen wir diesen Durchschnittsränge zu. Beispiel 22 Die Daten seien x 1 =40 x 2 =40 x 3 =31 x 4 =23 x 5 =31 x 6 =40 Der kleinste Wert ist 23. Dieser tritt nur einmal auf. Also gilt r 4 =1.Der zweitkleinste Wert ist 31. Dieser tritt zweimal auf. Wir würden die Ränge 2 und 3 vergeben. Wir bilden den Durschnittsrang. Also gilt r 3 =2.5 und r 5 =2.5. Der Wert 40 tritt dreimal auf. Wir würden die Ränge 4, 5 und 6 vergeben. Wir bilden auch hier den Durschnittsrang. Also gilt r 1 =5,r 2 =5 und r 6 =5. Ersetzen wir in Gleichung 3.4 auf Seite 81 x i durch r i und y i durch s i,so erhalten wir den Rangkorrelationskoeffizienten von Spearman: r S = n (r i r) (s i s) (r i r) 2 (s i s) 2 (3.5) Liegen keine Bindungen vor, so können wir den Rangkorrelationskoeffizienten nach folgender Formel bestimmen: 6 d 2 i r S =1 n (n 2 1). Dabei gilt d i = r i s i. Beispiel 22 (fortgesetzt) Wir stellen die Ränge in einer Tabelle zusammen und bestimmen die Differenzen d i = r i s i.

22 86 KAPITEL 3. BIVARIATE ANALYSE Tabelle 3.10: Hilstabelle zur Berechnung des Korrelationskoeffizienten von Spearman Wohnung r i s i d i Es gilt r S = 1 6 ( ( 2) ( 1) 2 6 (6 2 1) =0.714 Besteht ein streng monoton wachsender Zusammenhang zwischen den beiden Merkmalen, so ist der Rangkorrelationskoeffizient von Spearman gleich 1. In diesem Fall gilt für i =1,...,n r i = s i. Besteht ein streng monoton fallender Zusammenhang zwischen den beiden Merkmalen, so ist der Rangkorrelationskoeffizient von Spearman gleich 1. In diesem Fall gilt für i =1,...,n nämlich r i = n +1 s i Sehr oft liegen die Werte von zwei Merkmalsträgern bereits als Ränge vor. In diesem Fall kann man mit dem Rangkorrelationskoeffizienten überprüfen, wie sehr die beiden Merkmalsträger in ihrer Bewertung übereinstimmen. Beispiel 23 Zwei Personen werden gebeten, sechs Paare von Politikern der Ähnlichkeit nach zu ordnen. Dem Paar, bei dem sich die beiden Politiker am ähnlichsten sind, sollten sie eine 1, dem zweitähnlichsten eine 2,... u.s.w. geben. Die Werte sind in Tabelle 3.11 zu finden.

23 3.3. ZWEI QUANTITATIVE MERKMALE 87 Tabelle 3.11: Bewertung der Ähnlichkeit von Politikerpaaren durch zwei Personen Politikerpaar Person 1 Person 2 Schröder - Fischer 4 1 Schröder - Schäuble 1 3 Schröder - Westerwelle 2 5 Fischer - Schäuble 5 6 Fischer - Westerwelle 6 2 Schäuble - Westerwelle 3 4 Es gilt d 1 =3 d 3 = 3 d 5 =4 d 2 = 2 d 4 = 1 d 6 = 1 Also gilt d 2 i =40 und es folgt r S = (6 2 1) = Zur Interpretation von Korrelation Ist die Korrelation zwischen zwei Merkmalen groß, so wird oft unterstellt, dass die eine Größe die andere beeinflusst. Bei einer derartigen Interpretation muss man sehr vorsichtig sein. So hängt die Höhe der Geburtenrate sicherlich nicht von der Anzahl der Störche ab, die in einer Region leben. Beide Merkmale sind aber positiv miteinander korreliert. Diese Korrelation wird aber durch eine dritte Größe bewirkt. Diese ist der Grad der Industralisierung in einem Land. Je höher die Industrialisierung, um so niedriger die Geburtenrate und die Anzahl der Störche. Schauen wir uns noch ein Beispiel an.

24 88 KAPITEL 3. BIVARIATE ANALYSE Beispiel 24 Bei einer Befragung von Erstsemestern wurden unter anderem die Merkmale Körpergröße x, Körpergewicht y und Schuhgröße z erhoben. Die Werte von 20 Studenten sind in Tabelle 3.12 zu finden. Tabelle 3.12: Körpergröße, Körpergewicht und Schuhgröße von 20 Studenten Student i x i y i z i Student i x i y i z i Wir bestimmen die empirische Korrelationsmatrix R = (3.6) Zwischen allen Merkmalen in Beispiel 24 besteht eine hohe positive Korrelation. Bei der Korrelation zwischen den Merkmalen Körpergröße und Körpergewicht wundert uns das nicht. Je größer eine Person ist, umso mehr wird sie auch wiegen. Die starke positive Korrelation zwischen den Merkmalen Körpergröße und Schuhgröße haben wir auch erwartet. Dass aber die Merkmale Körpergewicht und Schuhgröße eine starke positive Korrelation aufweisen, ist verwunderlich. Warum sollten schwerere Personen größere Füße haben? Wir hätten hier eher einen Wert des empirischen Korrelationskoeffizienten in der Nähe von 0 erwartet. Woher kommt dieser hohe positive Wert? Der Zusammenhang zwischen den Merkmalen Körpergewicht und Schuhgröße kann am Merkmal Körpergröße liegen, denn das Merkmal Körpergröße bedingt im Regelfall sowohl das Merkmal Körpergewicht als auch das Merkmal Schuhgröße. Umzuüberprüfen, ob das Merkmal Körpergröße den Zusammenhang zwischen den Merkmalen Körpergewicht

25 3.3. ZWEI QUANTITATIVE MERKMALE 89 und Schuhgröße bedingt, müssen wir es kontrollieren. Hierzu haben wir zwei Möglichkeiten: Wir betrachten nur Personen, die die gleiche Ausprägung des Merkmals Körpergröße besitzen, und bestimmen bei diesen den Zusammenhang zwischen den Merkmalen Körpergewicht und Schuhgröße. Besteht bei Personen, die die gleiche Ausprägung des Merkmals Körpergröße besitzen, kein Zusammenhang zwischen den Merkmalen Körpergewicht und Schuhgröße, so sollte der Wert des empirischen Korrelationskoeffizienten gleich 0 sein. Wir können den Effekt des Merkmals Körpergröße auf die Merkmale Körpergewicht und Schuhgröße statistisch bereinigen und den Zusammenhang zwischen den bereinigten Merkmalen bestimmen. Bereinigt man die die Korrelation zwischen den Merkmalen Y und Z um den Effekt des Merkmals X, so erhält man partiellen Korrelationskoeffizienten r YZ.X. Dieser ist folgendermaßen definiert: r YZ.X = r YZ r XY r XZ (1 r 2 XY ) (1 r 2 XZ ) (3.7) Dabei ist r YZ der Korrelationskoeffizient zwischen Y und Z, r XY der Korrelationskoeffizient zwischen X und Y und r XZ der Korrelationskoeffizient zwischen X und Z. IstderWertvonr YZ.X in der Nähe von 0, so deutet dies darauf hin, dass die Korrelation zwischen Y und Z gleich 0 ist, wenn man beide um den linearen Effekt von X bereinigt. Beispiel 24 (fortgesetzt von Seite) Mit r XY =0.882, r XZ =0.796 und r YZ =0.712 gilt r YZ.X = r YZ r XY r XZ (1 r 2 XY ) (1 rxz 2 ) = ( ) ( ) =0.035 Diie partielle Korrelation zwischen dem Körpergewicht und der Schuhgröße ist also ungefähr gleich 0. Zwischen dem Körpergewicht und der Schuhgröße besteht also keine Korrelation, wenn man beide um den linearen Effekt der Körpergrößbereinigt.

a) Zeichnen Sie in das nebenstehende Streudiagramm mit Lineal eine Regressionsgerade ein, die Sie für passend halten.

a) Zeichnen Sie in das nebenstehende Streudiagramm mit Lineal eine Regressionsgerade ein, die Sie für passend halten. Statistik für Kommunikationswissenschaftler Wintersemester 2009/200 Vorlesung Prof. Dr. Helmut Küchenhoff Übung Cornelia Oberhauser, Monia Mahling, Juliane Manitz Thema 4 Homepage zur Veranstaltung: http://www.statistik.lmu.de/~helmut/kw09.html

Mehr

Leseprobe. Michael Sachs. Wahrscheinlichkeitsrechnung und Statistik. für Ingenieurstudenten an Fachhochschulen. ISBN (Buch):

Leseprobe. Michael Sachs. Wahrscheinlichkeitsrechnung und Statistik. für Ingenieurstudenten an Fachhochschulen. ISBN (Buch): Leseprobe Michael Sachs Wahrscheinlichkeitsrechnung und Statistik für Ingenieurstudenten an Fachhochschulen ISBN (Buch): 978-3-446-43797-5 ISBN (E-Book): 978-3-446-43732-6 Weitere Informationen oder Bestellungen

Mehr

Deskription, Statistische Testverfahren und Regression. Seminar: Planung und Auswertung klinischer und experimenteller Studien

Deskription, Statistische Testverfahren und Regression. Seminar: Planung und Auswertung klinischer und experimenteller Studien Deskription, Statistische Testverfahren und Regression Seminar: Planung und Auswertung klinischer und experimenteller Studien Deskriptive Statistik Deskriptive Statistik: beschreibende Statistik, empirische

Mehr

Wahrscheinlichkeitsrechnung und Statistik

Wahrscheinlichkeitsrechnung und Statistik Wahrscheinlichkeitsrechnung und Statistik Für Ingenieurstudenten an Fachhochschulen von Michael Sachs erweitert Wahrscheinlichkeitsrechnung und Statistik Sachs schnell und portofrei erhältlich bei beck-shopde

Mehr

Skalenniveaus =,!=, >, <, +, -

Skalenniveaus =,!=, >, <, +, - ZUSAMMENHANGSMAßE Skalenniveaus Nominalskala Ordinalskala Intervallskala Verhältnisskala =,!= =,!=, >, < =,!=, >, ,

Mehr

Musterlösung zur Aufgabensammlung Statistik I Teil 3

Musterlösung zur Aufgabensammlung Statistik I Teil 3 Musterlösung zur Aufgabensammlung Statistik I Teil 3 2008, Malte Wissmann 1 Zusammenhang zwischen zwei Merkmalen Nominale, Ordinale Merkmale und Mischungen Aufgabe 12 a) x\ y 1.Klasse 2.Klasse 3.Klasse

Mehr

Zusammenhänge zwischen metrischen Merkmalen

Zusammenhänge zwischen metrischen Merkmalen Zusammenhänge zwischen metrischen Merkmalen Darstellung des Zusammenhangs, Korrelation und Regression Daten liegen zu zwei metrischen Merkmalen vor: Datenpaare (x i, y i ), i = 1,..., n Beispiel: x: Anzahl

Mehr

Assoziation & Korrelation

Assoziation & Korrelation Statistik 1 für SoziologInnen Assoziation & Korrelation Univ.Prof. Dr. Marcus Hudec Einleitung Bei Beobachtung von Merkmalen stellt sich die Frage, ob es Zusammenhänge oder Abhängigkeiten zwischen den

Mehr

Assoziation & Korrelation

Assoziation & Korrelation Statistik 1 für SoziologInnen Assoziation & Korrelation Univ.Prof. Dr. Marcus Hudec Einleitung Bei Beobachtung von 2 Merkmalen stellt sich die Frage, ob es Zusammenhänge oder Abhängigkeiten zwischen den

Mehr

3. Deskriptive Statistik

3. Deskriptive Statistik 3. Deskriptive Statistik Eindimensionale (univariate) Daten: Pro Objekt wird ein Merkmal durch Messung / Befragung/ Beobachtung erhoben. Resultat ist jeweils ein Wert (Merkmalsausprägung) x i : - Gewicht

Mehr

1.1 Graphische Darstellung von Messdaten und unterschiedliche Mittelwerte. D. Horstmann: Oktober

1.1 Graphische Darstellung von Messdaten und unterschiedliche Mittelwerte. D. Horstmann: Oktober 1.1 Graphische Darstellung von Messdaten und unterschiedliche Mittelwerte D. Horstmann: Oktober 2014 4 Graphische Darstellung von Daten und unterschiedliche Mittelwerte Eine Umfrage nach der Körpergröße

Mehr

2. Deskriptive Statistik 2.1. Häufigkeitstabellen, Histogramme, empirische Verteilungsfunktionen

2. Deskriptive Statistik 2.1. Häufigkeitstabellen, Histogramme, empirische Verteilungsfunktionen 4. Datenanalyse und Modellbildung Deskriptive Statistik 2-1 2. Deskriptive Statistik 2.1. Häufigkeitstabellen, Histogramme, empirische Verteilungsfunktionen Für die Auswertung einer Messreihe, die in Form

Mehr

WISTA WIRTSCHAFTSSTATISTIK

WISTA WIRTSCHAFTSSTATISTIK WISTA WIRTSCHAFTSSTATISTIK PROF. DR. ROLF HÜPEN FAKULTÄT FÜR WIRTSCHAFTSWISSENSCHAFT Seminar für Theoretische Wirtschaftslehre Vorlesungsprogramm 04.06.2013 Zweidimensionale Datensätze 1. Kontingenztabelle

Mehr

Es können keine oder mehrere Antworten richtig sein. Eine Frage ist NUR dann richtig beantwortet, wenn ALLE richtigen Antworten angekreuzt wurden.

Es können keine oder mehrere Antworten richtig sein. Eine Frage ist NUR dann richtig beantwortet, wenn ALLE richtigen Antworten angekreuzt wurden. Teil III: Statistik Alle Fragen sind zu beantworten. Es können keine oder mehrere Antworten richtig sein. Eine Frage ist NUR dann richtig beantwortet, wenn ALLE richtigen Antworten angekreuzt wurden. Wird

Mehr

Didaktik der Stochastik (Leitidee: Daten und Zufall)

Didaktik der Stochastik (Leitidee: Daten und Zufall) Didaktik der Geometrie und Stochastik WS 09 / 10 15. 1. 2010 Didaktik der Stochastik (Leitidee: Daten und Zufall) 7. Beschreibende Statistik 7.1 Zum Begriff Stochastik : Seit den Fünfziger Jahren werden

Mehr

Statistik I für Betriebswirte Vorlesung 10

Statistik I für Betriebswirte Vorlesung 10 Statistik I für Betriebswirte Vorlesung 10 Prof. Dr. Hans-Jörg Starkloff TU Bergakademie Freiberg Institut für Stochastik 13. Juni 2016 Prof. Dr. Hans-Jörg Starkloff Statistik I für Betriebswirte Vorlesung

Mehr

Kapitel 2. Häufigkeitsverteilungen

Kapitel 2. Häufigkeitsverteilungen 6 Kapitel 2 Häufigkeitsverteilungen Ziel: Darstellung bzw Beschreibung (Exploration) einer Variablen Ausgangssituation: An n Einheiten ω,, ω n sei das Merkmal X beobachtet worden x = X(ω ),, x n = X(ω

Mehr

Eine zweidimensionale Stichprobe

Eine zweidimensionale Stichprobe Eine zweidimensionale Stichprobe liegt vor, wenn zwei qualitative Merkmale gleichzeitig betrachtet werden. Eine Urliste besteht dann aus Wertepaaren (x i, y i ) R 2 und hat die Form (x 1, y 1 ), (x 2,

Mehr

Grundlagen der Statistik

Grundlagen der Statistik Grundlagen der Statistik Übung 2 2010 FernUniversität in Hagen Alle Rechte vorbehalten Fakultät für Wirtschaftswissenschaft Übersicht über die mit den Übungsaufgaben geprüften Lehrzielgruppen Lehrzielgruppe

Mehr

Statistik. Ronald Balestra CH St. Peter

Statistik. Ronald Balestra CH St. Peter Statistik Ronald Balestra CH - 7028 St. Peter www.ronaldbalestra.ch 17. Januar 2010 Inhaltsverzeichnis 1 Statistik 1 1.1 Beschreibende Statistik....................... 1 1.2 Charakterisierung von Häufigkeitsverteilungen...........

Mehr

Graphische Darstellung einer univariaten Verteilung:

Graphische Darstellung einer univariaten Verteilung: Graphische Darstellung einer univariaten Verteilung: Die graphische Darstellung einer univariaten Verteilung hängt von dem Messniveau der Variablen ab. Bei einer graphischen Darstellung wird die Häufigkeit

Mehr

Was sind Zusammenhangsmaße?

Was sind Zusammenhangsmaße? Was sind Zusammenhangsmaße? Zusammenhangsmaße beschreiben einen Zusammenhang zwischen zwei Variablen Beispiele für Zusammenhänge: Arbeiter wählen häufiger die SPD als andere Gruppen Hochgebildete vertreten

Mehr

Lineare Funktionen. Klasse 8 Aufgabenblatt für Lineare Funktionen Datum: Donnerstag,

Lineare Funktionen. Klasse 8 Aufgabenblatt für Lineare Funktionen Datum: Donnerstag, Lineare Funktionen Aufgabe 1: Welche der folgenden Abbildungen stellen eine Funktion dar? Welche Abbildungen stellen eine lineare Funktion dar? Ermittle für die linearen Funktionen eine Funktionsgleichung.

Mehr

Deskriptive Statistik Auswertung durch Informationsreduktion

Deskriptive Statistik Auswertung durch Informationsreduktion Deskriptive Statistik Auswertung durch Informationsreduktion Gliederung Ø Grundbegriffe der Datenerhebung Total-/Stichprobenerhebung, qualitatives/quantitatives Merkmal Einteilung der Daten (Skalierung,

Mehr

Grafische Darstellung von Häufigkeitsverteilungen (1)

Grafische Darstellung von Häufigkeitsverteilungen (1) Grafische Darstellung von Häufigkeitsverteilungen () Grafische Darstellungen dienen... - Einführung - der Unterstützung des Lesens und Interpretierens von Daten. der Veranschaulichung mathematischer Begriffe

Mehr

Zusammenhangsanalyse in Kontingenztabellen

Zusammenhangsanalyse in Kontingenztabellen Zusammenhangsanalyse in Kontingenztabellen Bisher: Tabellarische / graphische Präsentation Jetzt: Maßzahlen für Stärke des Zusammenhangs zwischen X und Y. Chancen und relative Chancen Zunächst 2 2 - Kontingenztafel

Mehr

Deskriptive Statistik Lösungen zu Blatt 5 Christian Heumann, Susanne Konrath SS Lösung Aufgabe 27. f X Y (a i b j ) = f i j = f ij f j

Deskriptive Statistik Lösungen zu Blatt 5 Christian Heumann, Susanne Konrath SS Lösung Aufgabe 27. f X Y (a i b j ) = f i j = f ij f j 1 Deskriptive Statistik Lösungen zu Blatt 5 Christian Heumann, Susanne Konrath SS 2011 Lösung Aufgabe 27 (a) Notation: X: Rauchen, Y : chronische Bronchitis S X {ja, nein} {a 1, a 2 }, S Y {ja, nein} {b

Mehr

Bivariate Analyse: Gemeinsame (bivariate) Häufigkeitstabelle. Sie wird auch Kontingenz-, Assoziations- oder Korrelationstabelle (f b )genannt.

Bivariate Analyse: Gemeinsame (bivariate) Häufigkeitstabelle. Sie wird auch Kontingenz-, Assoziations- oder Korrelationstabelle (f b )genannt. Bivariate Analyse: Tabellarische Darstellung: Gemeinsame (bivariate) Häufigkeitstabelle. Sie wird auch Kontingenz-, Assoziations- oder Korrelationstabelle (f b )genannt. Beispiel: Häufigkeitsverteilung

Mehr

Beispiel 2 (Einige Aufgaben zu Lageparametern) Aufgabe 1 (Lageparameter)

Beispiel 2 (Einige Aufgaben zu Lageparametern) Aufgabe 1 (Lageparameter) Beispiel (Einige Aufgaben zu Lageparametern) Aufgabe 1 (Lageparameter) 1 Ein Statistiker ist zu früh zu einer Verabredung gekommen und vertreibt sich nun die Zeit damit, daß er die Anzahl X der Stockwerke

Mehr

Kapitel 5. Univariate Zufallsvariablen. 5.1 Diskrete Zufallsvariablen

Kapitel 5. Univariate Zufallsvariablen. 5.1 Diskrete Zufallsvariablen Kapitel 5 Univariate Zufallsvariablen Im ersten Teil dieses Skriptes haben wir uns mit Daten beschäftigt und gezeigt, wie man die Verteilung eines Merkmals beschreiben kann. Ist man nur an der Population

Mehr

Statistik und Wahrscheinlichkeitsrechnung

Statistik und Wahrscheinlichkeitsrechnung Statistik und Wahrscheinlichkeitsrechnung Übung 2 28.02.2008 1 Inhalt der heutigen Übung Beschreibende Statistik Gemeinsames Lösen der Übungsaufgaben 2.1: Häufigkeitsverteilung 2.2: Tukey Boxplot 25:Korrelation

Mehr

Einführung in die Statistik für Politikwissenschaftler Sommersemester 2011

Einführung in die Statistik für Politikwissenschaftler Sommersemester 2011 Einführung in die Statistik für Politikwissenschaftler Sommersemester 2011 Es können von den Antworten alle, mehrere oder keine Antwort(en) richtig sein. Nur bei einer korrekten Antwort (ohne Auslassungen

Mehr

Bitte am PC mit Windows anmelden!

Bitte am PC mit Windows anmelden! Einführung in SPSS Plan für heute: Grundlagen/ Vorwissen für SPSS Vergleich der Übungsaufgaben Einführung in SPSS http://weknowmemes.com/generator/uploads/generated/g1374774654830726655.jpg Standardnormalverteilung

Mehr

WISTA WIRTSCHAFTSSTATISTIK

WISTA WIRTSCHAFTSSTATISTIK WISTA WIRTSCHAFTSSTATISTIK PROF DR ROLF HÜPEN FAKULTÄT FÜR WIRTSCHAFTSWISSENSCHAFT Seminar für Theoretische Wirtschaftslehre Vorlesungsprogramm 23042013 Datenlagen und Darstellung eindimensionaler Häufigkeitsverteilungen

Mehr

Beide Verteilungen der Zeiten sind leicht schief. Der Quartilsabstand für Zeiten zum Surfen ist kleiner als der zum Fernsehen.

Beide Verteilungen der Zeiten sind leicht schief. Der Quartilsabstand für Zeiten zum Surfen ist kleiner als der zum Fernsehen. Welche der folgenden Maßzahlen sind resistent gegenüber Ausreißer? Der Mittelwert und die Standardabweichung. Der und die Standardabweichung. Der und die Spannweite. Der und der Quartilsabstand. Die Spannweite

Mehr

Einführung in die Statistik

Einführung in die Statistik Einführung in die Statistik Analyse und Modellierung von Daten Von Prof. Dr. Rainer Schlittgen 4., überarbeitete und erweiterte Auflage Fachbereich Materialwissenschaft! der Techn. Hochschule Darmstadt

Mehr

3 Häufigkeitsverteilungen

3 Häufigkeitsverteilungen 3 Häufigkeitsverteilungen 3.1 Absolute und relative Häufigkeiten 3.2 Klassierung von Daten 3.3 Verteilungsverläufe 3.1 Absolute und relative Häufigkeiten Datenaggregation: Bildung von Häufigkeiten X nominal

Mehr

Wirtschaftswissenschaftliches Prüfungsamt Bachelor-Prüfung Deskriptive Statistik und Wahrscheinlichkeitsrechnung Wintersemester 2010/11.

Wirtschaftswissenschaftliches Prüfungsamt Bachelor-Prüfung Deskriptive Statistik und Wahrscheinlichkeitsrechnung Wintersemester 2010/11. Wirtschaftswissenschaftliches Prüfungsamt Bachelor-Prüfung Deskriptive Statistik und Wahrscheinlichkeitsrechnung Wintersemester 2010/11 Namensschild Dr. Martin Becker Hinweise für die Klausurteilnehmer

Mehr

Teil II: Einführung in die Statistik

Teil II: Einführung in die Statistik Teil II: Einführung in die Statistik (50 Punkte) Bitte beantworten Sie ALLE Fragen. Es handelt sich um multiple choice Fragen. Sie müssen die exakte Antwortmöglichkeit angeben, um die volle Punktzahl zu

Mehr

Modul G.1 WS 07/08: Statistik

Modul G.1 WS 07/08: Statistik Modul G.1 WS 07/08: Statistik 10.01.2008 1 2 Test Anwendungen Der 2 Test ist eine Klasse von Verfahren für Nominaldaten, wobei die Verteilung der beobachteten Häufigkeiten auf zwei mehrfach gestufte Variablen

Mehr

Günther Bourier. Beschreibende Statistik. Praxisorientierte Einführung - Mit. Aufgaben und Lösungen. 12., überarbeitete und aktualisierte Auflage

Günther Bourier. Beschreibende Statistik. Praxisorientierte Einführung - Mit. Aufgaben und Lösungen. 12., überarbeitete und aktualisierte Auflage i Günther Bourier Beschreibende Statistik Praxisorientierte Einführung - Mit Aufgaben und Lösungen 12., überarbeitete und aktualisierte Auflage 4^ Springer Gabler Inhaltsverzeichnis Vorwort V 1 Einführung

Mehr

Linearer Zusammenhang von Datenreihen

Linearer Zusammenhang von Datenreihen Linearer Zusammenhang von Datenreihen Vielen Problemen liegen (möglicherweise) lineare Zusammenhänge zugrunde: Mein Internetanbieter verlangt eine Grundgebühr und rechnet minutenweise ab Ich bestelle ein

Mehr

Statistik I für Humanund Sozialwissenschaften

Statistik I für Humanund Sozialwissenschaften Statistik I für Humanund Sozialwissenschaften 1 Übung Lösungsvorschlag Gruppenübung G 1 Auf einer Touristeninsel in der Karibik wurden in den letzten beiden Juliwochen morgens zur gleichen Zeit die folgenden

Mehr

Kapitel 10. Stichproben

Kapitel 10. Stichproben Kapitel 10 n In der deskriptiven Statistik werden die Charakteristika eines Datensatzes durch Grafiken verdeutlicht und durch Maßzahlen zusammengefasst. In der Regel ist man aber nicht nur an der Verteilung

Mehr

Kapitel 2. Univariate Analyse. 2.1 Darstellung univariater Datensätze Darstellung qualitativer Merkmale

Kapitel 2. Univariate Analyse. 2.1 Darstellung univariater Datensätze Darstellung qualitativer Merkmale Kapitel 2 Univariate Analyse Wir wollen nun Strukturen in Datensätzen finden. Dabei betrachten wir zunächst jeweils nur ein Merkmal. Man spricht auch von univariater Datenanalyse. Jede Analyse beginnt

Mehr

TEIL 7: EINFÜHRUNG UNIVARIATE ANALYSE TABELLARISCHE DARSTELLUNG / AUSWERTUNG

TEIL 7: EINFÜHRUNG UNIVARIATE ANALYSE TABELLARISCHE DARSTELLUNG / AUSWERTUNG TEIL 7: EINFÜHRUNG UNIVARIATE ANALYSE TABELLARISCHE DARSTELLUNG / AUSWERTUNG GLIEDERUNG Statistik eine Umschreibung Gliederung der Statistik in zwei zentrale Teilbereiche Deskriptive Statistik Inferenzstatistik

Mehr

Chi-Quadrat Verfahren

Chi-Quadrat Verfahren Chi-Quadrat Verfahren Chi-Quadrat Verfahren werden bei nominalskalierten Daten verwendet. Die einzige Information, die wir bei Nominalskalenniveau zur Verfügung haben, sind Häufigkeiten. Die Quintessenz

Mehr

9. Kapitel: Grafische Darstellung quantitativer Informationen

9. Kapitel: Grafische Darstellung quantitativer Informationen 9. Kapitel: Grafische Darstellung quantitativer Informationen 9.1: Fallstricke bei der Übersetzung von Zahlen in Bilder a) optische Täuschungen b) absichtliche Manipulationen 9.2: Typologie von Datengrafiken

Mehr

Statistik und Wahrscheinlichkeitsrechnung

Statistik und Wahrscheinlichkeitsrechnung Statistik und Wahrscheinlichkeitsrechnung Dr. Jochen Köhler 26.02.2008 1 Warum Statistik und Wahrscheinlichkeits rechnung im Ingenieurwesen? Zusammenfassung der letzten Vorlesung Statistik und Wahrscheinlichkeitsrechnung

Mehr

Die Korrelation von Merkmalen

Die Korrelation von Merkmalen Die Korrelation von Merkmalen In der Analse von Datenmaterial ist eines der Hauptziele der Statistik eine Abhängigkeit bzw. einen Zusammenhang zwischen Merkmalen zu erkennen. Die Korrelation ermittelt

Mehr

Vorlesung Grundlagen der Biometrie WS 2011/12 1. Grundbegriffe

Vorlesung Grundlagen der Biometrie WS 2011/12 1. Grundbegriffe Vorlesung Grundlagen der Biometrie WS 2011/12 1. Grundbegriffe Dr. Antje Kiesel Institut für Angewandte Mathematik WS 2011/2012 1. Grundbegriffe der beschreibenden Statistik Statistische Einheiten, Grundgesamtheit

Mehr

Statistik II. Lineare Regressionsrechnung. Wiederholung Skript 2.8 und Ergänzungen (Schira: Kapitel 4) Statistik II

Statistik II. Lineare Regressionsrechnung. Wiederholung Skript 2.8 und Ergänzungen (Schira: Kapitel 4) Statistik II Statistik II Lineare Regressionsrechnung Wiederholung Skript 2.8 und Ergänzungen (Schira: Kapitel 4) Statistik II - 09.06.2006 1 Mit der Kovarianz und dem Korrelationskoeffizienten können wir den statistischen

Mehr

Datenanalyse mit Excel. Wintersemester 2013/14

Datenanalyse mit Excel. Wintersemester 2013/14 Datenanalyse mit Excel 1 KORRELATIONRECHNUNG 2 Korrelationsrechnung Ziel der Korrelationsrechnung besteht im bivariaten Fall darin, die Stärke des Zusammenhangs zwischen zwei interessierenden statistischen

Mehr

Statistik eindimensionaler Größen

Statistik eindimensionaler Größen Statistik eindimensionaler Größen Michael Spielmann Inhaltsverzeichnis 1 Aufgabe der eindimensionalen Statistik 2 2 Grundbegriffe 2 3 Aufbereiten der Stichprobe 3 4 Die Kennzahlen Mittelwert und Streuung,

Mehr

Einführung 17. Teil I Kopfüber eintauchen in die Statistik 23. Kapitel 1 Kategoriale Daten zusammenfassen: Häufigkeiten und Prozente 25

Einführung 17. Teil I Kopfüber eintauchen in die Statistik 23. Kapitel 1 Kategoriale Daten zusammenfassen: Häufigkeiten und Prozente 25 Inhaltsverzeichnis Einführung 17 Über dieses Buch 17 Törichte Annahmen über den Leser 19 Wie dieses Buch aufgebaut ist 19 Teil I: Kopfüber eintauchen indie Statistik 19 Teil II: Von Wahrscheinlichkeiten,

Mehr

Lösung Aufgabe 1 (Regression) Es wurden in einer Befragung zwei metrische Merkmale X und Y erhoben. Betrachten Sie dazu die

Lösung Aufgabe 1 (Regression) Es wurden in einer Befragung zwei metrische Merkmale X und Y erhoben. Betrachten Sie dazu die Statistik für Kommunikationswissenschaftler Wintersemester 2010/2011 Vorlesung Prof. Dr. Nicole Krämer Übung Nicole Krämer, Cornelia Oberhauser, Monia Mahling Lösung Thema 9 Homepage zur Veranstaltung:

Mehr

Bivariate Zusammenhänge

Bivariate Zusammenhänge Bivariate Zusammenhänge 40 60 80 Bivariater Zusammenhang: Zusammenhang zwischen zwei Variablen weight (kg) Gibt es einen Zusammenhang zwischen Größe & Gewicht? (am Beispieldatensatz) Offensichtlich positiver

Mehr

1,11 1,12 1,13 1,14 1,15 1,16 1,17 1,17 1,17 1,18

1,11 1,12 1,13 1,14 1,15 1,16 1,17 1,17 1,17 1,18 3. Deskriptive Statistik Ziel der deskriptiven (beschreibenden) Statistik (explorativen Datenanalyse) ist die übersichtliche Darstellung der wesentlichen in den erhobenen Daten enthaltene Informationen

Mehr

Tabellarische und graphie Darstellung von univariaten Daten

Tabellarische und graphie Darstellung von univariaten Daten Part I Wrums 1 Motivation und Einleitung Motivation Satz von Bayes Übersetzten mit Paralleltext Merkmale und Datentypen Skalentypen Norminal Ordinal Intervall Verältnis Merkmalstyp Diskret Stetig Tabellarische

Mehr

Prüfung aus Statistik 1 für SoziologInnen- Gruppe A

Prüfung aus Statistik 1 für SoziologInnen- Gruppe A Prüfung aus Statistik 1 für SoziologInnen- Gruppe A 26. Juni 2012 Gesamtpunktezahl =80 Prüfungsdauer: 2 Stunden 1) Wissenstest (maximal 20 Punkte) Lösungen Kreuzen ( ) Sie die jeweils richtige Antwort

Mehr

Regression ein kleiner Rückblick. Methodenseminar Dozent: Uwe Altmann Alexandra Kuhn, Melanie Spate

Regression ein kleiner Rückblick. Methodenseminar Dozent: Uwe Altmann Alexandra Kuhn, Melanie Spate Regression ein kleiner Rückblick Methodenseminar Dozent: Uwe Altmann Alexandra Kuhn, Melanie Spate 05.11.2009 Gliederung 1. Stochastische Abhängigkeit 2. Definition Zufallsvariable 3. Kennwerte 3.1 für

Mehr

Mathematische und statistische Methoden I

Mathematische und statistische Methoden I Prof. Dr. G. Meinhardt Methodenlehre Mathematische und statistische Methoden I Sprechstunde jederzeit nach Vereinbarung und nach der Vorlesung Wallstr. 3, 6. Stock, Raum 06-206 Dr. Malte Persike persike@uni-mainz.de

Mehr

Statistik Grundbegriffe

Statistik Grundbegriffe Kapitel 2 Statistik Grundbegriffe 2.1 Überblick Im Abschnitt Statistik Grundbegriffe werden Sie die Bedeutung von statistischen Grundbegriffen wie Stichprobe oder Merkmal kennenlernen und verschiedene

Mehr

P (X = 2) = 1/36, P (X = 3) = 2/36,...

P (X = 2) = 1/36, P (X = 3) = 2/36,... 2.3 Zufallsvariablen 2.3 Zufallsvariablen Meist sind die Ereignisse eines Zufallseperiments bereits reelle Zahlen. Ist dies nicht der Fall, kann man Ereignissen eine reelle Zahl zuordnen. Zum Beispiel

Mehr

5 Grundlagen der Differentialrechnung

5 Grundlagen der Differentialrechnung VWA-Mathematik WS 2003/04 1 5 Grundlagen der Differentialrechnung 5.1 Abbildungen Unter einer Abbildung f, f:d W, y= f( ) von einer Menge D (Definitionsbereich) in eine Menge W (Wertemenge) versteht man

Mehr

1) Warum ist die Lage einer Verteilung für das Ergebnis einer statistischen Analyse von Bedeutung?

1) Warum ist die Lage einer Verteilung für das Ergebnis einer statistischen Analyse von Bedeutung? 86 8. Lageparameter Leitfragen 1) Warum ist die Lage einer Verteilung für das Ergebnis einer statistischen Analyse von Bedeutung? 2) Was ist der Unterschied zwischen Parametern der Lage und der Streuung?

Mehr

er einen Fragebogen, den er von den Teilnehmern ausfüllen lässt. Der Fragebogen ist auf Seite 8 zu finden.

er einen Fragebogen, den er von den Teilnehmern ausfüllen lässt. Der Fragebogen ist auf Seite 8 zu finden. Kapitel 1 Grundbegriffe Fragt man Personen, was sie mit dem Begriff Statistik assoziieren, so werden in den Antworten in der Regel die Begriffe Zahlenkolonnen, Tabellen und Graphiken auftauchen. Es schließt

Mehr

Statistik. Ludwig Fahrmeir Rita Künstler Iris Pigeot Gerhard Tutz. Der Weg zur Datenanalyse. Springer. Zweite, verbesserte Auflage

Statistik. Ludwig Fahrmeir Rita Künstler Iris Pigeot Gerhard Tutz. Der Weg zur Datenanalyse. Springer. Zweite, verbesserte Auflage Ludwig Fahrmeir Rita Künstler Iris Pigeot Gerhard Tutz Statistik Der Weg zur Datenanalyse Zweite, verbesserte Auflage Mit 165 Abbildungen und 34 Tabellen Springer Inhaltsverzeichnis Vorwort v 1 Einführung

Mehr

Statistik I für Statistiker, Mathematiker und Informatiker Lösungen zu Blatt 6 Gerhard Tutz, Jan Ulbricht WS 05/06.

Statistik I für Statistiker, Mathematiker und Informatiker Lösungen zu Blatt 6 Gerhard Tutz, Jan Ulbricht WS 05/06. Statistik I für Statistiker, Mathematiker und Informatiker Lösungen zu Blatt Gerhard Tutz, Jan Ulbricht WS 05/0 Lösung Aufgabe 4 Notation: X: Rauchen, Y : chronische Bronchitis S X {ja, nein} {a 1, a },

Mehr

7. Konzentrations- und Disparitätsmessung

7. Konzentrations- und Disparitätsmessung 7. Konzentrations- und Disparitätsmessung Betrachte: Merkmal X, bei dem alle Daten x i 0 sind und die Merkmalssumme n i=1 x i eine sinnvolle Interpretation besitzt (extensives Merkmal) 314 Beispiel: X:

Mehr

8. Statistik Beispiel Noten. Informationsbestände analysieren Statistik

8. Statistik Beispiel Noten. Informationsbestände analysieren Statistik Informationsbestände analysieren Statistik 8. Statistik Nebst der Darstellung von Datenreihen bildet die Statistik eine weitere Domäne für die Auswertung von Datenbestände. Sie ist ein Fachgebiet der Mathematik

Mehr

Lagemaße Übung. Zentrale Methodenlehre, Europa Universität - Flensburg

Lagemaße Übung. Zentrale Methodenlehre, Europa Universität - Flensburg Lagemaße Übung M O D U S, M E D I A N, M I T T E L W E R T, M O D A L K L A S S E, M E D I A N, K L A S S E, I N T E R P O L A T I O N D E R M E D I A N, K L A S S E M I T T E Zentrale Methodenlehre, Europa

Mehr

Wahrscheinlichkeits - rechnung und Statistik

Wahrscheinlichkeits - rechnung und Statistik Michael Sachs Mathematik-Studienhilfen Wahrscheinlichkeits - rechnung und Statistik für Ingenieurstudenten an Fachhochschulen 4., aktualisierte Auflage 2.2 Eindimensionale Häufigkeitsverteilungen 19 absolute

Mehr

Anteile Häufigkeiten Verteilungen Lagemaße Streuungsmaße Merkmale von Verteilungen. Anteile Häufigkeiten Verteilungen

Anteile Häufigkeiten Verteilungen Lagemaße Streuungsmaße Merkmale von Verteilungen. Anteile Häufigkeiten Verteilungen DAS THEMA: VERTEILUNGEN LAGEMAßE - STREUUUNGSMAßE Anteile Häufigkeiten Verteilungen Lagemaße Streuungsmaße Merkmale von Verteilungen Anteile Häufigkeiten Verteilungen Anteile und Häufigkeiten Darstellung

Mehr

Dr. I. Fahrner WiSe 2016/17 Fakultät Grundlagen Hochschule Esslingen Übungsblatt 2. Statistik

Dr. I. Fahrner WiSe 2016/17 Fakultät Grundlagen Hochschule Esslingen Übungsblatt 2. Statistik Dr. I. Fahrner WiSe 2016/17 Fakultät Grundlagen 6.10.2016 Hochschule Esslingen Übungsblatt 2 Statistik Stichworte: arithmetischer Mittelwert, empirische Varianz, empirische Standardabweichung, empirischer

Mehr

90-minütige Klausur Statistik für Studierende der Kommunikationswissenschaft

90-minütige Klausur Statistik für Studierende der Kommunikationswissenschaft Prof. Dr. Helmut Küchenhoff SS08 90-minütige Klausur Statistik für Studierende der Kommunikationswissenschaft am 22.7.2008 Anmerkungen Überprüfen Sie bitte sofort, ob Ihre Angabe vollständig ist. Sie sollte

Mehr

WISTA WIRTSCHAFTSSTATISTIK

WISTA WIRTSCHAFTSSTATISTIK WISTA WIRTSCHAFTSSTATISTIK PROF DR ROLF HÜPEN FAKULTÄT FÜR WIRTSCHAFTSWISSENSCHAFT Seminar für Theoretische Wirtschaftslehre Vorlesungsprogramm 07052013 Mittelwerte und Lagemaße II 1 Anwendung und Berechnung

Mehr

Lernrückblick. 1 a) Ich weiß, wie ich ein Schrägbild in der Kabinettprojektion zeichne: 2 a) Ich kann einen Körper aus folgenden Ansichten zeichnen:

Lernrückblick. 1 a) Ich weiß, wie ich ein Schrägbild in der Kabinettprojektion zeichne: 2 a) Ich kann einen Körper aus folgenden Ansichten zeichnen: 1 a) Ich weiß, wie ich ein Schrägbild in der Kabinettprojektion zeichne: b) Beispiel 2 a) Ich kann einen Körper aus folgenden Ansichten zeichnen: b) Beispiel 3 Entscheide dich. Ich fühle mich fit im Bereich

Mehr

Gemeinsame Wahrscheinlichkeitsverteilungen

Gemeinsame Wahrscheinlichkeitsverteilungen Gemeinsame Wahrscheinlichkeitsverteilungen Worum geht es in diesem Modul? Gemeinsame Wahrscheinlichkeits-Funktion zweier Zufallsvariablen Randverteilungen Bedingte Verteilungen Unabhängigkeit von Zufallsvariablen

Mehr

ÜBUNGSAUFGABEN ZUR DESKRIPTIVEN UND EXPLORATIVEN DATENANALYSE

ÜBUNGSAUFGABEN ZUR DESKRIPTIVEN UND EXPLORATIVEN DATENANALYSE ÜBUNGSAUFGABEN ZUR DESKRIPTIVEN UND EXPLORATIVEN DATENANALYSE 1.1 Füllen Sie bitte folgenden Lückentext aus. Daten, die in Untersuchungen erhoben werden, muss man grundsätzlich nach ihrem unterscheiden.

Mehr

Mathematische Statistik. Zur Notation

Mathematische Statistik. Zur Notation Mathematische Statistik dient dazu, anhand von Stichproben Informationen zu gewinnen. Während die Wahrscheinlichkeitsrechnung Prognosen über das Eintreten zufälliger (zukünftiger) Ereignisse macht, werden

Mehr

VS PLUS

VS PLUS VS PLUS Zusatzinformationen zu Medien des VS Verlags Statistik II Inferenzstatistik 2010 Übungsaufgaben und Lösungen Inferenzstatistik 2 [Übungsaufgaben und Lösungenn - Inferenzstatistik 2] ÜBUNGSAUFGABEN

Mehr

2.3 Univariate Datenanalyse in R

2.3 Univariate Datenanalyse in R 2.3. UNIVARIATE DATENANALYSE IN R 47 2.3 Univariate Datenanalyse in R Wir wollen nun lernen, wie man in R Daten elementar analysiert. R bietet eine interaktive Umgebung, Befehlsmodus genannt, in der man

Mehr

Verteilungsfunktion und Quantile

Verteilungsfunktion und Quantile Statistik 1 für SoziologInnen Verteilungsfunktion und Quantile Univ.Prof. Dr. Marcus Hudec Kumulierte Häufigkeiten Hinweis: Damit das Kumulieren inhaltlich sinnvoll ist, muss das Merkmal zumindest ordinal

Mehr

Grundlagen der Statistik I

Grundlagen der Statistik I NWB-Studienbücher Wirtschaftswissenschaften Grundlagen der Statistik I Beschreibende Verfahren Von Professor Dr. Jochen Schwarze 10. Auflage Verlag Neue Wirtschafts-Briefe Herne/Berlin Inhaltsverzeichnis

Mehr

Grundlegende Eigenschaften von Punktschätzern

Grundlegende Eigenschaften von Punktschätzern Grundlegende Eigenschaften von Punktschätzern Worum geht es in diesem Modul? Schätzer als Zufallsvariablen Vorbereitung einer Simulation Verteilung von P-Dach Empirische Lage- und Streuungsparameter zur

Mehr

Korrelationsmatrix. Statistische Bindungen zwischen den N Zufallsgrößen werden durch die Korrelationsmatrix vollständig beschrieben:

Korrelationsmatrix. Statistische Bindungen zwischen den N Zufallsgrößen werden durch die Korrelationsmatrix vollständig beschrieben: Korrelationsmatrix Bisher wurden nur statistische Bindungen zwischen zwei (skalaren) Zufallsgrößen betrachtet. Für den allgemeineren Fall einer Zufallsgröße mit N Dimensionen bietet sich zweckmäßiger Weise

Mehr

13,86. Schritt 4: Berechnung des Quartilsabstandes. Unteres Quartil! #5,5.

13,86. Schritt 4: Berechnung des Quartilsabstandes. Unteres Quartil! #5,5. Lösung Aufgabe A1 Detaillierter Lösungsweg: Schritt 1: Prüfung, ob die gegebene Messreihe sortiert ist, In diesem Beispiel ist dies der Fall und wir haben insgesamt 22 Messungen. Schritt 2: Berechnen des

Mehr

Kontingenzkoeffizient (nach Pearson)

Kontingenzkoeffizient (nach Pearson) Assoziationsmaß für zwei nominale Merkmale misst die Unabhängigkeit zweier Merkmale gibt keine Richtung eines Zusammenhanges an 46 o jl beobachtete Häufigkeiten der Kombination von Merkmalsausprägungen

Mehr

Funktionen in der Mathematik

Funktionen in der Mathematik R. Brinkmann http://brinkmann-du.de Seite 05.0.008 Funktionen in der Mathematik Bei der mathematischen Betrachtung natürlicher, technischer oder auch alltäglicher Vorgänge hängt der Wert einer Größe oft

Mehr

FAKTORIELLE VERSUCHSPLÄNE. Andreas Handl

FAKTORIELLE VERSUCHSPLÄNE. Andreas Handl FAKTORIELLE VERSUCHSPLÄNE Andreas Handl 1 Inhaltsverzeichnis 1 Versuchsplanung 4 2 Einfaktorielle Varianzanalyse 6 2.1 DieAnnahmen... 6 2.2 Die ANOVA-Tabelle und der F -Test... 6 2.3 Versuche mit zwei

Mehr

Mathematische und statistische Methoden I

Mathematische und statistische Methoden I Prof. Dr. G. Meinhardt 6. Stock, Wallstr. 3 (Raum 06-206) Sprechstunde jederzeit nach Vereinbarung und nach der Vorlesung. Mathematische und statistische Methoden I Dr. Malte Persike persike@uni-mainz.de

Mehr

Parametrische vs. Non-Parametrische Testverfahren

Parametrische vs. Non-Parametrische Testverfahren Parametrische vs. Non-Parametrische Testverfahren Parametrische Verfahren haben die Besonderheit, dass sie auf Annahmen zur Verteilung der Messwerte in der Population beruhen: die Messwerte sollten einer

Mehr

Hinweis: Es sind 4 aus 6 Aufgaben zu bearbeiten. Werden mehr als 4 Aufgaben bearbeitet, werden nur die ersten vier Aufgaben gewertet.

Hinweis: Es sind 4 aus 6 Aufgaben zu bearbeiten. Werden mehr als 4 Aufgaben bearbeitet, werden nur die ersten vier Aufgaben gewertet. 11.01.2012 Prof. Dr. Ingo Klein Klausur zur VWA-Statistik Hinweis: Es sind 4 aus 6 Aufgaben zu bearbeiten. Werden mehr als 4 Aufgaben bearbeitet, werden nur die ersten vier Aufgaben gewertet. Aufgabe 1:

Mehr

Formale Methoden der Ökonomik: Einführung in die empirische Wirtschaftsforschung

Formale Methoden der Ökonomik: Einführung in die empirische Wirtschaftsforschung Übung Formale Methoden der Ökonomik: Einführung in die empirische Wirtschaftsforschung BACHELOR FT 2013 (HSU) Übung Emp. WiFo FT 2013 1 / 1 Maßzahlen für den Zusammenhang zwischen Merkmalen Kontingenztabelle:

Mehr

Übung 1: Wiederholung Wahrscheinlichkeitstheorie

Übung 1: Wiederholung Wahrscheinlichkeitstheorie Übung 1: Wiederholung Wahrscheinlichkeitstheorie Ü1.1 Zufallsvariablen Eine Zufallsvariable ist eine Variable, deren numerischer Wert solange unbekannt ist, bis er beobachtet wird. Der Wert einer Zufallsvariable

Mehr

Inhaltsverzeichnis: Aufgaben zur Vorlesung Statistik Seite 1 von 10 Prof. Dr. Karin Melzer, Prof. Dr. Gabriele Gühring, Fakultät Grundlagen

Inhaltsverzeichnis: Aufgaben zur Vorlesung Statistik Seite 1 von 10 Prof. Dr. Karin Melzer, Prof. Dr. Gabriele Gühring, Fakultät Grundlagen Inhaltsverzeichnis: 1. Aufgabenlösungen... Lösung zu Aufgabe 1:... Lösung zu Aufgabe... Lösung zu Aufgabe 3... Lösung zu Aufgabe 4... Lösung zu Aufgabe 5... 3 Lösung zu Aufgabe... 3 Lösung zu Aufgabe 7...

Mehr

Übungsaufgaben zu Kapitel 2 und 3

Übungsaufgaben zu Kapitel 2 und 3 Inhaltsverzeichnis: Übungsaufgaben zu Kapitel 2 und 3... 2 Aufgabe 1... 2 Aufgabe 2... 2 Aufgabe 3... 2 Aufgabe 4... 3 Aufgabe 5... 3 Aufgabe 6... 3 Aufgabe 7... 4 Aufgabe 8... 4 Aufgabe 9... 5 Aufgabe

Mehr

Lösungsvorschläge zur Klausur Beschreibende Statistik und Wirtschaftsstatistik (Sommersemester 2013)

Lösungsvorschläge zur Klausur Beschreibende Statistik und Wirtschaftsstatistik (Sommersemester 2013) Lösungsvorschläge zur Klausur Beschreibende Statistik und Wirtschaftsstatistik (Sommersemester 203) Aufgabe (9 Punkte) Ein metrisches Merkmal X sei in einer Grundgesamtheit vom Umfang n = 200 diskret klassiert.

Mehr