a) Zeichnen Sie in das nebenstehende Streudiagramm mit Lineal eine Regressionsgerade ein, die Sie für passend halten.

Save this PDF as:
 WORD  PNG  TXT  JPG

Größe: px
Ab Seite anzeigen:

Download "a) Zeichnen Sie in das nebenstehende Streudiagramm mit Lineal eine Regressionsgerade ein, die Sie für passend halten."

Transkript

1 Statistik für Kommunikationswissenschaftler Wintersemester 2009/200 Vorlesung Prof. Dr. Helmut Küchenhoff Übung Cornelia Oberhauser, Monia Mahling, Juliane Manitz Thema 4 Homepage zur Veranstaltung: Lösung Aufgabe (Zusammenhang zwischen metrischen Merkmalen) Es wurden in einer Befragung zwei metrische Merkmale X und Y erhoben. Betrachten Sie dazu die Stichprobe S {(; 6), (; 8), (2; 5), (2; 6), (3; 5), (4; 2), (4; 3), (7; 4)} mit dem zugehörigen Streudiagramm: y x a) Zeichnen Sie in das nebenstehende Streudiagramm mit Lineal eine Regressionsgerade ein, die Sie für passend halten. y x

2 b) Berechnen Sie aus der oben stehenden Stichprobe S, die der Grafik zugrunde liegt, die Parameter a und b für die lineare Regression. x n ȳ n x i 8 y i 8 8 x i 8 [ ] y i 8 [ ] 39 4, s XY n 8 (x i x)(y i ȳ) 8 (x i x)(y i ȳ) [( 3)(6 4, 875) + ( 3)(8 4, 875) + (2 3)(5 4, 875) + (2 3)(6 4, 875) 7 +(3 3)(5 4, 875) + (4 3)(2 4, 875) + (4 3)(3 4, 875) + (7 3)(4 4, 875)] 8 2, 57 7 s 2 X n 8 (x i x) 2 8 (x i x) 2 7 [( 3) 2 + ( 3) 2 + (2 3) 2 + (2 3) 2 + (3 3) 2 + (4 3) 2 + (4 3) 2 + (7 3) 2] b s XY s 2 X 2, , 64 a ȳ b x 4, 875 ( 0, 64) 3 4, 875 +, 92 6, 8 c) Zeichnen Sie nun die Regressionsgerade mit den Parametern aus Teilaufgabe b) in die Grafik. Haben Sie sich verschätzt bei Ihrer freihand gezeichneten Geraden? Wie konnte das passieren? 2 Punkte zum Zeichnen nötig: Geradengleichung: y a + b x 6, 8 0, 64 x Punkt an der Stelle x 0: y 6, 8 0, , 8 (x i ; y i ) (0; 6, 8) Punkt an der Stelle x 8: y 6, 8 0, 64 8, 68 (x i ; y i ) (8;, 68) 2

3 y x Grund für Verschätzen: Der Punkt (7; 4) wurde bei der Freihandzeichnung nicht so wichtig genommen. d) Berechnen Sie den Korrelationskoeffizienten nach Pearson. Wie ist dieser zu interpretieren? 2, 57 s X s 2 aus b) X 4 2 s XY aus b) s 2 Y n 8 8 (y i ȳ) 2 8 (y i ȳ) 2 7 [(6 4, 875) 2 + (8 4, 875) 2 + (5 4, 875) 2 + (6 4, 875) 2 +(5 4, 875) 2 + (2 4, 875) 2 + (3 4, 875) 2 + (4 4, 875) 2] s Y 24, 875 3, 55 7 s 2 Y 3, 55, 88 r XY s XY s X s Y 2, 57 0, 683 2, 88 Interpretation: r XY 0, 683 bedeutet, dass zwischen X und Y ein mittlerer negativer Zusammenhang besteht. 3

4 e) Berechnen Sie nun das Bestimmtheitsmaß der Regression. Was fällt auf? Wie kann man den Wert interpretieren? s 2 Y aus d) 3, 55 ŷ i a + b x i 6, 8 0, 64 x i i x i ŷ i 6,6 2 6, , , , , , ,32 s 2 Ŷ n 8 (ŷ i ȳ) 2 8 (ŷ i ȳ) 2 7 [(6, 6 4, 875) 2 + (6, 6 4, 875) 2 + (5, 52 4, 875) 2 + (5, 52 4, 875) 2 +(4, 88 4, 875) 2 + (4, 24 4, 875) 2 + (4, 24 4, 875) 2 + (2, 32 4, 875) 2], 469, 64 7 r 2 s2 Ŷ s 2 Y, 64 0, 46 3, 55 r 2 XY ( 0, 683)2 0, 47 ist (bis auf Rundungsfehler) identisch mit r 2. Interpretation: Ungefähr 46% der Streuung von Y werden durch X erklärt. Lösung Aufgabe 2 (Zusammenhang zwischen metrischen Variablen) Bei sieben zufällig ausgewählten ProfessorInnen wurden die monatlichen Ausgaben für Kosmetikprodukte und Styling-Magazine (jeweils in e) erfragt. Außerdem wurde ihre durchschnittliche Aufenthaltsdauer pro Tag an der Universität erhoben (in Minuten). Die Ergebnisse finden Sie in untenstehender Tabelle. Die Merkmale werden mit folgenden Buchstaben identifiziert: ˆ X: Ausgaben für Kosmetika ˆ Y: Ausgaben für Styling-Magazine ˆ Z: Zeit an der Uni 4

5 Ausgaben Ausgaben Zeit an Kosmetika Styling-Magazine der Uni Für die Berechnungen sind als Hilfsgrößen gegeben: ˆ die empirischen Standardabweichungen s X 23, 6, s Y 9, 6 und s Z 64, 3 ˆ die Kovarianzen s XY 08, 6, s XZ 345, 2 und s Y Z 262, a) Berechnen Sie den gewöhnlichen Korrelationskoeffizienten für alle möglichen Zweierkombinationen der drei Merkmale in der Tabelle, also r XY, r XZ und r Y Z. Interpretieren Sie diese. Ändern sich die Korrelationskoeffizienten, wenn man die Variablen transformiert, also z.b. die Ausgaben in Dollar statt in Euro angibt? r XY s XY 08, 6 0, 48 s X s Y 23, 6 9, 6 Zwischen den Ausgaben für Kosmetika und den Ausgaben für Styling-Magazine besteht ein schwacher positiver linearer Zusammenhang. r XZ s XZ 345, 2 0, 89 s X s Z 23, 6 64, 3 Zwischen den Ausgaben für Kosmetika und der Zeit an der Uni besteht ein starker negativer linearer Zusammenhang. r Y Z s Y Z 262, 0, 42 s Y s Z 9, 6 64, 3 Zwischen den Ausgaben für Styling-Magazine und der Zeit an der Uni besteht ein schwacher negativer linearer Zusammenhang. Bei linearen Transformationen ändert sich der Korrelationskoeffizient nicht. b) Berechnen Sie nun den partiellen Korrelationskoeffizienten zwischen den beiden Merkmalen Ausgaben für Kosmetika und Ausgaben für Styling-Magazine (d.h. den Korrelationskoeffizienten ohne den Einfluss der Aufenthaltsdauer an der Uni ), also r XY Z. Nutzen Sie dabei die Ergebnisse aus Teilaufgabe a). Der partielle Korrelationskoeffizient zwischen Ausgaben für Kosmetika und Ausgaben für Styling- Magazine (gegeben die Zeit an der Uni) wird berechnet, weil man vermutet, dass die Zeit an der Uni beides beeinflusst. Die Ausgaben für Kosmetika und die Ausgaben für Styling-Magazine werden beide gehemmt durch den Umfang der Arbeitszeit. 5

6 r XY Z r XY r XZ r Y Z r 2 XZ r 2 Y Z 0, 48 [( 0, 89) ( 0, 42)] ( 0, 89)2 ( 0, 42) 2 0, 48 0, 37 0, 46 0, 92 0, 26 (vorher: r XY 0, 48) Welchen der beiden Werte würde man verwenden? Annahme, dass Z die Variablen X und Y beeinflusst, scheint realistisch r XY Z bevorzugen ( Einfluss von Z rausrechnen ) c) Berechnen Sie den Rangkorrelationskoeffizienten von Spearman zwischen den Ausgaben für Kosmetika und dem Uniaufenthalt, also rxz S. Interpretieren Sie diesen. Ränge vergeben (Bei gleichen Beobachtungen wird üblicherweise der Mittelwert der entsprechenden Ränge gebildet.) X Z U R(X) V R(Z) 4, ,5 6,5 6,5 5 3 r UV s UV s U s V dazu: s UV n (u i ū)(v i v) ū n v n u i 7 v i 7 7 u i 7 [ ] v i 7 [, , 5 +, 5 + 6, 5 + 3] s UV 7 7 (u i ū)(v i v) [(4 4)(, 5 4) + (3 4)(5 4) + (7 4)(4 4) + (2 4)(6, 5 4) 6 +(6 4)(, 5 4) + ( 4)(6, 5 4) + (5 4)(3 4)] ( 9, 5) 3,

7 s 2 U n 7 (u i ū) 2 7 (u i ū) 2 6 [(4 4) 2 + (3 4) 2 + (7 4) 2 + (2 4) 2 + (6 4) 2 + ( 4) 2 + (5 4) 2] 28 4, 67 6 s 2 V n 7 (v i v) 2 7 (v i v) 2 6 [(, 5 4) 2 + (5 4) 2 + (4 4) 2 + (6, 5 4) 2 + (, 5 4) 2 + (6, 5 4) 2 + (3 4) 2] 27 4, 5 6 Interpretation: r UV s UV s U s V 3, 25 4, 67 4, 5 0, 7 Zwischen den Ausgaben für Kosmetika und der Zeit an der Uni besteht ein mittlerer negativer monotoner Zusammenhang. (vorher: r XZ 0, 89) Welchen der beiden Werte würde man verwenden? Ausgaben für Kosmetika (X) Zeit in der Uni (Z) Entscheidung anhand des Streudiagramms linearer Zusammenhang sichtbar (außerdem: metrisches Merkmal, keine Ausreißer) Korrelationskoeffizient nach Pearson d) Können Sie aufgrund des Korrelationskoeffizienten in Teilaufgabe c) ein Aussage über den kausalen Zusammenhang dieser Merkmale machen? Kausalität heißt: X Y, Korrelationskoeffizienten messen aber X Y Kausalität generell nicht durch Beobachtungsdaten nachweisbar 7

8 ) gute Theorie nötig 2) zeitliche Abfolge (Ursache Wirkung) 3) Kontrollvariablen berücksichtigen e) In einfachen linearen Regressionsmodellen ergeben sich folgende Schätzungen für die Koeffizienten a (Achsenabschnitt) und b (Steigung): e) X i 26, 53 +, 9 Y i + E i e2) X i 22, 05 0, 33 Z i + F i e3) Y i 43, 95 0, 06 Z i + G i Zeichnen Sie die Regressionsgeraden in die zugehörigen Streudiagramme ein. Interpretieren Sie die einzelnen Koeffizienten. Ausgaben für Kosmetika (X) Ausgaben für Kosmetika (X) Ausgaben für Styling Magazine (Y) Zeit in der Uni (Z) Ausgaben für Styling Magazine (Y) Zeit in der Uni (Z) einfache lineare Regression e) wieder Berechnen von 2 Punkten Geradengleichung: X i 26, 53 +, 9 Y i + E i * Punkt an der Stelle Y i 0: X i 26, 53 +, , 53 (Y i ; X i ) (0; 26, 53) * Punkt an der Stelle Y i 30: X i 26, 53+, , 23 (Y i ; X i ) (30; 62, 23) Interpretation: * a 26, 53 Man erwartet, dass eine Person, die 0 Euro für Styling-Magazine ausgibt, 26,53 Euro für Kosmetika ausgibt. 8

9 Ausgaben für Kosmetika (X) Ausgaben für Styling Magazine (Y) Ausgaben für Kosmetika (X) Zeit in der Uni (Z) Ausgaben für Styling Magazine (Y) Zeit in der Uni (Z) * b, 9 Gibt eine Person Euro mehr für Styling-Magazine aus, so erwartet man, dass diese,9 Euro mehr für Kosmetika ausgibt. e2) Geradengleichung: X i 22, 05 0, 33 Z i + F i * Punkt an der Stelle Z i 0: X i 22, 05 0, , 05 (Z i ; X i ) (0; 22, 05) * Punkt an der Stelle Z i 700: X i 22, 05 0, , 95 (Z i ; X i ) (700; 8, 95) Interpretation: * a 22, 05 nicht sinnvoll interpretierbar (es gibt keinen Professor/keine Professorin, die nie an der Uni ist) * b 0, 33 Ist eine Person Minute länger an der Uni, so erwartet man, dass diese 0,33 Euro weniger für Kosmetika ausgibt. e3) Geradengleichung: Y i 43, 95 0, 06 Z i + G i * Punkt an der Stelle Z i 0: Y i 43, 95 0, , 95 (Z i ; Y i ) (0; 43, 95) * Punkt an der Stelle Z i 700: Y i 43, 95 0, , 94 (Z i ; Y i ) (700;, 94) Interpretation: * a 43, 95 nicht sinnvoll interpretierbar 9

10 * b 0, 06 Ist eine Person Minute länger in der Uni, so erwartet man, dass diese 0,06 Euro weniger für Styling-Magazine ausgibt. f) In einem multiplen linearen Regressionsmodell ergeben sich folgende Schätzungen für die Koeffizienten: X i 98, 4 + 0, 3 Y i 0, 3 Z i + E i Interpretieren Sie die einzelnen Koeffizienten. Vergleichen Sie diese mit den Koeffizienten aus Teilaufgabe e). Interpretation: a 98, 4 nicht sinnvoll interpretierbar b 0, 3 Gibt eine Person Euro mehr für Styling-Magazine aus, so erwartet man, dass diese 0,3 Euro mehr für Kosmetika ausgibt, wenn sie die gleiche Zeit an der Uni verbringt. b 2 0, 3 Bei einer Person, die Minute länger an der Uni ist, erwartet man, dass diese 0,3 Euro weniger für Kosmetika ausgibt, wenn sie die gleichen Ausgaben für Styling-Magazine hat. Vergleich: b 0, 3 ist kleiner als, 9 in e) b 2 0, 3 ist größer als 0, 33 in e) Lösung Aufgabe 3 (Zusammenhang zwischen nominalen Merkmalen) In einer Stichprobe S {s,..., s 0 } werden zwei Untersuchungsmerkmale X und Y erhoben. Dabei sei X das Geschlecht und Y der Familienstand der Untersuchungseinheiten. Man erhält folgende Daten: g i x i y i g männlich ledig g 2 weiblich ledig g 3 männlich ledig g 4 männlich verheiratet g 5 männlich ledig g 6 männlich ledig g 7 weiblich geschieden g 8 weiblich geschieden g 9 männlich verheiratet g 0 männlich ledig 0

11 a) Übertragen Sie die Daten in eine Häufigkeitstabelle. Wie kann man diese Tabelle noch nennen? Welche Information geht beim Übergang in die Tabellenform verloren? Familienstand Geschlecht ledig verheiratet geschieden Summe männlich weiblich Summe Weitere Bezeichnungen für diese Tabelle: Kontingenztabelle, Kontingenztafel, Kreuztabelle Bei der Darstellung in Tabellenform geht bis auf die Reihenfolge der Beobachtungen keine Information der ursprünglichen Daten verloren. b) Benennen Sie anhand der erstellten Tabelle in a) die Klasse C 2 und geben Sie ihre absolute Häufigkeit n 2 an. C 2 Klasse der verheirateten Männer (erste Zahl im Index gibt die Zeile an, zweite Zahl die Spalte) absolute Häufigkeit n 2 2 (Lösung abhängig von der Tabelle in a). Es könnte dort auch in der ersten Zeile weiblich stehen und in der zweiten Zeile männlich. Außerdem könnte auch der Familienstand in einer anderen Reihenfolge in der Tabelle erscheinen.) c) Was gibt die Summe der absoluten Häufigkeiten n 2j (die Summe aller Zellen in der zweiten Zeile) an? Wie lautet die abkürzende Schreibweise für diese Summe? Summe der absoluten Häufigkeiten n 2j entspricht Anzahl der Frauen in der Studie abkürzende Schreibweise: 3 n 2j n 2 3 j d) Was gibt die Summe der absoluten Häufigkeiten n i (die Summe aller Zellen in der ersten Spalte) an? Wie lautet die abkürzende Schreibweise für diese Summe? Summe der absoluten Häufigkeiten n i enspricht Anzahl der ledigen Personen in der Studie abkürzende Schreibweise: 2 n i n 6 e) Sind beide Merkmale abhängig? Was bedeutet das? e n n 7 6 n , 2 5 n Die beiden Merkmale sind abhängig, die bedingten Verteilungen unterscheiden sich also von den Randverteilungen.

12 Lösung Aufgabe 4 (Zusammenhang zwischen nominalen Merkmalen) In der Medienstudie wurde erhoben, ob sich ein Computer im jeweiligen Haushalt befindet. Es ergab sich folgende Vierfeldertafel: Computer im Haushalt Geschlecht ja nein männlich weiblich a) Ergänzen Sie in der Tabelle die Randverteilung des Merkmals Geschlecht. Randverteilung des Merkmals Geschlecht: Computer im Haushalt Geschlecht ja nein männlich weiblich b) Finden Sie in der Tabelle die bedingte Verteilung des Geschlechts gegeben Computer im Haushalt nein. bedingte Verteilung des Geschlechts gegeben Computer im Haushalt nein Computer im Haushalt Geschlecht ja nein männlich 883 weiblich 607 c) Untersuchen Sie nun, ob das Geschlecht und die Variable Computer im Haushalt unabhängig voneinander sind. Zunächst muss die vollständige Tabelle mit allen Randhäufigkeiten und der Stichprobengröße erstellt werden: Computer im Haushalt Geschlecht ja nein männlich weiblich e n n n 2937 Die beiden Merkmale sind abhängig n 2

13 d) Gibt es einen Zusammenhang zwischen Geschlecht und Computer im Haushalt? Benutzen Sie eine gängige Maßzahl! Maßzahl für den Zusammenhang zwischen Geschlecht und Computer im Haushalt Korrelation? - nicht geeignet Quadratische Kontingenz χ 2 nicht normiert Kontingenzkoeffizient K normiert: K liegt zwischen 0 und Berechne zuerst die unter Unabhängigkeit erwarteten Häufigkeiten e ij n i n j n Beispiel: e n n n Diese erhält man am einfachsten in Tabellenform, indem man die Randhäufigkeiten der entsprechenden Zelle multipliziert und anschließend durch n teilt. Unabhängigkeitstabelle: Computer im Haushalt Geschlecht ja nein männlich weiblich χ 2 (n ij e ij ) 2 j e ij (967 9)2 ( ) , , , , 69 8, 32 + ( ) (607 55)2 55 Die quadratische Kontingenz ist nicht normiert, d.h. sie liegt in keinem festen Intervall. Somit ist ihr Wert nicht direkt interpretierbar. Kontingenzkoeffizienten berechnen t min{2, 2} 2 χ K 2 (χ 2 + n) (t )/t 8, 32 (8, ) (2 )/2 0, 02 0, Der Zusammenhang ist sehr schwach. 3

14 Lösung Aufgabe 5 (Zusammenhang zwischen metrischen und nominalen Merkmalen) Gegeben seien die Daten zum Alter von Beschäftigten von 3 Abteilungen einer Firma. Die Daten lauten folgendermaßen: Alter in Abteilung {35, 39, 32, 28, 33, 38, 39, 32, 35, 36}, Alter in Abteilung 2 {2, 8, 9, 24, 20, 2, 2, 2}, Alter in Abteilung 3 {39, 42, 38, 40, 42, 39, 44, 48, 42, 36, 47, 43}. a) Wie würden Sie den Zusammenhang zwischen dem Merkmal Abteilung und dem Merkmal Alter untersuchen? X: Merkmal Abteilung: diskret, nominal Y : Merkmal Alter: stetig, metrisch Korrelation? - geht nicht Kontingenzmaße? - geht nicht Für jede Abteilung separat die bedingte Verteilung des Alters gegeben die Abteilung anschauen. Charakterisiert werden diese Verteilungen dann mit den bekannten Lage- und Streuungsmaßzahlen. b) Welche graphische Darstellung würden Sie für diese Daten wählen und warum? Zeichnen Sie diese. Boxplot für jede Abteilung, da die Verteilung eines metrischen Merkmals in mehreren Gruppen verglichen werden soll Alter Abteilung 4

15 c) Beschreiben und interpretieren Sie die Abbildung. Vergleichen Sie die drei Gruppen. Beschreibung: Werte ablesen Minimum unteres Quartil Median oberes Quartil Maximum Abteilung Abteilung Abteilung Interpretation: In Abteilung ist die jüngste Person 28 Jahre alt; ein Viertel der Personen ist 32 Jahre alt oder jünger und drei Viertel sind 32 Jahre alt oder die Hälfte der Personen ist 35 Jahre alt oder jünger und die Hälfte ist 35 Jahre alt oder drei Viertel der Personen sind 37 Jahre alt oder jünger und ein Viertel ist 37 Jahre alt oder die älteste Person ist 39 Jahre alt. In Abteilung 2 ist die jüngste Person 8 Jahre alt; ein Viertel der Personen ist 20 Jahre alt oder jünger und drei Viertel sind 20 Jahre alt oder die Hälfte der Personen ist 2 Jahre alt oder jünger und die Hälfte ist 2 Jahre alt oder drei Viertel der Personen sind 2 Jahre alt oder jünger und ein Viertel ist 2 Jahre alt oder die älteste Person ist 24 Jahre alt. In Abteilung 3 ist die jüngste Person 36 Jahre alt; ein Viertel der Personen ist 39 Jahre alt oder jünger und drei Viertel sind 39 Jahre alt oder die Hälfte der Personen ist 42 Jahre alt oder jünger und die Hälfte ist 42 Jahre alt oder drei Viertel der Personen sind 43 Jahre alt oder jünger und ein Viertel ist 43 Jahre alt oder die älteste Person ist 48 Jahre alt. Vergleich: Generelles Niveau: Die Personen in Abteilung 2 sind am jüngsten. Die Personen in Abteilung sind wesentlich älter, während die Personen in Abteilung 3 sogar noch etwas älter sind. Vergleich einzelner Parameter: Dasselbe gilt für den Median, das untere Quartil, das obere Quartil, das Minimum und das Maximum des Alters in den drei Abteilungen. Vergleich des Quartilsabstandes und der Spannweite: Der Quartilsabstand ist in Abteilung 2 am kleinsten, gefolgt von Abteilung 3 und. Die Spannweite ist in Abteilung am kleinsten und in den Abteilungen und 3 ähnlich groß. 5

Lösung Aufgabe 1 (Regression) Es wurden in einer Befragung zwei metrische Merkmale X und Y erhoben. Betrachten Sie dazu die

Lösung Aufgabe 1 (Regression) Es wurden in einer Befragung zwei metrische Merkmale X und Y erhoben. Betrachten Sie dazu die Statistik für Kommunikationswissenschaftler Wintersemester 2010/2011 Vorlesung Prof. Dr. Nicole Krämer Übung Nicole Krämer, Cornelia Oberhauser, Monia Mahling Lösung Thema 9 Homepage zur Veranstaltung:

Mehr

5 Zusammenhangsmaße, Korrelation und Regression

5 Zusammenhangsmaße, Korrelation und Regression 5 Zusammenhangsmaße, Korrelation und Regression 5.1 Zusammenhangsmaße und Korrelation Aufgabe 5.1 In einem Hauptstudiumsseminar des Lehrstuhls für Wirtschafts- und Sozialstatistik machten die Teilnehmer

Mehr

Klausur zu Methoden der Statistik I (mit Kurzlösung) Wintersemester 2007/2008. Aufgabe 1

Klausur zu Methoden der Statistik I (mit Kurzlösung) Wintersemester 2007/2008. Aufgabe 1 Lehrstuhl für Statistik und Ökonometrie der Otto-Friedrich-Universität Bamberg Prof. Dr. Susanne Rässler Klausur zu Methoden der Statistik I (mit Kurzlösung) Wintersemester 2007/2008 Aufgabe 1 Ihnen liegt

Mehr

90-minütige Klausur Statistik für Studierende der Kommunikationswissenschaft

90-minütige Klausur Statistik für Studierende der Kommunikationswissenschaft Prof. Dr. Helmut Küchenhoff SS08 90-minütige Klausur Statistik für Studierende der Kommunikationswissenschaft am 22.7.2008 Anmerkungen Überprüfen Sie bitte sofort, ob Ihre Angabe vollständig ist. Sie sollte

Mehr

Kontingenzkoeffizient (nach Pearson)

Kontingenzkoeffizient (nach Pearson) Assoziationsmaß für zwei nominale Merkmale misst die Unabhängigkeit zweier Merkmale gibt keine Richtung eines Zusammenhanges an 46 o jl beobachtete Häufigkeiten der Kombination von Merkmalsausprägungen

Mehr

2. Deskriptive Statistik 2.1. Häufigkeitstabellen, Histogramme, empirische Verteilungsfunktionen

2. Deskriptive Statistik 2.1. Häufigkeitstabellen, Histogramme, empirische Verteilungsfunktionen 4. Datenanalyse und Modellbildung Deskriptive Statistik 2-1 2. Deskriptive Statistik 2.1. Häufigkeitstabellen, Histogramme, empirische Verteilungsfunktionen Für die Auswertung einer Messreihe, die in Form

Mehr

Zusammenhänge zwischen metrischen Merkmalen

Zusammenhänge zwischen metrischen Merkmalen Zusammenhänge zwischen metrischen Merkmalen Darstellung des Zusammenhangs, Korrelation und Regression Daten liegen zu zwei metrischen Merkmalen vor: Datenpaare (x i, y i ), i = 1,..., n Beispiel: x: Anzahl

Mehr

Analog zu Aufgabe 16.1 werden die Daten durch folgenden Befehl eingelesen: > kredit<-read.table("c:\\compaufg\\kredit.

Analog zu Aufgabe 16.1 werden die Daten durch folgenden Befehl eingelesen: > kredit<-read.table(c:\\compaufg\\kredit. Lösung 16.3 Analog zu Aufgabe 16.1 werden die Daten durch folgenden Befehl eingelesen: > kredit

Mehr

4. Erstellen von Klassen

4. Erstellen von Klassen Statistik mit Tabellenkalkulation 4. Erstellen von Klassen Mit einem einfachen Befehl lässt sich eine Liste von Zahlen auf die Häufigkeit der einzelnen Werte untersuchen. Verwenden Sie dazu den Befehl

Mehr

Einfache statistische Auswertungen mit dem TI-Nspire

Einfache statistische Auswertungen mit dem TI-Nspire 1. Neues Dokument und darin eine neue Seite anlegen Als Typ 6: Lists & Spreadsheet wählen. Darin die Messwerte in einer Spalte erfassen. Dies ergibt die Urliste. Wenn mehrere Messwerte vorliegen, die diejenigen,

Mehr

Korrelation - Regression. Berghold, IMI

Korrelation - Regression. Berghold, IMI Korrelation - Regression Zusammenhang zwischen Variablen Bivariate Datenanalyse - Zusammenhang zwischen 2 stetigen Variablen Korrelation Einfaches lineares Regressionsmodell 1. Schritt: Erstellung eines

Mehr

Datenanalyse mit Excel. Wintersemester 2013/14

Datenanalyse mit Excel. Wintersemester 2013/14 Datenanalyse mit Excel 1 KORRELATIONRECHNUNG 2 Korrelationsrechnung Ziel der Korrelationsrechnung besteht im bivariaten Fall darin, die Stärke des Zusammenhangs zwischen zwei interessierenden statistischen

Mehr

Profil A 49,3 48,2 50,7 50,9 49,8 48,7 49,6 50,1 Profil B 51,8 49,6 53,2 51,1 51,1 53,4 50,7 50 51,5 51,7 48,8

Profil A 49,3 48,2 50,7 50,9 49,8 48,7 49,6 50,1 Profil B 51,8 49,6 53,2 51,1 51,1 53,4 50,7 50 51,5 51,7 48,8 1. Aufgabe: Eine Reifenfirma hat für Winterreifen unterschiedliche Profile entwickelt. Bei jeweils gleicher Geschwindigkeit und auch sonst gleichen Bedingungen wurden die Bremswirkungen gemessen. Die gemessenen

Mehr

3.2 Bivariate Verteilungen

3.2 Bivariate Verteilungen 3.2 Bivariate Verteilungen zwei Variablen X, Y werden gemeinsam betrachtet (an jedem Objekt i, i = 1,..., n, werden gleichzeitig zwei Merkmale beobachtet) Beobachtungswerte sind Paare/Kombinationen von

Mehr

Webergänzung zu Kapitel 10

Webergänzung zu Kapitel 10 Webergänzung zu Kapitel 10 10.1.4 Varianzanalyse (ANOVA: analysis of variance) Im Kapitel 10 haben wir uns hauptsächlich mit Forschungsbeispielen beschäftigt, die nur zwei Ergebnissätze hatten (entweder

Mehr

Auswerten mit Excel. Viele Video-Tutorials auf Youtube z.b. http://www.youtube.com/watch?v=vuuky6xxjro

Auswerten mit Excel. Viele Video-Tutorials auf Youtube z.b. http://www.youtube.com/watch?v=vuuky6xxjro Auswerten mit Excel Viele Video-Tutorials auf Youtube z.b. http://www.youtube.com/watch?v=vuuky6xxjro 1. Pivot-Tabellen erstellen: In der Datenmaske in eine beliebige Zelle klicken Registerkarte Einfügen

Mehr

Teil II: Einführung in die Statistik

Teil II: Einführung in die Statistik Teil II: Einführung in die Statistik (50 Punkte) Bitte beantworten Sie ALLE Fragen. Es handelt sich um multiple choice Fragen. Sie müssen die exakte Antwortmöglichkeit angeben, um die volle Punktzahl zu

Mehr

Deskription, Statistische Testverfahren und Regression. Seminar: Planung und Auswertung klinischer und experimenteller Studien

Deskription, Statistische Testverfahren und Regression. Seminar: Planung und Auswertung klinischer und experimenteller Studien Deskription, Statistische Testverfahren und Regression Seminar: Planung und Auswertung klinischer und experimenteller Studien Deskriptive Statistik Deskriptive Statistik: beschreibende Statistik, empirische

Mehr

1 Darstellen von Daten

1 Darstellen von Daten 1 Darstellen von Daten BesucherInnenzahlen der Bühnen Graz in der Spielzeit 2010/11 1 Opernhaus 156283 Hauptbühne 65055 Probebühne 7063 Ebene 3 2422 Next Liberty 26800 Säulen- bzw. Balkendiagramm erstellen

Mehr

1,11 1,12 1,13 1,14 1,15 1,16 1,17 1,17 1,17 1,18

1,11 1,12 1,13 1,14 1,15 1,16 1,17 1,17 1,17 1,18 3. Deskriptive Statistik Ziel der deskriptiven (beschreibenden) Statistik (explorativen Datenanalyse) ist die übersichtliche Darstellung der wesentlichen in den erhobenen Daten enthaltene Informationen

Mehr

Prüfung zu Modul 26 (BA Bw) bzw. 10 (BA IB) (Wirtschaftsstatistik)

Prüfung zu Modul 26 (BA Bw) bzw. 10 (BA IB) (Wirtschaftsstatistik) 2 3 Klausur-Nr = Sitzplatz-Nr Prüfung zu Modul 26 (BA Bw) bzw. 10 (BA IB) (Wirtschaftsstatistik) Klausurteil 1: Beschreibende Statistik BeStat-1 (7 ) n = 400 Personen wurden gefragt, wie viele Stück eines

Mehr

Korrelation (II) Korrelation und Kausalität

Korrelation (II) Korrelation und Kausalität Korrelation (II) Korrelation und Kausalität Situation: Seien X, Y zwei metrisch skalierte Merkmale mit Ausprägungen (x 1, x 2,..., x n ) bzw. (y 1, y 2,..., y n ). D.h. für jede i = 1, 2,..., n bezeichnen

Mehr

Willkommen zur Vorlesung Statistik (Master)

Willkommen zur Vorlesung Statistik (Master) Willkommen zur Vorlesung Statistik (Master) Thema dieser Vorlesung: Verteilungsfreie Verfahren Prof. Dr. Wolfgang Ludwig-Mayerhofer Universität Siegen Philosophische Fakultät, Seminar für Sozialwissenschaften

Mehr

Statistik und Wahrscheinlichkeitsrechnung

Statistik und Wahrscheinlichkeitsrechnung Statistik und Wahrscheinlichkeitsrechnung Übung 2 28.02.2008 1 Inhalt der heutigen Übung Beschreibende Statistik Gemeinsames Lösen der Übungsaufgaben 2.1: Häufigkeitsverteilung 2.2: Tukey Boxplot 25:Korrelation

Mehr

Klausur zu Methoden der Statistik I (mit Kurzlösung) Sommersemester 2008. Aufgabe 1

Klausur zu Methoden der Statistik I (mit Kurzlösung) Sommersemester 2008. Aufgabe 1 Lehrstuhl für Statistik und Ökonometrie der Otto-Friedrich-Universität Bamberg Prof. Dr. Susanne Rässler Klausur zu Methoden der Statistik I (mit Kurzlösung) Sommersemester 2008 Aufgabe 1 I) Einige Mitarbeiter

Mehr

Einfache statistische Auswertungen mit dem Programm SPSS

Einfache statistische Auswertungen mit dem Programm SPSS Einfache statistische Auswertungen mit dem Programm SPSS Datensatz: fiktive_daten.sav Dipl. Päd. Anne Haßelkus Dr. Dorothea Dette-Hagenmeyer 11/2011 Überblick 1 Deskriptive Statistiken; Mittelwert berechnen...

Mehr

Multiple Regression. Ziel: Vorhersage der Werte einer Variable (Kriterium) bei Kenntnis der Werte von zwei oder mehr anderen Variablen (Prädiktoren)

Multiple Regression. Ziel: Vorhersage der Werte einer Variable (Kriterium) bei Kenntnis der Werte von zwei oder mehr anderen Variablen (Prädiktoren) Multiple Regression 1 Was ist multiple lineare Regression? Ziel: Vorhersage der Werte einer Variable (Kriterium) bei Kenntnis der Werte von zwei oder mehr anderen Variablen (Prädiktoren) Annahme: Der Zusammenhang

Mehr

Franz Kronthaler. Statistik angewandt. Datenanalyse ist (k)eine Kunst. Excel Edition. ^ Springer Spektrum

Franz Kronthaler. Statistik angewandt. Datenanalyse ist (k)eine Kunst. Excel Edition. ^ Springer Spektrum Franz Kronthaler Statistik angewandt Datenanalyse ist (k)eine Kunst Excel Edition ^ Springer Spektrum Inhaltsverzeichnis Teil I Basiswissen und Werkzeuge, um Statistik anzuwenden 1 Statistik ist Spaß 3

Mehr

Expertenrunde Gruppe 1: Wiederholungsgruppe EXCEL (Datenerfassung, Darstellungsformen, Verwertung)

Expertenrunde Gruppe 1: Wiederholungsgruppe EXCEL (Datenerfassung, Darstellungsformen, Verwertung) Epertenrunde Gruppe 1: Wiederholungsgruppe EXCEL (Datenerfassung, Darstellungsformen, Verwertung) Im Folgenden wird mit Hilfe des Programms EXEL, Version 007, der Firma Microsoft gearbeitet. Die meisten

Mehr

Fortgeschrittene Statistik Logistische Regression

Fortgeschrittene Statistik Logistische Regression Fortgeschrittene Statistik Logistische Regression O D D S, O D D S - R A T I O, L O G I T T R A N S F O R M A T I O N, I N T E R P R E T A T I O N V O N K O E F F I Z I E N T E N, L O G I S T I S C H E

Mehr

Dokumentation. estat Version 2.0

Dokumentation. estat Version 2.0 Dokumentation estat Version 2.0 Installation Die Datei estat.xla in beliebiges Verzeichnis speichern. Im Menü Extras AddIns... Durchsuchen die Datei estat.xla auswählen. Danach das Auswahlhäkchen beim

Mehr

Analyse bivariater Kontingenztafeln

Analyse bivariater Kontingenztafeln Analyse bivariater Kontingenztafeln Werden zwei kategoriale Merkmale mit nicht zu vielen möglichen Ausprägungen gemeinsam analysiert, so kommen zur Beschreibung der gemeinsamen Verteilung im allgemeinen

Mehr

Häufigkeitstabellen. Balken- oder Kreisdiagramme. kritischer Wert für χ2-test. Kontingenztafeln

Häufigkeitstabellen. Balken- oder Kreisdiagramme. kritischer Wert für χ2-test. Kontingenztafeln Häufigkeitstabellen Menüpunkt Data PivotTable Report (bzw. entsprechendes Icon): wähle Data Range (Zellen, die die Daten enthalten + Zelle mit Variablenname) wähle kategoriale Variable für Spalten- oder

Mehr

Dr. Maike M. Burda. Welchen Einfluss hat die Körperhöhe auf das Körpergewicht? Eine Regressionsanalyse. HU Berlin, Econ Bootcamp 7.-9.

Dr. Maike M. Burda. Welchen Einfluss hat die Körperhöhe auf das Körpergewicht? Eine Regressionsanalyse. HU Berlin, Econ Bootcamp 7.-9. Dr. Maike M. Burda Welchen Einfluss hat die Körperhöhe auf das Körpergewicht? Eine Regressionsanalyse. HU Berlin, Econ Bootcamp 7.-9. Januar 2011 BOOTDATA11.GDT: 250 Beobachtungen für die Variablen...

Mehr

Sozialwissenschaftliche Fakultät der Universität Göttingen. Sommersemester 2009. Statistik mit SPSS

Sozialwissenschaftliche Fakultät der Universität Göttingen. Sommersemester 2009. Statistik mit SPSS Sommersemester 2009 Statistik mit SPSS 15. Mai 2009 15. Mai 2009 Statistik Dozentin: mit Esther SPSSOchoa Fernández 1 Überblick 1. Korrelationsanalysen Kovariation und Kovarianz Korrelation: - Interpretation

Mehr

3.1 Zusammenhang zwischen einem qualitativen und einem quantitativen Merkmal

3.1 Zusammenhang zwischen einem qualitativen und einem quantitativen Merkmal Kapitel 3 Bivariate Analyse In Kapitel 2 haben wir gesehen, wie man ein Merkmal auswertet. Mit Hilfe statistischer Verfahren kann man aber auch untersuchen, ob zwischen mehreren Merkmalen Abhängigkeiten

Mehr

Einseitig gerichtete Relation: Mit zunehmender Höhe über dem Meeresspiegel sinkt im allgemeinen die Lufttemperatur.

Einseitig gerichtete Relation: Mit zunehmender Höhe über dem Meeresspiegel sinkt im allgemeinen die Lufttemperatur. Statistik Grundlagen Charakterisierung von Verteilungen Einführung Wahrscheinlichkeitsrechnung Wahrscheinlichkeitsverteilungen Schätzen und Testen Korrelation Regression Einführung Die Analyse und modellhafte

Mehr

Prüfung zu Modul 26 (BA Bw) bzw. 10 (BA IB) (Wirtschaftsstatistik)

Prüfung zu Modul 26 (BA Bw) bzw. 10 (BA IB) (Wirtschaftsstatistik) 2 Klausur-Nr = Sitzplatz-Nr Prüfung zu Modul 26 (BA Bw) bzw. 10 (BA IB) (Wirtschaftsstatistik) Klausurteil 1: Beschreibende Statistik Name, Vorname:... verteilung Teil 1: Beschreibende Statistik Aufgaben

Mehr

Grundlagen der empirischen Sozialforschung

Grundlagen der empirischen Sozialforschung Grundlagen der empirischen Sozialforschung Sitzung 11 - Datenanalyseverfahren Jan Finsel Lehrstuhl für empirische Sozialforschung Prof. Dr. Petra Stein 5. Januar 2009 1 / 22 Online-Materialien Die Materialien

Mehr

Einfache Statistiken in Excel

Einfache Statistiken in Excel Einfache Statistiken in Excel Dipl.-Volkswirtin Anna Miller Bergische Universität Wuppertal Schumpeter School of Business and Economics Lehrstuhl für Internationale Wirtschaft und Regionalökonomik Raum

Mehr

Es können keine oder mehrere Antworten richtig sein. Eine Frage ist NUR dann richtig beantwortet, wenn ALLE richtigen Antworten angekreuzt wurden.

Es können keine oder mehrere Antworten richtig sein. Eine Frage ist NUR dann richtig beantwortet, wenn ALLE richtigen Antworten angekreuzt wurden. Teil III: Statistik Alle Fragen sind zu beantworten. Es können keine oder mehrere Antworten richtig sein. Eine Frage ist NUR dann richtig beantwortet, wenn ALLE richtigen Antworten angekreuzt wurden. Wird

Mehr

Statistische Methoden in den Umweltwissenschaften

Statistische Methoden in den Umweltwissenschaften Statistische Methoden in den Umweltwissenschaften Korrelationsanalysen Kreuztabellen und χ²-test Themen Korrelation oder Lineare Regression? Korrelationsanalysen - Pearson, Spearman-Rang, Kendall s Tau

Mehr

1 x 1 y 1 2 x 2 y 2 3 x 3 y 3... n x n y n

1 x 1 y 1 2 x 2 y 2 3 x 3 y 3... n x n y n 3.2. Bivariate Verteilungen zwei Variablen X, Y werden gemeinsam betrachtet (an jedem Objekt werden gleichzeitig zwei Merkmale beobachtet) Beobachtungswerte sind Paare von Merkmalsausprägungen (x, y) Beispiele:

Mehr

Lösungen zur Klausur zur Statistik Übung am

Lösungen zur Klausur zur Statistik Übung am Lösungen zur Klausur zur Statistik Übung am 28.06.2013 Fabian Kleine Staatswissenschaftliche Fakultät Aufgabe 1 Gegeben sei die folgende geordneten Urliste des Merkmals Y. 30 Punkte Y : 5 5 5 5 10 10 10

Mehr

Eine computergestützte Einführung mit

Eine computergestützte Einführung mit Thomas Cleff Deskriptive Statistik und Explorative Datenanalyse Eine computergestützte Einführung mit Excel, SPSS und STATA 3., überarbeitete und erweiterte Auflage ^ Springer Inhaltsverzeichnis 1 Statistik

Mehr

Einige Statistische Tests für den Ein- Zwei- und k-stichprobenfall (Nach Sachs, Stat. Meth.)

Einige Statistische Tests für den Ein- Zwei- und k-stichprobenfall (Nach Sachs, Stat. Meth.) ue biostatistik: nichtparametrische testverfahren / ergänzung 1/6 h. Lettner / physik Statistische Testverfahren Einige Statistische Tests für den Ein- Zwei- und k-stichprobenfall (Nach Sachs, Stat. Meth.)

Mehr

Dr. Maike M. Burda. Welchen Einfluss hat die Körperhöhe auf das Körpergewicht? Eine Regressionsanalyse. HU Berlin, Econ Bootcamp

Dr. Maike M. Burda. Welchen Einfluss hat die Körperhöhe auf das Körpergewicht? Eine Regressionsanalyse. HU Berlin, Econ Bootcamp Dr. Maike M. Burda Welchen Einfluss hat die Körperhöhe auf das Körpergewicht? Eine Regressionsanalyse. HU Berlin, Econ Bootcamp 8.-10. Januar 2010 BOOTDATA.GDT: 250 Beobachtungen für die Variablen... cm:

Mehr

SAS-Vertiefung zur Statistischen Software im SS 2010 Übungsaufgaben

SAS-Vertiefung zur Statistischen Software im SS 2010 Übungsaufgaben SAS-Vertiefung zur Statistischen Software im SS 2010 Übungsaufgaben Helmut Küchenhoff, Cornelia Oberhauser, Monia Mahling, Armin Monecke Im Folgenden gibt es 4 Aufgabenblöcke. Block 1: Daten einlesen,

Mehr

Eine zweidimensionale Stichprobe

Eine zweidimensionale Stichprobe Eine zweidimensionale Stichprobe liegt vor, wenn zwei qualitative Merkmale gleichzeitig betrachtet werden. Eine Urliste besteht dann aus Wertepaaren (x i, y i ) R 2 und hat die Form (x 1, y 1 ), (x 2,

Mehr

Statistik I. 1. Klausur Wintersemester 2010/2011 Hamburg, Art der Anmeldung: STiNE FlexNow Zulassung unter Vorbehalt

Statistik I. 1. Klausur Wintersemester 2010/2011 Hamburg, Art der Anmeldung: STiNE FlexNow Zulassung unter Vorbehalt Statistik I 1. Klausur Wintersemester 2010/2011 Hamburg, 11.02.2011 BITTE LESERLICH IN DRUCKBUCHSTABEN AUSFÜLLEN! Nachname:............................................................................ Vorname:.............................................................................

Mehr

Streuungsmaße von Stichproben

Streuungsmaße von Stichproben Streuungsmaße von Stichproben S P A N N W E I T E, V A R I A N Z, S T A N D A R D A B W E I C H U N G, Q U A R T I L E, K O V A R I A N Z, K O R R E L A T I O N S K O E F F I Z I E N T Zentrale Methodenlehre,

Mehr

Korrelation. Übungsbeispiel 1. Übungsbeispiel 4. Übungsbeispiel 2. Übungsbeispiel 3. Korrel.dtp Seite 1

Korrelation. Übungsbeispiel 1. Übungsbeispiel 4. Übungsbeispiel 2. Übungsbeispiel 3. Korrel.dtp Seite 1 Korrelation Die Korrelationsanalyse zeigt Zusammenhänge auf und macht Vorhersagen möglich Was ist Korrelation? Was sagt die Korrelationszahl aus? Wie geht man vor? Korrelation ist eine eindeutige Beziehung

Mehr

Teil I: Deskriptive Statistik

Teil I: Deskriptive Statistik Teil I: Deskriptive Statistik 2 Grundbegriffe 2.1 Merkmal und Stichprobe 2.2 Skalenniveau von Merkmalen 2.3 Geordnete Stichproben und Ränge 2.1 Merkmal und Stichprobe An (geeignet ausgewählten) Untersuchungseinheiten

Mehr

Repetitionsaufgaben: Lineare Funktionen

Repetitionsaufgaben: Lineare Funktionen Kantonale Fachschaft Mathematik Repetitionsaufgaben: Lineare Funktionen Zusammengestellt von Irina Bayer-Krakvina, KSR Lernziele: - Wissen, was ein Steigungsdreieck einer Geraden ist und wie die Steigungszahl

Mehr

Standardisierung von Daten Darstellung von Daten in Texten, Tabellen und Abbildungen. Standardisierung von Daten

Standardisierung von Daten Darstellung von Daten in Texten, Tabellen und Abbildungen. Standardisierung von Daten DAS THEMA: TABELLEN UND ABBILDUNGEN Standardisierung von Daten Darstellung von Daten in Texten, Tabellen und Abbildungen Standardisierung von Daten z-standardisierung Standardnormalverteilung 1 DIE Z-STANDARDISIERUNG

Mehr

Karl Entacher. FH-Salzburg

Karl Entacher. FH-Salzburg Ahorn Versteinert Bernhard.Zimmer@fh-salzburg.ac.at Statistik @ HTK Karl Entacher FH-Salzburg karl.entacher@fh-salzburg.ac.at Beispiel 3 Gegeben sind 241 NIR Spektren (Vektoren der Länge 223) zu Holzproben

Mehr

Schätzung des Lifetime Values von Spendern mit Hilfe der Überlebensanalyse

Schätzung des Lifetime Values von Spendern mit Hilfe der Überlebensanalyse Schätzung Lifetime Values von Spenn mit Hilfe Überlebensanalyse Einführung in das Verfahren am Beispiel Einzugsgenehmigung Überlebensanalysen o Ereignisdatenanalysen behandeln das Problem, mit welcher

Mehr

Ermitteln Sie auf 2 Dezimalstellen genau die folgenden Kenngrößen der bivariaten Verteilung der Merkmale Weite und Zeit:

Ermitteln Sie auf 2 Dezimalstellen genau die folgenden Kenngrößen der bivariaten Verteilung der Merkmale Weite und Zeit: 1. Welche der folgenden Kenngrößen, Statistiken bzw. Grafiken sind zur Beschreibung der Werteverteilung des Merkmals Konfessionszugehörigkeit sinnvoll einsetzbar? A. Der Modalwert. B. Der Median. C. Das

Mehr

Einführung in statistische Analysen

Einführung in statistische Analysen Einführung in statistische Analysen Andreas Thams Econ Boot Camp 2008 Wozu braucht man Statistik? Statistik begegnet uns jeden Tag... Weihnachten macht Deutschen Einkaufslaune. Im Advent überkommt die

Mehr

Statistik I. Zusammenfassung und wichtiges zur Prüfungsvorbereitung. Malte Wissmann. 9. Dezember Universität Basel.

Statistik I. Zusammenfassung und wichtiges zur Prüfungsvorbereitung. Malte Wissmann. 9. Dezember Universität Basel. Zusammenfassung und wichtiges zur Prüfungsvorbereitung 9. Dezember 2008 Begriffe Kenntnis der wichtigen Begriffe und Unterscheidung dieser. Beispiele: Merkmal, Merkmalsraum, etc. Skalierung: Nominal etc

Mehr

Übungsblatt 4. Berechnen Sie für die statistischen Reihen die Varianzen, Kovarianzen und Korrelationskoeffizienten

Übungsblatt 4. Berechnen Sie für die statistischen Reihen die Varianzen, Kovarianzen und Korrelationskoeffizienten Aufgabe 1: Übungsblatt 4 Berechnen Sie für die statistischen Reihen die Varianzen, Kovarianzen und Korrelationskoeffizienten a) s 2 X, s 2 Y, sz, 2 s 2 U, s 2 V, s 2 W, s 2 T b) c XY, c Y Z c) c ZU, c

Mehr

Willkommen zur Vorlesung Statistik

Willkommen zur Vorlesung Statistik Willkommen zur Vorlesung Statistik Thema dieser Vorlesung: Maßzahlen für zentrale Tendenz, Streuung und andere Eigenschaften von Verteilungen Prof. Dr. Wolfgang Ludwig-Mayerhofer Universität Siegen Philosophische

Mehr

Statistik II. Lineare Regressionsrechnung. Wiederholung Skript 2.8 und Ergänzungen (Schira: Kapitel 4) Statistik II

Statistik II. Lineare Regressionsrechnung. Wiederholung Skript 2.8 und Ergänzungen (Schira: Kapitel 4) Statistik II Statistik II Lineare Regressionsrechnung Wiederholung Skript 2.8 und Ergänzungen (Schira: Kapitel 4) Statistik II - 09.06.2006 1 Mit der Kovarianz und dem Korrelationskoeffizienten können wir den statistischen

Mehr

6. Auswertung mehrdimensionaler Daten

6. Auswertung mehrdimensionaler Daten 6. Auswertung mehrdimensionaler Daten Bisher: Auswertungsmethoden für Daten eines einzelnen Merkmals, z.b. Diskrete Klassierung Grafische Darstellungen (Verteilungsfunktion) Lagemaße Streungsmaße Schiefemaße

Mehr

Bachelorabschlussseminar Dipl.-Kfm. Daniel Cracau

Bachelorabschlussseminar Dipl.-Kfm. Daniel Cracau 1 Einführung in die statistische Datenanalyse Bachelorabschlussseminar Dipl.-Kfm. Daniel Cracau 2 Gliederung 1.Grundlagen 2.Nicht-parametrische Tests a. Mann-Whitney-Wilcoxon-U Test b. Wilcoxon-Signed-Rank

Mehr

Linearer Zusammenhang von Datenreihen

Linearer Zusammenhang von Datenreihen Linearer Zusammenhang von Datenreihen Vielen Problemen liegen (möglicherweise) lineare Zusammenhänge zugrunde: Mein Internetanbieter verlangt eine Grundgebühr und rechnet minutenweise ab Ich bestelle ein

Mehr

Universität Bonn 28. Juli 2010 Fachbereich Rechts- und Wirtschaftswissenschaften Statistische Abteilung Prof. Dr. A. Kneip. KLAUSUR Statistik B

Universität Bonn 28. Juli 2010 Fachbereich Rechts- und Wirtschaftswissenschaften Statistische Abteilung Prof. Dr. A. Kneip. KLAUSUR Statistik B Universität Bonn 28. Juli 2010 Fachbereich Rechts- und Wirtschaftswissenschaften Statistische Abteilung Prof. Dr. A. Kneip Sommersemester 2010 KLAUSUR Statistik B Hinweise zur Bearbeitung: Bei allen Teilaufgaben

Mehr

Statistik I für Betriebswirte Vorlesung 2

Statistik I für Betriebswirte Vorlesung 2 Statistik I für Betriebswirte Vorlesung 2 PD Dr. Frank Heyde TU Bergakademie Freiberg Institut für Stochastik 16. April 2015 PD Dr. Frank Heyde Statistik I für Betriebswirte Vorlesung 2 1 ii) empirische

Mehr

Deskriptive Statistik

Deskriptive Statistik Deskriptive Statistik Deskriptive Statistik: Ziele Daten zusammenfassen durch numerische Kennzahlen. Grafische Darstellung der Daten. Quelle: Ursus Wehrli, Kunst aufräumen 1 Modell vs. Daten Bis jetzt

Mehr

Univariates Chi-Quadrat-Verfahren für ein dichotomes Merkmal und eine Messwiederholung: Test nach McNemar

Univariates Chi-Quadrat-Verfahren für ein dichotomes Merkmal und eine Messwiederholung: Test nach McNemar Univariates Chi-Quadrat-Verfahren für ein dichotomes Merkmal und eine Messwiederholung: Test nach McNemar Inhaltsverzeichnis Univariates Chi-Quadrat-Verfahren für ein dichotomes Merkmal und eine Messwiederholung:

Mehr

Abhängigkeit zweier Merkmale

Abhängigkeit zweier Merkmale Abhängigkeit zweier Merkmale Johannes Hain Lehrstuhl für Mathematik VIII Statistik 1/33 Allgemeine Situation Neben der Untersuchung auf Unterschiede zwischen zwei oder mehreren Untersuchungsgruppen hinsichtlich

Mehr

1. Allgemeine Hinweise Alexander.Martin.Koenig@TU-Clausthal.de

1. Allgemeine Hinweise Alexander.Martin.Koenig@TU-Clausthal.de 1. Allgemeine Hinweise Alexander.Martin.Koenig@TU-Clausthal.de Man sollte eine Excel-Tabelle immer so übersichtlich wie möglich halten. Dazu empfiehlt es sich, alle benötigten Daten, Konstanten und Messwerte

Mehr

Einführung in die Statistik für Politikwissenschaftler Sommersemester 2011

Einführung in die Statistik für Politikwissenschaftler Sommersemester 2011 Einführung in die Statistik für Politikwissenschaftler Sommersemester 2011 Es können von den Antworten alle, mehrere oder keine Antwort(en) richtig sein. Nur bei einer korrekten Antwort (ohne Auslassungen

Mehr

Anhand des bereits hergeleiteten Models erstellen wir nun mit der Formel

Anhand des bereits hergeleiteten Models erstellen wir nun mit der Formel Ausarbeitung zum Proseminar Finanzmathematische Modelle und Simulationen bei Raphael Kruse und Prof. Dr. Wolf-Jürgen Beyn zum Thema Simulation des Anlagenpreismodels von Simon Uphus im WS 09/10 Zusammenfassung

Mehr

Trim Size: 176mm x 240mm Lipow ftoc.tex V1 - March 9, :34 P.M. Page 11. Über die Übersetzerin 9. Einleitung 19

Trim Size: 176mm x 240mm Lipow ftoc.tex V1 - March 9, :34 P.M. Page 11. Über die Übersetzerin 9. Einleitung 19 Trim Size: 176mm x 240mm Lipow ftoc.tex V1 - March 9, 2016 6:34 P.M. Page 11 Inhaltsverzeichnis Über die Übersetzerin 9 Einleitung 19 Was Sie hier finden werden 19 Wie dieses Arbeitsbuch aufgebaut ist

Mehr

Musterlösung zu Serie 14

Musterlösung zu Serie 14 Dr. Lukas Meier Statistik und Wahrscheinlichkeitsrechnung FS 21 Musterlösung zu Serie 14 1. Der Datensatz von Forbes zeigt Messungen von Siedepunkt (in F) und Luftdruck (in inches of mercury) an verschiedenen

Mehr

Unterrichtsmaterialien in digitaler und in gedruckter Form. Auszug aus: Übungsbuch für den Grundkurs mit Tipps und Lösungen: Analysis

Unterrichtsmaterialien in digitaler und in gedruckter Form. Auszug aus: Übungsbuch für den Grundkurs mit Tipps und Lösungen: Analysis Unterrichtsmaterialien in digitaler und in gedruckter Form Auszug aus: Übungsbuch für den Grundkurs mit Tipps und Lösungen: Analysis Das komplette Material finden Sie hier: Download bei School-Scout.de

Mehr

Skalenniveaus =,!=, >, <, +, -

Skalenniveaus =,!=, >, <, +, - ZUSAMMENHANGSMAßE Skalenniveaus Nominalskala Ordinalskala Intervallskala Verhältnisskala =,!= =,!=, >, < =,!=, >, ,

Mehr

METHODENLEHRE I WS 2013/14 THOMAS SCHÄFER

METHODENLEHRE I WS 2013/14 THOMAS SCHÄFER METHODENLEHRE I WS 2013/14 THOMAS SCHÄFER DAS THEMA: INFERENZSTATISTIK IV INFERENZSTATISTISCHE AUSSAGEN FÜR ZUSAMMENHÄNGE UND UNTERSCHIEDE Inferenzstatistik für Zusammenhänge Inferenzstatistik für Unterschiede

Mehr

6Korrelationsanalyse:Zusammengangsanalysestetiger Merkmale

6Korrelationsanalyse:Zusammengangsanalysestetiger Merkmale 6Korrelationsanalyse:Zusammengangsanalysestetiger Merkmale Jetzt betrachten wir bivariate Merkmale (X, Y ), wobei sowohl X als auch Y stetig bzw. quasi-stetig und mindestens ordinalskaliert, typischerweise

Mehr

Statistische Auswertung:

Statistische Auswertung: Statistische Auswertung: Die erhobenen Daten mittels der selbst erstellten Tests (Surfaufgaben) Statistics Punkte aus dem Punkte aus Surftheorietest Punkte aus dem dem und dem Surftheorietest max.14p.

Mehr

Regressionsanalysen. Zusammenhänge von Variablen. Ziel der Regression. ( Idealfall )

Regressionsanalysen. Zusammenhänge von Variablen. Ziel der Regression. ( Idealfall ) Zusammenhänge von Variablen Regressionsanalysen linearer Zusammenhang ( Idealfall ) kein Zusammenhang nichtlinearer monotoner Zusammenhang (i.d.regel berechenbar über Variablentransformationen mittels

Mehr

Einleitung 19. Teil I Datenanalyse und Modellbildung Grundlagen 25

Einleitung 19. Teil I Datenanalyse und Modellbildung Grundlagen 25 Inhaltsverzeichnis Einleitung 19 Zu diesem Buch 19 Konventionen in diesem Buch 20 Was Sie nicht lesen müssen 21 Falsche Voraussetzungen 21 Wie dieses Buch aufgebaut ist 21 Teil I: Datenanalyse und Grundlagen

Mehr

1 Verteilungen und ihre Darstellung

1 Verteilungen und ihre Darstellung GKC Statistische Grundlagen für die Korpuslinguistik Kapitel 2: Univariate Deskription von Daten 8.11.2004 Univariate (= eindimensionale) Daten bestehen aus Beobachtungen eines einzelnen Merkmals. 1 Verteilungen

Mehr

Bivariate explorative Datenanalyse in R

Bivariate explorative Datenanalyse in R Bivariate explorative Datenanalyse in R Achim Zeileis, Regina Tüchler 2006-10-09 In der LV Statistik 1 haben wir auch den Zusammenhang von 2 Variablen untersucht. Hier werden die dazugehörenden R-Befehle

Mehr

Modul G.1 WS 07/08: Statistik 17.01.2008 1. Die Korrelation ist ein standardisiertes Maß für den linearen Zusammenhangzwischen zwei Variablen.

Modul G.1 WS 07/08: Statistik 17.01.2008 1. Die Korrelation ist ein standardisiertes Maß für den linearen Zusammenhangzwischen zwei Variablen. Modul G.1 WS 07/08: Statistik 17.01.2008 1 Wiederholung Kovarianz und Korrelation Kovarianz = Maß für den linearen Zusammenhang zwischen zwei Variablen x und y Korrelation Die Korrelation ist ein standardisiertes

Mehr

Philipp Sibbertsen Hartmut Lehne. Statistik. Einführung für Wirtschafts- und. Sozialwissenschaftler. 2., überarbeitete Auflage. 4^ Springer Gabler

Philipp Sibbertsen Hartmut Lehne. Statistik. Einführung für Wirtschafts- und. Sozialwissenschaftler. 2., überarbeitete Auflage. 4^ Springer Gabler Philipp Sibbertsen Hartmut Lehne Statistik Einführung für Wirtschafts- und Sozialwissenschaftler 2., überarbeitete Auflage 4^ Springer Gabler Inhaltsverzeichnis Teil I Deskriptive Statistik 1 Einführung

Mehr

Mathematische und statistische Methoden II

Mathematische und statistische Methoden II Methodenlehre e e Prof. Dr. G. Meinhardt 6. Stock, Wallstr. 3 (Raum 06-206) Sprechstunde jederzeit nach Vereinbarung und nach der Vorlesung. Mathematische und statistische Methoden II Dr. Malte Persike

Mehr

BOXPLOT 1. Begründung. Boxplot A B C

BOXPLOT 1. Begründung. Boxplot A B C BOXPLOT 1 In nachstehender Tabelle sind drei sortierte Datenreihen gegeben. Zu welchem Boxplot gehört die jeweilige Datenreihe? Kreuze an und begründe Deine Entscheidung! Boxplot A B C Begründung 1 1 1

Mehr

Zusammenhänge zwischen metrischen Merkmalen

Zusammenhänge zwischen metrischen Merkmalen Zusammenhänge zwischen metrischen Merkmalen Darstellung des Zusammenhangs, Korrelation und Regression Daten liegen zu zwei metrischen Merkmalen vor: Datenpaare (x i, y i ), i = 1,..., n Beispiel: x: Anzahl

Mehr

6.2 Regressionsanalyse

6.2 Regressionsanalyse c-kennzahlensystem (ROCI) 6. Regressionsanalyse Die Regressionsanalyse zählt zu den wichtigsten Analysemethoden des Kommunikationscontrollings und hat ihre tiefen Wurzeln in der Statistik. Im Rahmen des

Mehr

Überblick über die Verfahren für Ordinaldaten

Überblick über die Verfahren für Ordinaldaten Verfahren zur Analyse ordinalskalierten Daten 1 Überblick über die Verfahren für Ordinaldaten Unterschiede bei unabhängigen Stichproben Test U Test nach Mann & Whitney H Test nach Kruskal & Wallis parametrische

Mehr

9. Schätzen und Testen bei unbekannter Varianz

9. Schätzen und Testen bei unbekannter Varianz 9. Schätzen und Testen bei unbekannter Varianz Dr. Antje Kiesel Institut für Angewandte Mathematik WS 2011/2012 Schätzen und Testen bei unbekannter Varianz Wenn wir die Standardabweichung σ nicht kennen,

Mehr

Theoretische Grundlagen der Informatik WS 09/10

Theoretische Grundlagen der Informatik WS 09/10 Theoretische Grundlagen der Informatik WS 09/10 - Tutorium 6 - Michael Kirsten und Kai Wallisch Sitzung 13 02.02.2010 Inhaltsverzeichnis 1 Formeln zur Berechnung Aufgabe 1 2 Hamming-Distanz Aufgabe 2 3

Mehr

Statistik mit Excel. für Praktiker: Statistiken aufbereiten und präsentieren HORST-DIETER RADKE

Statistik mit Excel. für Praktiker: Statistiken aufbereiten und präsentieren HORST-DIETER RADKE Statistik mit Excel für Praktiker: Statistiken aufbereiten und präsentieren HORST-DIETER RADKE INHALTS- VERZEICHNIS Vorwort 13 Schreiben Sie uns! 15 1 Statistische Untersuchungen 17 Wozu Statistik? 18

Mehr

Statistik für Betriebswirte I 1. Klausur Wintersemester 2014/

Statistik für Betriebswirte I 1. Klausur Wintersemester 2014/ Statistik für Betriebswirte I 1. Klausur Wintersemester 2014/2015 13.02.2015 BITTE LESERLICH IN DRUCKBUCHSTABEN AUSFÜLLEN Nachname:................................................................... Vorname:....................................................................

Mehr

Klausur zu Methoden der Statistik I (mit Kurzlösung) Wintersemester 2008/2009. Aufgabe 1

Klausur zu Methoden der Statistik I (mit Kurzlösung) Wintersemester 2008/2009. Aufgabe 1 Lehrstuhl für Statistik und Ökonometrie der Otto-Friedrich-Universität Bamberg Prof. Dr. Susanne Rässler Klausur zu Methoden der Statistik I (mit Kurzlösung) Wintersemester 2008/2009 Aufgabe 1 Der Student

Mehr

Multivariate Statistik

Multivariate Statistik Hermann Singer Multivariate Statistik 1 Auflage 15 Oktober 2012 Seite: 12 KAPITEL 1 FALLSTUDIEN Abbildung 12: Logistische Regression: Geschätzte Wahrscheinlichkeit für schlechte und gute Kredite (rot/blau)

Mehr

3. Lektion: Deskriptive Statistik

3. Lektion: Deskriptive Statistik Seite 1 von 5 3. Lektion: Deskriptive Statistik Ziel dieser Lektion: Du kennst die verschiedenen Methoden der deskriptiven Statistik und weißt, welche davon für Deine Daten passen. Inhalt: 3.1 Deskriptive

Mehr

Musterlösung zur Übungsklausur Statistik

Musterlösung zur Übungsklausur Statistik Musterlösung zur Übungsklausur Statistik WMS15B Oettinger 9/216 Aufgabe 1 (a) Falsch: der Modus ist die am häufigsten auftretende Merkmalsausprägung in einer Stichprobe. (b) Falsch: die beiden Größen sind

Mehr