a) Zeichnen Sie in das nebenstehende Streudiagramm mit Lineal eine Regressionsgerade ein, die Sie für passend halten.

Größe: px
Ab Seite anzeigen:

Download "a) Zeichnen Sie in das nebenstehende Streudiagramm mit Lineal eine Regressionsgerade ein, die Sie für passend halten."

Transkript

1 Statistik für Kommunikationswissenschaftler Wintersemester 2009/200 Vorlesung Prof. Dr. Helmut Küchenhoff Übung Cornelia Oberhauser, Monia Mahling, Juliane Manitz Thema 4 Homepage zur Veranstaltung: Lösung Aufgabe (Zusammenhang zwischen metrischen Merkmalen) Es wurden in einer Befragung zwei metrische Merkmale X und Y erhoben. Betrachten Sie dazu die Stichprobe S {(; 6), (; 8), (2; 5), (2; 6), (3; 5), (4; 2), (4; 3), (7; 4)} mit dem zugehörigen Streudiagramm: y x a) Zeichnen Sie in das nebenstehende Streudiagramm mit Lineal eine Regressionsgerade ein, die Sie für passend halten. y x

2 b) Berechnen Sie aus der oben stehenden Stichprobe S, die der Grafik zugrunde liegt, die Parameter a und b für die lineare Regression. x n ȳ n x i 8 y i 8 8 x i 8 [ ] y i 8 [ ] 39 4, s XY n 8 (x i x)(y i ȳ) 8 (x i x)(y i ȳ) [( 3)(6 4, 875) + ( 3)(8 4, 875) + (2 3)(5 4, 875) + (2 3)(6 4, 875) 7 +(3 3)(5 4, 875) + (4 3)(2 4, 875) + (4 3)(3 4, 875) + (7 3)(4 4, 875)] 8 2, 57 7 s 2 X n 8 (x i x) 2 8 (x i x) 2 7 [( 3) 2 + ( 3) 2 + (2 3) 2 + (2 3) 2 + (3 3) 2 + (4 3) 2 + (4 3) 2 + (7 3) 2] b s XY s 2 X 2, , 64 a ȳ b x 4, 875 ( 0, 64) 3 4, 875 +, 92 6, 8 c) Zeichnen Sie nun die Regressionsgerade mit den Parametern aus Teilaufgabe b) in die Grafik. Haben Sie sich verschätzt bei Ihrer freihand gezeichneten Geraden? Wie konnte das passieren? 2 Punkte zum Zeichnen nötig: Geradengleichung: y a + b x 6, 8 0, 64 x Punkt an der Stelle x 0: y 6, 8 0, , 8 (x i ; y i ) (0; 6, 8) Punkt an der Stelle x 8: y 6, 8 0, 64 8, 68 (x i ; y i ) (8;, 68) 2

3 y x Grund für Verschätzen: Der Punkt (7; 4) wurde bei der Freihandzeichnung nicht so wichtig genommen. d) Berechnen Sie den Korrelationskoeffizienten nach Pearson. Wie ist dieser zu interpretieren? 2, 57 s X s 2 aus b) X 4 2 s XY aus b) s 2 Y n 8 8 (y i ȳ) 2 8 (y i ȳ) 2 7 [(6 4, 875) 2 + (8 4, 875) 2 + (5 4, 875) 2 + (6 4, 875) 2 +(5 4, 875) 2 + (2 4, 875) 2 + (3 4, 875) 2 + (4 4, 875) 2] s Y 24, 875 3, 55 7 s 2 Y 3, 55, 88 r XY s XY s X s Y 2, 57 0, 683 2, 88 Interpretation: r XY 0, 683 bedeutet, dass zwischen X und Y ein mittlerer negativer Zusammenhang besteht. 3

4 e) Berechnen Sie nun das Bestimmtheitsmaß der Regression. Was fällt auf? Wie kann man den Wert interpretieren? s 2 Y aus d) 3, 55 ŷ i a + b x i 6, 8 0, 64 x i i x i ŷ i 6,6 2 6, , , , , , ,32 s 2 Ŷ n 8 (ŷ i ȳ) 2 8 (ŷ i ȳ) 2 7 [(6, 6 4, 875) 2 + (6, 6 4, 875) 2 + (5, 52 4, 875) 2 + (5, 52 4, 875) 2 +(4, 88 4, 875) 2 + (4, 24 4, 875) 2 + (4, 24 4, 875) 2 + (2, 32 4, 875) 2], 469, 64 7 r 2 s2 Ŷ s 2 Y, 64 0, 46 3, 55 r 2 XY ( 0, 683)2 0, 47 ist (bis auf Rundungsfehler) identisch mit r 2. Interpretation: Ungefähr 46% der Streuung von Y werden durch X erklärt. Lösung Aufgabe 2 (Zusammenhang zwischen metrischen Variablen) Bei sieben zufällig ausgewählten ProfessorInnen wurden die monatlichen Ausgaben für Kosmetikprodukte und Styling-Magazine (jeweils in e) erfragt. Außerdem wurde ihre durchschnittliche Aufenthaltsdauer pro Tag an der Universität erhoben (in Minuten). Die Ergebnisse finden Sie in untenstehender Tabelle. Die Merkmale werden mit folgenden Buchstaben identifiziert: ˆ X: Ausgaben für Kosmetika ˆ Y: Ausgaben für Styling-Magazine ˆ Z: Zeit an der Uni 4

5 Ausgaben Ausgaben Zeit an Kosmetika Styling-Magazine der Uni Für die Berechnungen sind als Hilfsgrößen gegeben: ˆ die empirischen Standardabweichungen s X 23, 6, s Y 9, 6 und s Z 64, 3 ˆ die Kovarianzen s XY 08, 6, s XZ 345, 2 und s Y Z 262, a) Berechnen Sie den gewöhnlichen Korrelationskoeffizienten für alle möglichen Zweierkombinationen der drei Merkmale in der Tabelle, also r XY, r XZ und r Y Z. Interpretieren Sie diese. Ändern sich die Korrelationskoeffizienten, wenn man die Variablen transformiert, also z.b. die Ausgaben in Dollar statt in Euro angibt? r XY s XY 08, 6 0, 48 s X s Y 23, 6 9, 6 Zwischen den Ausgaben für Kosmetika und den Ausgaben für Styling-Magazine besteht ein schwacher positiver linearer Zusammenhang. r XZ s XZ 345, 2 0, 89 s X s Z 23, 6 64, 3 Zwischen den Ausgaben für Kosmetika und der Zeit an der Uni besteht ein starker negativer linearer Zusammenhang. r Y Z s Y Z 262, 0, 42 s Y s Z 9, 6 64, 3 Zwischen den Ausgaben für Styling-Magazine und der Zeit an der Uni besteht ein schwacher negativer linearer Zusammenhang. Bei linearen Transformationen ändert sich der Korrelationskoeffizient nicht. b) Berechnen Sie nun den partiellen Korrelationskoeffizienten zwischen den beiden Merkmalen Ausgaben für Kosmetika und Ausgaben für Styling-Magazine (d.h. den Korrelationskoeffizienten ohne den Einfluss der Aufenthaltsdauer an der Uni ), also r XY Z. Nutzen Sie dabei die Ergebnisse aus Teilaufgabe a). Der partielle Korrelationskoeffizient zwischen Ausgaben für Kosmetika und Ausgaben für Styling- Magazine (gegeben die Zeit an der Uni) wird berechnet, weil man vermutet, dass die Zeit an der Uni beides beeinflusst. Die Ausgaben für Kosmetika und die Ausgaben für Styling-Magazine werden beide gehemmt durch den Umfang der Arbeitszeit. 5

6 r XY Z r XY r XZ r Y Z r 2 XZ r 2 Y Z 0, 48 [( 0, 89) ( 0, 42)] ( 0, 89)2 ( 0, 42) 2 0, 48 0, 37 0, 46 0, 92 0, 26 (vorher: r XY 0, 48) Welchen der beiden Werte würde man verwenden? Annahme, dass Z die Variablen X und Y beeinflusst, scheint realistisch r XY Z bevorzugen ( Einfluss von Z rausrechnen ) c) Berechnen Sie den Rangkorrelationskoeffizienten von Spearman zwischen den Ausgaben für Kosmetika und dem Uniaufenthalt, also rxz S. Interpretieren Sie diesen. Ränge vergeben (Bei gleichen Beobachtungen wird üblicherweise der Mittelwert der entsprechenden Ränge gebildet.) X Z U R(X) V R(Z) 4, ,5 6,5 6,5 5 3 r UV s UV s U s V dazu: s UV n (u i ū)(v i v) ū n v n u i 7 v i 7 7 u i 7 [ ] v i 7 [, , 5 +, 5 + 6, 5 + 3] s UV 7 7 (u i ū)(v i v) [(4 4)(, 5 4) + (3 4)(5 4) + (7 4)(4 4) + (2 4)(6, 5 4) 6 +(6 4)(, 5 4) + ( 4)(6, 5 4) + (5 4)(3 4)] ( 9, 5) 3,

7 s 2 U n 7 (u i ū) 2 7 (u i ū) 2 6 [(4 4) 2 + (3 4) 2 + (7 4) 2 + (2 4) 2 + (6 4) 2 + ( 4) 2 + (5 4) 2] 28 4, 67 6 s 2 V n 7 (v i v) 2 7 (v i v) 2 6 [(, 5 4) 2 + (5 4) 2 + (4 4) 2 + (6, 5 4) 2 + (, 5 4) 2 + (6, 5 4) 2 + (3 4) 2] 27 4, 5 6 Interpretation: r UV s UV s U s V 3, 25 4, 67 4, 5 0, 7 Zwischen den Ausgaben für Kosmetika und der Zeit an der Uni besteht ein mittlerer negativer monotoner Zusammenhang. (vorher: r XZ 0, 89) Welchen der beiden Werte würde man verwenden? Ausgaben für Kosmetika (X) Zeit in der Uni (Z) Entscheidung anhand des Streudiagramms linearer Zusammenhang sichtbar (außerdem: metrisches Merkmal, keine Ausreißer) Korrelationskoeffizient nach Pearson d) Können Sie aufgrund des Korrelationskoeffizienten in Teilaufgabe c) ein Aussage über den kausalen Zusammenhang dieser Merkmale machen? Kausalität heißt: X Y, Korrelationskoeffizienten messen aber X Y Kausalität generell nicht durch Beobachtungsdaten nachweisbar 7

8 ) gute Theorie nötig 2) zeitliche Abfolge (Ursache Wirkung) 3) Kontrollvariablen berücksichtigen e) In einfachen linearen Regressionsmodellen ergeben sich folgende Schätzungen für die Koeffizienten a (Achsenabschnitt) und b (Steigung): e) X i 26, 53 +, 9 Y i + E i e2) X i 22, 05 0, 33 Z i + F i e3) Y i 43, 95 0, 06 Z i + G i Zeichnen Sie die Regressionsgeraden in die zugehörigen Streudiagramme ein. Interpretieren Sie die einzelnen Koeffizienten. Ausgaben für Kosmetika (X) Ausgaben für Kosmetika (X) Ausgaben für Styling Magazine (Y) Zeit in der Uni (Z) Ausgaben für Styling Magazine (Y) Zeit in der Uni (Z) einfache lineare Regression e) wieder Berechnen von 2 Punkten Geradengleichung: X i 26, 53 +, 9 Y i + E i * Punkt an der Stelle Y i 0: X i 26, 53 +, , 53 (Y i ; X i ) (0; 26, 53) * Punkt an der Stelle Y i 30: X i 26, 53+, , 23 (Y i ; X i ) (30; 62, 23) Interpretation: * a 26, 53 Man erwartet, dass eine Person, die 0 Euro für Styling-Magazine ausgibt, 26,53 Euro für Kosmetika ausgibt. 8

9 Ausgaben für Kosmetika (X) Ausgaben für Styling Magazine (Y) Ausgaben für Kosmetika (X) Zeit in der Uni (Z) Ausgaben für Styling Magazine (Y) Zeit in der Uni (Z) * b, 9 Gibt eine Person Euro mehr für Styling-Magazine aus, so erwartet man, dass diese,9 Euro mehr für Kosmetika ausgibt. e2) Geradengleichung: X i 22, 05 0, 33 Z i + F i * Punkt an der Stelle Z i 0: X i 22, 05 0, , 05 (Z i ; X i ) (0; 22, 05) * Punkt an der Stelle Z i 700: X i 22, 05 0, , 95 (Z i ; X i ) (700; 8, 95) Interpretation: * a 22, 05 nicht sinnvoll interpretierbar (es gibt keinen Professor/keine Professorin, die nie an der Uni ist) * b 0, 33 Ist eine Person Minute länger an der Uni, so erwartet man, dass diese 0,33 Euro weniger für Kosmetika ausgibt. e3) Geradengleichung: Y i 43, 95 0, 06 Z i + G i * Punkt an der Stelle Z i 0: Y i 43, 95 0, , 95 (Z i ; Y i ) (0; 43, 95) * Punkt an der Stelle Z i 700: Y i 43, 95 0, , 94 (Z i ; Y i ) (700;, 94) Interpretation: * a 43, 95 nicht sinnvoll interpretierbar 9

10 * b 0, 06 Ist eine Person Minute länger in der Uni, so erwartet man, dass diese 0,06 Euro weniger für Styling-Magazine ausgibt. f) In einem multiplen linearen Regressionsmodell ergeben sich folgende Schätzungen für die Koeffizienten: X i 98, 4 + 0, 3 Y i 0, 3 Z i + E i Interpretieren Sie die einzelnen Koeffizienten. Vergleichen Sie diese mit den Koeffizienten aus Teilaufgabe e). Interpretation: a 98, 4 nicht sinnvoll interpretierbar b 0, 3 Gibt eine Person Euro mehr für Styling-Magazine aus, so erwartet man, dass diese 0,3 Euro mehr für Kosmetika ausgibt, wenn sie die gleiche Zeit an der Uni verbringt. b 2 0, 3 Bei einer Person, die Minute länger an der Uni ist, erwartet man, dass diese 0,3 Euro weniger für Kosmetika ausgibt, wenn sie die gleichen Ausgaben für Styling-Magazine hat. Vergleich: b 0, 3 ist kleiner als, 9 in e) b 2 0, 3 ist größer als 0, 33 in e) Lösung Aufgabe 3 (Zusammenhang zwischen nominalen Merkmalen) In einer Stichprobe S {s,..., s 0 } werden zwei Untersuchungsmerkmale X und Y erhoben. Dabei sei X das Geschlecht und Y der Familienstand der Untersuchungseinheiten. Man erhält folgende Daten: g i x i y i g männlich ledig g 2 weiblich ledig g 3 männlich ledig g 4 männlich verheiratet g 5 männlich ledig g 6 männlich ledig g 7 weiblich geschieden g 8 weiblich geschieden g 9 männlich verheiratet g 0 männlich ledig 0

11 a) Übertragen Sie die Daten in eine Häufigkeitstabelle. Wie kann man diese Tabelle noch nennen? Welche Information geht beim Übergang in die Tabellenform verloren? Familienstand Geschlecht ledig verheiratet geschieden Summe männlich weiblich Summe Weitere Bezeichnungen für diese Tabelle: Kontingenztabelle, Kontingenztafel, Kreuztabelle Bei der Darstellung in Tabellenform geht bis auf die Reihenfolge der Beobachtungen keine Information der ursprünglichen Daten verloren. b) Benennen Sie anhand der erstellten Tabelle in a) die Klasse C 2 und geben Sie ihre absolute Häufigkeit n 2 an. C 2 Klasse der verheirateten Männer (erste Zahl im Index gibt die Zeile an, zweite Zahl die Spalte) absolute Häufigkeit n 2 2 (Lösung abhängig von der Tabelle in a). Es könnte dort auch in der ersten Zeile weiblich stehen und in der zweiten Zeile männlich. Außerdem könnte auch der Familienstand in einer anderen Reihenfolge in der Tabelle erscheinen.) c) Was gibt die Summe der absoluten Häufigkeiten n 2j (die Summe aller Zellen in der zweiten Zeile) an? Wie lautet die abkürzende Schreibweise für diese Summe? Summe der absoluten Häufigkeiten n 2j entspricht Anzahl der Frauen in der Studie abkürzende Schreibweise: 3 n 2j n 2 3 j d) Was gibt die Summe der absoluten Häufigkeiten n i (die Summe aller Zellen in der ersten Spalte) an? Wie lautet die abkürzende Schreibweise für diese Summe? Summe der absoluten Häufigkeiten n i enspricht Anzahl der ledigen Personen in der Studie abkürzende Schreibweise: 2 n i n 6 e) Sind beide Merkmale abhängig? Was bedeutet das? e n n 7 6 n , 2 5 n Die beiden Merkmale sind abhängig, die bedingten Verteilungen unterscheiden sich also von den Randverteilungen.

12 Lösung Aufgabe 4 (Zusammenhang zwischen nominalen Merkmalen) In der Medienstudie wurde erhoben, ob sich ein Computer im jeweiligen Haushalt befindet. Es ergab sich folgende Vierfeldertafel: Computer im Haushalt Geschlecht ja nein männlich weiblich a) Ergänzen Sie in der Tabelle die Randverteilung des Merkmals Geschlecht. Randverteilung des Merkmals Geschlecht: Computer im Haushalt Geschlecht ja nein männlich weiblich b) Finden Sie in der Tabelle die bedingte Verteilung des Geschlechts gegeben Computer im Haushalt nein. bedingte Verteilung des Geschlechts gegeben Computer im Haushalt nein Computer im Haushalt Geschlecht ja nein männlich 883 weiblich 607 c) Untersuchen Sie nun, ob das Geschlecht und die Variable Computer im Haushalt unabhängig voneinander sind. Zunächst muss die vollständige Tabelle mit allen Randhäufigkeiten und der Stichprobengröße erstellt werden: Computer im Haushalt Geschlecht ja nein männlich weiblich e n n n 2937 Die beiden Merkmale sind abhängig n 2

13 d) Gibt es einen Zusammenhang zwischen Geschlecht und Computer im Haushalt? Benutzen Sie eine gängige Maßzahl! Maßzahl für den Zusammenhang zwischen Geschlecht und Computer im Haushalt Korrelation? - nicht geeignet Quadratische Kontingenz χ 2 nicht normiert Kontingenzkoeffizient K normiert: K liegt zwischen 0 und Berechne zuerst die unter Unabhängigkeit erwarteten Häufigkeiten e ij n i n j n Beispiel: e n n n Diese erhält man am einfachsten in Tabellenform, indem man die Randhäufigkeiten der entsprechenden Zelle multipliziert und anschließend durch n teilt. Unabhängigkeitstabelle: Computer im Haushalt Geschlecht ja nein männlich weiblich χ 2 (n ij e ij ) 2 j e ij (967 9)2 ( ) , , , , 69 8, 32 + ( ) (607 55)2 55 Die quadratische Kontingenz ist nicht normiert, d.h. sie liegt in keinem festen Intervall. Somit ist ihr Wert nicht direkt interpretierbar. Kontingenzkoeffizienten berechnen t min{2, 2} 2 χ K 2 (χ 2 + n) (t )/t 8, 32 (8, ) (2 )/2 0, 02 0, Der Zusammenhang ist sehr schwach. 3

14 Lösung Aufgabe 5 (Zusammenhang zwischen metrischen und nominalen Merkmalen) Gegeben seien die Daten zum Alter von Beschäftigten von 3 Abteilungen einer Firma. Die Daten lauten folgendermaßen: Alter in Abteilung {35, 39, 32, 28, 33, 38, 39, 32, 35, 36}, Alter in Abteilung 2 {2, 8, 9, 24, 20, 2, 2, 2}, Alter in Abteilung 3 {39, 42, 38, 40, 42, 39, 44, 48, 42, 36, 47, 43}. a) Wie würden Sie den Zusammenhang zwischen dem Merkmal Abteilung und dem Merkmal Alter untersuchen? X: Merkmal Abteilung: diskret, nominal Y : Merkmal Alter: stetig, metrisch Korrelation? - geht nicht Kontingenzmaße? - geht nicht Für jede Abteilung separat die bedingte Verteilung des Alters gegeben die Abteilung anschauen. Charakterisiert werden diese Verteilungen dann mit den bekannten Lage- und Streuungsmaßzahlen. b) Welche graphische Darstellung würden Sie für diese Daten wählen und warum? Zeichnen Sie diese. Boxplot für jede Abteilung, da die Verteilung eines metrischen Merkmals in mehreren Gruppen verglichen werden soll Alter Abteilung 4

15 c) Beschreiben und interpretieren Sie die Abbildung. Vergleichen Sie die drei Gruppen. Beschreibung: Werte ablesen Minimum unteres Quartil Median oberes Quartil Maximum Abteilung Abteilung Abteilung Interpretation: In Abteilung ist die jüngste Person 28 Jahre alt; ein Viertel der Personen ist 32 Jahre alt oder jünger und drei Viertel sind 32 Jahre alt oder die Hälfte der Personen ist 35 Jahre alt oder jünger und die Hälfte ist 35 Jahre alt oder drei Viertel der Personen sind 37 Jahre alt oder jünger und ein Viertel ist 37 Jahre alt oder die älteste Person ist 39 Jahre alt. In Abteilung 2 ist die jüngste Person 8 Jahre alt; ein Viertel der Personen ist 20 Jahre alt oder jünger und drei Viertel sind 20 Jahre alt oder die Hälfte der Personen ist 2 Jahre alt oder jünger und die Hälfte ist 2 Jahre alt oder drei Viertel der Personen sind 2 Jahre alt oder jünger und ein Viertel ist 2 Jahre alt oder die älteste Person ist 24 Jahre alt. In Abteilung 3 ist die jüngste Person 36 Jahre alt; ein Viertel der Personen ist 39 Jahre alt oder jünger und drei Viertel sind 39 Jahre alt oder die Hälfte der Personen ist 42 Jahre alt oder jünger und die Hälfte ist 42 Jahre alt oder drei Viertel der Personen sind 43 Jahre alt oder jünger und ein Viertel ist 43 Jahre alt oder die älteste Person ist 48 Jahre alt. Vergleich: Generelles Niveau: Die Personen in Abteilung 2 sind am jüngsten. Die Personen in Abteilung sind wesentlich älter, während die Personen in Abteilung 3 sogar noch etwas älter sind. Vergleich einzelner Parameter: Dasselbe gilt für den Median, das untere Quartil, das obere Quartil, das Minimum und das Maximum des Alters in den drei Abteilungen. Vergleich des Quartilsabstandes und der Spannweite: Der Quartilsabstand ist in Abteilung 2 am kleinsten, gefolgt von Abteilung 3 und. Die Spannweite ist in Abteilung am kleinsten und in den Abteilungen und 3 ähnlich groß. 5

Lösung Aufgabe 1 (Regression) Es wurden in einer Befragung zwei metrische Merkmale X und Y erhoben. Betrachten Sie dazu die

Lösung Aufgabe 1 (Regression) Es wurden in einer Befragung zwei metrische Merkmale X und Y erhoben. Betrachten Sie dazu die Statistik für Kommunikationswissenschaftler Wintersemester 2010/2011 Vorlesung Prof. Dr. Nicole Krämer Übung Nicole Krämer, Cornelia Oberhauser, Monia Mahling Lösung Thema 9 Homepage zur Veranstaltung:

Mehr

5 Zusammenhangsmaße, Korrelation und Regression

5 Zusammenhangsmaße, Korrelation und Regression 5 Zusammenhangsmaße, Korrelation und Regression 5.1 Zusammenhangsmaße und Korrelation Aufgabe 5.1 In einem Hauptstudiumsseminar des Lehrstuhls für Wirtschafts- und Sozialstatistik machten die Teilnehmer

Mehr

90-minütige Klausur Statistik für Studierende der Kommunikationswissenschaft

90-minütige Klausur Statistik für Studierende der Kommunikationswissenschaft Prof. Dr. Helmut Küchenhoff SS08 90-minütige Klausur Statistik für Studierende der Kommunikationswissenschaft am 22.7.2008 Anmerkungen Überprüfen Sie bitte sofort, ob Ihre Angabe vollständig ist. Sie sollte

Mehr

Klausur zu Methoden der Statistik I (mit Kurzlösung) Wintersemester 2007/2008. Aufgabe 1

Klausur zu Methoden der Statistik I (mit Kurzlösung) Wintersemester 2007/2008. Aufgabe 1 Lehrstuhl für Statistik und Ökonometrie der Otto-Friedrich-Universität Bamberg Prof. Dr. Susanne Rässler Klausur zu Methoden der Statistik I (mit Kurzlösung) Wintersemester 2007/2008 Aufgabe 1 Ihnen liegt

Mehr

Kontingenzkoeffizient (nach Pearson)

Kontingenzkoeffizient (nach Pearson) Assoziationsmaß für zwei nominale Merkmale misst die Unabhängigkeit zweier Merkmale gibt keine Richtung eines Zusammenhanges an 46 o jl beobachtete Häufigkeiten der Kombination von Merkmalsausprägungen

Mehr

Zusammenhänge zwischen metrischen Merkmalen

Zusammenhänge zwischen metrischen Merkmalen Zusammenhänge zwischen metrischen Merkmalen Darstellung des Zusammenhangs, Korrelation und Regression Daten liegen zu zwei metrischen Merkmalen vor: Datenpaare (x i, y i ), i = 1,..., n Beispiel: x: Anzahl

Mehr

Einfache statistische Auswertungen mit dem TI-Nspire

Einfache statistische Auswertungen mit dem TI-Nspire 1. Neues Dokument und darin eine neue Seite anlegen Als Typ 6: Lists & Spreadsheet wählen. Darin die Messwerte in einer Spalte erfassen. Dies ergibt die Urliste. Wenn mehrere Messwerte vorliegen, die diejenigen,

Mehr

3.2 Bivariate Verteilungen

3.2 Bivariate Verteilungen 3.2 Bivariate Verteilungen zwei Variablen X, Y werden gemeinsam betrachtet (an jedem Objekt i, i = 1,..., n, werden gleichzeitig zwei Merkmale beobachtet) Beobachtungswerte sind Paare/Kombinationen von

Mehr

Korrelation - Regression. Berghold, IMI

Korrelation - Regression. Berghold, IMI Korrelation - Regression Zusammenhang zwischen Variablen Bivariate Datenanalyse - Zusammenhang zwischen 2 stetigen Variablen Korrelation Einfaches lineares Regressionsmodell 1. Schritt: Erstellung eines

Mehr

2. Deskriptive Statistik 2.1. Häufigkeitstabellen, Histogramme, empirische Verteilungsfunktionen

2. Deskriptive Statistik 2.1. Häufigkeitstabellen, Histogramme, empirische Verteilungsfunktionen 4. Datenanalyse und Modellbildung Deskriptive Statistik 2-1 2. Deskriptive Statistik 2.1. Häufigkeitstabellen, Histogramme, empirische Verteilungsfunktionen Für die Auswertung einer Messreihe, die in Form

Mehr

Analog zu Aufgabe 16.1 werden die Daten durch folgenden Befehl eingelesen: > kredit<-read.table("c:\\compaufg\\kredit.

Analog zu Aufgabe 16.1 werden die Daten durch folgenden Befehl eingelesen: > kredit<-read.table(c:\\compaufg\\kredit. Lösung 16.3 Analog zu Aufgabe 16.1 werden die Daten durch folgenden Befehl eingelesen: > kredit

Mehr

Deskription, Statistische Testverfahren und Regression. Seminar: Planung und Auswertung klinischer und experimenteller Studien

Deskription, Statistische Testverfahren und Regression. Seminar: Planung und Auswertung klinischer und experimenteller Studien Deskription, Statistische Testverfahren und Regression Seminar: Planung und Auswertung klinischer und experimenteller Studien Deskriptive Statistik Deskriptive Statistik: beschreibende Statistik, empirische

Mehr

Datenanalyse mit Excel. Wintersemester 2013/14

Datenanalyse mit Excel. Wintersemester 2013/14 Datenanalyse mit Excel 1 KORRELATIONRECHNUNG 2 Korrelationsrechnung Ziel der Korrelationsrechnung besteht im bivariaten Fall darin, die Stärke des Zusammenhangs zwischen zwei interessierenden statistischen

Mehr

4. Erstellen von Klassen

4. Erstellen von Klassen Statistik mit Tabellenkalkulation 4. Erstellen von Klassen Mit einem einfachen Befehl lässt sich eine Liste von Zahlen auf die Häufigkeit der einzelnen Werte untersuchen. Verwenden Sie dazu den Befehl

Mehr

Teil II: Einführung in die Statistik

Teil II: Einführung in die Statistik Teil II: Einführung in die Statistik (50 Punkte) Bitte beantworten Sie ALLE Fragen. Es handelt sich um multiple choice Fragen. Sie müssen die exakte Antwortmöglichkeit angeben, um die volle Punktzahl zu

Mehr

1,11 1,12 1,13 1,14 1,15 1,16 1,17 1,17 1,17 1,18

1,11 1,12 1,13 1,14 1,15 1,16 1,17 1,17 1,17 1,18 3. Deskriptive Statistik Ziel der deskriptiven (beschreibenden) Statistik (explorativen Datenanalyse) ist die übersichtliche Darstellung der wesentlichen in den erhobenen Daten enthaltene Informationen

Mehr

Prüfung zu Modul 26 (BA Bw) bzw. 10 (BA IB) (Wirtschaftsstatistik)

Prüfung zu Modul 26 (BA Bw) bzw. 10 (BA IB) (Wirtschaftsstatistik) 2 3 Klausur-Nr = Sitzplatz-Nr Prüfung zu Modul 26 (BA Bw) bzw. 10 (BA IB) (Wirtschaftsstatistik) Klausurteil 1: Beschreibende Statistik BeStat-1 (7 ) n = 400 Personen wurden gefragt, wie viele Stück eines

Mehr

Klausur zu Methoden der Statistik I (mit Kurzlösung) Sommersemester 2008. Aufgabe 1

Klausur zu Methoden der Statistik I (mit Kurzlösung) Sommersemester 2008. Aufgabe 1 Lehrstuhl für Statistik und Ökonometrie der Otto-Friedrich-Universität Bamberg Prof. Dr. Susanne Rässler Klausur zu Methoden der Statistik I (mit Kurzlösung) Sommersemester 2008 Aufgabe 1 I) Einige Mitarbeiter

Mehr

Statistik und Wahrscheinlichkeitsrechnung

Statistik und Wahrscheinlichkeitsrechnung Statistik und Wahrscheinlichkeitsrechnung Übung 2 28.02.2008 1 Inhalt der heutigen Übung Beschreibende Statistik Gemeinsames Lösen der Übungsaufgaben 2.1: Häufigkeitsverteilung 2.2: Tukey Boxplot 25:Korrelation

Mehr

Dr. Maike M. Burda. Welchen Einfluss hat die Körperhöhe auf das Körpergewicht? Eine Regressionsanalyse. HU Berlin, Econ Bootcamp 7.-9.

Dr. Maike M. Burda. Welchen Einfluss hat die Körperhöhe auf das Körpergewicht? Eine Regressionsanalyse. HU Berlin, Econ Bootcamp 7.-9. Dr. Maike M. Burda Welchen Einfluss hat die Körperhöhe auf das Körpergewicht? Eine Regressionsanalyse. HU Berlin, Econ Bootcamp 7.-9. Januar 2011 BOOTDATA11.GDT: 250 Beobachtungen für die Variablen...

Mehr

Profil A 49,3 48,2 50,7 50,9 49,8 48,7 49,6 50,1 Profil B 51,8 49,6 53,2 51,1 51,1 53,4 50,7 50 51,5 51,7 48,8

Profil A 49,3 48,2 50,7 50,9 49,8 48,7 49,6 50,1 Profil B 51,8 49,6 53,2 51,1 51,1 53,4 50,7 50 51,5 51,7 48,8 1. Aufgabe: Eine Reifenfirma hat für Winterreifen unterschiedliche Profile entwickelt. Bei jeweils gleicher Geschwindigkeit und auch sonst gleichen Bedingungen wurden die Bremswirkungen gemessen. Die gemessenen

Mehr

Einfache Statistiken in Excel

Einfache Statistiken in Excel Einfache Statistiken in Excel Dipl.-Volkswirtin Anna Miller Bergische Universität Wuppertal Schumpeter School of Business and Economics Lehrstuhl für Internationale Wirtschaft und Regionalökonomik Raum

Mehr

Webergänzung zu Kapitel 10

Webergänzung zu Kapitel 10 Webergänzung zu Kapitel 10 10.1.4 Varianzanalyse (ANOVA: analysis of variance) Im Kapitel 10 haben wir uns hauptsächlich mit Forschungsbeispielen beschäftigt, die nur zwei Ergebnissätze hatten (entweder

Mehr

Franz Kronthaler. Statistik angewandt. Datenanalyse ist (k)eine Kunst. Excel Edition. ^ Springer Spektrum

Franz Kronthaler. Statistik angewandt. Datenanalyse ist (k)eine Kunst. Excel Edition. ^ Springer Spektrum Franz Kronthaler Statistik angewandt Datenanalyse ist (k)eine Kunst Excel Edition ^ Springer Spektrum Inhaltsverzeichnis Teil I Basiswissen und Werkzeuge, um Statistik anzuwenden 1 Statistik ist Spaß 3

Mehr

Prüfung zu Modul 26 (BA Bw) bzw. 10 (BA IB) (Wirtschaftsstatistik)

Prüfung zu Modul 26 (BA Bw) bzw. 10 (BA IB) (Wirtschaftsstatistik) 2 Klausur-Nr = Sitzplatz-Nr Prüfung zu Modul 26 (BA Bw) bzw. 10 (BA IB) (Wirtschaftsstatistik) Klausurteil 1: Beschreibende Statistik Name, Vorname:... verteilung Teil 1: Beschreibende Statistik Aufgaben

Mehr

Es können keine oder mehrere Antworten richtig sein. Eine Frage ist NUR dann richtig beantwortet, wenn ALLE richtigen Antworten angekreuzt wurden.

Es können keine oder mehrere Antworten richtig sein. Eine Frage ist NUR dann richtig beantwortet, wenn ALLE richtigen Antworten angekreuzt wurden. Teil III: Statistik Alle Fragen sind zu beantworten. Es können keine oder mehrere Antworten richtig sein. Eine Frage ist NUR dann richtig beantwortet, wenn ALLE richtigen Antworten angekreuzt wurden. Wird

Mehr

Auswerten mit Excel. Viele Video-Tutorials auf Youtube z.b. http://www.youtube.com/watch?v=vuuky6xxjro

Auswerten mit Excel. Viele Video-Tutorials auf Youtube z.b. http://www.youtube.com/watch?v=vuuky6xxjro Auswerten mit Excel Viele Video-Tutorials auf Youtube z.b. http://www.youtube.com/watch?v=vuuky6xxjro 1. Pivot-Tabellen erstellen: In der Datenmaske in eine beliebige Zelle klicken Registerkarte Einfügen

Mehr

1 Darstellen von Daten

1 Darstellen von Daten 1 Darstellen von Daten BesucherInnenzahlen der Bühnen Graz in der Spielzeit 2010/11 1 Opernhaus 156283 Hauptbühne 65055 Probebühne 7063 Ebene 3 2422 Next Liberty 26800 Säulen- bzw. Balkendiagramm erstellen

Mehr

Eine computergestützte Einführung mit

Eine computergestützte Einführung mit Thomas Cleff Deskriptive Statistik und Explorative Datenanalyse Eine computergestützte Einführung mit Excel, SPSS und STATA 3., überarbeitete und erweiterte Auflage ^ Springer Inhaltsverzeichnis 1 Statistik

Mehr

Korrelation (II) Korrelation und Kausalität

Korrelation (II) Korrelation und Kausalität Korrelation (II) Korrelation und Kausalität Situation: Seien X, Y zwei metrisch skalierte Merkmale mit Ausprägungen (x 1, x 2,..., x n ) bzw. (y 1, y 2,..., y n ). D.h. für jede i = 1, 2,..., n bezeichnen

Mehr

Willkommen zur Vorlesung Statistik (Master)

Willkommen zur Vorlesung Statistik (Master) Willkommen zur Vorlesung Statistik (Master) Thema dieser Vorlesung: Verteilungsfreie Verfahren Prof. Dr. Wolfgang Ludwig-Mayerhofer Universität Siegen Philosophische Fakultät, Seminar für Sozialwissenschaften

Mehr

Grundlagen der empirischen Sozialforschung

Grundlagen der empirischen Sozialforschung Grundlagen der empirischen Sozialforschung Sitzung 11 - Datenanalyseverfahren Jan Finsel Lehrstuhl für empirische Sozialforschung Prof. Dr. Petra Stein 5. Januar 2009 1 / 22 Online-Materialien Die Materialien

Mehr

Eine zweidimensionale Stichprobe

Eine zweidimensionale Stichprobe Eine zweidimensionale Stichprobe liegt vor, wenn zwei qualitative Merkmale gleichzeitig betrachtet werden. Eine Urliste besteht dann aus Wertepaaren (x i, y i ) R 2 und hat die Form (x 1, y 1 ), (x 2,

Mehr

Analyse bivariater Kontingenztafeln

Analyse bivariater Kontingenztafeln Analyse bivariater Kontingenztafeln Werden zwei kategoriale Merkmale mit nicht zu vielen möglichen Ausprägungen gemeinsam analysiert, so kommen zur Beschreibung der gemeinsamen Verteilung im allgemeinen

Mehr

Multiple Regression. Ziel: Vorhersage der Werte einer Variable (Kriterium) bei Kenntnis der Werte von zwei oder mehr anderen Variablen (Prädiktoren)

Multiple Regression. Ziel: Vorhersage der Werte einer Variable (Kriterium) bei Kenntnis der Werte von zwei oder mehr anderen Variablen (Prädiktoren) Multiple Regression 1 Was ist multiple lineare Regression? Ziel: Vorhersage der Werte einer Variable (Kriterium) bei Kenntnis der Werte von zwei oder mehr anderen Variablen (Prädiktoren) Annahme: Der Zusammenhang

Mehr

3.1 Zusammenhang zwischen einem qualitativen und einem quantitativen Merkmal

3.1 Zusammenhang zwischen einem qualitativen und einem quantitativen Merkmal Kapitel 3 Bivariate Analyse In Kapitel 2 haben wir gesehen, wie man ein Merkmal auswertet. Mit Hilfe statistischer Verfahren kann man aber auch untersuchen, ob zwischen mehreren Merkmalen Abhängigkeiten

Mehr

Einfache statistische Auswertungen mit dem Programm SPSS

Einfache statistische Auswertungen mit dem Programm SPSS Einfache statistische Auswertungen mit dem Programm SPSS Datensatz: fiktive_daten.sav Dipl. Päd. Anne Haßelkus Dr. Dorothea Dette-Hagenmeyer 11/2011 Überblick 1 Deskriptive Statistiken; Mittelwert berechnen...

Mehr

Expertenrunde Gruppe 1: Wiederholungsgruppe EXCEL (Datenerfassung, Darstellungsformen, Verwertung)

Expertenrunde Gruppe 1: Wiederholungsgruppe EXCEL (Datenerfassung, Darstellungsformen, Verwertung) Epertenrunde Gruppe 1: Wiederholungsgruppe EXCEL (Datenerfassung, Darstellungsformen, Verwertung) Im Folgenden wird mit Hilfe des Programms EXEL, Version 007, der Firma Microsoft gearbeitet. Die meisten

Mehr

Häufigkeitstabellen. Balken- oder Kreisdiagramme. kritischer Wert für χ2-test. Kontingenztafeln

Häufigkeitstabellen. Balken- oder Kreisdiagramme. kritischer Wert für χ2-test. Kontingenztafeln Häufigkeitstabellen Menüpunkt Data PivotTable Report (bzw. entsprechendes Icon): wähle Data Range (Zellen, die die Daten enthalten + Zelle mit Variablenname) wähle kategoriale Variable für Spalten- oder

Mehr

Teil I: Deskriptive Statistik

Teil I: Deskriptive Statistik Teil I: Deskriptive Statistik 2 Grundbegriffe 2.1 Merkmal und Stichprobe 2.2 Skalenniveau von Merkmalen 2.3 Geordnete Stichproben und Ränge 2.1 Merkmal und Stichprobe An (geeignet ausgewählten) Untersuchungseinheiten

Mehr

SAS-Vertiefung zur Statistischen Software im SS 2010 Übungsaufgaben

SAS-Vertiefung zur Statistischen Software im SS 2010 Übungsaufgaben SAS-Vertiefung zur Statistischen Software im SS 2010 Übungsaufgaben Helmut Küchenhoff, Cornelia Oberhauser, Monia Mahling, Armin Monecke Im Folgenden gibt es 4 Aufgabenblöcke. Block 1: Daten einlesen,

Mehr

Linearer Zusammenhang von Datenreihen

Linearer Zusammenhang von Datenreihen Linearer Zusammenhang von Datenreihen Vielen Problemen liegen (möglicherweise) lineare Zusammenhänge zugrunde: Mein Internetanbieter verlangt eine Grundgebühr und rechnet minutenweise ab Ich bestelle ein

Mehr

Statistik II. Lineare Regressionsrechnung. Wiederholung Skript 2.8 und Ergänzungen (Schira: Kapitel 4) Statistik II

Statistik II. Lineare Regressionsrechnung. Wiederholung Skript 2.8 und Ergänzungen (Schira: Kapitel 4) Statistik II Statistik II Lineare Regressionsrechnung Wiederholung Skript 2.8 und Ergänzungen (Schira: Kapitel 4) Statistik II - 09.06.2006 1 Mit der Kovarianz und dem Korrelationskoeffizienten können wir den statistischen

Mehr

Einseitig gerichtete Relation: Mit zunehmender Höhe über dem Meeresspiegel sinkt im allgemeinen die Lufttemperatur.

Einseitig gerichtete Relation: Mit zunehmender Höhe über dem Meeresspiegel sinkt im allgemeinen die Lufttemperatur. Statistik Grundlagen Charakterisierung von Verteilungen Einführung Wahrscheinlichkeitsrechnung Wahrscheinlichkeitsverteilungen Schätzen und Testen Korrelation Regression Einführung Die Analyse und modellhafte

Mehr

Dokumentation. estat Version 2.0

Dokumentation. estat Version 2.0 Dokumentation estat Version 2.0 Installation Die Datei estat.xla in beliebiges Verzeichnis speichern. Im Menü Extras AddIns... Durchsuchen die Datei estat.xla auswählen. Danach das Auswahlhäkchen beim

Mehr

Fortgeschrittene Statistik Logistische Regression

Fortgeschrittene Statistik Logistische Regression Fortgeschrittene Statistik Logistische Regression O D D S, O D D S - R A T I O, L O G I T T R A N S F O R M A T I O N, I N T E R P R E T A T I O N V O N K O E F F I Z I E N T E N, L O G I S T I S C H E

Mehr

Einführung in die Statistik für Politikwissenschaftler Sommersemester 2011

Einführung in die Statistik für Politikwissenschaftler Sommersemester 2011 Einführung in die Statistik für Politikwissenschaftler Sommersemester 2011 Es können von den Antworten alle, mehrere oder keine Antwort(en) richtig sein. Nur bei einer korrekten Antwort (ohne Auslassungen

Mehr

Skalenniveaus =,!=, >, <, +, -

Skalenniveaus =,!=, >, <, +, - ZUSAMMENHANGSMAßE Skalenniveaus Nominalskala Ordinalskala Intervallskala Verhältnisskala =,!= =,!=, >, < =,!=, >, ,

Mehr

Willkommen zur Vorlesung Statistik

Willkommen zur Vorlesung Statistik Willkommen zur Vorlesung Statistik Thema dieser Vorlesung: Maßzahlen für zentrale Tendenz, Streuung und andere Eigenschaften von Verteilungen Prof. Dr. Wolfgang Ludwig-Mayerhofer Universität Siegen Philosophische

Mehr

Abhängigkeit zweier Merkmale

Abhängigkeit zweier Merkmale Abhängigkeit zweier Merkmale Johannes Hain Lehrstuhl für Mathematik VIII Statistik 1/33 Allgemeine Situation Neben der Untersuchung auf Unterschiede zwischen zwei oder mehreren Untersuchungsgruppen hinsichtlich

Mehr

6. Auswertung mehrdimensionaler Daten

6. Auswertung mehrdimensionaler Daten 6. Auswertung mehrdimensionaler Daten Bisher: Auswertungsmethoden für Daten eines einzelnen Merkmals, z.b. Diskrete Klassierung Grafische Darstellungen (Verteilungsfunktion) Lagemaße Streungsmaße Schiefemaße

Mehr

Statistik für Betriebswirte I 1. Klausur Wintersemester 2014/

Statistik für Betriebswirte I 1. Klausur Wintersemester 2014/ Statistik für Betriebswirte I 1. Klausur Wintersemester 2014/2015 13.02.2015 BITTE LESERLICH IN DRUCKBUCHSTABEN AUSFÜLLEN Nachname:................................................................... Vorname:....................................................................

Mehr

Einleitung 19. Teil I Datenanalyse und Modellbildung Grundlagen 25

Einleitung 19. Teil I Datenanalyse und Modellbildung Grundlagen 25 Inhaltsverzeichnis Einleitung 19 Zu diesem Buch 19 Konventionen in diesem Buch 20 Was Sie nicht lesen müssen 21 Falsche Voraussetzungen 21 Wie dieses Buch aufgebaut ist 21 Teil I: Datenanalyse und Grundlagen

Mehr

Sozialwissenschaftliche Fakultät der Universität Göttingen. Sommersemester 2009. Statistik mit SPSS

Sozialwissenschaftliche Fakultät der Universität Göttingen. Sommersemester 2009. Statistik mit SPSS Sommersemester 2009 Statistik mit SPSS 15. Mai 2009 15. Mai 2009 Statistik Dozentin: mit Esther SPSSOchoa Fernández 1 Überblick 1. Korrelationsanalysen Kovariation und Kovarianz Korrelation: - Interpretation

Mehr

1 Verteilungen und ihre Darstellung

1 Verteilungen und ihre Darstellung GKC Statistische Grundlagen für die Korpuslinguistik Kapitel 2: Univariate Deskription von Daten 8.11.2004 Univariate (= eindimensionale) Daten bestehen aus Beobachtungen eines einzelnen Merkmals. 1 Verteilungen

Mehr

Einige Statistische Tests für den Ein- Zwei- und k-stichprobenfall (Nach Sachs, Stat. Meth.)

Einige Statistische Tests für den Ein- Zwei- und k-stichprobenfall (Nach Sachs, Stat. Meth.) ue biostatistik: nichtparametrische testverfahren / ergänzung 1/6 h. Lettner / physik Statistische Testverfahren Einige Statistische Tests für den Ein- Zwei- und k-stichprobenfall (Nach Sachs, Stat. Meth.)

Mehr

Musterlösung zur Aufgabensammlung Statistik I Teil 3

Musterlösung zur Aufgabensammlung Statistik I Teil 3 Musterlösung zur Aufgabensammlung Statistik I Teil 3 2008, Malte Wissmann 1 Zusammenhang zwischen zwei Merkmalen Nominale, Ordinale Merkmale und Mischungen Aufgabe 12 a) x\ y 1.Klasse 2.Klasse 3.Klasse

Mehr

Statistik I für Betriebswirte Vorlesung 2

Statistik I für Betriebswirte Vorlesung 2 Statistik I für Betriebswirte Vorlesung 2 PD Dr. Frank Heyde TU Bergakademie Freiberg Institut für Stochastik 16. April 2015 PD Dr. Frank Heyde Statistik I für Betriebswirte Vorlesung 2 1 ii) empirische

Mehr

Bachelorabschlussseminar Dipl.-Kfm. Daniel Cracau

Bachelorabschlussseminar Dipl.-Kfm. Daniel Cracau 1 Einführung in die statistische Datenanalyse Bachelorabschlussseminar Dipl.-Kfm. Daniel Cracau 2 Gliederung 1.Grundlagen 2.Nicht-parametrische Tests a. Mann-Whitney-Wilcoxon-U Test b. Wilcoxon-Signed-Rank

Mehr

Statistik. Ronald Balestra CH St. Peter

Statistik. Ronald Balestra CH St. Peter Statistik Ronald Balestra CH - 7028 St. Peter www.ronaldbalestra.ch 17. Januar 2010 Inhaltsverzeichnis 1 Statistik 1 1.1 Beschreibende Statistik....................... 1 1.2 Charakterisierung von Häufigkeitsverteilungen...........

Mehr

3. Deskriptive Statistik

3. Deskriptive Statistik 3. Deskriptive Statistik Eindimensionale (univariate) Daten: Pro Objekt wird ein Merkmal durch Messung / Befragung/ Beobachtung erhoben. Resultat ist jeweils ein Wert (Merkmalsausprägung) x i : - Gewicht

Mehr

PROC MEANS. zum Berechnen statistischer Maßzahlen (für quantitative Merkmale)

PROC MEANS. zum Berechnen statistischer Maßzahlen (für quantitative Merkmale) PROC MEAS zum Berechnen statistischer Maßzahlen (für quantitative Merkmale) Allgemeine Form: PROC MEAS DATA=name Optionen ; VAR variablenliste ; CLASS vergleichsvariable ; Beispiel und Beschreibung der

Mehr

Erstellen von statistischen Auswertungen mit Excel in den Sozialwissenschaften

Erstellen von statistischen Auswertungen mit Excel in den Sozialwissenschaften Erstellen von statistischen Auswertungen mit Excel in den Sozialwissenschaften Dr. Viola Vockrodt-Scholz Telefon: 030/25 29 93 26 Email: vvs@zedat.fu-berlin.de Dr.Viola.Vockrodt-Scholz@t-online.de www.userpage.fu-berlin.de/~vvs

Mehr

Standardisierung von Daten Darstellung von Daten in Texten, Tabellen und Abbildungen. Standardisierung von Daten

Standardisierung von Daten Darstellung von Daten in Texten, Tabellen und Abbildungen. Standardisierung von Daten DAS THEMA: TABELLEN UND ABBILDUNGEN Standardisierung von Daten Darstellung von Daten in Texten, Tabellen und Abbildungen Standardisierung von Daten z-standardisierung Standardnormalverteilung 1 DIE Z-STANDARDISIERUNG

Mehr

Statistik mit Excel. für Praktiker: Statistiken aufbereiten und präsentieren HORST-DIETER RADKE

Statistik mit Excel. für Praktiker: Statistiken aufbereiten und präsentieren HORST-DIETER RADKE Statistik mit Excel für Praktiker: Statistiken aufbereiten und präsentieren HORST-DIETER RADKE INHALTS- VERZEICHNIS Vorwort 13 Schreiben Sie uns! 15 1 Statistische Untersuchungen 17 Wozu Statistik? 18

Mehr

1 45, 39, 44, 48, 42, 39, 40, , 31, 46, 35, 31, 42, 51, , 42, 33, 46, 33, 44, 43

1 45, 39, 44, 48, 42, 39, 40, , 31, 46, 35, 31, 42, 51, , 42, 33, 46, 33, 44, 43 1) Ermittle jeweils das arithmetische Mittel. Ordne die Datenerhebungen nach der Größe der arithmetischen Mittel. Beginne mit dem Größten. 1 45, 39, 44, 48, 42, 39, 40, 31 2 35, 31, 46, 35, 31, 42, 51,

Mehr

Beide Verteilungen der Zeiten sind leicht schief. Der Quartilsabstand für Zeiten zum Surfen ist kleiner als der zum Fernsehen.

Beide Verteilungen der Zeiten sind leicht schief. Der Quartilsabstand für Zeiten zum Surfen ist kleiner als der zum Fernsehen. Welche der folgenden Maßzahlen sind resistent gegenüber Ausreißer? Der Mittelwert und die Standardabweichung. Der und die Standardabweichung. Der und die Spannweite. Der und der Quartilsabstand. Die Spannweite

Mehr

Regressionsanalysen. Zusammenhänge von Variablen. Ziel der Regression. ( Idealfall )

Regressionsanalysen. Zusammenhänge von Variablen. Ziel der Regression. ( Idealfall ) Zusammenhänge von Variablen Regressionsanalysen linearer Zusammenhang ( Idealfall ) kein Zusammenhang nichtlinearer monotoner Zusammenhang (i.d.regel berechenbar über Variablentransformationen mittels

Mehr

Einführung in statistische Analysen

Einführung in statistische Analysen Einführung in statistische Analysen Andreas Thams Econ Boot Camp 2008 Wozu braucht man Statistik? Statistik begegnet uns jeden Tag... Weihnachten macht Deutschen Einkaufslaune. Im Advent überkommt die

Mehr

1. Allgemeine Hinweise Alexander.Martin.Koenig@TU-Clausthal.de

1. Allgemeine Hinweise Alexander.Martin.Koenig@TU-Clausthal.de 1. Allgemeine Hinweise Alexander.Martin.Koenig@TU-Clausthal.de Man sollte eine Excel-Tabelle immer so übersichtlich wie möglich halten. Dazu empfiehlt es sich, alle benötigten Daten, Konstanten und Messwerte

Mehr

Methoden Quantitative Datenanalyse

Methoden Quantitative Datenanalyse Leitfaden Universität Zürich ISEK - Andreasstrasse 15 CH-8050 Zürich Telefon +41 44 635 22 11 Telefax +41 44 635 22 19 www.isek.uzh.ch 11. September 2014 Methoden Quantitative Datenanalyse Vorbereitung

Mehr

Modul G.1 WS 07/08: Statistik 17.01.2008 1. Die Korrelation ist ein standardisiertes Maß für den linearen Zusammenhangzwischen zwei Variablen.

Modul G.1 WS 07/08: Statistik 17.01.2008 1. Die Korrelation ist ein standardisiertes Maß für den linearen Zusammenhangzwischen zwei Variablen. Modul G.1 WS 07/08: Statistik 17.01.2008 1 Wiederholung Kovarianz und Korrelation Kovarianz = Maß für den linearen Zusammenhang zwischen zwei Variablen x und y Korrelation Die Korrelation ist ein standardisiertes

Mehr

Schätzung des Lifetime Values von Spendern mit Hilfe der Überlebensanalyse

Schätzung des Lifetime Values von Spendern mit Hilfe der Überlebensanalyse Schätzung Lifetime Values von Spenn mit Hilfe Überlebensanalyse Einführung in das Verfahren am Beispiel Einzugsgenehmigung Überlebensanalysen o Ereignisdatenanalysen behandeln das Problem, mit welcher

Mehr

Die erhobenen Daten werden zunächst in einer Urliste angeschrieben. Daraus ermittelt man:

Die erhobenen Daten werden zunächst in einer Urliste angeschrieben. Daraus ermittelt man: Die erhobenen Daten werden zunächst in einer Urliste angeschrieben. Daraus ermittelt man: a) Die absoluten Häufigkeit: Sie gibt an, wie oft ein Variablenwert vorkommt b) Die relative Häufigkeit: Sie erhält

Mehr

Universität Bonn 28. Juli 2010 Fachbereich Rechts- und Wirtschaftswissenschaften Statistische Abteilung Prof. Dr. A. Kneip. KLAUSUR Statistik B

Universität Bonn 28. Juli 2010 Fachbereich Rechts- und Wirtschaftswissenschaften Statistische Abteilung Prof. Dr. A. Kneip. KLAUSUR Statistik B Universität Bonn 28. Juli 2010 Fachbereich Rechts- und Wirtschaftswissenschaften Statistische Abteilung Prof. Dr. A. Kneip Sommersemester 2010 KLAUSUR Statistik B Hinweise zur Bearbeitung: Bei allen Teilaufgaben

Mehr

Statistische Verfahren für das Data Mining in einem Industrieprojekt

Statistische Verfahren für das Data Mining in einem Industrieprojekt Statistische Verfahren für das Data Mining in einem Industrieprojekt Thorsten Dickhaus Forschungszentrum Jülich GmbH Zentralinstitut für Angewandte Mathematik Telefon: 02461/61-4193 E-Mail: th.dickhaus@fz-juelich.de

Mehr

Assoziation & Korrelation

Assoziation & Korrelation Statistik 1 für SoziologInnen Assoziation & Korrelation Univ.Prof. Dr. Marcus Hudec Einleitung Bei Beobachtung von 2 Merkmalen für jeden Merkmalsträger stellt sich die Frage, ob es systematische Zusammenhänge

Mehr

Lage- und Streuungsparameter

Lage- und Streuungsparameter Lage- und Streuungsparameter Beziehen sich auf die Verteilung der Ausprägungen von intervall- und ratio-skalierten Variablen Versuchen, diese Verteilung durch Zahlen zu beschreiben, statt sie graphisch

Mehr

Weitere Fragestellungen im Zusammenhang mit einer linearen Einfachregression

Weitere Fragestellungen im Zusammenhang mit einer linearen Einfachregression Weitere Fragestellungen im Zusammenhang mit einer linearen Einfachregression Speziell im Zusammenhang mit der Ablehnung der Globalhypothese werden bei einer linearen Einfachregression weitere Fragestellungen

Mehr

Statistik mit Excel. für Praktiker: Statistiken aufbereiten und präsentieren HORST-DIETER RADKE. Markt+Technik

Statistik mit Excel. für Praktiker: Statistiken aufbereiten und präsentieren HORST-DIETER RADKE. Markt+Technik Statistik mit Excel für Praktiker: Statistiken aufbereiten und präsentieren HORST-DIETER RADKE Markt+Technik Vorwort Schreiben Sie uns! 13 15 Statistische Untersuchungen 17 Wozu Statistik? 18 Wirtschaftliche

Mehr

Auswertung und Darstellung wissenschaftlicher Daten (1)

Auswertung und Darstellung wissenschaftlicher Daten (1) Auswertung und Darstellung wissenschaftlicher Daten () Mag. Dr. Andrea Payrhuber Zwei Schritte der Auswertung. Deskriptive Darstellung aller Daten 2. analytische Darstellung (Gruppenvergleiche) SPSS-Andrea

Mehr

6.2 Regressionsanalyse

6.2 Regressionsanalyse c-kennzahlensystem (ROCI) 6. Regressionsanalyse Die Regressionsanalyse zählt zu den wichtigsten Analysemethoden des Kommunikationscontrollings und hat ihre tiefen Wurzeln in der Statistik. Im Rahmen des

Mehr

Box-and-Whisker Plot -0,2 0,8 1,8 2,8 3,8 4,8

Box-and-Whisker Plot -0,2 0,8 1,8 2,8 3,8 4,8 . Aufgabe: Für zwei verschiedene Aktien wurde der relative Kurszuwachs (in % beobachtet. Aus den jeweils 20 Quartaldaten ergaben sich die folgenden Box-Plots. Box-and-Whisker Plot Aktie Aktie 2-0,2 0,8,8

Mehr

Statistik Einführung // Lineare Regression 9 p.2/72

Statistik Einführung // Lineare Regression 9 p.2/72 Statistik Einführung Lineare Regression Kapitel 9 Statistik WU Wien Gerhard Derflinger Michael Hauser Jörg Lenneis Josef Ledold Günter Tirler Rosmarie Wakolbinger Statistik Einführung // Lineare Regression

Mehr

Tabelle 6a: Deskriptive Statistiken der metrischen Variablen

Tabelle 6a: Deskriptive Statistiken der metrischen Variablen Ergebnisse 77 5 Ergebnisse Das folgende Kapitel widmet sich der statistischen Auswertung der Daten zur Ü- berprüfung der Hypothesen. Die hier verwendeten Daten wurden mit den in 4.3 beschriebenen Instrumenten

Mehr

erwartete Häufigkeit n=80 davon 50% Frauen fe=40 davon 50% Männer fe=40 Abweichung der beobachteten von den erwarteten Häufigkeiten:

erwartete Häufigkeit n=80 davon 50% Frauen fe=40 davon 50% Männer fe=40 Abweichung der beobachteten von den erwarteten Häufigkeiten: Verfahren zur Analyse von Nominaldaten Chi-Quadrat-Tests Vier-Felder Kontingenztafel Mehrfach gestufte Merkmale Cramers V, Kontingenzkoeffizient, Phi-Koeffizient Muster aller Chi-Quadrat-Verfahren eine

Mehr

1 Einfachregression 1.1In 10 Haushalten wurden Einkommen und Ausgaben für Luxusgüter erfragt:

1 Einfachregression 1.1In 10 Haushalten wurden Einkommen und Ausgaben für Luxusgüter erfragt: Beispiele zum Üben und Wiederholen zu Wirtschaftsstatistik 2 (Kurs 3) 1 Einfachregression 1.1In 10 Haushalten wurden Einkommen und Ausgaben für Luxusgüter erfragt: Haushaltseinkommen 12 24 30 40 80 60

Mehr

Dr. I. Fahrner WiSe 2016/17 Fakultät Grundlagen Hochschule Esslingen Übungsblatt 2. Statistik

Dr. I. Fahrner WiSe 2016/17 Fakultät Grundlagen Hochschule Esslingen Übungsblatt 2. Statistik Dr. I. Fahrner WiSe 2016/17 Fakultät Grundlagen 6.10.2016 Hochschule Esslingen Übungsblatt 2 Statistik Stichworte: arithmetischer Mittelwert, empirische Varianz, empirische Standardabweichung, empirischer

Mehr

benötigen. Die Zeit wird dabei in Minuten angegeben und in einem Boxplot-Diagramm veranschaulicht.

benötigen. Die Zeit wird dabei in Minuten angegeben und in einem Boxplot-Diagramm veranschaulicht. , D 1 Kreuze die richtige Aussage an und stelle die anderen Aussagen richtig. A Das arithmetische Mittel kennzeichnet den mittleren Wert einer geordneten Datenliste. B Die Varianz erhält man, wenn man

Mehr

Standardab er des. Testwert = 145.5 95% Konfidenzintervall. T df Sig. (2-seitig) Differenz Untere Obere -2.011 698.045-5.82-11.50 -.14.

Standardab er des. Testwert = 145.5 95% Konfidenzintervall. T df Sig. (2-seitig) Differenz Untere Obere -2.011 698.045-5.82-11.50 -.14. Aufgabe : einfacher T-Test Statistik bei einer Stichprobe Standardfehl Standardab er des Mittelwert weichung Mittelwertes 699 39.68 76.59 2.894 Test bei einer Sichprobe Testwert = 45.5 95% Konfidenzintervall

Mehr

Standardisierte kompetenzorientierte schriftliche Reifeprüfung. Mathematik. Probeklausur März 2014. Teil-1-Aufgaben

Standardisierte kompetenzorientierte schriftliche Reifeprüfung. Mathematik. Probeklausur März 2014. Teil-1-Aufgaben Standardisierte kompetenzorientierte schriftliche Reifeprüfung Mathematik Probeklausur März 2014 Teil-1-Aufgaben Beurteilung Jede Aufgabe in Teil 1 wird mit 0 oder 1 Punkt bewertet, jede Teilaufgabe in

Mehr

Veranstaltung Statistik (BWL) an der FH Frankfurt/Main im WS 2004/05 (Dr. Faik) Klausur 09.02.2005 - GRUPPE A - BEARBEITER/IN (NAME, VORNAME):

Veranstaltung Statistik (BWL) an der FH Frankfurt/Main im WS 2004/05 (Dr. Faik) Klausur 09.02.2005 - GRUPPE A - BEARBEITER/IN (NAME, VORNAME): Veranstaltung Statistik (BWL) an der FH Frankfurt/Main im WS 2004/05 (Dr. Faik) Klausur 09.02.2005 - GRUPPE A - BEARBEITER/IN (NAME, VORNAME): MATRIKELNUMMER: Alte Prüfungsordnung/Neue Prüfungsordnung

Mehr

Univariates Chi-Quadrat-Verfahren für ein dichotomes Merkmal und eine Messwiederholung: Test nach McNemar

Univariates Chi-Quadrat-Verfahren für ein dichotomes Merkmal und eine Messwiederholung: Test nach McNemar Univariates Chi-Quadrat-Verfahren für ein dichotomes Merkmal und eine Messwiederholung: Test nach McNemar Inhaltsverzeichnis Univariates Chi-Quadrat-Verfahren für ein dichotomes Merkmal und eine Messwiederholung:

Mehr

Institut für Biometrie und klinische Forschung. WiSe 2012/2013

Institut für Biometrie und klinische Forschung. WiSe 2012/2013 Klinische Forschung WWU Münster Pflichtvorlesung zum Querschnittsfach Epidemiologie, Biometrie und Med. Informatik Praktikum der Medizinischen Biometrie () WiSe /3 Univariate und bivariate Verfahren Univariate

Mehr

Lösungsvorschläge zur Klausur Beschreibende Statistik und Wirtschaftsstatistik (Sommersemester 2013)

Lösungsvorschläge zur Klausur Beschreibende Statistik und Wirtschaftsstatistik (Sommersemester 2013) Lösungsvorschläge zur Klausur Beschreibende Statistik und Wirtschaftsstatistik (Sommersemester 203) Aufgabe (9 Punkte) Ein metrisches Merkmal X sei in einer Grundgesamtheit vom Umfang n = 200 diskret klassiert.

Mehr

Bivariate Zusammenhänge

Bivariate Zusammenhänge Bivariate Zusammenhänge 40 60 80 Bivariater Zusammenhang: Zusammenhang zwischen zwei Variablen weight (kg) Gibt es einen Zusammenhang zwischen Größe & Gewicht? (am Beispieldatensatz) Offensichtlich positiver

Mehr

Bitte am PC mit Windows anmelden!

Bitte am PC mit Windows anmelden! Einführung in SPSS Plan für heute: Grundlagen/ Vorwissen für SPSS Vergleich der Übungsaufgaben Einführung in SPSS http://weknowmemes.com/generator/uploads/generated/g1374774654830726655.jpg Standardnormalverteilung

Mehr

Beispiel 4 (Einige weitere Aufgaben)

Beispiel 4 (Einige weitere Aufgaben) 1 Beispiel 4 (Einige weitere Aufgaben) Aufgabe 1 Bestimmen Sie für die folgenden Zweierstichproben, d. h. Stichproben, die jeweils aus zwei Beobachtungen bestehen, a) den Durchschnitt x b) die mittlere

Mehr

Korrelation. Übungsbeispiel 1. Übungsbeispiel 4. Übungsbeispiel 2. Übungsbeispiel 3. Korrel.dtp Seite 1

Korrelation. Übungsbeispiel 1. Übungsbeispiel 4. Übungsbeispiel 2. Übungsbeispiel 3. Korrel.dtp Seite 1 Korrelation Die Korrelationsanalyse zeigt Zusammenhänge auf und macht Vorhersagen möglich Was ist Korrelation? Was sagt die Korrelationszahl aus? Wie geht man vor? Korrelation ist eine eindeutige Beziehung

Mehr