Abhängigkeit zweier Merkmale

Größe: px
Ab Seite anzeigen:

Download "Abhängigkeit zweier Merkmale"

Transkript

1 Abhängigkeit zweier Merkmale Johannes Hain Lehrstuhl für Mathematik VIII Statistik 1/33

2 Allgemeine Situation Neben der Untersuchung auf Unterschiede zwischen zwei oder mehreren Untersuchungsgruppen hinsichtlich eines bestimmten Merkmals, kann unter Umständen das Gegenteil von Interesse sein nämlich die Frage, ob ein bestimmter Zusammenhang zwischen zwei Merkmalen besteht. Die Frage nach dem Zusammenhang lässt sich aus statistischer Sicht wieder sowohl explorativ, als auch mit Hilfe von Signifikanztests untersuchen. Dabei unterschiedet man im Wesentlichen die folgenden Fälle: (i) Die Daten sind metrisch: Normalverteilte Stichproben Nicht normalverteilte Stichproben (ii) Die Daten sind kategorial 2/33

3 Abhängigkeit bei metrischen Variablen Voraussetzungen Für zwei Zufallsvariablen X und Y vom stetigen Typ, d.h. entweder intervall- oder sogar verhältnisskalierte Variablen, liegt eine unabhängige Stichprobe (X 1,Y 1 ),...,(X n,y n ) vom Umfang n vor. Die Abhängigkeitsstruktur von X und Y kann man mit einem Scatterplot grafisch untersuchen. Hierbei werden die beiden Variablen X und Y gegeneinander in einem Diagramm eingetragen. Je nach dem wie stark der Zusammenhang zwischen den beiden Variablen ist, kann man mit einem Scatterplot schon eine Struktur in den Daten erkennen. 3/33

4 Abhängigkeit bei metrischen Variablen Beispiel: Scatterplot der Ehepaar-Daten, X = Alter des Mannes, Y = Alter der Frau. 4/33

5 Abhängigkeit bei metrischen Variablen Erstellung eines Scatterplots in SPSS Diagramme Veraltete Dialogfelder Streu-/Punkt-Diagramm Definiere ein Einfaches Streudiagramm und wähle die beiden gewünschten Variablen in die X-Achse und die Y-Achse. 5/33

6 Abhängigkeit bei metrischen Variablen Eng mit dem Begriff der Abhängigkeit verwandt ist in der Statistik die Korrelation zwischen zwei Variablen. Mit der Korrelation lässt sich der Zusammenhang quantifizieren und somit auch statistisch genauer untersuchen. Die Korrelation zwischen X und Y ist dann wie folgt definiert: Corr(X,Y) = Cov(X,Y) σ X σ Y [ 1;1]. = Die Korrelation ist auf dem Intervall [ 1, +1] standardisiert und kann deshalb viel leichter interpretiert werden. 6/33

7 Abhängigkeit bei metrischen Variablen Interpretation der Korrelation: Eine hohe positive (negative) Korrelation bedeutet, dass tendenziell ein überdurchschnittlich hoher Wert von X mit einem überdurchschnittlich hohen (niedrigen) Wert von Y einhergeht. Richtlinien für die Stärke der Korrelation Corr(X, Y) 0: vernachlässigbare lineare Abhängigkeit zwischen X und Y. 0.3 < Corr(X,Y) < 0.7: schwacher linearer Zusammenhang zwischen X und Y. Corr(X, Y) > 0.7: starker linearer Zusammenhang zwischen X und Y. 7/33

8 Abhängigkeit bei metrischen Variablen Zusammenhang zwischen Abhängigkeit und Korrelation: Es gilt: Achtung: X und Y unabhängig X und Y unkorreliert. X und Y unkorreliert X und Y unabhängig. gilt im Allgemeinen aber NICHT! Merke: Die Korrelation misst nur die lineare Abhängigkeit. Es gibt auch andere Arten von Abhängigkeiten zwischen Variablen, z.b. quadratische oder logarithmische. Gilt Corr(X,Y) = 1, spricht man auch von einem perfekten postiven (negativen) Zusammenhang. In der Praxis kommt ein solcher Koeffizient aber eigentlich nicht vor. 8/33

9 Abhängigkeit bei metrischen Variablen Normalverteilte Stichproben Um nun konkrete statistische Aussagen über die Stärke des Zusammenhangs zweier Variablen zu machen, berechnet man aus der vorliegenden Stichproben den empirischen Korrelationskoeffizienten nach Pearson: ρ := Ĉov(X,Y) ˆσ Xˆσ Y = (1 n n i=1 X iy i ) ( 1 n n i=1 X i)( 1 n n i=1 Y i) ( 1 n n i=1 (X i X) 2 )( 1 n n i=1 (Y i Ȳ)2 ) Interpretation von ρ Wenn der Wert der einen Variablen, z.b. von X um eine Einheit ansteigt, dann verändert sich der Wert der anderen Variablen, also Y, um ρ Einheiten. Je nach dem Vorzeichen geht der Wert von Y um ρ Einheiten nach oben oder nach unten. 9/33

10 Abhängigkeit bei metrischen Variablen Normalverteilte Stichproben Um festzustellen, ob der Zusammenhang zwischen zwei Variablen X und Y nicht nur zufällig sondern systematisch ist, kann man einen Signifikanztest durchführen. Voraussetzungen Gegeben sind zwei metrisch-skalierte Stichproben X 1,...,X n und Y 1,...,Y n, die durch die Bildung von Paaren (X i,y i ),i = 1,...,n erhoben wurden. Die beiden Stichproben sind außerdem normalverteilt, d.h. X 1,...,X n N(µ X,σ 2 ) und Y 1,...,Y n N(µ Y,σ 2 ). = Es reicht bei diesem Test also nicht aus, dass intervallskalierte Daten vorliegen, sondern die Daten müssen zusätzlich auch noch beide normalverteilt sein! 10/33

11 Abhängigkeit bei metrischen Variablen Normalverteilte Stichproben Die zugehörige Nullhypothese für diesen Test lautet H 0 : ρ = 0, d.h. es wird überprüft, ob überhaupt ein Zusammenhang zwischen X und Y vorliegt. Die zugehörige Teststatistik T := ρ 1 ρ 2 n 2 ist unter H 0 t-verteilt mit (n 2) Freiheitsgraden. Wird H 0 nun verworfen, kann man anhand des Vorzeichens von ρ erkennen, in welche Richtung der Zusammenhang geht. 11/33

12 Abhängigkeit bei metrischen Variablen Normalverteilte Stichproben Pearson scher Korrelationskoeffizient in SPSS Analysieren Korrelation Bivariat Wähle die gewünschten Variablen aus und klicke im Feld Korrelationskoeffizienten den Koeffizienten nach Pearson an. 12/33

13 Abhängigkeit bei metrischen Variablen Nicht normalverteilte Stichproben Voraussetzungen Für zwei metrische Zufallsvariablen X und Y liegt eine unabhängige Stichprobe (X 1,Y 1 ),...,(X n,y n ) vom Umfang n vor. Im Fall nicht normalverteilter Daten, kann ebenfalls ein Korrelationskoeffizient berechnet werden, der sogenannte Spearman Rangkorrelationskoeffizient. Vorgehen zur Berechnung: Ordne die X 1,...,X n und die Y 1,...,Y n jeweils der Größe nach an. Jeder Messwert X i und Y i erhält einen Rang r X,i und r Y,i. Berechne den Spearman schen Rangkorrelationskoeffizienten: r S := 6 n i=1 (r X,i r Y,i ) 2 n(n 2 1) [ 1;1]. 13/33

14 Abhängigkeit bei metrischen Variablen Nicht normalverteilte Stichproben Wie beim Korrelationkoeffizienten nach Pearson wird auch hier die Nullhypothese H 0 : r S = 0 getestet, also ob die beiden Variablen signifikant zusammenhängen in welche Richtung auch immer. Die Teststatistik T := r S 1 r 2 S n 2 ist dann für n > 30 approximativ t-verteilt mit (n 2) Freiheitsgraden. Für n 30 berechnet SPSS den p-wert basierend auf Tafelwerken. 14/33

15 Abhängigkeit bei metrischen Variablen Nicht normalverteilte Stichproben Spearman scher Korrelationskoeffizient in SPSS Analysieren Korrelation Bivariat Wähle die gewünschten Variablen aus und klicke im Feld Korrelationskoeffizienten den Koeffizienten nach Spearman an. 15/33

16 Abhängigkeit bei metrischen Variablen Aufgaben zur Vertiefung I Aufgabe zum Datensatz Kino.sav Gibt es einen Zusammenhang zwischen dem Alter und der Anzahl der Kinobesuche? Stelle die Daten grafisch dar, berechne ein geeignetes Zusammenhangsmaß und führe dazu einen Signifikanztest durch. Aufgabe zum Datensatz Fussball.sav Wie hoch ist die Korrelation zwischen den Punkten am Saisonende und dem Etat des jeweiligen Vereins? Überprüfe die Signifikanz mit dem korrekten Testverfahren und versuche die Daten grafisch zu veranschaulichen. 16/33

17 Abhängigkeit bei metrischen Variablen Aufgaben zur Vertiefung II Aufgabe zum Datensatz Arbeitsbeschaffung.sav Der Datensatz enthält das Bruttoeinkommen von Erwerbslosen vor und während einer Arbeitsbeschaffungsmaßnahme. Wie hoch ist die Korrelation zwischen den beiden Einkommen? Überprüfe die Signifikanz mit dem korrekten Testverfahren und versuche die Daten grafisch zu veranschaulichen. Aufgabe zum Datensatz Pisa.sav Zwischen welchen der drei Leistungsparameter (Lesen, Mathe, Naturwissenschaften) gibt es den stärksten linearen Zusammenhang? 17/33

18 Abhängigkeit bei kategorialen Variablen Voraussetzungen Für zwei Zufallsvariablen X und Y mit nominalskalierten Werten liegt eine unabhängige Stichprobe (X 1,Y 1 ),...,(X n,y n ) vom Umfang n vor. Für Variablen vom diskreten Typ macht die Erstellung eines Scatterplot natürlich wenig Sinn. Allerdings gibt es auch in diesem Fall die Möglichkeit der grafischen Veranschaulichung der Daten, beispielsweise mittels 3D-Balken. Dabei wird für jede mögliche Merkmalskombination von X und Y die Häufigkeit in ein dreidimensionales Histogramm gezeichnet. 18/33

19 Abhängigkeit bei kategorialen Variablen Beispiel: 3D-Histogramm für zwei nominalsaklierte Variablen 19/33

20 Abhängigkeit bei kategorialen Variablen 3D-Histogramm in SPSS Diagramme Veraltete Diaglogfelder 3D-Balken Klicke sowohl für die X-Achse als auch für die Y-Achse die Auswahl Fallgruppen an und gehe auf das Feld Definieren Wähle die beiden gewünschten Variablen in die Felder Kategorieachse X und Kategorieachse Z 20/33

21 Abhängigkeit bei kategorialen Variablen Die nominalskalierten Variablen X und Y mit einem statistischen Verfahren auf ihren Zusammenhang zu testen kann man mit dem χ 2 -Unabhängigkeitstest. Die zu untersuchende Nullhypothese lautet: H 0 : X und Y sind voneinander unabhängig Das Vorgehens des χ 2 -Tests kann man sich mit Hilfe von Kontingenztafeln deutlich machen. Das Resultat jeder Sichprobe mit paarweisen Beobachtungen (X i,y i ) lässt sich mit einer Kontingenztafel darstellen. 21/33

22 Abhängigkeit bei kategorialen Variablen Beispiel einer Kontingenztafel X := Familienstand mit den Ausprägungen X {ledig, geschieden, verheiratet} Y := Schulbildung mit den Ausprägungen Y {Gymnasium, Realschule, Hauptschule} Gymnasium Realschule Hauptschule Gesamt ledig geschieden verheiratet Gesamt /33

23 Abhängigkeit bei kategorialen Variablen Grafische Veranschaulichung Ein Balkendiagramm, dass für jede Ausprägung der einer Variable die prozentuale Verteilung der anderen Variablen darstellt, verdeutlicht ebenso die Vorgehensweise des χ 2 -Tests: 100,0% 80,0% Auge blau braun nuss gruen 60,0% 40,0% 20,0% 0,0% rot braun blond schwarz 23/33

24 Abhängigkeit bei kategorialen Variablen Grafische Veranschaulichung Balkendiagramm mit SPSS Diagramme Diagrammerstellung... Wähle im Feld Galerie eines der beiden gruppierten Balkendiagrammsymbole mit einem Doppelklick aus. Ziehe die Variable Haar in das Feld X-Achse? und die Variable Auge in das Feld Clustervariable... Aktiviere das Fenster Elementeigenschaften. Ändere im Feld Statistiken unter Statistik die Auswahl von Anzahl zu Prozentsatz () Klicke auf das Feld Parameter festlegen... und wähle im neu erscheinenden Dialogfeld Gesamt für jede X-Achsen-Kategorie aus und gehe auf Weiter Gehe auf Zuweisen und danach im Fenster Diagrammerstellung auf OK 24/33

25 Abhängigkeit bei kategorialen Variablen Grundlegender Gedanke Vorgehen beim χ 2 -Test Ausgehend von den vorliegenden Daten berechnet man beim χ 2 -Test die erwarteten Häufigkeiten jeder Faktorstufenkombination unter der Annahme, dass X und Y unabhängig sind. Diese erwarteten Häufigkeiten werden dann mit den tatsächlichen Häufigkeiten vergleichen. Trifft H 0 zu, sollte die Differenz der beiden Werte nahe bei Null liegen. Die zugehörige Teststatistik X 2 ist etwas komplizierter vereinfacht gesprochen werden die quadrierten Differenzen für jede Faktorstufenkombination aufsummiert: ( I J nij n jn i ) 2 X 2 := i=1 j=1 n n j n i n. Wird diese Gesamtsumme zu groß wird die Nullhypothese verworfen. 25/33

26 Abhängigkeit bei kategorialen Variablen Der χ 2 -Unabhängigkeitstest in SPSS Analysieren Deskriptive Statistiken Kreuztabellen Ziehe eine der gewünschen Variablen in das Feld Zeilen, die andere in das Feld Spalten Klicke das Feld Statistik an und wähle Chi-Quadrat aus Klicke das Feld Zellen und klicke im Feld Häufigkeiten die Option Erwartet an, um sich zusätzlich noch die erwarteten Häufigkeiten angeben zu lassen 26/33

27 Abhängigkeit bei kategorialen Variablen Der χ 2 -Unabhängigkeitstest ist ein approximatives Testverfahren die zugehörige Teststatistik T P ist nur approximativ χ 2 -verteilt mit (I 1)(J 1) Freiheitsgraden. Das gleiche Problem tritt beispielsweise beim Mann-Whitney-U-Test auf. Damit die Approximation von ausreichender Güte ist, sollte die folgende Faustregel erfüllt sein: Faustregel für den χ 2 -Test (Regel von Cochran) Die erwartete Häufigkeit sollte in jeder Zelle mindestens den Wert 1 betragen und für 80% der Zellen sollte die erwartete Häufigkeit mindestens den Wert 5 betragen. Ist die Regel verletzt, gibt es zwei Möglichkeiten: (i) Weglassen von dünn besetzten Kategorien oder (ii) Zusammenfassen von (fachlich ähnlichen) Kategorien. 27/33

28 Abhängigkeit bei kategorialen Variablen Ein wichtiger Spezialfall tritt auf, wenn die Variablen X und Y beide binär sind, d.h. jeweils nur zwei mögliche Ausprägungen besitzen. In diesem Fall spricht man bei der Kontingenztafel auch von einer Vierfeldertafel. Dieser Fall ist unter anderem deshalb so wichtig, weil es für ihn ein spezielles Auswertungsverfahren gibt, dass auf Kontingeztafeln höherer Ordnung nicht anwendbar ist (siehe weiter unten). Allgemeines Schema einer Vierfeldertafel: X/Y n 11 n 12 n 1 2 n 21 n 22 n 2 n 1 n 2 n 28/33

29 Abhängigkeit bei kategorialen Variablen Für den Fall zweier binärer Variablen X und Y kann man auf die approximativen Testverfahren verzichten, denn hierfür ist sogar ein exakter Test möglich, nämlich Fishers exakter Test auf Unabhängigkeit Die obigen Faustregeln für eine ausreichende Güte des Tests sind in diesem Fall also nicht zu beachten die Zellenbesetzung in einer Vierfeldertafel kann demzufolge auch sehr dünn sein. Die Nullhypothese H 0 ist hier die gleiche wie beim χ 2 -Test, die Teststatistik ist in diesem Fall sehr einfach definiert durch T F := n 11 also genau der Wert in der linken oberen Zelle. Die Teststatistik T F ist unter H 0 hypergeometrisch verteilt gemäß H(n,n 1,n 1 ). 29/33

30 Abhängigkeit bei kategorialen Variablen Fishers exakter Test in SPSS Führe den χ 2 -Unabhängigkeitstest durch wie auf Folie 26 beschrieben. Im Fall einer Vierfeldertafel wird in der SPSS-Ausgabe automatisch zusätzlich zum bekannten Output noch das Ergebnis des exakten Test nach Fisher angegeben. 30/33

31 Abhängigkeit bei kategorialen Variablen Aufgaben zur Vertiefung I Aufabe zum Datensatz Titanic.sav Der Datensatz enthält Informationen über die Klassenzugehörigkeit, das Geschlecht und das Alter aller Passagiere der Titanic. (i) Gibt es einen Zusammenhang zwischen dem Überleben des Schiffsuntergangs und der Klasse? (ii) Gibt es einen Zusammenhang zwischen Überleben und Geschlecht? (iii) Gibt es einen Zusammenhang zwischen Überleben und dem Alter? Erstellen Sie hierfür eine neue Variable mit zwei Kategorien: Passagiere unter 18 Jahre und Passagiere über 18 Jahre. 31/33

32 Abhängigkeit bei kategorialen Variablen Aufgaben zur Vertiefung II Aufabe zum Datensatz Suizid.sav Der Datensatz enthält Informationen über die Todesart von Personen, die einen Suizid begangen haben. Gibt es einen Zusammenhang zwischen der die Todesart des Selbstmords und dem Geschlecht? Aufabe zum Datensatz Interesse.sav Das Ergebnis einer Umfrage nach den Interesse an Fußball ist im Datensatz Interesse.sav dokumentiert. Gibt es einen Zusammenhang zwischen dem Interesse an Fußball und dem Geschlecht der befragten Personen? 32/33

33 Abhängigkeit bei kategorialen Variablen Aufgaben zur Vertiefung III Aufabe zum Datensatz Kopfschmerzen.sav Ein neues Medikament (Medikament1) gegen Kopfschmerzen wird gegen ein bereits auf dem Markt zugelassenes Medikament (Medikament2) getestet. Von allen Teilnehmern wird außerdem aufgezeichnet, ob sich ihre Kopfschmerzen durch das Medikament verbessert haben (Behandlungserfolg). Untersuche die Fragestellung ob das neue Medikament besser wirkt, als das bereits zugelassene. Aufabe zum Datensatz Kino.sav Öffne den Datensatz kino.sav und definiere die Variable alter codiert nach dem Schema alter 37 jung alter > 37 alt. Gibt es einen Zusammenhang zwischen gender und alter codiert? 33/33

Kategoriale Daten. Johannes Hain. Lehrstuhl für Mathematik VIII Statistik 1/17

Kategoriale Daten. Johannes Hain. Lehrstuhl für Mathematik VIII Statistik 1/17 Johannes Hain Lehrstuhl für Mathematik VIII Statistik 1/17 Übersicht Besitzen die Daten, die statistisch ausgewertet werden sollen, kategoriales Skalenniveau, unterscheidet man die folgenden Szenarien:

Mehr

Einfache statistische Testverfahren

Einfache statistische Testverfahren Einfache statistische Testverfahren Johannes Hain Lehrstuhl für Mathematik VIII (Statistik) 1/29 Hypothesentesten: Allgemeine Situation Im Folgenden wird die statistische Vorgehensweise zur Durchführung

Mehr

Varianzanalyse ANOVA

Varianzanalyse ANOVA Varianzanalyse ANOVA Johannes Hain Lehrstuhl für Mathematik VIII Statistik 1/23 Einfaktorielle Varianzanalyse (ANOVA) Bisher war man lediglich in der Lage, mit dem t-test einen Mittelwertsvergleich für

Mehr

Einfache statistische Auswertungen mit dem Programm SPSS

Einfache statistische Auswertungen mit dem Programm SPSS Einfache statistische Auswertungen mit dem Programm SPSS Datensatz: fiktive_daten.sav Dipl. Päd. Anne Haßelkus Dr. Dorothea Dette-Hagenmeyer 11/2011 Überblick 1 Deskriptive Statistiken; Mittelwert berechnen...

Mehr

Kontingenzkoeffizient (nach Pearson)

Kontingenzkoeffizient (nach Pearson) Assoziationsmaß für zwei nominale Merkmale misst die Unabhängigkeit zweier Merkmale gibt keine Richtung eines Zusammenhanges an 46 o jl beobachtete Häufigkeiten der Kombination von Merkmalsausprägungen

Mehr

Metrische Daten. Johannes Hain. Lehrstuhl für Mathematik VIII Statistik 1/28

Metrische Daten. Johannes Hain. Lehrstuhl für Mathematik VIII Statistik 1/28 Metrische Daten Johannes Hain Lehrstuhl für Mathematik VIII Statistik 1/28 Metrische Daten Übersicht Besitzen die Daten, die statistisch ausgewertet werden sollen, metrisches Skalenniveau, unterscheidet

Mehr

a) Zeichnen Sie in das nebenstehende Streudiagramm mit Lineal eine Regressionsgerade ein, die Sie für passend halten.

a) Zeichnen Sie in das nebenstehende Streudiagramm mit Lineal eine Regressionsgerade ein, die Sie für passend halten. Statistik für Kommunikationswissenschaftler Wintersemester 2009/200 Vorlesung Prof. Dr. Helmut Küchenhoff Übung Cornelia Oberhauser, Monia Mahling, Juliane Manitz Thema 4 Homepage zur Veranstaltung: http://www.statistik.lmu.de/~helmut/kw09.html

Mehr

5.2. Nichtparametrische Tests. 5.2.1. Zwei unabhängige Stichproben: U- Test nach MANN- WHITNEY

5.2. Nichtparametrische Tests. 5.2.1. Zwei unabhängige Stichproben: U- Test nach MANN- WHITNEY 5.2. Nichtparametrische Tests 5.2.1. Zwei unabhängige Stichproben: U- Test nach MANN- WHITNEY Voraussetzungen: - Die Verteilungen der beiden Grundgesamtheiten sollten eine ähnliche Form aufweisen. - Die

Mehr

3.2 Bivariate Verteilungen

3.2 Bivariate Verteilungen 3.2 Bivariate Verteilungen zwei Variablen X, Y werden gemeinsam betrachtet (an jedem Objekt i, i = 1,..., n, werden gleichzeitig zwei Merkmale beobachtet) Beobachtungswerte sind Paare/Kombinationen von

Mehr

Korrelation - Regression. Berghold, IMI

Korrelation - Regression. Berghold, IMI Korrelation - Regression Zusammenhang zwischen Variablen Bivariate Datenanalyse - Zusammenhang zwischen 2 stetigen Variablen Korrelation Einfaches lineares Regressionsmodell 1. Schritt: Erstellung eines

Mehr

Fortgeschrittene Statistik Logistische Regression

Fortgeschrittene Statistik Logistische Regression Fortgeschrittene Statistik Logistische Regression O D D S, O D D S - R A T I O, L O G I T T R A N S F O R M A T I O N, I N T E R P R E T A T I O N V O N K O E F F I Z I E N T E N, L O G I S T I S C H E

Mehr

Datenanalyse mit Excel. Wintersemester 2013/14

Datenanalyse mit Excel. Wintersemester 2013/14 Datenanalyse mit Excel 1 KORRELATIONRECHNUNG 2 Korrelationsrechnung Ziel der Korrelationsrechnung besteht im bivariaten Fall darin, die Stärke des Zusammenhangs zwischen zwei interessierenden statistischen

Mehr

Einige Statistische Tests für den Ein- Zwei- und k-stichprobenfall (Nach Sachs, Stat. Meth.)

Einige Statistische Tests für den Ein- Zwei- und k-stichprobenfall (Nach Sachs, Stat. Meth.) ue biostatistik: nichtparametrische testverfahren / ergänzung 1/6 h. Lettner / physik Statistische Testverfahren Einige Statistische Tests für den Ein- Zwei- und k-stichprobenfall (Nach Sachs, Stat. Meth.)

Mehr

Deskription, Statistische Testverfahren und Regression. Seminar: Planung und Auswertung klinischer und experimenteller Studien

Deskription, Statistische Testverfahren und Regression. Seminar: Planung und Auswertung klinischer und experimenteller Studien Deskription, Statistische Testverfahren und Regression Seminar: Planung und Auswertung klinischer und experimenteller Studien Deskriptive Statistik Deskriptive Statistik: beschreibende Statistik, empirische

Mehr

Verteilungsanalyse. Johannes Hain. Lehrstuhl für Mathematik VIII Statistik 1/35

Verteilungsanalyse. Johannes Hain. Lehrstuhl für Mathematik VIII Statistik 1/35 Verteilungsanalyse Johannes Hain Lehrstuhl für Mathematik VIII Statistik 1/35 Datentypen Als Sammeln von Daten bezeichnet man in der Statistik das Aufzeichnen von Fakten. Erhobene Daten klassifziert man

Mehr

Willkommen zur Vorlesung Statistik (Master)

Willkommen zur Vorlesung Statistik (Master) Willkommen zur Vorlesung Statistik (Master) Thema dieser Vorlesung: Verteilungsfreie Verfahren Prof. Dr. Wolfgang Ludwig-Mayerhofer Universität Siegen Philosophische Fakultät, Seminar für Sozialwissenschaften

Mehr

Sozialwissenschaftliche Fakultät der Universität Göttingen. Sommersemester 2009. Statistik mit SPSS

Sozialwissenschaftliche Fakultät der Universität Göttingen. Sommersemester 2009. Statistik mit SPSS Sommersemester 2009 Statistik mit SPSS 15. Mai 2009 15. Mai 2009 Statistik Dozentin: mit Esther SPSSOchoa Fernández 1 Überblick 1. Korrelationsanalysen Kovariation und Kovarianz Korrelation: - Interpretation

Mehr

Einseitig gerichtete Relation: Mit zunehmender Höhe über dem Meeresspiegel sinkt im allgemeinen die Lufttemperatur.

Einseitig gerichtete Relation: Mit zunehmender Höhe über dem Meeresspiegel sinkt im allgemeinen die Lufttemperatur. Statistik Grundlagen Charakterisierung von Verteilungen Einführung Wahrscheinlichkeitsrechnung Wahrscheinlichkeitsverteilungen Schätzen und Testen Korrelation Regression Einführung Die Analyse und modellhafte

Mehr

METHODENLEHRE I WS 2013/14 THOMAS SCHÄFER

METHODENLEHRE I WS 2013/14 THOMAS SCHÄFER METHODENLEHRE I WS 2013/14 THOMAS SCHÄFER DAS THEMA: INFERENZSTATISTIK IV INFERENZSTATISTISCHE AUSSAGEN FÜR ZUSAMMENHÄNGE UND UNTERSCHIEDE Inferenzstatistik für Zusammenhänge Inferenzstatistik für Unterschiede

Mehr

Profil A 49,3 48,2 50,7 50,9 49,8 48,7 49,6 50,1 Profil B 51,8 49,6 53,2 51,1 51,1 53,4 50,7 50 51,5 51,7 48,8

Profil A 49,3 48,2 50,7 50,9 49,8 48,7 49,6 50,1 Profil B 51,8 49,6 53,2 51,1 51,1 53,4 50,7 50 51,5 51,7 48,8 1. Aufgabe: Eine Reifenfirma hat für Winterreifen unterschiedliche Profile entwickelt. Bei jeweils gleicher Geschwindigkeit und auch sonst gleichen Bedingungen wurden die Bremswirkungen gemessen. Die gemessenen

Mehr

Klassifikation von Signifikanztests

Klassifikation von Signifikanztests Klassifikation von Signifikanztests nach Verteilungsannahmen: verteilungsabhängige = parametrische Tests verteilungsunabhängige = nichtparametrische Tests Bei parametrischen Tests werden im Modell Voraussetzungen

Mehr

12. Vergleich mehrerer Stichproben

12. Vergleich mehrerer Stichproben 12. Vergleich mehrerer Stichproben Dr. Antje Kiesel Institut für Angewandte Mathematik WS 2011/2012 Häufig wollen wir verschiedene Populationen, Verfahren, usw. miteinander vergleichen. Beipiel: Vergleich

Mehr

Analog zu Aufgabe 16.1 werden die Daten durch folgenden Befehl eingelesen: > kredit<-read.table("c:\\compaufg\\kredit.

Analog zu Aufgabe 16.1 werden die Daten durch folgenden Befehl eingelesen: > kredit<-read.table(c:\\compaufg\\kredit. Lösung 16.3 Analog zu Aufgabe 16.1 werden die Daten durch folgenden Befehl eingelesen: > kredit

Mehr

Klausur zu Methoden der Statistik I (mit Kurzlösung) Wintersemester 2007/2008. Aufgabe 1

Klausur zu Methoden der Statistik I (mit Kurzlösung) Wintersemester 2007/2008. Aufgabe 1 Lehrstuhl für Statistik und Ökonometrie der Otto-Friedrich-Universität Bamberg Prof. Dr. Susanne Rässler Klausur zu Methoden der Statistik I (mit Kurzlösung) Wintersemester 2007/2008 Aufgabe 1 Ihnen liegt

Mehr

Überblick über die Verfahren für Ordinaldaten

Überblick über die Verfahren für Ordinaldaten Verfahren zur Analyse ordinalskalierten Daten 1 Überblick über die Verfahren für Ordinaldaten Unterschiede bei unabhängigen Stichproben Test U Test nach Mann & Whitney H Test nach Kruskal & Wallis parametrische

Mehr

Auswerten mit Excel. Viele Video-Tutorials auf Youtube z.b. http://www.youtube.com/watch?v=vuuky6xxjro

Auswerten mit Excel. Viele Video-Tutorials auf Youtube z.b. http://www.youtube.com/watch?v=vuuky6xxjro Auswerten mit Excel Viele Video-Tutorials auf Youtube z.b. http://www.youtube.com/watch?v=vuuky6xxjro 1. Pivot-Tabellen erstellen: In der Datenmaske in eine beliebige Zelle klicken Registerkarte Einfügen

Mehr

9. Schätzen und Testen bei unbekannter Varianz

9. Schätzen und Testen bei unbekannter Varianz 9. Schätzen und Testen bei unbekannter Varianz Dr. Antje Kiesel Institut für Angewandte Mathematik WS 2011/2012 Schätzen und Testen bei unbekannter Varianz Wenn wir die Standardabweichung σ nicht kennen,

Mehr

Zusammenhänge zwischen metrischen Merkmalen

Zusammenhänge zwischen metrischen Merkmalen Zusammenhänge zwischen metrischen Merkmalen Darstellung des Zusammenhangs, Korrelation und Regression Daten liegen zu zwei metrischen Merkmalen vor: Datenpaare (x i, y i ), i = 1,..., n Beispiel: x: Anzahl

Mehr

Es können keine oder mehrere Antworten richtig sein. Eine Frage ist NUR dann richtig beantwortet, wenn ALLE richtigen Antworten angekreuzt wurden.

Es können keine oder mehrere Antworten richtig sein. Eine Frage ist NUR dann richtig beantwortet, wenn ALLE richtigen Antworten angekreuzt wurden. Teil III: Statistik Alle Fragen sind zu beantworten. Es können keine oder mehrere Antworten richtig sein. Eine Frage ist NUR dann richtig beantwortet, wenn ALLE richtigen Antworten angekreuzt wurden. Wird

Mehr

Teil II: Einführung in die Statistik

Teil II: Einführung in die Statistik Teil II: Einführung in die Statistik (50 Punkte) Bitte beantworten Sie ALLE Fragen. Es handelt sich um multiple choice Fragen. Sie müssen die exakte Antwortmöglichkeit angeben, um die volle Punktzahl zu

Mehr

2. Deskriptive Statistik 2.1. Häufigkeitstabellen, Histogramme, empirische Verteilungsfunktionen

2. Deskriptive Statistik 2.1. Häufigkeitstabellen, Histogramme, empirische Verteilungsfunktionen 4. Datenanalyse und Modellbildung Deskriptive Statistik 2-1 2. Deskriptive Statistik 2.1. Häufigkeitstabellen, Histogramme, empirische Verteilungsfunktionen Für die Auswertung einer Messreihe, die in Form

Mehr

Häufigkeitstabellen. Balken- oder Kreisdiagramme. kritischer Wert für χ2-test. Kontingenztafeln

Häufigkeitstabellen. Balken- oder Kreisdiagramme. kritischer Wert für χ2-test. Kontingenztafeln Häufigkeitstabellen Menüpunkt Data PivotTable Report (bzw. entsprechendes Icon): wähle Data Range (Zellen, die die Daten enthalten + Zelle mit Variablenname) wähle kategoriale Variable für Spalten- oder

Mehr

Bachelorabschlussseminar Dipl.-Kfm. Daniel Cracau

Bachelorabschlussseminar Dipl.-Kfm. Daniel Cracau 1 Einführung in die statistische Datenanalyse Bachelorabschlussseminar Dipl.-Kfm. Daniel Cracau 2 Gliederung 1.Grundlagen 2.Nicht-parametrische Tests a. Mann-Whitney-Wilcoxon-U Test b. Wilcoxon-Signed-Rank

Mehr

Business Value Launch 2006

Business Value Launch 2006 Quantitative Methoden Inferenzstatistik alea iacta est 11.04.2008 Prof. Dr. Walter Hussy und David Tobinski UDE.EDUcation College im Rahmen des dokforums Universität Duisburg-Essen Inferenzstatistik Erläuterung

Mehr

Statistik II für Betriebswirte Vorlesung 3

Statistik II für Betriebswirte Vorlesung 3 PD Dr. Frank Heyde TU Bergakademie Freiberg Institut für Stochastik Statistik II für Betriebswirte Vorlesung 3 5. November 2013 Beispiel: Aktiensplit (Aczel & Sounderpandan, Aufg. 14-28) Ein Börsenanalyst

Mehr

Auswertung und Darstellung wissenschaftlicher Daten (1)

Auswertung und Darstellung wissenschaftlicher Daten (1) Auswertung und Darstellung wissenschaftlicher Daten () Mag. Dr. Andrea Payrhuber Zwei Schritte der Auswertung. Deskriptive Darstellung aller Daten 2. analytische Darstellung (Gruppenvergleiche) SPSS-Andrea

Mehr

Verteilungsanalyse. Johannes Hain. Lehrstuhl für Mathematik VIII Statistik 1/31

Verteilungsanalyse. Johannes Hain. Lehrstuhl für Mathematik VIII Statistik 1/31 Verteilungsanalyse Johannes Hain Lehrstuhl für Mathematik VIII Statistik 1/31 Datentypen Als Sammeln von Daten bezeichnet man in der Statistik das Aufzeichnen von Fakten. Erhobene Daten klassifziert man

Mehr

Kapitel 9: Verfahren für Nominaldaten

Kapitel 9: Verfahren für Nominaldaten Kapitel 9: Verfahren für Nominaldaten Eindimensionaler Chi²-Test 1 Der zweidimensionale Chi²-Test 4 Eindimensionaler Chi²-Test Der eindimensionale χ²-test wird dann herangezogen, wenn die Versuchspersonen

Mehr

Weitere (wählbare) Kontraste in der SPSS Prozedur Allgemeines Lineares Modell

Weitere (wählbare) Kontraste in der SPSS Prozedur Allgemeines Lineares Modell Einfaktorielle Versuchspläne 27/40 Weitere (wählbare) Kontraste in der SPSS Prozedur Allgemeines Lineares Modell Abweichung Einfach Differenz Helmert Wiederholt Vergleich Jede Gruppe mit Gesamtmittelwert

Mehr

Weitere Fragestellungen im Zusammenhang mit einer linearen Einfachregression

Weitere Fragestellungen im Zusammenhang mit einer linearen Einfachregression Weitere Fragestellungen im Zusammenhang mit einer linearen Einfachregression Speziell im Zusammenhang mit der Ablehnung der Globalhypothese werden bei einer linearen Einfachregression weitere Fragestellungen

Mehr

Güte von Tests. die Wahrscheinlichkeit für den Fehler 2. Art bei der Testentscheidung, nämlich. falsch ist. Darauf haben wir bereits im Kapitel über

Güte von Tests. die Wahrscheinlichkeit für den Fehler 2. Art bei der Testentscheidung, nämlich. falsch ist. Darauf haben wir bereits im Kapitel über Güte von s Grundlegendes zum Konzept der Güte Ableitung der Gütefunktion des Gauss im Einstichprobenproblem Grafische Darstellung der Gütefunktionen des Gauss im Einstichprobenproblem Ableitung der Gütefunktion

Mehr

5 Zusammenhangsmaße, Korrelation und Regression

5 Zusammenhangsmaße, Korrelation und Regression 5 Zusammenhangsmaße, Korrelation und Regression 5.1 Zusammenhangsmaße und Korrelation Aufgabe 5.1 In einem Hauptstudiumsseminar des Lehrstuhls für Wirtschafts- und Sozialstatistik machten die Teilnehmer

Mehr

Aufgaben zum Datenmanagement

Aufgaben zum Datenmanagement Aufgaben zum Datenmanagement Johannes Hain Lehrstuhl für Mathematik VIII Statistik 1/10 Datentransformationen Berechnung neuer Variablen Berechne das Durchschnittsalter und die Durchschnittsgröße beider

Mehr

Inhaltsverzeichnis. Regressionsanalyse. http://mesosworld.ch - Stand vom: 20.1.2010 1

Inhaltsverzeichnis. Regressionsanalyse. http://mesosworld.ch - Stand vom: 20.1.2010 1 Inhaltsverzeichnis Regressionsanalyse... 2 Lernhinweise... 2 Einführung... 2 Theorie (1-8)... 2 1. Allgemeine Beziehungen... 3 2. 'Best Fit'... 3 3. 'Ordinary Least Squares'... 4 4. Formel der Regressionskoeffizienten...

Mehr

Parametrische vs. Non-Parametrische Testverfahren

Parametrische vs. Non-Parametrische Testverfahren Parametrische vs. Non-Parametrische Testverfahren Parametrische Verfahren haben die Besonderheit, dass sie auf Annahmen zur Verteilung der Messwerte in der Population beruhen: die Messwerte sollten einer

Mehr

1,11 1,12 1,13 1,14 1,15 1,16 1,17 1,17 1,17 1,18

1,11 1,12 1,13 1,14 1,15 1,16 1,17 1,17 1,17 1,18 3. Deskriptive Statistik Ziel der deskriptiven (beschreibenden) Statistik (explorativen Datenanalyse) ist die übersichtliche Darstellung der wesentlichen in den erhobenen Daten enthaltene Informationen

Mehr

Kapitel 9: Verfahren für Nominaldaten

Kapitel 9: Verfahren für Nominaldaten Kapitel 9: Verfahren für Nominaldaten Eindimensionaler Chi²-Test Der eindimensionale χ²-test wird dann herangezogen, wenn die Versuchspersonen einer Population anhand eines Merkmals mit zwei oder mehr

Mehr

Eine Einführung in R: Statistische Tests

Eine Einführung in R: Statistische Tests Eine Einführung in R: Statistische Tests Bernd Klaus, Verena Zuber Institut für Medizinische Informatik, Statistik und Epidemiologie (IMISE), Universität Leipzig http://www.uni-leipzig.de/ zuber/teaching/ws12/r-kurs/

Mehr

Analyse bivariater Kontingenztafeln

Analyse bivariater Kontingenztafeln Analyse bivariater Kontingenztafeln Werden zwei kategoriale Merkmale mit nicht zu vielen möglichen Ausprägungen gemeinsam analysiert, so kommen zur Beschreibung der gemeinsamen Verteilung im allgemeinen

Mehr

Herzlich Willkommen zur Vorlesung Statistik

Herzlich Willkommen zur Vorlesung Statistik Herzlich Willkommen zur Vorlesung Statistik Thema dieser Vorlesung: Kovarianz und Korrelation Prof. Dr. Wolfgang Ludwig-Mayerhofer Universität Siegen Philosophische Fakultät, Seminar für Sozialwissenschaften

Mehr

Kapitel 9: Verfahren für Nominaldaten

Kapitel 9: Verfahren für Nominaldaten Kapitel 9: Verfahren für Nominaldaten Eindimensionaler Chi²-Test 1 Der zweidimensionale Chi²-Test 6 Alternativer Lösungsweg für SPSS Version 17 und älter 10 Alte Dialogfelder: Eindimensionaler Chi²-Test

Mehr

Quantitative Methoden der Bildungsforschung

Quantitative Methoden der Bildungsforschung Glieung Wieholung Korrelationen Grundlagen lineare Regression Lineare Regression in SPSS Übung Wieholung Korrelationen Standardisiertes Zusammenhangsmaß (unstandardisiert: Kovarianz) linearer Zusammenhang

Mehr

Übungen zur Veranstaltung Statistik 2 mit SPSS

Übungen zur Veranstaltung Statistik 2 mit SPSS Raum 22, Tel. 39 4 Aufgabe 5. Wird der neue Film MatchPoint von Woody Allen von weiblichen und männlichen Zuschauern gleich bewertet? Eine Umfrage unter 00 Kinobesuchern ergab folgende Daten: Altersgruppe

Mehr

Franz Kronthaler. Statistik angewandt. Datenanalyse ist (k)eine Kunst. Excel Edition. ^ Springer Spektrum

Franz Kronthaler. Statistik angewandt. Datenanalyse ist (k)eine Kunst. Excel Edition. ^ Springer Spektrum Franz Kronthaler Statistik angewandt Datenanalyse ist (k)eine Kunst Excel Edition ^ Springer Spektrum Inhaltsverzeichnis Teil I Basiswissen und Werkzeuge, um Statistik anzuwenden 1 Statistik ist Spaß 3

Mehr

Computergestützte Methoden. Master of Science Prof. Dr. G. H. Franke WS 07/08

Computergestützte Methoden. Master of Science Prof. Dr. G. H. Franke WS 07/08 Computergestützte Methoden Master of Science Prof. Dr. G. H. Franke WS 07/08 1 Seminarübersicht 1. Einführung 2. Recherchen mit Datenbanken 3. Erstellung eines Datenfeldes 4. Skalenniveau und Skalierung

Mehr

Test auf den Erwartungswert

Test auf den Erwartungswert Test auf den Erwartungswert Wir interessieren uns für den Erwartungswert µ einer metrischen Zufallsgröße. Beispiele: Alter, Einkommen, Körpergröße, Scorewert... Wir können einseitige oder zweiseitige Hypothesen

Mehr

1. Allgemeine Hinweise Alexander.Martin.Koenig@TU-Clausthal.de

1. Allgemeine Hinweise Alexander.Martin.Koenig@TU-Clausthal.de 1. Allgemeine Hinweise Alexander.Martin.Koenig@TU-Clausthal.de Man sollte eine Excel-Tabelle immer so übersichtlich wie möglich halten. Dazu empfiehlt es sich, alle benötigten Daten, Konstanten und Messwerte

Mehr

Methoden Quantitative Datenanalyse

Methoden Quantitative Datenanalyse Leitfaden Universität Zürich ISEK - Andreasstrasse 15 CH-8050 Zürich Telefon +41 44 635 22 11 Telefax +41 44 635 22 19 www.isek.uzh.ch 11. September 2014 Methoden Quantitative Datenanalyse Vorbereitung

Mehr

Aufgaben zu Kapitel 9

Aufgaben zu Kapitel 9 Aufgaben zu Kapitel 9 Aufgabe 1 Für diese Aufgabe benötigen Sie den Datensatz Nominaldaten.sav. a) Sie arbeiten für eine Marktforschungsfirma und sollen überprüfen, ob die in diesem Datensatz untersuchte

Mehr

Korrelation (II) Korrelation und Kausalität

Korrelation (II) Korrelation und Kausalität Korrelation (II) Korrelation und Kausalität Situation: Seien X, Y zwei metrisch skalierte Merkmale mit Ausprägungen (x 1, x 2,..., x n ) bzw. (y 1, y 2,..., y n ). D.h. für jede i = 1, 2,..., n bezeichnen

Mehr

6. METRISCHE UND KATEGORIALE MERKMALE

6. METRISCHE UND KATEGORIALE MERKMALE 6. METRISCHE UND KATEGORIALE MERKMALE wenn an einer Beobachtungseinheit eine (oder mehrere) metrische und eine (oder mehrere) kategoriale Variable(n) erhoben wurden Beispiel: Haushaltsarbeit von Teenagern

Mehr

2. Korrelation, lineare Regression und multiple Regression

2. Korrelation, lineare Regression und multiple Regression multiple 2.2 Lineare 2.2 Lineare 1 / 130 2.2 Lineare 2 / 130 2.1 Beispiel: Arbeitsmotivation Untersuchung zur Motivation am Arbeitsplatz in einem Chemie-Konzern 25 Personen werden durch Arbeitsplatz zufällig

Mehr

Lösungen zu Janssen/Laatz, Statistische Datenanalyse mit SPSS 1

Lösungen zu Janssen/Laatz, Statistische Datenanalyse mit SPSS 1 LÖSUNG 3A Lösungen zu Janssen/Laatz, Statistische Datenanalyse mit SPSS 1 Mit den Berechnungsfunktionen LG10(?) und SQRT(?) in "Transformieren", "Berechnen" können logarithmierte Werte sowie die Quadratwurzel

Mehr

Institut für Soziologie. Methoden 2. Regressionsanalyse I: Einfache lineare Regression

Institut für Soziologie. Methoden 2. Regressionsanalyse I: Einfache lineare Regression Institut für Soziologie Methoden 2 Regressionsanalyse I: Einfache lineare Regression Programm Anwendungsbereich Vorgehensweise Interpretation Annahmen Zusammenfassung Übungsaufgabe Literatur # 2 Anwendungsbereich

Mehr

Psychologische Methodenlehre und Statistik II

Psychologische Methodenlehre und Statistik II Psychologische Methodenlehre und Statistik II Pantelis Christodoulides & Karin Waldherr 9. Juni 2010 Pantelis Christodoulides & Karin Waldherr Psychologische Methodenlehre und Statistik II 1/47 Allgemeines

Mehr

Einführung in die Statistik für Politikwissenschaftler Sommersemester 2011

Einführung in die Statistik für Politikwissenschaftler Sommersemester 2011 Einführung in die Statistik für Politikwissenschaftler Sommersemester 2011 Es können von den Antworten alle, mehrere oder keine Antwort(en) richtig sein. Nur bei einer korrekten Antwort (ohne Auslassungen

Mehr

Statistik II für Betriebswirte Vorlesung 2

Statistik II für Betriebswirte Vorlesung 2 PD Dr. Frank Heyde TU Bergakademie Freiberg Institut für Stochastik Statistik II für Betriebswirte Vorlesung 2 21. Oktober 2014 Verbundene Stichproben Liegen zwei Stichproben vor, deren Werte einander

Mehr

Ausarbeitung des Seminarvortrags zum Thema

Ausarbeitung des Seminarvortrags zum Thema Ausarbeitung des Seminarvortrags zum Thema Anlagepreisbewegung zum Seminar Finanzmathematische Modelle und Simulationen bei Raphael Kruse und Prof. Dr. Wolf-Jürgen Beyn von Imke Meyer im W9/10 Anlagepreisbewegung

Mehr

Multiple Regression. Ziel: Vorhersage der Werte einer Variable (Kriterium) bei Kenntnis der Werte von zwei oder mehr anderen Variablen (Prädiktoren)

Multiple Regression. Ziel: Vorhersage der Werte einer Variable (Kriterium) bei Kenntnis der Werte von zwei oder mehr anderen Variablen (Prädiktoren) Multiple Regression 1 Was ist multiple lineare Regression? Ziel: Vorhersage der Werte einer Variable (Kriterium) bei Kenntnis der Werte von zwei oder mehr anderen Variablen (Prädiktoren) Annahme: Der Zusammenhang

Mehr

5. Schließende Statistik. 5.1. Einführung

5. Schließende Statistik. 5.1. Einführung 5. Schließende Statistik 5.1. Einführung Sollen auf der Basis von empirischen Untersuchungen (Daten) Erkenntnisse gewonnen und Entscheidungen gefällt werden, sind die Methoden der Statistik einzusetzen.

Mehr

Multivariate Statistik

Multivariate Statistik Hermann Singer Multivariate Statistik 1 Auflage 15 Oktober 2012 Seite: 12 KAPITEL 1 FALLSTUDIEN Abbildung 12: Logistische Regression: Geschätzte Wahrscheinlichkeit für schlechte und gute Kredite (rot/blau)

Mehr

Eine computergestützte Einführung mit

Eine computergestützte Einführung mit Thomas Cleff Deskriptive Statistik und Explorative Datenanalyse Eine computergestützte Einführung mit Excel, SPSS und STATA 3., überarbeitete und erweiterte Auflage ^ Springer Inhaltsverzeichnis 1 Statistik

Mehr

Tutorial: Homogenitätstest

Tutorial: Homogenitätstest Tutorial: Homogenitätstest Eine Bank möchte die Kreditwürdigkeit potenzieller Kreditnehmer abschätzen. Einerseits lebt die Bank ja von der Vergabe von Krediten, andererseits verursachen Problemkredite

Mehr

3 Zusammenhangsmaße Zusammenhangshypothesen

3 Zusammenhangsmaße Zusammenhangshypothesen 3 Zusammenhangsmaße Zusammenhangshypothesen Zusammenhänge (zwischen 2 Variablen) misst man mittels Korrelationen. Die Wahl der Korrelation hängt ab von: a) Skalenniveau der beiden Variablen: 1) intervallskaliert

Mehr

Analyse von Kontingenztafeln

Analyse von Kontingenztafeln Analyse von Kontingenztafeln Mit Hilfe von Kontingenztafeln (Kreuztabellen) kann die Abhängigkeit bzw. die Inhomogenität der Verteilungen kategorialer Merkmale beschrieben, analysiert und getestet werden.

Mehr

Kommentierter SPSS-Ausdruck zur logistischen Regression

Kommentierter SPSS-Ausdruck zur logistischen Regression Daten: POK V AG 3 (POKV_AG3_V07.SAV) Kommentierter SPSS-Ausdruck zur logistischen Regression Fragestellung: Welchen Einfluss hat die Fachnähe und das Geschlecht auf die interpersonale Attraktion einer

Mehr

Willkommen zur Vorlesung Statistik

Willkommen zur Vorlesung Statistik Willkommen zur Vorlesung Statistik Thema dieser Vorlesung: Varianzanalyse Prof. Dr. Wolfgang Ludwig-Mayerhofer Universität Siegen Philosophische Fakultät, Seminar für Sozialwissenschaften Prof. Dr. Wolfgang

Mehr

Einfache Statistiken in Excel

Einfache Statistiken in Excel Einfache Statistiken in Excel Dipl.-Volkswirtin Anna Miller Bergische Universität Wuppertal Schumpeter School of Business and Economics Lehrstuhl für Internationale Wirtschaft und Regionalökonomik Raum

Mehr

Analytische Statistik I. Statistische Methoden in der Korpuslinguistik Heike Zinsmeister WS 2009/10

Analytische Statistik I. Statistische Methoden in der Korpuslinguistik Heike Zinsmeister WS 2009/10 Analytische Statistik I Statistische Methoden in der Korpuslinguistik Heike Zinsmeister WS 2009/10 Testen Anpassungstests (goodness of fit) Weicht eine gegebene Verteilung signifikant von einer bekannten

Mehr

Kapitel 7: Varianzanalyse mit Messwiederholung

Kapitel 7: Varianzanalyse mit Messwiederholung Kapitel 7: Varianzanalyse mit Messwiederholung Durchführung einer einfaktoriellen Varianzanalyse mit Messwiederholung 1 Durchführung einer zweifaktoriellen Varianzanalyse mit Messwiederholung auf einem

Mehr

Grundlagen quantitativer Sozialforschung Interferenzstatistische Datenanalyse in MS Excel

Grundlagen quantitativer Sozialforschung Interferenzstatistische Datenanalyse in MS Excel Grundlagen quantitativer Sozialforschung Interferenzstatistische Datenanalyse in MS Excel 16.11.01 MP1 - Grundlagen quantitativer Sozialforschung - (4) Datenanalyse 1 Gliederung Datenanalyse (inferenzstatistisch)

Mehr

Zusammenhangsanalyse mit SPSS. Messung der Intensität und/oder der Richtung des Zusammenhangs zwischen 2 oder mehr Variablen

Zusammenhangsanalyse mit SPSS. Messung der Intensität und/oder der Richtung des Zusammenhangs zwischen 2 oder mehr Variablen - nominal, ordinal, metrisch In SPSS: - Einfache -> Mittelwerte vergleichen -> Einfaktorielle - Mehrfaktorielle -> Allgemeines lineares Modell -> Univariat In SPSS: -> Nichtparametrische Tests -> K unabhängige

Mehr

Universität Bonn 28. Juli 2010 Fachbereich Rechts- und Wirtschaftswissenschaften Statistische Abteilung Prof. Dr. A. Kneip. KLAUSUR Statistik B

Universität Bonn 28. Juli 2010 Fachbereich Rechts- und Wirtschaftswissenschaften Statistische Abteilung Prof. Dr. A. Kneip. KLAUSUR Statistik B Universität Bonn 28. Juli 2010 Fachbereich Rechts- und Wirtschaftswissenschaften Statistische Abteilung Prof. Dr. A. Kneip Sommersemester 2010 KLAUSUR Statistik B Hinweise zur Bearbeitung: Bei allen Teilaufgaben

Mehr

Kapitel 4: Merkmalszusammenhänge

Kapitel 4: Merkmalszusammenhänge Kapitel 4: Merkmalszusammenhänge Streudiagramme 1 Korrelationen 3 Lineare Regression 6 Zusammenhang zwischen Korrelation, Regression und t-test 8 Streudiagramme SPSS bietet die Möglichkeit, verschiedene

Mehr

Multinomiale logistische Regression

Multinomiale logistische Regression Multinomiale logistische Regression Die multinomiale logistische Regression dient zur Schätzung von Gruppenzugehörigkeiten bzw. einer entsprechenden Wahrscheinlichkeit hierfür, wobei als abhänginge Variable

Mehr

STATISTISCHE MUSTERANALYSE - DARSTELLUNGSVORSCHLAG

STATISTISCHE MUSTERANALYSE - DARSTELLUNGSVORSCHLAG STATISTISCHE MUSTERANALYSE - DARSTELLUNGSVORSCHLAG Statistische Methoden In der vorliegenden fiktiven Musterstudie wurden X Patienten mit XY Syndrom (im folgenden: Gruppe XY) mit Y Patienten eines unauffälligem

Mehr

Teil I: Deskriptive Statistik

Teil I: Deskriptive Statistik Teil I: Deskriptive Statistik 2 Grundbegriffe 2.1 Merkmal und Stichprobe 2.2 Skalenniveau von Merkmalen 2.3 Geordnete Stichproben und Ränge 2.1 Merkmal und Stichprobe An (geeignet ausgewählten) Untersuchungseinheiten

Mehr

Datenanalyse mit SPSS spezifische Analysen

Datenanalyse mit SPSS spezifische Analysen Datenanalyse mit SPSS spezifische Analysen Arnd Florack Tel.: 0251 / 83-34788 E-Mail: florack@psy.uni-muenster.de Raum 2.015 Sprechstunde: Dienstags 15-16 Uhr 25. Mai 2001 2 Auswertung von Häufigkeitsdaten

Mehr

Nichtparametrische statistische Verfahren

Nichtparametrische statistische Verfahren Nichtparametrische statistische Verfahren (im Wesentlichen Analyse von Abhängigkeiten) Kategorien von nichtparametrischen Methoden Beispiel für Rangsummentests: Wilcoxon-Test / U-Test Varianzanalysen 1-faktorielle

Mehr

Hypothesentests mit SPSS

Hypothesentests mit SPSS Beispiel für einen chi²-test Daten: afrikamie.sav Im Rahmen der Evaluation des Afrikamie-Festivals wurden persönliche Interviews durchgeführt. Hypothese: Es gibt einen Zusammenhang zwischen dem Geschlecht

Mehr

Standardab er des. Testwert = 145.5 95% Konfidenzintervall. T df Sig. (2-seitig) Differenz Untere Obere -2.011 698.045-5.82-11.50 -.14.

Standardab er des. Testwert = 145.5 95% Konfidenzintervall. T df Sig. (2-seitig) Differenz Untere Obere -2.011 698.045-5.82-11.50 -.14. Aufgabe : einfacher T-Test Statistik bei einer Stichprobe Standardfehl Standardab er des Mittelwert weichung Mittelwertes 699 39.68 76.59 2.894 Test bei einer Sichprobe Testwert = 45.5 95% Konfidenzintervall

Mehr

Melanie Kaspar, Prof. Dr. B. Grabowski 1

Melanie Kaspar, Prof. Dr. B. Grabowski 1 7. Hypothesentests Ausgangssituation: Man muss sich zwischen 2 Möglichkeiten (=Hypothesen) entscheiden. Diese Entscheidung soll mit Hilfe von Beobachtungen ( Stichprobe ) getroffen werden. Die Hypothesen

Mehr

Statistische Auswertung:

Statistische Auswertung: Statistische Auswertung: Die erhobenen Daten mittels der selbst erstellten Tests (Surfaufgaben) Statistics Punkte aus dem Punkte aus Surftheorietest Punkte aus dem dem und dem Surftheorietest max.14p.

Mehr

Allgemeines Lineares Modell: Univariate Varianzanalyse und Kovarianzanalyse

Allgemeines Lineares Modell: Univariate Varianzanalyse und Kovarianzanalyse Allgemeines Lineares Modell: Univariate Varianzanalyse und Kovarianzanalyse Univariate Varianz- und Kovarianzanlyse, Multivariate Varianzanalyse und Varianzanalyse mit Messwiederholung finden sich unter

Mehr

Überblick über die Tests

Überblick über die Tests Anhang A Überblick über die Tests A.1 Ein-Stichproben-Tests A.1.1 Tests auf Verteilungsannahmen ˆ Shapiro-Wilk-Test Situation: Test auf Normalverteilung H 0 : X N(µ, σ 2 ) H 1 : X nicht normalverteilt

Mehr

fh management, communication & it Constantin von Craushaar fh-management, communication & it Statistik Angewandte Statistik

fh management, communication & it Constantin von Craushaar fh-management, communication & it Statistik Angewandte Statistik fh management, communication & it Folie 1 Überblick Grundlagen (Testvoraussetzungen) Mittelwertvergleiche (t-test,..) Nichtparametrische Tests Korrelationen Regressionsanalyse... Folie 2 Überblick... Varianzanalyse

Mehr

Deskriptive Statistik

Deskriptive Statistik Deskriptive Statistik [descriptive statistics] Ziel der deskriptiven (beschreibenden) Statistik einschließlich der explorativen Datenanalyse [exploratory data analysis] ist zunächst die übersichtliche

Mehr

Trendlinien in Diagrammen (Excel 2010)

Trendlinien in Diagrammen (Excel 2010) Trendlinien in Diagrammen (Excel 2010) Trendlinien in Diagrammen (Excel 2010)... 1 Allgemeines... 2 Informationen über Prognosen und das Anzeigen von Trends in Diagrammen... 3 AUSWÄHLEN DES PASSENDEN TRENDLINIETYPS

Mehr

Statistik II: Signifikanztests /1

Statistik II: Signifikanztests /1 Medien Institut : Signifikanztests /1 Dr. Andreas Vlašić Medien Institut (0621) 52 67 44 vlasic@medien-institut.de Gliederung 1. Noch einmal: Grundlagen des Signifikanztests 2. Der chi 2 -Test 3. Der t-test

Mehr

Testen von Hypothesen:

Testen von Hypothesen: Testen von Hypothesen: Ein Beispiel: Eine Firma produziert Reifen. In der Entwicklungsabteilung wurde ein neues Modell entwickelt, das wesentlich ruhiger läuft. Vor der Markteinführung muss aber auch noch

Mehr