Die widerspenstige. Kapitel 5: Chi-Quadrat oder.. Merkmal B: Spalten. Merkmal A: Zeilen. Kreuztabelle zweidimensionale Häufigkeitstabelle

Größe: px
Ab Seite anzeigen:

Download "Die widerspenstige. Kapitel 5: Chi-Quadrat oder.. Merkmal B: Spalten. Merkmal A: Zeilen. Kreuztabelle zweidimensionale Häufigkeitstabelle"

Transkript

1 Kapitel 5: Chi-Quadrat oder.. Die widerspenstige Zähmung des Zufalls Ein Lustspiel in mehreren Akten 1. Akt: Die Kreuztabelle Kreuztabelle zweidimensionale Häufigkeitstabelle Merkmal 2 Merkmal 1 y 1 y 2 Summe x 1 n 11 n 12 n 1. x 2 n 21 n 22 n 2. x 3 n 31 n 32 n 3. Summe n.1 n.2 n Eine der gebräuchlichsten Analysemethoden bei Nominalskalen und allen kategorisierten Skalen (Übersichtlichkeit!) Achtung: Je nach Kategorisierung unterschiedliche Ergebnisse 2 Häufigkeitstabellen Kreuztabelle Merkmal B: Spalten 3 Merkmal A: Zeilen 4

2 Kreuztabelle Spaltenprozentwerte 5 6 Zeilenprozentwerte prozentwerte 7 8

3 Aufstellen von Hypothesen 10 Besteht ein Zusammenhang zwischen Variable X und Variable Y? Zufall oder nicht Zufall, -das ist hier die Frage. unabhängige Variable Rauchen hat Einfluß auf hat Einfluß auf abhängige Variable Lungenkrebs 2. Akt: Prüfmaß und Signifikanz Gewalterfahrung hat Einfluß auf Einstiegsalter Geschlecht hat Einfluß auf Konsumgewohnheiten Grundlagen zur Hypothesentestung Aussagen über die Grundgesamtheit Hypothesen (H 0 und H 1 ) formulieren Wahl des geeigneten Tests und Sig.niveau der Prüfgröße festlegen (5% oder 1%) Prüfgröße berechnen Je nach Irrtums-WS H 0 beibehalten oder H 1 annehmen. 11 Beispiel 1: Drogenabhängige Frauen im Gefängnis (n=30, Studie 2009) Unterscheiden sich die inhaftierten Frauen mit oder ohne Gewalterfahrung in der Kindheit hinsichtlich ihres Einstiegsalters von SIGNIFIKANT? Oder: Ist der beobachtete Unterschied im Einstiegsalter nach Gewalterfahrung ZUFÄLLIG oder nicht???? b5 Gewalterf ahrung 1 v or 18 J. 2 nach 18 J. 0 not experienced experienced

4 Ist der festgestellte Unterschied signifikant? 14 b5 physical violence or threats before age 17 from family members, relatives or known persons * Kreuztabelle b5 physical violence 0 not experienced or threats before age 17 from family members, relatives 1 experienced or known persons % % % 2 nach 1 vor 18 J. 18 J ,3% 66,7% 100,0% ,3% 26,7% 100,0% ,3% 46,7% 100,0% 13 Nullhypothese (H 0 ): Ausganspunkt der Testung: Es besteht kein signifikanter Unterschied/Zusammenhang Die befragten Frauen mit bzw. ohne Gewalterfahrung unterscheiden sich nicht hinsichtlich ihres Einstiegsalters. Die tatsächlichen Zellhäufigkeiten der Kreuztabelle entsprechen in etwa den erwarteten Zellhäufigkeiten. Alternativhypothese (H A ): Hypothese zum Zusammenhang: Es besteht ein signifikanter Unterschied/Zusammenhang Die befragten Frauen mit bzw. ohne Gewalterfahrung unterscheiden sich hinsichtlich ihres Einstiegsalters. (zweiseitig) Befragte mit Gewalterfahrung beginnen früher, zu konsumieren als Befragte ohne Gewalterfahrung. (einseitig) Die tatsächlichen Zellhäufigkeiten der Kreuztabelle weichen signifikant von den erwarteten Zellhäufigkeiten ab. Regeln bei der Hypothesentestung Konvention Jedes Prüfmaß hat eine berechenbar = Wahrscheinlichkeit des jeweiligen Prüfmaß unter Voraussetzung von Unabhängigkeit (= Zufall) (= kein Unterschied) (= kein Zusammenhang) Abhängigkeit = kein Zufall = Unterschied / Zusammenhang = Gesetzmäßigkeit Nullhypothese: wenn der Signifikanzwert groß ist ( p > 0,05) dann wird die Nullhypothese beibehalten (kein signifikanter Unterschied). Alternativhypothese: Hypothese zum Zusammenhang: wenn der Signifikanzwert sehr klein ist ( p 0,05) dann wird die H A angenommen (signifikanter Unterschied/Zusammenhang) DieFehlerwahrscheinlichkeit ist dann kleiner als 0,05 (oder: 5%). Das Risiko, einen falschen Zusammenhang anzunehmen, liegt unter 5%. Der Signifikanzwert des Prüfmaß spricht entweder für Unabhängigkeit (H 0 wenn p > 0,05) oder für Abhängigkeit (H A wenn p <= 0,05). 15 Erwartete bei Unabhängigkeit = Wenn sich die Befragten mit oder ohne Gewalterfahrung nicht hinsichtlich des s von unterscheiden. Σf = o Σf = e 30 b5 Gewalterf ahrung 0 not experienced 1 experienced Erwartete Erwartete Erwartete Erstkonsumationsalte r 2 nach 18 J ,0 7,0 15, ,0 7,0 15, ,0 14,0 30,0 1 v or 18 J. Randsummen werden als gegeben angenommen: Erwartete in den einzelnen Zellen = (Randsumme Zeile x Randsumme Spalte) / summe Bsp.: Gewalterfahrung, Einstieg vor18 J.: (15 x 16) / 30 = 8 16

5 Absolutes Residuum = Differenz zwischen tatsächlicher und erwarteter Häufigkeit = Abweichung tatsächlicher Häufigkeit zur Unabhängigkeit (=Zufall) b5 Gewalterf ahrung 0 not experienced 1 experienced 1 v or 18 J. 2 nach 18 J Erwartete 8,0 7,0 15,0-3,0 3,0 Erwartete Erwartete ,0 7,0 15,0 3,0-3, ,0 14,0 30, Standardisiertes Residuum = Stdd. absolutes Residuum = standardisierte Abweichung tatsächlicher Hfkt. zur Unabhängigkeit (=Zufall) b5 Gewalterf ahrung 0 not experienced 1 experienced 1 v or 18 J. 2 nach 18 J Erwartete 8,0 7,0 15,0-3,0 3,0 Standardisierte -1,1 1, Erwartete Standardisierte Erwartete 8,0 7,0 15,0 3,0-3,0 1,1-1, ,0 14,0 30,0 0 0 Residuum = Tatsächliche Zellhäufigkeit erwartete Zellhäufigkeit Bsp.: Gewalterfahrung, Einstieg vor 18 J.: 11 8 = 3 abs.re s Standardisiertes Residuum = erwhfkt. Bsp.: Gewalterfahrung, Einstieg vor 18 J.: 3 / 8 = 1,1 18 f o -f e Σ f e = f o -f e standardisiertes Residuum f e = 0 Summe der standardisierten 19 WS hoch nieder klein -2 Zufall = Unabhängigkeit Zufall regiert Σ = 100% 0 standardisiertes Residuum groß 2 20

6 Quadrieren = Prüfmaß Σ ( f o f e ) 2 f e = χ 2 = Summe der quadrierten stdd. = z.b. ((-1,1) 2 + (1,1) 2 + (-1,1) 2 + (1,1) 2 ) = 4,8 = Maß für die Abweichung von der erwarteten Verteilung (oder: der Zufallsverteilung) Es gilt: Große Abweichung = hohes Chi-Quadrat 21 Chi-Quadrat nach Pearson Kontinuitätskorrektur a Likelihood-Quotient Exakter Test nach Fisher Zusammenhang linear-mit-linear der gültigen Fälle Nominal- bzgl. Nominalmaß der gültigen Fälle Wert df 4,821 b 1,028 3,348 1,067 4,963 1,026 4,661 1,031 Phi Cramer-V Kontingenzkoeffizient a. Die Null-Hyphothese wird nicht angenommen. Exakte Signifikanz Näherung sweise Wert Signifikanz -,401,028,401,028,372, b. Unter Annahme der Null-Hyphothese wird der asymptotische Standardfehler verwendet. Das Prüfmaß Chi-Quadrat beträgt 4,8 Exakte Signifikanz (1-seitig),066, Dieses Prüfmaß ist mit 2,8 % WS a. Wird nur für eine 2x2-Tabelle berechnet durch Zufall zustande gekommen. b. 0 Zellen (,0%) haben eine erwartete Häufigkeit kleiner 5. Die minimale erwartete ODER: Häufigkeit Irrtums-WS: ist 7,00. Wenn ich einen signifikanten Unterschied annehme, Symmetrische Maße irre ich mich in 2,8 % aller Fälle. Es besteht ein starker Zusammenhang mit V= 0,4 22 Bei allen möglichen Stichproben: Wie ist Chi-Quadrat verteilt, wenn kein Zusammenhang besteht? Zur Erinnerung: die standardisierten sind bei Unabhängigkeit normalverteilt. WS hoch nieder Zufall regiert Σ = 100% 5% p 0,05 Wahrscheinlichkeitsverteilung von χ 2 = quadrierte Normalverteilung klein groß 5% der Verteilung abgeschnitten 23 24

7 χ 2 -Verteilung (quadrierte Normalverteilung) (versch. Verteilungen je nach Freiheitsgraden) df = (Spalten 1) x (Zeilen 1) Σ = 100% 5% p 0,05 zb: df=8 ab hier: H A (Gesetz) gilt 25 Simulation: Was passiert, wenn ich doppelt so viele Fälle HÄTTE: Daten Fälle gewichten mit gewicht2 Das heißt: Wir tun so (simulieren), als ob wir doppelt so viele Befragte in unserer Stichprobe hätten also statt 30 haben wir 60 Personen. Beachte: Das dient nur zur Veranschaulichung. Derartige Gewichtungen sind selbstverständlich nicht zulässig! b5 physical violence or threats before age 17 from family members, relatives or known persons 0 not experienced Erwartete Standardisierte 1 experienced Erwartete Standardisierte Erwartete 1 vor 18 J. 2 nach 18 J ,0 14,0 30,0-6,0 6,0-1,5 1, ,0 14,0 30,0 6,0-6,0 1,5-1, ,0 28,0 60,0 26 Simulation: Was passiert, wenn ich dreimal so viele Fälle HÄTTE: Daten Fälle gewichten mit gewicht3 Wir simulieren, dass wir dreimal so viele Befragte in unserer Stichprobe haben also statt 30 haben wir 90 Personen. Simulation: Was passiert, wenn ich neunmal so viele Fälle HÄTTE: Daten Fälle gewichten mit gewicht9 Wir simulieren, dass wir neunmal so viele Befragte in unserer Stichprobe haben also statt 30 haben wir 270 Personen. b5 physical violence or threats before age 17 from family members, relatives or known persons 0 not experienced Erwartete Standardisierte 1 experienced Erwartete Standardisierte Erwartete 1 vor 18 J. 2 nach 18 J ,0 21,0 45,0-9,0 9,0-1,8 2, ,0 21,0 45,0 9,0-9,0 1,8-2, ,0 42,0 90,0 b5 physical violence or threats before age 17 from family members, relatives or known persons 0 not experienced 1 experienced Erwartete Standardisierte Erwartete Standardisierte Erwartete 1 vor 18 J. 2 nach 18 J ,0 63,0 135,0-27,0 27,0-3,2 3, ,0 63,0 135,0 27,0-27,0 3,2-3, ,0 126,0 270,

8 Gewalterfahrung und Einstiegsalter Prüfmaß Prüfmaß Fallzahl Chi-Quadrat Cramer s V Signifikanz n = 30 n = 60 χ 2 = 4,8 V = 0,40 p = 0,028 χ 2 = 9,6 n = 90 χ 2 = 14,5 n = 270 χ 2 = 43,4 V = 0,40 V = 0,40 V = 0,40 p = 0,002 p = 0,000 p = 0,000 Mit steigender Größe der Stichprobe unterliegt das Ergebnis immer weniger Zufallsschwankungen. Das bedeutet auch: bei einer sehr großen Stichprobe sind sehr kleine (darunter auch nicht relevante) Unterschiede bereits signifikant. 29 Gewalterfahrung und Einstiegsalter Chi-Quadrat nach Pearson der gültigen Fälle Wert 4,821 b 1, a. Wird nur für eine 2x2-Tabelle berechnet df b. 0 Zellen (,0%) haben eine erwartete Häufigkeit kleiner 5. Die Mit steigender minimale erwartete Häufigkeit ist 7,00. Fallzahl wird die Zufalls-WS kleiner Chi-Quadrat nach Pearson der gültigen Fälle Wert 43,393 b 1, a. Wird nur für eine 2x2-Tabelle berechnet df b. 0 Zellen (,0%) haben eine erwartete Häufigkeit kleiner 5. Die minimale erwartete Häufigkeit ist 63, Beispiel für ein nicht signifikantes Ergebnis: Von Zuhause ausgerissen und Einstiegsalter Unterscheiden sich die inhaftierten Frauen, die als Kind/Jugendliche von zu Hause ausgerissen sind, hinsichtlich ihres Einstiegsalters SIGNIFIKANT von jenen, die das nicht gemacht haben? b7 runaway from home as child or adolescent because of conflicts und Einstiegsalter dichotom runaway f rom home as child or adolescent because of conf licts not experienced experienced % % % v or 18 J. nach 18 J ,7% 58,3% 100,0% ,1% 38,9% 100,0% ,3% 46,7% 100,0% 31 b7 runaway from home as child or adolescent because of conflicts und Einstiegsalter dichotom runaway f rom home as child or adolescent because of conf licts not experienced Erwartete experienced Standardisierte Erwartete Standardisierte Erwartete Σ Standardiesierte = 0 v or 18 J. nach 18 J ,4 5,6 12,0-1,4 1,4 -,6, ,6 8,4 18,0 1,4-1,4,5 -, ,0 14,0 30,0 32

9 b7 runaway from home as child or adolescent because of conflicts und Einstiegsalter dichotom Chi-Quadrat nach Pearson der gültigen Fälle Wert 1,094 b 1, a. Wird nur für eine 2x2-Tabelle berechnet df b. 0 Zellen (,0%) haben eine erwartete Häufigkeit kleiner 5. Die minimale erwartete Häufigkeit ist 5,60. Chi-Quadrat nach Pearson der gültigen Fälle Wert 9,844 b 1, a. Wird nur für eine 2x2-Tabelle berechnet df b. 0 Zellen (,0%) haben eine erwartete Häufigkeit kleiner 5. Die minimale erwartete Häufigkeit ist 50,40. Mit steigender Fallzahl wird die Zufalls-WS kleiner 33 b7 runaway from home as child or adolescent because of conflicts und Einstiegsalter dichotom Prüfmaß Prüfmaß Fallzahl Chi-Quadrat Cramer s V Signifikanz n = 30 n = 60 χ 2 = 1,1 V = 0,19 p = 0,296 χ 2 = 2,2 n = 90 χ 2 = 3,3 n = 270 χ 2 = 9,8 V = 0,19 V = 0,19 V = 0,19 Bei diesem Beispiel wird ein nicht signifikantes Ergebnis bei einer höheren Stichprobengröße signifikant! (hier simuliert bei einer Fallzahl von 30 bis 270 Befragten). p = 0,139 p = 0,070 p = 0, Beispiel für ein nicht signifikantes Ergebnis: Trennung der Eltern und Einstiegsalter Unterscheiden sich die inhaftierten Frauen, deren Eltern sich getrennt haben hinsichtlich ihres Einstiegsalters SIGNIFIKANT von jenen, die deren Eltern sich nicht getrennt haben? Beispiel für ein nicht signifikantes Ergebnis: b1 separation of parents und Einstiegsalter b1 separation of parents und Einstiegsalter b1 seperation or divorce of parents 0 not experienced 1 experienced % von b1 % von b1 % von b1 2 nach 1 vor 18 J. 18 J ,6% 44,4% 100,0% ,4% 47,6% 100,0% ,3% 46,7% 100,0% 35 b1 seperation or divorce of parents 0 not experienced 1 experienced Erwartete Standardisierte Erwartete Standardisierte Erwartete 1 vor 18 J. 2 nach 18 J ,8 4,2 9,0,2 -,2,1 -, ,2 9,8 21,0 -,2,2 -,1, ,0 14,0 30,0 36

10 Beispiel für ein nicht signifikantes Ergebnis: Trennung der Eltern und Einstiegsalter Chi-Quadrat nach Pearson der gültigen Fälle Wert,026 b 1, a. Wird nur für eine 2x2-Tabelle berechnet df b. 2 Zellen (50,0%) haben eine erwartete Häufigkeit kleiner 5. Die minimale erwartete Häufigkeit ist 4,20. Mit steigender Fallzahl wird die Zufalls-WS zwar kleiner, aber das Ergebnis bleibt nicht signifikant Trennung der Eltern und Einstiegsalter Prüfmaß Prüfmaß Fallzahl Chi-Quadrat Cramer s V Signifikanz n = 30 n = 60 n = 90 χ 2 = 0,03 V = 0,029 p = 0,873 χ 2 = 0,05 V = 0,029 p = 0,821 χ 2 = 0,08 V = 0,029 p = 0,782 n = 270 χ 2 = 0,23 V = 0,029 p = 0,632 Dieses Ergebnis bleibt trotz hoher Fallzahl nicht signifikant. 38 Chi-Quadrat nach Pearson der gültigen Fälle Wert,230 b 1, a. Wird nur für eine 2x2-Tabelle berechnet df b. 0 Zellen (,0%) haben eine erwartete Häufigkeit kleiner 5. Die minimale erwartete Häufigkeit ist 37, Wichtig bei Signifikanztests bei Kreuztabellen: Voraussetzung: Die erwartete darf in keiner Zelle weniger als 5 sein. Weniger streng: Die erwartete darf in 20% der Zellen weniger als 5 sein. Unser Bsp.: Trennung der Eltern: Es gibt nur 9 Personen, die das nicht betrifft: In 2 von 4 Zellen liegt die erwartete Häufigkeit unter 5. Kein Signifikanztest zulässig. Ergebnis unterliegt zu stark den Zufallsschwankungen. 2. Beispiel aus dem Datensatz zum Darmmanagement Konsumhäufigkeit von Obst und Gemüse nach Geschlecht 39 Ist der festgestellte Unterschied signifikant? Nullhypothese (H 0 ): Ausganspunkt der Testung: Es besteht kein signifikanter Unterschied/Zusammenhang Die befragten Patienten und Patientinnen unterscheiden sich nicht hinsichtlich ihren Konsumgewohnheiten. Die tatsächlichen Zellhäufigkeiten der Kreuztabelle entsprechen den erwarteten Zellhäufigkeiten. Alternativhypothese (H A ): Hypothese zum Zusammenhang: Es besteht ein signifikanter Unterschied/Zusammenhang Die befragten Patienten und Patientinnen unterscheiden sich hinsichtlich ihren Konsumgewohnheiten. Die tatsächlichen Zellhäufigkeiten der Kreuztabelle weichen signifikant von den erwarteten Zellhäufigkeiten ab. Erwartete der Zellhäufigkeiten = bei Unabhängigkeit (Zufall = keine Gesetzmäßigkeit) 40

11 Kreuztabelle Erwartete Häufigkeiten Erwartete in den einzelnen Zellen = (Randsumme Zeile x Randsumme Spalte) / summe Kreuztabelle 42 Bsp.: Erwartete Männer mit täglichem Konsum: (34 x 56) / 78 = 24,4 das sind 44% von 56 Personen entspricht Spalten% für 24,4 / 56 = 34 / 78 (44% täglicher Konsum) oder 72% von 34 Personen entspricht Zeilen% für 24,4 / 34 = 56 / 78 (72% Männer) 41 Kreuztabelle Signifikanztest: Prüfmaß Chi-Quadrat 43 Konsumhäufigkeit von fettreichen Speisen nach Geschlecht Prüfmaß χ 2 Freiheitsgrade WS vom Prüfmaß unter Voraussetzung von Unabhängigkeit ist 0,006 oder 0,6%, also unter 1%. Oder: Mit weniger als 1%iger Wahrscheinlichkeit ist dieses Ergebnis zufällig zustande gekommen. 44

12 Kreuztabelle Kreuztabelle Signifikanztest: Prüfmaß Chi-Quadrat 46 Prüfmaß χ 2 Freiheitsgrade 45 WS vom Prüfmaß unter Voraussetzung von Unabhängigkeit ist 0,629 oder 63%. Oder: Mit 63%iger Wahrscheinlichkeit ist dieses Ergebnis zufällig zustande gekommen. Kreuztabelle Signifikanztest: Interpretation Ergebnis: Frauen konsumieren Obst und Gemüse laut eigenen Angaben signifikant häufiger als Männer (χ 2 =7,5; df=1; p=0,006). Die Irrtumswahrscheinlichkeit beträgt 0,6% und ist damit kleiner als 5%. (hier sogar kleiner als 1%) Ergebnis: Frauen und Männer konsumieren laut eigenen Angaben gleich häufig fettreiche Speisen (χ 2 =2,3; df=1; p=0,629). Die Irrtumswahrscheinlichkeit beträgt 63% und ist damit größer als 5%. 47 Vorteil: Wahrscheinlichkeit: immer zwischen 0-1 Wenn Chi 2 ein so hoher Wert, dass WS dafür kleiner als 0,05 (= 5%) dann: signifikantes Ergebnis, Zusammenhang/Gesetzmäßigkeit gilt

13 Fehlerarten Grundgesamtheit/Population Simulation: 50 H 0 H A Maximale Abhängigkeit Stichpro obe H 0 H A kein Zusammenhang a Zusammenhang falsch α - Fehler Zusammenhang nicht erkannt β - Fehler Zusammenhang a Starke Abhängigkeit Signifikanztests niemals mit gewichteten Daten berechnen: Weil: Kriterium für di ist die Fallzahl Simulation: Simulation: Abhängigkeit von der Fallzahl 52 Trend Hier: H 0 gilt: Ergebnis = Zufall α-fehler soll möglichst klein (5%, 1%) sein!! = konservatives Verhalten; Wenn α-fehler = 5% Jedes 20. signifikante Ergebnis ist falsch Bei hoher Fallzahl sind bereits kleine Unterschiede signifikant. 51 Zufall Hier: H A gilt: Ergebnis Zufall

14 Simulation: Testen auf Vorergebnis (β-fehler) Hier: H 0 gilt: akt. = voriges Erg. Fehler-WS = 20% Antidepressiva werden nur Frauen verschrieben. Simulation: Verschreibungspraxis von Antidepressiva nach Geschlecht Frauen und Männern werden gleichermaßen Antidepressiva verschrieben. WS des Ergebnisses bei erwarteter Verteilung = 26% Gefahr, den Zufall fälschlicherweise zu behaupten: 26% Hier: H A gilt: akt. voriges Erg. Hier: Fehler = 2,5% 53 HÜ Arbeitsgruppe E : 232 Personen haben einen pflegebedürftigen AngehörigeN. Randsumme A: 100 Personen pflegen IhreN Angehörigen selbst, 132 nicht. Randsumme B: 63 Personen sind Männer und 169 Personen sind Frauen. Fragestellung: Gibt es einen Geschlechtsunterschied bei selbst-und nicht selbst-pflegenden Angehörigen von pflegebedürftigen Personen? Entwerfen Sie zu den gegebenen Randsummen eine fiktive Kreuztabelle. Berechnen Sie: Zeilen- und Spalten%, erwartete Häufigkeiten, absolute und standardisierte und den Chi 2 -Wert. Vergleichen Sie anhand der WS-Verteilung ob Ihr Ergebnis signifikant ist. Je weiblicher, desto kränker. HÜ Arbeitsgruppe F für total Lernwütige!! (Tipp: Verwenden Sie dazu das Bastel-Tool Wer bastelt mit? auf unserer HP!) a) Erstellen Sie die Übersicht von der vorigen Folie (das Kontinuum der Abhängigkeit) mit einer Fallzahl von 200! b) Wer noch immer nicht genug hat: Machen Sie selbiges mit einer Fallzahl von 2000! Was fällt Ihnen auf? 55???

15 Kreuztabelle Genannte gesundheitliche Probleme (zusätzlich zu abhängigkeit) aktuelle gesundheitl. Probleme AIDS/HIV-Infektion? (B0048) aktuelle gesundheitl. Probleme chronische_hepatitisb? (B0048) aktuelle gesundheitl. Probleme chronische_hepatitisc? (B0048) aktuelle gesundheitl. Probleme Krampfanfälle/epileptische_Anfälle? (B00 aktuelle gesundheitl. Probleme Zahnprobleme? (B0048) aktuelle gesundheitl. Probleme Haut-,Venenprobleme? (B0048) aktuelle gesundheitl. Probleme Magen-/Darmprobleme? (B0048) aktuelle gesundheitl. Probleme STD(sexuell_übertragbare_Krankheiten) aktuelle gesundheitl. Probleme psychiatrische_erkrankungen? (B0048) aktuelle gesundheitl. Probleme Allergien? (B0048) SA73_86 Krankheiten Chi-Quadrat nach Pearson der gültigen Fälle SSEX Geschlecht männlich weiblich Wert 24,525 a 9, df a. 7 Zellen (35,0%) haben eine erwartete Häufigkeit kleiner 5. Die minimale erwartete Häufigkeit ist, SA73_86 Krankheiten Kreuztabelle Erwartete Erwartete Erwartete Erwartete Erwartete Erwartete Erwartete Erwartete Erwartete Erwartete Erwartete SSEX Geschlecht männlich weiblich ,4 46,6 172, ,8 48,2 178, ,1 31,9 118, ,7 27,3 101, ,9 14,1 52, ,4 10,6 39, ,6 2,4 9, ,9 1,1 4, ,7,3 1, ,5,5 2, ,0 183,0 676,0 59 Kreuztabelle SSEX Geschlecht männlich weiblich SA73_K keine 126Wert 46 df 172 Chi-Quadrat eine nach Pearson 13815,693 a ,003 Krankheiten der gültigen zwei Fälle drei a. 0 Zellen (,0%) haben eine erwartete Häufigkeit kleiner 5. Die vier und mehr minimale erwartete Häufigkeit ist 27, SA73_K Krankheiten keine eine zwei drei vier und mehr SSEX Geschlecht männlich weiblich ,6% 25,1% 25,4% ,0% 21,9% 26,3% ,7% 14,2% 17,5% ,2% 14,2% 14,9% ,6% 24,6% 15,8% ,0% 100,0% 100,0% 60

16 SA73_KK Krankheiten keine ein bis zwei drei und mehr SSEX Geschlecht männlich weiblich ,6% 25,1% 25,4% ,7% 36,1% 43,8% ,8% 38,8% 30,8% ,0% 100,0% 100,0% keine Krankheit Krankheit SSEX Geschlecht männlich weiblich ,6% 25,1% 25,4% ,4% 74,9% 74,6% ,0% 100,0% 100,0% Chi-Quadrat nach Pearson der gültigen Fälle Wert df 8,683 a 2, a. 0 Zellen (,0%) haben eine erwartete Häufigkeit kleiner 5. Die minimale erwartete Häufigkeit ist 46,56. Chi-Quadrat nach Pearson der gültigen Fälle Wert df,012 b 1, b. 0 Zellen (,0%) haben eine erwartete Häufigkeit kleiner 5. Die minimale erwartete Häufigkeit ist 46, Die weiblichen Patientinnen haben mehr Krankheiten. 63 Die weiblichen Patientinnen geben mehr Krankheiten an. warum? Genauso viel Männer wie Frauen haben keine Krankheiten. Bei den Patientinnen wurden von den ÄrztInnen mehr Kreuzerln gemacht..weil sie mehr Krankheiten haben? weil sie so wehleidig sind? weil sie ihre Krankheiten stärker wahrnehmen?...weil sie besser über ihre Krankheiten bescheid wissen?..weil sie genauer befragt werden?.weil man ihnen besser zuhört?..weil man ihre Krankheiten mehr ernst nimmt?..weil sie mehr Krankheiten haben dürfen? 64

17 Krisenambulanz AKH (UTP Uniklinik für Psychotherapie 1998) TYPX Typisierung 1 hysterisch 3 narzißtisch 13 sonstige Persönlkstö. Chi-Quadrat nach Pearson der gültigen Fälle % von sex % von sex % von sex % von sex Wert 74,589 a 2, df SEX Geschlecht des/r PatientIn 1 männlich 2 weiblich ,3% 67,2% 51,1% ,9% 9,0% 20,4% ,8% 23,8% 28,5% ,0% 100,0% 100,0% a. 0 Zellen (,0%) haben eine erwartete Häufigkeit kleiner 5. Die minimale erwartete Häufigkeit ist 17, HÜ Arbeitsgruppe E : 232 Personen haben einen pflegebedürftigen AngehörigeN. Randsumme A: 100 Personen pflegen IhreN Angehörigen selbst, 132 nicht. Randsumme B: 63 Personen sind Männer und 169 Personen sind Frauen. Fragestellung: Gibt es einen Geschlechtsunterschied bei selbst-und nicht selbst-pflegenden Angehörigen von pflegebedürftigen Personen? Berechnen Sie: Die Zeilen- und Spalten%, die erwarteten Häufigkeiten, die absoluten und standardisierten und den Chi2-Wert. Vergleichen Sie anhand der WS-Verteilung ob das Ergebnis signifikant ist. b2_1 P1: Pflegen Sie Person selbst? Ja Nein v20 Geschlecht männlich weiblich v20 Geschlecht männlich weiblich % von b2_1 % von b2_1 % von b2_1 b2_1 P1: Pflegen Sie Person selbst? keine Ja Nein Angabe ,0% 35,6% 60,0% 27,8% ,0% 64,4% 40,0% 72,2% ,0% 100,0% 100,0% 100,0% b2_1 P1: Pflegen Sie Person selbst? Ja Nein % von b2_1 % von b2_1 % von b2_1 v20 Geschlecht männlich weiblich ,0% 84,0% 100,0% ,6% 64,4% 100,0% ,2% 72,8% 100,0% v20 Geschlecht männlich weiblich % von v20 % von v20 % von v20 b2_1 P1: Pflegen Sie Person selbst? keine Ja Nein Angabe ,2% 71,2% 4,5% 100,0% ,1% 49,7% 1,2% 100,0% ,2% 55,7% 2,1% 100,0% b2_1 P1: Pflegen Sie Person selbst? Ja Nein % von v20 % von v20 % von v20 v20 Geschlecht männlich weiblich ,4% 49,7% 43,1% ,6% 50,3% 56,9% ,0% 100,0% 100,0% 67 68

18 b2_1 P1: Pflegen Sie Person selbst? b2_1 P1: Pflegen Sie Person selbst? Ja Ja Nein Nein Erwartete Erwartete Erwartete Erwartete Erwartete % von v20 Geschlecht v20 Geschlecht männlich weiblich ,2 72,8 100, ,8 96,2 132, ,0 169,0 232,0 v20 Geschlecht männlich weiblich ,2 72,8-11,2 11, ,8 96,2 11,2-11, ,0% 100,0% 100,0% 69 b2_1 P1: Pflegen Sie Person selbst? Chi-Quadrat nach Pearson Kontinuitätskorrektur a der gültigen Fälle Ja Nein a. Wird nur für eine 2x2-Tabelle berechnet Erwartete Standardisierte Erwartete Standardisierte % von v20 Geschlecht e Signifikanz Wert df 11,056 b 1,001 10,088 1, b. 0 Zellen (,0%) haben eine erwartete Häufigkeit kleiner 5. Die minimale erwartete Häufigkeit ist 27,16. v20 Geschlecht männlich weiblich ,2 72,8-11,2 11,2-2,1 1, ,8 96,2 11,2-11,2 1,9-1, ,0% 100,0% 100,0% Symmetrische Maße Nominal- bzgl. Nominalmaß der gültigen Fälle Phi Cramer-V Kontingenzkoeffizient 70 Wert Signifikanz -,218,001,218,001,213,

Hypothesentests mit SPSS

Hypothesentests mit SPSS Beispiel für einen chi²-test Daten: afrikamie.sav Im Rahmen der Evaluation des Afrikamie-Festivals wurden persönliche Interviews durchgeführt. Hypothese: Es gibt einen Zusammenhang zwischen dem Geschlecht

Mehr

entschieden hat, obwohl die Merkmalsausprägungen in der Grundgesamtheit voneinander abhängig sind.

entschieden hat, obwohl die Merkmalsausprägungen in der Grundgesamtheit voneinander abhängig sind. Bsp 1) Die Wahrscheinlichkeit dafür, dass eine Glühbirne länger als 200 Stunden brennt, beträgt 0,2. Wie wahrscheinlich ist es, dass von 10 Glühbirnen mindestens eine länger als 200 Stunden brennt? (Berechnen

Mehr

Statistisches Testen

Statistisches Testen Statistisches Testen Grundlegendes Prinzip Erwartungswert Bekannte Varianz Unbekannte Varianz Differenzen Anteilswert Chi-Quadrat Tests Gleichheit von Varianzen Prinzip des Statistischen Tests Konfidenzintervall

Mehr

Statistik II: Signifikanztests /1

Statistik II: Signifikanztests /1 Medien Institut : Signifikanztests /1 Dr. Andreas Vlašić Medien Institut (0621) 52 67 44 vlasic@medien-institut.de Gliederung 1. Noch einmal: Grundlagen des Signifikanztests 2. Der chi 2 -Test 3. Der t-test

Mehr

erwartete Häufigkeit n=80 davon 50% Frauen fe=40 davon 50% Männer fe=40 Abweichung der beobachteten von den erwarteten Häufigkeiten:

erwartete Häufigkeit n=80 davon 50% Frauen fe=40 davon 50% Männer fe=40 Abweichung der beobachteten von den erwarteten Häufigkeiten: Verfahren zur Analyse von Nominaldaten Chi-Quadrat-Tests Vier-Felder Kontingenztafel Mehrfach gestufte Merkmale Cramers V, Kontingenzkoeffizient, Phi-Koeffizient Muster aller Chi-Quadrat-Verfahren eine

Mehr

Chi-Quadrat Verfahren

Chi-Quadrat Verfahren Chi-Quadrat Verfahren Chi-Quadrat Verfahren werden bei nominalskalierten Daten verwendet. Die einzige Information, die wir bei Nominalskalenniveau zur Verfügung haben, sind Häufigkeiten. Die Quintessenz

Mehr

Der χ 2 -Test (Chiquadrat-Test)

Der χ 2 -Test (Chiquadrat-Test) Der χ 2 -Test (Chiquadrat-Test) Der Grundgedanke Mit den χ 2 -Methoden kann überprüft werden, ob sich die empirischen (im Experiment beobachteten) Häufigkeiten einer nominalen Variable systematisch von

Mehr

Ergebnisse VitA und VitVM

Ergebnisse VitA und VitVM Ergebnisse VitA und VitVM 1 Basisparameter... 2 1.1 n... 2 1.2 Alter... 2 1.3 Geschlecht... 5 1.4 Beobachtungszeitraum (von 1. Datum bis letzte in situ)... 9 2 Extraktion... 11 3 Extraktionsgründe... 15

Mehr

Hypothesenprüfung. Darüber hinaus existieren zahlreiche andere Testverfahren, die alle auf der gleichen Logik basieren

Hypothesenprüfung. Darüber hinaus existieren zahlreiche andere Testverfahren, die alle auf der gleichen Logik basieren Hypothesenprüfung Teil der Inferenzstatistik Befaßt sich mit der Frage, wie Hypothesen über eine (in der Regel unbekannte) Grundgesamtheit an einer Stichprobe überprüft werden können Behandelt werden drei

Mehr

Statistische Methoden in den Umweltwissenschaften

Statistische Methoden in den Umweltwissenschaften Statistische Methoden in den Umweltwissenschaften Korrelationsanalysen Kreuztabellen und χ²-test Themen Korrelation oder Lineare Regression? Korrelationsanalysen - Pearson, Spearman-Rang, Kendall s Tau

Mehr

Lösungen zum Aufgabenblatt 2: Bivariate Kreuztabellen mit nominalem Messniveau

Lösungen zum Aufgabenblatt 2: Bivariate Kreuztabellen mit nominalem Messniveau Lösungen zum Aufgabenblatt 2 1 Lösungen zum Aufgabenblatt 2: Bivariate Kreuztabellen mit nominalem Messniveau Nach dem Laden des Datensatzes (G:\DATEN\METH2\DATEN\EUROBAR\ Euba30.sav) ist zunächst der

Mehr

Lösungen zu Janssen/Laatz, Statistische Datenanalyse mit SPSS 1

Lösungen zu Janssen/Laatz, Statistische Datenanalyse mit SPSS 1 LÖSUNG 4B a.) Lösungen zu Janssen/Laatz, Statistische Datenanalyse mit SPSS 1 Mit "Deskriptive Statistiken", "Kreuztabellen " wird die Dialogbox "Kreuztabellen" geöffnet. POL wird in das Eingabefeld von

Mehr

fh management, communication & it Constantin von Craushaar fh-management, communication & it Statistik Angewandte Statistik

fh management, communication & it Constantin von Craushaar fh-management, communication & it Statistik Angewandte Statistik fh management, communication & it Folie 1 Überblick Grundlagen (Testvoraussetzungen) Mittelwertvergleiche (t-test,..) Nichtparametrische Tests Korrelationen Regressionsanalyse... Folie 2 Überblick... Varianzanalyse

Mehr

5. Seminar Statistik

5. Seminar Statistik Sandra Schlick Seite 1 5. Seminar 5. Seminar Statistik 30 Kurztest 4 45 Testen von Hypothesen inkl. Übungen 45 Test- und Prüfverfahren inkl. Übungen 45 Repetitorium und Prüfungsvorbereitung 15 Kursevaluation

Mehr

Mathematische und statistische Methoden II

Mathematische und statistische Methoden II Methodenlehre e e Prof. Dr. G. Meinhardt 6. Stock, Wallstr. 3 (Raum 06-06) Sprechstunde jederzeit nach Vereinbarung und nach der Vorlesung. Mathematische und statistische Methoden II Dr. Malte Persike

Mehr

Statistik II. IV. Hypothesentests. Martin Huber

Statistik II. IV. Hypothesentests. Martin Huber Statistik II IV. Hypothesentests Martin Huber 1 / 41 Übersicht Struktur eines Hypothesentests Stichprobenverteilung t-test: Einzelner-Parameter-Test F-Test: Multiple lineare Restriktionen 2 / 41 Struktur

Mehr

2. Formulieren von Hypothesen. Nullhypothese: H 0 : µ = 0 Gerät exakt geeicht

2. Formulieren von Hypothesen. Nullhypothese: H 0 : µ = 0 Gerät exakt geeicht 43 Signifikanztests Beispiel zum Gauß-Test Bei einer Serienfertigung eines bestimmten Typs von Messgeräten werden vor der Auslieferung eines jeden Gerätes 10 Kontrollmessungen durchgeführt um festzustellen,

Mehr

Die widerspenstige Zähmung des Zufalls

Die widerspenstige Zähmung des Zufalls Kapitel 6: Signifikanztests Signifikanztests = Hypothesenprüfung Hypothese = Wenn dann -Beziehung Besteht ein Zusammenhang zwischen Variable X und Variable Y? Die widerspenstige Zähmung des Zufalls unabhängige

Mehr

Biomathematik für Mediziner, Klausur SS 2001 Seite 1

Biomathematik für Mediziner, Klausur SS 2001 Seite 1 Biomathematik für Mediziner, Klausur SS 2001 Seite 1 Aufgabe 1: Von den Patienten einer Klinik geben 70% an, Masern gehabt zu haben, und 60% erinnerten sich an eine Windpockeninfektion. An mindestens einer

Mehr

Klassifikation von Signifikanztests

Klassifikation von Signifikanztests Klassifikation von Signifikanztests nach Verteilungsannahmen: verteilungsabhängige = parametrische Tests verteilungsunabhängige = nichtparametrische Tests Bei parametrischen Tests werden im Modell Voraussetzungen

Mehr

Zwei kategoriale Merkmale. Homogenität Unabhängigkeit

Zwei kategoriale Merkmale. Homogenität Unabhängigkeit 121 Zwei kategoriale Merkmale Homogenität Unabhängigkeit 122 Beispiel Gründe für die Beliebtheit bei Klassenkameraden 478 neun- bis zwölfjährige Schulkinder in Michigan, USA Grund für Beliebtheit weiblich

Mehr

Tutorial:Unabhängigkeitstest

Tutorial:Unabhängigkeitstest Tutorial:Unabhängigkeitstest Mit Daten aus einer Befragung zur Einstellung gegenüber der wissenschaftlich-technischen Entwicklungen untersucht eine Soziologin den Zusammenhang zwischen der Einstellung

Mehr

Konfidenzintervalle. Statistische Methoden in der Korpuslinguistik Heike Zinsmeister WS 2008/09

Konfidenzintervalle. Statistische Methoden in der Korpuslinguistik Heike Zinsmeister WS 2008/09 Konfidenzintervalle Statistische Methoden in der Korpuslinguistik Heike Zinsmeister WS 2008/09 Münzspiel Experiment 100 Münzwürfe: Stefan gewinnt bei "Kopf" Hypothesen H 0 : Stefan wird so oft gewinnen

Mehr

Ermitteln Sie auf 2 Dezimalstellen genau die folgenden Kenngrößen der bivariaten Verteilung der Merkmale Weite und Zeit:

Ermitteln Sie auf 2 Dezimalstellen genau die folgenden Kenngrößen der bivariaten Verteilung der Merkmale Weite und Zeit: 1. Welche der folgenden Kenngrößen, Statistiken bzw. Grafiken sind zur Beschreibung der Werteverteilung des Merkmals Konfessionszugehörigkeit sinnvoll einsetzbar? A. Der Modalwert. B. Der Median. C. Das

Mehr

Analytische Statistik II

Analytische Statistik II Analytische Statistik II Institut für Geographie 1 Schätz- und Teststatistik 2 Das Testen von Hypothesen Während die deskriptive Statistik die Stichproben nur mit Hilfe quantitativer Angaben charakterisiert,

Mehr

2.1 Einführung in das Testen von Hypothesen

2.1 Einführung in das Testen von Hypothesen 2.1 Einführung in das Testen von Hypothesen 1 Gliederung 2.1 Einführung in das Testen von Hypothesen 2.1.1 Typische Fragestellungen 2.1.2 Mittelwertvergleich 2.1.2.1 Einstichprobenproblem 2.1.2.2 Zweistichprobenproblem

Mehr

Wiederholung Hypothesentests Zusammenfassung. Hypothesentests. Statistik I. Sommersemester Statistik I Hypothesentests I (1/36)

Wiederholung Hypothesentests Zusammenfassung. Hypothesentests. Statistik I. Sommersemester Statistik I Hypothesentests I (1/36) Statistik I Sommersemester 2009 Statistik I I (1/36) Wiederholung Grenzwertsatz Konfidenzintervalle Logik des 0.0 0.1 0.2 0.3 0.4 4 2 0 2 4 Statistik I I (2/36) Zum Nachlesen Agresti/Finlay: Kapitel 6+7

Mehr

Statistische Tests (Signifikanztests)

Statistische Tests (Signifikanztests) Statistische Tests (Signifikanztests) [testing statistical hypothesis] Prüfen und Bewerten von Hypothesen (Annahmen, Vermutungen) über die Verteilungen von Merkmalen in einer Grundgesamtheit (Population)

Mehr

Bivariater Zusammenhang in der Vierfeldertafel PEΣO

Bivariater Zusammenhang in der Vierfeldertafel PEΣO Bivariater Zusammenhang in der Vierfeldertafel PEΣO 12. Oktober 2001 Zusammenhang zweier Variablen und bivariate Häufigkeitsverteilung Die Bivariate Häufigkeitsverteilung gibt Auskunft darüber, wie zwei

Mehr

Anpassungstests VORGEHENSWEISE

Anpassungstests VORGEHENSWEISE Anpassungstests Anpassungstests prüfen, wie sehr sich ein bestimmter Datensatz einer erwarteten Verteilung anpasst bzw. von dieser abweicht. Nach der Erläuterung der Funktionsweise sind je ein Beispiel

Mehr

Bivariate Zusammenhänge

Bivariate Zusammenhänge Bivariate Zusammenhänge Tabellenanalyse: Kreuztabellierung und Kontingenzanalyse Philosophische Fakultät Institut für Soziologie Berufsverläufe und Berufserfolg von Hochschulabsolventen Dozent: Mike Kühne

Mehr

Quantitative Auswertung II. Korpuslinguistik Heike Zinsmeister

Quantitative Auswertung II. Korpuslinguistik Heike Zinsmeister Quantitative Auswertung II Korpuslinguistik Heike Zinsmeister 16.12.2011 Unterschiedstest Fall 1: unabhängige Stichproben Daten eine unabhängige Variable auf Nominal- oder Kategorialniveau eine abhängige

Mehr

4.1. Nullhypothese, Gegenhypothese und Entscheidung

4.1. Nullhypothese, Gegenhypothese und Entscheidung rof. Dr. Roland Füss Statistik II SS 8 4. Testtheorie 4.. Nullhypothese, Gegenhypothese und Entscheidung ypothesen Annahmen über die Verteilung oder über einzelne arameter der Verteilung eines Merkmals

Mehr

Angewandte Statistik 3. Semester

Angewandte Statistik 3. Semester Angewandte Statistik 3. Semester Übung 5 Grundlagen der Statistik Übersicht Semester 1 Einführung ins SPSS Auswertung im SPSS anhand eines Beispieles Häufigkeitsauswertungen Grafiken Statistische Grundlagen

Mehr

Bivariate Kreuztabellen

Bivariate Kreuztabellen Bivariate Kreuztabellen Kühnel, Krebs 2001 S. 307-342 Gabriele Doblhammer: Empirische Sozialforschung Teil II, SS 2004 1/33 Häufigkeit in Zelle y 1 x 1 Kreuztabellen Randverteilung x 1... x j... x J Σ

Mehr

Einführung in die Induktive Statistik: Testen von Hypothesen

Einführung in die Induktive Statistik: Testen von Hypothesen Einführung in die Induktive Statistik: Testen von Hypothesen Jan Gertheiss LMU München Sommersemester 2011 Vielen Dank an Christian Heumann für das Überlassen von TEX-Code! Testen: Einführung und Konzepte

Mehr

Willkommen zur Vorlesung Statistik (Master)

Willkommen zur Vorlesung Statistik (Master) Willkommen zur Vorlesung Statistik (Master) Thema dieser Vorlesung: Verteilungen stetiger Zufallsvariablen Prof. Dr. Wolfgang Ludwig-Mayerhofer Universität Siegen Philosophische Fakultät, Seminar für Sozialwissenschaften

Mehr

Methodenlehre. Vorlesung 10. Prof. Dr. Björn Rasch, Cognitive Biopsychology and Methods University of Fribourg

Methodenlehre. Vorlesung 10. Prof. Dr. Björn Rasch, Cognitive Biopsychology and Methods University of Fribourg Methodenlehre Vorlesung 10 Prof. Dr., Cognitive Biopsychology and Methods University of Fribourg 1 Methodenlehre I Woche Datum Thema 1 FQ Einführung, Verteilung der Termine 1 25.9.13 Psychologie als Wissenschaft

Mehr

Bivariater Zusammenhang in der Mehrfeldertafel PEΣO

Bivariater Zusammenhang in der Mehrfeldertafel PEΣO Bivariater Zusammenhang in der Mehrfeldertafel PEΣO 9. November 2001 Bivariate Häufigkeitsverteilungen in Mehrfeldertabellen In der Mehrfeldertabelle werden im Gegensatz zur Vierfeldertabelle keine dichotomen

Mehr

Chi Quadrat-Unabhängigkeitstest

Chi Quadrat-Unabhängigkeitstest Fragestellung 1: Untersuchung mit Hilfe des Chi-Quadrat-Unabhängigkeitstestes, ob zwischen dem Herkunftsland der Befragten und der Bewertung des Kontaktes zu den Nachbarn aus einem Anderen Herkunftsland

Mehr

Analyse von Kontingenztafeln

Analyse von Kontingenztafeln Analyse von Kontingenztafeln Mit Hilfe von Kontingenztafeln (Kreuztabellen) kann die Abhängigkeit bzw. die Inhomogenität der Verteilungen kategorialer Merkmale beschrieben, analysiert und getestet werden.

Mehr

Syntax. Ausgabe *Ü12. *1. corr it25 with alter li_re kontakt.

Syntax. Ausgabe *Ü12. *1. corr it25 with alter li_re kontakt. Syntax *Ü2. *. corr it25 with alter li_re kontakt. *2. regression var=it25 alter li_re kontakt/statistics /dependent=it25 /enter. regression var=it25 li_re kontakt/statistics /dependent=it25 /enter. *3.

Mehr

7.2 Mittelwert einer Stichprobe

7.2 Mittelwert einer Stichprobe 66 7.2 Mittelwert einer Stichprobe Gegeben ist eine normalverteilte Grundgesamtheit. Mit Hilfe einer Stichprobe möchten wir Aussagen über den unbekannten Mittelwert µ dieser Grundgesamtheit machen. Wenn

Mehr

Einführung in die Statistik für Politikwissenschaftler Sommersemester 2011

Einführung in die Statistik für Politikwissenschaftler Sommersemester 2011 Einführung in die Statistik für Politikwissenschaftler Sommersemester 2011 Es können von den Antworten alle, mehrere oder keine Antwort(en) richtig sein. Nur bei einer korrekten Antwort (ohne Auslassungen

Mehr

Hypothesen: Fehler 1. und 2. Art, Power eines statistischen Tests

Hypothesen: Fehler 1. und 2. Art, Power eines statistischen Tests ue biostatistik: hypothesen, fehler 1. und. art, power 1/8 h. lettner / physik Hypothesen: Fehler 1. und. Art, Power eines statistischen Tests Die äußerst wichtige Tabelle über die Zusammenhänge zwischen

Mehr

Klassifikation von Signifikanztests

Klassifikation von Signifikanztests Klassifikation von Signifikanztests Nach Verteilungsannahmen: verteilungsabhängig: parametrischer [parametric] Test verteilungsunabhängig: nichtparametrischer [non-parametric] Test Bei parametrischen Tests

Mehr

Statistik I für Betriebswirte Vorlesung 14

Statistik I für Betriebswirte Vorlesung 14 Statistik I für Betriebswirte Vorlesung 14 Dr. Andreas Wünsche TU Bergakademie Freiberg Institut für Stochastik 13. Juli 017 Dr. Andreas Wünsche Statistik I für Betriebswirte Vorlesung 14 Version: 8. Juli

Mehr

Computergestützte Methoden. Master of Science Prof. Dr. G. H. Franke WS 07/08

Computergestützte Methoden. Master of Science Prof. Dr. G. H. Franke WS 07/08 Computergestützte Methoden Master of Science Prof. Dr. G. H. Franke WS 07/08 1 Seminarübersicht 1. Einführung 2. Recherchen mit Datenbanken 3. Erstellung eines Datenfeldes 4. Skalenniveau und Skalierung

Mehr

Biomathematik für Mediziner, Klausur WS 1999/2000 Seite 1

Biomathematik für Mediziner, Klausur WS 1999/2000 Seite 1 Biomathematik für Mediziner, Klausur WS 1999/2000 Seite 1 Aufgabe 1: Wieviele der folgenden Variablen sind quantitativ stetig? Schulnoten, Familienstand, Religion, Steuerklasse, Alter, Reaktionszeit, Fahrzeit,

Mehr

Einfache statistische Auswertungen mit dem Programm SPSS

Einfache statistische Auswertungen mit dem Programm SPSS Einfache statistische Auswertungen mit dem Programm SPSS Datensatz: fiktive_daten.sav Dipl. Päd. Anne Haßelkus Dr. Dorothea Dette-Hagenmeyer 11/2011 Überblick 1 Deskriptive Statistiken; Mittelwert berechnen...

Mehr

Analyse von Querschnittsdaten. Signifikanztests I Basics

Analyse von Querschnittsdaten. Signifikanztests I Basics Analyse von Querschnittsdaten Signifikanztests I Basics Warum geht es in den folgenden Sitzungen? Kontinuierliche Variablen Generalisierung kategoriale Variablen Datum 13.10.2004 20.10.2004 27.10.2004

Mehr

Tutorial: Anpassungstest

Tutorial: Anpassungstest Tutorial: Anpassungstest An einem Institut gibt es vier UniversitätslehrerInnen, die auch Diplomarbeiten betreuen. Natürlich erfordert die Betreuung einer Diplomarbeit einiges an Arbeit und Zeit und vom

Mehr

Jost Reinecke. 7. Juni 2005

Jost Reinecke. 7. Juni 2005 Universität Bielefeld 7. Juni 2005 Testtheorie Test für unabhängige Stichproben Test für abhängige Stichproben Testtheorie Die Testtheorie beinhaltet eine Reihe von Testverfahren, die sich mit der Überprüfung

Mehr

= 3. Kapitel 4: Normalverteilung.. und Standardnormalverteilung und: das Konfidenzintervall..

= 3. Kapitel 4: Normalverteilung.. und Standardnormalverteilung und: das Konfidenzintervall.. Kapitel : Normalverteilung.. und Standardnormalverteilung und: das Konfidenzintervall.. Mittelwert = Summe aller Einzelwerte / n = durchschnittliche Ausprägung, wenn alle gleich viel hätten. Streuung =

Mehr

Forschungsstatistik I

Forschungsstatistik I Psychologie Prof. Dr. G. Meinhardt 6. Stock, TB II R. 06-206 (Persike) R. 06-321 (Meinhardt) Sprechstunde jederzeit nach Vereinbarung Forschungsstatistik I Dr. Malte Persike persike@uni-mainz.de http://psymet03.sowi.uni-mainz.de/

Mehr

Institut für Soziologie Werner Fröhlich. Methoden 2. Kontingenztabellen Chi-Quadrat-Unabhängigkeitstest

Institut für Soziologie Werner Fröhlich. Methoden 2. Kontingenztabellen Chi-Quadrat-Unabhängigkeitstest Institut für Soziologie Methoden 2 Kontingenztabellen Chi-Quadrat-Unabhängigkeitstest Aufbau der Sitzung Was sind Kontingenztabellen? Wofür werden Kontingenztabellen verwendet? Aufbau und Interpretation

Mehr

Statistische Methoden in den Umweltwissenschaften

Statistische Methoden in den Umweltwissenschaften Statistische Methoden in den Umweltwissenschaften Post Hoc Tests A priori Tests (Kontraste) Nicht-parametrischer Vergleich von Mittelwerten 50 Ergebnis der ANOVA Sprossdichte der Seegräser 40 30 20 10

Mehr

Hypothesentests mit SPSS. Beispiel für einen t-test

Hypothesentests mit SPSS. Beispiel für einen t-test Beispiel für einen t-test Daten: museum-f-v04.sav Hypothese: Als Gründe, in ein Museum zu gehen, geben mehr Frauen als Männer die Erweiterung der Bildung für Kinder an. Dies hängt mit der Geschlechtsrolle

Mehr

3. Das Prüfen von Hypothesen. Hypothese?! Stichprobe Signifikanztests in der Wirtschaft

3. Das Prüfen von Hypothesen. Hypothese?! Stichprobe Signifikanztests in der Wirtschaft 3. Das Prüfen von Hypothesen Hypothese?! Stichprobe 3.1. Signifikanztests in der Wirtschaft Prüfung, ob eine (theoretische) Hypothese über die Verteilung eines Merkmals X und ihre Parameter mit einer (empirischen)

Mehr

3. ZWEI KATEGORIALE MERKMALE (bivariate kategoriale Daten)

3. ZWEI KATEGORIALE MERKMALE (bivariate kategoriale Daten) 3. ZWEI KATEGORIALE MERKMALE (bivariate kategoriale Daten) Beispiel: Gründe für Beliebtheit bei Klassenkameraden 478 neun- bis zwölfjährigen Schulkinder in Michigan, USA warum ist man bei seinen Klassenkameraden

Mehr

Deskription, Statistische Testverfahren und Regression. Seminar: Planung und Auswertung klinischer und experimenteller Studien

Deskription, Statistische Testverfahren und Regression. Seminar: Planung und Auswertung klinischer und experimenteller Studien Deskription, Statistische Testverfahren und Regression Seminar: Planung und Auswertung klinischer und experimenteller Studien Deskriptive Statistik Deskriptive Statistik: beschreibende Statistik, empirische

Mehr

Aufgaben zu Kapitel 8

Aufgaben zu Kapitel 8 Aufgaben zu Kapitel 8 Aufgabe 1 a) Berechnen Sie einen U-Test für das in Kapitel 8.1 besprochene Beispiel mit verbundenen n. Die entsprechende Testvariable punkte2 finden Sie im Datensatz Rangdaten.sav.

Mehr

Institut für Soziologie Sabine Düval. Methoden 2. Kontingenztabellen Chi-Quadrat-Unabhängigkeitstest

Institut für Soziologie Sabine Düval. Methoden 2. Kontingenztabellen Chi-Quadrat-Unabhängigkeitstest Institut für Soziologie Methoden 2 Kontingenztabellen Chi-Quadrat-Unabhängigkeitstest Aufbau der Sitzung Wiederholung Exkurs zur Inferenzstatistik Was sind Kontingenztabellen? Recodieren, Kategorisieren

Mehr

Allgemeines zu Tests. Statistische Hypothesentests

Allgemeines zu Tests. Statistische Hypothesentests Statistische Hypothesentests Allgemeines zu Tests Allgemeines Tests in normalverteilten Grundgesamtheiten Asymptotische Tests Statistischer Test: Verfahren Entscheidungsregel), mit dem auf Basis einer

Mehr

Statistik III Regressionsanalyse, Varianzanalyse und Verfahren bei Messwiederholung mit SPSS

Statistik III Regressionsanalyse, Varianzanalyse und Verfahren bei Messwiederholung mit SPSS Statistik III Regressionsanalyse, Varianzanalyse und Verfahren bei Messwiederholung mit SPSS Verena Hofmann Dr. phil. des. Departement für Sonderpädagogik Universität Freiburg Petrus-Kanisius-Gasse 21

Mehr

Unterschiedshypothesen Vergleiche von Häufigkeiten bzw. Mittelwerten zwischen (mindestens) zwei Gruppen Zusammenhangshypothesen Korrelationsanalysen

Unterschiedshypothesen Vergleiche von Häufigkeiten bzw. Mittelwerten zwischen (mindestens) zwei Gruppen Zusammenhangshypothesen Korrelationsanalysen Statistische Überprüfung von Hypothesen Hypothesen sind allgemeine Aussagen über Zusammenhänge zwischen empirischen und logischen Sachverhalten.Allgemein bezeichnet man diejenigen Aussagen als Hypothesen,

Mehr

Wiederholung. Statistik I. Sommersemester 2009

Wiederholung. Statistik I. Sommersemester 2009 Statistik I Sommersemester 2009 Statistik I (1/21) Daten/graphische Darstellungen Lage- und Streuungsmaße Zusammenhangsmaße Lineare Regression Wahrscheinlichkeitsrechnung Zentraler Grenzwertsatz Konfidenzintervalle

Mehr

Aufgaben zu Kapitel 9

Aufgaben zu Kapitel 9 Aufgaben zu Kapitel 9 Aufgabe 1 Für diese Aufgabe benötigen Sie den Datensatz Nominaldaten.sav. a) Sie arbeiten für eine Marktforschungsfirma und sollen überprüfen, ob die in diesem Datensatz untersuchte

Mehr

Klausur Wiederholung t-tests. Zusammenfassung. Hypothesentests II. Statistik I. Sommersemester Statistik I Hypothesentests I (1/37)

Klausur Wiederholung t-tests. Zusammenfassung. Hypothesentests II. Statistik I. Sommersemester Statistik I Hypothesentests I (1/37) Hypothesentests II Statistik I Sommersemester 2009 Statistik I Hypothesentests I (1/37) Logik/z-Test Statistische Signifikanz 00 01 02 03 04 4 2 0 2 4 Statistik I Hypothesentests I (2/37) Informationen

Mehr

Beurteilende Statistik

Beurteilende Statistik Beurteilende Statistik Wahrscheinlichkeitsrechnung und Beurteilende Statistik was ist der Unterschied zwischen den beiden Bereichen? In der Wahrscheinlichkeitstheorie werden aus gegebenen Wahrscheinlichkeiten

Mehr

Hypothesen über die Grundgesamtheit. Aufgabenstellung der Testtheorie Hypothesen (Annahmen, Vermutungen oder

Hypothesen über die Grundgesamtheit. Aufgabenstellung der Testtheorie Hypothesen (Annahmen, Vermutungen oder Hypothesen über die Grundgesamtheit Aufgabenstellung der Testtheorie Hypothesen (Annahmen, Vermutungen oder Behauptungen) über die unbekannte Grundgesamtheit anhand einer Stichprobe als richtig oder falsch

Mehr

Kapitel 16 Kreuztabellen

Kapitel 16 Kreuztabellen Kapitel 16 Kreuztabellen Eine Kreuztabelle dient dazu, die kombinierte Häufigkeitsverteilung zweier Variablen darzustellen. Sie bildet somit das Pendant zu einer Häufigkeitstabelle für den 2-Variablen-Fall.

Mehr

Aufgabenblock 4. Da Körpergröße normalverteilt ist, erhalten wir aus der Tabelle der t-verteilung bei df = 19 und α = 0.05 den Wert t 19,97.

Aufgabenblock 4. Da Körpergröße normalverteilt ist, erhalten wir aus der Tabelle der t-verteilung bei df = 19 und α = 0.05 den Wert t 19,97. Aufgabenblock 4 Aufgabe ) Da s = 8. cm nur eine Schätzung für die Streuung der Population ist, müssen wir den geschätzten Standardfehler verwenden. Dieser berechnet sich als n s s 8. ˆ = = =.88. ( n )

Mehr

2.4 Hypothesentests Grundprinzipien statistischer Hypothesentests. Hypothese:

2.4 Hypothesentests Grundprinzipien statistischer Hypothesentests. Hypothese: 2.4.1 Grundprinzipien statistischer Hypothesentests Hypothese: Behauptung einer Tatsache, deren Überprüfung noch aussteht (Leutner in: Endruweit, Trommsdorff: Wörterbuch der Soziologie, 1989). Statistischer

Mehr

Mathematik 2 für Naturwissenschaften

Mathematik 2 für Naturwissenschaften Hans Walser Mathematik 2 für Naturwissenschaften 2 3 3 4 6 4 5 0 0 5 6 5 20 5 6 Tabellen (leicht gekürzte Version) Hans Walser: Tabellen ii Inhalt Binomische Verteilung.... Binomische Verteilung (ohne

Mehr

Bivariate Analyse: Gemeinsame (bivariate) Häufigkeitstabelle. Sie wird auch Kontingenz-, Assoziations- oder Korrelationstabelle (f b )genannt.

Bivariate Analyse: Gemeinsame (bivariate) Häufigkeitstabelle. Sie wird auch Kontingenz-, Assoziations- oder Korrelationstabelle (f b )genannt. Bivariate Analyse: Tabellarische Darstellung: Gemeinsame (bivariate) Häufigkeitstabelle. Sie wird auch Kontingenz-, Assoziations- oder Korrelationstabelle (f b )genannt. Beispiel: Häufigkeitsverteilung

Mehr

Willkommen zur Vorlesung Statistik (Master)

Willkommen zur Vorlesung Statistik (Master) Willkommen zur Vorlesung Statistik (Master) Thema dieser Vorlesung: Verteilungsfreie Verfahren Prof. Dr. Wolfgang Ludwig-Mayerhofer Universität Siegen Philosophische Fakultät, Seminar für Sozialwissenschaften

Mehr

Vorlesung: Statistik II für Wirtschaftswissenschaft

Vorlesung: Statistik II für Wirtschaftswissenschaft Vorlesung: Statistik II für Wirtschaftswissenschaft Prof. Dr. Helmut Küchenhoff Institut für Statistik, LMU München Sommersemester 2017 Einführung 1 Wahrscheinlichkeit: Definition und Interpretation 2

Mehr

Statistik I. Sommersemester 2009

Statistik I. Sommersemester 2009 I Sommersemester 2009 I χ 2 =?!? Nächste Woche: Maße für ordinale, nominal/intervallskalierte und intervallskalierte Daten I Zum Nachlesen Agresti/Finlay: Kapitel 8.1-8.4 Gehring/Weins: Kapitel 7.1 Schumann:

Mehr

SozialwissenschaftlerInnen II

SozialwissenschaftlerInnen II Statistik für SozialwissenschaftlerInnen II Henning Best best@wiso.uni-koeln.de Universität zu Köln Forschungsinstitut für Soziologie Statistik für SozialwissenschaftlerInnen II p.1 Testen von Hypothesen

Mehr

Konfidenzintervalle Grundlegendes Prinzip Erwartungswert Bekannte Varianz Unbekannte Varianz Anteilswert Differenzen von Erwartungswert Anteilswert

Konfidenzintervalle Grundlegendes Prinzip Erwartungswert Bekannte Varianz Unbekannte Varianz Anteilswert Differenzen von Erwartungswert Anteilswert Konfidenzintervalle Grundlegendes Prinzip Erwartungswert Bekannte Varianz Unbekannte Varianz Anteilswert Differenzen von Erwartungswert Anteilswert Beispiel für Konfidenzintervall Im Prinzip haben wir

Mehr

Grundidee. χ 2 Tests. Ausgangspunkt: Klasseneinteilung der Beobachtungen in k Klassen. Grundidee. Annahme: Einfache Zufallsstichprobe (X 1,..., X n ).

Grundidee. χ 2 Tests. Ausgangspunkt: Klasseneinteilung der Beobachtungen in k Klassen. Grundidee. Annahme: Einfache Zufallsstichprobe (X 1,..., X n ). Grundidee χ 2 -Anpassungstest χ 2 -Unabhängigkeitstest χ 2 -Homogenitätstest χ 2 Tests Grundidee Ausgangspunkt: Klasseneinteilung der Beobachtungen in k Klassen Annahme: Einfache Zufallsstichprobe (X 1,,

Mehr

Einführung in SPSS. Sitzung 4: Bivariate Zusammenhänge. Knut Wenzig. 27. Januar 2005

Einführung in SPSS. Sitzung 4: Bivariate Zusammenhänge. Knut Wenzig. 27. Januar 2005 Sitzung 4: Bivariate Zusammenhänge 27. Januar 2005 Inhalt der letzten Sitzung Übung: ein Index Umgang mit missing values Berechnung eines Indexes Inhalt der letzten Sitzung Übung: ein Index Umgang mit

Mehr

Grundlagen der Statistik

Grundlagen der Statistik Grundlagen der Statistik Übung 15 009 FernUniversität in Hagen Alle Rechte vorbehalten Fachbereich Wirtschaftswissenschaft Übersicht über die mit den Übungsaufgaben geprüften Lehrzielgruppen Lehrzielgruppe

Mehr

73 Hypothesentests Motivation Parametertest am Beispiel eines Münzexperiments

73 Hypothesentests Motivation Parametertest am Beispiel eines Münzexperiments 73 Hypothesentests 73.1 Motivation Bei Hypothesentests will man eine gewisse Annahme über eine Zufallsvariable darauf hin überprüfen, ob sie korrekt ist. Beispiele: ( Ist eine Münze fair p = 1 )? 2 Sind

Mehr

GRUNDPRINZIPIEN statistischen Testens

GRUNDPRINZIPIEN statistischen Testens Fragestellungen beim Testen GRUNDPRINZIPIEN statistischen Testens. Vergleiche Unterscheidet sich die Stichprobenbeobachtung von einer vorher spezifizierten Erwartung ( Hypothese ) mit ausreichender Sicherheit?

Mehr

7. Lösungen weitere Übungsaufgaben Statistik für Ingenieure WiSe 16/17

7. Lösungen weitere Übungsaufgaben Statistik für Ingenieure WiSe 16/17 7. Lösungen weitere Übungsaufgaben Statistik für Ingenieure WiSe 16/17 1. Aufgabe: a) Grundgesamtheit sind alle Reifen aus der Produktion von Langstone aus dem Monat März der entsprechenden Reifentypen.

Mehr

Statistische Methoden in den Umweltwissenschaften

Statistische Methoden in den Umweltwissenschaften Statistische Methoden in den Umweltwissenschaften t-test Varianzanalyse (ANOVA) Übersicht Vergleich von Mittelwerten 2 Gruppen: t-test einfaktorielle ANOVA > 2 Gruppen: einfaktorielle ANOVA Seeigel und

Mehr

Was sind Zusammenhangsmaße?

Was sind Zusammenhangsmaße? Was sind Zusammenhangsmaße? Zusammenhangsmaße beschreiben einen Zusammenhang zwischen zwei Variablen Beispiele für Zusammenhänge: Arbeiter wählen häufiger die SPD als andere Gruppen Hochgebildete vertreten

Mehr

Mathematik für Biologen

Mathematik für Biologen Mathematik für Biologen Prof. Dr. Rüdiger W. Braun Heinrich-Heine-Universität Düsseldorf 25. Januar 2013 1 Der χ 2 -Anpassungstest 2 Exakter Test nach Fisher Mendelsche Erbregeln als Beispiel für mehr

Mehr

Wahrscheinlichkeitsrechnung und Statistik für Biologen Wiederholung: Verteilungen

Wahrscheinlichkeitsrechnung und Statistik für Biologen Wiederholung: Verteilungen Wahrscheinlichkeitsrechnung und Statistik für Biologen Wiederholung: Verteilungen Noémie Becker & Dirk Metzler 31. Mai 2016 Inhaltsverzeichnis 1 Binomialverteilung 1 2 Normalverteilung 2 3 T-Verteilung

Mehr

Wahrscheinlichkeitsrechnung und Statistik für Biologen Spezielle Verteilungen

Wahrscheinlichkeitsrechnung und Statistik für Biologen Spezielle Verteilungen Wahrscheinlichkeitsrechnung und Statistik für Biologen Spezielle Verteilungen Noémie Becker & Dirk Metzler http://evol.bio.lmu.de/_statgen 7. Juni 2013 1 Binomialverteilung 2 Normalverteilung 3 T-Verteilung

Mehr

Fallzahlplanung bei unabhängigen Stichproben

Fallzahlplanung bei unabhängigen Stichproben Fallzahlplanung bei unabhängigen Stichproben Seminar Aktuelle biometrische Probleme Benjamin Hofner benjamin.hofner@stat.uni-muenchen.de 12. Januar 2005 Übersicht 1. Einführung und Grundlagen der Fallzahlplanung

Mehr

Grundlagen der empirischen Sozialforschung

Grundlagen der empirischen Sozialforschung Grundlagen der empirischen Sozialforschung Sitzung 11 - Datenanalyseverfahren Jan Finsel Lehrstuhl für empirische Sozialforschung Prof. Dr. Petra Stein 5. Januar 2009 1 / 22 Online-Materialien Die Materialien

Mehr

Bivariate Verteilungen

Bivariate Verteilungen Bivariate Verteilungen Tabellarische Darstellung: Bivariate Tabellen entstehen durch Kreuztabulation zweier Variablen. Beispiel: X Y Student(in) Herkunft Fakultät 0001 Europa Jura 000 Nicht-Europa Medizin

Mehr

Hypothesentests mit SPSS

Hypothesentests mit SPSS Beispiel für eine zweifaktorielle Varianzanalyse mit Messwiederholung auf einem Faktor (univariate Lösung) Daten: POKIII_AG4_V06.SAV Hypothese: Die physische Attraktivität der Bildperson und das Geschlecht

Mehr