Statistisches Testen

Ähnliche Dokumente
Konfidenzintervalle Grundlegendes Prinzip Erwartungswert Bekannte Varianz Unbekannte Varianz Anteilswert Differenzen von Erwartungswert Anteilswert

Klassifikation von Signifikanztests

4.1. Nullhypothese, Gegenhypothese und Entscheidung

Einführung in die Induktive Statistik: Testen von Hypothesen

5. Seminar Statistik

Die Familie der χ 2 (n)-verteilungen

Vorlesung: Statistik II für Wirtschaftswissenschaft

3 Grundlagen statistischer Tests (Kap. 8 IS)

Zufallsvariablen. Diskret. Stetig. Verteilung der Stichprobenkennzahlen. Binomial Hypergeometrisch Poisson. Normal Lognormal Exponential

Statistik II für Betriebswirte Vorlesung 1

Statistik II: Signifikanztests /1

Wahrscheinlichkeitsrechnung und Statistik für Biologen Spezielle Verteilungen

Statistik I für Betriebswirte Vorlesung 14

Tutorial: Anpassungstest

Statistische Tests für unbekannte Parameter

Statistik II. IV. Hypothesentests. Martin Huber

Auswertung und Lösung

Wahrscheinlichkeitsrechnung und Statistik

73 Hypothesentests Motivation Parametertest am Beispiel eines Münzexperiments

Entscheidung zwischen zwei Möglichkeiten auf der Basis unsicherer (zufälliger) Daten

Statistische Tests für unbekannte Parameter

Hypothesen: Fehler 1. und 2. Art, Power eines statistischen Tests

Testen von Hypothesen:

2.4 Hypothesentests Grundprinzipien statistischer Hypothesentests. Hypothese:

Statistische Tests. Kapitel Grundbegriffe. Wir betrachten wieder ein parametrisches Modell {P θ : θ Θ} und eine zugehörige Zufallsstichprobe

Prüfung aus Wahrscheinlichkeitstheorie und Statistik MASCHINENBAU 2003

Statistik II. Weitere Statistische Tests. Statistik II

Chi-Quadrat Verfahren

Test auf den Erwartungswert

Wahrscheinlichkeitsrechnung und Statistik für Biologen Wiederholung: Verteilungen

Einführung in Quantitative Methoden

Aufgabenblock 4. Da Körpergröße normalverteilt ist, erhalten wir aus der Tabelle der t-verteilung bei df = 19 und α = 0.05 den Wert t 19,97.

Statistische Tests (Signifikanztests)

4. Lösung weitere Übungsaufgaben Statistik II WiSe 2016/2017

2. Formulieren von Hypothesen. Nullhypothese: H 0 : µ = 0 Gerät exakt geeicht

Statistik Testverfahren. Heinz Holling Günther Gediga. Bachelorstudium Psychologie. hogrefe.de

Zweiseitiger Test für den unbekannten Mittelwert µ einer Normalverteilung bei unbekannter Varianz

Mathematische Statistik Aufgaben zum Üben. Schätzer

Statistik und Wahrscheinlichkeitsrechnung

Mathematische und statistische Methoden II

Alternative Darstellung des 2-Stcihprobentests für Anteile

erwartete Häufigkeit n=80 davon 50% Frauen fe=40 davon 50% Männer fe=40 Abweichung der beobachteten von den erwarteten Häufigkeiten:

Bivariater Zusammenhang in der Vierfeldertafel PEΣO

Tutorial:Unabhängigkeitstest

Statistik II. Statistische Tests. Statistik II

Eine Einführung in R: Statistische Tests

Mathematik IV für Maschinenbau und Informatik (Stochastik) Universität Rostock, Institut für Mathematik Sommersemester 2007

GRUNDPRINZIPIEN statistischen Testens

Statistik II. IV. Hypothesentests. Martin Huber

Anhang: Statistische Tafeln und Funktionen

Einfaktorielle Varianzanalyse

Hypothesentests für Erwartungswert und Median. Statistik (Biol./Pharm./HST) FS 2015

Kapitel 3 Schließende Statistik

Anpassungstests VORGEHENSWEISE

Hypothesenprüfung. Darüber hinaus existieren zahlreiche andere Testverfahren, die alle auf der gleichen Logik basieren

Hypothesentests mit SPSS. Beispiel für einen t-test

Analytische Statistik II

Allgemeines zu Tests. Statistische Hypothesentests

Klausur zu Statistik II

Biomathematik für Mediziner, Klausur WS 1999/2000 Seite 1

Grundlagen der Statistik

Statistische Überlegungen: Eine kleine Einführung in das 1 x 1

T-Test für den Zweistichprobenfall

5. Kolmogorov-Smirnov-Test und χ 2 -Anpassungstest

Vergleich von Gruppen I

Jost Reinecke. 7. Juni 2005

10. Die Normalverteilungsannahme

Inferenzstatistik und Hypothesentests. Hierbei geht es um die Absicherung eines Untersuchungsergebnisses gegen ein Zufallsereignis.

Fit for Abi & Study Stochastik

0 sonst. a) Wie lautet die Randwahrscheinlichkeitsfunktion von Y? 0.5 y = 1

THEMA: "STATISTIK IN DER PRAXIS TESTEN IST BESSER ALS VERMUTEN" TORSTEN SCHOLZ

Bereiche der Statistik

7. Hypothesentests. Ausgangssituation erneut: ZV X repräsentiere einen Zufallsvorgang. X habe die unbekannte VF F X (x)

Lösungen zu den Übungsaufgaben in Kapitel 10

Lösungen zu Janssen/Laatz, Statistische Datenanalyse mit SPSS 1

Klausur zur Vorlesung

Probeklausur zu Mathematik 3 für Informatik Lösungshinweise (ohne Garantie auf Fehlefreiheit)

Der χ 2 -Test (Chiquadrat-Test)

Zusammenfassung PVK Statistik

2 Wiederholung statistischer Grundlagen Schließende Statistik empirischen Information aus Stichprobenrealisation x von X

Biomathematik für Mediziner, Klausur SS 2001 Seite 1

Klassifikation von Signifikanztests

Fallzahlplanung bei unabhängigen Stichproben

7.2 Mittelwert einer Stichprobe

Eine Einführung in R: Statistische Tests

Wichtige Definitionen und Aussagen

4.1. Verteilungsannahmen des Fehlers. 4. Statistik im multiplen Regressionsmodell Verteilungsannahmen des Fehlers

Tests für Erwartungswert & Median

SozialwissenschaftlerInnen II

Macht des statistischen Tests (power)

Grundlagen der Biometrie in Agrarwissenschaften / Ernährungswissenschaften

k np g(n, p) = Pr p [T K] = Pr p [T k] Φ. np(1 p) DWT 4.1 Einführung 359/467 Ernst W. Mayr

Mathematik für Biologen

Transkript:

Statistisches Testen Grundlegendes Prinzip Erwartungswert Bekannte Varianz Unbekannte Varianz Differenzen Anteilswert Chi-Quadrat Tests Gleichheit von Varianzen

Prinzip des Statistischen Tests Konfidenzintervall diente dazu, um Bereich festzulegen in dem ein Schätzer mit einer gewissen Wahrscheinlichkeit liegt. Testverfahren dienen dazu, um eine Entscheidung zu treffen. Typischerweise wählt man zwischen einer Nullhypothese H 0 und einer Alternative H 1, die beide präzise festgelegt werden müssen. Es kann zu zwei Fehlentscheidungen kommen: H 0 ist richtig, man entscheidet sich jedoch für H 1. H 1 ist richtig, man entscheidet sich jedoch für H 0.

Allgemeines zum Testprinzip: Fehler erster und zweiter Art tatsächlich gilt H 0 H 1 Testentscheidung H 0 1-α β H 1 α 1-β Fehler erster Art (α) : Wahrscheinlichkeit die Nullhypothese fälschlicherweise zu verwerfen. Fehler zweiter Art (β) : Wahrscheinlichkeit die Nullhypothese fälschlicherweise nicht zu verwerfen.

Allgemeines zum Testprinzip: Fehler erster und zweiter Art tatsächlich gilt H 0 H 1 Testentscheidung H 0 1-α β H 1 α 1-β Signifikanzniveau α wird von vorne herein festgelegt zb.: α = 0,05 Güte bzw. Power eines Tests (1 β) : Wahrscheinlichkeit für die korrekte Verwerfung der Nullhypothese.

Allgemeines zum Testprinzip: Power eines statistischen Tests Signifikanzniveau α Stichprob enumfang (+) Power eines Tests (+) Ausmaß des tatsächlichen Effektes/Unterschiedes/Zusammenhanges

Test für den Erwartungswert Man sucht nach Tests die bei gegebenem Signifikanzniveau α maximale Güte haben. Typischerweise wird ein Test derart durchgeführt, dass aus den Daten einer Stichprobe eine gewisse Teststatistik T berechnet wird, die mit einem zugehörigen Ablehnbereich verglichen wird Liegt T im Ablehnbereich wird die Nullhypothese verworfen und man entscheidet sich für H 1. Liegt T nicht im Ablehnbereich muss man H 0 beibehalten. Die Daten sind nicht stichhaltig genug, um sich für die Alternative zu entscheiden.

Test für den Erwartungswert Annahme: Stichprobe der Größe n normalverteilt mit bekannter Varianz σ und fraglichem Mittelwert µ. H 0 : µ = µ 0 H 1 : µ µ 0 Teststatistik: T = n ( 0 x µ ) σ Testentscheidung für H 1 : Ansonsten H 0 beibehalten

Einseitiges und zweiseitiges Testen Zweiseitiges Testen: H 0 : µ = µ 0 H 1 : µ µ 0 Testentscheidung für H 1 : Einseitiges Testen: H 0 : µ = µ 0 H 1 : µ > µ 0 Testentscheidung für H 1 : H 0 : µ = µ 0 H 1 : µ < µ 0 Testentscheidung für H 1 :

Test für Erwartungswert, σ unbekannt Stichprobe der Größe n, empirische Varianz s H 0 : µ = µ 0 H 1 : µ µ 0 Teststatistik: T = n( x µ 0) s Testentscheidung für H 1 : Ansonsten kann H 1 nicht verworfen werden. Einseitige Tests analog zu Fall mit σ bekannt

Beispiel 6-1 n = 30 Beutel Speisekartoffel, Sollwert kg. Im Mittel 1.88 kg, Standardabweichung s = 0.5 kg Teste zum Niveau α = 0.05 ob Beutel korrekt abgefüllt, Alternative: nicht korrekt abgefüllt 30(1.88 0.5 H 0 : µ =, H 1 : µ, T = =. 63 ) Testentscheidung für H 1 : Die Stichprobe bekräftigt, dass die Säcke nicht korrekt abgefüllt wurden.

Beispiel 6-1, Fortsetzung Berechne für das selbe Problem ein 95%-CI (µ x α, µ + x α ) mit CI = [1.787, 1.973] Man erkennt, dass der Sollwert nicht im Konfidenzintervall für den Erwartungswert liegt. Wir sehen hier den Zusammenhang zwischen Konfidenzintervallen und Testentscheidung: Ich entscheide mich im Test zum Niveau α genau dann für H 1 wenn das zu testende µ 0 nicht im (1- α) Konfidenzintervall von µ liegt.

Tests für Differenz zweier Mittelwerte Aufgrund von dem Zusammenhang zwischen Tests und Konfidenzintervallen ist nun klar, dass wir beim Vergleich von Mittelwerten wiederum folgende Fälle unterscheiden: 1. Verbundene Stichproben (Vorher-Nachher Vergleich): Bilde Differenzen und teste H 0 : µ = µ 0 gegen H 1 : µ µ 0. Zwei unabhängige Stichproben Bekannte Varianzen Unbekannte Varianzen, in beiden Gruppen gleich Unbekannte Varianzen, in beiden Gruppen verschieden

Unabhängige Stichproben (Größe n 1,n ), bekannte Varianzen σ 1, σ H 0 : µ 1 = µ H 1 : µ 1 µ Teststatistik: wobei T = µ σ D D und Testentscheidung für H 1 : Die Gestalt der Teststatistik ist für T-Tests typisch!

Unabhängige Stichproben (Größe n 1,n ) ; unbekannte Varianzen, Ann: σ 1 σ H 0 : µ 1 = µ H 1 : µ 1 µ Teststatistik: T = µ s D D wobei Testentscheidung für H 1 : mit wobei

Unabhängige Stichproben (Größe n 1,n ) ; unbekannte Varianzen, Ann: σ 1 = σ H 0 : µ 1 = µ H 1 : µ 1 µ Teststatistik: T = µ s D P mit Testentscheidung für H 1 :

Tests für den Anteilswert Wie schon bei der Berechnung vom α-konfidenzintervall für Anteilswerte benutzen wir auch beim Testen die Normalverteilungs - Approximation: Stichprobe der Größe n, H 0 : p = p 0, H 1 : p p 0 Teststatistik: T = n( pˆ p 0 (1 p p 0 0 ) ) Testentscheidung für H 1 : Beachte: : Kleiner Unterschied zu den Konfidenzintervallen für Anteilswerte: Verwende für die Varianz p 0!

Test für Differenz zweier Anteilswerte Wie für den Anteilswert selbst Normalverteilungs- Approximation (im Vergleich zum Konfidenzintervall wiederum Unterschied in der Formel für s D ) Stichproben der Größe n 1,n, H 0 : p 1 = p, H 1 : p 1 p Teststatistik: pˆ 1 pˆ T = s D mit und

Bsp. 6-1 Werbekampagne: 0 Personen vorher, davon 60 pos. 0 nachher befragt, davon pos. Frage: Änderung des Bekanntheitsgrades? H 0 : p 1 = p, H 1 : p 1 p p = 0.3, pˆ 0. 6 ˆ1 = T pˆ pˆ 1 Teststatistik: = = 6. 98 s D

Bsp. 6-1 - Fortsetzung T pˆ pˆ 1 Teststatistik: = = 6. 98 s D Entscheide mich für die Alternativhypothese: Der Bekanntheitsgrad hat sich geändert! Einseitiger Test: H 0 : p p 1, H 1 : p > p 1 Entscheide mich für die Alternativhypothese: Der Bekanntheitsgrad hat sich gesteigert!

Tests für kategorielle Variablen Bisher behandelten wir Tests für Eigenschaften von metrischen Variablen. Wir möchten nun kategorielle Variablen behandeln (endlich viele Ausprägungen). Typischerweise folgen in diesem Zusammenhang die Teststatistiken einer χ Verteilung. Die Quantile der χ - Verteilung findet man in Tabelle 4, Seite 3 Wir werden 3 Situationen besprechen: 1. Test auf Unabhängigkeit zweier Variablen. Test auf Homogenität einer Variable zwischen Gruppen 3. Anpassungstest (eine Variable)

Klassischer χ -Test Dieser Test wird bei zwei verschiedenen Fragestellungen angewendet: 1) Besteht ein Zusammenhang zwischen zwei kategoriellen Variablen? ) Hat eine kategorielle Variable in zwei oder mehr Gruppen die selbe Verteilung? Test wird in beiden Situationen identisch durchgeführt. Entscheidend ist das Berechnen der Teststatistik aus einer Kreuztabelle.

χ Test am Beispiel von Tafel Frage: Gibt es einen Zusammenhang zwischen dem Geschlecht und dem Wunsch nach Lokalanästhesie vor einer Zahnbehandlung? D.h., unterscheidet sich der Anteil der, die Lokalanästhesie wünschen vom Anteil der? Nullhypothese, H 0 : Es besteht kein Zusammenhang zwischen Geschlecht und dem Wunsch nach Lokalanästhesie. (Die Anteile sind gleich) Alternativhypothese, H 1 : Es besteht ein Zusammenhang zwischen Geschlecht und dem Wunsch nach Lokalanästhesie. (Die Anteile unterscheiden sich)

χ Test am Beispiel von Tafel Daten der letzten beiden Tage aus einer Zahnarztpraxis: Lokalanästhesie gewünscht nicht gewünscht 11 9 7 13 Anteil Lokalanästhesien bei n: 11/ = 55% Anteil Lokalanästhesien bei : 7/ = 35% Anteil Lokalanästhesien gesamt: / = 45%

χ Test am Beispiel von Tafel Angenommen, der Wunsch nach Lokalanästhesie ist tatsächlich unabhängig vom Geschlecht (d.h. bei n und gleich ausgeprägt), welche Zellenhäufigkeiten würden wir erwarten? Lokalanästhesie gewünscht nicht gewünscht???? Anteil Lokalanästhesien gesamt: / = 45%

χ Test am Beispiel von Tafel Angenommen, der Wunsch nach Lokalanästhesie ist tatsächlich unabhängig vom Geschlecht (d.h. bei n und gleich ausgeprägt), welche Zellenhäufigkeiten würden wir erwarten? Lokalanästhesie gewünscht nicht gewünscht 9 11 9 11 zb: Zelle links oben: */ = 9.

χ Test Gesucht: Teststatistik, die den Abstand zwischen der beobachteten und der unter H 0 erwarteten Tabelle erfaßt. LA ja beobachtet unter H 0 erwartet 11 7 LA nein 9 13 LA ja 9 9 LA nein 11 11 Berechne (beobachtet - erwartet) erwartet über alle 4 Zellen T = (11 9) 9 + (9 11) 11 + (7 9) 9 + (13 11) 11 = 1.616

LA ja LA nein 11 9 7 13 Frage: Wie wahrscheinlich ist es, dieses spezielle Resultat ( T = 1.616) oder ein noch extremeres zu beobachten, unter der Annahme, dass kein Zusammenhang besteht (H 0 )? LA ja LA nein Noch extremer?:

LA ja LA nein 11 9 7 13 Frage: Wie wahrscheinlich ist es, dieses spezielle Resultat ( T = 1.616) oder ein noch extremeres zu beobachten, unter der Annahme, dass kein Zusammenhang besteht (H 0 )? LA ja LA nein Noch extremer?: 1 6 8 14

11 9 11 9 LA nein LA ja 1 8 10 10 13 7 9 11 14 6 8 1 15 5 7 13 16 4 6 14 17 3 5 15 4 16 19 1 3 17 0

11 9 11 9 LA nein LA ja 1 8 10 10 13 7 9 11 14 6 8 1 15 5 7 13 16 4 6 14 17 3 5 15 4 16 19 1 3 17 0 0 0,4 1,616 3,636 6,465 10,10 14,55 19,80 5,86 3,73

Teststatistik χ Test (allgemein) Kreuztabelle mit r Zeilen und s Spalten Teststatistik: T = r s i= 1 j= 1 ( h ij e e ij ij ) h ij beobachtete Häufigkeiten pro Zelle e ij = h i. h. j /n erwartete Häufigkeiten pro Zelle Entscheidung: H 0 wird abgelehnt falls

Der p-wert Bisher haben wir Testentscheidungen durchgeführt, indem wir die Teststatistik mit dem kritischen Wert verglichen haben. Alternativ kann man den entsprechenden p-wert heranziehen. p-wert: Wahrscheinlichkeit dass unter H 0 die Teststatistik (betragsmäßig) größer ist als der berechnete Wert. Testentscheidung: H 0 wird abgelehnt falls p-wert < α H 0 wird beibehalten falls p-wert α

χ Test mittels Computer Frage: Wie wahrscheinlich ist es in obigem Besipiel, dieses spezielle Resultat ( T = 1.616) oder ein noch extremeres zu beobachten, wenn kein Zusammenhang besteht (H 0 )? Antwort: (mittels Computer) Gesuchte Wahrscheinlichkeit für T = 1.616 p = 0,36 p-wert > α = 0.05 Beide Ungleichungen sagen aus, dass H 0 nicht verworfen werden kann!

Durchführung des Tests mittels Computer 1) Formulieren von H 0 und H 1 ) Signifikanzniveau festlegen, z.b.: α = 0.05 3) Passenden Test auswählen und durchführen 4) p-wert berechnen 5) p-wert mit Signifikanzniveau vergleichen 6) Testentscheidung: Frequency 1 Total --------- -------- -------- ----------- 1 11 9 -------- -------- 7 13 -------- -------- Total Statistics for Table of geschl by Lokanae Statistic DF Value Prob ------------------------------------------- Chi-Square 1 1.616 0.36 wenn p < α H 0 verwerfen wenn p > α H 0 nicht verwefen

Anpassungstest Gegeben sei ein Merkmal mit m Ausprägungen. Aufgrund von n Beobachtungen sollen folgende Hypothesen getestet werden: H 0 : P(j-te Ausprägung) = p j H 1 : Mindestens eine Ausprägung hat nicht die vorgegebene Wahrscheinlichkeit p j Typisches Beispiel - Test auf Gleichverteilung: p j = 1/m

Anpassungstest: Teststatistik Teststatistik: T = m i= 1 ( h i e e i i ) h 1,, h m, beobachtete absolute Häufigkeiten e i = n p i, erwartete absolute Häufigkeiten Entscheidung: H 0 wird abgelehnt falls Die Quantile der χ - Verteilung findet man in Tabelle 4, Seite 3

Beispiel 6-13 Handelsvertreter besucht täglich Kunden Abschlüsse 0 1 > Tage 30 34 1 5 Teste ob Kunden unabhängig voneinander mit p=0.05 ein Geschäft mit dem Vertreter abschließen (α = 0.01) Anzahl der täglichen Abschlüsse unter H 0 binomialverteilt mit n= und p=0.05 Erwartete Tage mit k Abschlüssen: 90 P(X=k)

Beispiel 6-13 Fortsetzung Abschlüsse 0 1 > Tage 30 34 1 5 Unter H 0 erwartet 3. 33.9 17.0 6.8 Teststatistik:. 3. + 0.1 33.9 + 4 17.0 + 1.8 6.8 = 1.6 Aus Tabelle 4 entnimmt man H 0 kann nicht verworfen werden.

Test auf Gleichheit von Varianzen Die Verteilung des Quotienten zweier χ verteilter Zufallsgrößen heißt F-Verteilung Betrachte H 0 : Die Verteilungen zweier unabhängige Stichproben der Größe n 1 und n haben gleiche Varianz T = s s 1 ist F-verteilt H 0 : σ 1 = σ, H 1 : σ 1 σ H 0 wird beibehalten falls

Quantile der F-Verteilung Für n, m 1 und 0 < γ < 1 gilt Beachte die vertauschte Reihenfolge der Freiheitsgrade!