Analyse 2: Hypothesentests Ashkan Taassob Andreas Reisch
Inhalt Motivation Statistischer Hintergrund Hypothese Nullhypothesen Alternativhypothesen Fehler beim Hypothesentesten Signifikanz-LEVEL und P-value Statistik Test Theorie t-test F-Test Chi-squre-Test ANOVA (Analysis of variance) Wilcoxon-Vorzeichen-Rang-Test Zusammenfassung 2
Motivation Idee Operation Preparation Definition Experiment design Execution Data validation Planing Experiment definition Context selection Hypthesis.. Variables selection Experiment data Experiment report Selection.. Experiment desing Instrumentation Analysis & Interpretation Descriptive statistics Data set reduction Präsentation & package Validy evaluation Hypthesis testing Conclusion 3
Motivation Vermutung: Je länger ein Fehler in einer Software unentdeckt bleibt, desto aufwändiger ist dessen Beseitigung. H 0 : Die Zeit, die ein Fehler unentdeckt bleibt ist unabhängig von dem Aufwand, diesen Fehler zu beseitigen. H 1 : Zwischen der Endeckzeit und dem Aufwand besteht ein Zusammenhang 4
Statistischer Hintergrund Hypothese Unter Hypothese versteht man in der statistik eine anhand Stichproben zu prüfende Annhame. Nullhypothese: Es gibt keine Mittelwertsunterschied, BZW keine Zusammenhänge in der Population. Bezeichnet als H 0 Alternativhypothese: Es existiert ein Unterschied oder ein Zusammenhang in der Population. Bezeichnet als H 1 5
Statistischer Hintergrund Fehler beim Hypothesentests Fehler Typ I: Ablehnung der richtigen Nullhypothese bei gültiger Nullhypothese. P( Ablehnung H 0 H 0 ist richtig)= α Fehler Typ II: Beibehaltung der falschen Nullhypothese beo gültiger Alternativhypothese P( nicht Ablehnung H 0 H 0 ist falsch)= β Teststärke: Die Wahrscheinlichkeit, dass ein in der Population vorhandener unterschied bei statistischer Testung entdeckt wird brechnet als 1-β 6
Statistischer Hintergrund 7
Statistischer Hintergrund Signifikanz-Niveau P-value Es steht in enger Beziehung mit Signifikanzniveau. Wenn p-value kleiner als Signifikanzniveau ist, lehnnen wir H 0 ab. 8
Statistischer Hintergrund Statistik Funktion, die einer Stichprobe einen Wert zuordnet. Beispiel: t n 1 = x µ s Der Freiheitsgrad(df) beschreibt die Anzahl der frei wählbaren Werte, welche in die Brechnung eines statistischen Kennwerts eingehen. n 9
Statistischer Hintergrund Histogram 6 Frequency 4 2 0 1,54 2,46 3,38 More Bin Frequency 10
Statistischer Hintergrund Normal Probability Plot 4 3 Y 2 1 0 0 20 40 60 80 100 Sample Percentile 11
Überblick über parametrik und nicht parametrik tests Design parametric Non parametric One factor, one treatment One factor, two treatment, compeletly randomized design One factor, two treatments, paired comparison One factor, more than two treatments t-test F-test Paired t-test ANOVA Chi-sqaure Binomialtest Mann-whitney Chi-square Wilcoxon Sign-test Kruskal wallis Chi-square 12
t-test Vorraussetzungen Stichproben sind normalverteilt, unabhängig und haben gleiche Varianz H 0 µ t0 = x =µ y Ewartete Mittelwerte sind gleich s p x y 1 1 + n m Rechnenweg x y t 0 =,sp = 1 1 sp + m n (n 1)s + (m 1)s 2 2 x y m+ n 2 Kriterium H 0 : µ x =µ y wird abgelehnt, wenn t 0 > t α/2,n+m-2 13
t-test für f r gepaarte Stichproben Vorraussetzungen Stichproben sind normalverteilt H 0 µ d =0,d i =x i -y i Ewartete Mittelwert ist in differenz gleich null Rechnenweg d t 0 =,sd = s / n d n 2 (di d) i= 1 n 1 Kriterium H 0 : µ d =0 wird ablgelehnet, wenn t 0 > t α/2,n-1 14
F-Test Vorraussetzungen Stichproben sind normalverteilt und unabhängig H 0 σ 2 x=σ 2 y varianzen sind gleich Rechnenweg F 0 =S 2 x / S 2 y Kriterium H 0 : σ 1 x=σ 2 y wird abgelehnt, wenn F 0 >F α/2,n-1,m-1 15
Chi-square mit K unbahängige ngige Stichproben(Gruppen) Vorraussetz ungen H 0 Nicht parametrische Daten Homogenität des Materials Rechnenweg r k 2 (n E ) R C 2 X =,E ij = E N i= 1 j= 1 ij ij ij i j In diese Tabelle n ij zeigt die Häufigkeit der variable i in der Gruppe j,c i zeigt die Summe der Häufigkeit der Gruppe i und R i zeigt die Summe von Variable i. Kriterium H 0 wird abgelehnt, wenn X 2 >X 2 α,f, Wobei f=df=(r-1)(k-1), r ist die Anzahl der Variables und k ist die Anzahl der Gruppen 16
ANOVA Vorraussetzungen H 0 Rechnenweg Stichproben sind normalverteilt,unabhängig µ x1 =µ x2 =...=µ xa Ewartete Mittelwerte sind gleich n a i x S S x.. 2 T = å å ij -, i= 1 j= 1 N a x 2 x 2 S S i... Treatm ent = å - i= 1 n i N SS Error =SS T -SS Treatment, MS Traetment = SS Treatment /(a-1), MS Error =SS Error / (N-a), F0=MS Treatment /MS Error Kriterium H 0 wird abgelehnt, wenn F 0 >F α/2,a-1,n-a 17
Wilcoxon-Vorzeichen Vorzeichen-Rang-Test Vorraussetzungen Die beiden Populationen sollen stetig verteilumgen von gleicher Form haben H 0 T + =T -, wobei T + ist die Summe der Ränge aller Veränderungen mit positivem Vorzeichen und T - die Summe der Ränge aller Veränderungen mit negativen Vorzeichen Rechnenweg Kriterium H0 wird abgelehnt, wenn T=min(T +,T - ) kleiner als den Wert aus Wicoxon s Tabelle 18
Zusammenfassung t-test handelt sich um mehrere verfahren zur Prüfung von Mittelwertsdifferenzen. F-Test kann zur Prüfung der Varianzhomogenität benutzt werden. Bei der Prüfung der Vereinbarkeit von Mittelwerten aus unabhängigen Stichproben muss zunächst mit einem F-Test entschieden werden. Chi-square test handelt es sich um eine Verfahrenklasse zur Auswertung von Nominaldaten. Wilcoxon-vorzeichen-Rang-Test berücksichtigt neben der Richtung des Unterschieds auch noch die größe des Unterschieds bei einer ordinalskalierten Variablen. 19