Experimentelle Methoden der Teilchenphysik Sommersemester 2011/2012 Albert-Ludwigs-Universität Freiburg

Ähnliche Dokumente
Statistische Methoden der Datenanalyse Wintersemester 2012/2013 Albert-Ludwigs-Universität Freiburg

Statistische Methoden der Datenanalyse Wintersemester 2012/2013 Albert-Ludwigs-Universität Freiburg

73 Hypothesentests Motivation Parametertest am Beispiel eines Münzexperiments

3 Grundlagen statistischer Tests (Kap. 8 IS)

Einführung in die Induktive Statistik: Testen von Hypothesen

Statistische Tests Übersicht

Online-Aufgaben Statistik (BIOL, CHAB) Auswertung und Lösung

Hypothesen: Fehler 1. und 2. Art, Power eines statistischen Tests

Statistische Tests. Kapitel Grundbegriffe. Wir betrachten wieder ein parametrisches Modell {P θ : θ Θ} und eine zugehörige Zufallsstichprobe

Einführung in die statistische Testtheorie

Statistisches Testen

2. Formulieren von Hypothesen. Nullhypothese: H 0 : µ = 0 Gerät exakt geeicht

2 Wiederholung statistischer Grundlagen Schließende Statistik empirischen Information aus Stichprobenrealisation x von X

Kapitel 3 Schließende Statistik

Auswertung und Lösung

Allgemeines zu Tests. Statistische Hypothesentests

Fit for Abi & Study Stochastik

4.1 Stichproben, Verteilungen und Schätzwerte. N(t) = N 0 e λt, (4.1)

Schließende Statistik: Hypothesentests (Forts.)

Auswertung und Lösung

4.1. Nullhypothese, Gegenhypothese und Entscheidung

Statistik II. Statistische Tests. Statistik II

STATISTIK Teil 2 Wahrscheinlichkeitsrechnung und schließende Statistik

Statistik II für Betriebswirte Vorlesung 1

Statistiktutorium (Kurs Frau Jacobsen)

9 Prinzipien der statistischen Hypothesenprüfung

Wichtige Definitionen und Aussagen

Hypothesentests für Erwartungswert und Median. Statistik (Biol./Pharm./HST) FS 2015

Kapitel III: Einführung in die schließende Statistik

Entscheidung zwischen zwei Möglichkeiten auf der Basis unsicherer (zufälliger) Daten

Statistische Tests (Signifikanztests)

Kapitel 13. Grundbegriffe statistischer Tests

Statistik II. IV. Hypothesentests. Martin Huber

Aufgabenblock 4. Da Körpergröße normalverteilt ist, erhalten wir aus der Tabelle der t-verteilung bei df = 19 und α = 0.05 den Wert t 19,97.

Statistische Tests für unbekannte Parameter

Vorlesung: Statistik II für Wirtschaftswissenschaft

Statistische Tests für unbekannte Parameter

3. Das Prüfen von Hypothesen. Hypothese?! Stichprobe Signifikanztests in der Wirtschaft

Die Familie der χ 2 (n)-verteilungen

Zweiseitiger Test für den unbekannten Mittelwert µ einer Normalverteilung bei unbekannter Varianz

7. Hypothesentests. Ausgangssituation erneut: ZV X repräsentiere einen Zufallsvorgang. X habe die unbekannte VF F X (x)

Klassifikation von Signifikanztests

Wahrscheinlichkeitsrechnung und Statistik

WAHRSCHEINLICHKEITSRECHNUNG

Kapitel 3 Schließende Statistik

Tests für Erwartungswert & Median

Beurteilende Statistik

Überblick Hypothesentests bei Binomialverteilungen (Ac)

Kapitel XIII - p-wert und Beziehung zwischen Tests und Konfidenzintervallen

Forschungsstatistik I

9 Prinzipien der statistischen Hypothesenprüfung

Auswertung und Lösung

Zusammenfassung PVK Statistik

Einführung in Quantitative Methoden

5. Seminar Statistik

2.4 Hypothesentests Grundprinzipien statistischer Hypothesentests. Hypothese:

VL 13a: Testen von Hypothesen

Statistik. Sommersemester Prof. Dr. Stefan Etschberger HSA. für Betriebswirtschaft und International Management

Güteanalyse. Nochmal zur Erinnerung: Hypothesentest. Binominalverteilung für n=20 und p=0,5. Münzwurf-Beispiel genauer

Probeklausur zu Mathematik 3 für Informatik Lösungshinweise (ohne Garantie auf Fehlefreiheit)

Jost Reinecke. 7. Juni 2005

Die Abfüllmenge ist gleich dem Sollwert 3 [Deziliter].

GRUNDPRINZIPIEN statistischen Testens

Schriftliche Prüfung (90 Minuten)

Testen von Hypothesen:

Statistik Testverfahren. Heinz Holling Günther Gediga. Bachelorstudium Psychologie. hogrefe.de

Hypothesen über die Grundgesamtheit. Aufgabenstellung der Testtheorie Hypothesen (Annahmen, Vermutungen oder

VL 08: Testen von Hypothesen

Grundgesamtheit, Merkmale, Stichprobe. Eigenschaften der Stichprobe. Klasseneinteilung, Histogramm. Arithmetisches Mittel, empirische Varianz

Statistics, Data Analysis, and Simulation SS 2017

Prof. Dr. Walter F. Tichy Dr. Matthias Müller Sommersemester 2006

Wiederholung Hypothesentests Zusammenfassung. Hypothesentests. Statistik I. Sommersemester Statistik I Hypothesentests I (1/36)

Stochastik (BSc D-MAVT / BSc D-MATH / BSc D-MATL)

Konfidenzintervalle Grundlegendes Prinzip Erwartungswert Bekannte Varianz Unbekannte Varianz Anteilswert Differenzen von Erwartungswert Anteilswert

Konkretes Durchführen einer Inferenzstatistik

Computergestützte Datenanalyse in der Kern- und Teilchenphysik

Mathematik für Biologen

8. Konfidenzintervalle und Hypothesentests

1. Einführung in die induktive Statistik

Lösungen zum Aufgabenblatt 14

Zufallsvariablen. Diskret. Stetig. Verteilung der Stichprobenkennzahlen. Binomial Hypergeometrisch Poisson. Normal Lognormal Exponential

Klassifikation von Signifikanztests

4.1. Verteilungsannahmen des Fehlers. 4. Statistik im multiplen Regressionsmodell Verteilungsannahmen des Fehlers

a) Man bestimme ein 95%-Konfidenzintervall für den Anteil der Wahlberechtigten, die gegen die Einführung dieses generellen

Hypothesentests für Erwartungswert und Median. für D-UWIS, D-ERDW, D-USYS und D-HEST SS15

Statistik II. IV. Hypothesentests. Martin Huber

Wahrscheinlichkeit und Statistik BSc D-INFK

4.2 Methoden um Tests zu finden: Likelihood Quotienten Tests (LRT) Falls X 1,..., X n iid aus f(x θ), so gilt für die Likelihood Funktion

THEMA: "STATISTIK IN DER PRAXIS TESTEN IST BESSER ALS VERMUTEN" TORSTEN SCHOLZ

Zweiseitiger Binomialtest. für D-UWIS, D-ERDW, D-USYS und D-HEST SS15

Statistische Methoden der Datenanalyse Wintersemester 2012/2013 Albert-Ludwigs-Universität Freiburg

Einführung in die statistische Testtheorie II

KATA LOGO Mathematik Statistik Roadmap: Von der Hypothese zum p-wert

Tutorial: Anpassungstest

Trim Size: 176mm x 240mm Lipow ftoc.tex V1 - March 9, :34 P.M. Page 11. Über die Übersetzerin 9. Einleitung 19

Bereiche der Statistik

DWT 2.1 Maximum-Likelihood-Prinzip zur Konstruktion von Schätzvariablen 330/467 Ernst W. Mayr

Aufgabe 1 (8= Punkte) 13 Studenten haben die folgenden Noten (ganze Zahl) in der Statistikklausur erhalten:

Auswertung von Messungen Teil II

Transkript:

Experimentelle Methoden der Teilchenphysik Sommersemester 2011/2012 Albert-Ludwigs-Universität Freiburg Prof. Markus Schumacher Physikalisches Institut, Westbau, 2. OG Raum 008 Telefon 07621 203 7612 E-Mail: Markus.Schumacher@physik.uni-freiburg.de Kapitel 15: Hypothesentests http://terascale.physik.uni-freiburg.de/lehre/sommersemester%202012

Statistische Hypothesentests: Einführung Ziel: Vergleich der Beobachtung bzw. Auswertung der Messdaten einer Stichprobe mit Hypothesen à Entscheidung welche Hypothese bevorzugt wird, welche Hypothesen verworfen oder behalten werden a) Vergleich mit Theorie - Gauss-WDF + Annahme über Mittelwert, Varianz - Güte der Anpassung von Parametern - Hinweis auf neues Phänomen b) Vergleich von zwei Stichproben - Mittelwert, Varianz - Form der Verteilung (selbe Grundgesamtheit) c) Unterscheidung von Hypothesen - Exponential- oder Gauss-WDF - linearer oder quadratischer Zusammenhang zwischen Messpaaren - Diskriminierung von Ereignisklassen (Signal oder Untergrund), Spam-Mail oder gute Mail, Teilchensorten: e, µ, π, γ.)

Statistische Hypothesentests: Einführung Methode: - Konstruktion einer Größe zur Quantifzierung der Übereinstimmung/ Diskrepanz mit Hypothesen à Testatistik t - Quantifizierung der Übereinstimmung mittels Wahrscheinlichkeitsdichtefunktion f(t) für Teststatistik - Entscheidung über Verwerfung der Hypothese oder Auswahl unter Alternativhypothesen 3

Grundbegriffe für statistische Tests: Hypothesen Hypothese(n): klare Aussage(n), die man falsifizieren bzw. unterscheiden kann Fall (a): eine alllgemein anerkannte Hypothese, die falsifiziert werden soll à Nullhypothese H 0 Beispiele: - Lebensdauer des Teilchens ist τ - kein Anzeichen für neue Physik - Theorie und Stichprobe ( 2 Stichroben) stimmen überein in Mittelwert oder Form der Verteilung Bem.: oft Aussage (Nullhypothese) = Negation der Aussage, die einen interessiert Bsp.: Suche nach neuem Teilchen à H 0 : nur Untergrund Lebensdauer τ τ 0 à H 0 : τ=τ 0

Grundbegriffe für statistische Tests: Hypothesen Fall (b): mehrere Hypothesen, zwischen denen Unterschieden werden soll Standardannahme, Nullhypothese: H 0 Alternativhypothesen: H 1,H 2,H 3, Beispiele: Lebensdauer H 0 : τ = 2s H 1 : τ = 1s H 2 : τ > 2s Higgssuche: H 0 : nur Untergrund H 1 :Signal+Untergrund Signatur im Detektor von: H 0 = Pion, H 1 = Myon, H 3 =Elektron Arten von Hypothesen: x sei ZV und f(x;λ) Wahrscheinlichkeitsdichtefunktion - einfach: wenn f(x) durch Hypothese vollständig fixiert entweder kein Parameter oder Parameter λ festgelegt - zusammengesetzt: wenn mindestens einer der Parameter nicht bekannt ist f(x;λ) mit λ unbekannt oder λ aus Intervall [a,b] WDF für Hypothesen werden mit f(x H 0 ) und f(x H 1 ) bezeichnet

Grundbegriffe für statistische Tests: Teststatistik Teststatistik t(x 1, x n ): Funktion der Stichprobenwerte (x 1,..,x n ) zur Quantifzierung der Übereinstimmung mit Hypothesen H i mit Ziel - Verwerfung von H 0 (H 1 ) - Unterscheidung von H 0, H 1, H 2 t(x 1,..x n ) kann Vektor sein z.b. t i = x i (nicht sehr nützlich) Ziel: Reduzierung der Dimension von t auf skalare Größe t unter optimaler Ausnutzung der Information in Stichprobe (x i ) bzgl. der Hypothesen H i Aufgaben: a) Definition/Auswahl von Teststatistik t b) Bestimmung der WDFs für t unter den Hypothesen f(t H i ) c) Festlegung eines Kriteriums für Verwerfung/Unterscheidung der Hypothesen

Grundbegriffe für stat. Tests: Entscheidungsgrenze Entscheidungsgrenze t cut oder t krit Anname: wir können die WDFs für die Testatistik unter beiden Hypothesen ausrechnen Festlegung der Entscheidungsgrenze (krtischer Wert) t krit oder t cut kritische Region/Verwerfungregion: t>t krit Verwerfung von H 0, Nicht-Verwerfung (Akzeptanz) von H 1 Komplement zu kritischer Region/Akzeptanzregion: t<t krit keine Verwerfung von H 0, Verwerfung von H 1

Grundbegriffe: Signifikanzniveau Abb.4.4(b)).DerTest kritische Region Ω k d zu verwerfen, we Akzeptanzregion. Signifikanzniveau Ω Ω k u liegen ) g(t H 0 0.3 0.2 0.1 Nullhypothese H 0 Akzeptanzregion t k kritische Region H 0 akzeptieren H 0 verwerfen Fehler erster Art α : Signifikanzniveau (a) α = Ω k g( t H 0 )d t. α = t k g(t H 0 )dt. ullhypothese fälschliche 0 0 5 10 15 20 t α: Signifikanzniveau, Fehler erster Art ist Wahrscheinlichkeit H 0 zu verwerfen, obwohl die Hypothese war ist Bemerkung: α (=5%,10%,1%, 2.85x10-7 ) vor Experiment festlegen, wenn H 0 verworfen/getestet werden soll α ist keine Zufallsvariable sondern ein festgelegter Wert

Definition der Kritischen Region Aber im allgmeinen gibt es unendliche viele Möglichkeiten kritische Regionen zu wählen, die alle das gleiches Signifinkanzniveau α besitzen. Also muss die Wahl der kritischen Region für die Nullhypothese H 0 die Alternativhypothese H 1 berücksichtigen. Ungefähr ausgedrückt heisst das Kriterium: wähle die kritische Region so, dass es eine kleine Wkt gibt dort eine Messung zu finden, wenn H 0 wahr ist, aber eine große, wenn H 1 ist wahr ist.

Abb.4.4(b)).DerTest kritische Region Ω k d zu verwerfen, we Akzeptanzregion. Signifikanzniveau β = β = Grundbegriffe: Mächtigkeit Ω Ω k u liegen Ω Ω k g( t H 1 )d t. tk g(t H 1 )dt. β: Fehler zweiter Art 1-β: Mächtigkeit des Tests 0 0 5 10 15 20 β ist Wkt H 1 zu verwerfen obwohl die Hypothese war ist 1-β ist Wkt. H 1 zu akzeptieren, wenn Hypothese war ist Zie: α,β minimieren (ideal = 0) und 1-β maximieren (ideal=1) nicht gleichzeitig möglich à Kompromiss Wahl der besten kritischen Region/Teststatistik für gegebenes α ) g(t H 1 0.3 0.2 0.1 alternative Hypothese H 1 Akzeptanzregion H 0 akzeptieren Fehler zweiter Art β t k kritische Region H 0 verwerfen (b) t

Ein- und zweiseitige Tests Je nach Problem sind Abweichungen in beide Richtungen interessant à dann zweiseitiger Test z.b. Toleranzen in der industriellen Produktion verteile das Signifikanzniveau i.a. zur Hälfte auf Ausläufer nach oben u. unten

Eigenschaften von Hypothesentests Gegeben Nullhypothese H 0 und Signifkanzniveau α a) bester Test bzgl. Alternativhpothese H 1 maximale Mächtigkeit 1-ß unter H 1 b) gleichmäßig bester Test maximale Mächtigkeit 1-ß unter allen Alternativhypothesen c) unverzerrter Test Mächtigkeit 1-ß > α für alle Alternativhpothesen

Illustratives Beispiel Test der Hypothese, dass eine Gauss-WDF mit bekannter Varianz σ 2 den Mittelwert λ=λ 0 hat. Stichprobe vom Umfang n (für Illustration =2): x 1,x 2, Teststatistik: arithmetischer Mittelwert folgt Gauss-Verteilung mit Mittelwert λ und Varianz σ 2 /n Wahl von vier kritischen Regionen mit gleichem Signifikanzniveau α

Illustratives Beispiel Reihen: 4 verschiedene kritische Regionen linke Spalte: kritische Regionen für n=2 im Stichprobenraum mittlere Spalten: WDFs für Teststatistik für H 0 und H 1 + kritische Regionen rechte Spalte: Mächtigkeit für n=2 und n=10

Illustratives Beispiel U1 ist unverzerrter Test U2: mächtiger für λ 1 >λ 0 U3: mächtiger für λ 1 <λ 0 U4: kein guter Test maximale Mächtigkeit für λ 1 =λ 0 keiner von U1 bis U3 ist ein gleichmäßig bester Test

Grundlegende Begriffe: P-Werte P-Wert: Wahrscheinlichkeit eine Stichprobe zu beobachten, die genauso verträglich oder weniger verträglich mit der Nullhypothese wie die aktuelle Messung/Beobachtung g(t H 0 ) 0.5 (a) g(t H 0 ) 0.4 (b) 0.4 0.3 0.3 0.2 P-Wert 0.2 P-Wert 0.1 0.1 0 0 2 4 6 8 10 t Messung t 0-4 -2 0 2 4 -tmessung tmessung t t=0 für perfekte Übereinstimmung zwischen Daten und H 0 links: einseitiger P-Wert rechts: zweiseitiger P-Wert

Grundlegende Begriffe: Bemerkungen zum P-Wert P-Wert ist Zufallsvariable (vgl.: Signifkanzniveau α vor Messung fixiert) Wenn P-Wert = Signifkanzniveau α, dann gilt t Messung = t kritisch P-Wert auch beobachtetes Signifkanzniveau genannt 1-P-Wert = Vetrauensniveau des Tests ( confidence level ) P-Wert = 5% dann ausgeschlossen mit 95% Vetrauensniveau wenn P-Wert < Signifkanzniveau α, dann Hypothese H 0 verwerfen Achtung vor Fehlinterpretationen: P-Wert ist nicht Wkt., dass H 0 falsch ist 1-P-Wert ist nicht Wkt, dass H 0 wahr ist

Ein einfaches Beispiel Bewertung der Fairness eines Würfels Stichprobe aus n Münzwürfen n K = Anzahl des Auftretens von Kopf n Z =n-n K = Anzahl des Auftretens von Zahl H 0 : Münze ist fair, d.h. p K =0,5 p Z = 0,5 Signifkanzniveau auf α = 5% fixiert Teststatistik: t = n K folgt einer Binomialverteilung Annahme: n=20 (fix), Beobachtung n K =17 E[n K ] = 10 zweiseitiger P-Wert = Σ 0 3 f Bin (n K ;20) + Σ 17 20 f Bin (n K ;20) = 0.26% à Nullhypothese fairer Würfel verwerfen Achtung: Sei ZV n Versuche bis 3x Zahl und 3 x Kopf erscheint. n Versuche = 20 P H0 =0.072% optional stopping -Problem