Statistik - Fehlerrechnung - Auswertung von Messungen

Ähnliche Dokumente

Statistische Thermodynamik I Lösungen zur Serie 1

Statistik - Fehlerrechnung - Auswertung von Messungen

Füllmenge. Füllmenge. Füllmenge. Füllmenge. Mean = 500,0029 Std. Dev. = 3,96016 N = ,00 490,00 495,00 500,00 505,00 510,00 515,00 Füllmenge

, dt. $+ f(x) = , - + < x < +, " > 0. " 2# Für die zugehörige Verteilungsfunktion F(x) ergibt sich dann: F(x) =

Zählstatistik. Peter Appel. 31. Januar 2005

9. Schätzen und Testen bei unbekannter Varianz

$ % + 0 sonst. " p für X =1 $

Würfelt man dabei je genau 10 - mal eine 1, 2, 3, 4, 5 und 6, so beträgt die Anzahl. der verschiedenen Reihenfolgen, in denen man dies tun kann, 60!.

Motivation. Jede Messung ist mit einem sogenannten Fehler behaftet, d.h. einer Messungenauigkeit

RUPRECHTS-KARLS-UNIVERSITÄT HEIDELBERG

Statistik, Datenanalyse und Simulation

q = 1 p = k k k = 0, 1,..., = [ ] = 0.678

Anpassungsrechnungen mit kleinsten Quadraten und Maximum Likelihood

Kapitel 3. Zufallsvariable. Wahrscheinlichkeitsfunktion, Dichte und Verteilungsfunktion. Erwartungswert, Varianz und Standardabweichung

Bei vielen Zufallsexperimenten interessiert man sich lediglich für das Eintreten bzw. das Nichteintreten eines bestimmten Ereignisses.

Protokoll Grundpraktikum I: F7 Statistik und Radioaktivität

Anleitung zum Physikpraktikum für Oberstufenlehrpersonen Fehlerrechnung und Statistik (FR) Herbstsemester 2015

i x k k=1 i u i x i v i 1 0, ,08 2 0, ,18 3 0, ,36 4 0, ,60 5 1, ,00 2,22 G = n 2 n i=1

R ist freie Software und kann von der Website.

8.6.1 Erwartungswert eines beliebigen Operators O Beispiel: Erwartungswert des Impulses eines freien Teilchens

Box-and-Whisker Plot -0,2 0,8 1,8 2,8 3,8 4,8

Statistische Methoden der Datenanalyse

Ausarbeitung des Seminarvortrags zum Thema

6. Bayes-Klassifikation. (Schukat-Talamazzini 2002)

Theoretische Grundlagen der Informatik WS 09/10

Gibt es einen Geschmacksunterschied zwischen Coca Cola und Cola Zero?

Grundlagen der Inferenzstatistik: Was Ihnen nicht erspart bleibt!

Planen mit mathematischen Modellen 00844: Computergestützte Optimierung. Autor: Dr. Heinz Peter Reidmacher

Grundlagen der Inferenzstatistik

B 2. " Zeigen Sie, dass die Wahrscheinlichkeit, dass eine Leiterplatte akzeptiert wird, 0,93 beträgt. (genauerer Wert: 0,933).!:!!

Güte von Tests. die Wahrscheinlichkeit für den Fehler 2. Art bei der Testentscheidung, nämlich. falsch ist. Darauf haben wir bereits im Kapitel über

13.5 Der zentrale Grenzwertsatz

Aufgaben zur Flächenberechnung mit der Integralrechung

Unterrichtsmaterialien in digitaler und in gedruckter Form. Auszug aus: Übungsbuch für den Grundkurs mit Tipps und Lösungen: Analysis

Einführung in die Geostatistik (7) Fred Hattermann (Vorlesung), Michael Roers (Übung),

7 Rechnen mit Polynomen

Regelmäßigkeit (Erkennen von Mustern und Zusammenhängen) versus Zufall

Physik 4, Übung 8, Prof. Förster

Profil A 49,3 48,2 50,7 50,9 49,8 48,7 49,6 50,1 Profil B 51,8 49,6 53,2 51,1 51,1 53,4 50, ,5 51,7 48,8

Stochastische Eingangsprüfung,

Willkommen zur Vorlesung Statistik

1.1 Auflösungsvermögen von Spektralapparaten

geben. Die Wahrscheinlichkeit von 100% ist hier demnach nur der Gehen wir einmal davon aus, dass die von uns angenommenen

Physik im Studium. Physik I - IV. Theoretische Vorlesungen. Praktika. Vorlesungen für Fortgeschrittene. Praktika für Fortgeschrittene

Messgeräte: Mess-System-Analyse und Messmittelfähigkeit

Statistik I für Betriebswirte Vorlesung 5

Entladen und Aufladen eines Kondensators über einen ohmschen Widerstand

Kurzeinführung LABTALK

2. Deskriptive Statistik 2.1. Häufigkeitstabellen, Histogramme, empirische Verteilungsfunktionen

Anerkannte, gleiche und reproduzierbare Größen sind (auch außerhalb der Physik) notwendig: Handel, Grundbesitz, Navigation, Dosierung...!

Übungsrunde 7, Gruppe 2 LVA , Übungsrunde 7, Gruppe 2, Markus Nemetz, markus.nemetz@tuwien.ac.at, TU Wien, 11/2006

Analyse extremer Ereignisse unter dem Einfluss von Langzeitkorrelationen

Forschungsstatistik I

Melanie Kaspar, Prof. Dr. B. Grabowski 1

Statistische Methoden der Datenanalyse

Klausur Nr. 1. Wahrscheinlichkeitsrechnung. Keine Hilfsmittel gestattet, bitte alle Lösungen auf dieses Blatt.

Statistik II für Betriebswirte Vorlesung 2

Ein möglicher Unterrichtsgang

Abituraufgabe zur Stochastik, Hessen 2009, Grundkurs (TR)

Data Mining: Einige Grundlagen aus der Stochastik

Schleswig-Holstein Kernfach Mathematik

15.3 Bedingte Wahrscheinlichkeit und Unabhängigkeit

Professionelle Seminare im Bereich MS-Office

Statistik I für Betriebswirte Vorlesung 11

Klausur zur Vorlesung Multivariate Verfahren, SS Kreditpunkte, 90 min

Von den Grundlagen der Monte-Carlo-Methode zur Simulation von Teilchenreaktionen und Teilchendetektoren

Universität Bonn 28. Juli 2010 Fachbereich Rechts- und Wirtschaftswissenschaften Statistische Abteilung Prof. Dr. A. Kneip. KLAUSUR Statistik B

Angewandte Statistik und Datenanalyse

Statistische Auswertung:

Mathematischer Vorbereitungskurs für Ökonomen

Beispiel Zusammengesetzte Zufallsvariablen

Fotios Filis. Monte-Carlo-Simulation

Datenanalyse mit Python. Dr. Wolfram Schroers <Wolfram.Schroers - at - Field-theory.org>

1. Man schreibe die folgenden Aussagen jeweils in einen normalen Satz um. Zum Beispiel kann man die Aussage:

Arbeit Leistung Energie

Weiterbildungskurs Stochastik

Mechanismus Design Auktionen

Kugel-Fächer-Modell. 1fach. 3fach. Für die Einzelkugel gibt es 3 Möglichkeiten. 6fach. 3! Möglichkeiten

Statistik mit Excel. für Praktiker: Statistiken aufbereiten und präsentieren HORST-DIETER RADKE. Markt+Technik

5. Schließende Statistik Einführung

Statistik mit Excel. für Praktiker: Statistiken aufbereiten und präsentieren HORST-DIETER RADKE

1 Zwei Teilchen in einem Kastenpotenzial

Das Black-Scholes Marktmodell

Überblick über die Verfahren für Ordinaldaten

Zufallsgrößen und Wahrscheinlichkeitsverteilungen

Numerische Methoden und Algorithmen in der Physik

Bestimmung der Induktivität einer Spule durch Messung der Resonanzfrequenz in einem Parallelschwingkreis Versuchsprotokoll

Modulabschlussklausur Analysis II

QM: Prüfen -1- KN

Anhand des bereits hergeleiteten Models erstellen wir nun mit der Formel

Institut für Computational Engineering ICE. N ä h e r d ra n a m S ys t e m d e r Te c h n i k d e r Z u ku n f t. w w w. n t b.

Einführung in Statistik und Messwertanalyse für Physiker

90-minütige Klausur Statistik für Studierende der Kommunikationswissenschaft

Häufigkeitstabellen. Balken- oder Kreisdiagramme. kritischer Wert für χ2-test. Kontingenztafeln

Der monatliche Tarif für ein Handy wurde als lineare Funktion der Form f(x) = k x + d modelliert (siehe Grafik).

Tangentengleichung. Wie lautet die Geradengleichung für die Tangente, y T =? Antwort:

Numerische Verfahren und Grundlagen der Analysis

Transkript:

2013-11-13 Statistik - Fehlerrechnung - Auswertung von Messungen TEIL I Vorbereitungskurs F-Praktikum B (Physik), RWTH Aachen Thomas Hebbeker Literatur Eindimensionaler Fall: Grundbegriffe Wahrscheinlichkeitsverteilungen: Gauß Poisson Binomial χ 2 Parameterbestimmung (Fit): Maximum-Likelihood χ 2

Literatur Lehrbücher Roger J. Barlow, Statistics: A Guide to the Use of Statistical Methods in the Physical Sciences, Wiley, 1989 Louis Lyons, Statistics for Nuclear and Particle Physics, Cambridge University Press, 1986 Glen Cowan, Statistical Data Analysis, Clarendon Press, 1998 Volker Blobel und Erich Lohrmann, Statistische und numerische Methoden der Datenanalyse, Teubner, 1998 Martin Erdmann und Thomas Hebbeker, Experimentalphysik 5 - Moderne Methoden der Datenanalyse, Springer Spektrum, 2013 Vorlesungsskripten Wes Metzger: http://www.hef.ru.nl/~wes/stat_course/statist_2002.pdf Glen Cowan: www.pp.rhul.ac.uk/~cowan/stat_course.html Kurzreferenz Particle Physics Booklet, pdg.lbl.gov/

Aufgabenstellungen Wahrscheinlichkeitsrechnung (= Theorie) Wahrscheinlichkeitsdichte analytisch als Funktion von (physikalischen) Parametern gegeben Verteilungen berechenbar Beispiel: f(t τ ) = N(τ ) e t/τ t 0 Statistik (= Experiment) Wahrscheinlichkeitsdichte näherungsweise durch Häufigkeitsverteilung von einzelnen Messresultaten gegeben Estimatoren für physikalische Parameter + statistische Fehler

Beispiel: [τ ] = (13.1 ± 0.7) s Fehlerfortpflanzung Gemessene Größen und Fehler Abgeleitete Größen und deren Fehler. Beispiel: [τ ] = (13.1 ± 0.7) s [T 1/2 ] = [τ ] ln 2 = (9.1 ± 0.5) s

Definitionen (eindimensional) THEORIE: Wahrscheinlichkeitsdichte (bzw. Wahrscheinlichkeitsverteilung) eines Messwertes (= Zufallsvariable): f(n) [diskret] bzw. f(x) [kontinuierlich] (f 0) Normierung: f(n) = 1 n f(x) dx = 1 Wahrscheinlichkeit: p(n 1 n n 2 ) = n 2 n 1 f(n) p(x 1 x x 2 ) = x2 x 1 f(x) dx f(n) bzw. f(x) können von Parametern abhängen!

Erwartungswert einer Funktion H(x): Bedeutung: Mittelwert von H. H(x) = H(x) f(x) dx z.b. Sonnenstrahlung(Wolkendichte) Spezialfälle: a) arithmetischer Mittelwert: µ x = x f(x) dx b) Varianz: σ 2 (x µ) 2 = (x µ) 2 f(x) dx = x 2 f(x) dx µ 2 f(x) dx = x 2 x 2 c) Standardabweichung: σ = σ 2 = x 2 x 2 Bedeutung: Maß für die Breite der Verteilung root mean square = r.m.s. = x 2

Beispiel: f(t) = 1 τ e t/τ µ = 1 τ t e t/τ dt =... = τ σ 2 = 1 τ (t τ ) 2 e t/τ dt =... = τ 2 Man beachte: a + b = a + b aber: a b = a b

EXPERIMENT: Aus N Messwerten berechnet man Estimatoren: [H(x)] = 1 N H(x i ) i Für große N: [H(x)] H(x) Speziell für Mittelwert und Varianz/Standardabweichung: x [x] = 1 N x i s 2 [(x µ) 2 ] = 1 N (x i µ) 2 i i Falls µ nicht bekannt: in Formel für s 2 ersetze µ x: s 2 = 1 N 1 (x i x) 2 Modifizierte Normierung (N 1): Estimator ungebiased. i

WARNUNG: Oft benutzt man doch den gleichen Buchstaben statt zwischen σ, s, s zu unterscheiden! Häufig x = σ x für den Fehler. a = [a] = a Immer auf Kontext achten!

Wichtige Wahrscheinlichkeitsverteilungen

Gauß-Verteilung (Normal-Verteilung) f(x µ, σ) = 1 2πσ e (x µ)2 /(2σ 2 ) Standard-Form (µ = 0, σ = 1): f(x) = 1 2π e x2 /2 kontinuierlich 1-dimensional (kann auf n Dim. verallgem. werden) 2 Parameter: Mittelwert = x = µ Varianz = (x µ) 2 = σ 2 Universelle Bedeutung wegen des Zentralen Grenzwertsatzes (s.u.)

Gauß-Fehler Viele Messgrößen streuen gaußisch um Erwartungswert (s.u.). Messgröße und Fehler: G ± G Normalerweise: Statistischer Fehler G = 1 Standardabweichung ±1 σ p = 68.27% Beispiel: Messresultat x = 24.3 ± 1.1 (gaußisch). Wahrscheinlichkeit, dass wahrer Wert µ im Intervall 24.3 ± 2.2? p 95%

Zentraler Grenzwertsatz Seien x i irgendwelche Zufallsvariablen mit IRGENDEINER Wahrscheinlichkeitsdichte g(x) (so dass Mittelwert = 0 und Varianz =1), dann ist die Zufallsvariable y N = 1 N N i x i GAUSS-verteilt (Mittelwert = 0 und Varianz =1) im Grenzfall N. Das bedeutet: Immer wenn sich ein Effekt aus vielen Einzeleffekten zusammensetzt, erhält man näherungsweise eine Gauß-Verteilung Illustration: g(x) = flach [ nächste Seite ] Beispiel aus der Teilchenphysik: Vielfachstreuung!

Illustration: Zentraler Grenzwertsatz (uniform verteilte Zufallszahlen)

Wichtige Anwendung (Begründung folgt): N Einzelmessungen Mittelwert und statistischer Fehler: x ± x x ± s N x ± σ N Mittelwert ist um wahren Wert gaußisch verteilt mit Standardabweichung x = s/ N σ/ N (auch für nicht gaußische Einzelverteilungen, wenn nur N groß) Nicht verwechseln: σ und x! Beispiel: N = 20 Einzelmessungen: x i = 3.4, 2.7, 2.9, 3.1, 2.7, 3.0, 3.5, 3.1, 2.8, 2.8, 3.1, 2.8, 2.2, 3.1, 3.2, 2.7, 2.5, 2.4, 2.8, 3.1 Form der Verteilung nicht (genau) bekannt. x = 2.90 s = 0.32 x = 0.07

Poisson-Verteilung diskret 1-dimensional 1 Parameter: f(n λ) = e λ λn n! Mittelwert = λ > 0 Varianz = λ Bedeutung: beschreibt die Verteilung der Zahl seltener und unabhängiger Ereignisse (in Zeit- oder Raumintervall). Beispiel aus dem Leben : Zahl der Verkehrsunfälle pro Tag und Stadt Beispiel aus der Kernphysik: Zahl der radioaktiven Zerfälle in einem 1 kg Uran-block in einer Sekunde Zusammenhang mit Gauß-Verteilung: Für λ Gauß-Verteilung mit µ = λ und σ = λ. Nur ein freier Paramter!

Illustration: Poisson-Verteilung

Quatsch! Poisson-Fehler Wichtig hier: Anwendung der gaußischen Näherung! Beispiel: kosmische Strahlung Auf Fläche von 0.5 m 2 werden n = 97 kosmische Myonen in Zeitraum von 1 s registriert. Bei n = 97 ist Poisson-Verteilung in guter Näherung gaußisch! Estimator für Mittelwert: x = 97 ± 97 = 97 ± 10 Beispiel: Boulevard-Zeitung Aufgrund... konnte die Zahl der Verkehrsunfälle in XYZ gegenüber dem Vorjahr um 11.6% gesenkt werden, nämlich von 43 auf 38. Gauß-Näherung: Differenz ist (43 ± 43) (38 ± 38) = 43 38 ± 43 + 38 = 5 ± 9 Varianzen addieren! (s. unten)

Binomial-Verteilung 0 n (= Erfolge) N f(n N, p) = ( N n ) p n (1 p) N n = N! n! (N n)! pn (1 p) N n diskret 1-dimensional (Verallgemeinerung: Multinomial) 2 Parameter: Wahrscheinlichkeit p für Erfolg und Zahl der Versuche N Mittelwert = Np Varianz = Np (1 p) Bedeutung: Wahrscheinlichkeitsverteilung bei genau zwei möglichen Ergebnissen (Erfolg oder nicht) Beispiel: Wahrscheinlichkeit, bei N maligem Würfeln n mal eine 6 zu erhalten. normalerweise p = 1/6 Hier Zusammenhang mit Poisson-Verteilung: Für p 0 (Np = const) Poisson-Vert. mit λ = Np Zusammenhang mit Gauß-Verteilung: Für N, p 0, 1 Gauß-Verteilung mit µ = Np und σ = Np(1 p)

Illustration: Binomial-Verteilung

Binomial-Fehler Beispiel: Ein Teilchendetektor weist von N = 11000 auftreffenden Teilchen n = 9600 nach. Verteilung: Binomial Estimator für Effizienz: ɛ = n N = 87.3% (= p) Standardabweichung (Zahl der Treffer) = Variationsbreite von n: Stat. Fehler der Effizienz: σ 2 = N ɛ (1 ɛ) ɛ = 1 N Nɛ(1 ɛ) = n N 1 ɛ = ɛ(1 ɛ) N = 0.3% Man beachte: - Bedingungen für Näherung durch eine Gaußverteilung erfüllt Fehler normalverteilt. - Fehler für ɛ und (1 ɛ) sind gleich groß!

χ 2 -Verteilung f(χ 2 N dof ) (χ 2 /2) N dof /2 1 e χ2 /2 x χ 2 kontinuierlich 1-dimensional 1 Parameter: Zahl der Freiheitsgrade N dof Mittelwert = N dof Varianz = 2N dof Zusammenhang mit Gauß-Zufallsvariablen: Sind x i Gauß-Zufallsvariable (µ = 0, σ = 1), dann ist χ 2 = N dof i x 2 i Zufallsvariable mit χ 2 -Verteilung für N dof Freiheitsgrade Wichtigste Anwendung: χ 2 -Fit, x i = (Messung i Theorie i )/Fehler i Zusammenhang mit Gauß-Verteilung: Für N dof : Gauß-Verteilung mit µ = N dof und σ = 2N dof

Illustration: χ 2 -Verteilung

Wichtige Wahrscheinlichkeitsverteilungen

Parameterbestimmung (1-dim.) Aufgabe: Theorie mit unbekanntem Parameter a Experiment } Estimator für a Beispiel: Radioaktiver Zerfall mit Lebensdauer τ = a. Methoden: Formel für Estimator (Beispiel: = Mittelwert Messdaten) Maximum-Likelihood-Fit: Maximiere Übereinstimmung Theorie(a) Experiment χ 2 -Fit: = Spezialfall (auch: Methode der kleinsten Quadrate )

Maximum-Likelihood-Fit-Methode, 1-dim. Bestimmung eines freien Parameters a aus Vergleich von N unabhäng. Messwerten x i mit Wahrscheinlichkeitsdichte f(x i a): Maximiere Likelihood f(x i a) bzw. minimiere Log-Likelihood i L(a) = 2 ln N f(x i a) = 2 N ln f(x i a) i=1 i=1 Estimator für a: L(a) = L min Fehler a +, a : L(a ± ) = L min + 1 Fehler im allgemeinen asymmetrisch! Nachteil: keine Information über Qualität des Fits = Anpassungrechnung VORSICHT: Größe des Fehlers sagt NICHTS über Fit-Qualität

Beispiel: Messung: N Ereignisanzahlen n i Theorie: Poisson-Verteilung Zu bestimmen: Parameter λ (= Mittelwert) der Poisson-Verteilung L(λ) = 2 i ln f(n i λ) = 2 i [ = 2 ln [ ] e λ λn i n i! Nλ + i n i ln λ ln n i! ] = 2Nλ 2 i n i ln λ + const Minimum: dl dλ = 0 2 N 2 i n i λ = 0 λ = 1 N n i = arithmetischer Mittelwert! i

Beispiel (konkreter Fall): Zahl der Geburten pro Tag in Stadt. Messung: N = 3 Tage: n 1 = 2, n 2 = 6, n 3 = 4 Minimum für Fehlerberechnung: λ = 1 N n i = 4.0 i L min = 2 n i 2 n i ln( 1 n i ) + const N i i i = 24 24 ln 4 + const = 9.271 + const 68%-Fehler aus 1 = L(λ) L min = 6λ 24 ln λ + 9.271 λ = 4.0 +1.3 1.1

χ 2 -Fit-Methode, unkorreliert, 1-dimensional N Messungen: x i, y i ± σ i (gaußisch) KEINE Korrelationen zwischen Messwerten Theorie: 1 freier Parameter a A-posteriori-Wahrscheinlichkeit: f(x i, y i a) = 1 2πσi e (y i t(x i a)) 2 /(2 σ 2 i ) Zu minimieren: L(a) χ 2 (a) = N i=1 (y i t(x i a)) 2 σ 2 i = ( ) 2 Messung Theorie(a) Fehler Estimator für a: Fehler von a: χ 2 (a) = χ 2 min χ 2 (a ± a) = χ 2 min + 1 Qualität des Fits: Falls gut: χ 2 min ist χ2 -verteilt (!) mit [χ 2 min ] = N dof = Zahl Messpunkte N minus Zahl Fit-Parameter = N 1 N

Unkorrelierte Daten (Gas in Kolben): i T i /K y i /mm 1 90.4 712 ± 4 2 100.5 799 ± 6 3 95.9 749 ± 2 4 90.7 711 ± 3 5 97.7 763 ± 5 Beispiel: Temperaturkoeffizient, Folge 1 Theorie: y i (T i ) t(t i a) = a T i χ 2 -Fit liefert: a = (7.833 ± 0.015) mm/k χ 2 /N dof = 6.4/4 1 ok!