Statistische Methoden

Größe: px
Ab Seite anzeigen:

Download "Statistische Methoden"

Transkript

1 Statistische Methoden Henning Gast (RWTH Aachen University) Grundpraktikum Physik, Oktober 2014 Henning Gast (RWTH Aachen University) Statistik 1

2 Inhalt 1 Wahrscheinlichkeit Grundbegriffe der Wahrscheinlichkeitsrechnung Wichtige Wahrscheinlichkeitsdichten Mehrere Zufallsgrößen 2 Statistische Messunsicherheiten Parameterschätzung Definition der statistischen Messunsicherheit Fehlerfortpflanzung 3 Modellanpassung Methode der kleinsten Quadrate Lineare Regression 4 Systematische Unsicherheiten Definition und Abschätzung Henning Gast (RWTH Aachen University) Statistik 2

3 Literatur G. Cowan, Statistical Data Analysis, Oxford University Press, ISBN R. Barlow, Statistics, Wiley, ISBN V. Blobel und E. Lohrmann, Statistische und numerische Methoden der Datenanalyse, ebuch: blobel/ebuch.html Henning Gast (RWTH Aachen University) Statistik 3

4 Messunsicherheiten Im Praktikum sollen alle Messergebnisse zusammen mit ihrer Unsicherheit angegeben werden, z.b.: R = Ω ± 0.10 Ω Die Unsicherheit gibt dabei an, mit welcher Genauigkeit eine Größe im Praktikum mit den zur Verfügung stehenden Mitteln bestimmt werden konnte. Sie spiegelt die Qualität und die Präzision einer Messung wider, vorausgesetzt dass sie korrekt bestimmt wurde. Wichtig ist die Unterscheidung zwischen statistischen und systematischen Unsicherheiten, dazu später mehr. Bei der Angabe des Messergebnisses sollen nur die im Rahmen der Genauigkeit signifikanten Stellen angegeben werden. (Am besten, 2 signifikante Stellen angeben, um Rundungsfehler klein zu halten.) Henning Gast (RWTH Aachen University) Statistik 4

5 Inhalt 1 Wahrscheinlichkeit Grundbegriffe der Wahrscheinlichkeitsrechnung Wichtige Wahrscheinlichkeitsdichten Mehrere Zufallsgrößen 2 Statistische Messunsicherheiten Parameterschätzung Definition der statistischen Messunsicherheit Fehlerfortpflanzung 3 Modellanpassung Methode der kleinsten Quadrate Lineare Regression 4 Systematische Unsicherheiten Definition und Abschätzung Henning Gast (RWTH Aachen University) Statistik 5

6 Wahrscheinlichkeit Wir betrachten eine Menge S und nennen sie den Parameterraum. Jeder Untermenge A von S weisen wir eine reelle Zahl P(A) zu, die wir Wahrscheinlichkeit nennen. Kolmogorov Axiome (1933) 1 Für jede Untermenge A in S: P(A) 0. 2 Für alle disjunkten Untermengen A and B: P(A B) = P(A) + P(B). 3 P(S) = 1. Wir möchten mit reellen Zahlen statt mit Elementen von Mengen rechnen, deshalb definieren wir: Definition Eine Abbildung X : S R n heißt Zufallsgröße. Henning Gast (RWTH Aachen University) Statistik 6

7 Bedingte Wahrscheinlichkeit Definition Für zwei Untermengen A und B des Parameterraums ist die bedingte Wahrscheinlichkeit P(A B) definiert durch P(A B) = P(A B) P(B) Die zwei Untermengen heißen unabhängig, wenn P(A B) = P(A) P(B). Wegen A B = B A, P(B A) = P(A B)P(B) = P(B A)P(A), und so kommen wir zu dem Theorem (Satz von Bayes) P(A B) = P(B A)P(A) P(B) Henning Gast (RWTH Aachen University) Statistik 7

8 Interpretation von Wahrscheinlichkeiten Frequentistische Interpretation P(A) = lim n Anzahl der Vorkommnisse von Ausgang A in n Messungen n Zugrunde liegende Annahme: Das Zufallsexperiment kann prinzipiell beliebig oft wiederholt werden. Beispiel: Messung der Kapazität eines Kondensators. Problematischer: Aussagen über Zufallsexperimente, die nur ein einziges Mal durchgeführt werden können, z.b.: Morgen wird es regnen. Henning Gast (RWTH Aachen University) Statistik 8

9 Wahrscheinlichkeitsdichte Betrachten wir einen Parameterraum S und eine Zufallsgröße X : S R. Definition Die Wahrscheinlichkeitsdichte von X ist definiert als f (x) dx = P(X ergibt Wert in [x, x + dx]) f (x) ist normiert, so dass S f (x) dx = 1 Die Definition gilt genauso für kontinuierliche wie für diskrete Zufallsgrößen. Henning Gast (RWTH Aachen University) Statistik 9

10 Histogramme Henning Gast (RWTH Aachen University) Statistik 10

11 Kumulative Verteilung Definition Die kumulative Verteilung F(x) zu einer Wahrscheinlichkeitsdichte f (x) ist definiert durch F (x) = x f (x ) dx Henning Gast (RWTH Aachen University) Statistik 11

12 Erwartungswert und Varianz Wir betrachten eine 1-D Zufallsgröße X. Um Mittelwert und Streuung von X zu charakterisieren, definieren wir: Definition Der Erwartungswert oder Mittelwert von X ist gegeben durch E[X] = Die Varianz von X ist gegeben durch V [X] = xf (x) dx = µ (x µ) 2 f (x) dx = σ 2 Die Standardabweichung von X ist gegeben durch σ = V [X]. Diese Größe ist sinnvoll, weil sie dieselben Einheiten hat wie x. Beachte, dass V [X] = (E[X 2 ]) µ 2. Henning Gast (RWTH Aachen University) Statistik 12

13 Inhalt 1 Wahrscheinlichkeit Grundbegriffe der Wahrscheinlichkeitsrechnung Wichtige Wahrscheinlichkeitsdichten Mehrere Zufallsgrößen 2 Statistische Messunsicherheiten Parameterschätzung Definition der statistischen Messunsicherheit Fehlerfortpflanzung 3 Modellanpassung Methode der kleinsten Quadrate Lineare Regression 4 Systematische Unsicherheiten Definition und Abschätzung Henning Gast (RWTH Aachen University) Statistik 13

14 Gauß-Verteilung Definition E[X] = µ V [X] = σ 2 f (x; µ, σ) = Die Wichtigkeit der Gauß-Verteilung liegt im zentralen Grenzwertsatz begründet: Die Summe von n unabhängigen kontinuierlichen Zufallsgrößen mit Mittelwerten µ i und endlichen Varianzen σ 2 i nähert sich im Grenzfall n einer Gauß-Verteilung mit Mittelwert µ = i µ i und Varianz σ 2 = i σ2 i. ( ) 1 exp (x µ)2 2πσ 2 2σ 2 Henning Gast (RWTH Aachen University) Statistik 14

15 Binomial-Verteilung Betrachte eine Serie von N unabhängigen Versuchen oder Beobachtungen, von denen jede zwei Mögliche Ausgänge hat ( 1 oder 0 ), mit fester Wahrscheinlichkeit p für 1 (Bernoulli-Experiment). Die Wahrscheinlichkeit, k-mal 1 in N Versuchen zu messen, ist Definition f (k; N, p) = ( ) N p k (1 p) N k k with ( ) N N! = k k!(n k)! E[X] = Np V [X] = Np(1 p) Henning Gast (RWTH Aachen University) Statistik 15

16 Poisson-Verteilung Betrachte die Binomial-Verteilung im Grenzfall, dass N sehr groß wird, p sehr klein wird, aber das Produkt np konstant gleich einem endlichen Wert ν bleibt. Dann nähert sich die Binomial-Verteilung einer Poisson-Verteilung an: Definition f (k; ν) = νk k! e ν E[X] = ν V [X] = ν Beispiel: Zählexperiment. Für große ν nähert sich die Poisson-Verteilung einer Gauß-Verteilung mit Mittelwert ν und Varianz ν an. Henning Gast (RWTH Aachen University) Statistik 16

17 Gleichverteilung Definition Die Gleichverteilung ist gegeben durch E[X] = 1 2 (α + β) V [X] = 1 12 (β α)2 Beispiele: f (x; α, β) = { 1 β α α x β 0 otherwise Digitalisierung im Analog-Digital-Wandler (ADC) Maßband (Intervall zwischen zwei Skalenstrichen) Henning Gast (RWTH Aachen University) Statistik 17

18 Inhalt 1 Wahrscheinlichkeit Grundbegriffe der Wahrscheinlichkeitsrechnung Wichtige Wahrscheinlichkeitsdichten Mehrere Zufallsgrößen 2 Statistische Messunsicherheiten Parameterschätzung Definition der statistischen Messunsicherheit Fehlerfortpflanzung 3 Modellanpassung Methode der kleinsten Quadrate Lineare Regression 4 Systematische Unsicherheiten Definition und Abschätzung Henning Gast (RWTH Aachen University) Statistik 18

19 Gemeinsame Wahrscheinlichkeitsdichte und Kovarianz Definition Seien X und Y zwei Zufallsgrößen. Die gemeinsame Wahrscheinlichkeitsdichte f (x, y) ist definiert als P(X(ω) [x, x + dx] Y (ω) [y, y + dy]) = f (x, y) dx dy für alle ω S. Definition Die Kovarianz von zwei Zufallsgrößen X and Y ist definiert als V xy = E[(x µ x )(y µ y )] = E[xy] µ x µ y = xy f (x, y) dx dy µ x µ y Henning Gast (RWTH Aachen University) Statistik 19

20 Korrelationskoeffizient Ein dimensionsloses Maß für die Korrelation zwischen zwei Zufallsgrößen ist gegeben durch den Korrelationskoeffizienten ρ xy = V xy σ x σ y Man kann zeigen, dass 1 ρ xy 1. Per Konstruktion ist die Kovarianzmatrix V ab symmetrisch in a und b, und die Diagonalelemente V aa = σ 2 a (d.h. die Varianzen) sind positiv. Henning Gast (RWTH Aachen University) Statistik 20

21 Streudiagramme Henning Gast (RWTH Aachen University) Statistik 21

22 Rechnen mit Erwartungswerten Aus der Definition des Erwartungswert folgt: Für die Multiplikation einer Zufallsgröße mit einer Konstanten a: E[aX] = ae[x] V [ax] = a 2 V [X] Für die Summe zweier Zufallsgrößen X und Y : E[X + Y ] = E[X] + E[Y ] V [X + Y ] = V [X] + V [Y ] wobei die letzte Beziehung nur gilt, wenn X and Y unabhängig sind, d.h. die gemeinsame Wahrscheinlichkeitsdichte faktorisiert: f (x, y) dx dy = f x (x)f y (y) dx dy. Henning Gast (RWTH Aachen University) Statistik 22

23 Inhalt 1 Wahrscheinlichkeit Grundbegriffe der Wahrscheinlichkeitsrechnung Wichtige Wahrscheinlichkeitsdichten Mehrere Zufallsgrößen 2 Statistische Messunsicherheiten Parameterschätzung Definition der statistischen Messunsicherheit Fehlerfortpflanzung 3 Modellanpassung Methode der kleinsten Quadrate Lineare Regression 4 Systematische Unsicherheiten Definition und Abschätzung Henning Gast (RWTH Aachen University) Statistik 23

24 Einführung in die Parameterschätzung Die Parameter einer Wahrscheinlichkeitsdichte sind Konstanten, die ihre Form beschreiben, z.b. θ in f (x; θ) = 1 θ e x/θ Um den unbekannten Parameter θ zu bestimmen, benutzen wir eine Stichprobe von Beobachtungswerten x = (x 1,..., x n ), die entsprechend der Wahrscheinlichkeitsdichte verteilt sind. Die Aufgabe besteht nun darin, eine Funktion der Daten zu finden, um den gesuchten Parameter zu schätzen: ˆθ(x) ˆθ(x) wird Schätzgröße für den unbekannten Parameter θ genannt. Im Allgemeinen heißt eine Funktion, die Beobachtungsdaten (x 1,..., x n ) eine Zahl zuordnet, eine Testgröße. Henning Gast (RWTH Aachen University) Statistik 24

25 Beispiel: Schätzgrößen für Mittelwert und Varianz Wir wollen eine Schätzgröße für den Mittelwert µ einer Wahrscheinlichkeitsdichte mit völlig unbekannter Form angeben, basierend auf der Stichprobe (x 1,..., x n ). Wir benutzen das arithmetische Mittel x = 1 n x i n i=1 Der Erwartungswert von x ergibt sich zu [ ] 1 n E[ x] = E x i = 1 n E[x i ] = 1 n n n i=1 i=1 n µ = µ was bedeutet, dass x in der Tat eine erwartungstreue Schätzgröße für µ ist. Man kann zeigen, dass die empirische Varianz s 2 = 1 n 1 n (x i x) 2 eine erwartungstreue Schätzgröße für die unbekannte Varianz ist: E[s 2 ] = σ 2. i=1 i=1 Henning Gast (RWTH Aachen University) Statistik 25

26 Schätzgröße für die Kovarianz Ähnlich kann gezeigt werden, dass die Größe ˆV xy = 1 n 1 n (x i x)(y i ȳ) = n (xy xȳ) n 1 i=1 eine erwartungstreue Schätzgröße für die Kovarianz V xy zweier Zufallsgrößen X und Y mit unbekanntem Mittelwert ist. Henning Gast (RWTH Aachen University) Statistik 26

27 Varianz des arithmetischen Mittels Für die Varianz des arithmetischen Mittels finden wir ( ) V [ x] = E[ x 2 ] (E[ x]) 2 = E 1 n x i 1 n n n = 1 n n 2 E[x i x j ] µ 2 i,j=1 i=1 = 1 n 2 [(n2 n)µ 2 + n(µ 2 + σ 2 )] µ 2 = σ2 n wo wir benutzt haben, dass E[x i x j ] = µ 2 für i j und E[x i x j ] = µ 2 + σ 2 für i = j. j=1 x j µ 2 Dieses Ergebnis bedeutet, dass die Unsicherheit des Mittelwerts bei n Messungen von x gleich der Standardabweichung von f (x) ist, geteilt durch n. Henning Gast (RWTH Aachen University) Statistik 27

28 Inhalt 1 Wahrscheinlichkeit Grundbegriffe der Wahrscheinlichkeitsrechnung Wichtige Wahrscheinlichkeitsdichten Mehrere Zufallsgrößen 2 Statistische Messunsicherheiten Parameterschätzung Definition der statistischen Messunsicherheit Fehlerfortpflanzung 3 Modellanpassung Methode der kleinsten Quadrate Lineare Regression 4 Systematische Unsicherheiten Definition und Abschätzung Henning Gast (RWTH Aachen University) Statistik 28

29 Statistische Messunsicherheit Wir betrachten zwei experimentelle Gegebenheiten: Ein bestimmter Parameter soll aus einer Menge von n wiederholten Messungen bestimmt werden. Wie stark streuen die Messungen? ( Standardfehler) Der unbekannte wahre Parameter einer Wahrscheinlichkeitsdichte soll aus einem einzelnen Experiment bestimmt werden. Mit welcher Genauigkeit kann der Parameter bestimmt werden? ( Konfidenzintervall) In beiden Fällen sind wir daran interessiert, ein Intervall zu finden, das den wahren Wert der zu messenden Größe mit einer Wahrscheinlichkeit von 68 % enthält. Motivation: Bei der Gauß-Verteilung gilt: µ+σ µ σ 1 2πσ exp ( ) (x µ)2 2σ 2 dx 0.68 Semantik: Was verstehen wir unter den folgenden Begriffen? Fehler Unsicherheit Henning Gast (RWTH Aachen University) Statistik 29

30 Standardabweichung als statistischer Fehler Wenn wir die Messung eines (wahren aber unbekannten) Parameters θ t mehrfach wiederholen und dabei Messwerte (t 1,..., t n ) erhalten, können wir das arithmetische Mittel θ = (1/n) t i und die empirische Standardabweichung σ θ berechnen. Für n Wiederholungen wird die Unsicherheit auf das arithmetische Mittel, das aus allen Messungen berechnet wird, σ θ / n betragen. Wir können dann θ ± σ θ / n als Ergebnis der Messung angeben. Aber: Welcher Anteil der Messungen wird im Mittel einen Wert im Intervall [θ σ θ / n, θ + σ θ / n] ergeben? Es stellt sich heraus, dass dieses simple Verfahren streng nur für Gauß-verteilte Messgrößen gilt. Henning Gast (RWTH Aachen University) Statistik 30

31 Konfidenzintervalle Problemstellung: Wir möchten auf einen Parameter µ schließen, dessen wahrer Wert µ t unbekannt ist. Dazu führen wir eine einzelne Messung einer Observablen x durch. Die Wahrscheinlichkeitsdichte dafür, x in Abhängigkeit des unbekannten Parameters µ zu erhalten, nehmen wir als bekannt an und nennen diese Wahrscheinlichkeitsdichte P(x µ). Unsere Messung ergebe nun den Wert x 0. Ein Konfidenzintervall [µ 1, µ 2 ] ist ein Element einer Menge, die durch die Eigenschaft P(µ [µ 1, µ 2 ]) = α definiert ist. α heißt Konfidenzniveau. Henning Gast (RWTH Aachen University) Statistik 31

32 Inhalt 1 Wahrscheinlichkeit Grundbegriffe der Wahrscheinlichkeitsrechnung Wichtige Wahrscheinlichkeitsdichten Mehrere Zufallsgrößen 2 Statistische Messunsicherheiten Parameterschätzung Definition der statistischen Messunsicherheit Fehlerfortpflanzung 3 Modellanpassung Methode der kleinsten Quadrate Lineare Regression 4 Systematische Unsicherheiten Definition und Abschätzung Henning Gast (RWTH Aachen University) Statistik 32

33 Fehlerfortpflanzung Wir betrachten eine Menge von n Zufallsgrößen x = (x 1,..., x n ), die gemäß einer gewissen gemeinsamen Wahrscheinlichkeitsdichte f (x) verteit seien. Die Wahrscheinlichkeitsdichte selbst ist unbekannt, aber die Mittelwerte der x i, µ = (µ 1,..., µ n ) sowie die Kovarianzmatrix V ij seien bekannt oder abgeschätzt. Unser Ziel ist die Bestimmung der Varianz V [y] einer Funktion y(x) der n Variablen. (Beispiel: Bestimmung eines Ohmschen Widerstands aus Messung von Strom und Spannung über R = U/I.) Dazu entwickeln wir y(x) bis zur ersten Ordnung um die Mittelwerte der x i : n [ ] y y(x) y(µ) + (x i µ i ) x i x=µ i=1 Wegen E[x i µ i ] = 0, ist der Erwartungswert von y E[y(x)] y(µ) Henning Gast (RWTH Aachen University) Statistik 33

34 Fehlerfortpflanzung Der Erwartungswert von y 2 ist E[y 2 (x)] y 2 (µ) + 2y(µ) ( n [ ] + E y x i i=1 = y 2 (µ) + n i,j=1 n [ ] y E[x i µ i ] x i x=µ (x i µ i )) n [ ] y x j i=1 x=µ [ y x i y x j ] V ij x=µ j=1 x=µ so dass die Varianz σ 2 y = E[y 2 ] (E[y]) 2 gegeben ist durch Gauß sche Fehlerfortpflanzung n σy 2 i,j=1 [ ] y y V ij x i x j x=µ (x j µ j ) Henning Gast (RWTH Aachen University) Statistik 34

35 Häufige Spezialfälle Für den Fall, dass die x i nicht korreliert sind, d.h. V ii = σ 2 i und V ij = 0 für i j, erhalten wir die wohlbekannte Formel σ 2 y n [ y i=1 x i ] 2 σi 2 x=µ Wir betrachten zwei Spezialfälle: Wenn y = x 1 + x 2, ergibt sich die Varianz von y zu σ 2 y = σ σ V 12 Für das Produkt y = x 1 x 2 erhalten wir σy 2 y 2 = σ2 1 x1 2 + σ2 2 x V 12 x 1 x 2 Henning Gast (RWTH Aachen University) Statistik 35

36 Inhalt 1 Wahrscheinlichkeit Grundbegriffe der Wahrscheinlichkeitsrechnung Wichtige Wahrscheinlichkeitsdichten Mehrere Zufallsgrößen 2 Statistische Messunsicherheiten Parameterschätzung Definition der statistischen Messunsicherheit Fehlerfortpflanzung 3 Modellanpassung Methode der kleinsten Quadrate Lineare Regression 4 Systematische Unsicherheiten Definition und Abschätzung Henning Gast (RWTH Aachen University) Statistik 36

37 Die Methode der kleinsten Quadrate Angenommen, wir haben eine Menge von N unabhängigen Gauß schen Zufallsgrößen y i, an verschiedenen Orten x i. Jeder Wert y i hat einen anderen Mittelwert λ i, der durch eine Funktion λ = λ(x; θ) gegeben ist, aber eine bekannte Varianz σ 2 i. λ hängt von m Parametern (θ 1,..., θ m ) ab, welche wir bestimmen wollen. Die Parameter, die die Größe χ 2 (θ) = N (y i λ(x i ; θ)) 2 σ 2 i=1 i minimieren, heißen χ 2 -Schätzgrößen (LS, least-squares) für die θ. Henning Gast (RWTH Aachen University) Statistik 37

38 Varianz der χ 2 -Schätzgrößen Man kann zeigen, dass für den Fall eines freien Parameters die Unsicherheit auf die best-fit Parameter θ 0 durch diejenigen Werte gegeben ist, bei denen wird. χ 2 (θ) = χ 2 min + 1 Henning Gast (RWTH Aachen University) Statistik 38

39 Güte der Anpassung (goodness of fit) Der Wert von χ 2 min ist ein Maß für die Übereinstimmung zwischen den Daten und der angepassten Modellkurve: χ 2 min = N (y i λ(x i ; ˆθ)) 2 σ 2 i=1 i Er kann deshalb als so genannte goodness-of-fit Testgröße benutzt werden, um die Hypothese der funktionalen Form λ(x; θ) zu testen. Man kann zeigen, dass wenn die Hypothese korrekt ist, die Testgröße t = χ 2 min einer χ2 -Verteilung folgt: f (t; n df ) = 1 2 n df /2 Γ(n df /2) t n df /2 1 e t/2 wobei n df die Anzahl der Freiheitsgrade ist: n df = Anzahl der Datenpunkte Anzahl der freien Parameter Henning Gast (RWTH Aachen University) Statistik 39

40 Güte der Anpassung Man erwartet χ 2 min /n df 1. Für den Fall, dass... χ 2 /n df 1: Sind die angenommenen Messunsicherheiten zu klein? Ist die funktionale Form der Hypothese λ(x; θ) korrekt? Den Mangel an Übereinstimmung kann man durch den p-value quantifizieren: p = χ 2 min f (t; n df ) dt also die Wahrscheinlichkeit für den Fall einer korrekten Hypothese, einen Wert von χ 2 min zu erhalten, der so groß wie oder größer ist als derjenige, den wir tatsächlich gefunden haben. ( TMath::Prob() ) χ 2 /n df 1: Sind die angenommenen Messunsicherheiten zu groß? Folgen die Datenpunkte wirklich unabhängigen Zufallsgrößen? χ 2 /n df 1: Sind die angenommenen Messunsicherheiten wirklich korrekt? Wie sieht der Residuenplot aus? Henning Gast (RWTH Aachen University) Statistik 40

41 Residuenplots Henning Gast (RWTH Aachen University) Statistik 41

42 Zusammenfassen von Messungen Es sei eine unbekannte Größe λ in N verschiedenen Experimenten gemessen worden, die unabhängige Messwerte y i mit abgeschätzten Unsicherheiten σ i geliefert haben. Die χ 2 -Schätzgröße ˆλ für λ kann dadurch abgeleitet werden, dass wir χ 2 (λ) = N (y i λ) 2 i=1 minimieren. Gleichsetzen von χ 2 (λ)/ λ = 0 liefert σ 2 i ˆλ = N i=1 y i/σ 2 i N i=1 1/σ2 i also die wohlbekannte Formel für das gewichtete Mittel. Die zweite Ableitung von χ 2 liefert die Varianz von ˆλ (hier ohne Beweis): 1 V [ˆλ] = N i=1 1/σ2 i (Eine analoge Methode wird im Praktikum zur nummerischen Bestimmung der Maxima einer Kurve eingesetzt (Peakfinding).) Henning Gast (RWTH Aachen University) Statistik 42

43 Inhalt 1 Wahrscheinlichkeit Grundbegriffe der Wahrscheinlichkeitsrechnung Wichtige Wahrscheinlichkeitsdichten Mehrere Zufallsgrößen 2 Statistische Messunsicherheiten Parameterschätzung Definition der statistischen Messunsicherheit Fehlerfortpflanzung 3 Modellanpassung Methode der kleinsten Quadrate Lineare Regression 4 Systematische Unsicherheiten Definition und Abschätzung Henning Gast (RWTH Aachen University) Statistik 43

44 Lineare Regression Eine häufige Anwendung der Methode der kleinsten Quadrate besteht in der Bestimmung von Steigung m und Achsenabschnitt c einer Geraden y = mx + c an n Paare von Messpunkten (x 1, y 1 ),..., (x n, y n ) mit Messunsicherheiten σ i auf die y i, während die x i als genau bekannt angenommen werden. Beispiel: Messung der Schallgeschwindigkeit aus Resonanzlängen einer stehenden Welle gemäß L n = (v/2f ) n. Zu minimieren ist n ( ) 2 χ 2 yi y(x i ) n ( ) 2 yi mx i c = = i=1 σ i i=1 σ i Henning Gast (RWTH Aachen University) Statistik 44

45 Lineare Regression oder χ 2 = n ( yi mx i c i=1 σ i ) 2 χ 2 c = 2 y i ˆmx i ĉ σi 2 yi xi σi 2 σi 1 ˆm 2 1 σi 2 σi 2 wo wir z.b. definieren: = y i σ 2 i ĉ = 0 ȳ ˆm x ĉ = 0 x = x i σi 2 / 1 σi 2 ˆm x i σ 2 i ĉ 1 σ 2 i = 0 Henning Gast (RWTH Aachen University) Statistik 45

46 Lineare Regression χ 2 = n ( yi mx i c i=1 σ i ) 2 χ 2 m = 2 y i ˆmx i ĉ σi 2 x i = x i y i σi 2 xy ˆmx 2 ĉ x = 0 ˆm xi 2 σi 2 ĉ x i σ 2 i = 0 Als Lösung des Gleichungssystems ergibt sich schließlich: ˆm = xy xȳ x 2 x 2 und ĉ = ȳ ˆm x Henning Gast (RWTH Aachen University) Statistik 46

47 Lineare Regression Zur Bestimmung der Unsicherheit σ ˆm auf ˆm schreiben wir ˆm = x i x N(x 2 x 2 ) y i wobei N = 1 σi 2 und mit dem Gesetz über die Fehlerfortpflanzung folgt dann σ ˆm = ( ) 2 x i x σ N(x 2 x 2 i 2 ) Analog ergibt sich σĉ = ( ) 2 x 2 xx i σ N(x 2 x 2 i 2 ) Henning Gast (RWTH Aachen University) Statistik 47

48 Korrelation zwischen m und c Vorsicht: Im Allgemeinen gibt es eine Korrelation zwischen Steigung m und Achsenabschnitt c bei der linearen Regression, die z.b. für den Fall σ i = σ gegeben ist durch ρ ˆm,ĉ = x x 2 Dadurch erhöht sich die Unsicherheit auf m und c! Die Korrelation verschwindet offenbar für den Fall x = 0. Diesen Fall können wir erreichen, indem wir die Geradengleichung wie folgt modifizieren: y = m(x x 0 ) + c mit x 0 = x. Der Parameter x 0 muss im Fit festgehalten werden! Henning Gast (RWTH Aachen University) Statistik 48

49 Lineare Regression mit Unsicherheiten in beiden Messgrößen Im Allgemeinen sind die x-koordinaten der Datenpunkte nicht beliebig genau bekannt, sondern weisen Messunsicherheiten σ xi auf. In erster Näherung kann man diese Unsicherheiten berücksichtigen, indem man die folgende Größe minimiert: χ 2 = i (y i f (x i )) 2 σ 2 yi + (f (x i )σ xi ) 2 Diese Methode heißt Methode der effektiven Varianz. Henning Gast (RWTH Aachen University) Statistik 49

50 Inhalt 1 Wahrscheinlichkeit Grundbegriffe der Wahrscheinlichkeitsrechnung Wichtige Wahrscheinlichkeitsdichten Mehrere Zufallsgrößen 2 Statistische Messunsicherheiten Parameterschätzung Definition der statistischen Messunsicherheit Fehlerfortpflanzung 3 Modellanpassung Methode der kleinsten Quadrate Lineare Regression 4 Systematische Unsicherheiten Definition und Abschätzung Henning Gast (RWTH Aachen University) Statistik 50

51 Definitionen Betrachten wir die folgenden zwei Situationen: Mit einem Metall-Lineal werden Längenmessungen durchgeführt. Das Lineal wurde bei einer Temperatur von 15 C kalibriert, aber die Messungen werden in einem wärmeren Labor durchgeführt und der Experimentator versäumt es, für die thermische Expansion zu korrigieren. Zur Bestimmung der Schallgeschwindigkeit wird die Wellenlänge einer stehenden Schallwelle ausgemessen. Dazu wird ein Wegaufnehmer verwendet, der zuvor nur mit einer endlichen Präzision kalibriert werden konnte. Frei übersetzt nach R. Barlow Es ist essentiell, systematische Effekte von systematischen Fehlern zu unterscheiden, die die Unsicherheiten in der Größe dieser Effekte sind, und von handwerklichen Fehlern, die aus dem Übersehen solcher Effekte herrühren. In diesem Sinne ist der Ausdruck systematische Unsicherheit sprachlich präziser als der Ausdruck systematischer Fehler. Henning Gast (RWTH Aachen University) Statistik 51

52 Abschätzung systematischer Messunsicherheiten Es existieren viele Methoden, um systematische Messunsicherheiten abzuschätzen. Wir nehmen an, dass das Ergebnis von einer Menge von N unbekannten Parametern φ abhängt und dass wir zumindest grobe Kenntnis ihrer Wahrscheinlichkeitsdichten haben. Im Praktikum benutzen wir vor allem die Verschiebemethode: Für N unbekannte Parameter φ = (φ 1,..., φ n ) mit unkorrelierten Gauß schen Unsicherheiten σ i, und einer Schätzgröße f (φ 1,..., φ n ) für die uns interessierende physikalische Größe, liefert die lineare Näherung: σ 2 f N ( f i=1 φ i ) 2 σ 2 i Die partiellen Ableitungen können als finite Differenzen angenähert werden: f f (φ 1,..., φ i + σ i,..., φ N ) f (φ 1,..., φ i,..., φ N ) = i φ i σ i σ i und so erhalten wir σ 2 f N i=1 2 i. Henning Gast (RWTH Aachen University) Statistik 52

53 Beispiel für die Verschiebemethode Beispiel: Ein Ohmscher Widerstand R soll aus einer linearen Regression an Messpunkte (U i, I i ) aus Spannungs- und Strommessungen bestimmt werden. Der Hersteller des Messgeräts gibt die folgenden systematischen Unsicherheiten auf Spannungsund Strommessungen an: σ U,sys = (0.01U i U Bereichsendwert )/ 3 σ I,sys = (0.02I i I Bereichsendwert )/ 3 Man studiert dann die Verschiebungen, die man jeweils für R erhält, wenn man die Spannungsmessungen bzw. die Strommessungen um die systematischen Unsicherheiten verschiebt. Die systematische Unsicherheit auf R erhält man schließlich durch quadratische Addition der Verschiebungen. Henning Gast (RWTH Aachen University) Statistik 53

54 Vergleich Statistische Fehler geben eine nicht zu vermeidende, zufällige Fluktuation der Messwerte wieder, können aus der Wiederholung von Messungen unter identischen Bedungungen bestimmt werden und fallen dabei wie 1/ n. Systematische Fehler basieren auf Effekten, die stets zu derselben, unbekannten Abweichung von Messwerten führen, können durch Wiederholung der Messung weder abgeschätzt noch reduziert werden, dürfen daher auch nicht als Gewicht beim gewichteten Mittel eingesetzt werden. Die statistischen und systematischen Unsicherheiten sollten getrennt ausgwiesen werden, z.b.: R = 99.8 Ω ± 0.1 Ω (stat.) ± 0.5 Ω (syst.) Henning Gast (RWTH Aachen University) Statistik 54

55 Zusammenfassung der wichtigsten Konzepte Empirisches Mittel, Standardabweichung, Fehler des Mittelwerts: x = 1 N x i σ x = 1 N (x i x) N N 1 2 σ x = σ x N i=1 Gewichtetes Mittel Wichtige Wahrscheinlichkeitsdichten: Gauß-Verteilung, Binomial-Verteilung, Poisson-Verteilung, Gleichverteilung Gauß sche Fehlerfortpflanzung, z.b.: y = A m B n i=1 ( ) 2 σy ( m σ A y A Regressionsrechnung, χ 2, Residuenplots ) 2 + ( Statistische und systematische Unsicherheiten n σ B B ) 2 Henning Gast (RWTH Aachen University) Statistik 55

Statistische Methoden

Statistische Methoden Statistische Methoden Henning Gast Grundpraktikum Physik, März 2016 Henning Gast Statistik 1 Inhalt 1 Wahrscheinlichkeit Grundbegriffe der Wahrscheinlichkeitsrechnung Wichtige Wahrscheinlichkeitsdichten

Mehr

Wichtige Definitionen und Aussagen

Wichtige Definitionen und Aussagen Wichtige Definitionen und Aussagen Zufallsexperiment, Ergebnis, Ereignis: Unter einem Zufallsexperiment verstehen wir einen Vorgang, dessen Ausgänge sich nicht vorhersagen lassen Die möglichen Ausgänge

Mehr

Statistics, Data Analysis, and Simulation SS 2017

Statistics, Data Analysis, and Simulation SS 2017 Statistics, Data Analysis, and Simulation SS 2017 08.128.730 Statistik, Datenanalyse und Simulation Dr. Michael O. Distler Mainz, 4. Mai 2017 Dr. Michael O. Distler

Mehr

Numerische Methoden und Algorithmen in der Physik

Numerische Methoden und Algorithmen in der Physik Numerische Methoden und Algorithmen in der Physik Hartmut Stadie, Christian Autermann 15.01.2009 Numerische Methoden und Algorithmen in der Physik Christian Autermann 1/ 47 Methode der kleinsten Quadrate

Mehr

Datenanalyse. (PHY231) Herbstsemester Olaf Steinkamp

Datenanalyse. (PHY231) Herbstsemester Olaf Steinkamp Datenanalyse (PHY23) Herbstsemester 207 Olaf Steinkamp 36-J-05 olafs@physik.uzh.ch 044 63 55763 Vorlesungsprogramm Einführung, Messunsicherheiten, Darstellung von Messdaten Grundbegriffe der Wahrscheinlichkeitsrechnung

Mehr

Statistik - Fehlerrechnung - Auswertung von Messungen

Statistik - Fehlerrechnung - Auswertung von Messungen Statistik - Fehlerrechnung - Auswertung von Messungen TEIL II Vorbereitungskurs F-Praktikum B (Physik), RWTH Aachen Thomas Hebbeker Eindimensionaler Fall: Parameterbestimmung - Beispiele [Übung] Mehrdimensionaler

Mehr

Moderne Methoden der Datenverarbeitung in der Physik I

Moderne Methoden der Datenverarbeitung in der Physik I Moderne Methoden der Datenverarbeitung in der Physik I Prof. Dr. Stefan Schael / Dr. Thomas Kirn I. Physikalisches Institut MAPLE II, Krypthographie Wahrscheinlichkeit Zufallszahlen, Wahrscheinlichkeitsdichten,

Mehr

Statistik und Wahrscheinlichkeitsrechnung

Statistik und Wahrscheinlichkeitsrechnung Statistik und Wahrscheinlichkeitsrechnung Dr. Jochen Köhler 1 Inhalt der heutigen Vorlesung Statistik und Wahrscheinlichkeitsrechnung Zusammenfassung der vorherigen Vorlesung Übersicht über Schätzung und

Mehr

Datenanalyse. (PHY231) Herbstsemester Olaf Steinkamp

Datenanalyse. (PHY231) Herbstsemester Olaf Steinkamp Datenanalyse (PHY231) Herbstsemester 2015 Olaf Steinkamp 36-J-22 olafs@physik.uzh.ch 044 63 55763 Vorlesungsprogramm Einführung, Messunsicherheiten, Darstellung von Messdaten Grundbegriffe der Wahrscheinlichkeitsrechnung

Mehr

Statistik I für Betriebswirte Vorlesung 4

Statistik I für Betriebswirte Vorlesung 4 Statistik I für Betriebswirte Vorlesung 4 Prof. Dr. Hans-Jörg Starkloff TU Bergakademie Freiberg Institut für Stochastik 25. April 2016 Prof. Dr. Hans-Jörg Starkloff Statistik I für Betriebswirte Vorlesung

Mehr

Mehrdimensionale Zufallsvariablen

Mehrdimensionale Zufallsvariablen Mehrdimensionale Zufallsvariablen Im Folgenden Beschränkung auf den diskreten Fall und zweidimensionale Zufallsvariablen. Vorstellung: Auswerten eines mehrdimensionalen Merkmals ( ) X Ỹ also z.b. ω Ω,

Mehr

7.5 Erwartungswert, Varianz

7.5 Erwartungswert, Varianz 7.5 Erwartungswert, Varianz Def. 7.5.: a) X sei eine diskrete ZV, die bei unendl. vielen Werten x k folgende Zusatzbedingung erfüllt: x k p k

Mehr

Wahrscheinlichkeit und Statistik: Zusammenfassung

Wahrscheinlichkeit und Statistik: Zusammenfassung HSR Hochschule für Technik Rapperswil Wahrscheinlichkeit und Statistik: Zusammenfassung beinhaltet Teile des Skripts von Herrn Hardy von Lukas Wilhelm lwilhelm.net 12. Januar 2007 Inhaltsverzeichnis 1

Mehr

Datenanalyse. (PHY231) Herbstsemester Olaf Steinkamp

Datenanalyse. (PHY231) Herbstsemester Olaf Steinkamp Datenanalyse (PHY31) Herbstsemester 015 Olaf Steinkamp 36-J- olafs@physik.uzh.ch 044 63 55763 Einführung, Messunsicherheiten, Darstellung von Messdaten Grundbegriffe der Wahrscheinlichkeitsrechnung und

Mehr

Statistics, Data Analysis, and Simulation SS 2017

Statistics, Data Analysis, and Simulation SS 2017 Statistics, Data Analysis, and Simulation SS 2017 08.128.730 Statistik, Datenanalyse und Simulation Dr. Michael O. Distler Mainz, May 29, 2017 Dr. Michael O. Distler

Mehr

Datenanalyse. (PHY231) Herbstsemester Olaf Steinkamp

Datenanalyse. (PHY231) Herbstsemester Olaf Steinkamp Datenanalyse PHY31 Herbstsemester 016 Olaf Steinkamp 36-J- olafs@physik.uzh.ch 044 63 55763 Vorlesungsprogramm Einführung, Messunsicherheiten, Darstellung von Messdaten Grundbegriffe der Wahrscheinlichkeitsrechnung

Mehr

Statistik. Sommersemester Prof. Dr. Stefan Etschberger HSA. für Betriebswirtschaft und International Management

Statistik. Sommersemester Prof. Dr. Stefan Etschberger HSA. für Betriebswirtschaft und International Management Statistik für Betriebswirtschaft und International Management Sommersemester 2014 Prof. Dr. Stefan Etschberger HSA Streuungsparameter Varianz Var(X) bzw. σ 2 : [x i E(X)] 2 f(x i ), wenn X diskret Var(X)

Mehr

Fakultät Verkehrswissenschaften Friedrich List Professur für Ökonometrie und Statistik, insb. im Verkehrswesen. Statistik II. Prof. Dr.

Fakultät Verkehrswissenschaften Friedrich List Professur für Ökonometrie und Statistik, insb. im Verkehrswesen. Statistik II. Prof. Dr. Statistik II Fakultät Verkehrswissenschaften Friedrich List Professur für Ökonometrie und Statistik, insb. im Verkehrswesen Statistik II 2. Parameterschätzung: 2.1 Grundbegriffe; 2.2 Maximum-Likelihood-Methode;

Mehr

Statistik und Wahrscheinlichkeitsrechnung

Statistik und Wahrscheinlichkeitsrechnung Statistik und Wahrscheinlichkeitsrechnung 11. Vorlesung Jochen Köhler 10.05.011 1 Inhalt der heutigen Vorlesung Zusammenfassung Parameterschätzung Übersicht über Schätzung und Modellbildung Modellevaluation

Mehr

Statistik I für Betriebswirte Vorlesung 3

Statistik I für Betriebswirte Vorlesung 3 Statistik I für Betriebswirte Vorlesung 3 Dr. Andreas Wünsche TU Bergakademie Freiberg Institut für Stochastik 15. April 2019 Dr. Andreas Wünsche Statistik I für Betriebswirte Vorlesung 3 Version: 1. April

Mehr

Messunsicherheit und Fehlerrechnung

Messunsicherheit und Fehlerrechnung Messunsicherheit und Fehlerrechnung p. 1/25 Messunsicherheit und Fehlerrechnung Kurzeinführung Peter Riegler p.riegler@fh-wolfenbuettel.de Fachhochschule Braunschweig/Wolfenbüttel Messunsicherheit und

Mehr

Numerische Methoden und Algorithmen in der Physik

Numerische Methoden und Algorithmen in der Physik Numerische Methoden und Algorithmen in der Physik Hartmut Stadie, Christian Autermann 08.01.2009 Numerische Methoden und Algorithmen in der Physik Hartmut Stadie 1/ 32 Einführung Wahrscheinlichkeit Verteilungen

Mehr

1 Messfehler. 1.1 Systematischer Fehler. 1.2 Statistische Fehler

1 Messfehler. 1.1 Systematischer Fehler. 1.2 Statistische Fehler 1 Messfehler Jede Messung ist ungenau, hat einen Fehler. Wenn Sie zum Beispiel die Schwingungsdauer eines Pendels messen, werden Sie - trotz gleicher experimenteller Anordnungen - unterschiedliche Messwerte

Mehr

Varianz und Kovarianz

Varianz und Kovarianz KAPITEL 9 Varianz und Kovarianz 9.1. Varianz Definition 9.1.1. Sei (Ω, F, P) ein Wahrscheinlichkeitsraum und X : Ω eine Zufallsvariable. Wir benutzen die Notation (1) X L 1, falls E[ X ]

Mehr

Statistische Methoden

Statistische Methoden Modeling of Data / Maximum Likelyhood methods Institut für Experimentelle und Angewandte Physik Christian-Albrechts-Universität zu Kiel 22.05.2006 Datenmodellierung Messung vs Modell Optimierungsproblem:

Mehr

Wahrscheinlichkeitstheorie und Statistik vom

Wahrscheinlichkeitstheorie und Statistik vom INSTITUT FÜR STOCHASTIK SS 2007 UNIVERSITÄT KARLSRUHE Priv.-Doz. Dr. D. Kadelka Dipl.-Math. oec. W. Lao Klausur (Maschineningenieure) Wahrscheinlichkeitstheorie und Statistik vom 2.9.2007 Musterlösungen

Mehr

Deskriptive Beschreibung linearer Zusammenhänge

Deskriptive Beschreibung linearer Zusammenhänge 9 Mittelwert- und Varianzvergleiche Mittelwertvergleiche bei k > 2 unabhängigen Stichproben 9.4 Beispiel: p-wert bei Varianzanalyse (Grafik) Bedienungszeiten-Beispiel, realisierte Teststatistik F = 3.89,

Mehr

Goethe-Universität Frankfurt

Goethe-Universität Frankfurt Goethe-Universität Frankfurt Fachbereich Wirtschaftswissenschaft PD Dr. Martin Biewen Dr. Ralf Wilke Sommersemester 2006 Klausur Statistik II 1. Alle Aufgaben sind zu beantworten. 2. Bitte runden Sie Ihre

Mehr

Anpassungsrechnungen mit kleinsten Quadraten und Maximum Likelihood

Anpassungsrechnungen mit kleinsten Quadraten und Maximum Likelihood Anpassungsrechnungen mit kleinsten Quadraten und Maximum Likelihood KARLSRUHER INSTITUT FÜR TECHNOLOGIE (KIT) 0 KIT 06.01.2012 Universität des Fabian Landes Hoffmann Baden-Württemberg und nationales Forschungszentrum

Mehr

Grundlagen der Wahrscheinlichkeitstheorie

Grundlagen der Wahrscheinlichkeitstheorie Priv.-Doz. Dr. H. Steinacker Wintersemester 2013/2014 Grundlagen der Wahrscheinlichkeitstheorie betrachte Wiederholungen eines Experimentes, gleicher Vorbereitung (z.b. Würfeln, Dart werfen, Doppelspaltexperiment,...)

Mehr

Datenanalyse. (PHY231) Herbstsemester Olaf Steinkamp

Datenanalyse. (PHY231) Herbstsemester Olaf Steinkamp PHY3 Herbstsemester 04 Olaf Steinkamp Physik-Institut der Universität Zürich Winterthurerstrasse 90 CH-8057 Zürich olafs@physik.uzh.ch Büro: 36-J- Tel.: 044-635.57.63 Vorlesungsprogramm Einführung, Messunsicherheiten,

Mehr

Mathematik für Naturwissenschaften, Teil 2

Mathematik für Naturwissenschaften, Teil 2 Lösungsvorschläge für die Aufgaben zur Vorlesung Mathematik für Naturwissenschaften, Teil Zusatzblatt SS 09 Dr. J. Schürmann keine Abgabe Aufgabe : Eine Familie habe fünf Kinder. Wir nehmen an, dass die

Mehr

Statistik, Datenanalyse und Simulation

Statistik, Datenanalyse und Simulation Dr. Michael O. Distler distler@kph.uni-mainz.de Mainz, 13. Juli 2011 Ziel der Vorlesung Vermittlung von Grundkenntnissen der Statistik, Simulationstechnik und numerischen Methoden (Algorithmen) Aufgabe:

Mehr

7.1 Korrelationsanalyse. Statistik. Kovarianz. Pearson-Korrelation. Institut für angewandte Statistik & EDV Universität für Bodenkultur Wien

7.1 Korrelationsanalyse. Statistik. Kovarianz. Pearson-Korrelation. Institut für angewandte Statistik & EDV Universität für Bodenkultur Wien Statistik 7.1 Korrelationsanalyse Institut für angewandte Statistik & EDV Universität für Bodenkultur Wien Sommersemester 2012 7 Regressions- und Korrelationsanalyse Kovarianz Pearson-Korrelation Der (lineare)

Mehr

Wichtige Begriffe und Sätze aus der Wahrscheinlichkeitsrechnung

Wichtige Begriffe und Sätze aus der Wahrscheinlichkeitsrechnung Wichtige Begriffe und Sätze aus der Wahrscheinlichkeitsrechnung Version: 22. September 2015 Evelina Erlacher 1 Mengen Es sei Ω eine Menge (die Universalmenge ) und A, B seien Teilmengen von Ω. Dann schreiben

Mehr

Einführung in die Fehlerrechnung und Messdatenauswertung

Einführung in die Fehlerrechnung und Messdatenauswertung Grundpraktikum der Physik Einführung in die Fehlerrechnung und Messdatenauswertung Wolfgang Limmer Institut für Halbleiterphysik 1 Fehlerrechnung 1.1 Motivation Bei einem Experiment soll der Wert einer

Mehr

Statistische Methoden der Datenanalyse Wintersemester 2011/2012 Albert-Ludwigs-Universität Freiburg

Statistische Methoden der Datenanalyse Wintersemester 2011/2012 Albert-Ludwigs-Universität Freiburg Statistische Methoden der Datenanalyse Wintersemester 2011/2012 Albert-Ludwigs-Universität Freiburg Dr. Stan Lai und Prof. Markus Schumacher Physikalisches Institut Westbau 2 OG Raum 008 Telefonnummer

Mehr

Zufallsvariablen. Diskret. Stetig. Verteilung der Stichprobenkennzahlen. Binomial Hypergeometrisch Poisson. Normal Lognormal Exponential

Zufallsvariablen. Diskret. Stetig. Verteilung der Stichprobenkennzahlen. Binomial Hypergeometrisch Poisson. Normal Lognormal Exponential Zufallsvariablen Diskret Binomial Hypergeometrisch Poisson Stetig Normal Lognormal Exponential Verteilung der Stichprobenkennzahlen Stetige Zufallsvariable Verteilungsfunktion: Dichtefunktion: Integralrechnung:

Mehr

5. Schließende Statistik (Inferenzstatistik, konfirmatorische Verfahren)

5. Schließende Statistik (Inferenzstatistik, konfirmatorische Verfahren) 5. Schließende Statistik (Inferenzstatistik, konfirmatorische Verfahren) 5.1. Einführung Schätzen unbekannter Parameter im Modell, z.b. Wahrscheinlichkeiten p i (Anteile in der Gesamtmenge), Erwartungswerte

Mehr

Teil VIII. Zentraler Grenzwertsatz und Vertrauensintervalle. Woche 6: Zentraler Grenzwertsatz und Vertrauensintervalle. Lernziele. Typische Situation

Teil VIII. Zentraler Grenzwertsatz und Vertrauensintervalle. Woche 6: Zentraler Grenzwertsatz und Vertrauensintervalle. Lernziele. Typische Situation Woche 6: Zentraler Grenzwertsatz und Vertrauensintervalle Patric Müller ETHZ Teil VIII Zentraler Grenzwertsatz und Vertrauensintervalle WBL 17/19, 29.05.2017 Wahrscheinlichkeit

Mehr

1. Grundbegri e der Stochastik

1. Grundbegri e der Stochastik Wiederholung von Grundwissen der Stochastik. Grundbegri e der Stochastik Menge der Ereignisse. Die Elemente! der Menge heißen Elementarereignisse und sind unzerlegbare Ereignisse. Das Ereignis A tritt

Mehr

Kapitel 7. Regression und Korrelation. 7.1 Das Regressionsproblem

Kapitel 7. Regression und Korrelation. 7.1 Das Regressionsproblem Kapitel 7 Regression und Korrelation Ein Regressionsproblem behandelt die Verteilung einer Variablen, wenn mindestens eine andere gewisse Werte in nicht zufälliger Art annimmt. Ein Korrelationsproblem

Mehr

4.1 Stichproben, Verteilungen und Schätzwerte. N(t) = N 0 e λt, (4.1)

4.1 Stichproben, Verteilungen und Schätzwerte. N(t) = N 0 e λt, (4.1) Kapitel 4 Stichproben und Schätzungen 4.1 Stichproben, Verteilungen und Schätzwerte Eine physikalische Messung ist eine endliche Stichprobe aus einer Grundgesamtheit, die endlich oder unendlich sein kann.

Mehr

Wichtige Begriffe und Sätze aus der Wahrscheinlichkeitsrechnung

Wichtige Begriffe und Sätze aus der Wahrscheinlichkeitsrechnung Wichtige Begriffe und Sätze aus der Wahrscheinlichkeitsrechnung Version: 15. Jänner 2017 Evelina Erlacher Inhaltsverzeichnis 1 Mengen 2 2 Wahrscheinlichkeiten 3 3 Zufallsvariablen 5 3.1 Diskrete Zufallsvariablen............................

Mehr

Fit for Abi & Study Stochastik

Fit for Abi & Study Stochastik Fit for Abi & Study Stochastik Prof. Dr. Tilla Schade Hochschule Harz 15. und 16. April 2014 No. 1 Stochastik besteht aus: Wahrscheinlichkeitsrechnung Statistik No. 2 Gliederung Grundlagen Zufallsgrößen

Mehr

1 Verteilungsfunktionen, Zufallsvariable etc.

1 Verteilungsfunktionen, Zufallsvariable etc. 4. Test M3 ET 27 6.6.27 4. Dezember 27 Regelung für den.ten Übungstest:. Wer bei den Professoren Dirschmid, Blümlinger, Vogl oder Langer die UE aus Mathematik 2 gemacht hat, sollte dort die WTH und Statistik

Mehr

5. Schließende Statistik (Inferenzstatistik, konfirmatorische Verfahren)

5. Schließende Statistik (Inferenzstatistik, konfirmatorische Verfahren) 5. Schließende Statistik (Inferenzstatistik, konfirmatorische Verfahren) 5.1. Einführung Schätzen unbekannter Parameter im Modell, z.b. Wahrscheinlichkeiten p i (Anteile in der Gesamtmenge), Erwartungswerte

Mehr

Hypothesenbewertungen: Übersicht

Hypothesenbewertungen: Übersicht Hypothesenbewertungen: Übersicht Wie kann man Fehler einer Hypothese abschätzen? Wie kann man einschätzen, ob ein Algorithmus besser ist als ein anderer? Trainingsfehler, wirklicher Fehler Kreuzvalidierung

Mehr

Wahrscheinlichkeiten. Verteilungen

Wahrscheinlichkeiten. Verteilungen Wahrscheinlichkeiten. Verteilungen 2 2.1 Wahrscheinlichkeitsrechnung Das Ergebnis eines mit Zufälligkeit behafteten Versuchs nennen wir ein Ereignis. Beim Wurf einer Münze sind zwei Ereignisse möglich.

Mehr

Mehrdimensionale Verteilungen und Korrelation

Mehrdimensionale Verteilungen und Korrelation Vorlesung: Computergestützte Datenauswertung Mehrdimensionale Verteilungen und Korrelation Günter Quast Fakultät für Physik Institut für Experimentelle Kernphysik SS '17 KIT Die Forschungsuniversität in

Mehr

Lineare Regression. Kapitel Regressionsgerade

Lineare Regression. Kapitel Regressionsgerade Kapitel 5 Lineare Regression 5 Regressionsgerade Eine reelle Zielgröße y hänge von einer reellen Einflussgröße x ab: y = yx) ; zb: Verkauf y eines Produkts in Stückzahl] hängt vom Preis in e] ab Das Modell

Mehr

Reelle Zufallsvariablen

Reelle Zufallsvariablen Kapitel 3 eelle Zufallsvariablen 3. Verteilungsfunktionen esultat aus der Maßtheorie: Zwischen der Menge aller W-Maße auf B, nennen wir sie W B ), und der Menge aller Verteilungsfunktionen auf, nennen

Mehr

Einige Konzepte aus der Wahrscheinlichkeitstheorie (Wiederh.)

Einige Konzepte aus der Wahrscheinlichkeitstheorie (Wiederh.) Einige Konzepte aus der Wahrscheinlichkeitstheorie (Wiederh.) 1 Zusammenfassung Bedingte Verteilung: P (y x) = P (x, y) P (x) mit P (x) > 0 Produktsatz P (x, y) = P (x y)p (y) = P (y x)p (x) Kettenregel

Mehr

Institut für Stochastik Prof. Dr. N. Henze Dipl.-Math. V. Riess

Institut für Stochastik Prof. Dr. N. Henze Dipl.-Math. V. Riess Institut für Stochastik Prof. Dr. N. Henze Dipl.-Math. V. Riess Name: Vorname: Matrikelnummer: Lösungsvorschlag zur Klausur zur Vorlesung Wahrscheinlichkeitstheorie und Statistik (Stochastik) Datum: 07.

Mehr

Statistik, Datenanalyse und Simulation

Statistik, Datenanalyse und Simulation Dr. Michael O. Distler distler@kph.uni-mainz.de Mainz, 29. Oktober 2007 1. Statistik 1.1 Wahrscheinlichkeit Pragmatisch: p(e) = n(e) N für N sehr groß Kombination von Wahrscheinlichkeiten p(a oder B) =

Mehr

Computer in der Wissenschaft

Computer in der Wissenschaft Dr. Michael O. Distler distler@uni-mainz.de Mainz, 8. Januar 2014 Methode der kleinsten Quadrate Geschichte: Von Legendre, Gauß und Laplace zu Beginn des 19. Jahrhunderts eingeführt. Die Methode der kleinsten

Mehr

1.5 Mehrdimensionale Verteilungen

1.5 Mehrdimensionale Verteilungen Poisson eine gute Näherung, da np = 0 und 500p = 5 00 = n. Wir erhalten somit als Näherung Exakte Rechnung ergibt P(2 X 0) = k=2 0 k=2 π (k) = 0,26424. 0 ( ) 00 P(2 X 0) = 0,0 k 0,99 00 k = 0,264238. k.4.2.4

Mehr

Wahrscheinlichkeitsrechnung und Statistik

Wahrscheinlichkeitsrechnung und Statistik 10. Vorlesung - 2018 Grundbegriffe der Statistik statistische Einheiten = Objekte an denen interessierende Größen erfaßt werden z.b. Bevölkerung einer Stadt; Schüler einer bestimmten Schule; Patienten

Mehr

Theorie Parameterschätzung Ausblick. Schätzung. Raimar Sandner. Studentenseminar "Statistische Methoden in der Physik"

Theorie Parameterschätzung Ausblick. Schätzung. Raimar Sandner. Studentenseminar Statistische Methoden in der Physik Studentenseminar "Statistische Methoden in der Physik" Gliederung 1 2 3 Worum geht es hier? Gliederung 1 2 3 Stichproben Gegeben eine Beobachtungsreihe x = (x 1, x 2,..., x n ): Realisierung der n-dimensionalen

Mehr

13 Mehrdimensionale Zufallsvariablen Zufallsvektoren

13 Mehrdimensionale Zufallsvariablen Zufallsvektoren 3 Mehrdimensionale Zufallsvariablen Zufallsvektoren Bisher haben wir uns ausschließlich mit Zufallsexperimenten beschäftigt, bei denen die Beobachtung eines einzigen Merkmals im Vordergrund stand. In diesem

Mehr

Wahrscheinlichkeitstheorie und Statistik

Wahrscheinlichkeitstheorie und Statistik Wahrscheinlichkeitstheorie und Statistik Definitionen und Sätze Prof. Dr. Christoph Karg Studiengang Informatik Hochschule Aalen Sommersemester 2018 2.5.2018 Diskrete Wahrscheinlichkeitsräume Diskreter

Mehr

Statistics, Data Analysis, and Simulation SS 2017

Statistics, Data Analysis, and Simulation SS 2017 Mainz, 8. Juni 2017 Statistics, Data Analysis, and Simulation SS 2017 08.128.730 Statistik, Datenanalyse und Simulation Dr. Michael O. Distler Dr. Michael O. Distler

Mehr

6. Schätzverfahren für Parameter

6. Schätzverfahren für Parameter 6. Schätzverfahren für Parameter Ausgangssituation: Ein interessierender Zufallsvorgang werde durch die ZV X repräsentiert X habe eine unbekannte Verteilungsfunktion F X (x) Wir interessieren uns für einen

Mehr

Rechnernutzung in der Physik

Rechnernutzung in der Physik Rechnernutzung in der Physik Teil 3 Statistische Methoden in der Datenanalyse Roger Wolf 15. Dezember 215 INSTITUTE OF EXPERIMENTAL PARTICLE PHYSICS (IEKP) PHYSICS FACULTY KIT University of the State of

Mehr

Zufallsgröße X : Ω R X : ω Anzahl der geworfenen K`s

Zufallsgröße X : Ω R X : ω Anzahl der geworfenen K`s X. Zufallsgrößen ================================================================= 10.1 Zufallsgrößen und ihr Erwartungswert --------------------------------------------------------------------------------------------------------------

Mehr

0 sonst. a) Wie lautet die Randwahrscheinlichkeitsfunktion von Y? 0.5 y = 1

0 sonst. a) Wie lautet die Randwahrscheinlichkeitsfunktion von Y? 0.5 y = 1 Aufgabe 1 (2 + 2 + 2 + 1 Punkte) Gegeben sei folgende gemeinsame Wahrscheinlichkeitsfunktion f(x, y) = P (X = x, Y = y) der Zufallsvariablen X und Y : 0.2 x = 1, y = 1 0.3 x = 2, y = 1 f(x, y) = 0.45 x

Mehr

Regression und Korrelation

Regression und Korrelation Kapitel 7 Regression und Korrelation Ein Regressionsproblem behandeltdie VerteilungeinerVariablen, wenn mindestens eine andere gewisse Werte in nicht zufälliger Art annimmt. Ein Korrelationsproblem dagegen

Mehr

Einführung Fehlerrechnung

Einführung Fehlerrechnung Einführung Fehlerrechnung Bei jeder Messung, ob Einzelmessung oder Messreihe, muss eine Aussage über die Güte ( Wie groß ist der Fehler? ) des Messergebnisses gemacht werden. Mögliche Fehlerarten 1. Systematische

Mehr

1 Grundlagen der Wahrscheinlichkeitsrechnung Wahrscheinlichkeitsräume. Ein erster mathematischer Blick auf Zufallsexperimente...

1 Grundlagen der Wahrscheinlichkeitsrechnung Wahrscheinlichkeitsräume. Ein erster mathematischer Blick auf Zufallsexperimente... Inhaltsverzeichnis 1 Grundlagen der Wahrscheinlichkeitsrechnung 1 1.1 Wahrscheinlichkeitsräume Ein erster mathematischer Blick auf Zufallsexperimente.......... 1 1.1.1 Wahrscheinlichkeit, Ergebnisraum,

Mehr

Statistische Methoden der Datenanalyse Wintersemester 2012/2013 Albert-Ludwigs-Universität Freiburg

Statistische Methoden der Datenanalyse Wintersemester 2012/2013 Albert-Ludwigs-Universität Freiburg Statistische Methoden der Datenanalyse Wintersemester 2012/2013 Albert-Ludwigs-Universität Freiburg Prof. Markus Schumacher, Dr. Stan Lai Physikalisches Institut Westbau 2 OG E-Mail: Markus.Schumacher@physik.uni-freiburg.de

Mehr

Die Maximum-Likelihood-Methode

Die Maximum-Likelihood-Methode Vorlesung: Computergestützte Datenauswertung Die Maximum-Likelihood-Methode Günter Quast Fakultät für Physik Institut für Experimentelle Kernphysik SS '17 KIT Die Forschungsuniversität in der Helmholtz-Gemeinschaft

Mehr

Stochastik Wiederholung von Teil 1

Stochastik Wiederholung von Teil 1 Stochastik Wiederholung von Teil 1 Andrej Depperschmidt Sommersemester 2016 Wahrscheinlichkeitsraum Definition Das Tripple (Ω, A, P) heißt Wahrscheinlichkeitsraum, falls gilt: (i) A ist eine σ-algebra,

Mehr

x p 2 (x )dx, Hinweis: es ist nicht erforderlich, zu integrieren!

x p 2 (x )dx, Hinweis: es ist nicht erforderlich, zu integrieren! Aufgabe T- Gegeben seien zwei normalverteilte Zufallsvariablen X N(µ, σ) 2 und X 2 N(µ 2, σ2) 2 mit pdf p (x) bzw. p 2 (x). Bestimmen Sie x (als Funktion der µ i, σ i, sodass x p (x )dx = + x p 2 (x )dx,

Mehr

Statistik. Sommersemester Stefan Etschberger. für Betriebswirtschaft, Internationales Management, Wirtschaftsinformatik und Informatik

Statistik. Sommersemester Stefan Etschberger. für Betriebswirtschaft, Internationales Management, Wirtschaftsinformatik und Informatik Stefan Etschberger für Betriebswirtschaft, Internationales Management, Wirtschaftsinformatik und Informatik Sommersemester 2017 Rechenregeln für den Erwartungswert Ist f symmetrisch bzgl. a, so gilt E(X)

Mehr

Wirtschaftsmathematik

Wirtschaftsmathematik Einführung in einige Teilbereiche der Wintersemester 206 Prof. Dr. Stefan Etschberger HSA Unabhängigkeit von Ereignissen A, B unabhängig: Eintreten von A liefert keine Information über P(B). Formal: P(A

Mehr

Ü b u n g s b l a t t 13

Ü b u n g s b l a t t 13 Einführung in die Stochastik Sommersemester 06 Dr. Walter Oevel 5. 6. 006 Ü b u n g s b l a t t 3 Mit und gekennzeichnete Aufgaben können zum Sammeln von Bonuspunkten verwendet werden. Lösungen von -Aufgaben

Mehr

Das (multiple) Bestimmtheitsmaß R 2. Beispiel: Ausgaben in Abhängigkeit vom Einkommen (I) Parameterschätzer im einfachen linearen Regressionsmodell

Das (multiple) Bestimmtheitsmaß R 2. Beispiel: Ausgaben in Abhängigkeit vom Einkommen (I) Parameterschätzer im einfachen linearen Regressionsmodell 1 Lineare Regression Parameterschätzung 13 Im einfachen linearen Regressionsmodell sind also neben σ ) insbesondere β 1 und β Parameter, deren Schätzung für die Quantifizierung des linearen Zusammenhangs

Mehr

Statistik I für Betriebswirte Vorlesung 14

Statistik I für Betriebswirte Vorlesung 14 Statistik I für Betriebswirte Vorlesung 14 Dr. Andreas Wünsche TU Bergakademie Freiberg Institut für Stochastik 13. Juli 017 Dr. Andreas Wünsche Statistik I für Betriebswirte Vorlesung 14 Version: 8. Juli

Mehr

Wahrscheinlichkeitstheorie und Statistik vom

Wahrscheinlichkeitstheorie und Statistik vom INSTITUT FÜR STOCHASTIK SS 2010 Karlsruher Institut für Technologie Priv.-Doz. Dr. D. Kadelka Klausur Wahrscheinlichkeitstheorie und Statistik vom 14.9.2010 Musterlösungen Aufgabe 1: Gegeben sei eine Urliste

Mehr

i =1 i =2 i =3 x i y i 4 0 1

i =1 i =2 i =3 x i y i 4 0 1 Aufgabe (5+5=0 Punkte) (a) Bei einem Minigolfturnier traten 6 Spieler gegeneinander an. Die Anzahlen der von ihnen über das gesamte Turnier hinweg benötigten Schläge betrugen x = 24, x 2 = 27, x = 2, x

Mehr

I Grundbegriffe 1 1 Wahrscheinlichkeitsräume Bedingte Wahrscheinlichkeiten und Unabhängigkeit Reellwertige Zufallsvariablen...

I Grundbegriffe 1 1 Wahrscheinlichkeitsräume Bedingte Wahrscheinlichkeiten und Unabhängigkeit Reellwertige Zufallsvariablen... Inhaltsverzeichnis I Grundbegriffe 1 1 Wahrscheinlichkeitsräume......................... 1 2 Bedingte Wahrscheinlichkeiten und Unabhängigkeit........... 7 3 Reellwertige Zufallsvariablen........................

Mehr

Statistik für Ingenieure Vorlesung 3

Statistik für Ingenieure Vorlesung 3 Statistik für Ingenieure Vorlesung 3 Prof. Dr. Hans-Jörg Starkloff TU Bergakademie Freiberg Institut für Stochastik 14. November 2017 3. Zufallsgrößen 3.1 Zufallsgrößen und ihre Verteilung Häufig sind

Mehr

Lösungen zur Klausur WAHRSCHEINLICHKEITSTHEORIE UND STATISTIK (STOCHASTIK)

Lösungen zur Klausur WAHRSCHEINLICHKEITSTHEORIE UND STATISTIK (STOCHASTIK) Institut für Stochastik Dr. Steffen Winter Lösungen zur Klausur WAHRSCHEINLICHKEITSTHEORIE UND STATISTIK (STOCHASTIK) für Studierende des Maschinenbaus vom 7. Juli (Dauer: 8 Minuten) Übersicht über die

Mehr

Statistik I für Betriebswirte Vorlesung 13

Statistik I für Betriebswirte Vorlesung 13 Statistik I für Betriebswirte Vorlesung 13 Prof. Dr. Hans-Jörg Starkloff TU Bergakademie Freiberg Institut für Stochastik 4. Juli 2016 Prof. Dr. Hans-Jörg Starkloff Statistik I für Betriebswirte Vorlesung

Mehr

2.2 Binomialverteilung, Hypergeometrische Verteilung, Poissonverteilung

2.2 Binomialverteilung, Hypergeometrische Verteilung, Poissonverteilung 2.2 Binomialverteilung, Hypergeometrische Verteilung, Poissonverteilung Die einfachste Verteilung ist die Gleichverteilung, bei der P(X = x i ) = 1/N gilt, wenn N die Anzahl möglicher Realisierungen von

Mehr

Die Familie der χ 2 (n)-verteilungen

Die Familie der χ 2 (n)-verteilungen Die Familie der χ (n)-verteilungen Sind Z 1,..., Z m für m 1 unabhängig identisch standardnormalverteilte Zufallsvariablen, so genügt die Summe der quadrierten Zufallsvariablen χ := m Z i = Z 1 +... +

Mehr

Die Familie der χ 2 (n)-verteilungen

Die Familie der χ 2 (n)-verteilungen Die Familie der χ (n)-verteilungen Sind Z 1,..., Z m für m 1 unabhängig identisch standardnormalverteilte Zufallsvariablen, so genügt die Summe der quadrierten Zufallsvariablen χ := m Z i = Z 1 +... +

Mehr

Prüfungsvorbereitungskurs Höhere Mathematik 3

Prüfungsvorbereitungskurs Höhere Mathematik 3 Prüfungsvorbereitungskurs Höhere Mathematik 3 Stochastik Marco Boßle Jörg Hörner Marcel Thoms Mathematik Online Herbst 211 PV-Kurs HM 3 Stochastik 1-1 Zusammenfassung Wahrscheinlichkeitsraum (WR): Menge

Mehr

Statistik. Sommersemester Prof. Dr. Stefan Etschberger Hochschule Augsburg. für Betriebswirtschaft und internationales Management

Statistik. Sommersemester Prof. Dr. Stefan Etschberger Hochschule Augsburg. für Betriebswirtschaft und internationales Management für Betriebswirtschaft und internationales Management Sommersemester 2015 Prof. Dr. Stefan Etschberger Hochschule Augsburg Normalverteilung Eine Zufallsvariable X mit einer Dichtefunktion und σ > 0 heißt

Mehr

Biostatistik, Sommer 2017

Biostatistik, Sommer 2017 1/39 Biostatistik, Sommer 2017 Wahrscheinlichkeitstheorie: Gesetz der großen Zahl, Zentraler Grenzwertsatz Schließende Statistik: Grundlagen Prof. Dr. Achim Klenke http://www.aklenke.de 9. Vorlesung: 16.06.2017

Mehr

Biostatistik, Sommer 2017

Biostatistik, Sommer 2017 1/51 Biostatistik, Sommer 2017 Wahrscheinlichkeitstheorie: Verteilungen, Kenngrößen Prof. Dr. Achim Klenke http://www.aklenke.de 8. Vorlesung: 09.06.2017 2/51 Inhalt 1 Verteilungen Normalverteilung Normalapproximation

Mehr

4.2 Moment und Varianz

4.2 Moment und Varianz 4.2 Moment und Varianz Def. 2.10 Es sei X eine zufällige Variable. Falls der Erwartungswert E( X p ) existiert, heißt der Erwartungswert EX p p tes Moment der zufälligen Variablen X. Es gilt dann: EX p

Mehr

Anpassungsrechnungen mit kleinsten Quadraten und Maximum Likelihood

Anpassungsrechnungen mit kleinsten Quadraten und Maximum Likelihood Anpassungsrechnungen mit kleinsten Quadraten und Maximum Likelihood Hauptseminar - Methoden der experimentellen Teilchenphysik WS 2011/2012 Fabian Hoffmann 2. Dezember 2011 Inhaltsverzeichnis 1 Einleitung

Mehr

Modellanpassung und Parameterschätzung. A: Übungsaufgaben

Modellanpassung und Parameterschätzung. A: Übungsaufgaben 7 Modellanpassung und Parameterschätzung 1 Kapitel 7: Modellanpassung und Parameterschätzung A: Übungsaufgaben [ 1 ] Bei n unabhängigen Wiederholungen eines Bernoulli-Experiments sei π die Wahrscheinlichkeit

Mehr