Statistische Methoden
|
|
- Krista Pohl
- vor 5 Jahren
- Abrufe
Transkript
1 Statistische Methoden Henning Gast (RWTH Aachen University) Grundpraktikum Physik, Oktober 2014 Henning Gast (RWTH Aachen University) Statistik 1
2 Inhalt 1 Wahrscheinlichkeit Grundbegriffe der Wahrscheinlichkeitsrechnung Wichtige Wahrscheinlichkeitsdichten Mehrere Zufallsgrößen 2 Statistische Messunsicherheiten Parameterschätzung Definition der statistischen Messunsicherheit Fehlerfortpflanzung 3 Modellanpassung Methode der kleinsten Quadrate Lineare Regression 4 Systematische Unsicherheiten Definition und Abschätzung Henning Gast (RWTH Aachen University) Statistik 2
3 Literatur G. Cowan, Statistical Data Analysis, Oxford University Press, ISBN R. Barlow, Statistics, Wiley, ISBN V. Blobel und E. Lohrmann, Statistische und numerische Methoden der Datenanalyse, ebuch: blobel/ebuch.html Henning Gast (RWTH Aachen University) Statistik 3
4 Messunsicherheiten Im Praktikum sollen alle Messergebnisse zusammen mit ihrer Unsicherheit angegeben werden, z.b.: R = Ω ± 0.10 Ω Die Unsicherheit gibt dabei an, mit welcher Genauigkeit eine Größe im Praktikum mit den zur Verfügung stehenden Mitteln bestimmt werden konnte. Sie spiegelt die Qualität und die Präzision einer Messung wider, vorausgesetzt dass sie korrekt bestimmt wurde. Wichtig ist die Unterscheidung zwischen statistischen und systematischen Unsicherheiten, dazu später mehr. Bei der Angabe des Messergebnisses sollen nur die im Rahmen der Genauigkeit signifikanten Stellen angegeben werden. (Am besten, 2 signifikante Stellen angeben, um Rundungsfehler klein zu halten.) Henning Gast (RWTH Aachen University) Statistik 4
5 Inhalt 1 Wahrscheinlichkeit Grundbegriffe der Wahrscheinlichkeitsrechnung Wichtige Wahrscheinlichkeitsdichten Mehrere Zufallsgrößen 2 Statistische Messunsicherheiten Parameterschätzung Definition der statistischen Messunsicherheit Fehlerfortpflanzung 3 Modellanpassung Methode der kleinsten Quadrate Lineare Regression 4 Systematische Unsicherheiten Definition und Abschätzung Henning Gast (RWTH Aachen University) Statistik 5
6 Wahrscheinlichkeit Wir betrachten eine Menge S und nennen sie den Parameterraum. Jeder Untermenge A von S weisen wir eine reelle Zahl P(A) zu, die wir Wahrscheinlichkeit nennen. Kolmogorov Axiome (1933) 1 Für jede Untermenge A in S: P(A) 0. 2 Für alle disjunkten Untermengen A and B: P(A B) = P(A) + P(B). 3 P(S) = 1. Wir möchten mit reellen Zahlen statt mit Elementen von Mengen rechnen, deshalb definieren wir: Definition Eine Abbildung X : S R n heißt Zufallsgröße. Henning Gast (RWTH Aachen University) Statistik 6
7 Bedingte Wahrscheinlichkeit Definition Für zwei Untermengen A und B des Parameterraums ist die bedingte Wahrscheinlichkeit P(A B) definiert durch P(A B) = P(A B) P(B) Die zwei Untermengen heißen unabhängig, wenn P(A B) = P(A) P(B). Wegen A B = B A, P(B A) = P(A B)P(B) = P(B A)P(A), und so kommen wir zu dem Theorem (Satz von Bayes) P(A B) = P(B A)P(A) P(B) Henning Gast (RWTH Aachen University) Statistik 7
8 Interpretation von Wahrscheinlichkeiten Frequentistische Interpretation P(A) = lim n Anzahl der Vorkommnisse von Ausgang A in n Messungen n Zugrunde liegende Annahme: Das Zufallsexperiment kann prinzipiell beliebig oft wiederholt werden. Beispiel: Messung der Kapazität eines Kondensators. Problematischer: Aussagen über Zufallsexperimente, die nur ein einziges Mal durchgeführt werden können, z.b.: Morgen wird es regnen. Henning Gast (RWTH Aachen University) Statistik 8
9 Wahrscheinlichkeitsdichte Betrachten wir einen Parameterraum S und eine Zufallsgröße X : S R. Definition Die Wahrscheinlichkeitsdichte von X ist definiert als f (x) dx = P(X ergibt Wert in [x, x + dx]) f (x) ist normiert, so dass S f (x) dx = 1 Die Definition gilt genauso für kontinuierliche wie für diskrete Zufallsgrößen. Henning Gast (RWTH Aachen University) Statistik 9
10 Histogramme Henning Gast (RWTH Aachen University) Statistik 10
11 Kumulative Verteilung Definition Die kumulative Verteilung F(x) zu einer Wahrscheinlichkeitsdichte f (x) ist definiert durch F (x) = x f (x ) dx Henning Gast (RWTH Aachen University) Statistik 11
12 Erwartungswert und Varianz Wir betrachten eine 1-D Zufallsgröße X. Um Mittelwert und Streuung von X zu charakterisieren, definieren wir: Definition Der Erwartungswert oder Mittelwert von X ist gegeben durch E[X] = Die Varianz von X ist gegeben durch V [X] = xf (x) dx = µ (x µ) 2 f (x) dx = σ 2 Die Standardabweichung von X ist gegeben durch σ = V [X]. Diese Größe ist sinnvoll, weil sie dieselben Einheiten hat wie x. Beachte, dass V [X] = (E[X 2 ]) µ 2. Henning Gast (RWTH Aachen University) Statistik 12
13 Inhalt 1 Wahrscheinlichkeit Grundbegriffe der Wahrscheinlichkeitsrechnung Wichtige Wahrscheinlichkeitsdichten Mehrere Zufallsgrößen 2 Statistische Messunsicherheiten Parameterschätzung Definition der statistischen Messunsicherheit Fehlerfortpflanzung 3 Modellanpassung Methode der kleinsten Quadrate Lineare Regression 4 Systematische Unsicherheiten Definition und Abschätzung Henning Gast (RWTH Aachen University) Statistik 13
14 Gauß-Verteilung Definition E[X] = µ V [X] = σ 2 f (x; µ, σ) = Die Wichtigkeit der Gauß-Verteilung liegt im zentralen Grenzwertsatz begründet: Die Summe von n unabhängigen kontinuierlichen Zufallsgrößen mit Mittelwerten µ i und endlichen Varianzen σ 2 i nähert sich im Grenzfall n einer Gauß-Verteilung mit Mittelwert µ = i µ i und Varianz σ 2 = i σ2 i. ( ) 1 exp (x µ)2 2πσ 2 2σ 2 Henning Gast (RWTH Aachen University) Statistik 14
15 Binomial-Verteilung Betrachte eine Serie von N unabhängigen Versuchen oder Beobachtungen, von denen jede zwei Mögliche Ausgänge hat ( 1 oder 0 ), mit fester Wahrscheinlichkeit p für 1 (Bernoulli-Experiment). Die Wahrscheinlichkeit, k-mal 1 in N Versuchen zu messen, ist Definition f (k; N, p) = ( ) N p k (1 p) N k k with ( ) N N! = k k!(n k)! E[X] = Np V [X] = Np(1 p) Henning Gast (RWTH Aachen University) Statistik 15
16 Poisson-Verteilung Betrachte die Binomial-Verteilung im Grenzfall, dass N sehr groß wird, p sehr klein wird, aber das Produkt np konstant gleich einem endlichen Wert ν bleibt. Dann nähert sich die Binomial-Verteilung einer Poisson-Verteilung an: Definition f (k; ν) = νk k! e ν E[X] = ν V [X] = ν Beispiel: Zählexperiment. Für große ν nähert sich die Poisson-Verteilung einer Gauß-Verteilung mit Mittelwert ν und Varianz ν an. Henning Gast (RWTH Aachen University) Statistik 16
17 Gleichverteilung Definition Die Gleichverteilung ist gegeben durch E[X] = 1 2 (α + β) V [X] = 1 12 (β α)2 Beispiele: f (x; α, β) = { 1 β α α x β 0 otherwise Digitalisierung im Analog-Digital-Wandler (ADC) Maßband (Intervall zwischen zwei Skalenstrichen) Henning Gast (RWTH Aachen University) Statistik 17
18 Inhalt 1 Wahrscheinlichkeit Grundbegriffe der Wahrscheinlichkeitsrechnung Wichtige Wahrscheinlichkeitsdichten Mehrere Zufallsgrößen 2 Statistische Messunsicherheiten Parameterschätzung Definition der statistischen Messunsicherheit Fehlerfortpflanzung 3 Modellanpassung Methode der kleinsten Quadrate Lineare Regression 4 Systematische Unsicherheiten Definition und Abschätzung Henning Gast (RWTH Aachen University) Statistik 18
19 Gemeinsame Wahrscheinlichkeitsdichte und Kovarianz Definition Seien X und Y zwei Zufallsgrößen. Die gemeinsame Wahrscheinlichkeitsdichte f (x, y) ist definiert als P(X(ω) [x, x + dx] Y (ω) [y, y + dy]) = f (x, y) dx dy für alle ω S. Definition Die Kovarianz von zwei Zufallsgrößen X and Y ist definiert als V xy = E[(x µ x )(y µ y )] = E[xy] µ x µ y = xy f (x, y) dx dy µ x µ y Henning Gast (RWTH Aachen University) Statistik 19
20 Korrelationskoeffizient Ein dimensionsloses Maß für die Korrelation zwischen zwei Zufallsgrößen ist gegeben durch den Korrelationskoeffizienten ρ xy = V xy σ x σ y Man kann zeigen, dass 1 ρ xy 1. Per Konstruktion ist die Kovarianzmatrix V ab symmetrisch in a und b, und die Diagonalelemente V aa = σ 2 a (d.h. die Varianzen) sind positiv. Henning Gast (RWTH Aachen University) Statistik 20
21 Streudiagramme Henning Gast (RWTH Aachen University) Statistik 21
22 Rechnen mit Erwartungswerten Aus der Definition des Erwartungswert folgt: Für die Multiplikation einer Zufallsgröße mit einer Konstanten a: E[aX] = ae[x] V [ax] = a 2 V [X] Für die Summe zweier Zufallsgrößen X und Y : E[X + Y ] = E[X] + E[Y ] V [X + Y ] = V [X] + V [Y ] wobei die letzte Beziehung nur gilt, wenn X and Y unabhängig sind, d.h. die gemeinsame Wahrscheinlichkeitsdichte faktorisiert: f (x, y) dx dy = f x (x)f y (y) dx dy. Henning Gast (RWTH Aachen University) Statistik 22
23 Inhalt 1 Wahrscheinlichkeit Grundbegriffe der Wahrscheinlichkeitsrechnung Wichtige Wahrscheinlichkeitsdichten Mehrere Zufallsgrößen 2 Statistische Messunsicherheiten Parameterschätzung Definition der statistischen Messunsicherheit Fehlerfortpflanzung 3 Modellanpassung Methode der kleinsten Quadrate Lineare Regression 4 Systematische Unsicherheiten Definition und Abschätzung Henning Gast (RWTH Aachen University) Statistik 23
24 Einführung in die Parameterschätzung Die Parameter einer Wahrscheinlichkeitsdichte sind Konstanten, die ihre Form beschreiben, z.b. θ in f (x; θ) = 1 θ e x/θ Um den unbekannten Parameter θ zu bestimmen, benutzen wir eine Stichprobe von Beobachtungswerten x = (x 1,..., x n ), die entsprechend der Wahrscheinlichkeitsdichte verteilt sind. Die Aufgabe besteht nun darin, eine Funktion der Daten zu finden, um den gesuchten Parameter zu schätzen: ˆθ(x) ˆθ(x) wird Schätzgröße für den unbekannten Parameter θ genannt. Im Allgemeinen heißt eine Funktion, die Beobachtungsdaten (x 1,..., x n ) eine Zahl zuordnet, eine Testgröße. Henning Gast (RWTH Aachen University) Statistik 24
25 Beispiel: Schätzgrößen für Mittelwert und Varianz Wir wollen eine Schätzgröße für den Mittelwert µ einer Wahrscheinlichkeitsdichte mit völlig unbekannter Form angeben, basierend auf der Stichprobe (x 1,..., x n ). Wir benutzen das arithmetische Mittel x = 1 n x i n i=1 Der Erwartungswert von x ergibt sich zu [ ] 1 n E[ x] = E x i = 1 n E[x i ] = 1 n n n i=1 i=1 n µ = µ was bedeutet, dass x in der Tat eine erwartungstreue Schätzgröße für µ ist. Man kann zeigen, dass die empirische Varianz s 2 = 1 n 1 n (x i x) 2 eine erwartungstreue Schätzgröße für die unbekannte Varianz ist: E[s 2 ] = σ 2. i=1 i=1 Henning Gast (RWTH Aachen University) Statistik 25
26 Schätzgröße für die Kovarianz Ähnlich kann gezeigt werden, dass die Größe ˆV xy = 1 n 1 n (x i x)(y i ȳ) = n (xy xȳ) n 1 i=1 eine erwartungstreue Schätzgröße für die Kovarianz V xy zweier Zufallsgrößen X und Y mit unbekanntem Mittelwert ist. Henning Gast (RWTH Aachen University) Statistik 26
27 Varianz des arithmetischen Mittels Für die Varianz des arithmetischen Mittels finden wir ( ) V [ x] = E[ x 2 ] (E[ x]) 2 = E 1 n x i 1 n n n = 1 n n 2 E[x i x j ] µ 2 i,j=1 i=1 = 1 n 2 [(n2 n)µ 2 + n(µ 2 + σ 2 )] µ 2 = σ2 n wo wir benutzt haben, dass E[x i x j ] = µ 2 für i j und E[x i x j ] = µ 2 + σ 2 für i = j. j=1 x j µ 2 Dieses Ergebnis bedeutet, dass die Unsicherheit des Mittelwerts bei n Messungen von x gleich der Standardabweichung von f (x) ist, geteilt durch n. Henning Gast (RWTH Aachen University) Statistik 27
28 Inhalt 1 Wahrscheinlichkeit Grundbegriffe der Wahrscheinlichkeitsrechnung Wichtige Wahrscheinlichkeitsdichten Mehrere Zufallsgrößen 2 Statistische Messunsicherheiten Parameterschätzung Definition der statistischen Messunsicherheit Fehlerfortpflanzung 3 Modellanpassung Methode der kleinsten Quadrate Lineare Regression 4 Systematische Unsicherheiten Definition und Abschätzung Henning Gast (RWTH Aachen University) Statistik 28
29 Statistische Messunsicherheit Wir betrachten zwei experimentelle Gegebenheiten: Ein bestimmter Parameter soll aus einer Menge von n wiederholten Messungen bestimmt werden. Wie stark streuen die Messungen? ( Standardfehler) Der unbekannte wahre Parameter einer Wahrscheinlichkeitsdichte soll aus einem einzelnen Experiment bestimmt werden. Mit welcher Genauigkeit kann der Parameter bestimmt werden? ( Konfidenzintervall) In beiden Fällen sind wir daran interessiert, ein Intervall zu finden, das den wahren Wert der zu messenden Größe mit einer Wahrscheinlichkeit von 68 % enthält. Motivation: Bei der Gauß-Verteilung gilt: µ+σ µ σ 1 2πσ exp ( ) (x µ)2 2σ 2 dx 0.68 Semantik: Was verstehen wir unter den folgenden Begriffen? Fehler Unsicherheit Henning Gast (RWTH Aachen University) Statistik 29
30 Standardabweichung als statistischer Fehler Wenn wir die Messung eines (wahren aber unbekannten) Parameters θ t mehrfach wiederholen und dabei Messwerte (t 1,..., t n ) erhalten, können wir das arithmetische Mittel θ = (1/n) t i und die empirische Standardabweichung σ θ berechnen. Für n Wiederholungen wird die Unsicherheit auf das arithmetische Mittel, das aus allen Messungen berechnet wird, σ θ / n betragen. Wir können dann θ ± σ θ / n als Ergebnis der Messung angeben. Aber: Welcher Anteil der Messungen wird im Mittel einen Wert im Intervall [θ σ θ / n, θ + σ θ / n] ergeben? Es stellt sich heraus, dass dieses simple Verfahren streng nur für Gauß-verteilte Messgrößen gilt. Henning Gast (RWTH Aachen University) Statistik 30
31 Konfidenzintervalle Problemstellung: Wir möchten auf einen Parameter µ schließen, dessen wahrer Wert µ t unbekannt ist. Dazu führen wir eine einzelne Messung einer Observablen x durch. Die Wahrscheinlichkeitsdichte dafür, x in Abhängigkeit des unbekannten Parameters µ zu erhalten, nehmen wir als bekannt an und nennen diese Wahrscheinlichkeitsdichte P(x µ). Unsere Messung ergebe nun den Wert x 0. Ein Konfidenzintervall [µ 1, µ 2 ] ist ein Element einer Menge, die durch die Eigenschaft P(µ [µ 1, µ 2 ]) = α definiert ist. α heißt Konfidenzniveau. Henning Gast (RWTH Aachen University) Statistik 31
32 Inhalt 1 Wahrscheinlichkeit Grundbegriffe der Wahrscheinlichkeitsrechnung Wichtige Wahrscheinlichkeitsdichten Mehrere Zufallsgrößen 2 Statistische Messunsicherheiten Parameterschätzung Definition der statistischen Messunsicherheit Fehlerfortpflanzung 3 Modellanpassung Methode der kleinsten Quadrate Lineare Regression 4 Systematische Unsicherheiten Definition und Abschätzung Henning Gast (RWTH Aachen University) Statistik 32
33 Fehlerfortpflanzung Wir betrachten eine Menge von n Zufallsgrößen x = (x 1,..., x n ), die gemäß einer gewissen gemeinsamen Wahrscheinlichkeitsdichte f (x) verteit seien. Die Wahrscheinlichkeitsdichte selbst ist unbekannt, aber die Mittelwerte der x i, µ = (µ 1,..., µ n ) sowie die Kovarianzmatrix V ij seien bekannt oder abgeschätzt. Unser Ziel ist die Bestimmung der Varianz V [y] einer Funktion y(x) der n Variablen. (Beispiel: Bestimmung eines Ohmschen Widerstands aus Messung von Strom und Spannung über R = U/I.) Dazu entwickeln wir y(x) bis zur ersten Ordnung um die Mittelwerte der x i : n [ ] y y(x) y(µ) + (x i µ i ) x i x=µ i=1 Wegen E[x i µ i ] = 0, ist der Erwartungswert von y E[y(x)] y(µ) Henning Gast (RWTH Aachen University) Statistik 33
34 Fehlerfortpflanzung Der Erwartungswert von y 2 ist E[y 2 (x)] y 2 (µ) + 2y(µ) ( n [ ] + E y x i i=1 = y 2 (µ) + n i,j=1 n [ ] y E[x i µ i ] x i x=µ (x i µ i )) n [ ] y x j i=1 x=µ [ y x i y x j ] V ij x=µ j=1 x=µ so dass die Varianz σ 2 y = E[y 2 ] (E[y]) 2 gegeben ist durch Gauß sche Fehlerfortpflanzung n σy 2 i,j=1 [ ] y y V ij x i x j x=µ (x j µ j ) Henning Gast (RWTH Aachen University) Statistik 34
35 Häufige Spezialfälle Für den Fall, dass die x i nicht korreliert sind, d.h. V ii = σ 2 i und V ij = 0 für i j, erhalten wir die wohlbekannte Formel σ 2 y n [ y i=1 x i ] 2 σi 2 x=µ Wir betrachten zwei Spezialfälle: Wenn y = x 1 + x 2, ergibt sich die Varianz von y zu σ 2 y = σ σ V 12 Für das Produkt y = x 1 x 2 erhalten wir σy 2 y 2 = σ2 1 x1 2 + σ2 2 x V 12 x 1 x 2 Henning Gast (RWTH Aachen University) Statistik 35
36 Inhalt 1 Wahrscheinlichkeit Grundbegriffe der Wahrscheinlichkeitsrechnung Wichtige Wahrscheinlichkeitsdichten Mehrere Zufallsgrößen 2 Statistische Messunsicherheiten Parameterschätzung Definition der statistischen Messunsicherheit Fehlerfortpflanzung 3 Modellanpassung Methode der kleinsten Quadrate Lineare Regression 4 Systematische Unsicherheiten Definition und Abschätzung Henning Gast (RWTH Aachen University) Statistik 36
37 Die Methode der kleinsten Quadrate Angenommen, wir haben eine Menge von N unabhängigen Gauß schen Zufallsgrößen y i, an verschiedenen Orten x i. Jeder Wert y i hat einen anderen Mittelwert λ i, der durch eine Funktion λ = λ(x; θ) gegeben ist, aber eine bekannte Varianz σ 2 i. λ hängt von m Parametern (θ 1,..., θ m ) ab, welche wir bestimmen wollen. Die Parameter, die die Größe χ 2 (θ) = N (y i λ(x i ; θ)) 2 σ 2 i=1 i minimieren, heißen χ 2 -Schätzgrößen (LS, least-squares) für die θ. Henning Gast (RWTH Aachen University) Statistik 37
38 Varianz der χ 2 -Schätzgrößen Man kann zeigen, dass für den Fall eines freien Parameters die Unsicherheit auf die best-fit Parameter θ 0 durch diejenigen Werte gegeben ist, bei denen wird. χ 2 (θ) = χ 2 min + 1 Henning Gast (RWTH Aachen University) Statistik 38
39 Güte der Anpassung (goodness of fit) Der Wert von χ 2 min ist ein Maß für die Übereinstimmung zwischen den Daten und der angepassten Modellkurve: χ 2 min = N (y i λ(x i ; ˆθ)) 2 σ 2 i=1 i Er kann deshalb als so genannte goodness-of-fit Testgröße benutzt werden, um die Hypothese der funktionalen Form λ(x; θ) zu testen. Man kann zeigen, dass wenn die Hypothese korrekt ist, die Testgröße t = χ 2 min einer χ2 -Verteilung folgt: f (t; n df ) = 1 2 n df /2 Γ(n df /2) t n df /2 1 e t/2 wobei n df die Anzahl der Freiheitsgrade ist: n df = Anzahl der Datenpunkte Anzahl der freien Parameter Henning Gast (RWTH Aachen University) Statistik 39
40 Güte der Anpassung Man erwartet χ 2 min /n df 1. Für den Fall, dass... χ 2 /n df 1: Sind die angenommenen Messunsicherheiten zu klein? Ist die funktionale Form der Hypothese λ(x; θ) korrekt? Den Mangel an Übereinstimmung kann man durch den p-value quantifizieren: p = χ 2 min f (t; n df ) dt also die Wahrscheinlichkeit für den Fall einer korrekten Hypothese, einen Wert von χ 2 min zu erhalten, der so groß wie oder größer ist als derjenige, den wir tatsächlich gefunden haben. ( TMath::Prob() ) χ 2 /n df 1: Sind die angenommenen Messunsicherheiten zu groß? Folgen die Datenpunkte wirklich unabhängigen Zufallsgrößen? χ 2 /n df 1: Sind die angenommenen Messunsicherheiten wirklich korrekt? Wie sieht der Residuenplot aus? Henning Gast (RWTH Aachen University) Statistik 40
41 Residuenplots Henning Gast (RWTH Aachen University) Statistik 41
42 Zusammenfassen von Messungen Es sei eine unbekannte Größe λ in N verschiedenen Experimenten gemessen worden, die unabhängige Messwerte y i mit abgeschätzten Unsicherheiten σ i geliefert haben. Die χ 2 -Schätzgröße ˆλ für λ kann dadurch abgeleitet werden, dass wir χ 2 (λ) = N (y i λ) 2 i=1 minimieren. Gleichsetzen von χ 2 (λ)/ λ = 0 liefert σ 2 i ˆλ = N i=1 y i/σ 2 i N i=1 1/σ2 i also die wohlbekannte Formel für das gewichtete Mittel. Die zweite Ableitung von χ 2 liefert die Varianz von ˆλ (hier ohne Beweis): 1 V [ˆλ] = N i=1 1/σ2 i (Eine analoge Methode wird im Praktikum zur nummerischen Bestimmung der Maxima einer Kurve eingesetzt (Peakfinding).) Henning Gast (RWTH Aachen University) Statistik 42
43 Inhalt 1 Wahrscheinlichkeit Grundbegriffe der Wahrscheinlichkeitsrechnung Wichtige Wahrscheinlichkeitsdichten Mehrere Zufallsgrößen 2 Statistische Messunsicherheiten Parameterschätzung Definition der statistischen Messunsicherheit Fehlerfortpflanzung 3 Modellanpassung Methode der kleinsten Quadrate Lineare Regression 4 Systematische Unsicherheiten Definition und Abschätzung Henning Gast (RWTH Aachen University) Statistik 43
44 Lineare Regression Eine häufige Anwendung der Methode der kleinsten Quadrate besteht in der Bestimmung von Steigung m und Achsenabschnitt c einer Geraden y = mx + c an n Paare von Messpunkten (x 1, y 1 ),..., (x n, y n ) mit Messunsicherheiten σ i auf die y i, während die x i als genau bekannt angenommen werden. Beispiel: Messung der Schallgeschwindigkeit aus Resonanzlängen einer stehenden Welle gemäß L n = (v/2f ) n. Zu minimieren ist n ( ) 2 χ 2 yi y(x i ) n ( ) 2 yi mx i c = = i=1 σ i i=1 σ i Henning Gast (RWTH Aachen University) Statistik 44
45 Lineare Regression oder χ 2 = n ( yi mx i c i=1 σ i ) 2 χ 2 c = 2 y i ˆmx i ĉ σi 2 yi xi σi 2 σi 1 ˆm 2 1 σi 2 σi 2 wo wir z.b. definieren: = y i σ 2 i ĉ = 0 ȳ ˆm x ĉ = 0 x = x i σi 2 / 1 σi 2 ˆm x i σ 2 i ĉ 1 σ 2 i = 0 Henning Gast (RWTH Aachen University) Statistik 45
46 Lineare Regression χ 2 = n ( yi mx i c i=1 σ i ) 2 χ 2 m = 2 y i ˆmx i ĉ σi 2 x i = x i y i σi 2 xy ˆmx 2 ĉ x = 0 ˆm xi 2 σi 2 ĉ x i σ 2 i = 0 Als Lösung des Gleichungssystems ergibt sich schließlich: ˆm = xy xȳ x 2 x 2 und ĉ = ȳ ˆm x Henning Gast (RWTH Aachen University) Statistik 46
47 Lineare Regression Zur Bestimmung der Unsicherheit σ ˆm auf ˆm schreiben wir ˆm = x i x N(x 2 x 2 ) y i wobei N = 1 σi 2 und mit dem Gesetz über die Fehlerfortpflanzung folgt dann σ ˆm = ( ) 2 x i x σ N(x 2 x 2 i 2 ) Analog ergibt sich σĉ = ( ) 2 x 2 xx i σ N(x 2 x 2 i 2 ) Henning Gast (RWTH Aachen University) Statistik 47
48 Korrelation zwischen m und c Vorsicht: Im Allgemeinen gibt es eine Korrelation zwischen Steigung m und Achsenabschnitt c bei der linearen Regression, die z.b. für den Fall σ i = σ gegeben ist durch ρ ˆm,ĉ = x x 2 Dadurch erhöht sich die Unsicherheit auf m und c! Die Korrelation verschwindet offenbar für den Fall x = 0. Diesen Fall können wir erreichen, indem wir die Geradengleichung wie folgt modifizieren: y = m(x x 0 ) + c mit x 0 = x. Der Parameter x 0 muss im Fit festgehalten werden! Henning Gast (RWTH Aachen University) Statistik 48
49 Lineare Regression mit Unsicherheiten in beiden Messgrößen Im Allgemeinen sind die x-koordinaten der Datenpunkte nicht beliebig genau bekannt, sondern weisen Messunsicherheiten σ xi auf. In erster Näherung kann man diese Unsicherheiten berücksichtigen, indem man die folgende Größe minimiert: χ 2 = i (y i f (x i )) 2 σ 2 yi + (f (x i )σ xi ) 2 Diese Methode heißt Methode der effektiven Varianz. Henning Gast (RWTH Aachen University) Statistik 49
50 Inhalt 1 Wahrscheinlichkeit Grundbegriffe der Wahrscheinlichkeitsrechnung Wichtige Wahrscheinlichkeitsdichten Mehrere Zufallsgrößen 2 Statistische Messunsicherheiten Parameterschätzung Definition der statistischen Messunsicherheit Fehlerfortpflanzung 3 Modellanpassung Methode der kleinsten Quadrate Lineare Regression 4 Systematische Unsicherheiten Definition und Abschätzung Henning Gast (RWTH Aachen University) Statistik 50
51 Definitionen Betrachten wir die folgenden zwei Situationen: Mit einem Metall-Lineal werden Längenmessungen durchgeführt. Das Lineal wurde bei einer Temperatur von 15 C kalibriert, aber die Messungen werden in einem wärmeren Labor durchgeführt und der Experimentator versäumt es, für die thermische Expansion zu korrigieren. Zur Bestimmung der Schallgeschwindigkeit wird die Wellenlänge einer stehenden Schallwelle ausgemessen. Dazu wird ein Wegaufnehmer verwendet, der zuvor nur mit einer endlichen Präzision kalibriert werden konnte. Frei übersetzt nach R. Barlow Es ist essentiell, systematische Effekte von systematischen Fehlern zu unterscheiden, die die Unsicherheiten in der Größe dieser Effekte sind, und von handwerklichen Fehlern, die aus dem Übersehen solcher Effekte herrühren. In diesem Sinne ist der Ausdruck systematische Unsicherheit sprachlich präziser als der Ausdruck systematischer Fehler. Henning Gast (RWTH Aachen University) Statistik 51
52 Abschätzung systematischer Messunsicherheiten Es existieren viele Methoden, um systematische Messunsicherheiten abzuschätzen. Wir nehmen an, dass das Ergebnis von einer Menge von N unbekannten Parametern φ abhängt und dass wir zumindest grobe Kenntnis ihrer Wahrscheinlichkeitsdichten haben. Im Praktikum benutzen wir vor allem die Verschiebemethode: Für N unbekannte Parameter φ = (φ 1,..., φ n ) mit unkorrelierten Gauß schen Unsicherheiten σ i, und einer Schätzgröße f (φ 1,..., φ n ) für die uns interessierende physikalische Größe, liefert die lineare Näherung: σ 2 f N ( f i=1 φ i ) 2 σ 2 i Die partiellen Ableitungen können als finite Differenzen angenähert werden: f f (φ 1,..., φ i + σ i,..., φ N ) f (φ 1,..., φ i,..., φ N ) = i φ i σ i σ i und so erhalten wir σ 2 f N i=1 2 i. Henning Gast (RWTH Aachen University) Statistik 52
53 Beispiel für die Verschiebemethode Beispiel: Ein Ohmscher Widerstand R soll aus einer linearen Regression an Messpunkte (U i, I i ) aus Spannungs- und Strommessungen bestimmt werden. Der Hersteller des Messgeräts gibt die folgenden systematischen Unsicherheiten auf Spannungsund Strommessungen an: σ U,sys = (0.01U i U Bereichsendwert )/ 3 σ I,sys = (0.02I i I Bereichsendwert )/ 3 Man studiert dann die Verschiebungen, die man jeweils für R erhält, wenn man die Spannungsmessungen bzw. die Strommessungen um die systematischen Unsicherheiten verschiebt. Die systematische Unsicherheit auf R erhält man schließlich durch quadratische Addition der Verschiebungen. Henning Gast (RWTH Aachen University) Statistik 53
54 Vergleich Statistische Fehler geben eine nicht zu vermeidende, zufällige Fluktuation der Messwerte wieder, können aus der Wiederholung von Messungen unter identischen Bedungungen bestimmt werden und fallen dabei wie 1/ n. Systematische Fehler basieren auf Effekten, die stets zu derselben, unbekannten Abweichung von Messwerten führen, können durch Wiederholung der Messung weder abgeschätzt noch reduziert werden, dürfen daher auch nicht als Gewicht beim gewichteten Mittel eingesetzt werden. Die statistischen und systematischen Unsicherheiten sollten getrennt ausgwiesen werden, z.b.: R = 99.8 Ω ± 0.1 Ω (stat.) ± 0.5 Ω (syst.) Henning Gast (RWTH Aachen University) Statistik 54
55 Zusammenfassung der wichtigsten Konzepte Empirisches Mittel, Standardabweichung, Fehler des Mittelwerts: x = 1 N x i σ x = 1 N (x i x) N N 1 2 σ x = σ x N i=1 Gewichtetes Mittel Wichtige Wahrscheinlichkeitsdichten: Gauß-Verteilung, Binomial-Verteilung, Poisson-Verteilung, Gleichverteilung Gauß sche Fehlerfortpflanzung, z.b.: y = A m B n i=1 ( ) 2 σy ( m σ A y A Regressionsrechnung, χ 2, Residuenplots ) 2 + ( Statistische und systematische Unsicherheiten n σ B B ) 2 Henning Gast (RWTH Aachen University) Statistik 55
Statistische Methoden
Statistische Methoden Henning Gast Grundpraktikum Physik, März 2016 Henning Gast Statistik 1 Inhalt 1 Wahrscheinlichkeit Grundbegriffe der Wahrscheinlichkeitsrechnung Wichtige Wahrscheinlichkeitsdichten
MehrWichtige Definitionen und Aussagen
Wichtige Definitionen und Aussagen Zufallsexperiment, Ergebnis, Ereignis: Unter einem Zufallsexperiment verstehen wir einen Vorgang, dessen Ausgänge sich nicht vorhersagen lassen Die möglichen Ausgänge
MehrStatistics, Data Analysis, and Simulation SS 2017
Statistics, Data Analysis, and Simulation SS 2017 08.128.730 Statistik, Datenanalyse und Simulation Dr. Michael O. Distler Mainz, 4. Mai 2017 Dr. Michael O. Distler
MehrNumerische Methoden und Algorithmen in der Physik
Numerische Methoden und Algorithmen in der Physik Hartmut Stadie, Christian Autermann 15.01.2009 Numerische Methoden und Algorithmen in der Physik Christian Autermann 1/ 47 Methode der kleinsten Quadrate
MehrDatenanalyse. (PHY231) Herbstsemester Olaf Steinkamp
Datenanalyse (PHY23) Herbstsemester 207 Olaf Steinkamp 36-J-05 olafs@physik.uzh.ch 044 63 55763 Vorlesungsprogramm Einführung, Messunsicherheiten, Darstellung von Messdaten Grundbegriffe der Wahrscheinlichkeitsrechnung
MehrStatistik - Fehlerrechnung - Auswertung von Messungen
Statistik - Fehlerrechnung - Auswertung von Messungen TEIL II Vorbereitungskurs F-Praktikum B (Physik), RWTH Aachen Thomas Hebbeker Eindimensionaler Fall: Parameterbestimmung - Beispiele [Übung] Mehrdimensionaler
MehrModerne Methoden der Datenverarbeitung in der Physik I
Moderne Methoden der Datenverarbeitung in der Physik I Prof. Dr. Stefan Schael / Dr. Thomas Kirn I. Physikalisches Institut MAPLE II, Krypthographie Wahrscheinlichkeit Zufallszahlen, Wahrscheinlichkeitsdichten,
MehrStatistik und Wahrscheinlichkeitsrechnung
Statistik und Wahrscheinlichkeitsrechnung Dr. Jochen Köhler 1 Inhalt der heutigen Vorlesung Statistik und Wahrscheinlichkeitsrechnung Zusammenfassung der vorherigen Vorlesung Übersicht über Schätzung und
MehrDatenanalyse. (PHY231) Herbstsemester Olaf Steinkamp
Datenanalyse (PHY231) Herbstsemester 2015 Olaf Steinkamp 36-J-22 olafs@physik.uzh.ch 044 63 55763 Vorlesungsprogramm Einführung, Messunsicherheiten, Darstellung von Messdaten Grundbegriffe der Wahrscheinlichkeitsrechnung
MehrStatistik I für Betriebswirte Vorlesung 4
Statistik I für Betriebswirte Vorlesung 4 Prof. Dr. Hans-Jörg Starkloff TU Bergakademie Freiberg Institut für Stochastik 25. April 2016 Prof. Dr. Hans-Jörg Starkloff Statistik I für Betriebswirte Vorlesung
MehrMehrdimensionale Zufallsvariablen
Mehrdimensionale Zufallsvariablen Im Folgenden Beschränkung auf den diskreten Fall und zweidimensionale Zufallsvariablen. Vorstellung: Auswerten eines mehrdimensionalen Merkmals ( ) X Ỹ also z.b. ω Ω,
Mehr7.5 Erwartungswert, Varianz
7.5 Erwartungswert, Varianz Def. 7.5.: a) X sei eine diskrete ZV, die bei unendl. vielen Werten x k folgende Zusatzbedingung erfüllt: x k p k
MehrWahrscheinlichkeit und Statistik: Zusammenfassung
HSR Hochschule für Technik Rapperswil Wahrscheinlichkeit und Statistik: Zusammenfassung beinhaltet Teile des Skripts von Herrn Hardy von Lukas Wilhelm lwilhelm.net 12. Januar 2007 Inhaltsverzeichnis 1
MehrDatenanalyse. (PHY231) Herbstsemester Olaf Steinkamp
Datenanalyse (PHY31) Herbstsemester 015 Olaf Steinkamp 36-J- olafs@physik.uzh.ch 044 63 55763 Einführung, Messunsicherheiten, Darstellung von Messdaten Grundbegriffe der Wahrscheinlichkeitsrechnung und
MehrStatistics, Data Analysis, and Simulation SS 2017
Statistics, Data Analysis, and Simulation SS 2017 08.128.730 Statistik, Datenanalyse und Simulation Dr. Michael O. Distler Mainz, May 29, 2017 Dr. Michael O. Distler
MehrDatenanalyse. (PHY231) Herbstsemester Olaf Steinkamp
Datenanalyse PHY31 Herbstsemester 016 Olaf Steinkamp 36-J- olafs@physik.uzh.ch 044 63 55763 Vorlesungsprogramm Einführung, Messunsicherheiten, Darstellung von Messdaten Grundbegriffe der Wahrscheinlichkeitsrechnung
MehrStatistik. Sommersemester Prof. Dr. Stefan Etschberger HSA. für Betriebswirtschaft und International Management
Statistik für Betriebswirtschaft und International Management Sommersemester 2014 Prof. Dr. Stefan Etschberger HSA Streuungsparameter Varianz Var(X) bzw. σ 2 : [x i E(X)] 2 f(x i ), wenn X diskret Var(X)
MehrFakultät Verkehrswissenschaften Friedrich List Professur für Ökonometrie und Statistik, insb. im Verkehrswesen. Statistik II. Prof. Dr.
Statistik II Fakultät Verkehrswissenschaften Friedrich List Professur für Ökonometrie und Statistik, insb. im Verkehrswesen Statistik II 2. Parameterschätzung: 2.1 Grundbegriffe; 2.2 Maximum-Likelihood-Methode;
MehrStatistik und Wahrscheinlichkeitsrechnung
Statistik und Wahrscheinlichkeitsrechnung 11. Vorlesung Jochen Köhler 10.05.011 1 Inhalt der heutigen Vorlesung Zusammenfassung Parameterschätzung Übersicht über Schätzung und Modellbildung Modellevaluation
MehrStatistik I für Betriebswirte Vorlesung 3
Statistik I für Betriebswirte Vorlesung 3 Dr. Andreas Wünsche TU Bergakademie Freiberg Institut für Stochastik 15. April 2019 Dr. Andreas Wünsche Statistik I für Betriebswirte Vorlesung 3 Version: 1. April
MehrMessunsicherheit und Fehlerrechnung
Messunsicherheit und Fehlerrechnung p. 1/25 Messunsicherheit und Fehlerrechnung Kurzeinführung Peter Riegler p.riegler@fh-wolfenbuettel.de Fachhochschule Braunschweig/Wolfenbüttel Messunsicherheit und
MehrNumerische Methoden und Algorithmen in der Physik
Numerische Methoden und Algorithmen in der Physik Hartmut Stadie, Christian Autermann 08.01.2009 Numerische Methoden und Algorithmen in der Physik Hartmut Stadie 1/ 32 Einführung Wahrscheinlichkeit Verteilungen
Mehr1 Messfehler. 1.1 Systematischer Fehler. 1.2 Statistische Fehler
1 Messfehler Jede Messung ist ungenau, hat einen Fehler. Wenn Sie zum Beispiel die Schwingungsdauer eines Pendels messen, werden Sie - trotz gleicher experimenteller Anordnungen - unterschiedliche Messwerte
MehrVarianz und Kovarianz
KAPITEL 9 Varianz und Kovarianz 9.1. Varianz Definition 9.1.1. Sei (Ω, F, P) ein Wahrscheinlichkeitsraum und X : Ω eine Zufallsvariable. Wir benutzen die Notation (1) X L 1, falls E[ X ]
MehrStatistische Methoden
Modeling of Data / Maximum Likelyhood methods Institut für Experimentelle und Angewandte Physik Christian-Albrechts-Universität zu Kiel 22.05.2006 Datenmodellierung Messung vs Modell Optimierungsproblem:
MehrWahrscheinlichkeitstheorie und Statistik vom
INSTITUT FÜR STOCHASTIK SS 2007 UNIVERSITÄT KARLSRUHE Priv.-Doz. Dr. D. Kadelka Dipl.-Math. oec. W. Lao Klausur (Maschineningenieure) Wahrscheinlichkeitstheorie und Statistik vom 2.9.2007 Musterlösungen
MehrDeskriptive Beschreibung linearer Zusammenhänge
9 Mittelwert- und Varianzvergleiche Mittelwertvergleiche bei k > 2 unabhängigen Stichproben 9.4 Beispiel: p-wert bei Varianzanalyse (Grafik) Bedienungszeiten-Beispiel, realisierte Teststatistik F = 3.89,
MehrGoethe-Universität Frankfurt
Goethe-Universität Frankfurt Fachbereich Wirtschaftswissenschaft PD Dr. Martin Biewen Dr. Ralf Wilke Sommersemester 2006 Klausur Statistik II 1. Alle Aufgaben sind zu beantworten. 2. Bitte runden Sie Ihre
MehrAnpassungsrechnungen mit kleinsten Quadraten und Maximum Likelihood
Anpassungsrechnungen mit kleinsten Quadraten und Maximum Likelihood KARLSRUHER INSTITUT FÜR TECHNOLOGIE (KIT) 0 KIT 06.01.2012 Universität des Fabian Landes Hoffmann Baden-Württemberg und nationales Forschungszentrum
MehrGrundlagen der Wahrscheinlichkeitstheorie
Priv.-Doz. Dr. H. Steinacker Wintersemester 2013/2014 Grundlagen der Wahrscheinlichkeitstheorie betrachte Wiederholungen eines Experimentes, gleicher Vorbereitung (z.b. Würfeln, Dart werfen, Doppelspaltexperiment,...)
MehrDatenanalyse. (PHY231) Herbstsemester Olaf Steinkamp
PHY3 Herbstsemester 04 Olaf Steinkamp Physik-Institut der Universität Zürich Winterthurerstrasse 90 CH-8057 Zürich olafs@physik.uzh.ch Büro: 36-J- Tel.: 044-635.57.63 Vorlesungsprogramm Einführung, Messunsicherheiten,
MehrMathematik für Naturwissenschaften, Teil 2
Lösungsvorschläge für die Aufgaben zur Vorlesung Mathematik für Naturwissenschaften, Teil Zusatzblatt SS 09 Dr. J. Schürmann keine Abgabe Aufgabe : Eine Familie habe fünf Kinder. Wir nehmen an, dass die
MehrStatistik, Datenanalyse und Simulation
Dr. Michael O. Distler distler@kph.uni-mainz.de Mainz, 13. Juli 2011 Ziel der Vorlesung Vermittlung von Grundkenntnissen der Statistik, Simulationstechnik und numerischen Methoden (Algorithmen) Aufgabe:
Mehr7.1 Korrelationsanalyse. Statistik. Kovarianz. Pearson-Korrelation. Institut für angewandte Statistik & EDV Universität für Bodenkultur Wien
Statistik 7.1 Korrelationsanalyse Institut für angewandte Statistik & EDV Universität für Bodenkultur Wien Sommersemester 2012 7 Regressions- und Korrelationsanalyse Kovarianz Pearson-Korrelation Der (lineare)
MehrWichtige Begriffe und Sätze aus der Wahrscheinlichkeitsrechnung
Wichtige Begriffe und Sätze aus der Wahrscheinlichkeitsrechnung Version: 22. September 2015 Evelina Erlacher 1 Mengen Es sei Ω eine Menge (die Universalmenge ) und A, B seien Teilmengen von Ω. Dann schreiben
MehrEinführung in die Fehlerrechnung und Messdatenauswertung
Grundpraktikum der Physik Einführung in die Fehlerrechnung und Messdatenauswertung Wolfgang Limmer Institut für Halbleiterphysik 1 Fehlerrechnung 1.1 Motivation Bei einem Experiment soll der Wert einer
MehrStatistische Methoden der Datenanalyse Wintersemester 2011/2012 Albert-Ludwigs-Universität Freiburg
Statistische Methoden der Datenanalyse Wintersemester 2011/2012 Albert-Ludwigs-Universität Freiburg Dr. Stan Lai und Prof. Markus Schumacher Physikalisches Institut Westbau 2 OG Raum 008 Telefonnummer
MehrZufallsvariablen. Diskret. Stetig. Verteilung der Stichprobenkennzahlen. Binomial Hypergeometrisch Poisson. Normal Lognormal Exponential
Zufallsvariablen Diskret Binomial Hypergeometrisch Poisson Stetig Normal Lognormal Exponential Verteilung der Stichprobenkennzahlen Stetige Zufallsvariable Verteilungsfunktion: Dichtefunktion: Integralrechnung:
Mehr5. Schließende Statistik (Inferenzstatistik, konfirmatorische Verfahren)
5. Schließende Statistik (Inferenzstatistik, konfirmatorische Verfahren) 5.1. Einführung Schätzen unbekannter Parameter im Modell, z.b. Wahrscheinlichkeiten p i (Anteile in der Gesamtmenge), Erwartungswerte
MehrTeil VIII. Zentraler Grenzwertsatz und Vertrauensintervalle. Woche 6: Zentraler Grenzwertsatz und Vertrauensintervalle. Lernziele. Typische Situation
Woche 6: Zentraler Grenzwertsatz und Vertrauensintervalle Patric Müller ETHZ Teil VIII Zentraler Grenzwertsatz und Vertrauensintervalle WBL 17/19, 29.05.2017 Wahrscheinlichkeit
Mehr1. Grundbegri e der Stochastik
Wiederholung von Grundwissen der Stochastik. Grundbegri e der Stochastik Menge der Ereignisse. Die Elemente! der Menge heißen Elementarereignisse und sind unzerlegbare Ereignisse. Das Ereignis A tritt
MehrKapitel 7. Regression und Korrelation. 7.1 Das Regressionsproblem
Kapitel 7 Regression und Korrelation Ein Regressionsproblem behandelt die Verteilung einer Variablen, wenn mindestens eine andere gewisse Werte in nicht zufälliger Art annimmt. Ein Korrelationsproblem
Mehr4.1 Stichproben, Verteilungen und Schätzwerte. N(t) = N 0 e λt, (4.1)
Kapitel 4 Stichproben und Schätzungen 4.1 Stichproben, Verteilungen und Schätzwerte Eine physikalische Messung ist eine endliche Stichprobe aus einer Grundgesamtheit, die endlich oder unendlich sein kann.
MehrWichtige Begriffe und Sätze aus der Wahrscheinlichkeitsrechnung
Wichtige Begriffe und Sätze aus der Wahrscheinlichkeitsrechnung Version: 15. Jänner 2017 Evelina Erlacher Inhaltsverzeichnis 1 Mengen 2 2 Wahrscheinlichkeiten 3 3 Zufallsvariablen 5 3.1 Diskrete Zufallsvariablen............................
MehrFit for Abi & Study Stochastik
Fit for Abi & Study Stochastik Prof. Dr. Tilla Schade Hochschule Harz 15. und 16. April 2014 No. 1 Stochastik besteht aus: Wahrscheinlichkeitsrechnung Statistik No. 2 Gliederung Grundlagen Zufallsgrößen
Mehr1 Verteilungsfunktionen, Zufallsvariable etc.
4. Test M3 ET 27 6.6.27 4. Dezember 27 Regelung für den.ten Übungstest:. Wer bei den Professoren Dirschmid, Blümlinger, Vogl oder Langer die UE aus Mathematik 2 gemacht hat, sollte dort die WTH und Statistik
Mehr5. Schließende Statistik (Inferenzstatistik, konfirmatorische Verfahren)
5. Schließende Statistik (Inferenzstatistik, konfirmatorische Verfahren) 5.1. Einführung Schätzen unbekannter Parameter im Modell, z.b. Wahrscheinlichkeiten p i (Anteile in der Gesamtmenge), Erwartungswerte
MehrHypothesenbewertungen: Übersicht
Hypothesenbewertungen: Übersicht Wie kann man Fehler einer Hypothese abschätzen? Wie kann man einschätzen, ob ein Algorithmus besser ist als ein anderer? Trainingsfehler, wirklicher Fehler Kreuzvalidierung
MehrWahrscheinlichkeiten. Verteilungen
Wahrscheinlichkeiten. Verteilungen 2 2.1 Wahrscheinlichkeitsrechnung Das Ergebnis eines mit Zufälligkeit behafteten Versuchs nennen wir ein Ereignis. Beim Wurf einer Münze sind zwei Ereignisse möglich.
MehrMehrdimensionale Verteilungen und Korrelation
Vorlesung: Computergestützte Datenauswertung Mehrdimensionale Verteilungen und Korrelation Günter Quast Fakultät für Physik Institut für Experimentelle Kernphysik SS '17 KIT Die Forschungsuniversität in
MehrLineare Regression. Kapitel Regressionsgerade
Kapitel 5 Lineare Regression 5 Regressionsgerade Eine reelle Zielgröße y hänge von einer reellen Einflussgröße x ab: y = yx) ; zb: Verkauf y eines Produkts in Stückzahl] hängt vom Preis in e] ab Das Modell
MehrReelle Zufallsvariablen
Kapitel 3 eelle Zufallsvariablen 3. Verteilungsfunktionen esultat aus der Maßtheorie: Zwischen der Menge aller W-Maße auf B, nennen wir sie W B ), und der Menge aller Verteilungsfunktionen auf, nennen
MehrEinige Konzepte aus der Wahrscheinlichkeitstheorie (Wiederh.)
Einige Konzepte aus der Wahrscheinlichkeitstheorie (Wiederh.) 1 Zusammenfassung Bedingte Verteilung: P (y x) = P (x, y) P (x) mit P (x) > 0 Produktsatz P (x, y) = P (x y)p (y) = P (y x)p (x) Kettenregel
MehrInstitut für Stochastik Prof. Dr. N. Henze Dipl.-Math. V. Riess
Institut für Stochastik Prof. Dr. N. Henze Dipl.-Math. V. Riess Name: Vorname: Matrikelnummer: Lösungsvorschlag zur Klausur zur Vorlesung Wahrscheinlichkeitstheorie und Statistik (Stochastik) Datum: 07.
MehrStatistik, Datenanalyse und Simulation
Dr. Michael O. Distler distler@kph.uni-mainz.de Mainz, 29. Oktober 2007 1. Statistik 1.1 Wahrscheinlichkeit Pragmatisch: p(e) = n(e) N für N sehr groß Kombination von Wahrscheinlichkeiten p(a oder B) =
MehrComputer in der Wissenschaft
Dr. Michael O. Distler distler@uni-mainz.de Mainz, 8. Januar 2014 Methode der kleinsten Quadrate Geschichte: Von Legendre, Gauß und Laplace zu Beginn des 19. Jahrhunderts eingeführt. Die Methode der kleinsten
Mehr1.5 Mehrdimensionale Verteilungen
Poisson eine gute Näherung, da np = 0 und 500p = 5 00 = n. Wir erhalten somit als Näherung Exakte Rechnung ergibt P(2 X 0) = k=2 0 k=2 π (k) = 0,26424. 0 ( ) 00 P(2 X 0) = 0,0 k 0,99 00 k = 0,264238. k.4.2.4
MehrWahrscheinlichkeitsrechnung und Statistik
10. Vorlesung - 2018 Grundbegriffe der Statistik statistische Einheiten = Objekte an denen interessierende Größen erfaßt werden z.b. Bevölkerung einer Stadt; Schüler einer bestimmten Schule; Patienten
MehrTheorie Parameterschätzung Ausblick. Schätzung. Raimar Sandner. Studentenseminar "Statistische Methoden in der Physik"
Studentenseminar "Statistische Methoden in der Physik" Gliederung 1 2 3 Worum geht es hier? Gliederung 1 2 3 Stichproben Gegeben eine Beobachtungsreihe x = (x 1, x 2,..., x n ): Realisierung der n-dimensionalen
Mehr13 Mehrdimensionale Zufallsvariablen Zufallsvektoren
3 Mehrdimensionale Zufallsvariablen Zufallsvektoren Bisher haben wir uns ausschließlich mit Zufallsexperimenten beschäftigt, bei denen die Beobachtung eines einzigen Merkmals im Vordergrund stand. In diesem
MehrWahrscheinlichkeitstheorie und Statistik
Wahrscheinlichkeitstheorie und Statistik Definitionen und Sätze Prof. Dr. Christoph Karg Studiengang Informatik Hochschule Aalen Sommersemester 2018 2.5.2018 Diskrete Wahrscheinlichkeitsräume Diskreter
MehrStatistics, Data Analysis, and Simulation SS 2017
Mainz, 8. Juni 2017 Statistics, Data Analysis, and Simulation SS 2017 08.128.730 Statistik, Datenanalyse und Simulation Dr. Michael O. Distler Dr. Michael O. Distler
Mehr6. Schätzverfahren für Parameter
6. Schätzverfahren für Parameter Ausgangssituation: Ein interessierender Zufallsvorgang werde durch die ZV X repräsentiert X habe eine unbekannte Verteilungsfunktion F X (x) Wir interessieren uns für einen
MehrRechnernutzung in der Physik
Rechnernutzung in der Physik Teil 3 Statistische Methoden in der Datenanalyse Roger Wolf 15. Dezember 215 INSTITUTE OF EXPERIMENTAL PARTICLE PHYSICS (IEKP) PHYSICS FACULTY KIT University of the State of
MehrZufallsgröße X : Ω R X : ω Anzahl der geworfenen K`s
X. Zufallsgrößen ================================================================= 10.1 Zufallsgrößen und ihr Erwartungswert --------------------------------------------------------------------------------------------------------------
Mehr0 sonst. a) Wie lautet die Randwahrscheinlichkeitsfunktion von Y? 0.5 y = 1
Aufgabe 1 (2 + 2 + 2 + 1 Punkte) Gegeben sei folgende gemeinsame Wahrscheinlichkeitsfunktion f(x, y) = P (X = x, Y = y) der Zufallsvariablen X und Y : 0.2 x = 1, y = 1 0.3 x = 2, y = 1 f(x, y) = 0.45 x
MehrRegression und Korrelation
Kapitel 7 Regression und Korrelation Ein Regressionsproblem behandeltdie VerteilungeinerVariablen, wenn mindestens eine andere gewisse Werte in nicht zufälliger Art annimmt. Ein Korrelationsproblem dagegen
MehrEinführung Fehlerrechnung
Einführung Fehlerrechnung Bei jeder Messung, ob Einzelmessung oder Messreihe, muss eine Aussage über die Güte ( Wie groß ist der Fehler? ) des Messergebnisses gemacht werden. Mögliche Fehlerarten 1. Systematische
Mehr1 Grundlagen der Wahrscheinlichkeitsrechnung Wahrscheinlichkeitsräume. Ein erster mathematischer Blick auf Zufallsexperimente...
Inhaltsverzeichnis 1 Grundlagen der Wahrscheinlichkeitsrechnung 1 1.1 Wahrscheinlichkeitsräume Ein erster mathematischer Blick auf Zufallsexperimente.......... 1 1.1.1 Wahrscheinlichkeit, Ergebnisraum,
MehrStatistische Methoden der Datenanalyse Wintersemester 2012/2013 Albert-Ludwigs-Universität Freiburg
Statistische Methoden der Datenanalyse Wintersemester 2012/2013 Albert-Ludwigs-Universität Freiburg Prof. Markus Schumacher, Dr. Stan Lai Physikalisches Institut Westbau 2 OG E-Mail: Markus.Schumacher@physik.uni-freiburg.de
MehrDie Maximum-Likelihood-Methode
Vorlesung: Computergestützte Datenauswertung Die Maximum-Likelihood-Methode Günter Quast Fakultät für Physik Institut für Experimentelle Kernphysik SS '17 KIT Die Forschungsuniversität in der Helmholtz-Gemeinschaft
MehrStochastik Wiederholung von Teil 1
Stochastik Wiederholung von Teil 1 Andrej Depperschmidt Sommersemester 2016 Wahrscheinlichkeitsraum Definition Das Tripple (Ω, A, P) heißt Wahrscheinlichkeitsraum, falls gilt: (i) A ist eine σ-algebra,
Mehrx p 2 (x )dx, Hinweis: es ist nicht erforderlich, zu integrieren!
Aufgabe T- Gegeben seien zwei normalverteilte Zufallsvariablen X N(µ, σ) 2 und X 2 N(µ 2, σ2) 2 mit pdf p (x) bzw. p 2 (x). Bestimmen Sie x (als Funktion der µ i, σ i, sodass x p (x )dx = + x p 2 (x )dx,
MehrStatistik. Sommersemester Stefan Etschberger. für Betriebswirtschaft, Internationales Management, Wirtschaftsinformatik und Informatik
Stefan Etschberger für Betriebswirtschaft, Internationales Management, Wirtschaftsinformatik und Informatik Sommersemester 2017 Rechenregeln für den Erwartungswert Ist f symmetrisch bzgl. a, so gilt E(X)
MehrWirtschaftsmathematik
Einführung in einige Teilbereiche der Wintersemester 206 Prof. Dr. Stefan Etschberger HSA Unabhängigkeit von Ereignissen A, B unabhängig: Eintreten von A liefert keine Information über P(B). Formal: P(A
MehrÜ b u n g s b l a t t 13
Einführung in die Stochastik Sommersemester 06 Dr. Walter Oevel 5. 6. 006 Ü b u n g s b l a t t 3 Mit und gekennzeichnete Aufgaben können zum Sammeln von Bonuspunkten verwendet werden. Lösungen von -Aufgaben
MehrDas (multiple) Bestimmtheitsmaß R 2. Beispiel: Ausgaben in Abhängigkeit vom Einkommen (I) Parameterschätzer im einfachen linearen Regressionsmodell
1 Lineare Regression Parameterschätzung 13 Im einfachen linearen Regressionsmodell sind also neben σ ) insbesondere β 1 und β Parameter, deren Schätzung für die Quantifizierung des linearen Zusammenhangs
MehrStatistik I für Betriebswirte Vorlesung 14
Statistik I für Betriebswirte Vorlesung 14 Dr. Andreas Wünsche TU Bergakademie Freiberg Institut für Stochastik 13. Juli 017 Dr. Andreas Wünsche Statistik I für Betriebswirte Vorlesung 14 Version: 8. Juli
MehrWahrscheinlichkeitstheorie und Statistik vom
INSTITUT FÜR STOCHASTIK SS 2010 Karlsruher Institut für Technologie Priv.-Doz. Dr. D. Kadelka Klausur Wahrscheinlichkeitstheorie und Statistik vom 14.9.2010 Musterlösungen Aufgabe 1: Gegeben sei eine Urliste
Mehri =1 i =2 i =3 x i y i 4 0 1
Aufgabe (5+5=0 Punkte) (a) Bei einem Minigolfturnier traten 6 Spieler gegeneinander an. Die Anzahlen der von ihnen über das gesamte Turnier hinweg benötigten Schläge betrugen x = 24, x 2 = 27, x = 2, x
MehrI Grundbegriffe 1 1 Wahrscheinlichkeitsräume Bedingte Wahrscheinlichkeiten und Unabhängigkeit Reellwertige Zufallsvariablen...
Inhaltsverzeichnis I Grundbegriffe 1 1 Wahrscheinlichkeitsräume......................... 1 2 Bedingte Wahrscheinlichkeiten und Unabhängigkeit........... 7 3 Reellwertige Zufallsvariablen........................
MehrStatistik für Ingenieure Vorlesung 3
Statistik für Ingenieure Vorlesung 3 Prof. Dr. Hans-Jörg Starkloff TU Bergakademie Freiberg Institut für Stochastik 14. November 2017 3. Zufallsgrößen 3.1 Zufallsgrößen und ihre Verteilung Häufig sind
MehrLösungen zur Klausur WAHRSCHEINLICHKEITSTHEORIE UND STATISTIK (STOCHASTIK)
Institut für Stochastik Dr. Steffen Winter Lösungen zur Klausur WAHRSCHEINLICHKEITSTHEORIE UND STATISTIK (STOCHASTIK) für Studierende des Maschinenbaus vom 7. Juli (Dauer: 8 Minuten) Übersicht über die
MehrStatistik I für Betriebswirte Vorlesung 13
Statistik I für Betriebswirte Vorlesung 13 Prof. Dr. Hans-Jörg Starkloff TU Bergakademie Freiberg Institut für Stochastik 4. Juli 2016 Prof. Dr. Hans-Jörg Starkloff Statistik I für Betriebswirte Vorlesung
Mehr2.2 Binomialverteilung, Hypergeometrische Verteilung, Poissonverteilung
2.2 Binomialverteilung, Hypergeometrische Verteilung, Poissonverteilung Die einfachste Verteilung ist die Gleichverteilung, bei der P(X = x i ) = 1/N gilt, wenn N die Anzahl möglicher Realisierungen von
MehrDie Familie der χ 2 (n)-verteilungen
Die Familie der χ (n)-verteilungen Sind Z 1,..., Z m für m 1 unabhängig identisch standardnormalverteilte Zufallsvariablen, so genügt die Summe der quadrierten Zufallsvariablen χ := m Z i = Z 1 +... +
MehrDie Familie der χ 2 (n)-verteilungen
Die Familie der χ (n)-verteilungen Sind Z 1,..., Z m für m 1 unabhängig identisch standardnormalverteilte Zufallsvariablen, so genügt die Summe der quadrierten Zufallsvariablen χ := m Z i = Z 1 +... +
MehrPrüfungsvorbereitungskurs Höhere Mathematik 3
Prüfungsvorbereitungskurs Höhere Mathematik 3 Stochastik Marco Boßle Jörg Hörner Marcel Thoms Mathematik Online Herbst 211 PV-Kurs HM 3 Stochastik 1-1 Zusammenfassung Wahrscheinlichkeitsraum (WR): Menge
MehrStatistik. Sommersemester Prof. Dr. Stefan Etschberger Hochschule Augsburg. für Betriebswirtschaft und internationales Management
für Betriebswirtschaft und internationales Management Sommersemester 2015 Prof. Dr. Stefan Etschberger Hochschule Augsburg Normalverteilung Eine Zufallsvariable X mit einer Dichtefunktion und σ > 0 heißt
MehrBiostatistik, Sommer 2017
1/39 Biostatistik, Sommer 2017 Wahrscheinlichkeitstheorie: Gesetz der großen Zahl, Zentraler Grenzwertsatz Schließende Statistik: Grundlagen Prof. Dr. Achim Klenke http://www.aklenke.de 9. Vorlesung: 16.06.2017
MehrBiostatistik, Sommer 2017
1/51 Biostatistik, Sommer 2017 Wahrscheinlichkeitstheorie: Verteilungen, Kenngrößen Prof. Dr. Achim Klenke http://www.aklenke.de 8. Vorlesung: 09.06.2017 2/51 Inhalt 1 Verteilungen Normalverteilung Normalapproximation
Mehr4.2 Moment und Varianz
4.2 Moment und Varianz Def. 2.10 Es sei X eine zufällige Variable. Falls der Erwartungswert E( X p ) existiert, heißt der Erwartungswert EX p p tes Moment der zufälligen Variablen X. Es gilt dann: EX p
MehrAnpassungsrechnungen mit kleinsten Quadraten und Maximum Likelihood
Anpassungsrechnungen mit kleinsten Quadraten und Maximum Likelihood Hauptseminar - Methoden der experimentellen Teilchenphysik WS 2011/2012 Fabian Hoffmann 2. Dezember 2011 Inhaltsverzeichnis 1 Einleitung
MehrModellanpassung und Parameterschätzung. A: Übungsaufgaben
7 Modellanpassung und Parameterschätzung 1 Kapitel 7: Modellanpassung und Parameterschätzung A: Übungsaufgaben [ 1 ] Bei n unabhängigen Wiederholungen eines Bernoulli-Experiments sei π die Wahrscheinlichkeit
Mehr