Varianz und Kovarianz

Ähnliche Dokumente
5 Erwartungswerte, Varianzen und Kovarianzen

Erwartungswert und Varianz von Zufallsvariablen

Vertiefung NWI: 8. Vorlesung zur Wahrscheinlichkeitstheorie

Unabhängige Zufallsvariablen

Wahrscheinlichkeitsrechnung und Statistik für Studierende der Informatik. PD Dr. U. Ludwig. Vorlesung 7 1 / 19

I Grundbegriffe 1 1 Wahrscheinlichkeitsräume Bedingte Wahrscheinlichkeiten und Unabhängigkeit Reellwertige Zufallsvariablen...

Kapitel 8. Parameter multivariater Verteilungen. 8.1 Erwartungswerte

13 Mehrdimensionale Zufallsvariablen Zufallsvektoren

Statistik I für Betriebswirte Vorlesung 3

Kapitel 12 Erwartungswert und Varianz

Stochastik Aufgaben zum Üben: Teil 2

Wahrscheinlichkeitstheorie und Statistik

Reelle Zufallsvariablen

7.2 Moment und Varianz

2 Zufallsvariable und Verteilungsfunktionen

4.2 Moment und Varianz

Wichtige Begriffe und Sätze aus der Wahrscheinlichkeitsrechnung

Die Varianz (Streuung) Definition

Statistik. Sommersemester Stefan Etschberger. für Betriebswirtschaft, Internationales Management, Wirtschaftsinformatik und Informatik

DWT 1.4 Rechnen mit kontinuierlichen Zufallsvariablen 234/467 Ernst W. Mayr

3. Gemeinsame und bedingte Verteilung, stochastische Unabhängigkeit

Wirtschaftsmathematik

Kapitel XII - Kennzahlen mehrdimensionaler Zufallsvariablen

Statistik. Sommersemester Prof. Dr. Stefan Etschberger Hochschule Augsburg. für Betriebswirtschaft und internationales Management

Folie zur Vorlesung Wahrscheinlichkeitsrechnung und Stoch. Prozesse

Vorlesung 5a. Die Varianz

Einführung in die Statistik für Wirtschaftswissenschaftler für Betriebswirtschaft und Internationales Management

7.5 Erwartungswert, Varianz

Statistik für Informatiker, SS Erwartungswert, Varianz und Kovarianz

Statistik I für Betriebswirte Vorlesung 4

2.2 Binomialverteilung, Hypergeometrische Verteilung, Poissonverteilung

Vorlesung 4b. Die Varianz

4 Unabhängige Zufallsvariablen. Gemeinsame Verteilung

Vorlesung 8b. Kovarianz, Korrelation und Regressionsgerade

Vorlesung 5a. Varianz und Kovarianz

Vorlesung 4b. Die Varianz

Wichtige Definitionen und Aussagen

4. Verteilungen von Funktionen von Zufallsvariablen

Statistik für Informatiker, SS Erwartungswert, Varianz und Kovarianz

Stochastik Wiederholung von Teil 1

11.4 Korrelation. Def. 44 Es seien X 1 und X 2 zwei zufällige Variablen, für die gilt: 0 < σ X1,σ X2 < +. Dann heißt der Quotient

Kapitel 5. Stochastik

Vorlesung 7b. Der Zentrale Grenzwertsatz

13 Grenzwertsätze Das Gesetz der großen Zahlen

DWT 1.4 Rechnen mit kontinuierlichen Zufallsvariablen 240/476 c Ernst W. Mayr

0 für t < für 1 t < für 2 t < für 3 t < für 4 t < 5 1 für t 5

1.5 Mehrdimensionale Verteilungen

Vorlesung 9b. Kovarianz und Korrelation

Kapitel 6. Verteilungsparameter. 6.1 Der Erwartungswert Diskrete Zufallsvariablen

Sind f X bzw. f Y die wie auf Folie 242 definierten Dichtefunktionen zur N(µ X, σx 2 )- bzw. N(µ Y, σy 2 )-Verteilung, so gilt (genau) im Fall ρ = 0

Zufallsgröße X : Ω R X : ω Anzahl der geworfenen K`s

Zufallsvariable: Verteilungen & Kennzahlen

Finanzmathematische Modelle und Simulation

Vorlesung 5a. Zufallsvariable mit Dichten

Statistik für Ingenieure Vorlesung 3

Kapitel 8: Zufallsvektoren

1 Multivariate Zufallsvariablen

Y = g 2 (U 1,U 2 ) = 2 ln U 1 sin 2πU 2

Mehrdimensionale Zufallsvariablen

Statistik. Sommersemester Prof. Dr. Stefan Etschberger HSA. für Betriebswirtschaft und International Management

Einige Konzepte aus der Wahrscheinlichkeitstheorie (Wiederh.)

1.5 Erwartungswert und Varianz

1.5 Erwartungswert und Varianz

Eine Auswahl wichtiger Definitionen und Aussagen zur Vorlesung»Stochastik für Informatiker und Regelschullehrer«

Vorlesung 8a. Kovarianz und Korrelation

Statistics, Data Analysis, and Simulation SS 2017

Mathematik für Naturwissenschaften, Teil 2

Unabhängigkeit von Zufallsvariablen

Einführung in die Stochastik für Informatiker Übungsaufgaben mit Lösungen

67 Zufallsvariable, Erwartungswert, Varianz

Erwartungswerte. Kapitel 5

Stochastik. Frank Eckert und. Thomas Huppertz Letzte Änderung:

Stochastik für Studierende der Informatik

Vorlesung 7b. Kovarianz und Korrelation

Diskrete Zufallsvariable

Biostatistik, Sommer 2017

Wahrscheinlichkeitsrechnung und Statistik

8 Zufallsvariablen und Verteilungen. Themen: Zufallsvariablen Verteilungen Gesetz der großen Zahlen

1. Grundbegri e der Stochastik

Wichtige Begriffe und Sätze aus der Wahrscheinlichkeitsrechnung

Beispiel 37. Wir werfen eine Münze so lange, bis zum ersten Mal

1. Grundbegri e. T n i=1 A i = A 1 \ A 2 \ : : : \ A n alle A i treten ein. na = A das zu A komplementäre Ereignis; tritt ein, wenn A nicht eintritt.

K. Eppler, Inst. f. Num. Mathematik Übungsaufgaben. 12. Übung SS 18: Woche vom

Wahrscheinlichkeit und Statistik

Wahrscheinlichkeitsrechnung. Sommersemester Kurzskript

Zufallsvariablen [random variable]

Zusammenfassung: diskrete und stetige Verteilungen. Woche 4: Gemeinsame Verteilungen. Zusammenfassung: diskrete und stetige Verteilungen

Kapitel VII - Funktion und Transformation von Zufallsvariablen

Ü b u n g s b l a t t 13

Erwartungswerte, Varianzen

Probeklausur Statistik II

Statistische Analyseverfahren Abschnitt 2: Zufallsvektoren und mehrdimensionale Verteilungen

KAPITEL 5. Erwartungswert

2 Zufallsvariable, Verteilungen, Erwartungswert

7. Übungsblatt - Lösungsskizzen

Beweis: Mit Hilfe des Satzes von der totalen Wahrscheinlichkeit folgt, dass

Mathematik für Biologen

Einige Konzepte aus der Wahrscheinlichkeitstheorie (Review)

Transkript:

KAPITEL 9 Varianz und Kovarianz 9.1. Varianz Definition 9.1.1. Sei (Ω, F, P) ein Wahrscheinlichkeitsraum und X : Ω eine Zufallsvariable. Wir benutzen die Notation (1) X L 1, falls E[ X ] <. () X L, falls E[X ] <. Lemma 9.1.. Sei (Ω, F, P) ein Wahrscheinlichkeitsraum und X, Y : Ω zwei Zufallsvariablen. Dann gilt: (1) X, Y L X + Y L. () X L, a ax L. (3) X L X L 1. Beweis von (1). Seien X, Y L, also E[X ] <, E[Y ] <. Aus der Ungleichung (X + Y ) X + Y folgt, dass Somit gilt X + Y L. E[(X + Y ) ] E[X ] + E[Y ] <. Beweis von (). Sei X L, also E[X ] <. Es folgt, dass E[(aX) ] = a E[X ] <, somit ax L. Beweis von (3). Sei X L, also E[X ] <. Es gilt die Ungleichung X X +1, also [ ] [ ] X + 1 X E[ X ] E = E + 1 <. Somit ist X L 1. Definition 9.1.3. Sei X L. Die Varianz von X ist: Die Standardabweichung von X ist: Var X = E[(X E[X]) ] <. σ(x) = Var X. Bemerkung 9.1.4. Die Varianz beschreibt die erwartete quadratische Abweichung einer Zufallsvariable von ihrem Erwartungswert. Wird X in irgendwelchen physikalischen Einheiten, etwa in Metern, gemessen, so wird Var X in Quadratmetern gemessen. Deshalb führt man die Standardabweichung von X ein. Diese wird dann wieder in Metern gemessen, hat 1

also die gleichen Einheiten wie X. Die Standardabweichung und die Varianz beschreiben, wie stark die Zufallsvariable um ihrem Erwartungswert streut. Für eine konstante Zufallsvariable X = c gilt zum Beispiel, dass Var X = σ(x) = 0, da es in diesem Fall gar keine Streuung gibt. Satz 9.1.5. Für jede Zufallsvariable X L gilt die Formel: Var X = E[X ] (E[X]). Bemerkung 9.1.6. Es gilt Var X 0. Als Korollar erhalten wir, dass (E[X]) E[X ]. Beweis. Wir benutzen die Linearität des Erwartungswerts: Var X = E[(X EX) ] = E[X X EX + (EX) ] = E[X ] E[EX X] + E[(EX) ] = E[X ] EX EX + (EX) = E[X ] (EX). Dabei haben wir benutzt, dass EX eine Konstante ist. Beispiel 9.1.7. Sei X U[0, 1] gleichverteilt auf dem Intervall [0, 1]. Wir berechnen Var X. Lösung. Die Dichte von X ist Wir berechnen EX: EX = f X (y) = { 1, y [0, 1], 0, y [0, 1]. yf X (y)dy = 1 0 ydy = 1. Wir berechnen E[X ] mit der Transformationsformel für den Erwartungswert: Somit erhalten wir E[X ] = y f X (y)dy = Var X = 1 3 ( 1 Für die Standardabweichung ergibt sich σ(x) = 1 1. 1 0 ) = 1 1. y dy = 1 3. Satz 9.1.8. Sei X L eine Zufallsvariable und a, b Konstanten. Dann gilt: (1) Var(aX + b) = a Var X. () σ(ax + b) = a σ(x).

Beweis von (1). Wir benutzen die Linearität des Erwartungswerts: Var(aX+b) = E[(aX+b E(aX+b)) ] = E[(aX+b aex b) ] = E[a (X EX) ] = a Var X. Beweis von (). σ(ax + b) = Var(aX + b) = a Var X = a σ(x). Beispiel 9.1.9. Sei X U[a, b] gleichverteilt auf einem Intervall [a, b]. Es gilt EX = a+b. Wir berechnen Var X. Lösung. Wir haben die Darstellung X = (b a)y + a, wobei Y U[0, 1]. Var X = Var((b a)y + a) = (b a) Var Y = Für die Standardabweichung ergibt sich σ(x) = b a 1. (b a). 1 Bemerkung 9.1.10. Die Varianz einer Zufallsvariable ist immer 0. Für eine konstante Zufallsvariable X = c gilt Var X = 0. Können wir die Umkehrung dieser Aussage beweisen? Sei X eine Zufallsvariable mit Var X = 0. Dann kann man behaupten, dass P[X = EX] = 1. Das heißt: die Zufallsvariable X ist fast sicher konstant. Wir werden das später mit Hilfe der Tschebyscheff-Ungleichung beweisen. Satz 9.1.11. Sei X N(µ, σ ) normalverteilt mit Parametern (µ, σ ). Dann gilt EX = µ und Var X = σ. Beweis. Zuerst betrachten woir den Fall µ = 0, σ = 1. Die Dichte von X ist dann f X (y) = 1 π e y /, y. Für den Erwartungswert erhalten wir EX = yf X (y)dy = 1 π ye y / dy = 0, da die Funktion ye y / ungerade ist. Für die Varianz erhalten wir Var X = E[X ] (EX) = y f X (y)dy = 1 y e y / dy. π Um dieses Integral zu berechnen, benutzen wir partielle Integration: Var X = 1 y( e y / ) dy = 1 ye y / + e y / dy = 1. π π Sei nun X N(µ, σ ) normalverteilt mit beliebigen Parametern (µ, σ ). Dann haben wir die Darstellung X = σy + µ, wobei Y (0, 1). Es gilt dann EX = E[σY + µ] = µ 3

und Var X = Var(σY + µ) = σ Var Y = σ. Für die Standardabweichung ergibt sich übrigens σ(x) = σ (wobei wir immer annehmen, dass σ > 0). Satz 9.1.1. Sei X Poi(λ) Poisson-verteilt mit Parameter λ > 0. Dann gilt EX = Var X = λ. Beweis. Wir haben bereits gezeigt, dass EX = λ. Wir berechnen Var X. Betrachte zunächst E[X(X 1)] = k(k 1) P[X = k] = k=0 k= = e λ λ = e λ λ e λ = λ. λ λk k(k 1)e k! k= λ k (k )! Für E[X ] gilt dann E[X ] = E[X(X 1)] + EX = λ + λ. Für die Varianz erhalten wir Var X = E[X ] (E[X ]) = λ + λ λ = λ. 9.. Kovarianz und Korrelationskoeffizient Definition 9..1. Sei (Ω, F, P) ein Wahrscheinlichkeitsraum und X, Y : Ω zwei Zufallsvariablen mit X, Y L. Dann ist die Kovarianz von X und Y wie folgt definiert: Bemerkung 9... Cov(X, X) = Var X. Cov(X, Y ) = E[(X EX)(Y EY )]. Bemerkung 9..3. Wir zeigen, dass die Kovarianz wohldefiniert ist. Seien X, Y L. Nach Lemma 9.1. existieren EX und EY. Außerdem gilt dann X := X EX L und Ỹ := Y EY L. Wir zeigen, dass E[ XỸ ] existiert. Es gilt Daraus folgt, dass E[ XỸ ] 1 XỸ X + Ỹ. ( E[ X ) ] + E[Ỹ ] <. 4

Somit ist die Zufallsvariable existiert. XỸ = (X EX)(Y EY ) integrierbar und die Kovarianz Satz 9..4. Seien X, Y L. Dann gilt: Cov(X, Y ) = E[XY ] E[X] E[Y ]. Beweis. Wir benutzen die Linearität des Erwartungswerts: Cov(X, Y ) = E[(X EX)(Y EY )] = E[XY X EY Y EX + (EX)(EY )] = E[XY ] E[EY X] E[EX Y ] + E[(EX)(EY )] = E[XY ] EY EX EX EY + (EX)(EY ) = E[XY ] E[X] E[Y ]. Dabei haben wir EX und EY wie Konstanten behandelt. Bemerkung 9..5. Für die Berechnung der Kovarianz kann man folgende Formeln benutzen: (1) Für X, Y diskret: E[XY ] = st P[X = s, Y = t]. s Im X t Im Y () Für X, Y absolut stetig mit gemeinsamer Dichte f X,Y : E[XY ] = st f X,Y (s, t)dsdt. Satz 9..6. Seien X, Y L Zufallsvariablen und a, b, c, d Konstanten. Dann gilt: Cov(aX + b, cy + d) = ac Cov(X, Y ). Beweis. Übungsaufgabe. Für die Kovarianz gelten ähnliche echenregeln wie für das Skalarprodukt. Satz 9..7. Seien X 1,..., X n, Y 1,..., Y m L Zufallsvariablen und a 1,..., a n, b 1,..., b m Konstanten. Dann gilt: n m Cov(a 1 X 1 +... + a n X n, b 1 Y 1 +... + b m Y m ) = a i b j Cov(X i, Y j ). i=1 j=1 Beweis. Übungsaufgabe. Satz 9..8 (Cauchy-Schwarz-Ungleichung). Seien X, Y L Zufallsvariablen. Dann gilt E[XY ] E[X ] E[Y ]. 5

Bemerkung 9..9. Zum Vergleich: Für zwei Vektoren x, y d gilt die Ungleichung x, y = x y cos(φ) x y = x, x y, y. Beweis von Satz 9..8. Für beliebige Konstante a gilt 0 E[(aX + Y ) ] = E[a X + axy + Y ] = a E[X ] + ae[xy ] + E[Y ]. Die rechte Seite ist eine quadratische Funktion von a. Diese Funktion ist für alle a nichtnegativ. Die Diskriminante D muss somit 0 sein: Das beweist die Behauptung. D = 4(E[XY ]) 4E[X ] E[Y ] 0. Korollar 9..10. Für beliebige Zufallsvariablen X, Y L gilt Cov(X, Y ) Var X Var Y. Beweis. Betrachte die zentrierten Zufallsvariablen X := X EX L und Ỹ := Y EY L. Nun wenden wir die Cauchy-Schwarz-Ungleichung auf die Zufallsvariablen X und Ỹ an: Cov(X, Y ) = E[ E[ XỸ ] X ] E[Ỹ ] = Var X Var Y. Definition 9..11. Seien X, Y L zwei Zufallsvariablen. Der Korrelationskoeffizient von X und Y ist ρ(x, Y ) = Cov(X, Y ). Var X Var Y Dabei nehmen wir an, dass X und Y nicht fast sicher konstant sind, so dass Var X 0 und Var Y 0. Bemerkung 9..1. Aus Korollar 9..10 folgt, dass ρ(x, Y ) 1. Der Korrelationskoeffizient ist ein Maß für den linearen Zusammenhang zwischen X und Y. Später werden wir zeigen, dass der Korrelationskoeffizient genau dann ±1 ist, wenn zwischen X und Y ein linearer Zusammenhang besteht, d.h., wenn Y = ax + b. Bemerkung 9..13. Seien a, b, c, d und a, c > 0. Dann gilt: ρ(ax + b, cy + d) = ρ(x, Y ). Bemerkung 9..14. ρ(x, X) = 1, ρ(x, X) = 1. Definition 9..15. Zwei Zufallsvariablen X, Y L heißen unkorreliert, wenn Cov(X, Y ) = 0 (und somit auch ρ(x, Y ) = 0). Satz 9..16. Seien X, Y L unabhängig. Dann sind X und Y unkorreliert, d.h. Cov(X, Y ) = 0. Beweis. Für unabhängige Zufallsvariablen gilt E[XY ] = E[X] E[Y ]. Wir erhalten Somit sind X und Y unkorreliert. Cov(X, Y ) = E[XY ] E[X] E[Y ] = 0. 6

Beispiel 9..17. Unabhängige Zufallsvariablen sind unkorreliert. Die Umkehrung dieser Aussage gilt jedoch nicht. Sei (X, Y ) ein Vektor, der gleichverteilt auf dem Einheitskreis A = {(t, s) : t + s < 1} ist. Wir behaupten, dass Cov(X, Y ) = 0 und dass dennoch X und Y abhängig sind. Lösung. Die gemeinsame Dichte von (X, Y ) ist f X,Y (t, s) = 1 π 1 A(t, s). Die anddichten (d.h. die Dichten von X und Y ) sind f X (t) = f Y (t) = π 1 t 1 t <1. Wegen Symmetrie sind die Erwartungswerte von X und Y gleich 0: Nun berechnen wir E[XY ]: E[XY ] = A EX = EY = π 1 1 tsf X,Y (t, s)dtds = 1 π t 1 t dt = 0. ts1 A (t, s)dtds = 0. Dabei ist das Integral gleich 0, da sich die Funktion ts1 A (t, s) bei der Transformation (t, s) ( t, s) in ts1 A (t, s) verwandelt. Somit sind X und Y unkorreliert: Cov(X, Y ) = 0. Und doch sind X, Y abhängig, denn wären X und Y abhängig, dann müsste die gemeinsame Dichte f X,Y (t, s) mit dem Produkt der anddichten f X (t)f X (s) für alle (t, s) außerhalb einer Menge vom Lebesgue-Maß 0 übereinstimmen. Dies ist jedoch nicht der Fall, denn f X,Y (t, s) = 1 ( ) π 1 A(t, s) 1 t 1 s π 1 t <1, s <1 = f X (t) f Y (s) zum Beispiel für alle (t, s) mit t < 1, s < 1 und t + s unkorreliert, aber abhängig. > 1. Somit sind X und Y Satz 9..18. Für beliebige Zufallsvariablen X, Y L gilt Var(X + Y ) = Var(X) + Var(Y ) + Cov(X, Y ). Beweis. Mit X := X EX und Ỹ = Y EY gilt Var(X + Y ) = E[((X EX) + (Y EY )) ] = E[( X + Ỹ ) ] = E[ X ] + E[ XỸ ] + E[Ỹ ] = Var(X) + Cov(X, Y ) + Var(Y ). 7

Korollar 9..19. Für unabhängige Zufallsvariablen X, Y L gilt Var(X + Y ) = Var(X) + Var(Y ). Bemerkung 9..0. Zum Vergleich: Für beliebige Zufallsvariablen X, Y L 1 gilt E[X + Y ] = E[X] + E[Y ]. Bemerkung 9..1. Für beliebige X 1,..., X n L gilt n Var(X 1 +... + X n ) = Var(X i ) + i=1 Für unabhängige X 1,..., X n L gilt sogar Var(X 1 +... + X n ) = 1 i<j n n Var(X i ). i=1 Cov(X i, X j ) Beispiel 9... Sei X Bin(n, p) binomialverteilt mit Parametern n, p. Berechne Var X. Lösung. Wir können X als die Anzahl der Erfolge in einem n-fachen Bernoulli-Experiment auffassen. Wir haben also die Darstellung X = X 1 +... + X n, wobei { 1, Erfolg beim i-ten Experiment, X i = i = 1,..., n. 0, sonst, Dabei sind X 1,..., X n unabhängig mit P[X i = 1] = p und P[X i = 0] = 1 p. Für jedes X i gilt E[X i ] = 1 p + 0 (1 p) = p und Var X i = E[X i ] (E[X i ]) = E[X i ] (E[X i ]) = p(1 p). Für die Varianz von X erhalten wir (wegen der Unabhängigkeit von X 1,..., X n ) Var X = Var(X 1 +... + X n ) = Var(X 1 ) +... + Var(X n ) = np(1 p). Bemerkung 9..3. Die maximale Varianz wird angenommen, wenn p = 1. Die minimale Varianz tritt ein, wenn p = 0 oder p = 1. (In diesem Fall ist X konstant und Var X = 0). Im nächsten Satz zeigen wir, dass der Korrelationskoeffizient genau dann gleich ±1 ist, wenn es einen linearen Zusammenhang zwischen X und Y gibt. Dabei entspricht der Wert +1 einem positiven Zusammenhang und 1 einem negativen Zusammenhang. Satz 9..4. Seien X, Y : Ω zwei Zufallsvariablen mit X, Y L und Var X 0, Var Y 0. Es gilt: (1) ρ(x, Y ) = 1 es existieren a > 0 und b mit P[Y = ax + b] = 1. () ρ(x, Y ) = 1 es existieren a < 0 und b mit P[Y = ax + b] = 1. Beweis von (1). Sei ρ(x, Y ) = 1. Definiere Var Y a = > 0 und b = EY aex. Var X 8

Definiere die Zufallsvariable = Y (ax + b). Wir zeigen, dass P[ = 0] = 1. Es gilt = (Y EY ) a(x EX) = Ỹ a X. Somit ist E[ ] = EỸ ae X = 0. Weiterhin gilt Var = E[ ] = E[Ỹ a XỸ + a X ] = Var Y a Cov(X, Y ) + a Var X Var Y = Var Y Var X Var Y + Var Y Var X Var X Var X = 0. Somit gilt P[ = E ] = 1, also P[ = 0] = 1. 9