Statistik Grundlagen Charakterisierung von Verteilungen Einführung Wahrscheinlichkeitsrechnung Wahrscheinlichkeitsverteilungen Schätzen und Testen Korrelation Regression
Einführung Die Einführung in grundlegende Begriffe der Wahrscheinlichkeitsrechnung hat zum Ziel in das begriffliche Instrumentarium einzuführen und sich daneben die verschiedenen Möglichkeiten der Wahrscheinlichkeitsrechnung für statistische Fragen nutzbar zu machen. Dazu gehört: Das Rechnen mit Über- und Unterschreitungswahrscheinlichkeiten für das Eintreten von bestimmten Ereignissen. Das Schätzen von Parametern einer Grundgesamtheit. Das Überprüfen von Aussagen (Hypothesen) über eine Grundgesamtheit aus einer Stichprobe heraus.
Fragestellungen Zur Verhinderung einer Überschwemmung soll ein Fluss, der häufig über die Ufer tritt, eingedeicht werden. Daraus ergibt sich die Frage, wie hoch der Deich gebaut werden soll. Einerseits soll er das Land möglichst effektiv schützen, andererseits müssen die Baukosten betrachtet und daher die Deichkrone so niedrig wie möglich gehalten werden. Deshalb einigt man sich darauf, dass man eine Sicherheit von 95% akzeptiert. Die Deichkrone muss also so hoch gebaut werden, dass im Mittel 95 von 100 Hochwässer abgehalten werden können. In einer Stichprobe vom Umfang 49 wurden die Hochwasserstände eines einzudeichenden Flusses gemessen. Dabei wurden ein arithmetisches Mittel von 5 m und eine Standardabweichung von 2,5 m ermittelt. Im Zusammenhang mit der Eindeichung ist nun die Frage, zwischen welchen Werten mit 95% Wahrscheinlichkeit das mittlere Hochwasser schwankt. Bei einer Bodenanalyse nach Schwermetallen werden 20 Proben genommen und mit dem Standardwert für Tongestein (95 ppm) verglichen. Wie erwartet unterscheiden sich die Mittelwerte der Schwermetallgehalte der Proben und die Standardgröße für Tongestein innerhalb der gezogenen Stichproben. Es erhebt sich nun die Frage, ob die Unterschiede zwischen dem vorgegebenen Wert und den Werten der Stichprobe zufällig sind oder ob die Differenz mit einer gewissen Wahrscheinlichkeit, etwa 5%, signifikant verschieden ist.
Grundbegriffe Zufallsexperiment: Stellt eine Versuchsreihe dar, die sich aus vielen Einzelergebnissen zusammensetzen und vom Zufall beeinflusst sind. Beispiele in der Wahrscheinlichkeitsrechnung sind das Werfen von Münzen, Farbrad, Ziehen von Kugeln oder Würfeln. Elementarereignis: Stellt ein Einzelergebnis eines Zufallsexperimentes dar, wird oftmals mit E bezeichnet. Ereignisraum: Ist der Menge der möglichen Ereignisse eines Zufallsexperimentes. Zufallsvariable: Die Zufallsvariable X ist Platzhalter für ein Ereignis aus dem zugehörigen Ereignisraum. X = E bedeutet, dass die Zufallsvariable X den Wert E annimmt.
Grundbegriffe Zufallsexperiment Ereignisraum Mögliches Ereignis Münzenwerfen Wappen, Zahl Zahl Farbrad Farben bzw. Zahlen Farbe rot, Zahl 7 1,2,...,9 Urnengriff schwarze, weiße weiße Kugel Kugeln Würfeln Zahlen 1,..., 6 Zahl 1
Grundbegriffe Beispiel: Bei einem Würfel gibt es 6 verschiedene Möglichkeiten für den Wurf einer Zahl. Die Zufallsvariable X kann eine der Zahlen 1, 2, 3, 4, 5, 6 als Elementarereignis annehmen. X = 1 bedeutet, dass die Zufallsvariable X den Wert 1 annimmt. Die Menge aller x i ist der Ereignisraum, es gilt P(X = x i ) > 0. Die Bedingung Augenzahl = gerade liefert die Ereignismenge {2; 4; 6}. Daher sind bei dieser Bedingung die Ereignisse 2, 4 und 6 keine Elementarereignisse.
Grundbegriffe Beispiel: Wahrscheinlichkeiten bei zunehmender Wurfversuchszahl n beim Würfel.
Grundbegriffe Beispiel: Wahrscheinlichkeiten bei zunehmender Wurfversuchszahl n beim Würfel. 0,30 0,25 0,20 0,15 0,10 0,05 0,00 0,30 0,25 0,20 0,15 0,10 0,05 0,00 1 2 3 4 5 6 1 2 3 4 5 6 50 Würfe 250 Würfe 0,30 0,25 0,20 0,15 0,10 0,05 0,00 0,30 0,25 0,20 0,15 0,10 0,05 0,00 1 2 3 4 5 6 1 2 3 4 5 6 500 Würfe 1000 Würfe
Grundbegriffe Beispiel: Wahrscheinlichkeiten beim Drehen am Farbrad. 90 10 30 10 70 30 40 20 60
Grundbegriffe Beispiel: Wahrscheinlichkeiten beim Drehen am Farbrad. Je höher die Anzahl n der Drehversuche, desto stärker nähert sich die experimentelle Wahrscheinlichkeit an die erwartete theoretische Wahrscheinlichkeit an.
Grundbegriffe Regeln der Wahrscheinlichkeitsrechnung: Additionsregel: P(A B) = P(A) + P(B) - P(A B) Sind A und B sich ausschließende Ereignisse, so ist P(A B) = P(A) + P(B). Bedingte Wahrscheinlichkeit: Ist das Eintreffen eines bestimmten Ereignisses A abhängig von dem eines anderen Ereignisses B, so bezeichnet man P(A B) als die bedingte Wahrscheinlichkeit von A unter der Bedingung B. Bei einem normalen Würfel bleibt die Wahrscheinlichkeit eines (Elementar-) Ereignisses stets konstant, unabhängig davon, was zuvor gewürfelt wurde. Beim Ziehen von Kugeln aus einer Urne ohne Zurücklegen beeinflusst das vorhergehende Ereignis die Wahrscheinlichkeit des nachfolgenden Ereignisses. Viele zufallsbeeinflusste Ereignisse in der Natur und Gesellschaft stehen in Zusammenhang mit bedingten Wahrscheinlichkeiten (etwa Temperaturen, Wasserstände, Niederschläge). So ist etwa P(Lufttemperatur = hoch) für den heutigen Tag größer, wenn es gestern bereits sehr warm war.
Grundbegriffe Regeln der Wahrscheinlichkeitsrechnung: Multiplikationssatz: P(A B) = P(A B) P(B) = P(B A) P(A) Stochastische Unabhängigkeit: Die Ereignisse A und B sind unabhängig voneinander, wenn P(A B) = P(A) ist. Dann ist P(A B) = P(A) P(B). Regionalisierungsverfahren sind nur dann durchzuführen, wenn die verwendeten Variablen unabhängig voneinander sind. Komplement: Für die Alternativereignisse A und ist P(A) = 1 P( ) A A
Grundbegriffe Beispiel: Es werden 2 Münzen geworfen mit den Ereignissen: A: beide Münzen zeigen die gleiche Seite und B: mindestens eine Münze zeigt Wappen. Frage: Wie groß ist die Wahrscheinlichkeit von A, wenn B schon eingetreten ist? Es ist P(A) = 1/2, P(B) = 3/4 und P(A B) = 1/4. Damit ist P(A B) = P(A B)/P(B) = 1/3.
Grundbegriffe Beispiel: Es werden 2 Würfel geworfen mit den Ereignissen: A: es tritt eine beliebige Zahl auf. B: die gewürfelte Zahl unterscheidet sich von der anderen. Frage: Wie groß ist die Wahrscheinlichkeit, dass verschiedene Zahlen auftreten? Es ist P(A) = 1 und P(B A) = 5/6. Dann ist P(A B) = P(A B) P(A) = 5/6.
Grundbegriffe Beispiel: Es werden 2 Würfel geworfen mit den Ereignissen: A: die Zahl ist gerade. B: die Zahl ist ungerade. Frage: Wie groß ist die Wahrscheinlichkeit, dass eine gerade und eine ungerade Zahl auftreten? Wegen P(A) = P(B) = 1/2 ist P(A B) = 1/4.
Grundbegriffe
Grundbegriffe Beispiel: Ein Landwirt hat 3 Maschinen im ständigen Einsatz. Die Wahrscheinlichkeit, dass eine Maschine innerhalb eines Monats nicht ausfällt, sei für die erste Maschine 0.9, für die zweite 0.8 und die letzte 0.85. Frage: Wie groß ist die Wahrscheinlichkeit, dass im Laufe eines Monats keine der 3 Maschinen ausfällt? Wie groß ist die Wahrscheinlichkeit, dass alle ausfallen? Es ist P(A B C)= P(A) P(B) P(C) = 0.9 0.8 0.85 = 0.612. Es ist P(A B C)= P(A) P(B) P(C) = 0.1 0.2 0.15 = 0.003.
Diskrete und stetige Zufallsvariable a b a b a b Diskrete Zufallsvariable: Wahrscheinlichkeitsverteilung Verteilungsfunktion Stetige Zufallsvariable: Wahrscheinlichkeitsdichtefunktion Verteilungsfunktion
Wahrscheinlichkeitsfunktion, Verteilungsfunktion Wahrscheinlichkeitsverteilung: Die Menge aller Wahrscheinlichkeiten f(x i ) = P(X = x i ) mit 1 i n ergibt die Wahrscheinlichkeitsverteilung der Variablen X. Dabei liegt f(x i ) zwischen 0 und 1 (sicheres Ereignis). In Histogrammen der Basislänge 1 der Säulen entspricht die Fläche einer Säule der Wahrscheinlichkeit für f(x i ). Ist P ein Wahrscheinlichkeitsmaß, dann gelten für die Einzelwahrscheinlichkeiten f(x i ) = P(X = x i ): n i = 1 f(x i ) = 1 Verteilungsfunktion: Die Verteilungsfunktion F(x) = P(X x) entsteht aus der Summe der Einzelwahrscheinlichkeiten bis zu einer gegebenen Grenze x, also: F(x) n = i = 1 f(x i ) für x i x
Wahrscheinlichkeitsfunktion, Verteilungsfunktion Beispiel: Unverfälschter Würfel. Die Wahrscheinlichkeitsverteilung besteht aus sechs gleich großen Funktionswerten f(x i ) = 1/6, deren Summe gleich 1 ist. Die Verteilungsfunktion F(x) ergibt sich aus der jeweiligen Summe der Einzelwahrscheinlichkeiten bis zu den einzelnen Grenzen durch F(x) = x/6.
Wahrscheinlichkeitsdichtefunktion, Verteilungsfunktion Wahrscheinlichkeitsdichtefunktion (Dichtefunktion): Bei stetigen Variablen lassen sich für Intervalle Wahrscheinlichkeitsverteilungen in Form von Dichtefunktionen f(x i ) angeben: b = P ( a X b) f ( x) dx = F(b) F(a) a ; a, b reelle Zahlen Es ist dann f ( x) dx = 1 Bei der diskreten Zufallsvariablen können Einzelwahrscheinlichkeiten 0 sein, etwa für die Körpergröße 1.811111 m. Verteilungsfunktion: Die Verteilungsfunktion F(x) entsteht aus der Dichtefunktion durch Integration bis zu den Grenzen x, also: = x F ( x) f ( t ) dt Es ist dann 0 F(x) 1
Wahrscheinlichkeitsdichtefunktion, Verteilungsfunktion Normalverteilung Binomialverteilung Poissonverteilung Poissonverteilung
Wahrscheinlichkeitsdichtefunktion, Verteilungsfunktion Beispiel: Hochwasserwelle. Die Zufallsvariable X sei die Verzögerungszeit mit der eine Hochwasserwelle durch einen Durchflussquerschnitt fließt. Sie nimmt die Werte x i zwischen 0 und 4 Stunden ein. Ursache für die Verzögerung sind die unterschiedlichen Reibungsmöglichkeiten im Flussverlauf. Die Wahrscheinlichkeitsverteilung der Zufallsvariablen X in den Grenzen 0 bis 4 wird durch die lineare Dichtefunktion f(x) = -0.125x + 0.5 beschrieben, die ein Wahrscheinlichkeitsmaß darstellt. Mit der Verteilungsfunktion F(x) = -0.0625 x 2 + 0,5 x kann für die Grenzen a und b berechnet werden, wie groß die Wahrscheinlichkeit ist, dass die Zufallsvariable zwischen a und b liegt. Für a = 1 und b = 2 ergibt sich P(1 x 2) = 0.3125.
Wahrscheinlichkeitsdichtefunktion, Verteilungsfunktion Unterschreitungswahrscheinlichkeit: Stellt die Wahrscheinlichkeit dafür dar, dass X Werte annimmt, die kleiner oder gleich einer gegebenen Grenze a ist, also P(X a) = F(a). Überschreitungswahrscheinlichkeit: Stellt die Wahrscheinlichkeit dafür dar, dass X Werte annimmt, die größer oder gleich einer gegebenen Grenze b ist, also P(b X) = 1 - F(b). Zwischenwahrscheinlichkeit: Stellt die Wahrscheinlichkeit dafür dar, dass X Werte annimmt, die größer oder gleich einer gegebenen Grenze a und kleiner oder gleich einer Grenze b ist, also P(a X b) = F(b) - F(a).
Wahrscheinlichkeitsdichtefunktion, Verteilungsfunktion
Erwartungswert, Varianz Erwartungswert: Entsprechend dem arithmetischen Mittel einer empirischen Variablen kann das Zentrum der Verteilung einer Zufallsvariablen durch den Erwartungswert E(X) = µ beschrieben werden. Bei einer diskreten Variablen ist E( X ) = n i = 1 x i P(X = x i ) Bei einer kontinuierlichen Variablen ist E ( X ) = x f ( x) dx Varianz: Entsprechend der Varianz einer empirischen Variablen kann die Abweichung der Verteilungswerte einer Zufallsvariablen vom Erwartungswert durch die Varianz Var(X) = σ 2 = E((X - µ) 2 ) beschrieben werden. Bei einer diskreten Variablen daher n Var ( X ) = ( xi µ ) f ( xi ) i = 1 2 Bei einer kontinuierlichen Variablen daher Var ( X ) = ( x µ ) f ( x) dx 2
Erwartungswert, Varianz Beispiel: Würfel. Die Zufallsvariable X sei die gewürfelte Augenzahl, wobei jede der Zahlen 1 bis 6 mit einer Wahrscheinlichkeit von jeweils 1/6 gewürfelt wird. Wenn man eine hohe Anzahl von Würfen vornimmt, dann erhält man: Erwartungswert E(X) = 1 1/6 + 2 1/6 +... + 6 1/6 = 3.5. Varianz Var(X) = (1-3.5) 2 1/6 + (2-3.5) 2 1/6 +... + (6-3.5) 2 1/6 = 2.92.
Wahrscheinlichkeitsverteilungen Bei der statistischen Analyse experimenteller Erhebungen kann oftmals festgestellt werden, dass sich charakteristische Verteilungen ergeben und diese jeweils bestimmten Zufallsprozessen zugeschrieben werden können. Diese lassen sich mit Hilfe von Zufallsvariablen und den Wahrscheinlichkeitsverteilungen beschreiben. Die wichtigsten Wahrscheinlichkeitsverteilungen sind: Normalverteilung Binomial- oder Bernoulli-Verteilung Poisson-Verteilung Chi - Quadrat - Verteilung Students t- Verteilung
Wahrscheinlichkeitsverteilungen - Normalverteilung Normalverteilung: Setzt stetige intervallskalierte Variable voraus. Wirken unzählige voneinander unabhängige Einzeleinflüsse zusammen auf eine Merkmal, so findet man häufig die Normalverteilung als Verteilungsmuster. Mitteleuropäer im Alter zwischen 50 und 60 Jahren
Wahrscheinlichkeitsverteilungen - Normalverteilung 1 x µ 1 Dichtefunktion der Normalverteilung: f ( x) = e 2 σ ; µ Mittelwert, σ > 0 Stand.abw. σ 2π 2
Wahrscheinlichkeitsverteilungen - Normalverteilung Eigenschaften der Normalverteilung Die Funktion N(µ,σ) = f(x) ist symmetrisch zu µ, dabei liegen Mittel, Modus sowie Median zusammen bei µ, der die größte Wahrscheinlichkeitsdichte vermittelt. Die Funktion f(x) beschreibt eine unbeschränkte, unimodale glockenförmige Verteilung. Der Parameter µ legt die Lage der Normalverteilung fest, σ legt die Streubreite fest und entspricht der Standardabweichung der Daten. Es liegen 68,3% der Fälle im Intervall [µ-σ; µ+σ], 95% im Intervall [µ-2σ; µ+2σ] und 99,7% im Intervall [µ-3σ; µ+3σ].
Wahrscheinlichkeitsverteilungen - Normalverteilung Eigenschaften der Normalverteilung Die Normalverteilung N(0,1) ist wegen ihrer Normierung von besonderer Bedeutung und wird als Standardnormalverteilung bezeichnet. Jede beliebige Normalverteilung N(µ,σ) kann durch Z = (X - µ)/σ in die Standardnormalverteilung N(0,1) überführt werden. Umgekehrt kann N(0,1) durch X = µ + σz in die Normalverteilung N(µ,σ) gebracht werden. N(0,1) 0,45 0,4 0,35 0,3 0,25 0,2 0,15 0,1 0,05 0-6 -4-2 0 2 4 6
Wahrscheinlichkeitsverteilungen - Normalverteilung Verteilungsfunktion der Normalverteilung: x 1 F ( x) = f ( t ) dt = e - x - σ 2π 1 t µ 2 σ 2 dt F(x) für N(0,1) 1.0 0.8 0.6 0.4 0.2 0-6 -4-2 0 2 4 6
Wahrscheinlichkeitsverteilungen - Normalverteilung 0,45 0,4 N(0,1) 0,35 0,3 0,25 0,2 0,15 0,1 0,05 N(2,1) 0-6 -4-2 0 2 4 6 0,45 0,4 N(0,1) 0,35 0,3 0,25 0,2 0,15 0,1 N(0,2) 0,05 0-6 -4-2 0 2 4 6
Wahrscheinlichkeitsverteilungen - Normalverteilung Fragestellungen bei der Analyse von annähernd normalverteilten Daten: Zweiseitige Fragestellung: Beinhaltet eine nach beiden Seiten mögliche Interpretation einer Fragestellung. Eine solche Frage unterscheidet nach Gleichheit bei Hypothesen und einer nach beiden Seiten offene Abweichung. Deshalb liegt der kritische, also gefragte Bereich in dem Intervall [a; b] oder in der Vereinigung der Intervalle [- ; a] und [b; ]. Etwa: Wie groß ist die Wahrscheinlichkeit, dass eine Person aus einer Grundgesamtheit größer als 1,72 m und kleiner als 1,80 m ist? Wie groß ist die Wahrscheinlichkeit, dass eine Person aus einer Grundgesamtheit kleiner als 1,72 m oder größer als 1,80 m ist? 1,60 1,65 1,70 1,75 1,80 1,85 1,90
Wahrscheinlichkeitsverteilungen - Normalverteilung Fragestellungen bei der Analyse von annähernd normalverteilten Daten: Einseitige Fragestellung: Der kritische, also gefragte Bereich liegt in den Intervallen [- ; x] oder [x; ], es tritt daher eine Unterschreitungswahrscheinlichkeit oder eine Überschreitungswahrscheinlichkeit auf. Etwa: Wie groß ist die Wahrscheinlichkeit, dass eine Person aus einer Grundgesamtheit kleiner als 1,80 m ist? Wie groß ist die Wahrscheinlichkeit, dass eine Person aus einer Grundgesamtheit größer als 1,72 m ist? 1,60 1,65 1,70 1,75 1,80 1,85 1,90
Wahrscheinlichkeitsverteilungen - Normalverteilung Fragestellungen bei der Analyse von annähernd normalverteilten Daten: Es reicht, die Unterschreitungs- oder Überschreitungswahrscheinlichkeiten von N(0,1) zu kennen, da jede andere Normalverteilung in diese überführt werden kann. Für N(0,1) liegen die entsprechenden Wahrscheinlichkeiten zumeist in Tabellen vor.
Wahrscheinlichkeitsverteilungen - Normalverteilung
Wahrscheinlichkeitsverteilungen - Normalverteilung Beispiel: Verwendung der Tabelle Es ist eine Schranke x gegeben, gesucht ist deren Überschreitungswahrscheinlichkeit P(X > x). P(X > 1.34) = 0.0901. P(X > 1.345) = 0.0893 (Interpolation zwischen den Tabellenwerten). 0,45 0,4 0,35 0,3 0,25 0,2 0,15 0,1 0,05 0-6 -4-2 0 2 4 6
Wahrscheinlichkeitsverteilungen - Normalverteilung Beispiel: Verwendung der Tabelle Umgekehrt sei die Überschreitungswahrscheinlichkeit p gegeben, gesucht ist die Schranke x, so dass P(X > x) = p ist. P(X > x) = 0.330, damit ist x = 0.44 P(X > x) = 0.00604, damit ist x = 2.51 F(x) für N(0,1) 1.0 0.8 0.6 0.4 0.2 0-6 -4-2 0 2 4 6
Wahrscheinlichkeitsverteilungen - Normalverteilung Beispiel: Verwendung der Tabelle Mit der Tabelle lassen sich auch relativ einfach Unterschreitungs- und Zwischenwahrscheinlichkeiten berechnen. Dabei nutzt man aus, dass N(0,1) symmetrisch zu x = 0 ist. Es gilt: P(X < -x) = P(X > x) P(X < x) = 1 - P(X > x) P(X > -x) = 1- P(X < -x) = 1 - P(X > x) P(a < X < b) = P(X > a) - P(X > b) 0,45 0,4 0,35 0,3 0,25 0,2 0,15 0,1 0,05 0-6 -4-2 0 2 4 6
Wahrscheinlichkeitsverteilungen - Normalverteilung Beispiel: Verwendung der Tabelle Ist daher etwa der Unterschreitungswert x gegeben, dann ist die Wahrscheinlichkeit p gesucht, so dass P(X < x) = p ist. Es ist also etwa P(X < 1.55) = 1 - P(X > 1.55) = 1-0.0606 = 0.9394.
Wahrscheinlichkeitsverteilungen - Normalverteilung Beispiel: Verwendung der Tabelle Will man mit Hilfe der Tabelle für N(0,1) eine Wahrscheinlichkeit P(X > x) für eine beliebige N(µ,σ) berechnen, so muss die Schranke x standardisiert werden zu z = (x - µ)/σ. Dann kann in der Tabelle für N(0,1) der Wert P(Z > z) ermittelt werden. Es ist P(X > x) = P(Z > z).
Wahrscheinlichkeitsverteilungen - Normalverteilung Anwendung der Normalverteilung: Die N(µ,σ) eignet sich als Grundgesamtheits-Modell (GG-Modell) zur Lösung einer Reihe praxisbezogener Fragestellungen, da viele Zufallsvariablen wenigstens annähernd normalverteilt sind. Die Dichtefunktion der Normalverteilung ist beidseitig unbeschränkt, also treten bei auch negative Werte auf. Daher ist die Normalverteilung auf rational-skalierte Zufallsvariablen (wie z.b. Niederschlagshöhe, Abfluss) streng genommen nicht anwendbar. Dennoch wird sie wegen ihrer leichten Benutzbarkeit häufig auch in diesen Fällen verwendet. Da bei einer GG oftmals µ und σ nicht vorliegen, wird von einer repräsentativen Stichprobe (STP) das arithmetische Mittel µ STP = sowie die Standardabweichung σ STP verwendet. Vor Verwendung der Normalverteilung als GG-Modell muss mit Hilfe eines geeigneten statistischen Tests geprüft werden, ob die STP die Hypothese einer normalverteilten GG stützt. x
Wahrscheinlichkeitsverteilungen - Normalverteilung Beispiel: Temperaturdaten. Als Stichprobe stehen die mittleren jährlichen Lufttemperaturen an n = 30 Messstationen in Tälern der nördlichen Alpen zur Verfügung. Die beiden Normalverteilungs-Parameter µ und σ sind zwar nicht bekannt, können aber durch die entsprechenden STP-Kennwerte geschätzt werden. Die STP stützt die Annahme, dass die Grundgesamtheit normalverteilt ist und es ist µ STP = 7.6 C und σ STP = 0.74 C. Es soll berechnet werden, mit welcher Wahrscheinlichkeit P die mittlere jährliche Lufttemperatur einen Wert von 8.5 C überschreitet, also P(T > 8.5). N(7.6,0.74) 7.6 8.5
Wahrscheinlichkeitsverteilungen - Normalverteilung Beispiel: Temperaturdaten. Der standardisierte Wert z für x = 8.5 ist durch z = (x - µ)/σ bestimmt, also ist z = 1.216. In der N(0,1)-Tabelle ist derjenige Wert p, für den p = P(Z > 1.216) ist, dann p = 0.1121. Wegen P(X > x) = P(Z > z) ist dann: P(T > 8.5) = 0.1121. Mit anderen Worten: An durchschnittlich 11 von 100 Orten (bzw. in 11% der Fläche) überschreitet die Jahresmitteltemperatur in den nördlichen Alpentälern die Schranke von 8.5 C.
Wahrscheinlichkeitsverteilungen - Normalverteilung Beispiel: Niederschlagsdaten. An einer Klimastation sind in den letzten 50 Jahren die Niederschlagsmengen aufgezeichnet worden. Die jährlichen Niederschlagssummen entsprechen dabei einer Normalverteilung mit µ = 400 mm und σ = 100 mm. Es soll berechnet werden In wie viel Prozent der Jahre liegen die jährlichen Niederschlagssummen zwischen 300 mm und 425 mm? Welche Niederschlagsmenge wird in 95% aller Jahre übertroffen? In welchem Intervall liegen 80% der jährlichen Niederschlagssummen? Mit welcher Wahrscheinlichkeit liegt ein Niederschlagswert (Jahressummen) zwischen 180 mm und 200 mm?
Wahrscheinlichkeitsverteilungen - Normalverteilung Beispiel: Niederschlagsdaten. Die Überschreitungswahrscheinlichkeit P(z > 300) entspricht nach Standardisierung durch z = (x - µ)/σ = (300-400)/100 = -1 dann P(z > -1) = 1 - P(z > 1). Die Tabelle zeigt P(z > 1) = 0.1587, daher ist P(z > -1) = 1-0.1587 = 0.8413. Die Überschreitungswahrscheinlichkeit P(z > 425) entspricht nach Standardisierung dann P(z > 0.25). Die Tabelle zeigt P(z > 0.25) = 0.4013. Die Zwischenwahrscheinlichkeit ist daher P(z > 300) - P(z > 425) = P(z > -1) - P(z > 0.25) = 0.44 (44%).
Wahrscheinlichkeitsverteilungen - Normalverteilung Beispiel: Niederschlagsdaten. Für die Frage nach der Niederschlagsmenge die in 95% aller Jahre übertroffen wird, kann wegen P(Z > -z) = 1 - P(Z > z) die Überschreitungswahrscheinlichkeit von 5% verwendet werden. Die N(0,1)-Tabelle zeigt für P(z > 0.05) dann z = 1.645. Wegen z = (x - µ)/σ ist dann x = 400 + 1.645 100 = 564.5 mm. Damit ist -x = 400 - (564.5-400) = 235.5 mm. N(400,100) -x 400
Wahrscheinlichkeitsverteilungen - Normalverteilung Beispiel: Niederschlagsdaten. Das Zwischenwahrscheinlichkeits-Intervall, das 80% der Niederschläge umfasst, beinhaltet 40% links und 40% rechts der Werte von µ = 400. Da es sich hierbei um eine zweiseitige Fragestellung handelt, muss nach dem Wert mit einer 10%- Wahrscheinlichkeit gefragt werden. Die N(0,1)-Tabelle zeigt für P(z > 0.1) dann z = 1.28. Wegen z = (x - µ)/σ ist dann x = 400 + 1.28 100 = 528 mm. Daher liegt die andere Grenze bei 400 - (528-400) = 272 mm. N(400,100) 400
Wahrscheinlichkeitsverteilungen - Binomialverteilung Binomialverteilung: Diese Verteilung behandelt eine diskrete Zufallsvariable die nur zwei unabhängige und verschiedene Merkmale annehmen kann (Bernoulli- Experiment), etwa beim Münzwurf, oder beim Ziehen von Kugeln mit Zurücklegen. Die Wahrscheinlichkeiten für die einzelnen Ereignisse p und 1-p sind jeweils konstant. Die Wahrscheinlichkeit, dass bei einem Experiment ein Ereignis mit Wahrscheinlichkeit p genau k-mal auftritt wenn das Experiment n-mal durchgeführt wird, ist durch die Dichtefunktion f gegeben durch: n f ( k) = p k k (1 p) n k mit n k = n! k! ( n k)! und n! = 1 2 3... ( n 1) n Eigenschaften: Bei festem n und steigendem p Veränderung der Dichtefunktion hinsichtlich der Symmetrie. Bei festem p und steigendem n wird die Dichtefunktion zunehmend symmetrisch.
Wahrscheinlichkeitsverteilungen - Binomialverteilung Beispiel: Münzwurf. Die Wahrscheinlichkeit bei 3 Münzwürfen genau 2-mal Wappen zu erhalten ist mit p = 0.5 = 1 - p dann 0.375 = 3/8. p WWW p 1-p p 1-p p 1-p WWZ p 1-p p 1-p WZW WZZ ZWW ZWZ 1-p p ZZW 1-p ZZZ
Wahrscheinlichkeitsverteilungen - Binomialverteilung Beispiel: Münzwurf. Die Wahrscheinlichkeit beim Wurf von 10 Münzen, genau 8-mal Wappen zu erhalten ist dann 0.044, also 4.44%.
Wahrscheinlichkeitsverteilungen - Binomialverteilung 0,3 n = 15, p = 0,2 0,2 0,1 0,0 0,3 0 5 10 15 20 n = 15, p = 0,5 0,2 0,1 0,0 0 5 10 15 20 0,3 n = 15, p = 0,8 0,2 0,1 0,0 0 5 10 15 20
Wahrscheinlichkeitsverteilungen - Binomialverteilung 0,3 n = 8, p = 0,5 0,2 0,1 0,0 0,3 0 5 10 15 20 n = 15, p = 0,5 0,2 0,1 0,0 0 5 10 15 20 0,3 n = 21, p = 0,5 0,2 0,1 0,0 0 5 10 15 20
Wahrscheinlichkeitsverteilungen - Poissonverteilung Poissonverteilung: Für eine große Anzahl von Versuchen n und kleiner Wahrscheinlichkeiten p der Ereignisse, insbesondere wenn der Ausdruck n p gegen einen Mittelwert µ konvergiert, lässt sich die Binomialverteilung durch die Poisson-Verteilung annähern. Dabei ist dessen Dichtefunktion gegeben durch: µ k µ f ( k) = e mit µ Mittelwert, k k! Anzahl der Ereignisse Eigenschaften: Die Poissonverteilung beschreibt die Wahrscheinlichkeit, dass k Ereignisse in einem festen Zeitintervall eintreten. Dies wird bei Warteschlangenproblemen aller Art benötigt, etwa Ankunft von Kunden, Eintreffen von Telefongesprächen, Ankunft eines Fahrzeugs an einem Messquerschnitt. Zudem bei radioaktivem Zerfall, Zählen von relativ seltenen zufälligen und voneinander unabhängigen Ereignissen pro Zeit-, Längen-, Flächen- oder Raumeinheit.
Wahrscheinlichkeitsverteilungen - Poissonverteilung 0,5 0,4 µ =1 m= 1 0,3 0,2 0,1 0,0 0 5 10 15 0,5 0,4 µ =5 m= 5 0,3 0,2 0,1 0,0 0 5 10 15 0,5 0,4 µ =10 m= 10 0,3 0,2 0,1 0,0 0 5 10 15
Wahrscheinlichkeitsverteilungen - Chi Quadrat-Verteilung Chi-Quadrat-Verteilung: Die Verteilung der Summe von n (Freiheitsgrad) unabhängigen standardnormalverteilten quadrierten Zufallsvariablen Z i2 ist die neue Zufallsvariable mit Chi-Quadrat-Verteilung χ². Unter den Freiheitsgraden versteht man die Differenz der Anzahl n der Stichprobenelemente und der bereits geschätzten Parameter, die zur Berechnung des Wertes der gesuchten Stichprobenfunktion notwendig sind. Dabei ist die Dichtefunktion gegeben durch: f x x) = 2 0 n / 2 1 ( n / 2 n x / 2 e Γ n / 2 ( ) für x > 0 für x 0 Eigenschaften: In der Berechnung des arithmetischen Mittels einer Stichprobe vom Umfang n gehen alle Stichprobenwerte ein, der Freiheitsgrad ist daher n. In der Berechnung der Standardabweichung einer Stichprobe vom Umfang n gehen alle Stichprobenwerte sowie das daraus berechnete arithmetische Mittel ein, der Freiheitsgrad ist daher n - 1. Die stetige, asymmetrische Verteilung hat als einzigen Parameter den Freiheitsgrad.
Wahrscheinlichkeitsverteilungen - Chi Quadrat-Verteilung Chi-Quadrat-Verteilung: Die Verteilung der Summe von n (Freiheitsgrad) unabhängigen standardnormalverteilten quadrierten Zufallsvariablen Z i2 ist die neue Zufallsvariable mit Chi-Quadrat-Verteilung χ². Unter den Freiheitsgraden versteht man die Differenz der Anzahl n der Stichprobenelemente und der bereits geschätzten Parameter, die zur Berechnung des Wertes der gesuchten Stichprobenfunktion notwendig sind. Dabei ist die Dichtefunktion gegeben durch: f x x) = 2 0 n / 2 1 ( n / 2 n x / 2 e Γ n / 2 ( ) für x > 0 für x 0 Eigenschaften: Die Chi-Quadrat-Verteilung nähert sich mit zunehmenden Freiheitsgraden n der Normalverteilung N(n,2n) an und wird daher zunehmend symmetrisch. Für die Chi-Quadrat-Verteilung gibt es entsprechend Tabellen
Wahrscheinlichkeitsverteilungen - Chi Quadrat-Verteilung
Wahrscheinlichkeitsverteilungen - Chi Quadrat-Verteilung
Wahrscheinlichkeitsverteilungen - Students t-verteilung Students t-verteilung: Dieses Verteilungsmuster liegt oft bei experimentellen Situationen mit kleiner Stichprobenanzahl vor, zumeist bei n < 30. Dabei ist die Dichtefunktion gegeben durch: f n n + 1 n + 1 Γ 2 + = 2 x 2 + x 1 t ( x) 1 mit < x < + und Γ( x) = t e dt n Γ n nπ 0 2 Eigenschaften Die t- Verteilung dient u.a. zur Beurteilung der Unterschiede zweier Mittelwerte, bei der Prüfung von Hypothesen und zur Berechnung von Vertrauensgrenzen für Mittelwerte und Regressionskoeffizienten. Bei der t- Verteilung wird µ = 0 und σ > 0 gewählt. Dabei ist σ 2 = n/(n-2), mit n Freiheitsgrad der Stichprobe. Für n = 30 nähert sich σ 2 dann 1 und die t- Verteilung damit der Standardnormalverteilung N(0,1) an.
Wahrscheinlichkeitsverteilungen - Students t-verteilung
Wahrscheinlichkeitsverteilungen - Students t-verteilung