Fragestellungen der Schließenden Statistik

Größe: px
Ab Seite anzeigen:

Download "Fragestellungen der Schließenden Statistik"

Transkript

1 Fragestellungen der Schließenden Statistik Bisher: Teil I: Beschreibende Statistik Zusammenfassung von an GesamtheitM N {e,,e N } erhobenem Datensatz x,,x N durch Häufigkeitsverteilung und Kennzahlen für Lage, Streuung und Zusammenhang Teil II: Wahrscheinlichkeitstheorie Jetzt: Auffassung von Datensatz x,,x N als Realisationsreihe von i.i.d. Zufallsvariablen X,,X N, Beschreibung der Wahrscheinlichkeitsverteilungdieser Zufallsvariablen und Charakterisierung der Verteilung durch Lage, Streuung und Zusammenhang Teil III: Schließende Statistik Rückschlüsse anhand von x,,x N auf Charakteristika θ,,θ k der unterstellten W keitsverteilungder datengenerierenden X,,X N und Fehlerabschätzung der Rückschlüsse. Diese Charakteristika gelten für die Grundgesamtheit, d.h. für die Menge {e, e 2, } aller Merkmalsträger (Ω, A, P) X:Ω R M N {e,,e N } x,,x N P(Xi x) F (x;θ) X z.b. θˆ P(Xi x) F (x;θ) X x P(X x) F (x;θ) M M {e,,e M } M>N < z.b. θ E(X) X

2 Fragestellungen der Schließenden Statistik Verfahrenstypen Punktschätzungen Schätzung von Verteilungs- parameter θ durch Kennzahl θˆ T(x,...,x N ) Intervallschätzungen Schätzung eines Intervalls [θˆ,θˆ L U] KI(x,...,x mit P θ [θˆ,θˆ ] ( ) α L U N ) Hypothesentests Entscheidung zwischen H : θ T und H : θ T anhand von θˆ Δ oder θˆ Δ mit P(Θˆ Δ θ T ) α 2

3 Ausgangssituation Datensatz x(x,,x N ) als Realisationsreihe von N i.i.d. Zufallsvariablen X,,X N, X i ~F X ( z.b.n, F X N(μ,) ) Unbekannterk-dimensionaler Parametervektor θ(i.w. k ) der Verteilung F X ( z.b. θ μ) θ θ θ μ 4.5 µ 4.9 µ 5 µ 5.2 µ 5.5 3

4 Hypothesen Nullhypothese H : θ T Alternativhypothese H : θ T ( z.b. H : μ 5 ) ( z.b. H : μ 5 ) µ 5 μ 4.5 µ 4.9 µ 5.2 µ 5.5 4

5 Teststatistik Allgemeine Form eines statistischen Tests Zufallsvariable T(X) mit unter H spezifizierter Verteilung F T(X) H (z.b. T(X) X, F ix H N(5, /N) ) Testentscheidung Zufallsvariable φ(x) I(T(X) Δ ) Lehne H nicht ab, falls T(X) Δ mit AnnahmebereichΔ ( z.b.δ (4.3, 5.7) ) Lehne H ab, falls T(X) Δ mit AblehnbereichΔ ( z.b.δ (, 4.3] [5.7, ) ) Δ Δ Δ ϕ(x) ϕ(x) ϕ(x) X 5

6 Test zum Niveau α Test, dessen maximale Wahrscheinlichkeit, H trotz ihrer Gültigkeit zu verwerfen, durch einen vor dem Test festzulegenden Wert α nach oben begrenzt ist. P(T(X) Δ θ T) α Für einen exakten Test zum Niveau αgilt P(T(X) Δ θ T) α Für einen konservativen Test zum Niveau α gilt P(T(X) Δ θ T) < α 6

7 Test zum Niveau α Test, dessen maximale Wahrscheinlichkeit, H trotz ihrer Gültigkeit zu verwerfen, durch αnach oben begrenzt ist. _ P(T(X) Δ θ T) α (z.b. T(X) X, F ix H N(5, /N) P[ X (4.3,5.7)].27 Beispieltest ist Niveau-α-Test für jedes α.27, also auch für.5 ) f X H (x) P(T(X) Δ θ T) x P(T(X) Δ θ T) 7

8 P-Wert Allgemeine Form eines statistischen Tests kleinstes Niveau α p, zu dem ein Niveau-α p -Test die Nullhypothese für die Realisation x (x,,x N ) ablehnt Für Niveau-α-Tests mit einseitigen AblehnbereichenΔ (c α, ), d.h. Tests, deren Entscheidung gegen H gleichbedeutend mit T(X) > c α (sog. kritischer Wert) ist, gilt: αp P(T(X) > T(x) H) Bemerkung: c α ist das für einen exakten Niveau-α-Test das -α-quantil der Verteilung von T(X) unter H, denn P(T(X) Δ θ T) α P(T(X) > cα H) α P(T(X) cα H) α Die Entscheidung zum Niveauαgegen H ist dann äquivalent mit I(α p α), denn α p α P(T(X) > T(x) H T(x) > c α ) P(T(X) > c α H ) 8

9 P-Wert Allgemeine Form eines statistischen Tests kleinstes Niveau α p, zu dem ein Niveau-α p -Test die Nullhypothese für die Realisation x (x,,x N ) ablehnt Für Niveau-α-Tests mit einseitigen AblehnbereichenΔ (c α, ), d.h. Tests, deren Entscheidung gegen H gleichbedeutend mit T(X) > c α (sog. kritischer Wert) ist, gilt: P(T(X) T(x) H ) αp > _ ( z.b. T(X) X-5, α.5 c <.62 _ X 4.8 T(x).2 P(T(X)>.2 μ5).527>.5 Lehne H zum Niveau.5 nicht ab ) -α.95 -α p.473 F X-5 H (x) _ x-5.2 c.5.62 x 9

10 Zufallsvariable X (X,...,X ),X ~F i.i.d ( z.b.n, F X N(μ,) ) N i X θ θ Nullhypothese H : θ T ( z.b. H : μ 5 ) TeststatistikT(X), mit F T(X) H T(X) mit ( z.b. T(X) X, F ix H N(5, /N) ) F T(X) H Testentscheidung φ(x) I(T(X) Δ) ( z.b.δ (4.3, 5.7) ) Test zum Niveau α P(T(X) Δ θ T) α ( z.b.α.5 ) _ P-Wert P(T(X) T(x) H ) ( z.b. T(X) X-5, α.5 c.5.62 αp > T(x).2 P(T(X)>.2 μ5).527 ) Signifikantes Ergebnis zum Niveau α α p α

11 Richtige und falsche Testentscheidungen H gilt H gilt Testentscheidung für H Richtige Testentscheidung (. Art) Fehler 2. Art(β-Fehler) Testentscheidung fürh Fehler. Art (α-fehler) Richtige Testentscheidung (2. Art) Bei einem Niveau-α-Test ist die Wahrscheinlichkeit für den Fehler. Art VORDurchführung des Tests nach oben durch den Wert von αbegrenzt (und entsprechend die Wahrscheinlichkeit für die richtige Testentscheidung. Art nach unten durch - α). Falls H gilt, ist die Wahrscheinlichkeit P(φ(X) H ), sich falsch zu entscheiden, maximal gleich α.

12 Richtige und falsche Testentscheidungen H gilt H gilt Testentscheidung für H Richtige Testentscheidung (. Art) Fehler 2. Art(β-Fehler) Testentscheidung fürh Fehler. Art (α-fehler) Richtige Testentscheidung (2. Art) Bei einem Niveau-α-Test ist die Wahrscheinlichkeit für den Fehler. Art VORDurchführung des Tests nach oben durch den Wert von αbegrenzt (und entsprechend die Wahrscheinlichkeit für die richtige Testentscheidung. Art nach unten durch - α). Falls H abgelehnt wurde, ist die Wahrscheinlichkeit P(H φ(x)), sich falsch entschieden zu haben, maximal gleich α. Wenn H als unbekannt, aber nicht als Ergebnis eines Zufallsexperiments angesehen wird, gilt ohnehin entweder P(H φ(x)) oder P(H φ(x)). 2

13 Beispiel: Einmaliges Würfeln mit 2-seitigem Würfel H gilt Alle Zahlen gleich wahrscheinlich H gilt Mindestens eine Zahl mit abweichender W keit P(H φ(x)) α. Testentscheidung für H : keine 2 gewürfelt Testentscheidung für H : 2 gewürfelt Richtige Testentscheidung (. Art) Fehler. Art (α-fehler) Fehler 2. Art(β-Fehler) Richtige Testentscheidung(2. Art) Wenn H als unbekannt, aber als Ergebnis eines Zufallsexperiments angesehen wird, gilt ohnehin entweder P(H φ(x)) oder P(H φ(x)). Betrachte die nach einfachem Wurf mit 2-seitigem Würfel geworfene Zahl X Der Test für H : P(Xi)/2 für alle i gegen H : P(Xi) /2 für mindestens ein i, der H ablehnt, falls die gewürfelte Zahl eine 2 ist, ist ein exakter Niveau-.5-Test. Falls über die Herkunft des Würfels nichts bekannt ist, kann aber auch bei Testentscheidung für H keine weitere Aussage über H getroffen werden außer der, dass falls H gälte, das erhaltene Testergebnis x2 nur in 5% aller Fälle auftreten würde. 3

14 Beispiel: Einmaliges Würfeln mit 2-seitigem Würfel H gilt Alle Zahlen gleich wahrscheinlich H gilt Mindestens eine Zahl mit abweichender W keit P(H φ(x)) α. Testentscheidung für H : keine 2 gewürfelt Testentscheidung für H : 2 gewürfelt Richtige Testentscheidung (. Art) Fehler. Art (α-fehler) Fehler 2. Art(β-Fehler) Richtige Testentscheidung(2. Art) Falls bekannt ist, dass der Würfel aus einer Kiste von Würfeln mit einem Anteil u an unfairen Würfeln stammt, so gilt P(H )-u. In diesem Fall ist H Ergebnis eines Zufallsexperiments und die Wahrscheinlichkeit P(H φ(x)) kann durch den Satz von Bayesbestimmt werden zu P(H φ(x) ) P( φ(x) H ) P( φ(x) H ) P(H ) P(H ) + [ P( φ(x) H ) ] [ P(H )] α ( u) + α ( u) [ P( φ(x) H) ] u und hängt damit noch von der Wahrscheinlichkeit für den Fehler 2. Art ab. 4

15 Richtige und falsche Testentscheidungen H gilt H gilt Testentscheidung für H Richtige Testentscheidung (. Art) Fehler 2. Art(β-Fehler) Testentscheidung fürh Fehler. Art (α-fehler) Richtige Testentscheidung (2. Art) Bei einem Niveau-α-Test ist die Wahrscheinlichkeit für den Fehler. Art VORDurchführung des Tests nach oben durch den Wert von αbegrenzt (und entsprechend die Wahrscheinlichkeit für die richtige Testentscheidung. Art nach unten durch - α). Über die Wahrscheinlichkeit für den Fehler 2. Art sagt die allgemeine Definition des Niveau-α- Tests nichts aus. Je nach konkretem Test können aber möglicherweise Aussagen über P(φ(X) θ T ) für Teilmengen T T gemacht werden. 5

16 Beispiel: Einmaliges Würfeln mit 2-seitigem Würfel H gilt Alle Zahlen gleich wahrscheinlich H gilt Zahl 2 mit %-iger W keit Testentscheidung für H : keine 2 gewürfelt Richtige Testentscheidung (. Art) Fehler 2. Art(β-Fehler) P(H φ(x)) α. Testentscheidung für H : 2 gewürfelt Fehler. Art (α-fehler) Richtige Testentscheidung(2. Art) Falls bekannt ist, dass der Würfel aus einer Kiste von Würfeln mit einem Anteil u an unfairen Würfeln stammt, so gilt P(H )-u. Falls weiterhin bekannt ist, dass auf allen 2 Seiten der unfairen Würfel eine 2 steht, so gilt: P( φ(x) H ) und damit: P(H φ(x) ) α ( u) + α ( u) [ P( φ(x) H ) ] u α ( u) α ( u) + u also z.b. für α.5 und u.: P(H φ(x) ).832 6

17 Beispiel: Einmaliges Würfeln mit 2-seitigem Würfel P(H φ(x)) α. Testentscheidung für H : keine 2 gewürfelt Testentscheidung für H : 2 gewürfelt H gilt Alle Zahlen gleich wahrscheinlich Richtige Testentscheidung (. Art) Fehler. Art (α-fehler) H gilt Zahl 2 mit %-iger W keit Fehler 2. Art(β-Fehler) Richtige Testentscheidung(2. Art) Falls bekannt ist, dass der Würfel aus einer Kiste von Würfeln mit einem Anteil u an unfairen Würfeln stammt, so gilt P(H )-u. Falls weiterhin bekannt ist, dass auf allen 2 Seiten der unfairen Würfel eine 2 steht, so gilt: P(H α ( u) φ(x) ) α ( u) + u Je geringer also der Anteil an unfairen Würfeln ist, desto wahrscheinlicher ist also H trotz gegenteiliger Testentscheidung. P(H φ(x) ) α.5 u 7

18 Satz von Bayes, Beispiel Spam-Filter Déjà-vu? Gegeben P(A B) Sensitivität.95 P(A C B C ) Spezifität.98 P(B) Prävalenz.5 P(B A) P(A B) C P (B) + [ P(A B Ω P(A B) P (B) Ω C )] [ P Ω A: Maximalgewinn in Mail A C : Maximalgewinn nicht in Mail (B)] P(B A) P(A B) P(B) P(A) B: Mail ist Spam B C : Mail ist kein Spam (.98) (.5) Wenn.5% der Mails Spam sind, sind bei einer Sensitivität von 95% und bei einer Spezifität von 98% ca. 9.3% der als Spam klassifizierten Mails tatsächlich Spam 8

19 Satz von Bayes, Beispiel Spam-Filter Déjà-vu! Spam-Filter ist Niveau-α-Test Gegeben P(φ H ) -α.95 P(φ H ) -P(β-Fehler).98 P(H ).5 P(H φ) P(φ H ) P(φ H ) P(H ) φ: Maximalgewinn in Mail φ: Maximalgewinn nicht in Mail P(H ) + [ P(φ H )] [ P(H )] P(φ H) P(H) P(H φ ) P(φ ) H : Mail ist Spam H : Mail ist kein Spam (.98) (.5) Wenn.5% der Mails Spam sind, sind bei einem Testniveau von 5% und bei einer Wahrscheinlichkeit für den Fehler 2. Art von 2% als Spam klassifizierten Mails mit einer Wahrscheinlichkeit von ca. 9.3% tatsächlich Spam 9

20 Beispiel: Hackerangriffsserie In einem Netzwerksystem sei es an 3 Tagen zu den Zeitpunkten 5 Uhr, 8 Uhr und 9 Uhr zu Hackerangriffen gekommen, von denen bekannt ist, dass sie von der selben Person ausgingen. In den Log-Dateien des Systems werden keine IP-Adressen gespeichert. Allerdings geht aus diesen Dateien hervor, dass sich täglich ca. Personen in das System einloggen, wobei ihr täglicher Einlogg-Zeitpunkt näherungsweise einer N(,.5 2 ) Verteilung und ihre tägliche Online-Zeit einer Exp(.5)-Verteilung folgt. Per Zufall geht nun aus den lokalen Log-Dateien eines ansonsten Unverdächtigen A hervor, dass er zu allen drei Angriffs-Zeitpunkten im System eingeloggt war. Fragen:. Spricht diese Tatsache zum Niveau gegen H : A ist unschuldig an den Angriffen? 2. Mit welcher Wahrscheinlichkeit hat A die Angriffe durchgeführt? 2

21 Beispiel: Hackerangriffsserie. Spricht diese Tatsache zum Niveau gegen H : A ist unschuldig an den Angriffen? Unter H gilt: Einloggzeitpunkt X e ~N(,.5 2 ) f X e (x) e 2π.5 2 x 2.5 Ausloggzeitpunkt Xa Xe + X o mit X o ~Exp(.5) f X x X x a e (y) I( y).5e.5y Wahrscheinlichkeit, zum Zeitpunkt x t eingeloggt gewesen zu sein: P(Xe < xt < Xa) P(Xe < xt) P(xTt < Xa Xe < x t ) P(Xe < xt) [ P(Xa < xt Xe < x t )] x x u t t f X ux X a e u (v) f X e (u) dv du x x u t t.5e.5v 2π.5 e 2 u 2.5 dv du 2

22 Beispiel: Hackerangriffsserie. Spricht diese Tatsache zum Niveau gegen H : A ist unschuldig an den Angriffen? Wahrscheinlichkeit, zum Zeitpunkt x t eingeloggt gewesen zu sein: P(X e < x t < X ) a x x u t t.5v.5e e 2π.5 2 u 2.5 dv du Wahrscheinlichkeiten, zu den 3 Angriffszeitpunkten online gewesen zu sein: P( X e < 5 < X a ).77 P( X e < 8 < X a ).4 P( X e < 9 < X a ).24 P(X e < x t < X a ) x t 22

23 Beispiel: Hackerangriffsserie. Spricht diese Tatsache zum Niveau gegen H : A ist unschuldig an den Angriffen? Wahrscheinlichkeit, zum Zeitpunkt x t eingeloggt gewesen zu sein: P(X e < x t < X ) a x x u t t.5v.5e e 2π.5 2 u 2.5 dv du Wahrscheinlichkeit, zu allen 3 Angriffszeitpunkten online gewesen zu sein: P( X e; < 5 < X a; X e;2 < 8 < X a;2 X e;3 < 9 < X a;3 ) P(X e < x t < X a ) x t 23

24 Beispiel: Hackerangriffsserie. Spricht diese Tatsache zum Niveau gegen H : A ist unschuldig an den Angriffen? Wahrscheinlichkeit, zum Zeitpunkt x t eingeloggt gewesen zu sein: P(X e < x t < X ) a x x u t t.5v.5e e 2π.5 Wahrscheinlichkeit, zu allen 3 Angriffszeitpunkten online gewesen zu sein: 2 u 2.5 dv du P( X e; < 5 < X a; X e;2 < 8 < X a;2 X e;3 < 9 < X a;3 ) <. Die Nullhypothese A ist unschuldig an den Angriffen kann also zum Niveau abgelehnt werden. 24

25 Beispiel: Hackerangriffsserie 2. Mit welcher Wahrscheinlichkeit hat A die Angriffe durchgeführt? Wahrscheinlichkeit der Unschuld von A ohne Einlogg-Information: P(H ) 9999/ Wahrscheinlichkeit, zu den drei Zeitpunkten eingeloggt gewesen zu sein bei Unschuld von A: P(X e; < 5 < X a; X e;2 < 8 < X a;2 X e;3 < 9 < X a;3 H ) : P(L 3 H ).73 Wahrscheinlichkeit, zu den drei Zeitpunkten eingeloggt gewesen zu sein bei Schuld von A: P(L 3 H ) Wahrscheinlichkeit, dass A unschuldig ist, wenn er zu den drei Zeitpunkten eingeloggt war: P(H L 3 ) P(L3 H) P(H) P(L ) 3 P(L 3 P(L3 H) P(H) H ) P(H ) + P(L H ) [ P(H )] 3 25

26 Beispiel: Hackerangriffsserie 2. Mit welcher Wahrscheinlichkeit hat A die Angriffe durchgeführt? Wahrscheinlichkeit der Unschuld von A ohne Einlogg-Information: P(H ) 9999/ Wahrscheinlichkeit, zu den drei Zeitpunkten eingeloggt gewesen zu sein bei Unschuld von A: P(X e; < 5 < X a; X e;2 < 8 < X a;2 X e;3 < 9 < X a;3 H ) : P(L 3 H ).73 Wahrscheinlichkeit, zu den drei Zeitpunkten eingeloggt gewesen zu sein bei Schuld von A: P(L 3 H ) Wahrscheinlichkeit, dass A unschuldig ist, wenn er zu den drei Zeitpunkten eingeloggt war: P(L3 H) P(H) P(H L3).633 P(L H ) P(H ) + P(L H ) [ P(H )]

27 Beispiel: Hackerangriffsserie 2. Mit welcher Wahrscheinlichkeit hat A die Angriffe durchgeführt? Wahrscheinlichkeit der Unschuld von A ohne Einlogg-Information: P(H ) 9999/ Wahrscheinlichkeit, zu den drei Zeitpunkten eingeloggt gewesen zu sein bei Unschuld von A: P(X e; < 5 < X a; X e;2 < 8 < X a;2 X e;3 < 9 < X a;3 H ) : P(L 3 H ).73 Wahrscheinlichkeit, zu den drei Zeitpunkten eingeloggt gewesen zu sein bei Schuld von A: P(L 3 H ) Wahrscheinlichkeit, dass A unschuldig ist, wenn er zu den drei Zeitpunkten eingeloggt war: P(H L3).633 Die Wahrscheinlichkeit, dass A die Angriffe durchgeführt hat, beträgt etwa -.633, also ca. 36.7%. 27

28 Beispiel: Hackerangriffsserie Die Wahrscheinlichkeit, dass A die Angriffe durchgeführt hat, beträgt etwa -.633, also ca. 36.7%. Diese Wahrscheinlichkeit P A (H ) kann in weiteren Tests als Vorinformation genutzt werden. Wenn sich z.b. aus den lokalen Dateien von A hervorgeht, dass auf seinem Rechner ein Programm installiert ist (Ereignis PI), das sich auf den Rechnern von 99% der Personen, die für vergleichbare Angriffe verantwortlich zeichneten und nur auf 6% der Rechner der übrigen Personen findet, so kann die Wahrscheinlichkeit P A (H PI) mit der gleichen Nullhypothese wie im vergangenen Test, berechnet werden zu: PA(PI H ) PA(H ) P(H PI).95 P (PI H ) P (H ) + P (PI H ) [ P (H )] A A A Das installierte Programm erhöht also die Schuldwahrscheinlichkeit von ca. 36.7% auf rund 9.5%, und das, obwohl ein Test auf Basis des installierten Programms allein wegen 6% > 5% die Unschuldshypothese zum Niveau 5% nicht ablehnen würde. A 28

29 H gilt H gilt Richtige und falsche Testentscheidungen Testentscheidung für H : keine 2 gewürfelt Testentscheidung für H : 2 gewürfelt Richtige Testentscheidung (. Art) Fehler. Art (α-fehler) Fehler 2. Art(β-Fehler) Richtige Testentscheidung(2. Art) Über die Wahrscheinlichkeit für den Fehler 2. Art sagt die allgemeine Definition des Niveau-α- Tests nichts aus. Je nach konkretem Test können aber möglicherweise Aussagen über P(φ(X) θ T ) für Teilmengen T T gemacht werden. Daraus folgt, dass nach der allgemeinen Definition eines Niveau-α-Tests die Testentscheidung weder von H noch von H abhängen muss! Damit ist der Test, der H ablehnt, wenn mit einem fairen 2-seitigen Würfel eine 2 gewürfelt wird, ein exakter Niveau-.5-Test für jede beliebige Nullhypothese, z.b. auch für H : Morgen wird es regnen! Für die Beurteilung von Qualität und Sinn eines konkreten Tests sind also i.a. Betrachtungen der Fehlerwahrscheinlichkeiten nötig, wie sie bspw. in den letzten Beispielen bei der Konstruktion von A-Posteriori-Wahrscheinlichkeiten der Hypothesen vorgenommen wurden. 29

30 Mehrere Tests an einem Datensatz Falls k Tests φ,, φ k auf die Nullhypothesen H ;,,H ;k durchgeführt werden und der Test φ auf die globale Nullhypothese H : H ;,,H ;k gelten gegen H : Für mindestens ein i gilt H ;i nicht zum globalen Testniveau αdurchgeführt werden soll, so müssen die Niveaus der k Einzeltests entsprechend angepasst werden, sofern die Ablehnung der globalen Nullhypothese erfolgt, sobald einer der Einzeltests seine Nullhypothese verwirft. Eine konservative Möglichkeit dies zu tun, liegt in der Verwendung des Niveaus α k α/k für jeden der k Einzeltests, da nach der Poincaré-Sylvesterformel gilt: P([φ ]... [ φk ] H;... H;k) P(φ H;) P(φk H α P(φ H ) k α k ; k ) 3

31 Beispiel: Hackerangriffsserie Falls die Hackerangriffe doch nicht alle von der selben Person stammen müssen, kann für jeden Angriff ein einzelner Test durchgeführt werden. Wie weiter oben gezeigt wurde, lauten die Wahrscheinlichkeiten, dass A während der einzelnen Angriffzeitpunkte bei gegebener Unschuld online war: P( X e < 5 < X a ).77 P( X e < 8 < X a ).4 P( X e < 9 < X a ).24 Zum Niveau 5 % würde also die Unschuldshypothese für den 2. und 3. Angriff abgelehnt. Da allerdings drei Einzeltests durchgeführt werden, müssen diese zum Niveau.5/3.7% durchgeführt werden, um einen globalen Test zum Niveau 5% auf die Hypothese A war an keinem der drei Angriffe beteiligt zu erhalten. Da alle P-Werte größer als.7% sind, kann diese Hypothese nicht abgelehnt werden. 3

32 Tests für H : μμ gegen H :μ μ bei Normalverteilung Herleitung des Tests Beispielhafter Test bei der allgemeinen Einführung des statistischen Testbegriffs ist Test (so genannter Gauß-Test) auf obige Hypothese, falls die Standardabweichung σ(im Beispiel σ ) bekannt ist. Da σ aber i.d.r. unbekannt ist, wird es durch die Schätzung ersetzt. s(x) N N n (Xn X) 2 Falls H : μ μ gilt, so kann die Verteilung der Teststatistik T(X) des so genannten zweiseitigen Einstichproben-t-Tests mit T(X) N X μ s(x) bestimmt werden, da in diesem Fall X μ N s(x) ~ tn gilt. 32

33 Tests für H : μμ gegen H :μ μ bei Normalverteilung Herleitung des Tests Falls H : μ μ gilt, so kann die Verteilung der Teststatistik T(X) des so genannten zweiseitigen Einstichproben-t-Tests mit T(X) N X μ s(x) X μ bestimmt werden, da in diesem Fall N s(x) ~ tn Entsprechend kann aus dieser Verteilung der P-Wert P[T(X)>T(x) H ] für den realisierten Datensatz x ermittelt werden: gilt. P X μ N T(x) s(x) H X μ x μ P N N H s(x) s(x) 33

34 Tests für H : μμ gegen H :μ μ bei Normalverteilung Herleitung des Tests Falls H : μ μ gilt, so kann die Verteilung der Teststatistik T(X) des so genannten zweiseitigen Einstichproben-t-Tests mit T(X) N X μ s(x) X μ bestimmt werden, da in diesem Fall N s(x) ~ tn Entsprechend kann aus dieser Verteilung der P-Wert P[T(X)>T(x) H ] für den realisierten Datensatz x ermittelt werden: T(x) gilt. P X μ N T(x) s(x) H tn x μ N s(x) F f tn- (u) u 34

35 Tests für H : μμ gegen H :μ μ bei Normalverteilung Herleitung des Tests Falls H : μ μ gilt, so kann die Verteilung der Teststatistik T(X) des so genannten zweiseitigen Einstichproben-t-Tests mit T(X) N X μ s(x) X μ bestimmt werden, da in diesem Fall N s(x) ~ tn Entsprechend kann aus dieser Verteilung der P-Wert P[T(X)>T(x) H ] für den realisierten Datensatz x ermittelt werden: T(x) T(x) gilt. P X μ N T(x) s(x) H x μ N s(x) F tn X μ P N T(x) H s(x) Symmetrieder t-verteilung f tn- (u) u 35

36 Tests für H : μμ gegen H :μ μ bei Normalverteilung Herleitung des Tests Falls H : μ μ gilt, so kann die Verteilung der Teststatistik T(X) des so genannten zweiseitigen Einstichproben-t-Tests mit T(X) N X μ s(x) P X μ bestimmt werden, da in diesem Fall N s(x) ~ tn Entsprechend kann aus dieser Verteilung der P-Wert P[T(X)>T(x) H ]für den realisierten Datensatz x ermittelt werden: T(x) [ T(X) ] T(x) H gilt. X μ X μ P N T(x) H + P N T(x) H s(x) s(x) 2 f tn- (u) 2 F t N x μ N s(x) 2 F t N ( T(x) ) u 36

37 Tests für H : μμ gegen H :μ μ bei Normalverteilung Beispiel: Besucher auf Internetseite pro Tag Der Besucherzähler einer Internetseite hat in den letzten Tagen die folgenden Besucherzahlen verzeichnet: 92, 55, 8493, 5786, 989, 8539, 2462, 325, 2727, 84 Überprüft werden soll die Hypothese zum Niveau 5 %, dass der Erwartungswert μder Besucherzahlen beträgt. Dabei wird von normalverteilten Besucherzahlen ausgegangen.. Testentscheidung anhand des kritischen Werts P(T(X) cα H) α X μ X μ P N cα H + P N cα H s(x) s(x) X μ X μ P N cα H P N cα H s(x) s(x) X μ P N cα H α/2 s(x) cα Qt N ; α/2 α α/2 x 397 μ 37

38 Tests für H : μμ gegen H :μ μ bei Normalverteilung Beispiel: Besucher auf Internetseite pro Tag Der Besucherzähler einer Internetseite hat in den letzten Tagen die folgenden Besucherzahlen verzeichnet: 92, 55, 8493, 5786, 989, 8539, 2462, 325, 2727, 84 Überprüft werden soll die Hypothese zum Niveau 5 %, dass der Erwartungswert μder Besucherzahlen beträgt. Dabei wird von normalverteilten Besucherzahlen ausgegangen.. Testentscheidung anhand des kritischen Werts c Qt ; α/2 Qt ;.975 α N x μ 397 T(x) N.886 < 2.26 s(x) 2342 Der Mittelwert von 397 weicht zum Niveau 5% nicht signifikant von μ ab, d.h. die Nullhypothese kann nicht verworfen werden. x 397 μ 38

39 Tests für H : μμ gegen H :μ μ bei Normalverteilung Beispiel: Besucher auf Internetseite pro Tag Der Besucherzähler einer Internetseite hat in den letzten Tagen die folgenden Besucherzahlen verzeichnet: 92, 55, 8493, 5786, 989, 8539, 2462, 325, 2727, 84 Überprüft werden soll die Hypothese zum Niveau 5 %, dass der Erwartungswert μder Besucherzahlen beträgt. Dabei wird von normalverteilten Besucherzahlen ausgegangen. 2. Testentscheidung anhand des P-Werts P T(X) x μ N s(x) > H 397 P T(X) > H P > Ft 9 (.886).92 ( T(X).886 H ) x 397 μ 39

40 Tests für H : μμ gegen H :μ μ bei Normalverteilung Beispiel: Besucher auf Internetseite pro Tag Der Besucherzähler einer Internetseite hat in den letzten Tagen die folgenden Besucherzahlen verzeichnet: 92, 55, 8493, 5786, 989, 8539, 2462, 325, 2727, 84 Überprüft werden soll die Hypothese zum Niveau 5 %, dass der Erwartungswert μder Besucherzahlen beträgt. Dabei wird von normalverteilten Besucherzahlen ausgegangen. 2. Testentscheidung anhand des P-Werts x μ P T(X) > N H.92 >.5 s(x) Der Mittelwert von 397 weicht zum Niveau 5% nicht signifikant von μ ab, d.h. die Nullhypothese kann nicht verworfen werden. x 397 μ 4

41 Tests für H : μμ gegen H :μ μ bei Normalverteilung Fehlerwahrscheinlichkeiten 2. Art Unter H ist die Verteilung von T(X) offenbar vollständig spezifiziert, so dass der zweiseitige Einstichproben-t-Test ein exakter Niveau-α-Test ist. Für einen bestimmten Wert μ R\μ ist die Verteilung von T(X) bis auf σspezifiert, da gilt: 2 X μ μ μ X,...,XN ~N(μ,σ ) N ~tn (δ), δ N, s(x) σ wobei t N- (δ) nichtzentrale t-verteilungmit Nichtzentralitätsparameter δund N- Freiheitsgraden genannt wird. f t9 (x;3.32) μ μ σ2 α.5 N x 4

42 Tests für H : μμ gegen H :μ μ bei Normalverteilung Fehlerwahrscheinlichkeiten 2. Art Damit kann für bestimmte μ und σdie Wahrscheinlichkeit βfür den Fehler 2. Art bestimmt werden: 2 X μ μ μ X,...,XN ~N(μ,σ ) N ~tn (δ), δ N s(x) σ ( T(X) c μ ) P α μ X μ P N Q tn ; s(x) μ μ α/2 X μ P Qt ; α/2 N Q N tn ; s(x) μ μ α/2 f t9 (u;) P(T(X) c α μ).95 (Keine Fehlentscheidung) μ μ σ2 α.5 N u 42

43 Tests für H : μμ gegen H :μ μ bei Normalverteilung Fehlerwahrscheinlichkeiten 2. Art Damit kann für bestimmte μ und σdie Wahrscheinlichkeit βfür den Fehler 2. Art bestimmt werden: 2 X μ μ μ X,...,XN ~N(μ,σ ) N ~tn (δ), δ N s(x) σ ( T(X) c μ ) P α μ X μ P N Q tn ; s(x) μ μ α/2 X μ P Qt ; α/2 N Q N tn ; s(x) μ μ α/2 f t9 (u;.33) P(T(X) c α μ.2).94 μ.2 μ σ2 α.5 N u 43

44 Tests für H : μμ gegen H :μ μ bei Normalverteilung Fehlerwahrscheinlichkeiten 2. Art Damit kann für bestimmte μ und σdie Wahrscheinlichkeit βfür den Fehler 2. Art bestimmt werden: 2 X μ μ μ X,...,XN ~N(μ,σ ) N ~tn (δ), δ N s(x) σ ( T(X) c μ ) P α μ X μ P N Q tn ; s(x) μ μ α/2 X μ P Qt ; α/2 N Q N tn ; s(x) μ μ α/2 f t9 (u;.66) P(T(X) c α μ).68 μ μ σ2 α.5 N u 44

45 Tests für H : μμ gegen H :μ μ bei Normalverteilung Fehlerwahrscheinlichkeiten 2. Art Damit kann für bestimmte μ und σdie Wahrscheinlichkeit βfür den Fehler 2. Art bestimmt werden: 2 X μ μ μ X,...,XN ~N(μ,σ ) N ~tn (δ), δ N s(x) σ ( T(X) c μ ) P α μ X μ P N Q tn ; s(x) μ μ α/2 X μ P Qt ; α/2 N Q N tn ; s(x) μ μ α/2 f t9 (u;4.5) P(T(X) c α μ2.5).4 μ 2.5 μ σ2 α.5 N u 45

46 Tests für H : μμ gegen H :μ μ bei Normalverteilung Fehlerwahrscheinlichkeiten 2. Art Damit kann für bestimmte μ und σdie Wahrscheinlichkeit βfür den Fehler 2. Art bestimmt werden: ( T(X) c μ ) P 2 X μ μ μ X,...,XN ~N(μ,σ ) N ~tn (δ), δ N s(x) σ α μ X μ P N Q tn ; s(x) μ μ α/2 X μ P Qt ; α/2 N Q N tn ; s(x) F (Qt ; α/2) F ( Qt ; α/2) t ( N(μ μ )/σ) N t ( N(μ μ )/σ) N N N μ μ α/2 F t9(.33) (z) μ.2 μ σ2 α.5 N X μ N s(x) z 46

47 Tests für H : μμ gegen H :μ μ bei Normalverteilung Fehlerwahrscheinlichkeiten 2. Art ( T(X) c μ ) P (Q ) F ( Q ) α μ Ft ( N(μ μ )/σ) tn ; α/2 t ( N(μ μ )/σ) tn ; α/2 N Die Funktion γ(μ ) P T(X) cα μ μ P T(X) > cα μ μ die die Wahrscheinlichkeit beschreibt, H : μμ abzulehnen, wenn μμ gilt, wird Gütefunktion des zweiseitigen Einstichproben-t-Tests genannt. N ( ) ( ), α,μ μ Es gilt: γ(μ) μ > α,μ μ σ2 α.5 N γ(μ ) μ 47

48 Tests für H : μμ gegen H :μ μ bei Normalverteilung Fehlerwahrscheinlichkeiten 2. Art ( T(X) c μ μ ) γ(μ ) P α Die Güte ist für festes μ F μ umso kleiner, je größer σund umso größer, je größer N. σ N5 γ().4 σ2 N5 γ().4 σ2.5 N5 γ(). μ F μ α.5 σ N γ().8 σ2 N γ().29 σ2.5 N γ().2 σ N5 γ().95 σ2 N5 γ().44 σ2.5 N5 γ().3 48

49 Tests für H : μμ gegen H :μ μ bei Normalverteilung Fehlerwahrscheinlichkeiten 2. Art ( T(X) c μ μ ) γ(μ ) P α Die Güte ist für festes μ F μ umso kleiner, je größer σund umso größer, je größer N. σ μ F μ α.5 γ() N 49

50 Tests für H : μμ gegen H :μ μ bei Normalverteilung Gütefunktion zum Vergleich mehrerer Tests für dieselbe Hypothese Sei σ bekannt Gaußtest Lehne H ab, wenn T(X) X μ > N(μ,N ); α/2 γ G(μ) F (Q ) N(μ μ,n ) N(μ,N ); α/2 F ( Q ) N(μ μ,n ) N(μ,N ); α/2 (Konservativer) Test nach Tschebyscheff-Ungleichung Q P var(x) ( X μ > ε) 2 2 ε var(x) N N ε Lehne H ab, wenn T(X) X μ > N α 5

51 Tests für H : μμ gegen H :μ μ bei Normalverteilung Gütefunktion zum Vergleich mehrerer Tests für dieselbe Hypothese Sei σ bekannt Gaußtest Lehne H N(μ,N ); α/2 γ G(μ) F (Q ) N(μ μ,n ) N(μ,N ); α/2 ab, wenn T(X) X μ F ( Q ) N(μ μ,n ) N(μ,N ); α/2 > Q μ N α.5 (Konservativer) Test nach Tschebyscheff-Ungleichung Lehne H ab, wenn T(X) X μ > N α γ T(μ) F N(μ μ,n ) N α F N(μ μ,n ) N α 5

9. Schätzen und Testen bei unbekannter Varianz

9. Schätzen und Testen bei unbekannter Varianz 9. Schätzen und Testen bei unbekannter Varianz Dr. Antje Kiesel Institut für Angewandte Mathematik WS 2011/2012 Schätzen und Testen bei unbekannter Varianz Wenn wir die Standardabweichung σ nicht kennen,

Mehr

9. StatistischeTests. 9.1 Konzeption

9. StatistischeTests. 9.1 Konzeption 9. StatistischeTests 9.1 Konzeption Statistische Tests dienen zur Überprüfung von Hypothesen über einen Parameter der Grundgesamtheit (bei einem Ein-Stichproben-Test) oder über die Verteilung einer Zufallsvariablen

Mehr

Bachelorabschlussseminar Dipl.-Kfm. Daniel Cracau

Bachelorabschlussseminar Dipl.-Kfm. Daniel Cracau 1 Einführung in die statistische Datenanalyse Bachelorabschlussseminar Dipl.-Kfm. Daniel Cracau 2 Gliederung 1.Grundlagen 2.Nicht-parametrische Tests a. Mann-Whitney-Wilcoxon-U Test b. Wilcoxon-Signed-Rank

Mehr

Verteilungsanalyse. Johannes Hain. Lehrstuhl für Mathematik VIII Statistik 1/31

Verteilungsanalyse. Johannes Hain. Lehrstuhl für Mathematik VIII Statistik 1/31 Verteilungsanalyse Johannes Hain Lehrstuhl für Mathematik VIII Statistik 1/31 Datentypen Als Sammeln von Daten bezeichnet man in der Statistik das Aufzeichnen von Fakten. Erhobene Daten klassifziert man

Mehr

12. Vergleich mehrerer Stichproben

12. Vergleich mehrerer Stichproben 12. Vergleich mehrerer Stichproben Dr. Antje Kiesel Institut für Angewandte Mathematik WS 2011/2012 Häufig wollen wir verschiedene Populationen, Verfahren, usw. miteinander vergleichen. Beipiel: Vergleich

Mehr

Verteilungsanalyse. Johannes Hain. Lehrstuhl für Mathematik VIII Statistik 1/35

Verteilungsanalyse. Johannes Hain. Lehrstuhl für Mathematik VIII Statistik 1/35 Verteilungsanalyse Johannes Hain Lehrstuhl für Mathematik VIII Statistik 1/35 Datentypen Als Sammeln von Daten bezeichnet man in der Statistik das Aufzeichnen von Fakten. Erhobene Daten klassifziert man

Mehr

5 Statistische Testverfahren

5 Statistische Testverfahren 70 5 Statistische Testverfahren 5.1 Grundlegende Definitionen und Binomialtest Beispiel 5.1.1: (Fortsetzung von Beispiel 4.2.15) Wir nehmen an, dass das Medikament als wenig bedenklich eingestuft werden

Mehr

Übungsaufgaben zu Kapitel 5. Aufgabe 101. Inhaltsverzeichnis:

Übungsaufgaben zu Kapitel 5. Aufgabe 101. Inhaltsverzeichnis: Inhaltsverzeichnis: Übungsaufgaben zu Kapitel 5... 1 Aufgabe 101... 1 Aufgabe 102... 2 Aufgabe 103... 2 Aufgabe 104... 2 Aufgabe 105... 3 Aufgabe 106... 3 Aufgabe 107... 3 Aufgabe 108... 4 Aufgabe 109...

Mehr

Beispiel: Sonntagsfrage. Einführung in die induktive Statistik. Statistische Tests. Statistische Tests

Beispiel: Sonntagsfrage. Einführung in die induktive Statistik. Statistische Tests. Statistische Tests Beispiel: Sonntagsfrage Vier Wochen vor der österreichischen Nationalratswahl 1999 wurde 499 Haushalten die Sonntagsfrage gestellt: Falls nächsten Sonntag Wahlen wären, welche Partei würden Sie wählen?

Mehr

$ % + 0 sonst. " p für X =1 $

$ % + 0 sonst.  p für X =1 $ 31 617 Spezielle Verteilungen 6171 Bernoulli Verteilung Wir beschreiben zunächst drei diskrete Verteilungen und beginnen mit einem Zufallsexperiment, indem wir uns für das Eintreffen eines bestimmten Ereignisses

Mehr

Biostatistik, Winter 2011/12

Biostatistik, Winter 2011/12 Biostatistik, Winter 2011/12 Vergleich zweier Stichproben, nichtparametrische Tests Prof. Dr. Achim Klenke http://www.aklenke.de 11. Vorlesung: 27.01.2012 1/86 Inhalt 1 Tests t-test 2 Vergleich zweier

Mehr

Füllmenge. Füllmenge. Füllmenge. Füllmenge. Mean = 500,0029 Std. Dev. = 3,96016 N = 10.000. 485,00 490,00 495,00 500,00 505,00 510,00 515,00 Füllmenge

Füllmenge. Füllmenge. Füllmenge. Füllmenge. Mean = 500,0029 Std. Dev. = 3,96016 N = 10.000. 485,00 490,00 495,00 500,00 505,00 510,00 515,00 Füllmenge 2.4 Stetige Zufallsvariable Beispiel. Abfüllung von 500 Gramm Packungen einer bestimmten Ware auf einer automatischen Abfüllanlage. Die Zufallsvariable X beschreibe die Füllmenge einer zufällig ausgewählten

Mehr

Medizinische Statistik Epidemiologie und χ 2 Vierfeldertest

Medizinische Statistik Epidemiologie und χ 2 Vierfeldertest Universität Wien Institut für Mathematik Wintersemester 2009/2010 Medizinische Statistik Epidemiologie und χ 2 Vierfeldertest Seminar Angewandte Mathematik Ao. Univ. Prof. Dr. Peter Schmitt von Nadja Reiterer

Mehr

Statistik im Bachelor-Studium der BWL und VWL

Statistik im Bachelor-Studium der BWL und VWL Max C. Wewel Statistik im Bachelor-Studium der BWL und VWL Methoden, Anwendung, Interpretation Mit herausnehmbarer Formelsammlung ein Imprint von Pearson Education München Boston San Francisco Harlow,

Mehr

Grundlagen der Inferenzstatistik: Was Ihnen nicht erspart bleibt!

Grundlagen der Inferenzstatistik: Was Ihnen nicht erspart bleibt! Grundlagen der Inferenzstatistik: Was Ihnen nicht erspart bleibt! 1 Einführung 2 Wahrscheinlichkeiten kurz gefasst 3 Zufallsvariablen und Verteilungen 4 Theoretische Verteilungen (Wahrscheinlichkeitsfunktion)

Mehr

Varianzanalyse ANOVA

Varianzanalyse ANOVA Varianzanalyse ANOVA Johannes Hain Lehrstuhl für Mathematik VIII Statistik 1/23 Einfaktorielle Varianzanalyse (ANOVA) Bisher war man lediglich in der Lage, mit dem t-test einen Mittelwertsvergleich für

Mehr

Kapitel 3. Zufallsvariable. Wahrscheinlichkeitsfunktion, Dichte und Verteilungsfunktion. Erwartungswert, Varianz und Standardabweichung

Kapitel 3. Zufallsvariable. Wahrscheinlichkeitsfunktion, Dichte und Verteilungsfunktion. Erwartungswert, Varianz und Standardabweichung Kapitel 3 Zufallsvariable Josef Leydold c 2006 Mathematische Methoden III Zufallsvariable 1 / 43 Lernziele Diskrete und stetige Zufallsvariable Wahrscheinlichkeitsfunktion, Dichte und Verteilungsfunktion

Mehr

14.01.14 DAS THEMA: INFERENZSTATISTIK II. Standardfehler Konfidenzintervalle Signifikanztests. Standardfehler

14.01.14 DAS THEMA: INFERENZSTATISTIK II. Standardfehler Konfidenzintervalle Signifikanztests. Standardfehler DAS THEMA: INFERENZSTATISTIK II INFERENZSTATISTISCHE AUSSAGEN Standardfehler Konfidenzintervalle Signifikanztests Standardfehler der Standardfehler Interpretation Verwendung 1 ZUR WIEDERHOLUNG... Ausgangspunkt:

Mehr

8. Methoden der klassischen multivariaten Statistik

8. Methoden der klassischen multivariaten Statistik 8. Methoden der klassischen multivariaten Statistik 8.1. Darstellung von Daten Voraussetzungen auch in diesem Kapitel: Grundgesamtheit (Datenraum) Ω von Objekten (Fällen, Instanzen), denen J-Tupel von

Mehr

25. Januar 2010. Ruhr-Universität Bochum. Methodenlehre III, WS 2009/2010. Prof. Dr. Holger Dette. 4. Multivariate Mittelwertvergleiche

25. Januar 2010. Ruhr-Universität Bochum. Methodenlehre III, WS 2009/2010. Prof. Dr. Holger Dette. 4. Multivariate Mittelwertvergleiche Ruhr-Universität Bochum 25. Januar 2010 1 / 75 2 / 75 4.1 Beispiel: Vergleich von verschiedenen Unterrichtsmethoden Zwei Zufallsstichproben (A und B) mit je 10 Schülern und 8 Schülern Gruppe A wird nach

Mehr

Mini-Skript Wahrscheinlichkeitstheorie und Statistik

Mini-Skript Wahrscheinlichkeitstheorie und Statistik Mini-Skript Wahrscheinlichkeitstheorie und Statistik Peter Bühlmann Georg Grafendorfer, Lukas Meier Inhaltsverzeichnis 1 Der Begriff der Wahrscheinlichkeit 1 1.1 Rechenregeln für Wahrscheinlichkeiten........................

Mehr

Statistik Musterlösungen

Statistik Musterlösungen Statistik Musterlösungen Regina Tüchler & Achim Zeileis Institut für Statistik & Mathematik Wirtschaftsuniversität Wien 1 Grundbegriffe (1.23) Skript Reaktionen auf Videofilm. Aussagen M, E, P, S h(m)

Mehr

2. Korrelation, lineare Regression und multiple Regression

2. Korrelation, lineare Regression und multiple Regression multiple 2.2 Lineare 2.2 Lineare 1 / 130 2.2 Lineare 2 / 130 2.1 Beispiel: Arbeitsmotivation Untersuchung zur Motivation am Arbeitsplatz in einem Chemie-Konzern 25 Personen werden durch Arbeitsplatz zufällig

Mehr

Multivariate Statistik

Multivariate Statistik Hermann Singer Multivariate Statistik 1 Auflage 15 Oktober 2012 Seite: 12 KAPITEL 1 FALLSTUDIEN Abbildung 12: Logistische Regression: Geschätzte Wahrscheinlichkeit für schlechte und gute Kredite (rot/blau)

Mehr

Universität Bonn 28. Juli 2010 Fachbereich Rechts- und Wirtschaftswissenschaften Statistische Abteilung Prof. Dr. A. Kneip. KLAUSUR Statistik B

Universität Bonn 28. Juli 2010 Fachbereich Rechts- und Wirtschaftswissenschaften Statistische Abteilung Prof. Dr. A. Kneip. KLAUSUR Statistik B Universität Bonn 28. Juli 2010 Fachbereich Rechts- und Wirtschaftswissenschaften Statistische Abteilung Prof. Dr. A. Kneip Sommersemester 2010 KLAUSUR Statistik B Hinweise zur Bearbeitung: Bei allen Teilaufgaben

Mehr

Tutorial: Homogenitätstest

Tutorial: Homogenitätstest Tutorial: Homogenitätstest Eine Bank möchte die Kreditwürdigkeit potenzieller Kreditnehmer abschätzen. Einerseits lebt die Bank ja von der Vergabe von Krediten, andererseits verursachen Problemkredite

Mehr

Welch-Test. Welch-Test

Welch-Test. Welch-Test Welch-Test Welch-Test Test auf Lageunterschied zweier normalverteilter Grundgesamtheiten mit unbekannten Varianzen durch Vergleich der Mittelwerte zweier unabhängiger Zufallsstichproben. Beispiel Im Labor

Mehr

Sozialwissenschaftliche Methoden und Statistik I

Sozialwissenschaftliche Methoden und Statistik I Sozialwissenschaftliche Methoden und Statistik I Universität Duisburg Essen Standort Duisburg Integrierter Diplomstudiengang Sozialwissenschaften Skript zum SMS I Tutorium Von Mark Lutter Stand: April

Mehr

Mathematik IV: Statistik. für D-UWIS, D-ERDW, D-USYS und D-HEST SS14

Mathematik IV: Statistik. für D-UWIS, D-ERDW, D-USYS und D-HEST SS14 Mathematik IV: Statistik für D-UWIS, D-ERDW, D-USYS und D-HEST SS14 Hygienische Reiniger Wissenschaftliche Studie: 10 000 Reinigungsversuche, 6 Fälle mit mehr als 1 Bakterien Stimmt s jetzt oder was? Binomialtest:

Mehr

Stochastik Abitur 2009 Stochastik

Stochastik Abitur 2009 Stochastik Abitur 2009 Stochastik Beilage ea (erhöhtes Anforderungsniveau) ga (grundlegendes Anforderungsniveau) ISBN 978-3-8120-0108-3 und ISBN 978-3-8120-0223-3 1 Aufgabe 2 (ea) Rauchen ist das größte vermeidbare

Mehr

Wahrscheinlichkeitstheoretische Grundlagen für False Discovery Rate-kontrollierende multiple Testprozeduren

Wahrscheinlichkeitstheoretische Grundlagen für False Discovery Rate-kontrollierende multiple Testprozeduren Wahrscheinlichkeitstheoretische Grundlagen für False Discovery Rate-kontrollierende multiple Testprozeduren Thorsten Dickhaus Universität des Saarlandes, 06. Juli 2009 Übersicht Einführung: Multiples Testen

Mehr

6. METRISCHE UND KATEGORIALE MERKMALE

6. METRISCHE UND KATEGORIALE MERKMALE 6. METRISCHE UND KATEGORIALE MERKMALE wenn an einer Beobachtungseinheit eine (oder mehrere) metrische und eine (oder mehrere) kategoriale Variable(n) erhoben wurden Beispiel: Haushaltsarbeit von Teenagern

Mehr

STATISTIK 1 - BEGLEITVERANSTALTUNG

STATISTIK 1 - BEGLEITVERANSTALTUNG STATISTIK 1 - BEGLEITVERANSTALTUNG VORLESUNG 4 ALPHA / BETA-FEHLER 12.12.2014 1 12.12.2014 1 Mona Ulrich, Psychologie (M.Sc.) AGENDA 01 STATISTISCHE HYPOTHESEN 02 POPULATION / STICHPROBE 03 ALPHA/ BETA-FEHLER

Mehr

Prüfen von Mittelwertsunterschieden: t-test

Prüfen von Mittelwertsunterschieden: t-test Prüfen von Mittelwertsunterschieden: t-test Sven Garbade Fakultät für Angewandte Psychologie SRH Hochschule Heidelberg sven.garbade@hochschule-heidelberg.de Statistik 1 S. Garbade (SRH Heidelberg) t-test

Mehr

90-minütige Klausur Statistik für Studierende der Kommunikationswissenschaft

90-minütige Klausur Statistik für Studierende der Kommunikationswissenschaft Prof. Dr. Helmut Küchenhoff SS08 90-minütige Klausur Statistik für Studierende der Kommunikationswissenschaft am 22.7.2008 Anmerkungen Überprüfen Sie bitte sofort, ob Ihre Angabe vollständig ist. Sie sollte

Mehr

1. Biometrische Planung

1. Biometrische Planung 1. Biometrische Planung Die biometrische Planung ist Teil der Studienplanung für wissenschaftliche Studien, in denen eine statistische Bewertung von Daten erfolgen soll. Sie stellt alle erforderlichen

Mehr

Beispiel 48. 4.3.2 Zusammengesetzte Zufallsvariablen

Beispiel 48. 4.3.2 Zusammengesetzte Zufallsvariablen 4.3.2 Zusammengesetzte Zufallsvariablen Beispiel 48 Ein Würfel werde zweimal geworfen. X bzw. Y bezeichne die Augenzahl im ersten bzw. zweiten Wurf. Sei Z := X + Y die Summe der gewürfelten Augenzahlen.

Mehr

Box-and-Whisker Plot -0,2 0,8 1,8 2,8 3,8 4,8

Box-and-Whisker Plot -0,2 0,8 1,8 2,8 3,8 4,8 . Aufgabe: Für zwei verschiedene Aktien wurde der relative Kurszuwachs (in % beobachtet. Aus den jeweils 20 Quartaldaten ergaben sich die folgenden Box-Plots. Box-and-Whisker Plot Aktie Aktie 2-0,2 0,8,8

Mehr

Bei vielen Zufallsexperimenten interessiert man sich lediglich für das Eintreten bzw. das Nichteintreten eines bestimmten Ereignisses.

Bei vielen Zufallsexperimenten interessiert man sich lediglich für das Eintreten bzw. das Nichteintreten eines bestimmten Ereignisses. XI. Binomialverteilung ================================================================== 11.1 Definitionen -----------------------------------------------------------------------------------------------------------------

Mehr

Kugel-Fächer-Modell. 1fach. 3fach. Für die Einzelkugel gibt es 3 Möglichkeiten. 6fach. 3! Möglichkeiten

Kugel-Fächer-Modell. 1fach. 3fach. Für die Einzelkugel gibt es 3 Möglichkeiten. 6fach. 3! Möglichkeiten Kugel-Fächer-Modell n Kugeln (Rosinen) sollen auf m Fächer (Brötchen) verteilt werden, zunächst 3 Kugeln auf 3 Fächer. 1fach 3fach Für die Einzelkugel gibt es 3 Möglichkeiten } 6fach 3! Möglichkeiten Es

Mehr

Grundlagen von Versuchsmethodik und Datenanalyse

Grundlagen von Versuchsmethodik und Datenanalyse Grundlagen von Versuchsmethodik und Datenanalyse Der Anfang: Hypothesen über Ursache-Wirkungs-Zusammenhänge Ursache Wirkung Koffein verbessert Kurzzeitgedächtnis Gewaltfilme führen zu aggressivem Verhalten

Mehr

Risiko und Versicherung - Übung

Risiko und Versicherung - Übung Sommer 2009 Risiko und Versicherung - Übung Entscheidungstheoretische Grundlagen Renate Bodenstaff Vera Brinkmann r.bodenstaff@uni-hohenheim.de vera.brinkmann@uni-hohenheim.de https://insurance.uni-hohenheim.de

Mehr

Auswertung mit dem Statistikprogramm SPSS: 30.11.05

Auswertung mit dem Statistikprogramm SPSS: 30.11.05 Auswertung mit dem Statistikprogramm SPSS: 30.11.05 Seite 1 Einführung SPSS Was ist eine Fragestellung? Beispiel Welche statistische Prozedur gehört zu welcher Hypothese? Statistische Berechnungen mit

Mehr

q = 1 p = 0.8 0.2 k 0.8 10 k k = 0, 1,..., 10 1 1 0.8 2 + 10 0.2 0.8 + 10 9 1 2 0.22 1 = 0.8 8 [0.64 + 1.6 + 1.8] = 0.678

q = 1 p = 0.8 0.2 k 0.8 10 k k = 0, 1,..., 10 1 1 0.8 2 + 10 0.2 0.8 + 10 9 1 2 0.22 1 = 0.8 8 [0.64 + 1.6 + 1.8] = 0.678 Lösungsvorschläge zu Blatt 8 X binomialverteilt mit p = 0. und n = 10: a PX = = 10 q = 1 p = 0.8 0. 0.8 10 = 0, 1,..., 10 PX = PX = 0 + PX = 1 + PX = 10 10 = 0. 0 0.8 10 + 0. 1 0.8 9 + 0 1 10 = 0.8 8 [

Mehr

Schätzer (vgl. Kapitel 1): Stichprobenmittel X N. Stichprobenmedian X N

Schätzer (vgl. Kapitel 1): Stichprobenmittel X N. Stichprobenmedian X N Prof. Dr. J. Franke Statistik II für Wirtschaftswissenschaftler 8.1 Schätzer für Lage- und Skalenparameter und Verteilungsmodellwahl Lageparameter (l(x + a) = l(x) + a): Erwartungswert EX Median von X

Mehr

29. Mai 2006. 5. Bei Unterschleif gilt die Klausur als nicht bestanden und es erfolgt eine Meldung an das Prüfungsamt.

29. Mai 2006. 5. Bei Unterschleif gilt die Klausur als nicht bestanden und es erfolgt eine Meldung an das Prüfungsamt. L. Fahrmeir, C. Belitz Department für Statistik Bitte für die Korrektur freilassen! Aufgabe 1 2 3 4 Punkte Klausur zur Vorlesung Statistik III für Studenten mit Wahlfach Statistik 29. Mai 2006 Hinweise:

Mehr

Inhaltsverzeichnis. Regressionsanalyse. http://mesosworld.ch - Stand vom: 20.1.2010 1

Inhaltsverzeichnis. Regressionsanalyse. http://mesosworld.ch - Stand vom: 20.1.2010 1 Inhaltsverzeichnis Regressionsanalyse... 2 Lernhinweise... 2 Einführung... 2 Theorie (1-8)... 2 1. Allgemeine Beziehungen... 3 2. 'Best Fit'... 3 3. 'Ordinary Least Squares'... 4 4. Formel der Regressionskoeffizienten...

Mehr

Monte Carlo Methoden in Kreditrisiko-Management

Monte Carlo Methoden in Kreditrisiko-Management Monte Carlo Methoden in Kreditrisiko-Management P Kreditportfolio bestehend aus m Krediten; Verlustfunktion L = n i=1 L i; Die Verluste L i sind unabhängig bedingt durch einen Vektor Z von ökonomischen

Mehr

6 Test von statistischen Hypothesen Empirische Wissenschaften arbeiten experimentell und stellen aufgrund von Beobachtungen Hypothesen und Theorien auf. Diese Hypothesen sind vereinfachte Modelle der Wirklichkeit.

Mehr

AUFGABEN AUS DEM ZENTRALABITUR

AUFGABEN AUS DEM ZENTRALABITUR -28- -29- AUFGABEN AUS DEM ZENTRALABITUR GK-Aufgabe / Zentralabitur Bayern 1984 In einer Urne befinden sich 2 blaue und 6 weiße Kugeln. Die Kugeln unterscheiden sich nur durch ihre Farbe. 1. Bei einem

Mehr

Softwaretechnik. Prof. Dr. Rainer Koschke. Fachbereich Mathematik und Informatik Arbeitsgruppe Softwaretechnik Universität Bremen

Softwaretechnik. Prof. Dr. Rainer Koschke. Fachbereich Mathematik und Informatik Arbeitsgruppe Softwaretechnik Universität Bremen Softwaretechnik Prof. Dr. Rainer Koschke Fachbereich Mathematik und Informatik Arbeitsgruppe Softwaretechnik Universität Bremen Wintersemester 2013/14 Überblick I Statistik bei kontrollierten Experimenten

Mehr

Aufgabe 2.1. Ergebnis, Ergebnismenge, Ereignis

Aufgabe 2.1. Ergebnis, Ergebnismenge, Ereignis Aufgabe 2. Ergebnis, Ergebnismenge, Ereignis Ergebnis und Ergebnismenge Vorgänge mit zufälligem Ergebnis, oft Zufallsexperiment genannt Bei der Beschreibung der Ergebnisse wird stets ein bestimmtes Merkmal

Mehr

Gibt es einen Geschmacksunterschied zwischen Coca Cola und Cola Zero?

Gibt es einen Geschmacksunterschied zwischen Coca Cola und Cola Zero? Gibt es einen Geschmacksunterschied zwischen Coca Cola und Cola Zero? Manche sagen: Ja, manche sagen: Nein Wie soll man das objektiv feststellen? Kann man Geschmack objektiv messen? - Geschmack ist subjektiv

Mehr

Stochastische Analyse von empirischen Zählvergleichen

Stochastische Analyse von empirischen Zählvergleichen Stochastische Analyse von empirischen Zählvergleichen Klaus Felsenstein Institut für Statistik und Wahrscheinlichkeitstheorie technische universität wien 1 Problemstellung Den Ausgangspunkt für Entscheidungen

Mehr

Statistische Methoden

Statistische Methoden Statistische Methoden Dr. C.J. Luchsinger 3 Grundlagen der Statistik Literatur Kapitel 3: Lindgren: Kapitel 7 3.1 Überblick Die Statistik ist ein ausuferndes Wissensgebiet. Man könnte problemlos 20 Semester

Mehr

P(A B) = P(A) + P(B) P(A B) P(A B) = P(A) + P(B) P(A B) Geometrisch lassen sich diese Sätze einfach nachvollziehen (siehe Grafik rechts!

P(A B) = P(A) + P(B) P(A B) P(A B) = P(A) + P(B) P(A B) Geometrisch lassen sich diese Sätze einfach nachvollziehen (siehe Grafik rechts! Frequentistische und Bayes'sche Statistik Karsten Kirchgessner In den Naturwissenschaften herrscht ein wahrer Glaubenskrieg, ob die frequentistische oder Bayes sche Statistik als Grundlage zur Auswertung

Mehr

Profil A 49,3 48,2 50,7 50,9 49,8 48,7 49,6 50,1 Profil B 51,8 49,6 53,2 51,1 51,1 53,4 50,7 50 51,5 51,7 48,8

Profil A 49,3 48,2 50,7 50,9 49,8 48,7 49,6 50,1 Profil B 51,8 49,6 53,2 51,1 51,1 53,4 50,7 50 51,5 51,7 48,8 1. Aufgabe: Eine Reifenfirma hat für Winterreifen unterschiedliche Profile entwickelt. Bei jeweils gleicher Geschwindigkeit und auch sonst gleichen Bedingungen wurden die Bremswirkungen gemessen. Die gemessenen

Mehr

Name:... Matrikel-Nr.:... 3 Aufgabe Handyklingeln in der Vorlesung (9 Punkte) Angenommen, ein Student führt ein Handy mit sich, das mit einer Wahrscheinlichkeit von p während einer Vorlesung zumindest

Mehr

Trainingsaufgaben zur Klausurvorbereitung in Statistik I und II Thema: Satz von Bayes

Trainingsaufgaben zur Klausurvorbereitung in Statistik I und II Thema: Satz von Bayes Trainingsaufgaben zur Klausurvorbereitung in Statistik I und II Thema: Satz von Bayes Aufgabe 1: Wetterbericht Im Mittel sagt der Wetterbericht für den kommenden Tag zu 60 % schönes und zu 40% schlechtes

Mehr

Stochastik Wahrscheinlichkeit

Stochastik Wahrscheinlichkeit Stochastik Wahrscheinlichkeit Dies ist ein Detail, das auf dem letzten 1 DM Schein abgebildet war. Es stellt die wichtigste Wahrscheinlichkeitsverteilung überhaut dar die Normalverteilung. Diese Verteilung

Mehr

Analog definiert man das Nichteintreten eines Ereignisses (Misserfolg) als:

Analog definiert man das Nichteintreten eines Ereignisses (Misserfolg) als: 9-9 Die befasst sich mit der Untersuchung, wie wahrscheinlich das Eintreten eines Falles aufgrund bestimmter Voraussetzungen stattfindet. Bis anhin haben wir immer logisch gefolgert: 'Wenn diese Voraussetzung

Mehr

Stichprobenauslegung. für stetige und binäre Datentypen

Stichprobenauslegung. für stetige und binäre Datentypen Stichprobenauslegung für stetige und binäre Datentypen Roadmap zu Stichproben Hypothese über das interessierende Merkmal aufstellen Stichprobe entnehmen Beobachtete Messwerte abbilden Schluss von der Beobachtung

Mehr

Data Mining und Statistik: Gemeinsamkeiten und Unterschiede

Data Mining und Statistik: Gemeinsamkeiten und Unterschiede Universität Ulm Seminararbeit zum Thema Data Mining und Statistik: Gemeinsamkeiten und Unterschiede vorgelegt von: Daniel Meschenmoser betreut von: Dr. Tomas Hrycej Dr. Matthias Grabert Ulm, im Februar

Mehr

Betriebswirtschaftliche Blätter Fachzeitschrift

Betriebswirtschaftliche Blätter Fachzeitschrift Erwartungswert Auf richtige Interpretation kommt s an von Dr. Christian R. Sievi Der Erwartungswert spielt im Glücksspiel, etwa an Einarmigen Banditen, eine große Rolle. Für Sparkassen ist er wichtig bei

Mehr

Stochastik kompakt. - worauf es ankommt... Zürich 2007 1

Stochastik kompakt. - worauf es ankommt... Zürich 2007 1 Stochastik kompakt - worauf es ankommt... Zürich 2007 1 Ziel: Am Ende der Unterrichtssequenzen über Stochastik sollen die Schüler/innen Aufgaben aus folgenden Themenbereichen lösen können: 1. Umgang mit

Mehr

Naive Bayes. 5. Dezember 2014. Naive Bayes 5. Dezember 2014 1 / 18

Naive Bayes. 5. Dezember 2014. Naive Bayes 5. Dezember 2014 1 / 18 Naive Bayes 5. Dezember 2014 Naive Bayes 5. Dezember 2014 1 / 18 Inhaltsverzeichnis 1 Thomas Bayes 2 Anwendungsgebiete 3 Der Satz von Bayes 4 Ausführliche Form 5 Beispiel 6 Naive Bayes Einführung 7 Naive

Mehr

Standardabweichungen vorliegt, wobei die tatsächliche Größe der Differenz keine Rolle spielt. Daher verwendet der Assistent für den Test auf

Standardabweichungen vorliegt, wobei die tatsächliche Größe der Differenz keine Rolle spielt. Daher verwendet der Assistent für den Test auf Dieses White Paper ist Teil einer Reihe von Veröffentlichungen, welche die Forschungsarbeiten der Minitab-Statistiker erläutern, in deren Rahmen die im Assistenten der Minitab 17 Statistical Software verwendeten

Mehr

werden können. Wenn der Benutzer zudem eine konkrete Differenz mit praktischen Konsequenzen angibt, berechnet der Assistent den Stichprobenumfang,

werden können. Wenn der Benutzer zudem eine konkrete Differenz mit praktischen Konsequenzen angibt, berechnet der Assistent den Stichprobenumfang, Dieses White Paper ist Teil einer Reihe von Veröffentlichungen, welche die Forschungsarbeiten der Minitab-Statistiker erläutern, in deren Rahmen die im Assistenten der Minitab 17 Statistical Software verwendeten

Mehr

1.5 Folgerungen aus dem Kolmogoroff- Axiomensystem P( ) = 0.

1.5 Folgerungen aus dem Kolmogoroff- Axiomensystem P( ) = 0. 1.5 Folgerungen aus dem Kolmogoroff- Axiomensystem Folg. 2 Sei (Ω, E, P) W.-raum. Seien A, B,A 1,...,A n Ereignisse. Es gelten die folgenden Aussagen: 1. P(A) = 1 P(A). 2. Für das unmögliche Ereignis gilt:

Mehr

Unsupervised Kernel Regression

Unsupervised Kernel Regression 9. Mai 26 Inhalt Nichtlineare Dimensionsreduktion mittels UKR (Unüberwachte KernRegression, 25) Anknüpfungspunkte Datamining I: PCA + Hauptkurven Benötigte Zutaten Klassische Kernregression Kerndichteschätzung

Mehr

Wir haben ermittelt, dass Tests 1, 2 und 7 am nützlichsten zum Auswerten der Stabilität der X-quer-Karte und der I-Karte sind:

Wir haben ermittelt, dass Tests 1, 2 und 7 am nützlichsten zum Auswerten der Stabilität der X-quer-Karte und der I-Karte sind: Dieses White Paper ist Teil einer Reihe von Veröffentlichungen, welche die Forschungsarbeiten der Minitab-Statistiker erläutern, in deren Rahmen die im Assistenten der Minitab 17 Statistical Software verwendeten

Mehr

Modul 2 im B.Sc.-Studiengang Psychologie

Modul 2 im B.Sc.-Studiengang Psychologie LOTSE Vorläufige Musterlösungen (Stand: 30. März) zur Klausur zum Modul 2 im B.Sc.-Studiengang Psychologie Termin: 8. März 2010, 14.00-18.00 Uhr Prüfer: apl. Prof. Dr. H.-J. Mittag (Block 1) Dr. H.-G.

Mehr

Diskriminanzanalyse Beispiel

Diskriminanzanalyse Beispiel Diskriminanzanalyse Ziel bei der Diskriminanzanalyse ist die Analyse von Gruppenunterschieden, d. h. der Untersuchung von zwei oder mehr Gruppen hinsichtlich einer Vielzahl von Variablen. Diese Methode

Mehr

geben. Die Wahrscheinlichkeit von 100% ist hier demnach nur der Gehen wir einmal davon aus, dass die von uns angenommenen

geben. Die Wahrscheinlichkeit von 100% ist hier demnach nur der Gehen wir einmal davon aus, dass die von uns angenommenen geben. Die Wahrscheinlichkeit von 100% ist hier demnach nur der Vollständigkeit halber aufgeführt. Gehen wir einmal davon aus, dass die von uns angenommenen 70% im Beispiel exakt berechnet sind. Was würde

Mehr

DATENBLATT IDEE ZIELE LÖSUNG VORTEILE VORAUSSETZUNGEN. www.nospamproxy.de

DATENBLATT IDEE ZIELE LÖSUNG VORTEILE VORAUSSETZUNGEN. www.nospamproxy.de www.nospamproxy.de Net at Work Netzwerksysteme GmbH Am Hoppenhof 32, D-33104 Paderborn Tel. +49 5251 304-600, Fax -650 info@netatwork.de www.netatwork.de DIE IDEE Der Anlass zu entwickeln, ist der gestiegene

Mehr

Grundlagen quantitativer Sozialforschung Interferenzstatistische Datenanalyse in MS Excel

Grundlagen quantitativer Sozialforschung Interferenzstatistische Datenanalyse in MS Excel Grundlagen quantitativer Sozialforschung Interferenzstatistische Datenanalyse in MS Excel 16.11.01 MP1 - Grundlagen quantitativer Sozialforschung - (4) Datenanalyse 1 Gliederung Datenanalyse (inferenzstatistisch)

Mehr

Kaufhaus-Aufgabe. aus Abiturprüfung Bayern LK (abgeändert)

Kaufhaus-Aufgabe. aus Abiturprüfung Bayern LK (abgeändert) Kaufhaus-Aufgabe aus Abiturprüfung Bayern LK (abgeändert) 5. a) Ein Kunde eines Kaufhauses benutzt mit einer Wahrscheinlichkeit von 75% die hauseigene Tiefgarage. Mit einer Wahrscheinlichkeit von 40% bleibt

Mehr

Stochastische Prozesse und Zeitreihenmodelle

Stochastische Prozesse und Zeitreihenmodelle Kapitel 12 Stochastische Prozesse und reihenmodelle [ Stochastische Prozesse und reihenmodelle ] Einleitung:.com-Blase an der NASDAQ Department of Statistics and Mathematics WU Wien c 2008 Statistik 12

Mehr

Multinomiale logistische Regression

Multinomiale logistische Regression Multinomiale logistische Regression Die multinomiale logistische Regression dient zur Schätzung von Gruppenzugehörigkeiten bzw. einer entsprechenden Wahrscheinlichkeit hierfür, wobei als abhänginge Variable

Mehr

Schleswig-Holsteinische Ergänzung der Musteraufgaben für den hilfsmittelfreien Teil der schriftlichen Abiturprüfung im Fach Mathematik ab 2015

Schleswig-Holsteinische Ergänzung der Musteraufgaben für den hilfsmittelfreien Teil der schriftlichen Abiturprüfung im Fach Mathematik ab 2015 ische Ergänzung der für den hilfsmittelfreien Teil der schriftlichen Abiturprüfung im Fach Mathematik ab 2015 Ministerium für ildung und Wissenschaft des Landes Juni 2013 1 für Aufgabenpool 1 Analysis

Mehr

Computerviren, Waldbrände und Seuchen - ein stochastisches Modell für die Reichweite einer Epidemie

Computerviren, Waldbrände und Seuchen - ein stochastisches Modell für die Reichweite einer Epidemie Computerviren, Waldbrände und Seuchen - ein stochastisches für die Reichweite einer Epidemie Universität Hildesheim Schüler-Universität der Universität Hildesheim, 21.06.2012 Warum Mathematik? Fragen zum

Mehr

P X =3 = 2 36 P X =5 = 4 P X =6 = 5 36 P X =8 = 5 36 P X =9 = 4 P X =10 = 3 36 P X =11 = 2 36 P X =12 = 1

P X =3 = 2 36 P X =5 = 4 P X =6 = 5 36 P X =8 = 5 36 P X =9 = 4 P X =10 = 3 36 P X =11 = 2 36 P X =12 = 1 Übungen zur Stochastik - Lösungen 1. Ein Glücksrad ist in 3 kongruente Segmente aufgeteilt. Jedes Segment wird mit genau einer Zahl beschriftet, zwei Segmente mit der Zahl 0 und ein Segment mit der Zahl

Mehr

Statistik II - Elementare Wahrscheinlichkeitsrechnung. Prof. Dr. Christine Müller Technische Universität Dortmund

Statistik II - Elementare Wahrscheinlichkeitsrechnung. Prof. Dr. Christine Müller Technische Universität Dortmund Statistik II - Elementare Wahrscheinlichkeitsrechnung Prof Dr Christine Müller Technische Universität Dortmund Sommersemester 2014 1 Literatur Henze, N (1997 Stochastik für Einsteiger Vieweg, Braunschweig

Mehr

6.1 Grundlagen der Wahrscheinlichkeitsrechnung 6.1.1 Definitionen und Beispiele Beispiel 1 Zufallsexperiment 1,2,3,4,5,6 Elementarereignis

6.1 Grundlagen der Wahrscheinlichkeitsrechnung 6.1.1 Definitionen und Beispiele Beispiel 1 Zufallsexperiment 1,2,3,4,5,6 Elementarereignis 1 6.1 Grundlagen der Wahrscheinlichkeitsrechnung 6.1.1 Definitionen und Beispiele Spiele aus dem Alltagsleben: Würfel, Münzen, Karten,... u.s.w. sind gut geeignet die Grundlagen der Wahrscheinlichkeitsrechnung

Mehr

Seminar Text- und Datamining Datamining-Grundlagen

Seminar Text- und Datamining Datamining-Grundlagen Seminar Text- und Datamining Datamining-Grundlagen Martin Hacker Richard Schaller Künstliche Intelligenz Department Informatik FAU Erlangen-Nürnberg 23.05.2013 Gliederung 1 Klassifikationsprobleme 2 Evaluation

Mehr

Analog zu Aufgabe 16.1 werden die Daten durch folgenden Befehl eingelesen: > kredit<-read.table("c:\\compaufg\\kredit.

Analog zu Aufgabe 16.1 werden die Daten durch folgenden Befehl eingelesen: > kredit<-read.table(c:\\compaufg\\kredit. Lösung 16.3 Analog zu Aufgabe 16.1 werden die Daten durch folgenden Befehl eingelesen: > kredit

Mehr

Evaluation. Caroline Sporleder. Computational Linguistics Universität des Saarlandes. Sommersemester 2011 26.05.2011

Evaluation. Caroline Sporleder. Computational Linguistics Universität des Saarlandes. Sommersemester 2011 26.05.2011 Evaluation Caroline Sporleder Computational Linguistics Universität des Saarlandes Sommersemester 2011 26.05.2011 Caroline Sporleder Evaluation (1) Datensets Caroline Sporleder Evaluation (2) Warum evaluieren?

Mehr

Einführung in die Stochastik

Einführung in die Stochastik Einführung in die Stochastik Josef G. Steinebach Köln, WS 2009/10 I Wahrscheinlichkeitsrechnung 1 Wahrscheinlichkeitsräume, Urnenmodelle Stochastik : Lehre von den Gesetzmäßigkeiten des Zufalls, Analyse

Mehr

Theorien für die Darstellung von Unsicherheit Ein Vergleich der Wahrscheinlichkeits-, Möglichkeits- und Dempster-Shafer Theorie

Theorien für die Darstellung von Unsicherheit Ein Vergleich der Wahrscheinlichkeits-, Möglichkeits- und Dempster-Shafer Theorie Theorien für die Darstellung von Unsicherheit Ein Vergleich der Wahrscheinlichkeits-, Möglichkeits- und Dempster-Shafer Theorie Johannes Leitner Inhalt I Modellierung von Unschärfe Unscharfe Mengen Unscharfe

Mehr

Risikoaggregation und allokation

Risikoaggregation und allokation 2. Weiterbildungstag der DGVFM Risikoaggregation und allokation Einführung in das Thema Prof. Dr. Claudia Cottin, FH Bielefeld Dr. Stefan Nörtemann, msg life Hannover, 21. Mai 2015 2. Weiterbildungstag

Mehr

6. Bayes-Klassifikation. (Schukat-Talamazzini 2002)

6. Bayes-Klassifikation. (Schukat-Talamazzini 2002) 6. Bayes-Klassifikation (Schukat-Talamazzini 2002) (Böhm 2003) (Klawonn 2004) Der Satz von Bayes: Beweis: Klassifikation mittels des Satzes von Bayes (Klawonn 2004) Allgemeine Definition: Davon zu unterscheiden

Mehr

Probeklausur (1) Biostatistische Verfahren

Probeklausur (1) Biostatistische Verfahren Ernst-Abbe-Hochschule Jena FB Grundlagenwissenschaften Probeklausur (1) Biostatistische Verfahren Tag der Prüfung Studiengang Name: Matrikel-Nr.: Bearbeitungszeit 90 min Hilfsmittel Formelsammlung, auch

Mehr

Gewinnchancen und Gewinnerwartung

Gewinnchancen und Gewinnerwartung Bachelorarbeit an der Ruhr-Universität Bochum Gewinnchancen und Gewinnerwartung Marius Alexander Wilker aus Marl Bochum, im April 008 Fakultät für Mathematik Prof. Dr. R. Verfürth Inhaltsverzeichnis I.

Mehr

Finanzmathematik. Absichern und Bewerten von Optionen. Arnold Janssen / Klaus Janßen

Finanzmathematik. Absichern und Bewerten von Optionen. Arnold Janssen / Klaus Janßen Finanzmathematik Absichern und Bewerten von Optionen Arnold Janssen / Klaus Janßen Universität Düsseldorf 27.09.2012 Rohstoffe, Devisen, Aktien, Kredite,... haben Preise, die im Laufe der Zeit zufällig

Mehr

2.Tutorium Generalisierte Regression

2.Tutorium Generalisierte Regression 2.Tutorium Generalisierte Regression - Binäre Regression - Moritz Berger: 04.11.2013 und 11.11.2013 Shuai Shao: 06.11.2013 und 13.11.2013 Institut für Statistik, LMU München 1 / 16 Gliederung 1 Erweiterte

Mehr

Die Verteilung dieser Werte y ist eine Normalverteilung. hängt nicht von u ab

Die Verteilung dieser Werte y ist eine Normalverteilung. hängt nicht von u ab Einfache lineare Regression als Beispiel für das ALM ALM : Allgemeines Lineares Modell Y : Kriterium U : Prädiktor Modell : Erwartungswert von Y ist lineare Funktion von U Genauer : Für festes u gilt für

Mehr

LM2. WAHRSCHEINLICHKEITSRECHNUNG/STATISTIK

LM2. WAHRSCHEINLICHKEITSRECHNUNG/STATISTIK LM2. WAHRSCHEINLICHKEITSRECHNUNG/STATISTIK III. In einer Region haben 60 % der Haushalte einen Internetanschluss. Das Diagramm veranschaulicht die Anteile der Zugangsgeschwindigkeiten unter den Haushalten

Mehr

Derivatebewertung im Binomialmodell

Derivatebewertung im Binomialmodell Derivatebewertung im Binomialmodell Roland Stamm 27. Juni 2013 Roland Stamm 1 / 24 Agenda 1 Einleitung 2 Binomialmodell mit einer Periode 3 Binomialmodell mit mehreren Perioden 4 Kritische Würdigung und

Mehr

Der Fröhlich-Faktor. Referent: Stefan Fröhlich

Der Fröhlich-Faktor. Referent: Stefan Fröhlich Der Fröhlich-Faktor Referent: Stefan Fröhlich Entstehung des Fröhlich-Faktor Wenn man sich mit der Entwicklung und dem Backtesting von Handelssystemen beschäftigt wird der Fröhlich-Faktor immer dann wichtig

Mehr

Schleswig-Holsteinische Ergänzung der Musteraufgaben für den hilfsmittelfreien Teil der schriftlichen Abiturprüfung im Fach Mathematik ab 2015

Schleswig-Holsteinische Ergänzung der Musteraufgaben für den hilfsmittelfreien Teil der schriftlichen Abiturprüfung im Fach Mathematik ab 2015 ische Ergänzung der für den hilfsmittelfreien Teil der schriftlichen Abiturprüfung im Fach Mathematik ab 2015 Ministerium für ildung und Wissenschaft des Landes Juni 2013 1 Inhaltsverzeichnis Vorbemerkungen

Mehr