Fragestellungen der Schließenden Statistik

Größe: px
Ab Seite anzeigen:

Download "Fragestellungen der Schließenden Statistik"

Transkript

1 Fragestellungen der Schließenden Statistik Bisher: Teil I: Beschreibende Statistik Zusammenfassung von an GesamtheitM N {e,,e N } erhobenem Datensatz x,,x N durch Häufigkeitsverteilung und Kennzahlen für Lage, Streuung und Zusammenhang Teil II: Wahrscheinlichkeitstheorie Jetzt: Auffassung von Datensatz x,,x N als Realisationsreihe von i.i.d. Zufallsvariablen X,,X N, Beschreibung der Wahrscheinlichkeitsverteilungdieser Zufallsvariablen und Charakterisierung der Verteilung durch Lage, Streuung und Zusammenhang Teil III: Schließende Statistik Rückschlüsse anhand von x,,x N auf Charakteristika θ,,θ k der unterstellten W keitsverteilungder datengenerierenden X,,X N und Fehlerabschätzung der Rückschlüsse. Diese Charakteristika gelten für die Grundgesamtheit, d.h. für die Menge {e, e 2, } aller Merkmalsträger (Ω, A, P) X:Ω R M N {e,,e N } x,,x N P(Xi x) F (x;θ) X z.b. θˆ P(Xi x) F (x;θ) X x P(X x) F (x;θ) M M {e,,e M } M>N < z.b. θ E(X) X

2 Fragestellungen der Schließenden Statistik Verfahrenstypen Punktschätzungen Schätzung von Verteilungs- parameter θ durch Kennzahl θˆ T(x,...,x N ) Intervallschätzungen Schätzung eines Intervalls [θˆ,θˆ L U] KI(x,...,x mit P θ [θˆ,θˆ ] ( ) α L U N ) Hypothesentests Entscheidung zwischen H : θ T und H : θ T anhand von θˆ Δ oder θˆ Δ mit P(Θˆ Δ θ T ) α 2

3 Ausgangssituation Datensatz x(x,,x N ) als Realisationsreihe von N i.i.d. Zufallsvariablen X,,X N, X i ~F X ( z.b.n, F X N(μ,) ) Unbekannterk-dimensionaler Parametervektor θ(i.w. k ) der Verteilung F X ( z.b. θ μ) θ θ θ μ 4.5 µ 4.9 µ 5 µ 5.2 µ 5.5 3

4 Hypothesen Nullhypothese H : θ T Alternativhypothese H : θ T ( z.b. H : μ 5 ) ( z.b. H : μ 5 ) µ 5 μ 4.5 µ 4.9 µ 5.2 µ 5.5 4

5 Teststatistik Allgemeine Form eines statistischen Tests Zufallsvariable T(X) mit unter H spezifizierter Verteilung F T(X) H (z.b. T(X) X, F ix H N(5, /N) ) Testentscheidung Zufallsvariable φ(x) I(T(X) Δ ) Lehne H nicht ab, falls T(X) Δ mit AnnahmebereichΔ ( z.b.δ (4.3, 5.7) ) Lehne H ab, falls T(X) Δ mit AblehnbereichΔ ( z.b.δ (, 4.3] [5.7, ) ) Δ Δ Δ ϕ(x) ϕ(x) ϕ(x) X 5

6 Test zum Niveau α Test, dessen maximale Wahrscheinlichkeit, H trotz ihrer Gültigkeit zu verwerfen, durch einen vor dem Test festzulegenden Wert α nach oben begrenzt ist. P(T(X) Δ θ T) α Für einen exakten Test zum Niveau αgilt P(T(X) Δ θ T) α Für einen konservativen Test zum Niveau α gilt P(T(X) Δ θ T) < α 6

7 Test zum Niveau α Test, dessen maximale Wahrscheinlichkeit, H trotz ihrer Gültigkeit zu verwerfen, durch αnach oben begrenzt ist. _ P(T(X) Δ θ T) α (z.b. T(X) X, F ix H N(5, /N) P[ X (4.3,5.7)].27 Beispieltest ist Niveau-α-Test für jedes α.27, also auch für.5 ) f X H (x) P(T(X) Δ θ T) x P(T(X) Δ θ T) 7

8 P-Wert Allgemeine Form eines statistischen Tests kleinstes Niveau α p, zu dem ein Niveau-α p -Test die Nullhypothese für die Realisation x (x,,x N ) ablehnt Für Niveau-α-Tests mit einseitigen AblehnbereichenΔ (c α, ), d.h. Tests, deren Entscheidung gegen H gleichbedeutend mit T(X) > c α (sog. kritischer Wert) ist, gilt: αp P(T(X) > T(x) H) Bemerkung: c α ist das für einen exakten Niveau-α-Test das -α-quantil der Verteilung von T(X) unter H, denn P(T(X) Δ θ T) α P(T(X) > cα H) α P(T(X) cα H) α Die Entscheidung zum Niveauαgegen H ist dann äquivalent mit I(α p α), denn α p α P(T(X) > T(x) H T(x) > c α ) P(T(X) > c α H ) 8

9 P-Wert Allgemeine Form eines statistischen Tests kleinstes Niveau α p, zu dem ein Niveau-α p -Test die Nullhypothese für die Realisation x (x,,x N ) ablehnt Für Niveau-α-Tests mit einseitigen AblehnbereichenΔ (c α, ), d.h. Tests, deren Entscheidung gegen H gleichbedeutend mit T(X) > c α (sog. kritischer Wert) ist, gilt: P(T(X) T(x) H ) αp > _ ( z.b. T(X) X-5, α.5 c <.62 _ X 4.8 T(x).2 P(T(X)>.2 μ5).527>.5 Lehne H zum Niveau.5 nicht ab ) -α.95 -α p.473 F X-5 H (x) _ x-5.2 c.5.62 x 9

10 Zufallsvariable X (X,...,X ),X ~F i.i.d ( z.b.n, F X N(μ,) ) N i X θ θ Nullhypothese H : θ T ( z.b. H : μ 5 ) TeststatistikT(X), mit F T(X) H T(X) mit ( z.b. T(X) X, F ix H N(5, /N) ) F T(X) H Testentscheidung φ(x) I(T(X) Δ) ( z.b.δ (4.3, 5.7) ) Test zum Niveau α P(T(X) Δ θ T) α ( z.b.α.5 ) _ P-Wert P(T(X) T(x) H ) ( z.b. T(X) X-5, α.5 c.5.62 αp > T(x).2 P(T(X)>.2 μ5).527 ) Signifikantes Ergebnis zum Niveau α α p α

11 Richtige und falsche Testentscheidungen H gilt H gilt Testentscheidung für H Richtige Testentscheidung (. Art) Fehler 2. Art(β-Fehler) Testentscheidung fürh Fehler. Art (α-fehler) Richtige Testentscheidung (2. Art) Bei einem Niveau-α-Test ist die Wahrscheinlichkeit für den Fehler. Art VORDurchführung des Tests nach oben durch den Wert von αbegrenzt (und entsprechend die Wahrscheinlichkeit für die richtige Testentscheidung. Art nach unten durch - α). Falls H gilt, ist die Wahrscheinlichkeit P(φ(X) H ), sich falsch zu entscheiden, maximal gleich α.

12 Richtige und falsche Testentscheidungen H gilt H gilt Testentscheidung für H Richtige Testentscheidung (. Art) Fehler 2. Art(β-Fehler) Testentscheidung fürh Fehler. Art (α-fehler) Richtige Testentscheidung (2. Art) Bei einem Niveau-α-Test ist die Wahrscheinlichkeit für den Fehler. Art VORDurchführung des Tests nach oben durch den Wert von αbegrenzt (und entsprechend die Wahrscheinlichkeit für die richtige Testentscheidung. Art nach unten durch - α). Falls H abgelehnt wurde, ist die Wahrscheinlichkeit P(H φ(x)), sich falsch entschieden zu haben, maximal gleich α. Wenn H als unbekannt, aber nicht als Ergebnis eines Zufallsexperiments angesehen wird, gilt ohnehin entweder P(H φ(x)) oder P(H φ(x)). 2

13 Beispiel: Einmaliges Würfeln mit 2-seitigem Würfel H gilt Alle Zahlen gleich wahrscheinlich H gilt Mindestens eine Zahl mit abweichender W keit P(H φ(x)) α. Testentscheidung für H : keine 2 gewürfelt Testentscheidung für H : 2 gewürfelt Richtige Testentscheidung (. Art) Fehler. Art (α-fehler) Fehler 2. Art(β-Fehler) Richtige Testentscheidung(2. Art) Wenn H als unbekannt, aber als Ergebnis eines Zufallsexperiments angesehen wird, gilt ohnehin entweder P(H φ(x)) oder P(H φ(x)). Betrachte die nach einfachem Wurf mit 2-seitigem Würfel geworfene Zahl X Der Test für H : P(Xi)/2 für alle i gegen H : P(Xi) /2 für mindestens ein i, der H ablehnt, falls die gewürfelte Zahl eine 2 ist, ist ein exakter Niveau-.5-Test. Falls über die Herkunft des Würfels nichts bekannt ist, kann aber auch bei Testentscheidung für H keine weitere Aussage über H getroffen werden außer der, dass falls H gälte, das erhaltene Testergebnis x2 nur in 5% aller Fälle auftreten würde. 3

14 Beispiel: Einmaliges Würfeln mit 2-seitigem Würfel H gilt Alle Zahlen gleich wahrscheinlich H gilt Mindestens eine Zahl mit abweichender W keit P(H φ(x)) α. Testentscheidung für H : keine 2 gewürfelt Testentscheidung für H : 2 gewürfelt Richtige Testentscheidung (. Art) Fehler. Art (α-fehler) Fehler 2. Art(β-Fehler) Richtige Testentscheidung(2. Art) Falls bekannt ist, dass der Würfel aus einer Kiste von Würfeln mit einem Anteil u an unfairen Würfeln stammt, so gilt P(H )-u. In diesem Fall ist H Ergebnis eines Zufallsexperiments und die Wahrscheinlichkeit P(H φ(x)) kann durch den Satz von Bayesbestimmt werden zu P(H φ(x) ) P( φ(x) H ) P( φ(x) H ) P(H ) P(H ) + [ P( φ(x) H ) ] [ P(H )] α ( u) + α ( u) [ P( φ(x) H) ] u und hängt damit noch von der Wahrscheinlichkeit für den Fehler 2. Art ab. 4

15 Richtige und falsche Testentscheidungen H gilt H gilt Testentscheidung für H Richtige Testentscheidung (. Art) Fehler 2. Art(β-Fehler) Testentscheidung fürh Fehler. Art (α-fehler) Richtige Testentscheidung (2. Art) Bei einem Niveau-α-Test ist die Wahrscheinlichkeit für den Fehler. Art VORDurchführung des Tests nach oben durch den Wert von αbegrenzt (und entsprechend die Wahrscheinlichkeit für die richtige Testentscheidung. Art nach unten durch - α). Über die Wahrscheinlichkeit für den Fehler 2. Art sagt die allgemeine Definition des Niveau-α- Tests nichts aus. Je nach konkretem Test können aber möglicherweise Aussagen über P(φ(X) θ T ) für Teilmengen T T gemacht werden. 5

16 Beispiel: Einmaliges Würfeln mit 2-seitigem Würfel H gilt Alle Zahlen gleich wahrscheinlich H gilt Zahl 2 mit %-iger W keit Testentscheidung für H : keine 2 gewürfelt Richtige Testentscheidung (. Art) Fehler 2. Art(β-Fehler) P(H φ(x)) α. Testentscheidung für H : 2 gewürfelt Fehler. Art (α-fehler) Richtige Testentscheidung(2. Art) Falls bekannt ist, dass der Würfel aus einer Kiste von Würfeln mit einem Anteil u an unfairen Würfeln stammt, so gilt P(H )-u. Falls weiterhin bekannt ist, dass auf allen 2 Seiten der unfairen Würfel eine 2 steht, so gilt: P( φ(x) H ) und damit: P(H φ(x) ) α ( u) + α ( u) [ P( φ(x) H ) ] u α ( u) α ( u) + u also z.b. für α.5 und u.: P(H φ(x) ).832 6

17 Beispiel: Einmaliges Würfeln mit 2-seitigem Würfel P(H φ(x)) α. Testentscheidung für H : keine 2 gewürfelt Testentscheidung für H : 2 gewürfelt H gilt Alle Zahlen gleich wahrscheinlich Richtige Testentscheidung (. Art) Fehler. Art (α-fehler) H gilt Zahl 2 mit %-iger W keit Fehler 2. Art(β-Fehler) Richtige Testentscheidung(2. Art) Falls bekannt ist, dass der Würfel aus einer Kiste von Würfeln mit einem Anteil u an unfairen Würfeln stammt, so gilt P(H )-u. Falls weiterhin bekannt ist, dass auf allen 2 Seiten der unfairen Würfel eine 2 steht, so gilt: P(H α ( u) φ(x) ) α ( u) + u Je geringer also der Anteil an unfairen Würfeln ist, desto wahrscheinlicher ist also H trotz gegenteiliger Testentscheidung. P(H φ(x) ) α.5 u 7

18 Satz von Bayes, Beispiel Spam-Filter Déjà-vu? Gegeben P(A B) Sensitivität.95 P(A C B C ) Spezifität.98 P(B) Prävalenz.5 P(B A) P(A B) C P (B) + [ P(A B Ω P(A B) P (B) Ω C )] [ P Ω A: Maximalgewinn in Mail A C : Maximalgewinn nicht in Mail (B)] P(B A) P(A B) P(B) P(A) B: Mail ist Spam B C : Mail ist kein Spam (.98) (.5) Wenn.5% der Mails Spam sind, sind bei einer Sensitivität von 95% und bei einer Spezifität von 98% ca. 9.3% der als Spam klassifizierten Mails tatsächlich Spam 8

19 Satz von Bayes, Beispiel Spam-Filter Déjà-vu! Spam-Filter ist Niveau-α-Test Gegeben P(φ H ) -α.95 P(φ H ) -P(β-Fehler).98 P(H ).5 P(H φ) P(φ H ) P(φ H ) P(H ) φ: Maximalgewinn in Mail φ: Maximalgewinn nicht in Mail P(H ) + [ P(φ H )] [ P(H )] P(φ H) P(H) P(H φ ) P(φ ) H : Mail ist Spam H : Mail ist kein Spam (.98) (.5) Wenn.5% der Mails Spam sind, sind bei einem Testniveau von 5% und bei einer Wahrscheinlichkeit für den Fehler 2. Art von 2% als Spam klassifizierten Mails mit einer Wahrscheinlichkeit von ca. 9.3% tatsächlich Spam 9

20 Beispiel: Hackerangriffsserie In einem Netzwerksystem sei es an 3 Tagen zu den Zeitpunkten 5 Uhr, 8 Uhr und 9 Uhr zu Hackerangriffen gekommen, von denen bekannt ist, dass sie von der selben Person ausgingen. In den Log-Dateien des Systems werden keine IP-Adressen gespeichert. Allerdings geht aus diesen Dateien hervor, dass sich täglich ca. Personen in das System einloggen, wobei ihr täglicher Einlogg-Zeitpunkt näherungsweise einer N(,.5 2 ) Verteilung und ihre tägliche Online-Zeit einer Exp(.5)-Verteilung folgt. Per Zufall geht nun aus den lokalen Log-Dateien eines ansonsten Unverdächtigen A hervor, dass er zu allen drei Angriffs-Zeitpunkten im System eingeloggt war. Fragen:. Spricht diese Tatsache zum Niveau gegen H : A ist unschuldig an den Angriffen? 2. Mit welcher Wahrscheinlichkeit hat A die Angriffe durchgeführt? 2

21 Beispiel: Hackerangriffsserie. Spricht diese Tatsache zum Niveau gegen H : A ist unschuldig an den Angriffen? Unter H gilt: Einloggzeitpunkt X e ~N(,.5 2 ) f X e (x) e 2π.5 2 x 2.5 Ausloggzeitpunkt Xa Xe + X o mit X o ~Exp(.5) f X x X x a e (y) I( y).5e.5y Wahrscheinlichkeit, zum Zeitpunkt x t eingeloggt gewesen zu sein: P(Xe < xt < Xa) P(Xe < xt) P(xTt < Xa Xe < x t ) P(Xe < xt) [ P(Xa < xt Xe < x t )] x x u t t f X ux X a e u (v) f X e (u) dv du x x u t t.5e.5v 2π.5 e 2 u 2.5 dv du 2

22 Beispiel: Hackerangriffsserie. Spricht diese Tatsache zum Niveau gegen H : A ist unschuldig an den Angriffen? Wahrscheinlichkeit, zum Zeitpunkt x t eingeloggt gewesen zu sein: P(X e < x t < X ) a x x u t t.5v.5e e 2π.5 2 u 2.5 dv du Wahrscheinlichkeiten, zu den 3 Angriffszeitpunkten online gewesen zu sein: P( X e < 5 < X a ).77 P( X e < 8 < X a ).4 P( X e < 9 < X a ).24 P(X e < x t < X a ) x t 22

23 Beispiel: Hackerangriffsserie. Spricht diese Tatsache zum Niveau gegen H : A ist unschuldig an den Angriffen? Wahrscheinlichkeit, zum Zeitpunkt x t eingeloggt gewesen zu sein: P(X e < x t < X ) a x x u t t.5v.5e e 2π.5 2 u 2.5 dv du Wahrscheinlichkeit, zu allen 3 Angriffszeitpunkten online gewesen zu sein: P( X e; < 5 < X a; X e;2 < 8 < X a;2 X e;3 < 9 < X a;3 ) P(X e < x t < X a ) x t 23

24 Beispiel: Hackerangriffsserie. Spricht diese Tatsache zum Niveau gegen H : A ist unschuldig an den Angriffen? Wahrscheinlichkeit, zum Zeitpunkt x t eingeloggt gewesen zu sein: P(X e < x t < X ) a x x u t t.5v.5e e 2π.5 Wahrscheinlichkeit, zu allen 3 Angriffszeitpunkten online gewesen zu sein: 2 u 2.5 dv du P( X e; < 5 < X a; X e;2 < 8 < X a;2 X e;3 < 9 < X a;3 ) <. Die Nullhypothese A ist unschuldig an den Angriffen kann also zum Niveau abgelehnt werden. 24

25 Beispiel: Hackerangriffsserie 2. Mit welcher Wahrscheinlichkeit hat A die Angriffe durchgeführt? Wahrscheinlichkeit der Unschuld von A ohne Einlogg-Information: P(H ) 9999/ Wahrscheinlichkeit, zu den drei Zeitpunkten eingeloggt gewesen zu sein bei Unschuld von A: P(X e; < 5 < X a; X e;2 < 8 < X a;2 X e;3 < 9 < X a;3 H ) : P(L 3 H ).73 Wahrscheinlichkeit, zu den drei Zeitpunkten eingeloggt gewesen zu sein bei Schuld von A: P(L 3 H ) Wahrscheinlichkeit, dass A unschuldig ist, wenn er zu den drei Zeitpunkten eingeloggt war: P(H L 3 ) P(L3 H) P(H) P(L ) 3 P(L 3 P(L3 H) P(H) H ) P(H ) + P(L H ) [ P(H )] 3 25

26 Beispiel: Hackerangriffsserie 2. Mit welcher Wahrscheinlichkeit hat A die Angriffe durchgeführt? Wahrscheinlichkeit der Unschuld von A ohne Einlogg-Information: P(H ) 9999/ Wahrscheinlichkeit, zu den drei Zeitpunkten eingeloggt gewesen zu sein bei Unschuld von A: P(X e; < 5 < X a; X e;2 < 8 < X a;2 X e;3 < 9 < X a;3 H ) : P(L 3 H ).73 Wahrscheinlichkeit, zu den drei Zeitpunkten eingeloggt gewesen zu sein bei Schuld von A: P(L 3 H ) Wahrscheinlichkeit, dass A unschuldig ist, wenn er zu den drei Zeitpunkten eingeloggt war: P(L3 H) P(H) P(H L3).633 P(L H ) P(H ) + P(L H ) [ P(H )]

27 Beispiel: Hackerangriffsserie 2. Mit welcher Wahrscheinlichkeit hat A die Angriffe durchgeführt? Wahrscheinlichkeit der Unschuld von A ohne Einlogg-Information: P(H ) 9999/ Wahrscheinlichkeit, zu den drei Zeitpunkten eingeloggt gewesen zu sein bei Unschuld von A: P(X e; < 5 < X a; X e;2 < 8 < X a;2 X e;3 < 9 < X a;3 H ) : P(L 3 H ).73 Wahrscheinlichkeit, zu den drei Zeitpunkten eingeloggt gewesen zu sein bei Schuld von A: P(L 3 H ) Wahrscheinlichkeit, dass A unschuldig ist, wenn er zu den drei Zeitpunkten eingeloggt war: P(H L3).633 Die Wahrscheinlichkeit, dass A die Angriffe durchgeführt hat, beträgt etwa -.633, also ca. 36.7%. 27

28 Beispiel: Hackerangriffsserie Die Wahrscheinlichkeit, dass A die Angriffe durchgeführt hat, beträgt etwa -.633, also ca. 36.7%. Diese Wahrscheinlichkeit P A (H ) kann in weiteren Tests als Vorinformation genutzt werden. Wenn sich z.b. aus den lokalen Dateien von A hervorgeht, dass auf seinem Rechner ein Programm installiert ist (Ereignis PI), das sich auf den Rechnern von 99% der Personen, die für vergleichbare Angriffe verantwortlich zeichneten und nur auf 6% der Rechner der übrigen Personen findet, so kann die Wahrscheinlichkeit P A (H PI) mit der gleichen Nullhypothese wie im vergangenen Test, berechnet werden zu: PA(PI H ) PA(H ) P(H PI).95 P (PI H ) P (H ) + P (PI H ) [ P (H )] A A A Das installierte Programm erhöht also die Schuldwahrscheinlichkeit von ca. 36.7% auf rund 9.5%, und das, obwohl ein Test auf Basis des installierten Programms allein wegen 6% > 5% die Unschuldshypothese zum Niveau 5% nicht ablehnen würde. A 28

29 H gilt H gilt Richtige und falsche Testentscheidungen Testentscheidung für H : keine 2 gewürfelt Testentscheidung für H : 2 gewürfelt Richtige Testentscheidung (. Art) Fehler. Art (α-fehler) Fehler 2. Art(β-Fehler) Richtige Testentscheidung(2. Art) Über die Wahrscheinlichkeit für den Fehler 2. Art sagt die allgemeine Definition des Niveau-α- Tests nichts aus. Je nach konkretem Test können aber möglicherweise Aussagen über P(φ(X) θ T ) für Teilmengen T T gemacht werden. Daraus folgt, dass nach der allgemeinen Definition eines Niveau-α-Tests die Testentscheidung weder von H noch von H abhängen muss! Damit ist der Test, der H ablehnt, wenn mit einem fairen 2-seitigen Würfel eine 2 gewürfelt wird, ein exakter Niveau-.5-Test für jede beliebige Nullhypothese, z.b. auch für H : Morgen wird es regnen! Für die Beurteilung von Qualität und Sinn eines konkreten Tests sind also i.a. Betrachtungen der Fehlerwahrscheinlichkeiten nötig, wie sie bspw. in den letzten Beispielen bei der Konstruktion von A-Posteriori-Wahrscheinlichkeiten der Hypothesen vorgenommen wurden. 29

30 Mehrere Tests an einem Datensatz Falls k Tests φ,, φ k auf die Nullhypothesen H ;,,H ;k durchgeführt werden und der Test φ auf die globale Nullhypothese H : H ;,,H ;k gelten gegen H : Für mindestens ein i gilt H ;i nicht zum globalen Testniveau αdurchgeführt werden soll, so müssen die Niveaus der k Einzeltests entsprechend angepasst werden, sofern die Ablehnung der globalen Nullhypothese erfolgt, sobald einer der Einzeltests seine Nullhypothese verwirft. Eine konservative Möglichkeit dies zu tun, liegt in der Verwendung des Niveaus α k α/k für jeden der k Einzeltests, da nach der Poincaré-Sylvesterformel gilt: P([φ ]... [ φk ] H;... H;k) P(φ H;) P(φk H α P(φ H ) k α k ; k ) 3

31 Beispiel: Hackerangriffsserie Falls die Hackerangriffe doch nicht alle von der selben Person stammen müssen, kann für jeden Angriff ein einzelner Test durchgeführt werden. Wie weiter oben gezeigt wurde, lauten die Wahrscheinlichkeiten, dass A während der einzelnen Angriffzeitpunkte bei gegebener Unschuld online war: P( X e < 5 < X a ).77 P( X e < 8 < X a ).4 P( X e < 9 < X a ).24 Zum Niveau 5 % würde also die Unschuldshypothese für den 2. und 3. Angriff abgelehnt. Da allerdings drei Einzeltests durchgeführt werden, müssen diese zum Niveau.5/3.7% durchgeführt werden, um einen globalen Test zum Niveau 5% auf die Hypothese A war an keinem der drei Angriffe beteiligt zu erhalten. Da alle P-Werte größer als.7% sind, kann diese Hypothese nicht abgelehnt werden. 3

32 Tests für H : μμ gegen H :μ μ bei Normalverteilung Herleitung des Tests Beispielhafter Test bei der allgemeinen Einführung des statistischen Testbegriffs ist Test (so genannter Gauß-Test) auf obige Hypothese, falls die Standardabweichung σ(im Beispiel σ ) bekannt ist. Da σ aber i.d.r. unbekannt ist, wird es durch die Schätzung ersetzt. s(x) N N n (Xn X) 2 Falls H : μ μ gilt, so kann die Verteilung der Teststatistik T(X) des so genannten zweiseitigen Einstichproben-t-Tests mit T(X) N X μ s(x) bestimmt werden, da in diesem Fall X μ N s(x) ~ tn gilt. 32

33 Tests für H : μμ gegen H :μ μ bei Normalverteilung Herleitung des Tests Falls H : μ μ gilt, so kann die Verteilung der Teststatistik T(X) des so genannten zweiseitigen Einstichproben-t-Tests mit T(X) N X μ s(x) X μ bestimmt werden, da in diesem Fall N s(x) ~ tn Entsprechend kann aus dieser Verteilung der P-Wert P[T(X)>T(x) H ] für den realisierten Datensatz x ermittelt werden: gilt. P X μ N T(x) s(x) H X μ x μ P N N H s(x) s(x) 33

34 Tests für H : μμ gegen H :μ μ bei Normalverteilung Herleitung des Tests Falls H : μ μ gilt, so kann die Verteilung der Teststatistik T(X) des so genannten zweiseitigen Einstichproben-t-Tests mit T(X) N X μ s(x) X μ bestimmt werden, da in diesem Fall N s(x) ~ tn Entsprechend kann aus dieser Verteilung der P-Wert P[T(X)>T(x) H ] für den realisierten Datensatz x ermittelt werden: T(x) gilt. P X μ N T(x) s(x) H tn x μ N s(x) F f tn- (u) u 34

35 Tests für H : μμ gegen H :μ μ bei Normalverteilung Herleitung des Tests Falls H : μ μ gilt, so kann die Verteilung der Teststatistik T(X) des so genannten zweiseitigen Einstichproben-t-Tests mit T(X) N X μ s(x) X μ bestimmt werden, da in diesem Fall N s(x) ~ tn Entsprechend kann aus dieser Verteilung der P-Wert P[T(X)>T(x) H ] für den realisierten Datensatz x ermittelt werden: T(x) T(x) gilt. P X μ N T(x) s(x) H x μ N s(x) F tn X μ P N T(x) H s(x) Symmetrieder t-verteilung f tn- (u) u 35

36 Tests für H : μμ gegen H :μ μ bei Normalverteilung Herleitung des Tests Falls H : μ μ gilt, so kann die Verteilung der Teststatistik T(X) des so genannten zweiseitigen Einstichproben-t-Tests mit T(X) N X μ s(x) P X μ bestimmt werden, da in diesem Fall N s(x) ~ tn Entsprechend kann aus dieser Verteilung der P-Wert P[T(X)>T(x) H ]für den realisierten Datensatz x ermittelt werden: T(x) [ T(X) ] T(x) H gilt. X μ X μ P N T(x) H + P N T(x) H s(x) s(x) 2 f tn- (u) 2 F t N x μ N s(x) 2 F t N ( T(x) ) u 36

37 Tests für H : μμ gegen H :μ μ bei Normalverteilung Beispiel: Besucher auf Internetseite pro Tag Der Besucherzähler einer Internetseite hat in den letzten Tagen die folgenden Besucherzahlen verzeichnet: 92, 55, 8493, 5786, 989, 8539, 2462, 325, 2727, 84 Überprüft werden soll die Hypothese zum Niveau 5 %, dass der Erwartungswert μder Besucherzahlen beträgt. Dabei wird von normalverteilten Besucherzahlen ausgegangen.. Testentscheidung anhand des kritischen Werts P(T(X) cα H) α X μ X μ P N cα H + P N cα H s(x) s(x) X μ X μ P N cα H P N cα H s(x) s(x) X μ P N cα H α/2 s(x) cα Qt N ; α/2 α α/2 x 397 μ 37

38 Tests für H : μμ gegen H :μ μ bei Normalverteilung Beispiel: Besucher auf Internetseite pro Tag Der Besucherzähler einer Internetseite hat in den letzten Tagen die folgenden Besucherzahlen verzeichnet: 92, 55, 8493, 5786, 989, 8539, 2462, 325, 2727, 84 Überprüft werden soll die Hypothese zum Niveau 5 %, dass der Erwartungswert μder Besucherzahlen beträgt. Dabei wird von normalverteilten Besucherzahlen ausgegangen.. Testentscheidung anhand des kritischen Werts c Qt ; α/2 Qt ;.975 α N x μ 397 T(x) N.886 < 2.26 s(x) 2342 Der Mittelwert von 397 weicht zum Niveau 5% nicht signifikant von μ ab, d.h. die Nullhypothese kann nicht verworfen werden. x 397 μ 38

39 Tests für H : μμ gegen H :μ μ bei Normalverteilung Beispiel: Besucher auf Internetseite pro Tag Der Besucherzähler einer Internetseite hat in den letzten Tagen die folgenden Besucherzahlen verzeichnet: 92, 55, 8493, 5786, 989, 8539, 2462, 325, 2727, 84 Überprüft werden soll die Hypothese zum Niveau 5 %, dass der Erwartungswert μder Besucherzahlen beträgt. Dabei wird von normalverteilten Besucherzahlen ausgegangen. 2. Testentscheidung anhand des P-Werts P T(X) x μ N s(x) > H 397 P T(X) > H P > Ft 9 (.886).92 ( T(X).886 H ) x 397 μ 39

40 Tests für H : μμ gegen H :μ μ bei Normalverteilung Beispiel: Besucher auf Internetseite pro Tag Der Besucherzähler einer Internetseite hat in den letzten Tagen die folgenden Besucherzahlen verzeichnet: 92, 55, 8493, 5786, 989, 8539, 2462, 325, 2727, 84 Überprüft werden soll die Hypothese zum Niveau 5 %, dass der Erwartungswert μder Besucherzahlen beträgt. Dabei wird von normalverteilten Besucherzahlen ausgegangen. 2. Testentscheidung anhand des P-Werts x μ P T(X) > N H.92 >.5 s(x) Der Mittelwert von 397 weicht zum Niveau 5% nicht signifikant von μ ab, d.h. die Nullhypothese kann nicht verworfen werden. x 397 μ 4

41 Tests für H : μμ gegen H :μ μ bei Normalverteilung Fehlerwahrscheinlichkeiten 2. Art Unter H ist die Verteilung von T(X) offenbar vollständig spezifiziert, so dass der zweiseitige Einstichproben-t-Test ein exakter Niveau-α-Test ist. Für einen bestimmten Wert μ R\μ ist die Verteilung von T(X) bis auf σspezifiert, da gilt: 2 X μ μ μ X,...,XN ~N(μ,σ ) N ~tn (δ), δ N, s(x) σ wobei t N- (δ) nichtzentrale t-verteilungmit Nichtzentralitätsparameter δund N- Freiheitsgraden genannt wird. f t9 (x;3.32) μ μ σ2 α.5 N x 4

42 Tests für H : μμ gegen H :μ μ bei Normalverteilung Fehlerwahrscheinlichkeiten 2. Art Damit kann für bestimmte μ und σdie Wahrscheinlichkeit βfür den Fehler 2. Art bestimmt werden: 2 X μ μ μ X,...,XN ~N(μ,σ ) N ~tn (δ), δ N s(x) σ ( T(X) c μ ) P α μ X μ P N Q tn ; s(x) μ μ α/2 X μ P Qt ; α/2 N Q N tn ; s(x) μ μ α/2 f t9 (u;) P(T(X) c α μ).95 (Keine Fehlentscheidung) μ μ σ2 α.5 N u 42

43 Tests für H : μμ gegen H :μ μ bei Normalverteilung Fehlerwahrscheinlichkeiten 2. Art Damit kann für bestimmte μ und σdie Wahrscheinlichkeit βfür den Fehler 2. Art bestimmt werden: 2 X μ μ μ X,...,XN ~N(μ,σ ) N ~tn (δ), δ N s(x) σ ( T(X) c μ ) P α μ X μ P N Q tn ; s(x) μ μ α/2 X μ P Qt ; α/2 N Q N tn ; s(x) μ μ α/2 f t9 (u;.33) P(T(X) c α μ.2).94 μ.2 μ σ2 α.5 N u 43

44 Tests für H : μμ gegen H :μ μ bei Normalverteilung Fehlerwahrscheinlichkeiten 2. Art Damit kann für bestimmte μ und σdie Wahrscheinlichkeit βfür den Fehler 2. Art bestimmt werden: 2 X μ μ μ X,...,XN ~N(μ,σ ) N ~tn (δ), δ N s(x) σ ( T(X) c μ ) P α μ X μ P N Q tn ; s(x) μ μ α/2 X μ P Qt ; α/2 N Q N tn ; s(x) μ μ α/2 f t9 (u;.66) P(T(X) c α μ).68 μ μ σ2 α.5 N u 44

45 Tests für H : μμ gegen H :μ μ bei Normalverteilung Fehlerwahrscheinlichkeiten 2. Art Damit kann für bestimmte μ und σdie Wahrscheinlichkeit βfür den Fehler 2. Art bestimmt werden: 2 X μ μ μ X,...,XN ~N(μ,σ ) N ~tn (δ), δ N s(x) σ ( T(X) c μ ) P α μ X μ P N Q tn ; s(x) μ μ α/2 X μ P Qt ; α/2 N Q N tn ; s(x) μ μ α/2 f t9 (u;4.5) P(T(X) c α μ2.5).4 μ 2.5 μ σ2 α.5 N u 45

46 Tests für H : μμ gegen H :μ μ bei Normalverteilung Fehlerwahrscheinlichkeiten 2. Art Damit kann für bestimmte μ und σdie Wahrscheinlichkeit βfür den Fehler 2. Art bestimmt werden: ( T(X) c μ ) P 2 X μ μ μ X,...,XN ~N(μ,σ ) N ~tn (δ), δ N s(x) σ α μ X μ P N Q tn ; s(x) μ μ α/2 X μ P Qt ; α/2 N Q N tn ; s(x) F (Qt ; α/2) F ( Qt ; α/2) t ( N(μ μ )/σ) N t ( N(μ μ )/σ) N N N μ μ α/2 F t9(.33) (z) μ.2 μ σ2 α.5 N X μ N s(x) z 46

47 Tests für H : μμ gegen H :μ μ bei Normalverteilung Fehlerwahrscheinlichkeiten 2. Art ( T(X) c μ ) P (Q ) F ( Q ) α μ Ft ( N(μ μ )/σ) tn ; α/2 t ( N(μ μ )/σ) tn ; α/2 N Die Funktion γ(μ ) P T(X) cα μ μ P T(X) > cα μ μ die die Wahrscheinlichkeit beschreibt, H : μμ abzulehnen, wenn μμ gilt, wird Gütefunktion des zweiseitigen Einstichproben-t-Tests genannt. N ( ) ( ), α,μ μ Es gilt: γ(μ) μ > α,μ μ σ2 α.5 N γ(μ ) μ 47

48 Tests für H : μμ gegen H :μ μ bei Normalverteilung Fehlerwahrscheinlichkeiten 2. Art ( T(X) c μ μ ) γ(μ ) P α Die Güte ist für festes μ F μ umso kleiner, je größer σund umso größer, je größer N. σ N5 γ().4 σ2 N5 γ().4 σ2.5 N5 γ(). μ F μ α.5 σ N γ().8 σ2 N γ().29 σ2.5 N γ().2 σ N5 γ().95 σ2 N5 γ().44 σ2.5 N5 γ().3 48

49 Tests für H : μμ gegen H :μ μ bei Normalverteilung Fehlerwahrscheinlichkeiten 2. Art ( T(X) c μ μ ) γ(μ ) P α Die Güte ist für festes μ F μ umso kleiner, je größer σund umso größer, je größer N. σ μ F μ α.5 γ() N 49

50 Tests für H : μμ gegen H :μ μ bei Normalverteilung Gütefunktion zum Vergleich mehrerer Tests für dieselbe Hypothese Sei σ bekannt Gaußtest Lehne H ab, wenn T(X) X μ > N(μ,N ); α/2 γ G(μ) F (Q ) N(μ μ,n ) N(μ,N ); α/2 F ( Q ) N(μ μ,n ) N(μ,N ); α/2 (Konservativer) Test nach Tschebyscheff-Ungleichung Q P var(x) ( X μ > ε) 2 2 ε var(x) N N ε Lehne H ab, wenn T(X) X μ > N α 5

51 Tests für H : μμ gegen H :μ μ bei Normalverteilung Gütefunktion zum Vergleich mehrerer Tests für dieselbe Hypothese Sei σ bekannt Gaußtest Lehne H N(μ,N ); α/2 γ G(μ) F (Q ) N(μ μ,n ) N(μ,N ); α/2 ab, wenn T(X) X μ F ( Q ) N(μ μ,n ) N(μ,N ); α/2 > Q μ N α.5 (Konservativer) Test nach Tschebyscheff-Ungleichung Lehne H ab, wenn T(X) X μ > N α γ T(μ) F N(μ μ,n ) N α F N(μ μ,n ) N α 5

9. Schätzen und Testen bei unbekannter Varianz

9. Schätzen und Testen bei unbekannter Varianz 9. Schätzen und Testen bei unbekannter Varianz Dr. Antje Kiesel Institut für Angewandte Mathematik WS 2011/2012 Schätzen und Testen bei unbekannter Varianz Wenn wir die Standardabweichung σ nicht kennen,

Mehr

9. StatistischeTests. 9.1 Konzeption

9. StatistischeTests. 9.1 Konzeption 9. StatistischeTests 9.1 Konzeption Statistische Tests dienen zur Überprüfung von Hypothesen über einen Parameter der Grundgesamtheit (bei einem Ein-Stichproben-Test) oder über die Verteilung einer Zufallsvariablen

Mehr

27. Statistische Tests für Parameter. Was ist ein statistischer Test?

27. Statistische Tests für Parameter. Was ist ein statistischer Test? 27. Statistische Tests für Parameter Wenn du eine weise Antwort verlangst, musst du vernünftig fragen Was ist ein statistischer Test? Ein statistischen Test ist ein Verfahren, welches ausgehend von Stichproben

Mehr

Eine Einführung in R: Statistische Tests

Eine Einführung in R: Statistische Tests Eine Einführung in R: Statistische Tests Bernd Klaus, Verena Zuber Institut für Medizinische Informatik, Statistik und Epidemiologie (IMISE), Universität Leipzig http://www.uni-leipzig.de/ zuber/teaching/ws12/r-kurs/

Mehr

Melanie Kaspar, Prof. Dr. B. Grabowski 1

Melanie Kaspar, Prof. Dr. B. Grabowski 1 7. Hypothesentests Ausgangssituation: Man muss sich zwischen 2 Möglichkeiten (=Hypothesen) entscheiden. Diese Entscheidung soll mit Hilfe von Beobachtungen ( Stichprobe ) getroffen werden. Die Hypothesen

Mehr

Beurteilende Statistik

Beurteilende Statistik Beurteilende Statistik Wahrscheinlichkeitsrechnung und Beurteilende Statistik was ist der Unterschied zwischen den beiden Bereichen? In der Wahrscheinlichkeitstheorie werden aus gegebenen Wahrscheinlichkeiten

Mehr

Beurteilung der biometrischen Verhältnisse in einem Bestand. Dr. Richard Herrmann, Köln

Beurteilung der biometrischen Verhältnisse in einem Bestand. Dr. Richard Herrmann, Köln Beurteilung der biometrischen Verhältnisse in einem Bestand Dr. Richard Herrmann, Köln Beurteilung der biometrischen Verhältnisse in einem Bestand 1 Fragestellung Methoden.1 Vergleich der Anzahlen. Vergleich

Mehr

Marktforschung I. Marktforschung I 2

Marktforschung I. Marktforschung I 2 Marktforschung I Marktforschung I Einführung in die Testtheorie (Toporowski) Mathematische Grundlagen (Toporowski) Varianzanalyse (Toporowski) Regressionsanalyse (Boztuğ) Diskriminanzanalyse (Hammerschmidt)

Mehr

5. Schließende Statistik. 5.1. Einführung

5. Schließende Statistik. 5.1. Einführung 5. Schließende Statistik 5.1. Einführung Sollen auf der Basis von empirischen Untersuchungen (Daten) Erkenntnisse gewonnen und Entscheidungen gefällt werden, sind die Methoden der Statistik einzusetzen.

Mehr

Klausur Nr. 1. Wahrscheinlichkeitsrechnung. Keine Hilfsmittel gestattet, bitte alle Lösungen auf dieses Blatt.

Klausur Nr. 1. Wahrscheinlichkeitsrechnung. Keine Hilfsmittel gestattet, bitte alle Lösungen auf dieses Blatt. Klausur Nr. 1 2014-02-06 Wahrscheinlichkeitsrechnung Pflichtteil Keine Hilfsmittel gestattet, bitte alle Lösungen auf dieses Blatt. Name: 0. Für Pflicht- und Wahlteil gilt: saubere und übersichtliche Darstellung,

Mehr

Bachelorabschlussseminar Dipl.-Kfm. Daniel Cracau

Bachelorabschlussseminar Dipl.-Kfm. Daniel Cracau 1 Einführung in die statistische Datenanalyse Bachelorabschlussseminar Dipl.-Kfm. Daniel Cracau 2 Gliederung 1.Grundlagen 2.Nicht-parametrische Tests a. Mann-Whitney-Wilcoxon-U Test b. Wilcoxon-Signed-Rank

Mehr

Statistik II für Betriebswirte Vorlesung 3

Statistik II für Betriebswirte Vorlesung 3 PD Dr. Frank Heyde TU Bergakademie Freiberg Institut für Stochastik Statistik II für Betriebswirte Vorlesung 3 5. November 2013 Beispiel: Aktiensplit (Aczel & Sounderpandan, Aufg. 14-28) Ein Börsenanalyst

Mehr

Medizinische Statistik Epidemiologie und χ 2 Vierfeldertest

Medizinische Statistik Epidemiologie und χ 2 Vierfeldertest Universität Wien Institut für Mathematik Wintersemester 2009/2010 Medizinische Statistik Epidemiologie und χ 2 Vierfeldertest Seminar Angewandte Mathematik Ao. Univ. Prof. Dr. Peter Schmitt von Nadja Reiterer

Mehr

Füllmenge. Füllmenge. Füllmenge. Füllmenge. Mean = 500,0029 Std. Dev. = 3,96016 N = 10.000. 485,00 490,00 495,00 500,00 505,00 510,00 515,00 Füllmenge

Füllmenge. Füllmenge. Füllmenge. Füllmenge. Mean = 500,0029 Std. Dev. = 3,96016 N = 10.000. 485,00 490,00 495,00 500,00 505,00 510,00 515,00 Füllmenge 2.4 Stetige Zufallsvariable Beispiel. Abfüllung von 500 Gramm Packungen einer bestimmten Ware auf einer automatischen Abfüllanlage. Die Zufallsvariable X beschreibe die Füllmenge einer zufällig ausgewählten

Mehr

Güte von Tests. die Wahrscheinlichkeit für den Fehler 2. Art bei der Testentscheidung, nämlich. falsch ist. Darauf haben wir bereits im Kapitel über

Güte von Tests. die Wahrscheinlichkeit für den Fehler 2. Art bei der Testentscheidung, nämlich. falsch ist. Darauf haben wir bereits im Kapitel über Güte von s Grundlegendes zum Konzept der Güte Ableitung der Gütefunktion des Gauss im Einstichprobenproblem Grafische Darstellung der Gütefunktionen des Gauss im Einstichprobenproblem Ableitung der Gütefunktion

Mehr

Einführung in die Statistik für Wirtschaftswissenschaftler für Betriebswirtschaft und Internationales Management

Einführung in die Statistik für Wirtschaftswissenschaftler für Betriebswirtschaft und Internationales Management Einführung in die Statistik für Wirtschaftswissenschaftler für Betriebswirtschaft und Internationales Management Sommersemester 2013 Hochschule Augsburg : Gliederung 1 Einführung 2 Deskriptive Statistik

Mehr

Aufgabe 1 10 ECTS. y i x j gering mittel hoch n i Hausrat 200 25 0 225 KFZ 0 10 75 85 Unfall 20 35 90 145 Reiserücktritt 40 5 0 45 n j 260 75 165 500

Aufgabe 1 10 ECTS. y i x j gering mittel hoch n i Hausrat 200 25 0 225 KFZ 0 10 75 85 Unfall 20 35 90 145 Reiserücktritt 40 5 0 45 n j 260 75 165 500 Aufgabe 1 Für die Securance-Versicherung liegen Ihnen die gemeinsamen absoluten Häugkeiten der Merkmale X: Schadenshöhe und Y : Versicherungsart für die letzten 500 gemeldeten Schäden vor. 1. Interpretieren

Mehr

12. Vergleich mehrerer Stichproben

12. Vergleich mehrerer Stichproben 12. Vergleich mehrerer Stichproben Dr. Antje Kiesel Institut für Angewandte Mathematik WS 2011/2012 Häufig wollen wir verschiedene Populationen, Verfahren, usw. miteinander vergleichen. Beipiel: Vergleich

Mehr

Ein möglicher Unterrichtsgang

Ein möglicher Unterrichtsgang Ein möglicher Unterrichtsgang. Wiederholung: Bernoulli Experiment und Binomialverteilung Da der sichere Umgang mit der Binomialverteilung, auch der Umgang mit dem GTR und den Diagrammen, eine notwendige

Mehr

Grundlagen der Inferenzstatistik

Grundlagen der Inferenzstatistik Grundlagen der Inferenzstatistik (Induktive Statistik oder schließende Statistik) Dr. Winfried Zinn 1 Deskriptive Statistik versus Inferenzstatistik Die Deskriptive Statistik stellt Kenngrößen zur Verfügung,

Mehr

Statistik im Bachelor-Studium der BWL und VWL

Statistik im Bachelor-Studium der BWL und VWL Max C. Wewel Statistik im Bachelor-Studium der BWL und VWL Methoden, Anwendung, Interpretation Mit herausnehmbarer Formelsammlung ein Imprint von Pearson Education München Boston San Francisco Harlow,

Mehr

Verteilungsanalyse. Johannes Hain. Lehrstuhl für Mathematik VIII Statistik 1/31

Verteilungsanalyse. Johannes Hain. Lehrstuhl für Mathematik VIII Statistik 1/31 Verteilungsanalyse Johannes Hain Lehrstuhl für Mathematik VIII Statistik 1/31 Datentypen Als Sammeln von Daten bezeichnet man in der Statistik das Aufzeichnen von Fakten. Erhobene Daten klassifziert man

Mehr

Analytische Statistik I. Statistische Methoden in der Korpuslinguistik Heike Zinsmeister WS 2009/10

Analytische Statistik I. Statistische Methoden in der Korpuslinguistik Heike Zinsmeister WS 2009/10 Analytische Statistik I Statistische Methoden in der Korpuslinguistik Heike Zinsmeister WS 2009/10 Testen Anpassungstests (goodness of fit) Weicht eine gegebene Verteilung signifikant von einer bekannten

Mehr

Statistik im Versicherungs- und Finanzwesen

Statistik im Versicherungs- und Finanzwesen Springer Gabler PLUS Zusatzinformationen zu Medien von Springer Gabler Grimmer Statistik im Versicherungs- und Finanzwesen Eine anwendungsorientierte Einführung 2014 1. Auflage Übungsaufgaben zu Kapitel

Mehr

Varianzanalyse ANOVA

Varianzanalyse ANOVA Varianzanalyse ANOVA Johannes Hain Lehrstuhl für Mathematik VIII Statistik 1/23 Einfaktorielle Varianzanalyse (ANOVA) Bisher war man lediglich in der Lage, mit dem t-test einen Mittelwertsvergleich für

Mehr

Verteilungsanalyse. Johannes Hain. Lehrstuhl für Mathematik VIII Statistik 1/35

Verteilungsanalyse. Johannes Hain. Lehrstuhl für Mathematik VIII Statistik 1/35 Verteilungsanalyse Johannes Hain Lehrstuhl für Mathematik VIII Statistik 1/35 Datentypen Als Sammeln von Daten bezeichnet man in der Statistik das Aufzeichnen von Fakten. Erhobene Daten klassifziert man

Mehr

DIPLOMVORPRÜFUNG GRUNDZÜGE DER STATISTIK, TEIL B WINTERSEMESTER 2006/07 28.02.2007

DIPLOMVORPRÜFUNG GRUNDZÜGE DER STATISTIK, TEIL B WINTERSEMESTER 2006/07 28.02.2007 Wirtschaftswissenschaftliches Prüfungsamt DIPLOMVORPRÜFUNG GRUNDZÜGE DER STATISTIK, TEIL B WINTERSEMESTER 006/07 8.0.007 Lösung Prof. Dr. R Friedmann / Dr. R. Hauser Hinweise für die Klausurteilnehmer

Mehr

Statistik II für Betriebswirte Vorlesung 2

Statistik II für Betriebswirte Vorlesung 2 PD Dr. Frank Heyde TU Bergakademie Freiberg Institut für Stochastik Statistik II für Betriebswirte Vorlesung 2 21. Oktober 2014 Verbundene Stichproben Liegen zwei Stichproben vor, deren Werte einander

Mehr

$ % + 0 sonst. " p für X =1 $

$ % + 0 sonst.  p für X =1 $ 31 617 Spezielle Verteilungen 6171 Bernoulli Verteilung Wir beschreiben zunächst drei diskrete Verteilungen und beginnen mit einem Zufallsexperiment, indem wir uns für das Eintreffen eines bestimmten Ereignisses

Mehr

Skriptum zur Veranstaltung. Quantitative Methoden (Mathematik/Statistik) Teil Induktive Statistik. 1. Version (mehr Draft als Skriptum)

Skriptum zur Veranstaltung. Quantitative Methoden (Mathematik/Statistik) Teil Induktive Statistik. 1. Version (mehr Draft als Skriptum) Skriptum zur Veranstaltung Quantitative Methoden (Mathematik/Statistik) Teil Induktive Statistik 1. Version (mehr Draft als Skriptum) Anmerkungen, Aufzeigen von Tippfehlern und konstruktive Kritik erwünscht!!!

Mehr

Einführung in die Geostatistik (2) Fred Hattermann (Vorlesung), hattermann@pik-potsdam.de Michael Roers (Übung), roers@pik-potsdam.

Einführung in die Geostatistik (2) Fred Hattermann (Vorlesung), hattermann@pik-potsdam.de Michael Roers (Übung), roers@pik-potsdam. Einführung in die Geostatistik () Fred Hattermann (Vorlesung), hattermann@pik-potsdam.de Michael Roers (Übung), roers@pik-potsdam.de Gliederung Allgemeine Statistik. Deskriptive Statistik. Wahrscheinlichkeitstheorie.3

Mehr

Übungsaufgaben zu Kapitel 5. Aufgabe 101. Inhaltsverzeichnis:

Übungsaufgaben zu Kapitel 5. Aufgabe 101. Inhaltsverzeichnis: Inhaltsverzeichnis: Übungsaufgaben zu Kapitel 5... 1 Aufgabe 101... 1 Aufgabe 102... 2 Aufgabe 103... 2 Aufgabe 104... 2 Aufgabe 105... 3 Aufgabe 106... 3 Aufgabe 107... 3 Aufgabe 108... 4 Aufgabe 109...

Mehr

5 Statistische Testverfahren

5 Statistische Testverfahren 70 5 Statistische Testverfahren 5.1 Grundlegende Definitionen und Binomialtest Beispiel 5.1.1: (Fortsetzung von Beispiel 4.2.15) Wir nehmen an, dass das Medikament als wenig bedenklich eingestuft werden

Mehr

7. Mai 2010. Ruhr-Universität Bochum. Methodenlehre II, SS 2009. Prof. Dr. Holger Dette

7. Mai 2010. Ruhr-Universität Bochum. Methodenlehre II, SS 2009. Prof. Dr. Holger Dette Ruhr-Universität Bochum 7. Mai 2010 1 / 95 Methodenlehre II NA 3/73 Telefon: 0234 322 8284 Email: holger.dette@rub.de Internet: www.ruhr-uni-bochum.de/mathematik3/index.html Vorlesung: Montag, 8.30-10.00

Mehr

Universität Bonn 28. Juli 2010 Fachbereich Rechts- und Wirtschaftswissenschaften Statistische Abteilung Prof. Dr. A. Kneip. KLAUSUR Statistik B

Universität Bonn 28. Juli 2010 Fachbereich Rechts- und Wirtschaftswissenschaften Statistische Abteilung Prof. Dr. A. Kneip. KLAUSUR Statistik B Universität Bonn 28. Juli 2010 Fachbereich Rechts- und Wirtschaftswissenschaften Statistische Abteilung Prof. Dr. A. Kneip Sommersemester 2010 KLAUSUR Statistik B Hinweise zur Bearbeitung: Bei allen Teilaufgaben

Mehr

8. Konfidenzintervalle und Hypothesentests

8. Konfidenzintervalle und Hypothesentests 8. Konfidenzintervalle und Hypothesentests Dr. Antje Kiesel Institut für Angewandte Mathematik WS 2011/2012 Beispiel. Sie wollen den durchschnittlichen Fruchtsaftgehalt eines bestimmten Orangennektars

Mehr

, dt. $+ f(x) = , - + < x < +, " > 0. " 2# Für die zugehörige Verteilungsfunktion F(x) ergibt sich dann: F(x) =

, dt. $+ f(x) = , - + < x < +,  > 0.  2# Für die zugehörige Verteilungsfunktion F(x) ergibt sich dann: F(x) = 38 6..7.4 Normalverteilung Die Gauß-Verteilung oder Normal-Verteilung ist eine stetige Verteilung, d.h. ihre Zufallsvariablen können beliebige reelle Zahlenwerte annehmen. Wir definieren sie durch die

Mehr

METHODENLEHRE I WS 2013/14 THOMAS SCHÄFER

METHODENLEHRE I WS 2013/14 THOMAS SCHÄFER METHODENLEHRE I WS 2013/14 THOMAS SCHÄFER DAS THEMA: INFERENZSTATISTIK IV INFERENZSTATISTISCHE AUSSAGEN FÜR ZUSAMMENHÄNGE UND UNTERSCHIEDE Inferenzstatistik für Zusammenhänge Inferenzstatistik für Unterschiede

Mehr

Kapitel 3. Zufallsvariable. Wahrscheinlichkeitsfunktion, Dichte und Verteilungsfunktion. Erwartungswert, Varianz und Standardabweichung

Kapitel 3. Zufallsvariable. Wahrscheinlichkeitsfunktion, Dichte und Verteilungsfunktion. Erwartungswert, Varianz und Standardabweichung Kapitel 3 Zufallsvariable Josef Leydold c 2006 Mathematische Methoden III Zufallsvariable 1 / 43 Lernziele Diskrete und stetige Zufallsvariable Wahrscheinlichkeitsfunktion, Dichte und Verteilungsfunktion

Mehr

Versuchsplanung. Teil 1 Einführung und Grundlagen. Dr. Tobias Kiesling Einführung in die Versuchsplanung

Versuchsplanung. Teil 1 Einführung und Grundlagen. Dr. Tobias Kiesling <kiesling@stat.uni-muenchen.de> Einführung in die Versuchsplanung Versuchsplanung Teil 1 Einführung und Grundlagen Dr. Tobias Kiesling Inhalt Einführung in die Versuchsplanung Hintergründe Grundlegende Prinzipien und Begriffe Vorgehensweise

Mehr

Business Value Launch 2006

Business Value Launch 2006 Quantitative Methoden Inferenzstatistik alea iacta est 11.04.2008 Prof. Dr. Walter Hussy und David Tobinski UDE.EDUcation College im Rahmen des dokforums Universität Duisburg-Essen Inferenzstatistik Erläuterung

Mehr

Statistische Auswertung der Daten von Blatt 13

Statistische Auswertung der Daten von Blatt 13 Statistische Auswertung der Daten von Blatt 13 Problemstellung 1 Graphische Darstellung der Daten 1 Diskussion der Normalverteilung 3 Mittelwerte und deren Konfidenzbereiche 3 Signifikanz der Behandlung

Mehr

Beispiel: Sonntagsfrage. Einführung in die induktive Statistik. Statistische Tests. Statistische Tests

Beispiel: Sonntagsfrage. Einführung in die induktive Statistik. Statistische Tests. Statistische Tests Beispiel: Sonntagsfrage Vier Wochen vor der österreichischen Nationalratswahl 1999 wurde 499 Haushalten die Sonntagsfrage gestellt: Falls nächsten Sonntag Wahlen wären, welche Partei würden Sie wählen?

Mehr

Grundlagen der Inferenzstatistik: Was Ihnen nicht erspart bleibt!

Grundlagen der Inferenzstatistik: Was Ihnen nicht erspart bleibt! Grundlagen der Inferenzstatistik: Was Ihnen nicht erspart bleibt! 1 Einführung 2 Wahrscheinlichkeiten kurz gefasst 3 Zufallsvariablen und Verteilungen 4 Theoretische Verteilungen (Wahrscheinlichkeitsfunktion)

Mehr

Biostatistik, Winter 2011/12

Biostatistik, Winter 2011/12 Biostatistik, Winter 2011/12 Vergleich zweier Stichproben, nichtparametrische Tests Prof. Dr. Achim Klenke http://www.aklenke.de 11. Vorlesung: 27.01.2012 1/86 Inhalt 1 Tests t-test 2 Vergleich zweier

Mehr

14.01.14 DAS THEMA: INFERENZSTATISTIK II. Standardfehler Konfidenzintervalle Signifikanztests. Standardfehler

14.01.14 DAS THEMA: INFERENZSTATISTIK II. Standardfehler Konfidenzintervalle Signifikanztests. Standardfehler DAS THEMA: INFERENZSTATISTIK II INFERENZSTATISTISCHE AUSSAGEN Standardfehler Konfidenzintervalle Signifikanztests Standardfehler der Standardfehler Interpretation Verwendung 1 ZUR WIEDERHOLUNG... Ausgangspunkt:

Mehr

Motivation. Wilcoxon-Rangsummentest oder Mann-Whitney U-Test. Wilcoxon Rangsummen-Test Voraussetzungen. Bemerkungen

Motivation. Wilcoxon-Rangsummentest oder Mann-Whitney U-Test. Wilcoxon Rangsummen-Test Voraussetzungen. Bemerkungen Universität Karlsruhe (TH) Forschungsuniversität gegründet 825 Wilcoxon-Rangsummentest oder Mann-Whitney U-Test Motivation In Experimenten ist die Datenmenge oft klein Daten sind nicht normalverteilt Dann

Mehr

Teil I Beschreibende Statistik 29

Teil I Beschreibende Statistik 29 Vorwort zur 2. Auflage 15 Vorwort 15 Kapitel 0 Einführung 19 0.1 Methoden und Aufgaben der Statistik............................. 20 0.2 Ablauf statistischer Untersuchungen..............................

Mehr

Stochastik Abitur 2009 Stochastik

Stochastik Abitur 2009 Stochastik Abitur 2009 Stochastik Beilage ea (erhöhtes Anforderungsniveau) ga (grundlegendes Anforderungsniveau) ISBN 978-3-8120-0108-3 und ISBN 978-3-8120-0223-3 1 Aufgabe 2 (ea) Rauchen ist das größte vermeidbare

Mehr

Jetzt lerne ich Stochastik für die Oberstufe

Jetzt lerne ich Stochastik für die Oberstufe Jetzt lerne ich Stochastik für die Oberstufe von Dr. rer. nat. Marco Schuchmann, Dipl.-Math. - 2 - - 3 - Vorwort In diesem Buch werden Anwendungen der Stochastik in der Oberstufe mit vielen Beispielen

Mehr

Tutorial: Homogenitätstest

Tutorial: Homogenitätstest Tutorial: Homogenitätstest Eine Bank möchte die Kreditwürdigkeit potenzieller Kreditnehmer abschätzen. Einerseits lebt die Bank ja von der Vergabe von Krediten, andererseits verursachen Problemkredite

Mehr

Einfache statistische Testverfahren

Einfache statistische Testverfahren Einfache statistische Testverfahren Johannes Hain Lehrstuhl für Mathematik VIII (Statistik) 1/29 Hypothesentesten: Allgemeine Situation Im Folgenden wird die statistische Vorgehensweise zur Durchführung

Mehr

Wahrscheinlichkeitsrechnung und Statistik für Biologen 5. Der zwei-stichproben-t-test. und der Wilcoxon-Test

Wahrscheinlichkeitsrechnung und Statistik für Biologen 5. Der zwei-stichproben-t-test. und der Wilcoxon-Test Wahrscheinlichkeitsrechnung und Statistik für Biologen 5. Der zwei-stichproben-t-test (t-test für ungepaarte Stichproben) und der Wilcoxon-Test Dirk Metzler 22. Mai 2015 Inhaltsverzeichnis 1 Wiederholung:

Mehr

Übungen zur Mathematik für Pharmazeuten

Übungen zur Mathematik für Pharmazeuten Blatt 1 Aufgabe 1. Wir betrachten den Ereignisraum Ω = {(i,j) 1 i,j 6} zum Zufallsexperiment des zweimaligem Würfelns. Sei A Ω das Ereignis Pasch, und B Ω das Ereignis, daß der erste Wurf eine gerade Augenzahl

Mehr

Statistische Datenauswertung. Andreas Stoll Kantonsschule Olten

Statistische Datenauswertung. Andreas Stoll Kantonsschule Olten Statistische Datenauswertung Andreas Stoll Beschreibende vs. schliessende Statistik Wir unterscheiden grundsätzlich zwischen beschreibender (deskriptiver) und schliessender (induktiver) Statistik. Bei

Mehr

13.5 Der zentrale Grenzwertsatz

13.5 Der zentrale Grenzwertsatz 13.5 Der zentrale Grenzwertsatz Satz 56 (Der Zentrale Grenzwertsatz Es seien X 1,...,X n (n N unabhängige, identisch verteilte zufällige Variablen mit µ := EX i ; σ 2 := VarX i. Wir definieren für alle

Mehr

Klausur: Einführung in die Statistik

Klausur: Einführung in die Statistik 1 Lösungen immer unter die jeweiligen Aufgaben schreiben. Bei Platzmangel auf die Rückseite schreiben (dann Nummer der bearbeiteten Aufgabe mit anmerken!!!). Lösungen, die nicht auf den Aufgabenblättern

Mehr

Von der Untersuchungsfrage zu statistischen Hypothesen, und wie war das nochmal mit dem α- und

Von der Untersuchungsfrage zu statistischen Hypothesen, und wie war das nochmal mit dem α- und Von der Untersuchungsfrage zu statistischen Hypothesen, und wie war das nochmal mit dem α- und β-fehler? Sven Garbade Fakultät für Angewandte Psychologie SRH Hochschule Heidelberg sven.garbade@hochschule-heidelberg.de

Mehr

Multivariate Statistik

Multivariate Statistik Hermann Singer Multivariate Statistik 1 Auflage 15 Oktober 2012 Seite: 12 KAPITEL 1 FALLSTUDIEN Abbildung 12: Logistische Regression: Geschätzte Wahrscheinlichkeit für schlechte und gute Kredite (rot/blau)

Mehr

Mathematik IV: Statistik. für D-UWIS, D-ERDW, D-USYS und D-HEST SS14

Mathematik IV: Statistik. für D-UWIS, D-ERDW, D-USYS und D-HEST SS14 Mathematik IV: Statistik für D-UWIS, D-ERDW, D-USYS und D-HEST SS14 Hygienische Reiniger Wissenschaftliche Studie: 10 000 Reinigungsversuche, 6 Fälle mit mehr als 1 Bakterien Stimmt s jetzt oder was? Binomialtest:

Mehr

Biostatistik, WS 2015/2016 Der zwei-stichproben-t-test

Biostatistik, WS 2015/2016 Der zwei-stichproben-t-test 1/29 Biostatistik, WS 2015/2016 Der zwei-stichproben-t-test (t-test für ungepaarte Stichproben) Matthias Birkner http://www.staff.uni-mainz.de/birkner/biostatistik1516/ 11.12.2015 2/29 Inhalt 1 t-test

Mehr

Mini-Skript Wahrscheinlichkeitstheorie und Statistik

Mini-Skript Wahrscheinlichkeitstheorie und Statistik Mini-Skript Wahrscheinlichkeitstheorie und Statistik Peter Bühlmann Georg Grafendorfer, Lukas Meier Inhaltsverzeichnis 1 Der Begriff der Wahrscheinlichkeit 1 1.1 Rechenregeln für Wahrscheinlichkeiten........................

Mehr

Jost Reinecke. 7. Juni 2005

Jost Reinecke. 7. Juni 2005 Universität Bielefeld 7. Juni 2005 Testtheorie Test für unabhängige Stichproben Test für abhängige Stichproben Testtheorie Die Testtheorie beinhaltet eine Reihe von Testverfahren, die sich mit der Überprüfung

Mehr

Willkommen zur Vorlesung Statistik (Master)

Willkommen zur Vorlesung Statistik (Master) Willkommen zur Vorlesung Statistik (Master) Thema dieser Vorlesung: Verteilungsfreie Verfahren Prof. Dr. Wolfgang Ludwig-Mayerhofer Universität Siegen Philosophische Fakultät, Seminar für Sozialwissenschaften

Mehr

8. Methoden der klassischen multivariaten Statistik

8. Methoden der klassischen multivariaten Statistik 8. Methoden der klassischen multivariaten Statistik 8.1. Darstellung von Daten Voraussetzungen auch in diesem Kapitel: Grundgesamtheit (Datenraum) Ω von Objekten (Fällen, Instanzen), denen J-Tupel von

Mehr

2. Korrelation, lineare Regression und multiple Regression

2. Korrelation, lineare Regression und multiple Regression multiple 2.2 Lineare 2.2 Lineare 1 / 130 2.2 Lineare 2 / 130 2.1 Beispiel: Arbeitsmotivation Untersuchung zur Motivation am Arbeitsplatz in einem Chemie-Konzern 25 Personen werden durch Arbeitsplatz zufällig

Mehr

Statistik im Versicherungs- und Finanzwesen

Statistik im Versicherungs- und Finanzwesen Springer Gabler PLUS Zusatzinformationen zu Medien von Springer Gabler Grimmer Statistik im Versicherungs- und Finanzwesen Eine anwendungsorientierte Einführung 2014 1. Auflage Übungsaufgaben zu Kapitel

Mehr

TESTEN VON HYPOTHESEN

TESTEN VON HYPOTHESEN TESTEN VON HYPOTHESEN 1. Beispiel: Kann ein neugeborenes Küken Körner erkennen oder lernt es dies erst durch Erfahrung? Um diese Frage zu entscheiden, wird folgendes Experiment geplant: Sobald das Küken

Mehr

Statistik I für Betriebswirte Vorlesung 5

Statistik I für Betriebswirte Vorlesung 5 Statistik I für Betriebswirte Vorlesung 5 PD Dr. Frank Heyde TU Bergakademie Freiberg Institut für Stochastik 07. Mai 2015 PD Dr. Frank Heyde Statistik I für Betriebswirte Vorlesung 5 1 Klassische Wahrscheinlichkeitsdefinition

Mehr

Auswertung mit dem Statistikprogramm SPSS: 30.11.05

Auswertung mit dem Statistikprogramm SPSS: 30.11.05 Auswertung mit dem Statistikprogramm SPSS: 30.11.05 Seite 1 Einführung SPSS Was ist eine Fragestellung? Beispiel Welche statistische Prozedur gehört zu welcher Hypothese? Statistische Berechnungen mit

Mehr

Statistik Musterlösungen

Statistik Musterlösungen Statistik Musterlösungen Regina Tüchler & Achim Zeileis Institut für Statistik & Mathematik Wirtschaftsuniversität Wien 1 Grundbegriffe (1.23) Skript Reaktionen auf Videofilm. Aussagen M, E, P, S h(m)

Mehr

90-minütige Klausur Statistik für Studierende der Kommunikationswissenschaft

90-minütige Klausur Statistik für Studierende der Kommunikationswissenschaft Prof. Dr. Helmut Küchenhoff SS08 90-minütige Klausur Statistik für Studierende der Kommunikationswissenschaft am 22.7.2008 Anmerkungen Überprüfen Sie bitte sofort, ob Ihre Angabe vollständig ist. Sie sollte

Mehr

Studiendesign/ Evaluierungsdesign

Studiendesign/ Evaluierungsdesign Jennifer Ziegert Studiendesign/ Evaluierungsdesign Praxisprojekt: Nutzerorientierte Evaluierung von Visualisierungen in Daffodil mittels Eyetracker Warum Studien /Evaluierungsdesign Das Design einer Untersuchung

Mehr

3. Der t-test. Der t-test

3. Der t-test. Der t-test Der t-test 3 3. Der t-test Dieses Kapitel beschäftigt sich mit einem grundlegenden statistischen Verfahren zur Auswertung erhobener Daten: dem t-test. Der t-test untersucht, ob sich zwei empirisch gefundene

Mehr

Mögliche Fehler beim Testen

Mögliche Fehler beim Testen Mögliche Fehler beim Testen Fehler. Art (Irrtumswahrscheinlichkeit α), Zusammenfassung: Die Nullhypothese wird verworfen, obwohl sie zutrifft. Wir haben uns blamiert, weil wir etwas Wahres abgelehnt haben.

Mehr

2.4 Hypothesentests Grundprinzipien statistischer Hypothesentests. Hypothese:

2.4 Hypothesentests Grundprinzipien statistischer Hypothesentests. Hypothese: 2.4.1 Grundprinzipien statistischer Hypothesentests Hypothese: Behauptung einer Tatsache, deren Überprüfung noch aussteht (Leutner in: Endruweit, Trommsdorff: Wörterbuch der Soziologie, 1989). Statistischer

Mehr

Kugel-Fächer-Modell. 1fach. 3fach. Für die Einzelkugel gibt es 3 Möglichkeiten. 6fach. 3! Möglichkeiten

Kugel-Fächer-Modell. 1fach. 3fach. Für die Einzelkugel gibt es 3 Möglichkeiten. 6fach. 3! Möglichkeiten Kugel-Fächer-Modell n Kugeln (Rosinen) sollen auf m Fächer (Brötchen) verteilt werden, zunächst 3 Kugeln auf 3 Fächer. 1fach 3fach Für die Einzelkugel gibt es 3 Möglichkeiten } 6fach 3! Möglichkeiten Es

Mehr

Monte-Carlo Simulation

Monte-Carlo Simulation Monte-Carlo Simulation Sehr häufig hängen wichtige Ergebnisse von unbekannten Werten wesentlich ab, für die man allerhöchstens statistische Daten hat oder für die man ein Modell der Wahrscheinlichkeitsrechnung

Mehr

25. Januar 2010. Ruhr-Universität Bochum. Methodenlehre III, WS 2009/2010. Prof. Dr. Holger Dette. 4. Multivariate Mittelwertvergleiche

25. Januar 2010. Ruhr-Universität Bochum. Methodenlehre III, WS 2009/2010. Prof. Dr. Holger Dette. 4. Multivariate Mittelwertvergleiche Ruhr-Universität Bochum 25. Januar 2010 1 / 75 2 / 75 4.1 Beispiel: Vergleich von verschiedenen Unterrichtsmethoden Zwei Zufallsstichproben (A und B) mit je 10 Schülern und 8 Schülern Gruppe A wird nach

Mehr

12.1 Wie funktioniert ein Signifikanztest?

12.1 Wie funktioniert ein Signifikanztest? Sedlmeier & Renkewitz Kapitel 12 Signifikanztests 12.1 Wie funktioniert ein Signifikanztest? Zentrales Ergebnis eine Signifikanztests: Wie wahrscheinlich war es unter der Bedingung dass H0 gilt, diesen

Mehr

Weiterbildungskurs Stochastik

Weiterbildungskurs Stochastik Hansruedi Künsch Seminar für Statistik Departement Mathematik, ETH Zürich 24. Juni 2009 Inhalt STATISTIK DER BINOMIALVERTEILUNG 1 STATISTIK DER BINOMIALVERTEILUNG 2 Fragestellungen Typische Fragestellungen

Mehr

Beispiel 48. 4.3.2 Zusammengesetzte Zufallsvariablen

Beispiel 48. 4.3.2 Zusammengesetzte Zufallsvariablen 4.3.2 Zusammengesetzte Zufallsvariablen Beispiel 48 Ein Würfel werde zweimal geworfen. X bzw. Y bezeichne die Augenzahl im ersten bzw. zweiten Wurf. Sei Z := X + Y die Summe der gewürfelten Augenzahlen.

Mehr

Wahrscheinlichkeitstheoretische Grundlagen für False Discovery Rate-kontrollierende multiple Testprozeduren

Wahrscheinlichkeitstheoretische Grundlagen für False Discovery Rate-kontrollierende multiple Testprozeduren Wahrscheinlichkeitstheoretische Grundlagen für False Discovery Rate-kontrollierende multiple Testprozeduren Thorsten Dickhaus Universität des Saarlandes, 06. Juli 2009 Übersicht Einführung: Multiples Testen

Mehr

Einführung in die statistische Datenanalyse I

Einführung in die statistische Datenanalyse I Einführung in die statistische Datenanalyse I Inhaltsverzeichnis 1. EINFÜHRUNG IN THEORIEGELEITETES WISSENSCHAFTLICHES ARBEITEN 2 2. KRITIERIEN ZUR AUSWAHL STATISTISCH METHODISCHER VERFAHREN 2 3. UNIVARIATE

Mehr

Welch-Test. Welch-Test

Welch-Test. Welch-Test Welch-Test Welch-Test Test auf Lageunterschied zweier normalverteilter Grundgesamtheiten mit unbekannten Varianzen durch Vergleich der Mittelwerte zweier unabhängiger Zufallsstichproben. Beispiel Im Labor

Mehr

Stichprobenauslegung. für stetige und binäre Datentypen

Stichprobenauslegung. für stetige und binäre Datentypen Stichprobenauslegung für stetige und binäre Datentypen Roadmap zu Stichproben Hypothese über das interessierende Merkmal aufstellen Stichprobe entnehmen Beobachtete Messwerte abbilden Schluss von der Beobachtung

Mehr

Data Mining: Einige Grundlagen aus der Stochastik

Data Mining: Einige Grundlagen aus der Stochastik Data Mining: Einige Grundlagen aus der Stochastik Hagen Knaf Studiengang Angewandte Mathematik Hochschule RheinMain 21. Oktober 2015 Vorwort Das vorliegende Skript enthält eine Zusammenfassung verschiedener

Mehr

6. METRISCHE UND KATEGORIALE MERKMALE

6. METRISCHE UND KATEGORIALE MERKMALE 6. METRISCHE UND KATEGORIALE MERKMALE wenn an einer Beobachtungseinheit eine (oder mehrere) metrische und eine (oder mehrere) kategoriale Variable(n) erhoben wurden Beispiel: Haushaltsarbeit von Teenagern

Mehr

Franz Kronthaler. Statistik angewandt. Datenanalyse ist (k)eine Kunst. Excel Edition. ^ Springer Spektrum

Franz Kronthaler. Statistik angewandt. Datenanalyse ist (k)eine Kunst. Excel Edition. ^ Springer Spektrum Franz Kronthaler Statistik angewandt Datenanalyse ist (k)eine Kunst Excel Edition ^ Springer Spektrum Inhaltsverzeichnis Teil I Basiswissen und Werkzeuge, um Statistik anzuwenden 1 Statistik ist Spaß 3

Mehr

Deduktive und induktive Aspekte statistischer Methoden

Deduktive und induktive Aspekte statistischer Methoden Deduktive und induktive Aspekte statistischer Methoden Wissenschaftshistorische und -philosophische Grundlagen Felix Günther Institut für Statistik Ludwig-Maximilians-Universität München Prof. Seising

Mehr

Tests in Kontingenztafeln

Tests in Kontingenztafeln Tests in Kontingenztafeln Der theoretische Phi-Koeffizient Der Phi-Koeffizient bei unabhängigen Zufallsvariablen Der Chiquadrat-Unabhängigkeitstest Der Chiquadrat-Unabhängigkeitstest in Vierfelder-Tafeln

Mehr

Regelmäßigkeit (Erkennen von Mustern und Zusammenhängen) versus Zufall

Regelmäßigkeit (Erkennen von Mustern und Zusammenhängen) versus Zufall Wahrscheinlichkeitstheorie Was will die Sozialwissenschaft damit? Regelmäßigkeit (Erkennen von Mustern und Zusammenhängen) versus Zufall Auch im Alltagsleben arbeiten wir mit Wahrscheinlichkeiten, besteigen

Mehr

q = 1 p = 0.8 0.2 k 0.8 10 k k = 0, 1,..., 10 1 1 0.8 2 + 10 0.2 0.8 + 10 9 1 2 0.22 1 = 0.8 8 [0.64 + 1.6 + 1.8] = 0.678

q = 1 p = 0.8 0.2 k 0.8 10 k k = 0, 1,..., 10 1 1 0.8 2 + 10 0.2 0.8 + 10 9 1 2 0.22 1 = 0.8 8 [0.64 + 1.6 + 1.8] = 0.678 Lösungsvorschläge zu Blatt 8 X binomialverteilt mit p = 0. und n = 10: a PX = = 10 q = 1 p = 0.8 0. 0.8 10 = 0, 1,..., 10 PX = PX = 0 + PX = 1 + PX = 10 10 = 0. 0 0.8 10 + 0. 1 0.8 9 + 0 1 10 = 0.8 8 [

Mehr

Scheinklausur Stochastik 1 für Studierende des Lehramts und der Diplom-Pädagogik

Scheinklausur Stochastik 1 für Studierende des Lehramts und der Diplom-Pädagogik Universität Karlsruhe (TH) Institut für Stochastik Dr. Bernhard Klar Dipl.-Math. oec. Volker Baumstark Name Vorname Matr.-Nr.: Scheinklausur Stochastik für Studierende des Lehramts und der Diplom-Pädagogik

Mehr

Übungsrunde 7, Gruppe 2 LVA 107.369, Übungsrunde 7, Gruppe 2, 28.11. Markus Nemetz, markus.nemetz@tuwien.ac.at, TU Wien, 11/2006

Übungsrunde 7, Gruppe 2 LVA 107.369, Übungsrunde 7, Gruppe 2, 28.11. Markus Nemetz, markus.nemetz@tuwien.ac.at, TU Wien, 11/2006 1 3.34 1.1 Angabe Übungsrunde 7, Gruppe 2 LVA 107.369, Übungsrunde 7, Gruppe 2, 28.11. Markus Nemetz, markus.nemetz@tuwien.ac.at, TU Wien, 11/2006 U sei auf dem Intervall (0, 1) uniform verteilt. Zeigen

Mehr

Fortgeschrittene Statistik Logistische Regression

Fortgeschrittene Statistik Logistische Regression Fortgeschrittene Statistik Logistische Regression O D D S, O D D S - R A T I O, L O G I T T R A N S F O R M A T I O N, I N T E R P R E T A T I O N V O N K O E F F I Z I E N T E N, L O G I S T I S C H E

Mehr

1 Von den Ereignissen U und V eines Zufallsexperiments kennt man die Eigenschaften (1) bis (3) :

1 Von den Ereignissen U und V eines Zufallsexperiments kennt man die Eigenschaften (1) bis (3) : Prof. Dr. E. Mammen SEMINAR FÜR STATISTIK Prof. Dr. H. Stenger UNIVERSITÄT MANNHEIM Vierstündige Klausur in statistischer Methodenlehre 9. Juli 003; 8:30 - :30 Zulässige Hilfsmittel: keine, insbesondere

Mehr

Abitur 2012 Mathematik GK Stochastik Aufgabe C1

Abitur 2012 Mathematik GK Stochastik Aufgabe C1 Seite 1 Abiturloesung.de - Abituraufgaben Abitur 2012 Mathematik GK Stochastik Aufgabe C1 nter einem Regentag verstehen Meteorologen einen Tag, an dem mehr als ein Liter Niederschlag pro Quadratmeter gefallen

Mehr

Prüfen von Mittelwertsunterschieden: t-test

Prüfen von Mittelwertsunterschieden: t-test Prüfen von Mittelwertsunterschieden: t-test Sven Garbade Fakultät für Angewandte Psychologie SRH Hochschule Heidelberg sven.garbade@hochschule-heidelberg.de Statistik 1 S. Garbade (SRH Heidelberg) t-test

Mehr

Klausur in Statistik VWA Essen

Klausur in Statistik VWA Essen Prof. Dr. Peter von der Lippe Klausur in Statistik VWA Essen neue Regelung (verkürzter Stoff) Bitte schreiben Sie hier Ihren Namen auf das Deckblatt. Bitte neben dieser Aufgabenstellung keine weitere Blätter

Mehr