I N F E R E N Z S T A T I S T I K Terminologie

Größe: px
Ab Seite anzeigen:

Download "I N F E R E N Z S T A T I S T I K Terminologie"

Transkript

1 Seite 1 von 70 I N F E R E N Z S T A T I S T I K Terminologie i.i.d. independent and identically distributed bedeutet, unabhängig und in gleicher Weise verteilt, d.h., der gleichen Verteilung unterworfen. Vorsicht! gleich verteilt ist nicht gleichverteilt! Modell Die Parameter einer Verteilung liegen in einer bestimmten Menge, entweder in der Nullhypothese oder in der Alternative H A. Nullhypothese, Alternative Wir stellen eine Vermutung auf, die Nullhypothese, deren Gültigkeit wir anhand von Daten mit einer gewissen Wahrscheinlichkeit, dem Signifikanzniveau, nicht verwerfen werden. Belegen die Daten diese Nullhypothese nicht, so verwerfen wir diese und die Alternative wird angenommen. Test Ein Test wird so gewählt, dass die Wahrscheinlichkeit des Fehlers 1. Art (die Irrtumswahrscheinlichkeit) gleich einem vorher bestimmten α ist. Ein Test ist umso besser, je kleiner der Fehler 2. Art, der β-fehler, bei gegebenen α ist.

2 Seite 2 von 70 Einseitige oder zweiseitige Alternativen Wir unterscheiden einseitige Alternativen (one-sided alternative) und zweiseitige Alternativen (two-sided alternative). Einseitige Alternativen enthalten Verteilungen mit Parametern aus einem Halbstrahl von Parameter ist größer oder kleiner als eine reelle Zahl., d.h., der zu bewertende Zweiseitige Alternativen enthalten Verteilungen mit Parametern aus zwei Halbstrahlen, d.h., der Parameter nimmt einen gewissen Wert an oder nicht. Teststatistik, Testgröße, Prüfgröße Die Testgröße (test statistic) ist eine aus den Daten gewonnene Größe, die typischerweise in der Nullhypothese klein, in der Alternative groß ist. Kritischer Wert, Annahmebereich, Ablehnbereich Der kritische Wert (critical value) ist jener Wert, mit dem die Testgröße verglichen wird, um über eine Ablehnung der Nullhypothese entscheiden zu können. Der oder die kritischen Werte bestimmen den Annahmebereich bzw. Ablehnbereich für die Nullhypothese. Irrtumswahrscheinlichkeit Im Zusammenhang des Testens unterscheidet man zwischen zwei verschiedenen Irrtumswahrscheinlichkeiten, i.e. der Fehler erster und zweiter Art.

3 Seite 3 von 70 Signifikanzniveau Unter der Annahme der Nullhypothese wird mit der Wahrscheinlichkeit in Höhe des Signifikanzniveaus die Nullhypothese nicht verworfen (1 - α). Alpha-Fehler, Fehler erster Art, falsch negativ Der Fehler der jene Fälle misst, in denen die Nullhypothese abgelehnt wird, obwohl sie richtig ist (Ablehnung falsch, α- Fehler, error of first kind, false negatives). Beta-Fehler, Fehler zweiter Art, falsch positiv Jener Wert, der misst, wenn die Nullhypothese nicht abgelehnt wird, obwohl sie falsch ist (Annahme falsch, β-fehler, error of second kind, false positives). Je kleiner der β-fehler ist, desto schärfer trennt der Test und H A (more powerful), desto größer ist die Macht oder Güte des Tests. Güte, Macht Die Güte oder Macht eines Tests (power function) gibt die Annahmewahrscheinlichkeit der Alternative unter Annahme der Alternativverteilung in Abhängigkeit vom Parameter der Alternativhypothese an. D.h., sie misst die Güte eines Tests. Je kleiner der β-fehler ist, desto schärfer trennt der Test und H A (more powerful), desto größer ist die Macht oder Güte des Tests.

4 Seite 4 von 70 Die Güte eines Tests nimmt auch zu, wenn eine größere Stichprobe genommen wird. Beim Übergang vom einseitigen zum zweiseitigem Test nimmt die Macht eines Tests ab, da der Annahmebereich der Teststatistik größer wird (es bleibt nur mehr α/2 statt α am Rand), somit wird β größer und damit (1 - β), die Macht des Tests, kleiner. OC-Kurve, Operationscharakteristik, Prüfplankurve Die OC-Kurve misst den β-fehler in Abhängigkeit von der Verteilung der Alternativhypothese. Sie wird als 1 - Güte berechnet. P-Wert, p-value Die kleinst-mögliche Irrtumswahrscheinlichkeit α, die zur Ablehnung von führt. Oder: Die Wahrscheinlichkeit, dass - falls die Nullhypothese zutrifft - eine Teststatistik größer oder gleich der Beobachteten vorkommt. Schätzer Der Mittelwert ist ein Schätzer für den Erwartungswert. Die Stichprobenvarianz ist ein Schätzer für die Varianz. Die relative Häufigkeit eines Ereignisses ist ein Schätzer für die Wahrscheinlichkeit p eines Ereignisses.

5 Seite 5 von 70 Punktschätzer, Intervallschätzer Aus einer gegebenen Stichprobe werden statistische Parameter geschätzt. D.h., wir nehmen an, dass wir die Verteilung der Grundgesamtheit kennen, und "schätzen" die Parameter aus der vorliegenden Stichprobe. Dabei unterscheiden wir Punktschätzer, d.h. ein "exakter" Wert wird berechnet und Intervallschätzer, d.h. wir schätzen ein Intervall, in das der zu berechnende statistische Parameter mit einer gewissen Wahrscheinlichkeit fällt. Diese Schätzer müssen natürlich konsistent sein, sie sollten erwartungstreu sein und effizient. Konsistenz Ein Schätzer bzw. Schätzwert muss konsistent sein, d.h., er muss umso genauer sein, je mehr Daten zur Verfügung stehen. In Formelschreibweise wird die Konsistenz folgendermaßen beschrieben: Erwartungstreu, unverzerrt, unbiased Ein Schätzwert für einen statistischen Parameter heißt erwartungstreu (unverzerrt, unbiased), falls Bemerkung: Für unverzerrte Schätzer gilt:

6 Seite 6 von 70 Beispiele für erwartungstreue Schätzer Der Mittelwert ist ein erwartungstreuer Schätzer für den Erwartungswert. Die Stichprobenvarianz ist ein erwartungstreuer Schätzer für die Varianz σ²,

7 Seite 7 von 70 Beispiel für einen nicht erwartungstreuen Schätzer Die Stichprobenvarianz ist der Maximum-Likelihood-Schätzer, der kein erwartungstreuer Schätzer für die Varianz σ² ist. Effizienz Seien und zwei erwartungstreue Schätzwerte. Falls für alle möglichen Parameter ist, heißt besser als. Der Schätzer mit der kleinsten Varianz heißt effizient. Irrtumswahrscheinlichkeit, α-fehler, Fehler 1. Art Die Irrtumswahrscheinlichkeit α gibt jene Wahrscheinlichkeit an, mit der eine statistische Aussage falsch sein kann.

8 Seite 8 von 70 Signifikanzniveau Das Signifikanzniveau (1 - α) gibt jene Wahrscheinlichkeit an, mit der eine statistische Aussage eintreten kann. Konfidenzintervall Ein für einen statistischen Parameter ermitteltes Intervall heißt Konfidenzbereich (confidence region) zum Signifikanz- Niveau (1 - α), falls für alle Parameter gilt: Der Konfidenzbereich (das Konfidenzintervall, der Intervallschätzer) überdeckt den wahren Parameter mit einer Wahrscheinlichkeit von mindestens (1 - α), wobei α die Irrtumswahrscheinlichkeit ist. Je nach Verwendung sprechen wir von Toleranz- oder von Prognose-Intervallen.

9 Seite 9 von 70 I N F E R E N Z S T A T I S T I K Methodik Punktschätzer Allgemein Wir schätzen einen statistischen Parameter aus einer vorliegenden Stichprobe, wobei wir die Verteilung der Grundgesamtheit als bekannt voraussetzen. Der "einfachste" Schätzer ist der Mittelwert einer Stichprobe als erwartungstreuer Schätzer für den Erwartungswert µ, d.h. Verteilungen eine "zentrale" Rolle.. Dieser spielt auch in allen Die Stichprobenvarianz ist ein erwartungstreuer Schätzer für die Varianz σ², ( siehe Inferenzstatistik - Terminologie - Erwartungstreue), d.h.

10 Seite 10 von 70 Maximum Likelihood Es ist das wichtigste Konstruktionsprinzip von Punktschätzern, es funktioniert aber nur dann, wenn die den Daten zugrundeliegende Verteilung bekannt ist. So ist etwa beim Würfeln bekannt, dass jede Augenzahl gleich wahrscheinlich ist. Aus der Warteschlangentheorie wissen wir, dass die Wartezeiten in einer Schlange exponentialverteilt sind. Beispiel: In einer Urne befinden sich n = 10 Kugeln, von denen eine unbekannte Anzahl schwarz und der Rest weiß ist. Die Wahrscheinlichkeit, eine schwarze Kugel zu ziehen sei p. Befinden sich k schwarze Kugeln in der Urne, so ist p = k/n, einer der Werte 0, 0.1, 0.2,, 0.9, 1. Um die Anzahl der schwarzen Kugeln zu schätzen, werden nacheinander 4 Kugeln mit Zurücklegen gezogen. Es werden 3 schwarze und 1 weiße Kugel gezogen. Die Likelihood dafür ist: L(p) = p 3 (1 - p). Was ist die plausibelste Anzahl k für den beobachteten Ausgang dieses Experiments? p L(p) Wir erhalten, dass der beobachtete Ausgang am ehesten eintritt, wenn sich 7 (oder 8) schwarze Kugeln in der Urne befinden. Das können wir auch direkt durch die Berechnung des Maximums von L(p) erhalten - L(p)nach p ableiten und Null setzen: L(p) = 3p² - 4p³ = 0 also p = 3/4

11 Seite 11 von 70 Notation / Formeln / Berechnungen Allgemeine Berechnung der Maximum-Likelihood Sei eine Familie von Dichten, wobei ein Parameter (oder Parametervektor) ist, der die Dichten näher bestimmt. Wir schreiben für die Wahrscheinlichkeit, für den Erwartungswert und für die Varianz. Da die Zufallsvariablen X i unabhängig sind, ist die gemeinsame Dichte gleich dem Produkt der einzelnen Dichten Vorgangsweise Setze die Daten in die Dichte ein Finde jenes, welches die Likelihood-Funktion

12 Seite 12 von 70 oder die Log-Likelihood maximiert (Logarithmieren von Dichten verändert die Lage des Maximums nicht, da der Logarithmus eine streng monoton wachsende Funktion ist und die Dichten positive Funktionen sind). ist nun der Maximum-Likelihood Schätzer von. Maximum-Likelihood Beispiel mit Parameter der Poissonverteilung Seien die X 1,, X n Poisson(λ)-verteilt. Die Wahrscheinlichkeitsfunktion ist Wir können nun das Maximum direkt ausrechnen, d.h., die Wahrscheinlichkeitsfunktion (Likelihood) maximieren. Einfacher kann das über die Log-Likelihood berechnet werden:

13 Seite 13 von 70 Wir erhalten den Schätzer durch Maximieren in λ, d.h., durch Differenzieren nach λ: Der Schätzer für den Parameter λ der Poissonverteilung: ist erwartungstreu, da

14 Seite 14 von 70 Maximum-Likelihood Beispiel mit Parameter der Normalverteilung Seien die Zufallsvariablen normalverteilt. Die Wahrscheinlichkeitsdichte Maximieren in µ und ergibt

15 Seite 15 von 70 Der obige ML-Schätzer ist nicht erwartungstreu! Maximum-Likelihood Beispiel mit Anteilswert einer Binomialverteilung Sei X eine binomialverteilte Zufallsvariable, X B(n, p). "Welche Wahrscheinlichkeit p ist am wahrscheinlichsten, wenn eine Anzahl x von Ausfällen des Experiments beobachtet wurde?" Die Likelihood

16 Seite 16 von 70 I N F E R E N Z S T A T I S T I K Methodik Intervallschätzer Allgemein Ein Punktschätzer eines Parameters alleine enthält noch keine Information über dessen Genauigkeit. Durch einen Intervallschätzer wird ein Unsicherheitsbereich angegeben, der als Maß für die Genauigkeit gelten kann, d.h. der geschätzte Parameter liegt mit einer gewissen Wahrscheinlichkeit in dem geschätzten Konfidenzintervall. Ein ermitteltes Intervall heißt Konfidenzbereich (confidence region) zum Niveau (1 - α), falls für alle Parameter gilt: Der Konfidenzbereich (das Konfidenzintervall, der Intervallschätzer) überdeckt den wahren Parameter mit einer Wahrscheinlichkeit von mindestens (1 - α). Dies ist das sogenannte Signifikanzniveau, α ist die Irrtumswahrscheinlichkeit. Achtung! Je sicherer wir ein Intervall angeben wollen, d.h. je kleiner wir α wählen, desto größer wird das Intervall, desto "ungenauer" also die Schätzung für den Parameter. Üblich:

17 Seite 17 von 70 Intervallschätzer für die Parameter der Normalverteilung Allgemein Die Normalverteilung N(µ, σ² ) wird durch zwei Parameter parametrisiert: Den Erwartungswert und die Varianz. Punktschätzer für Mittelwert und Stichprobenvarianz siehe Inferenzstatistik - Terminologie - Erwartungstreue Bei Intervallschätzer für den Mittelwert unterscheiden wir zwei Fälle: 1. Die Varianz wird als bekannt vorausgesetzt. 2. Die Varianz ist unbekannt, muss also auch aus der Stichprobe geschätzt werden. Mittelwert der Normalverteilung bei bekannter Varianz Voraussetzung: Statistik: Konfidenzintervall:

18 Seite 18 von 70 Stichprobenumfang: Wurde die Stichprobe mit Zurücklegen gezogen und ist wobei N die Größe der Grundgesamtheit ist, so wird mit einer Endlichkeitskorrektur versehen und wir verwenden statt Herleitung des Konfidenzintervalls Wir rechnen die Wahrscheinlichkeit in ein Konfidenzintervall um:

19 Seite 19 von 70 und erhalten Der Intervallschätzer kann auch kurz durch angegeben werden. Herleitung des Stichprobenumfangs Ein Konfidenzntervall der Länge L erhalten wir, wenn wir das Intervall betrachten. Daraus ergibt sich

20 Seite 20 von 70 und somit Herleitung der Verteilung des Mittelwertes Wir wollen zeigen, dass also Da ist, folgt und

21 Seite 21 von 70 Es wird auch oft die Bezeichnung verwendet. Wir haben also und daher folgt die Behauptung nach Standardisierung. Mittelwert der Normalverteilung bei unbekannter Varianz Voraussetzung:

22 Seite 22 von 70 Statistik: Konfidenzintervall: Stichprobenumfang: Bemerkung: Das n 0 in der Formel für den Stichprobenumfang ist nicht leicht zu ermitteln, der kritische t-wert kann aber bei großen Stichproben durch den entsprechenden Wert der Normalverteilung ersetzt werden. Wurde die Stichprobe mit Zurücklegen gezogen und ist, wobei N die Größe der Grundgesamtheit ist, so wird mit einer Endlichkeitskorrektur versehen und wir verwenden statt

23 Seite 23 von 70 Herleitung des Konfidenzintervalls Wir rechnen die Wahrscheinlichkeit in ein Konfidenzintervall um: und erhalten

24 Seite 24 von 70 Varianz der Normalverteilung Voraussetzung: Statistik: Konfidenzintervall: Herleitung des Konfidenzintervalls Ausgehend von berechnen wir das zugehörige Konfidenzintervall für σ² als

25 Seite 25 von 70 Intervallschätzer für die Differenz zweier Erwartungswerte Fallunterscheidungen Im Fall der Differenz der Erwartungswerte zweier normalverteilter Stichproben ist folgende Fallunterscheidung zu treffen: 1. Zwei unabhängige Stichproben liegen vor Es werden unabhängige Stichproben verglichen, die daher auch nicht dieselbe Anzahl von Merkmalsträgern, d.h., den selben Umfang, haben müssen. Wir unterscheiden hier mehrere Fälle: Die Varianzen sind bekannt Die Varianzen sind unbekannt Die unbekannten Varianzen sind gleich Die unbekannten Varianzen sind verschieden 2. Zwei abhängige Stichproben liegen vor Hierbei handelt es sich um sogenannte verbundene Stichproben, die Merkmalsträger (untersuchten Objekte) sind in beiden Stichproben identisch. Wir sprechen auch von sogenannten Vor-Nach-Vergleichen, d.h., die Ausprägungen eines Merkmals werden vor und nach einer Maßnahme bzw einem Ereignis untersucht. Die Stichproben müssen demnach auch gleich groß sein. Es wird die Differenz der Mittelwerte der Stichproben bzw. der Mittelwert d der gepaarten Differenzen d i der Zufallsvariablen X i und Y i, d i = X i - Y i, geschätzt. Wir gehen hierbei genau so vor, wie beim Schätzen des Mittelwerts einer normalverteilten Zufallsgröße.

26 Seite 26 von 70 Folgende Fälle werden unterschieden: Die Varianzen sind bekannt Die Varianzen sind unbekannt Unabhängige Stichproben mit bekannter Varianz Voraussetzung: Statistik: Konfidenzintervall:

27 Seite 27 von 70 Unabhängige Stichproben mit unbekannter und gleicher Varianz Voraussetzung: Statistik: Konfidenzintervall:

28 Seite 28 von 70 Unabhängige Stichproben mit unbekannter und verschiedener Varianz Voraussetzung: Statistik: Konfidenzintervall:

29 Seite 29 von 70 Abhängige Stichproben mit bekannter Varianz Voraussetzung: Statistik: Konfidenzintervall: Abhängige Stichproben mit unbekannter Varianz Voraussetzung:

30 Seite 30 von 70 Statistik: Konfidenzintervall: Intervallschätzer für Anteilswerte Herleitung des Konfidenzintervalls Voraussetzung: beobachten m Erfolge bei n Versuchen Statistik:

31 Seite 31 von 70 Konfidenzintervall: Stichprobenumfang: Herleitung des Konfidenzintervalles Nach Wahl des Signifikanzniveaus (1 - α) soll für die beobachteten m Erfolge bei n Versuchen gelten: Diese Wahrscheinlichkeit rechnen wir in ein Intervall für den Anteilswert p um Da das unbekannte p in den Intervallgrenzen vorkommt, muss es dort durch den Schätzwert ersetzt werden.

32 Seite 32 von 70 Also erhalten wir das exakte Konfidenzintervall Da dieses Konfidenzintervall auf einer Approximation beruht, hält es nur für große n das Niveau. Bemerkung 1 zum KI Da für Anteilswerte gilt, dass und auch stets wird auch oft das größere, aber schneller zu berechnende approximative Konfidenzintervall verwendet. Bemerkung 2 zum KI Eigentlich betrachten wir ein Binomial-Experiment, d.h., Ziehen mit Zurücklegen. Falls ist, kann die obige Approximation durch die Normalverteilung verwendet werden. Bei großen Grundgesamtheiten kann dieses Konfidenzintervall auch im Fall der hypergeometrischen Verteilung verwendet werden, d.h., bei einem Experiment ohne Zurücklegen.

33 Seite 33 von 70 Bemerkung 3 zum KI Die Wilson-Score-Methode gibt ein auch schon bei kleinen p besseres Intervall [p 1, p 2 ], das durch gegeben ist. Ebenso können die Pearson-Clopper Werte verwendet werden. Herleitung des Stichprobenumfangs Bei Umfragen und statistischen Analysen ist es von Interesse zu wissen, wie groß eine Stichprobe sein muss, um ein in einem gewissen Rahmen sicheres Ergebnis zu erreichen. Wir messen diese "Sicherheit" mit Hilfe der Größe des Konfidenzintervalls, d.h., wir wollen eine "maximale" Größe des Konfidenzintervalls vorgeben, und dann berechnen, wie groß die Stichprobe mindestens sein muss, um dieses Ergebnis mit einer vorgegebenen Signifikanz zu erzielen.

34 Seite 34 von 70 Sei nun die Länge des Konfidenzintervalls mit L festgelegt, d.h., eine Abweichung um um den geschätzten Anteilswert, so ist das Konfidenzintervall und hat also die vom Stichprobenumfang N L abhängige Länge Durch Umformen dieser Formel erhalten wir Beispiel zur Herleitung des Konfidenzintervalls und Stichprobenumfangs Vor einer Volksabstimmung erklären 316 von 1000 befragten Leuten mit Nein stimmen zu wollen. Wir suchen das 99%- Konfidenzintervall für den erwarteten Anteil p der Nein-Stimmen.

35 Seite 35 von 70 Antwort: Dies ergibt eine "Unsicherheit" von ± 3.75 Prozent. Wie viele Personen müssten befragt werden, wenn die Abweichung des Ergebnisses nur ± 1 Prozent betragen soll? Antwort (approximativ): Differenz zweier Anteilswerte Voraussetzung:

36 Seite 36 von 70 Statistik: Konfidenzintervall: Beispiel zur Differenz von Anteilswerten Vor Beginn einer Werbekampagne kennen von 1000 Befragten 120 Personen eine bestimmte Marke. Nach der Werbekampagne kennen 160 von 1000 Befragten eine bestimmte Marke.

37 Seite 37 von 70 Ein 99 % Konfidenzintervall für die Differenz der Anteile berechnet sich folgendermaßen: Ergebnis: Die Werbekampagne brachte "von keinen bis 8 %" Zuwachs absolut.

38 Seite 38 von 70 Testen I N F E R E N Z S T A T I S T I K Methodik Allgemein Beim Testen geht es darum, eine aufgestellte Hypothese (Nullhypothese) auf Gültigkeit zu testen oder diese anhand der vorliegenden Datenlage zu widerlegen, d.h. das wahrscheinliche Vorliegen einer Alternative nachzuweisen. Dazu stellen wir Modelle auf, legen eine Irrtumswahrscheinlichkeit fest und sammeln Daten, aus denen wir statistische Parameter schätzen. Liegen diese dann in einem Annahmebereich für die Nullhypothese, wird diese nicht verworfen, im anderen Fall sagen wir, die Alternative liegt vor, d.h., der geschätzte Parameter liegt im Ablehnbereich. Der Annahmebereich entspricht "in etwa" dem Konfidenzintervall des geschätzten statistischen Parameters. Zur Beurteilung der Sachlage wird eine Teststatistik, ein statistischer Vergleichswert aus den Daten berechnet (mit den geschätzten statistischen Parametern) und mit einem berechneten kritischen Wert der zugrunde liegenden Verteilung verglichen. Heute wird allerdings meist nur mehr der berechnete p-wert mit einer vorgegebenen Irrtumswahrscheinlichkeit verglichen. Einführende Beispiele Oft müssen zweiwertige Entscheidungen (Ja/Nein) getroffen werden. 1. Ein einfaches Beispiel liefert der Münzwurf, wo wir entscheiden müssen, ob eine Münze fair ist. Die Entscheidung sollte dabei nicht nach Gefühl getroffen werden, sondern durch Daten belegt sein. 2. Wo es beim Glücksspiel Münzwurf noch ohne Folgen ist (niemand muss spielen), geht es bei den elektronischen

39 Seite 39 von 70 Diebstahlsicherungen um "Volksvermögen": Am Ausgang eines Verkaufslokals wird durch eine Maschine geprüft, ob eine nicht bezahlte Ware mitgenommen wird oder nicht. Das heißt, es wird automatisch die Hypothese Ware vollständig bezahlt gegen die Alternative unbezahlte Ware vorhanden getestet. Da die vorliegende Information, die die Testvorrichtung erhält, zu gering ist, kann es zu Fehlentscheidungen kommen. Es können zwei Arten von Fehlern auftreten: Bezahlte Ware als nicht bezahlt gemeldet (Fehlalarm), wir nennen dies einen Fehler der 1. Art. Oder es tritt der (teure) Fehler Nicht bezahlte Ware nicht gemeldet auf, wir nennen dies einen Fehler der 2. Art. Solche Fehler können unter anderem auftreten, wenn an der Kasse der elektronische Streifen/Chip nicht oder nicht vollständig entwertet wird oder wenn etwa ein elektronisches Gerät (etwa ein Mobiltelefon) einen Alarm auslöst. Unsere Testvorrichtung nimmt nun einen konstanten Fehler der 1. Art in Kauf, während der Fehler 2. Art minimiert werden soll. 3. Im Bereich der medizinischen Diagnostik geht es um mehr als nur um Geld. Hier können Fehldiagnosen lebensbedrohliche Folgen für die PatientInnen haben. MedizinerInnen müssen entscheiden, ob bei einem/r PatientIn/en eine Krankheit vorliegt oder nicht. Als Hypothese wird hier das Vorliegen einer Krankheit angenommen. In der Medizin bezeichnen wir Kranke, die als gesund (nicht erkannte Kranke) diagnostiziert sind, als falsch negativ eingeordnete (Fehler 1. Art), Gesunde, die als krank eingestuft werden, als falsch positiv eingestufte. Beide Fehldiagnosen können mit folgenschweren Auswirkungen verbunden sein. Entscheidung für wahr ist wahr ist H A Nullhypothese 1 - α β, Fehler 2. Art, falsch negativ Alternative H A α, Fehler 1. Art, falsch positiv 1 - β, Macht

40 Seite 40 von 70 Folgende Graphik visualisiert die Verteilung unter der Null- und Alternativhypothese, die Fehler 1. und 2. Art, sowie die Güte des Tests (einseitig). Modellbildung 1. Umwandlung einer Fragestellung in eine wissenschaftliche Fragestellung Formulierung einer Nullhypothese H (null hypothesis) 0 Formulierung einer Alternative H (alternative hypothesis). A 2. Wahl einer Irrtumswahrscheinlichkeit α bzw. eines Signikanzniveaus (1 - α) (level of significance). Bemerkung: Von manchen Autoren wird auch α selbst fälschlicherweise als Signifikanzniveau bezeichnet - dies ist falsch!

41 Seite 41 von 70 Üblich sind: α = 0.05 Ökonomie, Soziologie α = 0.01 Biologie, Psychologie, Naturwissenschaften α = Medizin 3. Auswahl eines Tests, wobei zwischen parametrischen und nichtparametrischen Tests unterschieden wird. Beim parametrischen Test werden Grundannahmen über die Verteilung der Grundgesamtheit getroffen. 4. Berechnung der Teststatistik T und eines kritischen Werts (bei einseitigen Tests) bzw. der kritischen Werte (bei zweiseitigen Tests) und damit eines Ablehnbereichs (Menge A). D.h., finde einen Wertebereich für die Daten, welcher unter der Nullhypothese sehr unwahrscheinlich ist (P(A) α) und unter dem die Alternative viel wahrscheinlicher ist. 5. Sammle Daten. Als Generalvoraussetzung wird angenommen, dass es sich um eine Zufallsstichprobe handelt. Durch Randomisieren kann die Selektion verbessert werden. Stelle fest, ob die gesammelten Daten Anlass dazu geben, dass die Teststatistik in diesen Wertebereich (kritischer Bereich, Ablehnbereich) fällt oder nicht. Entweder wird dazu die Teststatistik mit den kritischen Werten c α bzw. c 1 - α in den einseitigen Fällen und c α/2 und c 1 - α/2 im zweiseitigen Fall verglichen, oder es wird der P-Wert (p-value, level attained, descriptive level) berechnet und die Nullhypothese abgelehnt, falls dieser kleiner als das vorher gewählte Niveau (α) ist! p < α: lehne ab, d.h., verwerfen. p α: lehne nicht ab, d.h., kann nicht verworfen werden, da die Daten nicht im Widerspruch zu stehen.

42 Seite 42 von 70 Berechnung des Kritischen Wertes Für die Teststatistik (Prüfgröße) T wird ein kritischer Wert bzw. werden zwei kritische Werte berechnet, die vom vorgegebenen Fehler 1. Art (α-fehler) abhängen. Es soll gelten Einseitig (i) Einseitig (ii) Zweiseitig gleichbedeutend mit: Für den Fall einseitig (i) gilt folgendes: Wird c 1 - α unterschritten, so kann die Nullhypothese nicht abgelehnt werden, bei Überschreitung wird das Vorliegen der Alternative H A als wahrscheinlicher angesehen. Analog werden die Entscheidungen im Fall einseitig (ii) und zweiseitig getroffen.

43 Seite 43 von 70 Berechnung der Güte und des β-fehlers Die Güte oder Macht eines Tests für den Parameter einer Verteilung (unter der Alternative) ist definiert als Einseitig (i) Einseitig (ii) Zweiseitig wobei T die gewählte Teststatistik (Prüfgröße), α die gewählte Irrtumswahrscheinlichkeit und c α der kritische Wert ist. heißt β-fehler, Operationscharakteristik, OC-Kurve oder Prüfplankurve. Beim Übergang vom einseitigen zum zweiseitigem Test nimmt die Macht eines Tests ab, da der kritische Wert der Teststatistik größer wird (einseitig (i): c 1-α c 1 - α/2 ) kleiner wird (einseitig (ii): c α c α/2 ) somit bleibt nur mehr α/2 statt α am Rand, daher wird β größer und damit (1 - β), die Macht des Tests, kleiner.

44 Seite 44 von 70 Beispiel zur Berechnung der Güte Wir berechnen nun die Güte eines Tests, d.h., was passiert, wenn unsere Annahme über den Mittelwert der Verteilung (µ 0 ) nicht stimmt. Die Güte eines Tests ist die Wahrscheinlichkeit unter der Alternativhypothese (mit Parameter µ A ), dass die Teststatistik in den Ablehnbereich fällt, wobei der Ablehnbereich wiederum von der Nullhypothese (mit Parameter µ 0 ) abhängt. Nehmen wir an, dass eine Grundgesamtheit normalverteilt ist mit unbekanntem Erwartungswert µ und bekannter Varianz σ x ². Die beiden Hypothesen lauten: Nullhypothese : µ 0 Alternativhypothese H A : µ > 0 In folgender Graphik sieht man, dass die Güte des Tests davon abhängt, welcher konkrete Wert für µ A eingesetzt wird.

45 Seite 45 von 70 Die Güte g(µ A ) mit der Formel

46 Seite 46 von 70 und der β-fehler mit oder berechnet sich also im Falle der Normalverteilung: wobei C 1 - α das (1 - α)-quantil der Normalverteilung mit Mittelwert µ 0 und Varianz σ x ² ist. Die Güte ist dann Test für den Mittelwert Einstichprobentest des Mittelwertes bei bekannter Varianz, Gauss-Test, Z-Test Wir haben eine i.i.d. N(µ, σ²)-verteilte Stichprobe vorliegen, und wollen testen, ob die Daten belegen, dass ein

47 Seite 47 von 70 Erwartungswert µ im Verhältnis zu einem µ 0 angenommen werden kann. Dazu wird der Mittelwert als Schätzer für den Erwartungswert aus den Daten berechnet, die Testgröße berechnet und je nach Nullhypothese mit den kritischen Werten, die sich aus der Normalverteilung ergeben, verglichen. Voraussetzung: σ² bekannt Testgröße: Einseitig (i) ablehnen, falls T > Φ -1 (1 - α) Einseitig (ii) ablehnen, falls T < Φ -1 (α) Zweiseitig ablehnen, falls T > Φ -1 (1 - α/2) Einstichprobentest des Mittelwertes bei unbekannter Varianz, t-test Der t-test ist der am häufigsten zitierte Test, aber Vorsicht: es gibt "mehrere" t-tests. Wir haben eine i.i.d. N(µ, σ²)-verteilte Stichprobe vorliegen, wobei allerdings die Varianz σ² nicht bekannt ist, also durch die

48 Seite 48 von 70 Stichprobenvarianz s² geschätzt werden muss. Es ergeben sich folgende Tests: Voraussetzung: σ² unbekannt Testgröße: Einseitig (i) ablehnen, falls T > t n - 1, 1 - α Einseitig (ii) ablehnen, falls T < t n - 1, α Zweiseitig ablehnen, falls T > t n - 1, 1 - α/2 Bemerkung Wenn die quadrierte Teststatistik T² berechnet wird, folgt diese einer F-Verteilung mit einem und (n - 1) Freiheitsgraden:

49 Seite 49 von 70 BEISPIEL KAFFEEAUTOMAT Ohne philosophische Diskussionen über Qualität von Kaffee in Abhängigkeit von der Wasser- oder Kaffeemenge beginnen zu wollen, stellen wir uns folgende zwei Situationen vor: Der Automat verspricht "Kaffeegenuss - Becherinhalt 0.2l" 1. Für KundInnen des Automaten sei es wichtig, dass mindestens diese versprochenen 0.2 Liter enthalten sind. Also setzen wir an: : Die durchschnittliche Befüllung beträgt mindestens 0.2l (µ 0.2). H A : Die durchschnittliche Befüllung beträgt weniger als 0.2l (µ < 0.2). 2. Für die anbietende Firma, vertreten durch einen Servicetechniker, ist es wichtig, dass diese Füllmenge von 0.2 Litern ziemlich genau getroffen wird, um eine kalkulierbare Wartung durchführen zu können (Nachfüllen etc.), nicht zu viel zu verbrauchen, aber auch nicht "schlechtere" Qualität anzubieten und damit die KundInnen zu verärgern. Also setzen wir an:

50 Seite 50 von 70 : Die durchschnittliche Befüllung beträgt genau 0.2l (µ = 0.2). H A : Die durchschnittliche Befüllung beträgt nicht 0.2l (µ 0.2). Unter der Annahme, dass die Daten der Stichprobe unabhängig normalverteilt sind und aus einer normalverteilten Grundgesamtheit stammen, berechnen wir die Teststatistik T zu Wir haben die Irrtumswahrscheinlichkeit α mit 10% festgelegt und berechnen nun für beide Fälle die kritischen Werte.

51 Seite 51 von 70 Fall 1 Wir haben eine einseitige Nullhypothese, daher müssen wir das (untere) 10%-Quantil berechnen und erhalten den kritischen Wert t 0.1; 9 = Fall 2 Es liegt ein zweiseitiger Test vor, d.h., die 10% Fehler teilen sich in je 5% oberer und 5% unterer Fehler, und da die Dichte der t-verteilung symmetrisch um 0 ist, gilt: t 0.95; 9 = -t 0.05; 9 = Deshalb kommen wir zu folgenden Ergebnissen: Im ersten Fall wird die Nullhypothese abgelehnt, da die Teststatistik kleiner als der kritische Wert (-1,38) ist. Die durchschnittliche Füllmenge wird als zu gering eingeschätzt. Im zweiten Fall liegt die Teststatistik zwischen den beiden kritischen Werten bzw. es gilt T < 1.83, d.h., der Servicetechniker meldet, dass der Kaffeeautomat richtig eingestellt ist. Aus den berechneten Daten können wir die Annahme- und Ablehnbereiche sowohl der standardisierten Teststatistiken berechen also auch jene für die mittlere Füllmenge.

52 Seite 52 von 70 Teststatistik Annahmebereich Ablehnbereich Fall Fall Diese Werte können in tatsächliche Werte für den Messbereich umgerechnet werden, indem wir die Standardisierung zurückrechnen, d.h., die Intervallgrenzen a erhalten wir aus: und somit ergeben sich folgende Intervalle mittlere Füllmenge Annahmebereich Ablehnbereich Fall Fall Test für die Differenz zweier Mittelwerte Fallunterscheidungen Hier haben wir, genau so wie beim Schätzen, Fallunterscheidungen vorzunehmen.

53 Seite 53 von Zwei unabhängige Stichproben liegen vor Wir unterscheiden hier mehrere Fälle: Die Varianzen sind bekannt Die Varianzen sind unbekannt unbekannt aber gleich unbekannt und verschieden 2. Zwei abhängige Stichproben liegen vor Bei verbundenen Stichproben gehen wir von zwei abhängigen (gepaarten, verbundenen) Stichproben aus. Die Werte werden an identischen Entitäten (Merkmalsträgern) gemessen, wie etwa bei Vor-Nach-Vergleichen. Die Differenzen D i = Y i - X i werden dann wie im Einstichprobentest für Mittelwerte behandelt, d.h., entweder der Einstichprobentest des Mittelwerts bei bekannter Varianz oder der t-test für den Mittelwert, sollte die Varianz nicht bekannt sein. Folgende Fälle werden unterschieden: Die Varianzen sind bekannt Die Varianzen sind unbekannt Unabhängige Stichproben mit bekannter Varianz Zweistichproben t-test (Differenz der Mittel bei bekannten Varianzen) Sind die Varianzen der beiden unabhängigen und normalverteilten Stichproben bekannt, so ergeben sich folgende Tests: Voraussetzung:

54 Seite 54 von 70 X i, Y i unabhängig σ X und σ Y bekannt Testgröße: Einseitig (i) ablehnen, falls T > Φ -1 (1 - α) Bei der Differenz (µ X - µ Y ) = D ergeben sich foglende Testprobleme: Einseitig (ii) ablehnen, falls T < Φ -1 (α) Zweiseitig ablehnen, falls T > Φ -1 (1 - α/2) Unabhängige Stichproben mit unbekannter und gleicher Varianz Sind die Varianzen der beiden Stichproben nicht bekannt, können aber als gleich vorausgesetzt werden, so muss diese Varianz aus den Stichproben geschätzt werden. Es ergeben sich dann folgende Tests:

55 Seite 55 von 70 Voraussetzung: X i, Y i unabhängig σ X und σ Y unbekannt, aber gleich für beide Stichproben Testgröße: wobei Bei der Differenz (µ X - µ Y ) = D ergeben sich foglende Testprobleme: Einseitig (i) ablehnen, falls T > t n + m - 2; 1 - α Einseitig (ii) ablehnen, falls T < t n + m - 2; α Zweiseitig ablehnen, falls T > t n + m - 2; 1 - α/2

56 Seite 56 von 70 Unabhängige Stichproben mit unbekannter und ungleicher Varianz Voraussetzung: X i, Y i unabhängig σ X und σ Y unbekannt und nicht gleich in den beiden Stichproben Testgröße: ist approximativ t-verteilt, wobei die Freiheitsgrade v berechnet werden aus Bei der Differenz (µ X - µ Y ) = D ergeben sich foglende Testprobleme: Einseitig (i) ablehnen, falls T > t v; 1 - α

57 Seite 57 von 70 Einseitig (ii) ablehnen, falls T < t v; α Zweiseitig ablehnen, falls T > t v; 1 - α/2 Abhängige Stichproben mit bekannter Varianz Voraussetzung: σ X ², σ Y ² und σ X, Y bekannt Testgröße: wobei Einseitig (i)

58 Seite 58 von 70 ablehnen, falls T > Φ -1 (1 - α) Einseitig (ii) ablehnen, falls T < Φ -1 (α) Zweiseitig ablehnen, falls T > Φ -1 (1 - α/2) Abhängige Stichproben mit unbekannter Varianz Voraussetzung: σ X ², σ Y ² sind unbekannt Testgröße: wobei Einseitig (i)

59 Seite 59 von 70 ablehnen, falls T > t n - 1; 1 - α Einseitig (ii) ablehnen, falls T < t n - 1; α Zweiseitig ablehnen, falls T > t n - 1; 1 - α/2 BEISPIEL Verbundene Stichproben Wir wollen die Wirkung einer Diätkur testen. Gewicht vor Diätkur (X) Gewicht nach Diätkur (Y) Differenzen D i Die Differenzen werden einseitig auf Mittelwert 0 getestet, d.h., wir wollen wissen, ob die Kur eine signifikante Wirkung gehabt hat, mit einem α-fehler von 1%. Wir haben also : µ D 0 und H A : µ D < 0. Händische Analyse

60 Seite 60 von 70 Da T > t 4; 0.01 = kann nicht abgelehnt werden, d.h., es ist keine statistisch signifikante Wirkung der Diätkur nachweisbar. Analyse in R Programmtext von R für Dateneingabe und einen einseitigen, gepaarten Test, also einen Zweistichprobentest. x <- c(73,85,68,90,77) y <- c(72,81,70,82,73) d <- y - x t.test(y, x, alternative = c("less"), mu = 0, paired = TRUE, var.equal = FALSE, conf.level = 0.99) # Output: Paired t-test data: y and x t = , df = 4, p-value = alternative hypothesis: true difference in means is less than 0 99 percent confidence interval: -Inf sample estimates: mean of the differences -3

61 Seite 61 von 70 Hier der Programmtext von R für den entsprechenden Einstichprobentest t.test(d, alternative = c("less"), mu = 0, conf.level = 0.99) # Output: One Sample t-test data: d t = , df = 4, p-value = alternative hypothesis: true mean is less than 0 99 percent confidence interval: -Inf sample estimates: mean of x -3 Wir sehen, dass die Ergebnisse identisch sind. Analyse in MS-Excel Hier gibt es nur den gepaarten Zweistichproben t-test.

62 Seite 62 von 70 Testen von Anteilswerten Anteilswerte Test des Anteilswertes p einer B(n, p)-verteilung Voraussetzung: Testgröße:

63 Seite 63 von 70 wobei m die Anzahl der Versuche ist, bei denen das Ereignis von Interesse eingetreten ist. Einseitig (i) ablehnen, falls T > Φ -1 (1 - α) Einseitig (ii) ablehnen, falls T < Φ -1 (α) Zweiseitig ablehnen, falls T > Φ -1 (1 - α/2) Es gilt: Ist X N(0,1)-verteilt, so ist X² -verteilt.

64 Seite 64 von 70 Testen von Varianzen Einstichprobentest der Varianz Voraussetzung: Testgröße: bzw. wobei Einseitig (i) ablehnen, falls T² > Einseitig (ii) ablehnen, falls T² <

65 Seite 65 von 70 Zweiseitig ablehnen, falls T² < oder falls T² > Wichtig: Die obige Teststatistik T ist nur dann -verteilt, wenn µ unbekannt ist, ansonsten -verteilt. Beispiel Einstichprobentest der Varianz Beispiel Toleranzen bei Lagerwellen Wellen eines Lagers sollen eine Toleranz vom Sollwert σ 0 ² = 0.01 bei µ = 3.3 haben. Wir wollen eine Produktionscharge mit α = 0.05 anhand einer Stichprobe testen und erhalten folgende Daten: Der Mittelwert ist somit. Die beiden Hypothesen lauten: : σ² 0.01 und H A : σ² > 0.01

66 Seite 66 von 70 Da muss auf dem 5%-Fehlerniveau abgelehnt werden, d.h., die Varianz - und damit die Toleranz - ist signifikant größer als Die Produktionsmaschinen müssen daher neu eingestellt werden. Vergleich zweier Varianzen bei unabhängigen Stichproben Voraussetzung: Testgröße: wobei

67 Seite 67 von 70 Einseitig (i) ablehnen, falls T > F n - 1, m - 1; 1 - α Einseitig (ii) ablehnen, falls T < F n - 1, m - 1; α Zweiseitig ablehnen, falls T > F n - 1, m - 1; 1 - α/2 Bemerkung Für die Vertauschung der beiden Freiheitsgrade (Parameter) der F-Verteilung gilt: Die Verteilung der Teststatistik T kann aus Folgendem abgeleitet werden: Wir wissen, dass

68 Seite 68 von 70 -verteilt mit (n - 1) Freiheitsgraden ist. Wenn wir nun zwei -verteilte Zufallsvariablen X und Y haben, so kann gezeigt werden, dass nach der F-Verteilung F(n, m) verteilt ist. Beispiel Vergleich zweier Varianzen Beispiel Vergleich zweier Toleranzen Wir wollen die Produktion zweier Maschinen auf ihre Genauigkeit testen, indem wir die Toleranzen bei den produzierten Werkstücken testen, bei einem zulässigen Fehler von α = Stichprobe X i : Stichprobe Y i :

69 Seite 69 von 70 Da kann bei α = 0.01 nicht abgelehnt werden, d.h., die beiden Varianzen (Toleranzen) sind nicht signifikant verschieden, die beiden Maschinen arbeiten daher in demselben Normbereich. Vergleich zweier Varianzen bei abhängigen Stichproben Für den Test des unbekannten Streuungsparameters σ D ² der gepaarten Differenzen zweier abhängiger Meßreihen gilt folgendes: Voraussetzung: Testgröße:

70 Seite 70 von 70 bzw. falls µ X und µ Y bekannt sind. Wobei D i = X i - Y i und Einseitig (i) ablehnen, falls T² > Einseitig (ii) ablehnen, falls T² < Zweiseitig ablehnen, falls T² < oder falls T² >

9. Schätzen und Testen bei unbekannter Varianz

9. Schätzen und Testen bei unbekannter Varianz 9. Schätzen und Testen bei unbekannter Varianz Dr. Antje Kiesel Institut für Angewandte Mathematik WS 2011/2012 Schätzen und Testen bei unbekannter Varianz Wenn wir die Standardabweichung σ nicht kennen,

Mehr

Statistische Auswertung der Daten von Blatt 13

Statistische Auswertung der Daten von Blatt 13 Statistische Auswertung der Daten von Blatt 13 Problemstellung 1 Graphische Darstellung der Daten 1 Diskussion der Normalverteilung 3 Mittelwerte und deren Konfidenzbereiche 3 Signifikanz der Behandlung

Mehr

Biostatistik, WS 2015/2016 Der zwei-stichproben-t-test

Biostatistik, WS 2015/2016 Der zwei-stichproben-t-test 1/29 Biostatistik, WS 2015/2016 Der zwei-stichproben-t-test (t-test für ungepaarte Stichproben) Matthias Birkner http://www.staff.uni-mainz.de/birkner/biostatistik1516/ 11.12.2015 2/29 Inhalt 1 t-test

Mehr

Eine Einführung in R: Statistische Tests

Eine Einführung in R: Statistische Tests Eine Einführung in R: Statistische Tests Bernd Klaus, Verena Zuber Institut für Medizinische Informatik, Statistik und Epidemiologie (IMISE), Universität Leipzig http://www.uni-leipzig.de/ zuber/teaching/ws12/r-kurs/

Mehr

Güte von Tests. die Wahrscheinlichkeit für den Fehler 2. Art bei der Testentscheidung, nämlich. falsch ist. Darauf haben wir bereits im Kapitel über

Güte von Tests. die Wahrscheinlichkeit für den Fehler 2. Art bei der Testentscheidung, nämlich. falsch ist. Darauf haben wir bereits im Kapitel über Güte von s Grundlegendes zum Konzept der Güte Ableitung der Gütefunktion des Gauss im Einstichprobenproblem Grafische Darstellung der Gütefunktionen des Gauss im Einstichprobenproblem Ableitung der Gütefunktion

Mehr

5. Schließende Statistik. 5.1. Einführung

5. Schließende Statistik. 5.1. Einführung 5. Schließende Statistik 5.1. Einführung Sollen auf der Basis von empirischen Untersuchungen (Daten) Erkenntnisse gewonnen und Entscheidungen gefällt werden, sind die Methoden der Statistik einzusetzen.

Mehr

Klausur Statistik Lösungshinweise

Klausur Statistik Lösungshinweise Klausur Statistik Lösungshinweise Prüfungsdatum: 1. Juli 2015 Prüfer: Etschberger, Heiden, Jansen Studiengang: IM und BW Aufgabe 1 14 Punkte Ein Freund von Ihnen hat über einen Teil seiner Daten, die er

Mehr

Aufgabe 1 10 ECTS. y i x j gering mittel hoch n i Hausrat 200 25 0 225 KFZ 0 10 75 85 Unfall 20 35 90 145 Reiserücktritt 40 5 0 45 n j 260 75 165 500

Aufgabe 1 10 ECTS. y i x j gering mittel hoch n i Hausrat 200 25 0 225 KFZ 0 10 75 85 Unfall 20 35 90 145 Reiserücktritt 40 5 0 45 n j 260 75 165 500 Aufgabe 1 Für die Securance-Versicherung liegen Ihnen die gemeinsamen absoluten Häugkeiten der Merkmale X: Schadenshöhe und Y : Versicherungsart für die letzten 500 gemeldeten Schäden vor. 1. Interpretieren

Mehr

Grundlagen der Inferenzstatistik: Was Ihnen nicht erspart bleibt!

Grundlagen der Inferenzstatistik: Was Ihnen nicht erspart bleibt! Grundlagen der Inferenzstatistik: Was Ihnen nicht erspart bleibt! 1 Einführung 2 Wahrscheinlichkeiten kurz gefasst 3 Zufallsvariablen und Verteilungen 4 Theoretische Verteilungen (Wahrscheinlichkeitsfunktion)

Mehr

Einführung in die Statistik für Wirtschaftswissenschaftler für Betriebswirtschaft und Internationales Management

Einführung in die Statistik für Wirtschaftswissenschaftler für Betriebswirtschaft und Internationales Management Einführung in die Statistik für Wirtschaftswissenschaftler für Betriebswirtschaft und Internationales Management Sommersemester 2013 Hochschule Augsburg : Gliederung 1 Einführung 2 Deskriptive Statistik

Mehr

Übungsaufgaben zu Kapitel 5. Aufgabe 101. Inhaltsverzeichnis:

Übungsaufgaben zu Kapitel 5. Aufgabe 101. Inhaltsverzeichnis: Inhaltsverzeichnis: Übungsaufgaben zu Kapitel 5... 1 Aufgabe 101... 1 Aufgabe 102... 2 Aufgabe 103... 2 Aufgabe 104... 2 Aufgabe 105... 3 Aufgabe 106... 3 Aufgabe 107... 3 Aufgabe 108... 4 Aufgabe 109...

Mehr

9. StatistischeTests. 9.1 Konzeption

9. StatistischeTests. 9.1 Konzeption 9. StatistischeTests 9.1 Konzeption Statistische Tests dienen zur Überprüfung von Hypothesen über einen Parameter der Grundgesamtheit (bei einem Ein-Stichproben-Test) oder über die Verteilung einer Zufallsvariablen

Mehr

DIPLOMVORPRÜFUNG GRUNDZÜGE DER STATISTIK, TEIL B WINTERSEMESTER 2006/07 28.02.2007

DIPLOMVORPRÜFUNG GRUNDZÜGE DER STATISTIK, TEIL B WINTERSEMESTER 2006/07 28.02.2007 Wirtschaftswissenschaftliches Prüfungsamt DIPLOMVORPRÜFUNG GRUNDZÜGE DER STATISTIK, TEIL B WINTERSEMESTER 006/07 8.0.007 Lösung Prof. Dr. R Friedmann / Dr. R. Hauser Hinweise für die Klausurteilnehmer

Mehr

Klausur: Einführung in die Statistik

Klausur: Einführung in die Statistik 1 Lösungen immer unter die jeweiligen Aufgaben schreiben. Bei Platzmangel auf die Rückseite schreiben (dann Nummer der bearbeiteten Aufgabe mit anmerken!!!). Lösungen, die nicht auf den Aufgabenblättern

Mehr

14.01.14 DAS THEMA: INFERENZSTATISTIK II. Standardfehler Konfidenzintervalle Signifikanztests. Standardfehler

14.01.14 DAS THEMA: INFERENZSTATISTIK II. Standardfehler Konfidenzintervalle Signifikanztests. Standardfehler DAS THEMA: INFERENZSTATISTIK II INFERENZSTATISTISCHE AUSSAGEN Standardfehler Konfidenzintervalle Signifikanztests Standardfehler der Standardfehler Interpretation Verwendung 1 ZUR WIEDERHOLUNG... Ausgangspunkt:

Mehr

Klausur zu Methoden der Statistik II (mit Kurzlösung) Wintersemester 2010/2011. Aufgabe 1

Klausur zu Methoden der Statistik II (mit Kurzlösung) Wintersemester 2010/2011. Aufgabe 1 Lehrstuhl für Statistik und Ökonometrie der Otto-Friedrich-Universität Bamberg Prof. Dr. Susanne Rässler Klausur zu Methoden der Statistik II (mit Kurzlösung) Wintersemester 2010/2011 Aufgabe 1 Nach einer

Mehr

Wahrscheinlichkeitsrechnung und Statistik für Biologen 5. Der zwei-stichproben-t-test. und der Wilcoxon-Test

Wahrscheinlichkeitsrechnung und Statistik für Biologen 5. Der zwei-stichproben-t-test. und der Wilcoxon-Test Wahrscheinlichkeitsrechnung und Statistik für Biologen 5. Der zwei-stichproben-t-test (t-test für ungepaarte Stichproben) und der Wilcoxon-Test Dirk Metzler 22. Mai 2015 Inhaltsverzeichnis 1 Wiederholung:

Mehr

P X =3 = 2 36 P X =5 = 4 P X =6 = 5 36 P X =8 = 5 36 P X =9 = 4 P X =10 = 3 36 P X =11 = 2 36 P X =12 = 1

P X =3 = 2 36 P X =5 = 4 P X =6 = 5 36 P X =8 = 5 36 P X =9 = 4 P X =10 = 3 36 P X =11 = 2 36 P X =12 = 1 Übungen zur Stochastik - Lösungen 1. Ein Glücksrad ist in 3 kongruente Segmente aufgeteilt. Jedes Segment wird mit genau einer Zahl beschriftet, zwei Segmente mit der Zahl 0 und ein Segment mit der Zahl

Mehr

Ein möglicher Unterrichtsgang

Ein möglicher Unterrichtsgang Ein möglicher Unterrichtsgang. Wiederholung: Bernoulli Experiment und Binomialverteilung Da der sichere Umgang mit der Binomialverteilung, auch der Umgang mit dem GTR und den Diagrammen, eine notwendige

Mehr

Bei vielen Zufallsexperimenten interessiert man sich lediglich für das Eintreten bzw. das Nichteintreten eines bestimmten Ereignisses.

Bei vielen Zufallsexperimenten interessiert man sich lediglich für das Eintreten bzw. das Nichteintreten eines bestimmten Ereignisses. XI. Binomialverteilung ================================================================== 11.1 Definitionen -----------------------------------------------------------------------------------------------------------------

Mehr

Willkommen zur Vorlesung Statistik (Master)

Willkommen zur Vorlesung Statistik (Master) Willkommen zur Vorlesung Statistik (Master) Thema dieser Vorlesung: Verteilungsfreie Verfahren Prof. Dr. Wolfgang Ludwig-Mayerhofer Universität Siegen Philosophische Fakultät, Seminar für Sozialwissenschaften

Mehr

METHODENLEHRE I WS 2013/14 THOMAS SCHÄFER

METHODENLEHRE I WS 2013/14 THOMAS SCHÄFER METHODENLEHRE I WS 2013/14 THOMAS SCHÄFER DAS THEMA: INFERENZSTATISTIK IV INFERENZSTATISTISCHE AUSSAGEN FÜR ZUSAMMENHÄNGE UND UNTERSCHIEDE Inferenzstatistik für Zusammenhänge Inferenzstatistik für Unterschiede

Mehr

Statistik im Versicherungs- und Finanzwesen

Statistik im Versicherungs- und Finanzwesen Springer Gabler PLUS Zusatzinformationen zu Medien von Springer Gabler Grimmer Statistik im Versicherungs- und Finanzwesen Eine anwendungsorientierte Einführung 2014 1. Auflage Übungsaufgaben zu Kapitel

Mehr

Box-and-Whisker Plot -0,2 0,8 1,8 2,8 3,8 4,8

Box-and-Whisker Plot -0,2 0,8 1,8 2,8 3,8 4,8 . Aufgabe: Für zwei verschiedene Aktien wurde der relative Kurszuwachs (in % beobachtet. Aus den jeweils 20 Quartaldaten ergaben sich die folgenden Box-Plots. Box-and-Whisker Plot Aktie Aktie 2-0,2 0,8,8

Mehr

90-minütige Klausur Statistik für Studierende der Kommunikationswissenschaft

90-minütige Klausur Statistik für Studierende der Kommunikationswissenschaft Prof. Dr. Helmut Küchenhoff SS08 90-minütige Klausur Statistik für Studierende der Kommunikationswissenschaft am 22.7.2008 Anmerkungen Überprüfen Sie bitte sofort, ob Ihre Angabe vollständig ist. Sie sollte

Mehr

R-WORKSHOP II. Inferenzstatistik. Johannes Pfeffer

R-WORKSHOP II. Inferenzstatistik. Johannes Pfeffer R-WORKSHOP II Inferenzstatistik Johannes Pfeffer Dresden, 25.1.2011 01 Outline Lösung der Übungsaufgabe Selbstdefinierte Funktionen Inferenzstatistik t-test Kruskal-Wallis Test Übungsaufgabe TU Dresden,

Mehr

Prüfen von Mittelwertsunterschieden: t-test

Prüfen von Mittelwertsunterschieden: t-test Prüfen von Mittelwertsunterschieden: t-test Sven Garbade Fakultät für Angewandte Psychologie SRH Hochschule Heidelberg sven.garbade@hochschule-heidelberg.de Statistik 1 S. Garbade (SRH Heidelberg) t-test

Mehr

1 Statistische Grundlagen

1 Statistische Grundlagen Konzepte in Empirische Ökonomie 1 (Winter) Hier findest Du ein paar Tipps zu den Konzepten in Empirische 1. Wenn Du aber noch etwas Unterstützung kurz vor der Klausur brauchst, schreib uns eine kurze Email.

Mehr

Kapitel 3. Zufallsvariable. Wahrscheinlichkeitsfunktion, Dichte und Verteilungsfunktion. Erwartungswert, Varianz und Standardabweichung

Kapitel 3. Zufallsvariable. Wahrscheinlichkeitsfunktion, Dichte und Verteilungsfunktion. Erwartungswert, Varianz und Standardabweichung Kapitel 3 Zufallsvariable Josef Leydold c 2006 Mathematische Methoden III Zufallsvariable 1 / 43 Lernziele Diskrete und stetige Zufallsvariable Wahrscheinlichkeitsfunktion, Dichte und Verteilungsfunktion

Mehr

Klausur zur Vorlesung Statistik III für Studenten mit dem Wahlfach Statistik

Klausur zur Vorlesung Statistik III für Studenten mit dem Wahlfach Statistik Ludwig Fahrmeir, Nora Fenske Institut für Statistik Bitte für die Korrektur freilassen! Aufgabe 1 2 3 4 Punkte Klausur zur Vorlesung Statistik III für Studenten mit dem Wahlfach Statistik 29. März 21 Hinweise:

Mehr

Versuchsplanung. Teil 1 Einführung und Grundlagen. Dr. Tobias Kiesling <kiesling@stat.uni-muenchen.de> Einführung in die Versuchsplanung

Versuchsplanung. Teil 1 Einführung und Grundlagen. Dr. Tobias Kiesling <kiesling@stat.uni-muenchen.de> Einführung in die Versuchsplanung Versuchsplanung Teil 1 Einführung und Grundlagen Dr. Tobias Kiesling Inhalt Einführung in die Versuchsplanung Hintergründe Grundlegende Prinzipien und Begriffe Vorgehensweise

Mehr

Gibt es einen Geschmacksunterschied zwischen Coca Cola und Cola Zero?

Gibt es einen Geschmacksunterschied zwischen Coca Cola und Cola Zero? Gibt es einen Geschmacksunterschied zwischen Coca Cola und Cola Zero? Manche sagen: Ja, manche sagen: Nein Wie soll man das objektiv feststellen? Kann man Geschmack objektiv messen? - Geschmack ist subjektiv

Mehr

Von der Untersuchungsfrage zu statistischen Hypothesen, und wie war das nochmal mit dem α- und

Von der Untersuchungsfrage zu statistischen Hypothesen, und wie war das nochmal mit dem α- und Von der Untersuchungsfrage zu statistischen Hypothesen, und wie war das nochmal mit dem α- und β-fehler? Sven Garbade Fakultät für Angewandte Psychologie SRH Hochschule Heidelberg sven.garbade@hochschule-heidelberg.de

Mehr

27. Statistische Tests für Parameter. Was ist ein statistischer Test?

27. Statistische Tests für Parameter. Was ist ein statistischer Test? 27. Statistische Tests für Parameter Wenn du eine weise Antwort verlangst, musst du vernünftig fragen Was ist ein statistischer Test? Ein statistischen Test ist ein Verfahren, welches ausgehend von Stichproben

Mehr

Überblick über die Tests

Überblick über die Tests Anhang A Überblick über die Tests A.1 Ein-Stichproben-Tests A.1.1 Tests auf Verteilungsannahmen ˆ Shapiro-Wilk-Test Situation: Test auf Normalverteilung H 0 : X N(µ, σ 2 ) H 1 : X nicht normalverteilt

Mehr

8. Februar 2007. 5. Bei Unterschleif gilt die Klausur als nicht bestanden und es erfolgt eine Meldung an das Prüfungsamt.

8. Februar 2007. 5. Bei Unterschleif gilt die Klausur als nicht bestanden und es erfolgt eine Meldung an das Prüfungsamt. L. Fahrmeir, C. Belitz Department für Statistik Bitte für die Korrektur freilassen! Aufgabe 1 2 3 4 Punkte Klausur zur Vorlesung Statistik III für Studenten mit Wahlfach Statistik 8. Februar 2007 Hinweise:

Mehr

Bachelorabschlussseminar Dipl.-Kfm. Daniel Cracau

Bachelorabschlussseminar Dipl.-Kfm. Daniel Cracau 1 Einführung in die statistische Datenanalyse Bachelorabschlussseminar Dipl.-Kfm. Daniel Cracau 2 Gliederung 1.Grundlagen 2.Nicht-parametrische Tests a. Mann-Whitney-Wilcoxon-U Test b. Wilcoxon-Signed-Rank

Mehr

Bachelorprüfung. Praxis der empirischen Wirtschaftsforschung Prof. Regina T. Riphahn, Ph.D. Name, Vorname. Matrikelnr. E-Mail. Studiengang.

Bachelorprüfung. Praxis der empirischen Wirtschaftsforschung Prof. Regina T. Riphahn, Ph.D. Name, Vorname. Matrikelnr. E-Mail. Studiengang. Lehrstuhl für Statistik und empirische Wirtschaftsforschung Fach: Prüfer: Bachelorprüfung Praxis der empirischen Wirtschaftsforschung Prof. Regina T. Riphahn, Ph.D. Name, Vorname Matrikelnr. E-Mail Studiengang

Mehr

8. Methoden der klassischen multivariaten Statistik

8. Methoden der klassischen multivariaten Statistik 8. Methoden der klassischen multivariaten Statistik 8.1. Darstellung von Daten Voraussetzungen auch in diesem Kapitel: Grundgesamtheit (Datenraum) Ω von Objekten (Fällen, Instanzen), denen J-Tupel von

Mehr

Beispiel: Sonntagsfrage. Einführung in die induktive Statistik. Statistische Tests. Statistische Tests

Beispiel: Sonntagsfrage. Einführung in die induktive Statistik. Statistische Tests. Statistische Tests Beispiel: Sonntagsfrage Vier Wochen vor der österreichischen Nationalratswahl 1999 wurde 499 Haushalten die Sonntagsfrage gestellt: Falls nächsten Sonntag Wahlen wären, welche Partei würden Sie wählen?

Mehr

Nachholklausur STATISTIK II

Nachholklausur STATISTIK II Nachholklausur STATISTIK II Name, Vorname: Matrikel-Nr.: Die Klausur enthält zwei Typen von Aufgaben: T e i l A besteht aus Fragen mit mehreren vorgegebenen Antwortvorschlägen, von denen mindestens eine

Mehr

Statistik II für Betriebswirte Vorlesung 2

Statistik II für Betriebswirte Vorlesung 2 PD Dr. Frank Heyde TU Bergakademie Freiberg Institut für Stochastik Statistik II für Betriebswirte Vorlesung 2 21. Oktober 2014 Verbundene Stichproben Liegen zwei Stichproben vor, deren Werte einander

Mehr

Teil I Beschreibende Statistik 29

Teil I Beschreibende Statistik 29 Vorwort zur 2. Auflage 15 Vorwort 15 Kapitel 0 Einführung 19 0.1 Methoden und Aufgaben der Statistik............................. 20 0.2 Ablauf statistischer Untersuchungen..............................

Mehr

Grundlagen der Inferenzstatistik

Grundlagen der Inferenzstatistik Grundlagen der Inferenzstatistik (Induktive Statistik oder schließende Statistik) Dr. Winfried Zinn 1 Deskriptive Statistik versus Inferenzstatistik Die Deskriptive Statistik stellt Kenngrößen zur Verfügung,

Mehr

Stochastische Eingangsprüfung, 17.05.2008

Stochastische Eingangsprüfung, 17.05.2008 Stochastische Eingangsprüfung, 17.5.8 Wir gehen stets von einem Wahrscheinlichkeitsraum (Ω, A, P) aus. Aufgabe 1 ( Punkte) Sei X : Ω [, ) eine integrierbare Zufallsvariable mit XdP = 1. Sei Q : A R, Q(A)

Mehr

Klausur zu Methoden der Statistik II (mit Kurzlösung) Wintersemester 2008/2009. Aufgabe 1

Klausur zu Methoden der Statistik II (mit Kurzlösung) Wintersemester 2008/2009. Aufgabe 1 Lehrstuhl für Statistik und Ökonometrie der Otto-Friedrich-Universität Bamberg Prof. Dr. Susanne Rässler Klausur zu Methoden der Statistik II (mit Kurzlösung) Wintersemester 2008/2009 Aufgabe 1 Im Rahmen

Mehr

1 Von den Ereignissen U und V eines Zufallsexperiments kennt man die Eigenschaften (1) bis (3) :

1 Von den Ereignissen U und V eines Zufallsexperiments kennt man die Eigenschaften (1) bis (3) : Prof. Dr. E. Mammen SEMINAR FÜR STATISTIK Prof. Dr. H. Stenger UNIVERSITÄT MANNHEIM Vierstündige Klausur in statistischer Methodenlehre 9. Juli 003; 8:30 - :30 Zulässige Hilfsmittel: keine, insbesondere

Mehr

Statistik im Bachelor-Studium der BWL und VWL

Statistik im Bachelor-Studium der BWL und VWL Max C. Wewel Statistik im Bachelor-Studium der BWL und VWL Methoden, Anwendung, Interpretation Mit herausnehmbarer Formelsammlung ein Imprint von Pearson Education München Boston San Francisco Harlow,

Mehr

Regelmäßigkeit (Erkennen von Mustern und Zusammenhängen) versus Zufall

Regelmäßigkeit (Erkennen von Mustern und Zusammenhängen) versus Zufall Wahrscheinlichkeitstheorie Was will die Sozialwissenschaft damit? Regelmäßigkeit (Erkennen von Mustern und Zusammenhängen) versus Zufall Auch im Alltagsleben arbeiten wir mit Wahrscheinlichkeiten, besteigen

Mehr

Welch-Test. Welch-Test

Welch-Test. Welch-Test Welch-Test Welch-Test Test auf Lageunterschied zweier normalverteilter Grundgesamtheiten mit unbekannten Varianzen durch Vergleich der Mittelwerte zweier unabhängiger Zufallsstichproben. Beispiel Im Labor

Mehr

12.1 Wie funktioniert ein Signifikanztest?

12.1 Wie funktioniert ein Signifikanztest? Sedlmeier & Renkewitz Kapitel 12 Signifikanztests 12.1 Wie funktioniert ein Signifikanztest? Zentrales Ergebnis eine Signifikanztests: Wie wahrscheinlich war es unter der Bedingung dass H0 gilt, diesen

Mehr

Profil A 49,3 48,2 50,7 50,9 49,8 48,7 49,6 50,1 Profil B 51,8 49,6 53,2 51,1 51,1 53,4 50,7 50 51,5 51,7 48,8

Profil A 49,3 48,2 50,7 50,9 49,8 48,7 49,6 50,1 Profil B 51,8 49,6 53,2 51,1 51,1 53,4 50,7 50 51,5 51,7 48,8 1. Aufgabe: Eine Reifenfirma hat für Winterreifen unterschiedliche Profile entwickelt. Bei jeweils gleicher Geschwindigkeit und auch sonst gleichen Bedingungen wurden die Bremswirkungen gemessen. Die gemessenen

Mehr

Klausur Nr. 1. Wahrscheinlichkeitsrechnung. Keine Hilfsmittel gestattet, bitte alle Lösungen auf dieses Blatt.

Klausur Nr. 1. Wahrscheinlichkeitsrechnung. Keine Hilfsmittel gestattet, bitte alle Lösungen auf dieses Blatt. Klausur Nr. 1 2014-02-06 Wahrscheinlichkeitsrechnung Pflichtteil Keine Hilfsmittel gestattet, bitte alle Lösungen auf dieses Blatt. Name: 0. Für Pflicht- und Wahlteil gilt: saubere und übersichtliche Darstellung,

Mehr

Statistik II für Betriebswirte Vorlesung 3

Statistik II für Betriebswirte Vorlesung 3 PD Dr. Frank Heyde TU Bergakademie Freiberg Institut für Stochastik Statistik II für Betriebswirte Vorlesung 3 5. November 2013 Beispiel: Aktiensplit (Aczel & Sounderpandan, Aufg. 14-28) Ein Börsenanalyst

Mehr

Monte-Carlo Simulation

Monte-Carlo Simulation Monte-Carlo Simulation Sehr häufig hängen wichtige Ergebnisse von unbekannten Werten wesentlich ab, für die man allerhöchstens statistische Daten hat oder für die man ein Modell der Wahrscheinlichkeitsrechnung

Mehr

, dt. $+ f(x) = , - + < x < +, " > 0. " 2# Für die zugehörige Verteilungsfunktion F(x) ergibt sich dann: F(x) =

, dt. $+ f(x) = , - + < x < +,  > 0.  2# Für die zugehörige Verteilungsfunktion F(x) ergibt sich dann: F(x) = 38 6..7.4 Normalverteilung Die Gauß-Verteilung oder Normal-Verteilung ist eine stetige Verteilung, d.h. ihre Zufallsvariablen können beliebige reelle Zahlenwerte annehmen. Wir definieren sie durch die

Mehr

Analytische Statistik I. Statistische Methoden in der Korpuslinguistik Heike Zinsmeister WS 2009/10

Analytische Statistik I. Statistische Methoden in der Korpuslinguistik Heike Zinsmeister WS 2009/10 Analytische Statistik I Statistische Methoden in der Korpuslinguistik Heike Zinsmeister WS 2009/10 Testen Anpassungstests (goodness of fit) Weicht eine gegebene Verteilung signifikant von einer bekannten

Mehr

Fragestellungen der Schließenden Statistik

Fragestellungen der Schließenden Statistik Fragestellungen der Schließenden Statistik Bisher: Teil I: Beschreibende Statistik Zusammenfassung von an GesamtheitM N {e,,e N } erhobenem Datensatz x,,x N durch Häufigkeitsverteilung und Kennzahlen für

Mehr

2. Korrelation, lineare Regression und multiple Regression

2. Korrelation, lineare Regression und multiple Regression multiple 2.2 Lineare 2.2 Lineare 1 / 130 2.2 Lineare 2 / 130 2.1 Beispiel: Arbeitsmotivation Untersuchung zur Motivation am Arbeitsplatz in einem Chemie-Konzern 25 Personen werden durch Arbeitsplatz zufällig

Mehr

Weiterbildungskurs Stochastik

Weiterbildungskurs Stochastik Hansruedi Künsch Seminar für Statistik Departement Mathematik, ETH Zürich 24. Juni 2009 Inhalt STATISTIK DER BINOMIALVERTEILUNG 1 STATISTIK DER BINOMIALVERTEILUNG 2 Fragestellungen Typische Fragestellungen

Mehr

Einfache Varianzanalyse für abhängige

Einfache Varianzanalyse für abhängige Einfache Varianzanalyse für abhängige Stichproben Wie beim t-test gibt es auch bei der VA eine Alternative für abhängige Stichproben. Anmerkung: Was man unter abhängigen Stichproben versteht und wie diese

Mehr

FAKTORIELLE VERSUCHSPLÄNE. Andreas Handl

FAKTORIELLE VERSUCHSPLÄNE. Andreas Handl FAKTORIELLE VERSUCHSPLÄNE Andreas Handl 1 Inhaltsverzeichnis 1 Versuchsplanung 4 2 Einfaktorielle Varianzanalyse 6 2.1 DieAnnahmen... 6 2.2 Die ANOVA-Tabelle und der F -Test... 6 2.3 Versuche mit zwei

Mehr

Übungen zur Mathematik für Pharmazeuten

Übungen zur Mathematik für Pharmazeuten Blatt 1 Aufgabe 1. Wir betrachten den Ereignisraum Ω = {(i,j) 1 i,j 6} zum Zufallsexperiment des zweimaligem Würfelns. Sei A Ω das Ereignis Pasch, und B Ω das Ereignis, daß der erste Wurf eine gerade Augenzahl

Mehr

Statistik Musterlösungen

Statistik Musterlösungen Statistik Musterlösungen Regina Tüchler & Achim Zeileis Institut für Statistik & Mathematik Wirtschaftsuniversität Wien 1 Grundbegriffe (1.23) Skript Reaktionen auf Videofilm. Aussagen M, E, P, S h(m)

Mehr

werden können. Wenn der Benutzer zudem eine konkrete Differenz mit praktischen Konsequenzen angibt, berechnet der Assistent den Stichprobenumfang,

werden können. Wenn der Benutzer zudem eine konkrete Differenz mit praktischen Konsequenzen angibt, berechnet der Assistent den Stichprobenumfang, Dieses White Paper ist Teil einer Reihe von Veröffentlichungen, welche die Forschungsarbeiten der Minitab-Statistiker erläutern, in deren Rahmen die im Assistenten der Minitab 17 Statistical Software verwendeten

Mehr

Jetzt lerne ich Stochastik für die Oberstufe

Jetzt lerne ich Stochastik für die Oberstufe Jetzt lerne ich Stochastik für die Oberstufe von Dr. rer. nat. Marco Schuchmann, Dipl.-Math. - 2 - - 3 - Vorwort In diesem Buch werden Anwendungen der Stochastik in der Oberstufe mit vielen Beispielen

Mehr

Beurteilung der biometrischen Verhältnisse in einem Bestand. Dr. Richard Herrmann, Köln

Beurteilung der biometrischen Verhältnisse in einem Bestand. Dr. Richard Herrmann, Köln Beurteilung der biometrischen Verhältnisse in einem Bestand Dr. Richard Herrmann, Köln Beurteilung der biometrischen Verhältnisse in einem Bestand 1 Fragestellung Methoden.1 Vergleich der Anzahlen. Vergleich

Mehr

Einfache statistische Testverfahren

Einfache statistische Testverfahren Einfache statistische Testverfahren Johannes Hain Lehrstuhl für Mathematik VIII (Statistik) 1/29 Hypothesentesten: Allgemeine Situation Im Folgenden wird die statistische Vorgehensweise zur Durchführung

Mehr

Willkommen zur Vorlesung Statistik

Willkommen zur Vorlesung Statistik Willkommen zur Vorlesung Statistik Thema dieser Vorlesung: Varianzanalyse Prof. Dr. Wolfgang Ludwig-Mayerhofer Universität Siegen Philosophische Fakultät, Seminar für Sozialwissenschaften Prof. Dr. Wolfgang

Mehr

Probeklausur Zeitreihenökonometrie (Sommersemester 2014) 1

Probeklausur Zeitreihenökonometrie (Sommersemester 2014) 1 Probeklausur Zeitreihenökonometrie (Sommersemester 2014) 1 Aufgabe 1: Betrachtet wird folgendes Modell zur Erklärung des Managergehalts salary durch den Umsatz sales, die Eigenkapitalrendite roe und die

Mehr

Schätzer (vgl. Kapitel 1): Stichprobenmittel X N. Stichprobenmedian X N

Schätzer (vgl. Kapitel 1): Stichprobenmittel X N. Stichprobenmedian X N Prof. Dr. J. Franke Statistik II für Wirtschaftswissenschaftler 8.1 Schätzer für Lage- und Skalenparameter und Verteilungsmodellwahl Lageparameter (l(x + a) = l(x) + a): Erwartungswert EX Median von X

Mehr

Marktforschung I. Marktforschung I 2

Marktforschung I. Marktforschung I 2 Marktforschung I Marktforschung I Einführung in die Testtheorie (Toporowski) Mathematische Grundlagen (Toporowski) Varianzanalyse (Toporowski) Regressionsanalyse (Boztuğ) Diskriminanzanalyse (Hammerschmidt)

Mehr

Indextest bietet klare und schnelle Antworten auf immer wiederkehrende Fragen

Indextest bietet klare und schnelle Antworten auf immer wiederkehrende Fragen 06. August 2013 ForschungsWerk mit Innovation auf dem Markt: Indextest bietet klare und schnelle Antworten auf immer wiederkehrende Fragen NÜRNBERG - ForschungsWerk hat mit Indextest ein Tool entwickelt,

Mehr

Commercial Banking Übung 1 Kreditscoring

Commercial Banking Übung 1 Kreditscoring Commercial Banking Übung Kreditscoring Dr. Peter Raupach raupach@wiwi.uni-frankfurt.de Sprechzeit Dienstag 6-7:00 Uhr Raum 603 B Kreditscoring Gliederung Grundanliegen Das Sample Modellspezifikation Diskriminanzanalyse

Mehr

Medizinische Statistik Epidemiologie und χ 2 Vierfeldertest

Medizinische Statistik Epidemiologie und χ 2 Vierfeldertest Universität Wien Institut für Mathematik Wintersemester 2009/2010 Medizinische Statistik Epidemiologie und χ 2 Vierfeldertest Seminar Angewandte Mathematik Ao. Univ. Prof. Dr. Peter Schmitt von Nadja Reiterer

Mehr

Einführung in die Statistik

Einführung in die Statistik Einführung in die Statistik Dr. C.J. Luchsinger 2 Zufallsgrössen Literatur Kapitel 2 * Statistik in Cartoons: Kapitel 4 * Krengel: 3.1 und 3.2 in 3 und (Honours Program) 10 sowie 11.1, 11.2 und 11.3 in

Mehr

3. Der t-test. Der t-test

3. Der t-test. Der t-test Der t-test 3 3. Der t-test Dieses Kapitel beschäftigt sich mit einem grundlegenden statistischen Verfahren zur Auswertung erhobener Daten: dem t-test. Der t-test untersucht, ob sich zwei empirisch gefundene

Mehr

STATISTIK 1 - BEGLEITVERANSTALTUNG

STATISTIK 1 - BEGLEITVERANSTALTUNG STATISTIK 1 - BEGLEITVERANSTALTUNG VORLESUNG 4 ALPHA / BETA-FEHLER 12.12.2014 1 12.12.2014 1 Mona Ulrich, Psychologie (M.Sc.) AGENDA 01 STATISTISCHE HYPOTHESEN 02 POPULATION / STICHPROBE 03 ALPHA/ BETA-FEHLER

Mehr

Studiendesign/ Evaluierungsdesign

Studiendesign/ Evaluierungsdesign Jennifer Ziegert Studiendesign/ Evaluierungsdesign Praxisprojekt: Nutzerorientierte Evaluierung von Visualisierungen in Daffodil mittels Eyetracker Warum Studien /Evaluierungsdesign Das Design einer Untersuchung

Mehr

Klausur zur Vorlesung Multivariate Verfahren, SS 2006 6 Kreditpunkte, 90 min

Klausur zur Vorlesung Multivariate Verfahren, SS 2006 6 Kreditpunkte, 90 min Klausur, Multivariate Verfahren, SS 2006, 6 Kreditpunkte, 90 min 1 Prof. Dr. Fred Böker 08.08.2006 Klausur zur Vorlesung Multivariate Verfahren, SS 2006 6 Kreditpunkte, 90 min Gesamtpunkte: 39 Aufgabe

Mehr

Grundlagen quantitativer Sozialforschung Interferenzstatistische Datenanalyse in MS Excel

Grundlagen quantitativer Sozialforschung Interferenzstatistische Datenanalyse in MS Excel Grundlagen quantitativer Sozialforschung Interferenzstatistische Datenanalyse in MS Excel 16.11.01 MP1 - Grundlagen quantitativer Sozialforschung - (4) Datenanalyse 1 Gliederung Datenanalyse (inferenzstatistisch)

Mehr

Messgeräte: Mess-System-Analyse und Messmittelfähigkeit

Messgeräte: Mess-System-Analyse und Messmittelfähigkeit Messgeräte: Mess-System-Analyse und Messmittelfähigkeit Andreas Berlin 14. Juli 2009 Bachelor-Seminar: Messen und Statistik Inhalt: 1 Aspekte einer Messung 2 Mess-System-Analyse 2.1 ANOVA-Methode 2.2 Maße

Mehr

Modul G.1 WS 07/08: Statistik 17.01.2008 1. Die Korrelation ist ein standardisiertes Maß für den linearen Zusammenhangzwischen zwei Variablen.

Modul G.1 WS 07/08: Statistik 17.01.2008 1. Die Korrelation ist ein standardisiertes Maß für den linearen Zusammenhangzwischen zwei Variablen. Modul G.1 WS 07/08: Statistik 17.01.2008 1 Wiederholung Kovarianz und Korrelation Kovarianz = Maß für den linearen Zusammenhang zwischen zwei Variablen x und y Korrelation Die Korrelation ist ein standardisiertes

Mehr

Zufallsgrößen. Vorlesung Statistik für KW 29.04.2008 Helmut Küchenhoff

Zufallsgrößen. Vorlesung Statistik für KW 29.04.2008 Helmut Küchenhoff Zufallsgrößen 2.5 Zufallsgrößen 2.5.1 Verteilungsfunktion einer Zufallsgröße 2.5.2 Wahrscheinlichkeits- und Dichtefunktion Wahrscheinlichkeitsfunktion einer diskreten Zufallsgröße Dichtefunktion einer

Mehr

Beispiele zur UE Wirtschaftsstatistik 1 bei Nagel

Beispiele zur UE Wirtschaftsstatistik 1 bei Nagel Beispiele zur UE Wirtschaftsstatistik 1 bei Nagel 1 Ereignisse und Wahrscheinlichkeiten 1. Ein Würfel wird zweimal geworfen, der Stichprobenraum Ω ist Ihnen nicht neu. Versuchen Sie, den Stichprobenraum

Mehr

Bedingte Wahrscheinlichkeit

Bedingte Wahrscheinlichkeit Bedingte Wahrscheinlichkeit In einem Laden ist eine Alarmanlage eingebaut. Bei Einbruch gibt sie mit 99%-iger Wahrscheinlichkeit Alarm. Wenn in einer bestimmten Nacht kein Einbruch stattfindet, gibt sie

Mehr

Wilcoxon-Rangsummen-Test

Wilcoxon-Rangsummen-Test Wilcoxon-Rangsummen-Test Theorie: Wilcoxon-Rangsummen-Test Der Wilcoxon-Rangsummen-Test prüft, ob sich die Verteilungen der Grundgesamtheiten zweier Stichproben bezüglich ihrer Lage unterscheiden. Ein

Mehr

Sozialwissenschaftliche Methoden und Statistik I

Sozialwissenschaftliche Methoden und Statistik I Sozialwissenschaftliche Methoden und Statistik I Universität Duisburg Essen Standort Duisburg Integrierter Diplomstudiengang Sozialwissenschaften Skript zum SMS I Tutorium Von Mark Lutter Stand: April

Mehr

Tutorial: Homogenitätstest

Tutorial: Homogenitätstest Tutorial: Homogenitätstest Eine Bank möchte die Kreditwürdigkeit potenzieller Kreditnehmer abschätzen. Einerseits lebt die Bank ja von der Vergabe von Krediten, andererseits verursachen Problemkredite

Mehr

Willkommen zur Vorlesung Statistik (Master)

Willkommen zur Vorlesung Statistik (Master) Willkommen zur Vorlesung Statistik (Master) Thema dieser Vorlesung: Letzte Worte zur Inferenzstatistik, v. a. zu Signifikanztests Prof. Dr. Wolfgang Ludwig-Mayerhofer Universität Siegen Philosophische

Mehr

$ % + 0 sonst. " p für X =1 $

$ % + 0 sonst.  p für X =1 $ 31 617 Spezielle Verteilungen 6171 Bernoulli Verteilung Wir beschreiben zunächst drei diskrete Verteilungen und beginnen mit einem Zufallsexperiment, indem wir uns für das Eintreffen eines bestimmten Ereignisses

Mehr

Kapitel 4: Binäre Regression

Kapitel 4: Binäre Regression Kapitel 4: Binäre Regression Steffen Unkel (basierend auf Folien von Nora Fenske) Statistik III für Nebenfachstudierende WS 2013/2014 4.1 Motivation Ausgangssituation Gegeben sind Daten (y i, x i1,...,

Mehr

Grundlagen Wahrscheinlichkeitsrechnung, Statistik

Grundlagen Wahrscheinlichkeitsrechnung, Statistik Grundlagen Wahrscheinlichkeitsrechnung, Statistik Was ist Statistik? Wahrscheinlichkeit Grundgesamtheit und Verteilung Verteilung von Stichprobenparametern und Intervallschätzung Werkzeug Varianzanalyse

Mehr

Motivation. Wilcoxon-Rangsummentest oder Mann-Whitney U-Test. Wilcoxon Rangsummen-Test Voraussetzungen. Bemerkungen

Motivation. Wilcoxon-Rangsummentest oder Mann-Whitney U-Test. Wilcoxon Rangsummen-Test Voraussetzungen. Bemerkungen Universität Karlsruhe (TH) Forschungsuniversität gegründet 825 Wilcoxon-Rangsummentest oder Mann-Whitney U-Test Motivation In Experimenten ist die Datenmenge oft klein Daten sind nicht normalverteilt Dann

Mehr

Diskriminanzanalyse Beispiel

Diskriminanzanalyse Beispiel Diskriminanzanalyse Ziel bei der Diskriminanzanalyse ist die Analyse von Gruppenunterschieden, d. h. der Untersuchung von zwei oder mehr Gruppen hinsichtlich einer Vielzahl von Variablen. Diese Methode

Mehr