Biosignale und Benutzerschnittstellen

Größe: px
Ab Seite anzeigen:

Download "Biosignale und Benutzerschnittstellen"

Transkript

1 Vorlesung WS 2012/2013 Biosignale und Benutzerschnittstellen Statistik und Versuchsplanung Prof. Dr. Tanja Schultz Dipl. Math. Michael Wand 1 / 76

2 Fragestellung dieser Vorlesung Folgende Themen haben wir bisher behandelt: Biologische Grundlagen und Entstehung der verschiedenen Biosignale Ableitung/Messung von Signalen Algorithmische Grundlagen der Biosignalverarbeitung Jetzt nehmen wir an, wir haben diese Kenntnisse benutzt, um ein Experiment durchzuführen. Wir haben eine Reihe von Daten aufgenommen. Wir haben diese Daten nach einer gewissen Methode klassifiziert und haben beispielsweise Zahlenreihen von Erkennungsergebnissen o. ä. vorliegen. Was ist nun der nächste Schritt? 2 / 76

3 Auswertung eines Versuchs Wir sollten die Ergebnisse unseres Experiments statistisch auswerten! Ist unser Erkennungsergebnis signifikant besser als ein Zufallsergebnis, bzw. besser als schon bekannte Verfahren? Welche Aussagen können wir über die Genauigkeit unserer Ergebnisse treffen? Was können wir aus den Ergebnissen schließen? Können wir Aussagen über die Generalisierbarkeit der Ergebnisse treffen? 3 / 76

4 Statistik und Versuchsplanung Die Beantwortung dieser Fragen ist Gegenstand der Statistik. In dieser Vorlesung wollen wir: eine kurze Einführung in die Statistik geben Fragestellungen der Statistik erläutern einen statistischen Test vorstellen ein Rechenbeispiel durchrechnen. Außerdem: Wie muss ein Versuch aufgebaut werden, um auch gültige Ergebnisse liefern zu können? Welche Entscheidungen muss man vor Beginn des Versuchs treffen? 4 / 76

5 Literatur Jürgen Bortz: Statistik für Human- und Sozialwissenschaftler. 6. Auflage Springer Verlag, Gute Einführung in das Thema, mit Hintergrundinformationen und auch Methodenkritik. 5 / 76

6 Übersicht Erinnerung: Elemente der Wahrscheinlichkeitstheorie Stichproben und Konfidenzintervalle Der t-test Der Kolmogorov-Smirnov-Test Bemerkungen zur Versuchsplanung 6 / 76

7 Zufallsexperimente Betrachten wir ein Zufallsexperiment, etwa den Wurf einer Münze. Der Wahrscheinlichkeitsraum der möglichen Ausgänge dieses Experiments ist der Raum Ω = {Kopf, Zahl}. Auf Ω existiert eine Wahrscheinlichkeitsverteilung, die Wahrscheinlichkeiten der möglichen Ausgänge des Zufallsexperiments beschreibt. Bei einer fairen Münze gilt etwa P( ) = 0 P({Kopf}) = P({Zahl}) = 1/2 P(Ω) = 1. Eine Wahrscheinlichkeitsverteilung ordnet jeder Teilmenge des Wahrscheinlichkeitsraumes eine Wahrscheinlichkeit zwischen 0 und 1 zu. 7 / 76

8 Zufallsvariablen Eine Zufallsvariable (ZV) X ordnet den Ausgängen eines Zufallsexperiments reelle Zahlen (oder auch Vektoren des R n ) zu. Beispiel: Jemand wettet um einen Euro, dass eine geworfene Münze Kopf zeigt. Dann wäre eine nützliche Zufallsvariable gegeben durch X : Ω R Kopf 1 Zahl 1, also durch den Gewinn in Euro bei dem entsprechenden Ereignis. Die Verteilung auf Ω überträgt sich auf R. 8 / 76

9 Diskete und kontinuierliche Zufallsvariablen Die Verteilung einer ZV X kann diskret sein, dann ist die Wahrscheinlichkeitsmasse auf höchstens abzählbar unendlich viele Punkte x 1, x 2,... des R n verteilt kontinuierlich sein, dann ist die Wahrscheinlichkeitsmasse auf ein ganzes Intervall verteilt. Im ersten Fall kann die Verteilung durch die Wahrscheinlichkeiten der einzelnen Punkte charakterisiert werden, also P(x i ) = p i, im zweiten Fall kann man (oft) eine Dichtefunktion p angeben, dann gilt für A R: P(A) = p(x)dx A 9 / 76

10 Erwartungswert Der Erwartungswert einer Zufallsvariablen ist folgendermaßen definiert: Im diskreten Fall, wenn X die Werte x i mit Wahrscheinlichkeiten p i annimmt: µ = E(X ) = x i p i = x i P(X = x i ) i i Im kontinuierlichen Fall: µ = E(X ) = R 10 / 76 x p(x)dx. Ist X die Summe von Zufallsvariablen X i, so ist der Erwartungswert von X auch die Summe der Erwartungswerten der einzelnen X i : X = i X i E(X ) = i E(X i).

11 Schätzung des Erwartungswerts aus einer Stichprobe Betrachten wir eine Stichprobe x 1, x 2,..., x N. Wir nehmen an, dass alle diese Werte x i unabhängige Realisationen einer gewissen Zufallsvariablen X sind! Wie können wir aus dieser Stichprobe eine möglichst genaue Approximation (Schätzung) des Erwartungswertes von X gewinnen? Welches Kriterium soll ein solcher Schätzer überhaupt erfüllen? 11 / 76

12 Schätzung des Erwartungswerts aus einer Stichprobe Man kann zeigen: Der Stichprobenmittelwert x = 1 N der Stichprobe ist eine sehr nützliche Schätzung des Erwartungswertes: N i=1 Dies ist der Maximum-Likelihood-Schätzer: Diese Wahl des Stichprobenmittelwerts maximiert die Wahrscheinlichkeit der beobachteteten Daten (also der Stichprobe). Diese Schätzung ist erwartungstreu: Im Mittel wird der echte Erwartungswert weder über- noch unterschätzt. Die Schätzung ist auch konsistent: Das Gesetz der großen Zahlen sichert in vielen Fällen zu, dass der Stichprobenmittelwert bei wachsender Stichprobengröße gegen den Erwartungswert konvergiert. Wir werden der Mittelwertsschätzung wieder begegnen, wenn wir Konfidenzintervalle betrachten. 12 / 76 x i

13 Varianz Ist µ = E(X ) der Erwartungswert einer reellen Zufallsvariablen, so ist die Varianz durch σ 2 = Var(X ) = E((x µ) 2 ) definiert. Direkte Formeln lassen sich wieder für den kontinuierlichen und den diskreten Fall angeben: σ 2 = Var(X ) = (x i µ) 2 p i bzw. i σ 2 = Var(X ) = (x µ) 2 p(x)dx. R 13 / 76

14 Varianz Die Varianz gibt die Streuung einer Zufallsvariablen an. Das Bild zeigt zwei Gaussdichtefunktionen mit unterschiedlichen Varianzen. Die Form der Verteilungen bleibt gleich, aber die grün eingezeichnete Verteilung ist viel ausgebreiteter. Die Quadratwurzel der Varianz heißt Standardabweichung: σ X = Var(X ). 14 / 76

15 Varianzschätzung Auch die Varianz einer Verteilung kann man aus einer Stichprobe abschätzen. Die naheliegende Formel ˆσ 2 X,ML = 1 N N (x n x) 2 ist zwar der Maximum-Likelihood-Schätzer, führt aber dazu, dass die echte Varianz unterschätzt wird. Das heißt, dieser Schätzer ist nicht erwartungstreu, das heißt, dass sein Erwartungswert nicht gleich der (wahren) Varianz der Population ist, sondern davon abweicht (Bias). (Trotzdem kann man ihn für gewisse Zwecke verwenden.) n=1 15 / 76

16 Varianzschätzung Um die Varianz erwartungstreu zu beheben, muss das Ergebnis noch mit N N 1 multipliziert werden, das heißt, der übliche Schätzer für die Varianz einer ZV ist die korrigierte Stichprobenvarianz ˆσ 2 X = 1 N 1 N (x n x) 2. Wir haben also gelernt: Korrektes Schätzen ist nichttrivial, es gibt unterschiedliche Ansätze mit unterschiedlichen Vor- und Nachteilen! n=1 16 / 76

17 Typische Verteilungen Als nächstes besprechen wir einige häufig auftretende Wahrscheinlichkeitsverteilungen, die in der Statistik eine Rolle spielen, nämlich die: Gleichverteilung Normalverteilung Außerdem besprechen wir Verteilungen, die im Wesentlichen bei Hypothesentests verwendet werden: χ 2 -Verteilung t-verteilung 17 / 76

18 Die Gleichverteilung Die Gleichverteilung kann sowohl eine diskrete als auch eine kontinuierliche Verteilung sein. Im diskreten Fall haben alle (endlich vielen) möglichen Ergebnisse x 1,..., x N des Zufallsexperiments die gleiche Wahrscheinlichkeit, also p i = P(x i ) = 1/N, im kontinuierlichen Fall ist die Dichtefunktion auf einem endlich großen Intervall konstant. Die Grundidee der Gleichverteilung ist es, dass es keine Präferenz für ein gewisses Ergebnis eines Experiments gibt. 18 / 76

19 Die Normalverteilung Die Normalverteilung kennen wir aus sehr vielen Anwendungsgebieten. Sie ist eine kontinuierliche Verteilung. Im eindimensionalen Fall hat sie die Dichtefunktion ( f (x) = 1 σ 2π exp 1 ( ) ) x µ 2. 2 σ Ihre besondere Bedeutung für die Statistik kommt vom zentralen Grenzwertsatz, der besagt, dass der Mittelwert bzw. die Summe von vielen unabhängigen, identisch verteilten Zufallsvariablen annähernd standardnormalverteilt ist. Zwei Normalverteilungen sind in der Grafik abgebilet. 19 / 76

20 Die Normalverteilung Ein Hilfsmittel zur Veranschaulichung der Normalverteilung und des zentralen Grenzwertsatzes ist das Galtonsche Nagelbrett. Man sieht auf dem Bild, wie Kugeln in sieben Trichter rollen. Auf dem Weg wird jede Kugel von sechs Nägeln zufällig nach rechts oder links abgelenkt. Wenn die Trichter von links nach rechts mit 0, 1,..., 6 =: k durchnummeriert sind, so fällt eine Kugel genau dann in Trichter l, wenn sie l-mal nach rechts und 6 l-mal nach links abgelenkt wurde. 20 / 76

21 Die Normalverteilung Durch Abzählen sieht man, dass die Wahrscheinlichkeit, dass eine Kugel in Trichter l, 0 l k fällt, sich ergibt zu p l = ( k l ) 1 2 k. Eine solche diskrete Verteilung heißt Binomialverteilung. Können Sie erkennen, dass die Form der Binomialverteilung einer Normalverteilung ähnelt? Je mehr Trichter (und Nagelreihen) man verwendet, desto größer wird die Ähnlichkeit 21 / 76

22 Die Normalverteilung Es gibt auch ein Argument, warum die Verteilung der Kugeln auf die Trichter annähernd eine Normalverteilung ist. Seien X i (i = 1,..., 6) ZVen, die den Wert 0[1] annehmen, wenn eine Kugel in Nagelreihe i nach links[rechts] abgelenkt wurde (an welchem der Nägel genau, ist völlig egal). Sind die Nägel immer zentriert angebracht, so ist P(X i = 0) = P(X i = 1) = / 76

23 Die Normalverteilung Ist Y eine ZV, die die Nummer des Trichters angibt, in den eine Kugel fällt, so ist Y die Summe der (voneinander unabhängigen, identisch verteilten) X i : Y = X X k und somit annähernd normalverteilt. Je mehr X i (also je mehr Trichter und Nagelreihen) man hat, desto genauer wird die Normalverteilung approximiert. 23 / 76

24 Eigenschaften der Normalverteilung Die Normalverteilung wird durch Mittelwert µ und Varianz σ 2 vollständig beschrieben. Man schreibt für eine normalverteilte Zufallsvariable X : X N (µ, σ 2 ). Eine Normalverteilung mit Mittelwert 0 und Varianz 1 nennt man auch Standardnormalverteilung. Für eine standardnormalverteilte ZV verwendet man oft das Symbol z: Also z N (0, 1). Jede normalverteilte ZV X lässt sich durch Normierung in eine standardnormalverteilte ZV z überführen (z-transformation): z = X µ σ x 24 / 76

25 Die Chi-Quadrat-Verteilung Ist z eine standardnormalverteilte ZV, so ist ihr Quadrat χ 2 1 -verteilt: χ 2 1 = z 2 Die Zahl 1 gibt die Anzahl der Freiheitsgrade (df, degree of freedom) der Chi-Quadrat-Verteilung an. Summieren wir die Quadrate von df unabhängigen, standardnormalverteilten Zufallsvariablen auf, erhalten wir eine χ 2 -verteilte ZV mit df Freiheitsgraden: df χ 2 df = n=1 z 2 n Die rechte Grafik zeigt die Form der Chi-Quadrat-Verteilung für verschiedene Freiheitsgrade. 25 / 76

26 Die t-verteilung Aus einer standardnormalverteilten ZV wird ein z-wert gezogen, und aus einer hiervon unabhängigen χ 2 df -verteilten ZV wird ein χ2 df -Wert gezogen. Der folgende Quotient definiert einen t df -Wert: z t df = χ 2 df /df Die Verteilung dieser ZV heißt t-verteilung mit df Freiheitsgraden. Die t-verteilung wird uns später bei der Definition des t-tests wieder begegnen. 26 / 76

27 Übersicht Erinnerung: Elemente der Wahrscheinlichkeitstheorie Stichproben und Konfidenzintervalle Der t-test Der Kolmogorov-Smirnov-Test Bemerkungen zur Versuchsplanung 27 / 76

28 Stichproben Nehmen wir nun an, wir haben eine Population von beliebigen Objekten, die alle ein Merkmal x aufweisen. Wir wollen der Einfachheit halber davon ausgehen, dass sich dieses Merkmal als einzige reelle Zahl beschreiben lässt. Dabei kann diese Zahl sowohl kontinuierliche als auch diskrete Werte annehmen. Beispiele: Das monatliche Einkommen von Bevölkerungsgruppen (kontinuierlich) Die Wirksamkeit eines Medikaments (diskret entweder 0 oder 1) Die Fehlerrate bei einem Biosignalexperiment am CSL (kann kontinuierlich oder diskret sein) Wir wollen nun den Mittelwert dieses Merkmals bezogen auf die gesamte Population bestimmen. Warum ist das schwierig? 28 / 76

29 Stichproben Warum können wir den Mittelwert eines Merkmals nicht einfach ausrechnen? Weil viel zu viele Daten zu betrachten sind. Beispiel: Wirksamkeit eines Medikaments, sagen wir, gegen Bluthochdruck In D ca. 15 Mio. Menschen betroffen ( Diese 15 Mio. Menschen bilden die Population Medikament an jedem einzelnen ausprobieren??? 29 / 76

30 Stichproben Noch ein Beispiel: Fehlerrate eines Spracherkenners Wie viele mögliche Sprachäußerungen gibt es eigentlich? Nehmen wir eine Vorverarbeitung mit 13 Cepstralkoeffizienten, 100 Frames/Sekunde, jeder Koeffizient möge 256 verschiedene Werte annehmen können Bei Äußerungen von 5 Sekunden Dauer unterschiedliche Tokenfolgen???! Auf jeden Fall kann man nicht jedes einzelne Experiment durchführen. Man ist also auf eine Stichprobe angewiesen. 30 / 76

31 Stichproben Eine Stichprobe sollte die Population möglichst gut repräsentieren. Medizin: Möglichst große Bandbreite der Probanden z.b. bezüglich Vorerkrankungen, Alter etc. In der Spracherkennung: Möglichst viele verschiedene Sprachaufnahmen, unterschiedliche Sprecher,... ( Zufallsstichprobe ) Nehmen wir also an, wir haben eine zufällige Stichprobe der Größe N aus der Population gezogen. Dann haben wir die N Merkmalswerte x 1,..., x N. Wir interessieren uns für den Mittelwert µ des Merkmals innerhalb der Gesamtpopulation. 31 / 76

32 Stichproben Auf unserer Stichprobe können wir nun den Mittelwert x = 1 N N i=1 x i des Merkmals ausrechnen: Noch einmal zur Erinnerung: µ = Mittelwert des Merkmals in der Gesamtpopulation x = Mittelwert des Merkmals in der Stichprobe Wie stehen µ und x in Beziehung? Um diese Frage zu beantworten, machen wir ein Gedankenexperiment und ziehen noch eine weitere gleichgroße Zufallsstichprobe. Dann erhalten wir einen neuen Mittelwert x, der wahrscheinlich etwas von x abweicht, aber doch auch mit x und µ zusammenhängt. 32 / 76

33 Die Stichprobenkennwerteverteilung Die entscheidende Beobachtung: Das Ziehen einer (Zufalls-)Stichprobe ist selbst ein Zufallsexperiment! Folglich ist der Stichprobenmittelwert x, der durch die Gleichung x = 1 N N i=1 geschätzt wird, eine Realisierung einer ZV X! Die Stichprobenkennwerteverteilung ist die (theoretische) Verteilung, die sich ergibt, wenn man Stichproben fester Größe aus der Population zieht und jedes Mal den Kennwert (hier Stichprobenmittelwert) berechnet. 33 / 76 x i

34 Die Stichprobenkennwerteverteilung Welche Verteilung hat X? Man kann zeigen: Der Erwartungswert von X entspricht genau dem Mittelwert µ des Merkmals x in der Gesamtpopulation. Die Schätzung von µ durch die Gleichung oben ist also erwartungstreu. Welche weiteren Eigenschaften hat X? Die Standardabweichung σ x von X verringert sich mit zunehmendem Stichprobenumfang (wer weiß, warum?). Außerdem ist σ x offenbar von der (möglicherweise unbekannten) Streuung σ des Merkmals x in der Gesamtpopulation abhängig. 34 / 76

35 Die Stichprobenkennwerteverteilung Die Standardabweichung von X lässt sich berechnen durch σ x = σ 2 N. Dabei ist σ die Standardabweichung des Merkmals in der Gesamtpopulation. Das heißt, die Streuung von σ x nimmt mit der Quadratwurzel der Stichprobengröße ab. Wenn σ unbekannt ist, kann man es ebenfalls abschätzen (hatten wir vorhin: ˆσ 2 = 1 N N 1 i=1 (x i x) 2 ), und wir erhalten schließlich für σ x die Abschätzung N i=1 ˆσ x = (x i x) 2 N (N 1). 35 / 76

36 Die Stichprobenkennwerteverteilung Wie genau sieht die Verteilung von X denn nun aus? Der zentrale Grenzwertsatz der Wahrscheinlichkeitstheorie besagt, dass sich die Verteilung von X bei genügender Größe der Stichprobe (etwa N > 30) der Normalverteilung annähert! Beispiel (Applet zum selberausprobieren) für den zentralen Grenzwertsatz: ZentralerGWS.htm. 36 / 76

37 Die Stichprobenkennwerteverteilung Noch einmal zusammengefasst: Für genügend große Stichproben ist der Stichprobenmittelwert normalverteilt mit Mittelwert µ und Standardabweichung σ 2 σ x = N. Diese Verteilung ist ein Beispiel einer Stichprobenkennwerteverteilung für den Mittelwert als Kennwert einer Stichprobe. Noch ein Hinweis: Bei dieser Verteilung handelt es sich um ein theoretisches Konstrukt. Auf den nächsten Folien werden wir sehen, welche praktischen Informationen und Methoden daraus ableitbar sind. 37 / 76

38 Punktschätzung und Intervallschätzung Was schließen wir aus der Verteilung des Stichprobenmittelwerts? Wenn wir nur eine Stichprobe haben und einen einzigen Schätzwert für µ angeben wollen, bleibt x = N i=1 x i die bestmögliche Schätzung (erwartungstreu, minimaler quadratischer Fehler). Eine solche Schätzung nennt man Punktschätzung. Problem bei der Punktschätzung: Es gibt keine Information darüber, wie verlässlich der angegebene Wert eigentlich ist. Wir können aber auch ein Intervall für µ angeben (Intervallschätzung). Darin reflektiert sich, dass unsere Schätzung immer etwas ungenau sein wird. Die Wahrscheinlichkeitstheorie erlaubt uns aber, anzugeben, wie ungenau diese Schätzung ist. Damit hat man eine wahrscheinlichkeitstheoretisch verlässliche Aussage. 38 / 76

39 Konfidenzintervalle Der Bereich, in dem sich ein gewisser (hoher) Prozentsatz aller möglichen Mittelwerte eines Populationsmerkmals befinden, die einen gewissen Stichprobenmittelwert erzeugt haben können, heißt Konfidenzintervall. Üblicherweise wird als Genauigkeit eines Konfidenzintervalls 95% oder 99% festgelegt. Dies bedeutet: Wenn wir einen Stichprobenmittelwert x haben und ein Konfidenzintervall für den Mittelwert µ auf der Gesamtpopulation angeben, dann ist die Wahrscheinlichkeit, dass µ wirklich innerhalb dieses Intervalls liegt, 95% bzw. 99%. 39 / 76

40 Berechnung des Konfidenzintervalls Nehmen wir an, wir haben eine genügend große Stichprobe für ein Populationsmerkmal. Dann ist X normalverteilt mit Mittelwert µ und Standardabweichung σ x. Wir können von X den Mittelwert abziehen und durch den Standardfehler dividieren, dann erhalten wir sogar eine standardnormalverteilte Zufallsvariable Z: Z = X µ σ x Dieses Z kennen wir bereits als die z-transformierte von X. 40 / 76

41 Berechnung des Konfidenzintervalls Wir wollen das Konfidenzintervall zur Genauigkeit 95% berechnen. Eine Tabelle der Standardnormalverteilung liefert uns die Information, dass sich zwischen z ± = ± % der Gesamtwahrscheinlichkeitsmasse dieser Verteilung befinden. Das heißt, eine Realisierung z der oben definierten Zufallsvariablen Z liegt mit 95% Wahrscheinlichkeit im Bereich [z, z + ]. 41 / 76

42 Berechnung des Konfidenzintervalls Eine Realisierung z der oben definierten Zufallsvariablen Z liegt mit 95% Wahrscheinlichkeit im Bereich [z, z + ]. Durch Einsetzen in die Gleichung z = X µ ergibt sich, dass dann eine σ x Realisierung x von X mit 95% Wahrscheinlichkeit im Bereich [ x, x + ] mit x ± = µ ± 1.96 σ x liegt! Also: Wenn wir eine Stichprobe mit der oben festgelegten Größe ziehen und auf dieser Basis den empirischen Mittelwert x berechnen, dann liegt dieser Wert mit 95% Wahrscheinlichkeit nicht weiter als 1.96 σ x vom echten Mittelwert µ entfernt! 42 / 76

43 Berechnung des Konfidenzintervalls Das Intervall I γ der Breite 2 c(γ) σ x um den Mittelwert x einer Stichprobe nennt man Konfidenzintervall für den Parameter µ zum Konfidenzniveau γ. Der Wert von c ergibt sich aus dem gewünschten γ - für γ = 0.95 ist c = Damit haben wir eine Möglichkeit gefunden, die Lage des unbekannten Populationsmittelwertes stochastisch zu beschreiben: Für geeignetes c und eine geeignet große Stichprobe liegt des wahre Populationsmittelwert µ mit Wahrscheinlichkeit γ innerhalb des Intervalls I γ. 43 / 76

44 Beispielrechnung Konfidenzintervall Eine Beispielrechnung: Bei einer Wahlumfrage geben 400 von 1000 Personen an, Partei A wählen zu wollen. Welchen Anteil der Stimmen wird Partei A in der Wahl bekommen? Wir betrachten die Zufallsvariable { 0 Ein Wähler wählt Partei A nicht X = 1 Ein Wähler wählt Partei A. Wir wollen eine Aussage über den Erwartungswert von X treffen. Die 1000 befragten Personen stellen eine Stichprobe dar, aus der wir ein Konfidenzintervall für µ = E(X ) ableiten wollen. 44 / 76

45 Beispielrechnung Konfidenzintervall Unsere Stichproben seien x 1,..., x Als Punktschätzung für µ ergibt sich x = x i = = 0.4. i=1 Wir erinnern uns: x ist eine Realisierung der Zufallsvariablen X. Aufgrund der Stichprobengröße können wir davon ausgehen, dass X normalverteilt ist. 45 / 76

46 Beispielrechnung Konfidenzintervall Wir haben jetzt eine Schätzung für µ = E(X ), nämlich µ = x = 0.4. Die Populationsvarianz σ 2 können wir auch aus der Stichprobe abschätzen, der Schätzwert ˆσ 2 ist ˆσ 2 = (x i x) 2 = ( ) i=1 = = Alternativ verwende die Formel Var(X ) = E(X 2 ) (EX ) 2. Da die x i voneinander unabhängig sind, gilt für die Varianz von X : also σ X σ 2 X = Var( X ) = σ2 N = Var(X i) = , 46 / 76

47 Beispielrechnung Konfidenzintervall Das Konfidenzintervall zur Genauigkeit 95% ergibt sich mit diesen Abschätzungen zu I 95% = [E( X ) 1.96 σ X, E( X ) σ X ] = [ , ] = [0.37, 0.43]. Die Partei A wird also mit 95% Wahrscheinlichkeit zwischen 37% und 43% der Stimmen erhalten. Möchte man eine höhere Genauigkeit, muss man mehr Personen befragen. 47 / 76

48 Zusammenfassung dieses Abschnitts Wir haben im Abschnitt Konfidenzintervall festgestellt, dass der Mittelwert einer Stichprobe selbst eine Zufallsvariable ist die darüber hinaus einer ganz bestimmten Verteilung, nämlich der Normalverteilung, folgt (wenn die Population groß genug ist) Auf dieser Basis konnten wir ein Intervall angeben, das eine 95% sichere Schätzung eines Populationsmittelwerts erlaubt. 48 / 76

49 Übersicht Erinnerung: Elemente der Wahrscheinlichkeitstheorie Stichproben und Konfidenzintervalle Der t-test Der Kolmogorov-Smirnov-Test Bemerkungen zur Versuchsplanung 49 / 76

50 Statistische Tests Das Konfidenzintervall liefert uns eine Aussage darüber, wo sich ein bestimmter Populationsparameter (typischerweise der Mittelwert) befindet. Jetzt wollen wir noch einen Schritt weitergehen und eine Wahrscheinlichkeitsangabe dafür fordern, dass eine gewisse konkrete Aussage wahr ist. In der Medizin könnte die Hypothese lauten: Ein neues Medikament A wirkt besser als ein klassisches Vergleichspräparat B. Solche Aussagen bezeichnet man als Hypothesen. Damit ist also die Argumentationsrichtung anders als bei Punkt- oder Intervallschätzung: Beim Schätzen schließen wir aus in einer Stichprobe erhobenen Daten (Empirie) auf Eigenschaften der Population (Theorie). Bei einen statistischen Test beginnen wir mit einer Hypothese über die Population, die überprüft werden soll. 50 / 76

51 Die wissenschaftliche Hypothese Bei der Formulierung einer Hypothese gibt es verschiedene Ansätze, die hier aus Zeitgründen nicht vollständig behandelt werden. Man unterscheidet typischerweise Unterschiedshypothesen und Zusammenhangshypothesen. Eine typische Unterschiedhypothese spezifiziert einen Unterschied, etwa wie im Beispiel oben: Ein neues Medikament A wirkt besser als ein klassisches Vergleichspräparat B. Dies ist sogar eine gerichtete Hypothese, die die Richtung des Unterschied angibt. Für diese kleine Mühe, die Richtung zu spezifizieren, werden wir mit einer einfacheren statistischen Beweisführung belohnt. 51 / 76

52 Die statistische Hypothese Die wissenschaftliche Hypothese muss nun in eine mathematisch formulierbare statistische Hypothese H 1 überführt werden. Im obigen Beispiel könnte r x die Heilungsrate der Patienten bei Anwendung eines Medikaments sein, dann wäre die statistische Hypothese r A > r B Aber vielleicht ist die Heilungsrate nicht der optimale Parameter? Es gibt oft verschiedene Möglichkeiten, eine statistische Hypothese zu formulieren! Es wird weiterhin eine konkurrierende oder inverse Hypothese aufgestellt, die man als Nullhypothese H 0 bezeichnet: r A r B bzw. A wirkt maximal so gut wie B. 52 / 76

53 Durchführung eines statistischen Tests Der eigentliche Test besteht nun darin, mit statistischen Methoden die Unwahrscheinlichkeit der Nullhypothese zu zeigen, um dann im Umkehrschluss auf die Richtigkeit der Alternativhypothese zu schließen. Nur wenn die Realität (gegeben durch die Stichprobe) praktisch nicht mit der Nullhypothese zu erklären ist, darf die Nullhypothese zugunsten der Alternativhypothese verworfen werden. Merkregel: Die Nullhypothese stellt die Basis dar, von der aus entschieden wird, ob die Alternativhypothese akzeptiert werden kann oder nicht. 53 / 76

54 Fehler bei statistischen Entscheidungen Jeder statistische Test kann eine falsche Aussage liefern, da er von der zufällig gewählten Stichprobe abhängt. Man unterscheidet Fehler 1. Art (α) und Fehler 2. Art (β). Entscheidung aufgrund Stichprobe zugunsten: In der Population gilt die H 0 H 1 H 0 OK β-fehler H 1 α-fehler OK Ein β-fehler bedeutet also, dass die neue Hypothese irrtümlich verworfen wird, ein α-fehler bedeutet, dass die alte Hypothese irrtümlich verworfen wird. Je nach Aufgabenstellung muss man entscheiden, welcher Fehler die gravierenderen Konsequenzen hat und eher vermieden werden muss. 54 / 76

55 Der t-test Als Beispiel für einen statistischen Test wollen wir den t-test behandeln, der auf der t-verteilung beruht. Die typische Anwendung dieses Tests ist der Vergleich zweier Stichprobenmittelwerte. Dies bedeutet, dass wir untersuchen wollen, ob zwei Populationen identische Mittelwerte haben. Beispielhypothesen: Sportliche Menschen sind kognitiv leistungsfähiger als unsportliche Menschen. Ein Medikament A heilt mehr Menschen (prozentual) als ein Standardmedikament B. Ein neuer Algorithmus klassifiziert mehr Samples korrekt als ein klassischer Vergleichsalgorithmus. In jedem Fall werden zwei Stichproben gebildet und Mittelwerte µ 1 und µ 2 der zu untersuchenden Größe abgeschätzt. 55 / 76

56 Der t-test Zunächst sollten wir die wissenschaftliche Hypothese in eine statistische Hypothese überführen. Allgemein betrachten wir also als statistische Hypothese: H 1 : µ 1 µ 2 0. Die zugehörige Nullhypothese ist dann H 0 : µ 1 µ 2 = 0. Wir stehen nun wieder vor einem ähnlichen Problem wie bei der Angabe eines Konfidenzintervalls: Die Mittelwerte µ 1 und µ 2 müssen durch Stichprobenmittelwerte abgeschätzt werden. In der Regel werden diese Stichprobenmittelwerte nicht identisch sein, aber wie unterschiedlich müssen sie sein, um aussagen zu können, dass auch µ 1 und µ 2 verschieden sind? 56 / 76

57 Das Signifikanzniveau Klar: Eine statistische Aussage kann man immer nur mit einer gewissen Wahrscheinlichkeit treffen. Diese Wahrscheinlichkeit (Signifikanzniveau) muss man vor dem Test festlegen. Üblicherweise verwendet man ein Signifikanzniveau von α = 5% oder α = 1%. Dieser Wert beschreibt die Irrtumswahrscheinlichkeit für einen α-fehler, also die Irrtumswahrscheinlichkeit, falls wir aufgrund der Stichprobe H 0 verwerfen und H 1 akzeptieren. 57 / 76

58 Der t-test Betrachten wir wieder die Stichprobenmittelwerte x 1 und x 2 als Realisiationen von Zufallsvariablen X 1 und X 2. Die Größen der Stichproben sollen n 1 bzw. n 2 sein. Der Standardfehler dieser Differenz ergibt sich zu σ1 2 σ x1 x 2 = + σ2 2 n 1 n 2 Dieser Standardfehler kann auch auf Basis der Stichproben abgeschätzt werden. 58 / 76

59 Der t-test Es ergibt sich eine Testgröße t = ( x 1 x 2 ) (µ 1 µ 2 ) ˆσ ( x1 x 2 ) Setzt man entsprechend der Nullhypothese (µ 1 µ 2 ) = 0, so erhält man die Form t = ( x 1 x 2 ) ˆσ ( x1 x 2 ) Wir normieren also die Differenz der Mittelwerte an ihrer Streuung. Was können wir über diese Zufallsvariable aussagen? 59 / 76

60 Der t-test Betrachte t = ( x 1 x 2 ) ˆσ ( x1 x 2 ) Man kann zeigen: Falls die Nullhypothese zutrifft, hat t Mittelwert 0 und Standardfehler 1. ist t t-verteilt mit n 1 + n 2 2 Freiheitsgraden. Die t-verteilung ist ähnlich wie die Standardnormalverteilung tabelliert. Jetzt können wir prüfen, welche Fläche der ausgerechnete t-wert von der t-verteilung abschneidet, ähnlich wie wir es bei der Berechnung des Konfidenzintervalls getan haben. Ist t so sehr von Null verschieden, dass dieses Ergebnise bei Gültigkeit der Nullhypothese sehr unwahrscheinlich ist? 60 / 76

61 Der t-test Wir schauen, welcher Anteil der Fläche unter der t-dichtefunktion mit n 1 + n 2 2 Freiheitsgraden vom empirischen t-wert abgeschnitten wird. Bei einer ungerichteten Hypothese muss der ermittelte Wert p(t) noch verdoppelt werden. Heraus kommt die Wahrscheinlichkeit, mit der wir uns irren, wenn wir H 0 zugunsten von H 1 ablehnen. Ist dieser Wert geringer als 0.05, so sagen wir, die Hypothese H 1 trifft auf einem Signifikanzniveau von 0.05 zu dies bedeutet, dass µ 1 µ 2. Die Nullhypothese kann also nur dann abgelehnt werden, wenn der Wert der Testgröße t eine kritische Schwelle überschreitet, die man einer entsprechenden Tabelle entnehmen kann. 61 / 76

62 Voraussetzungen Sind die Stichproben klein (jeweils n 1, n 2 30), so muss vorausgesetzt werden, dass der zu untersuchende Parameter in der Population normalverteilt ist. Die Varianzen der beiden Stichproben müssen (annähernd) gleich sein. Die Stichproben müssen voneinander unabhängig sein. Ist dies nicht der Fall, wird der t-test für abhängige Stichproben verwendet. 62 / 76

63 t-test: Rechenbeispiel Ein kleines Rechenbeispiel für den t-test (aus Bortz: Statistik für Humanund Sozialwissenschaftler, 6. Auflage, Seite 138): Man hat ermittelt, dass Ratten im Durchschnitt 170s benötigen, um einen bestimmten Mechanismus zu bedienen. Diese Zeiten sind annähernd normalverteilt mit einer Streuung von ˆσ = 12. Es soll überprüft werden, ob Ratten, deren Eltern bereits konditioniert (trainiert) waren, diese Aufgabe schneller ausführen können (einseitiger Test, Signifikanzniveau α = 5%). 20 Ratten mit konditionierten Eltern erzielen eine Durchschnittszeit von 163s. 63 / 76

64 t-test: Rechenbeispiel In diesem Problem sind der Stichprobenmittelwert x = 163, der Populationsmittelwert µ 0 = 170 und die Streuung der Stichprobenmittelwerts ˆσ x = 12/ Der t-wert ergibt sich zu t = ( x 1 x 2 ) = ˆσ x 2.68 Der kritische Wert in der t-verteilung mit 19 Freiheitsgraden, der von einer Seite der Verteilung 5% abschneidet, ist t 5% = Wegen t > t 5% ist das gefundene Ergebnis also signifikant: Ratten, deren Eltern schon konditioniert waren, lernen schneller als Ratten mit nicht konditionierten Eltern. Jetzt könnte man noch Konfidenzintervalle berechnen, um das Ergebnis noch genauer zu quantifizieren. 64 / 76

65 Der t-test für abhängige Stichproben Eine kleine Variante des t-tests: Wir betrachten Stichproben, deren Objekte paarweise verbunden sind. Beispiele für solche Stichproben: (Irgendwelche) Eigenschaften von Ehemann und Ehefrau. Medikamentenstudien an Paaren von Personen, die einander möglichst ähnlich sind. Messwiederholungen: Eine Messung wird vor und nach einer bestimmten Handlung (etwa medikamentöse Behandlung) durchgeführt, oder die Ergebnisse zweier Klassifikationsalgorithmen auf demselben Datensatz werden verglichen (kommt am CSL sehr häufig vor). In einem solchen Fall betrachtet man nicht die Differenz von Mittelwerten, sondern man nimmt die Messwertdifferenz für jedes einzelne Sample und betrachtet die Verteilung dieser Differenzen. 65 / 76

66 t-test für abh. Stichproben: Durchführung Wir nehmen an, wir haben eine Reihe von Messwerten x (1) i und x (2) i = 1,..., N. Für jedes Messwertpaar bilden wir nun die Differenz der Messwerte d i = x (1) i x (2) i. Wir berechnen das arithmetische Mittel aller d i -Werte N i=1 x d = d i. N Der Standardfehler der Verteilung der Differenzmittelwerte ist wie gehabt ˆσ xd 66 / 76 = ˆσ d n wobei ˆσ d wie üblich eine Abschätzung der Varianz der Differenzen σ d ist. i,

67 t-test für abh. Stichproben: Durchführung Aus der durchschnittlichen Differenz berechnen wir wieder eine t-testgröße t = x d µ d die sich vereinfacht, wenn wir die Nullhypothese annehmen: ˆσ xd t = x d Dieser Wert wird (z.b. anhand einer Tabelle) mit dem kritischen t-wert verglichen, der vom gewünschten Signifikanzniveau und von der Anzahl der Freiheitsgrade abhängt. ˆσ xd 67 / 76

68 Übersicht Erinnerung: Elemente der Wahrscheinlichkeitstheorie Stichproben und Konfidenzintervalle Der t-test Der Kolmogorov-Smirnov-Test Bemerkungen zur Versuchsplanung 68 / 76

69 Der Kolmogorov-Smirnov-Test Zur Vervollständigung machen wir noch ein weiteres Beispiel: Den Kolmogorov-Smirnov-Test. Dieser Test kann verwendet werden, um 1. zu prüfen, ob zwei Verteilungen von irgendwelchen Merkmalen übereinstimmen 2. ob ein Merkmal eine angenommene Verteilung hat. Beispiel: Viele Tests (u.a. der t-test) erfordern, dass das Populationsmerkmal eine gewisse Verteilung hat (z.b. Normalverteilung). Beachte: Gerade für die Normalverteilung gibt es auch bessere Tests! 69 / 76

70 Der Kolmogorov-Smirnov-Test Betrachten wir den zweiten Fall: Wie haben eine Datenmenge x 1,..., x N, und wir wollen feststellen, ob sie einer gewissen Verteilung folgt. Wie testet man so etwas? Nehmen wir an, die angenommene Verteilung hat eine Verteilungsfunktion F 0, wenn f 0 die Dichte ist, ist also F 0 (x) = x 70 / 76 f 0 (ξ)dξ. Für die Datenreihe nehmen wir dementsprechend die empirische Verteilungsfunktion F X (x) = x i I (x i x) mit I (y x) = { 1 wenn y x 0 sonst.

71 Der Kolmogorov-Smirnov-Test Die Nullhypothese soll sein: mit der Alternativhypothese H 0 : F 0 = F X H 1 : F 0 F X Man kann zeigen: Falls die Nullhypothese gilt, so geht bei zunehmender Anzahl von Samples F X gegen F 0, und zwar gleichmäßig. Daher ist der maximale Anstand von F 0 und F X ein gutes Testkriterium: d = max x R F X (x) F 0 (x) = F X F 0 d ist die Realisierung einer Zufallsvariablen D, die der Kolmogorov-Verteilung folgt. Diese ist ebenso wie die t-verteilung tabelliert (bzw. in Statistikprogrammen enthalten). Nun muss man also nur d ausrechen - wenn d einen gewissen Schwellwert überschreitet, wird H 0 verworfen. 71 / 76

72 Zusammenfassung: Tests Damit haben wir den Abschnitt Statistische Tests abgeschlossen. Wichtig war uns nicht so sehr die konkrete Anwendung (dazu müssten wir viel mehr Tests betrachten, sowie ihre Stärken, Schwächen, und Voraussetzungen), sondern die grundlegenden Ideen: Wie funktioniert ein statistischer Test Zwei Beispiele, was man so alles testen kann Aufstellung der Hypothese Weitere Details überlassen wir den Lehrbüchern. 72 / 76

73 Übersicht Erinnerung: Elemente der Wahrscheinlichkeitstheorie Stichproben und Konfidenzintervalle Der t-test Der Kolmogorov-Smirnov-Test Bemerkungen zur Versuchsplanung 73 / 76

74 Versuchsplanung Worauf muss man achten, wenn man einen Versuch plant und das Ergebnis statistisch (z.b. durch t-test) absichern will? Insbesondere gilt: Es muss zuerst eine Hypothese gefunden werden, die danach an einer Testdatenmenge abgesichert wird. Üblicherweise erreicht man dies, indem man vor dem Versuch eine Testdatenmenge beiseite legt und erst zur Evaluation wieder betrachtet. Die verbleibenden Daten teilt man in Trainingsdaten und Kreuzvalidierungsdaten auf. Während des Versuchs werden die Kreuzvalidierungsdaten zum Testen der Modelle verwendet, um eventuelle Parameter zu optimieren. 74 / 76

75 Versuchsplanung Nach einer Versuchsreihe (mit diversen Optimierungsschritten) könnte die wissenschaftliche Hypothese dann so aussehen: Algorithmus A mit Parametern p i = γ i erreicht eine bessere Erkennungsrate als Algorithmus B. Die Ergebnisse auf den Kreuzvalidierungsdaten lassen aber eine Signifikanzaussage nicht zu, weil wir eben auf der Kreuzvalidierungsmenge optimiert haben! Jetzt werden zum ersten Mal die Testdaten betrachtet: Durch Ausführung der beiden Algorithmen (A und B) auf der Testdatenmenge ergibt sich ein Resultat, das man nun mit Hilfe eines geeigneten statistischen Tests überprüfen kann, um so zu einer abgesicherten Aussage zu kommen. 75 / 76

76 Zusammenfassung Wir haben in dieser Vorlesung folgendes gelernt: Definitionen von Erwartungswert und Varianz dies sind die wichtigsten statistischen Größen überhaupt! Abschätzung von Erwartungswert und Varianz Wenn wir eine Stichprobe haben, sind Erwartungswert usw. selbst wieder Zufallsvariablen und sind (annähernd) normalverteilt daraus konnten wir ein Konfidenzintervall für den Erwartungswert berechnen. Definition von statistischen Tests, Aufstellung von Hypothesen Der t-test als einfaches Beispiel: Berechnung einer Testgröße (in diesem Fall t-verteilt) Feststellung, ob die Testgröße einen kritischen Wert überschreitet Mögliche Ablehnung der Nullhypothese. Der Kolmogorov-Smirnov-Test 76 / 76

Fit for Abi & Study Stochastik

Fit for Abi & Study Stochastik Fit for Abi & Study Stochastik Prof. Dr. Tilla Schade Hochschule Harz 15. und 16. April 2014 No. 1 Stochastik besteht aus: Wahrscheinlichkeitsrechnung Statistik No. 2 Gliederung Grundlagen Zufallsgrößen

Mehr

Wichtige Definitionen und Aussagen

Wichtige Definitionen und Aussagen Wichtige Definitionen und Aussagen Zufallsexperiment, Ergebnis, Ereignis: Unter einem Zufallsexperiment verstehen wir einen Vorgang, dessen Ausgänge sich nicht vorhersagen lassen Die möglichen Ausgänge

Mehr

Wahrscheinlichkeitsverteilungen

Wahrscheinlichkeitsverteilungen Universität Bielefeld 3. Mai 2005 Wahrscheinlichkeitsrechnung Wahrscheinlichkeitsrechnung Das Ziehen einer Stichprobe ist die Realisierung eines Zufallsexperimentes. Die Wahrscheinlichkeitsrechnung betrachtet

Mehr

5. Schließende Statistik (Inferenzstatistik, konfirmatorische Verfahren)

5. Schließende Statistik (Inferenzstatistik, konfirmatorische Verfahren) 5. Schließende Statistik (Inferenzstatistik, konfirmatorische Verfahren) 5.1. Einführung Schätzen unbekannter Parameter im Modell, z.b. Wahrscheinlichkeiten p i (Anteile in der Gesamtmenge), Erwartungswerte

Mehr

4.1. Nullhypothese, Gegenhypothese und Entscheidung

4.1. Nullhypothese, Gegenhypothese und Entscheidung rof. Dr. Roland Füss Statistik II SS 8 4. Testtheorie 4.. Nullhypothese, Gegenhypothese und Entscheidung ypothesen Annahmen über die Verteilung oder über einzelne arameter der Verteilung eines Merkmals

Mehr

Probleme bei kleinen Stichprobenumfängen und t-verteilung

Probleme bei kleinen Stichprobenumfängen und t-verteilung Probleme bei kleinen Stichprobenumfängen und t-verteilung Fassen wir zusammen: Wir sind bisher von der Frage ausgegangen, mit welcher Wahrscheinlichkeit der Mittelwert einer empirischen Stichprobe vom

Mehr

Stichproben Parameterschätzung Konfidenzintervalle:

Stichproben Parameterschätzung Konfidenzintervalle: Stichproben Parameterschätzung Konfidenzintervalle: Beispiel Wahlprognose: Die Grundgesamtheit hat einen Prozentsatz p der Partei A wählt. Wenn dieser Prozentsatz bekannt ist, dann kann man z.b. ausrechnen,

Mehr

Statistik und Wahrscheinlichkeitsrechnung

Statistik und Wahrscheinlichkeitsrechnung Statistik und Wahrscheinlichkeitsrechnung Dr. Jochen Köhler 1 Inhalt der heutigen Vorlesung Statistik und Wahrscheinlichkeitsrechnung Zusammenfassung der vorherigen Vorlesung Übersicht über Schätzung und

Mehr

5. Seminar Statistik

5. Seminar Statistik Sandra Schlick Seite 1 5. Seminar 5. Seminar Statistik 30 Kurztest 4 45 Testen von Hypothesen inkl. Übungen 45 Test- und Prüfverfahren inkl. Übungen 45 Repetitorium und Prüfungsvorbereitung 15 Kursevaluation

Mehr

Wahrscheinlichkeit und Statistik: Zusammenfassung

Wahrscheinlichkeit und Statistik: Zusammenfassung HSR Hochschule für Technik Rapperswil Wahrscheinlichkeit und Statistik: Zusammenfassung beinhaltet Teile des Skripts von Herrn Hardy von Lukas Wilhelm lwilhelm.net 12. Januar 2007 Inhaltsverzeichnis 1

Mehr

3 Grundlagen statistischer Tests (Kap. 8 IS)

3 Grundlagen statistischer Tests (Kap. 8 IS) 3 Grundlagen statistischer Tests (Kap. 8 IS) 3.1 Beispiel zum Hypothesentest Beispiel: Betrachtet wird eine Abfüllanlage für Mineralwasser mit dem Sollgewicht µ 0 = 1000g und bekannter Standardabweichung

Mehr

SozialwissenschaftlerInnen II

SozialwissenschaftlerInnen II Statistik für SozialwissenschaftlerInnen II Henning Best best@wiso.uni-koeln.de Universität zu Köln Forschungsinstitut für Soziologie Statistik für SozialwissenschaftlerInnen II p.1 Testen von Hypothesen

Mehr

Zusammenfassung Mathe II. Themenschwerpunkt 2: Stochastik (ean) 1. Ein- und mehrstufige Zufallsexperimente; Ergebnismengen

Zusammenfassung Mathe II. Themenschwerpunkt 2: Stochastik (ean) 1. Ein- und mehrstufige Zufallsexperimente; Ergebnismengen Zusammenfassung Mathe II Themenschwerpunkt 2: Stochastik (ean) 1. Ein- und mehrstufige Zufallsexperimente; Ergebnismengen Zufallsexperiment: Ein Vorgang, bei dem mindestens zwei Ereignisse möglich sind

Mehr

Statistisches Testen

Statistisches Testen Statistisches Testen Grundlegendes Prinzip Erwartungswert Bekannte Varianz Unbekannte Varianz Differenzen Anteilswert Chi-Quadrat Tests Gleichheit von Varianzen Prinzip des Statistischen Tests Konfidenzintervall

Mehr

Statistik I für Betriebswirte Vorlesung 14

Statistik I für Betriebswirte Vorlesung 14 Statistik I für Betriebswirte Vorlesung 14 Dr. Andreas Wünsche TU Bergakademie Freiberg Institut für Stochastik 13. Juli 017 Dr. Andreas Wünsche Statistik I für Betriebswirte Vorlesung 14 Version: 8. Juli

Mehr

Hypothesen: Fehler 1. und 2. Art, Power eines statistischen Tests

Hypothesen: Fehler 1. und 2. Art, Power eines statistischen Tests ue biostatistik: hypothesen, fehler 1. und. art, power 1/8 h. lettner / physik Hypothesen: Fehler 1. und. Art, Power eines statistischen Tests Die äußerst wichtige Tabelle über die Zusammenhänge zwischen

Mehr

WS 2014/15. (d) Bestimmen Sie die Wahrscheinlichkeitsfunktion von X. (e) Bestimmen Sie nun den Erwartungswert und die Varianz von X.

WS 2014/15. (d) Bestimmen Sie die Wahrscheinlichkeitsfunktion von X. (e) Bestimmen Sie nun den Erwartungswert und die Varianz von X. Fragenkatalog zur Übung Methoden der empirischen Sozialforschung WS 2014/15 Hier finden Sie die denkbaren Fragen zum ersten Teil der Übung. Das bedeutet, dass Sie zu diesem Teil keine anderen Fragen im

Mehr

6. Schätzverfahren für Parameter

6. Schätzverfahren für Parameter 6. Schätzverfahren für Parameter Ausgangssituation: Ein interessierender Zufallsvorgang werde durch die ZV X repräsentiert X habe eine unbekannte Verteilungsfunktion F X (x) Wir interessieren uns für einen

Mehr

5. Spezielle stetige Verteilungen

5. Spezielle stetige Verteilungen 5. Spezielle stetige Verteilungen 5.1 Stetige Gleichverteilung Eine Zufallsvariable X folgt einer stetigen Gleichverteilung mit den Parametern a und b, wenn für die Dichtefunktion von X gilt: f x = 1 für

Mehr

Statistische Methoden in den Umweltwissenschaften

Statistische Methoden in den Umweltwissenschaften Statistische Methoden in den Umweltwissenschaften Stetige und diskrete Wahrscheinlichkeitsverteilungen Lageparameter Streuungsparameter Diskrete und stetige Zufallsvariablen Eine Variable (oder Merkmal

Mehr

Jost Reinecke. 7. Juni 2005

Jost Reinecke. 7. Juni 2005 Universität Bielefeld 7. Juni 2005 Testtheorie Test für unabhängige Stichproben Test für abhängige Stichproben Testtheorie Die Testtheorie beinhaltet eine Reihe von Testverfahren, die sich mit der Überprüfung

Mehr

73 Hypothesentests Motivation Parametertest am Beispiel eines Münzexperiments

73 Hypothesentests Motivation Parametertest am Beispiel eines Münzexperiments 73 Hypothesentests 73.1 Motivation Bei Hypothesentests will man eine gewisse Annahme über eine Zufallsvariable darauf hin überprüfen, ob sie korrekt ist. Beispiele: ( Ist eine Münze fair p = 1 )? 2 Sind

Mehr

Klassifikation von Signifikanztests

Klassifikation von Signifikanztests Klassifikation von Signifikanztests nach Verteilungsannahmen: verteilungsabhängige = parametrische Tests verteilungsunabhängige = nichtparametrische Tests Bei parametrischen Tests werden im Modell Voraussetzungen

Mehr

Konkretes Durchführen einer Inferenzstatistik

Konkretes Durchführen einer Inferenzstatistik Konkretes Durchführen einer Inferenzstatistik Die Frage ist, welche inferenzstatistischen Schlüsse bei einer kontinuierlichen Variablen - Beispiel: Reaktionszeit gemessen in ms - von der Stichprobe auf

Mehr

4. Schließende Statistik (Inferenzstatistik, konfirmatorische Verfahren)

4. Schließende Statistik (Inferenzstatistik, konfirmatorische Verfahren) 4. Schließende Statistik (Inferenzstatistik, konfirmatorische Verfahren) 4.1. Einführung Schätzen unbekannter Parameter im Modell, z.b. Wahrscheinlichkeiten p i (Anteile in der Gesamtmenge), Erwartungswerte

Mehr

DWT 2.1 Maximum-Likelihood-Prinzip zur Konstruktion von Schätzvariablen 330/467 Ernst W. Mayr

DWT 2.1 Maximum-Likelihood-Prinzip zur Konstruktion von Schätzvariablen 330/467 Ernst W. Mayr 2.1 Maximum-Likelihood-Prinzip zur Konstruktion von Schätzvariablen Wir betrachten nun ein Verfahren zur Konstruktion von Schätzvariablen für Parameter von Verteilungen. Sei X = (X 1,..., X n ). Bei X

Mehr

Die Familie der χ 2 (n)-verteilungen

Die Familie der χ 2 (n)-verteilungen Die Familie der χ (n)-verteilungen Sind Z 1,..., Z m für m 1 unabhängig identisch standardnormalverteilte Zufallsvariablen, so genügt die Summe der quadrierten Zufallsvariablen χ := m Z i = Z 1 +... +

Mehr

Aufgabenblock 4. Da Körpergröße normalverteilt ist, erhalten wir aus der Tabelle der t-verteilung bei df = 19 und α = 0.05 den Wert t 19,97.

Aufgabenblock 4. Da Körpergröße normalverteilt ist, erhalten wir aus der Tabelle der t-verteilung bei df = 19 und α = 0.05 den Wert t 19,97. Aufgabenblock 4 Aufgabe ) Da s = 8. cm nur eine Schätzung für die Streuung der Population ist, müssen wir den geschätzten Standardfehler verwenden. Dieser berechnet sich als n s s 8. ˆ = = =.88. ( n )

Mehr

Verteilungen eindimensionaler stetiger Zufallsvariablen Stetige Verteilungen. Chi-Quadrat-Verteilung Studentverteilung Fisher-Verteilung

Verteilungen eindimensionaler stetiger Zufallsvariablen Stetige Verteilungen. Chi-Quadrat-Verteilung Studentverteilung Fisher-Verteilung Verteilungen eindimensionaler stetiger Zufallsvariablen Stetige Verteilungen Chi-Quadrat-Verteilung Studentverteilung Fisher-Verteilung Typisierung der stetigen theoretischen Verteilungen Bibliografie:

Mehr

Statistik Testverfahren. Heinz Holling Günther Gediga. Bachelorstudium Psychologie. hogrefe.de

Statistik Testverfahren. Heinz Holling Günther Gediga. Bachelorstudium Psychologie. hogrefe.de rbu leh ch s plu psych Heinz Holling Günther Gediga hogrefe.de Bachelorstudium Psychologie Statistik Testverfahren 18 Kapitel 2 i.i.d.-annahme dem unabhängig. Es gilt also die i.i.d.-annahme (i.i.d = independent

Mehr

Zentraler Grenzwertsatz/Konfidenzintervalle

Zentraler Grenzwertsatz/Konfidenzintervalle / Statistik I Sommersemester 2009 Statistik I ZGWS/ (1/37) Kann Ahmadinejad die Wahl gewonnen haben? Im wesentlichen Dreiteilung der polit. Elite 2005: 17.3 Millionen Stimmen (Stichwahl), Wahlbeteiligung

Mehr

Schließende Statistik

Schließende Statistik Schließende Statistik [statistical inference] Sollen auf der Basis von empirischen Untersuchungen (Daten) Erkenntnisse gewonnen und Entscheidungen gefällt werden, sind die Methoden der Statistik einzusetzen.

Mehr

2. Formulieren von Hypothesen. Nullhypothese: H 0 : µ = 0 Gerät exakt geeicht

2. Formulieren von Hypothesen. Nullhypothese: H 0 : µ = 0 Gerät exakt geeicht 43 Signifikanztests Beispiel zum Gauß-Test Bei einer Serienfertigung eines bestimmten Typs von Messgeräten werden vor der Auslieferung eines jeden Gerätes 10 Kontrollmessungen durchgeführt um festzustellen,

Mehr

Statistik II. IV. Hypothesentests. Martin Huber

Statistik II. IV. Hypothesentests. Martin Huber Statistik II IV. Hypothesentests Martin Huber 1 / 41 Übersicht Struktur eines Hypothesentests Stichprobenverteilung t-test: Einzelner-Parameter-Test F-Test: Multiple lineare Restriktionen 2 / 41 Struktur

Mehr

Chi-Quadrat-Verteilung

Chi-Quadrat-Verteilung Chi-Quadrat-Verteilung Wikipedia http://de.wikipedia.org/wiki/chi-quadrat-verteilung 1 von 7 6/18/2009 6:13 PM Chi-Quadrat-Verteilung aus Wikipedia, der freien Enzyklopädie Die Chi-Quadrat-Verteilung ist

Mehr

Willkommen zur Vorlesung Statistik (Master)

Willkommen zur Vorlesung Statistik (Master) Willkommen zur Vorlesung Statistik (Master) Thema dieser Vorlesung: Verteilungen stetiger Zufallsvariablen Prof. Dr. Wolfgang Ludwig-Mayerhofer Universität Siegen Philosophische Fakultät, Seminar für Sozialwissenschaften

Mehr

Konfidenzintervalle Grundlegendes Prinzip Erwartungswert Bekannte Varianz Unbekannte Varianz Anteilswert Differenzen von Erwartungswert Anteilswert

Konfidenzintervalle Grundlegendes Prinzip Erwartungswert Bekannte Varianz Unbekannte Varianz Anteilswert Differenzen von Erwartungswert Anteilswert Konfidenzintervalle Grundlegendes Prinzip Erwartungswert Bekannte Varianz Unbekannte Varianz Anteilswert Differenzen von Erwartungswert Anteilswert Beispiel für Konfidenzintervall Im Prinzip haben wir

Mehr

2.3 Intervallschätzung

2.3 Intervallschätzung 2.3.1 Motivation und Hinführung Bsp. 2.11. [Wahlumfrage] Der wahre Anteil der rot-grün Wähler 2009 war genau 33.7%. Wie groß ist die Wahrscheinlichkeit, in einer Zufallsstichprobe von 1000 Personen genau

Mehr

Statistische Tests für unbekannte Parameter

Statistische Tests für unbekannte Parameter Konfidenzintervall Intervall, das den unbekannten Parameter der Verteilung mit vorgegebener Sicherheit überdeckt ('Genauigkeitsaussage' bzw. Zuverlässigkeit einer Punktschätzung) Statistischer Test Ja-Nein-Entscheidung

Mehr

Bereiche der Statistik

Bereiche der Statistik Bereiche der Statistik Deskriptive / Exploratorische Statistik Schließende Statistik Schließende Statistik Inferenz-Statistik (analytische, schließende oder konfirmatorische Statistik) baut auf der beschreibenden

Mehr

Klassifikation von Signifikanztests

Klassifikation von Signifikanztests Klassifikation von Signifikanztests Nach Verteilungsannahmen: verteilungsabhängig: parametrischer [parametric] Test verteilungsunabhängig: nichtparametrischer [non-parametric] Test Bei parametrischen Tests

Mehr

Hypothesenprüfung. Darüber hinaus existieren zahlreiche andere Testverfahren, die alle auf der gleichen Logik basieren

Hypothesenprüfung. Darüber hinaus existieren zahlreiche andere Testverfahren, die alle auf der gleichen Logik basieren Hypothesenprüfung Teil der Inferenzstatistik Befaßt sich mit der Frage, wie Hypothesen über eine (in der Regel unbekannte) Grundgesamtheit an einer Stichprobe überprüft werden können Behandelt werden drei

Mehr

SozialwissenschaftlerInnen II

SozialwissenschaftlerInnen II Statistik für SozialwissenschaftlerInnen II Henning Best best@wiso.uni-koeln.de Universität zu Köln Forschungsinstitut für Soziologie Statistik für SozialwissenschaftlerInnen II p.1 Wahrscheinlichkeitsfunktionen

Mehr

Willkommen zur Vorlesung Statistik (Master)

Willkommen zur Vorlesung Statistik (Master) Willkommen zur Vorlesung Statistik (Master) Thema dieser Vorlesung: Punkt- und Prof. Dr. Wolfgang Ludwig-Mayerhofer Universität Siegen Philosophische Fakultät, Seminar für Sozialwissenschaften Prof. Dr.

Mehr

Mathematische und statistische Methoden II

Mathematische und statistische Methoden II Methodenlehre e e Prof. Dr. G. Meinhardt 6. Stock, Wallstr. 3 (Raum 06-06) Sprechstunde jederzeit nach Vereinbarung und nach der Vorlesung. Mathematische und statistische Methoden II Dr. Malte Persike

Mehr

5. Stichproben und Statistiken

5. Stichproben und Statistiken 5. Stichproben und Statistiken Problem: Es sei X eine ZV, die einen interessierenden Zufallsvorgang repräsentiere Man möchte die tatsächliche Verteilung von X kennenlernen (z.b. mittels der VF F X (x)

Mehr

Häufigkeitsverteilungen

Häufigkeitsverteilungen Häufigkeitsverteilungen Eine Häufigkeitsverteilung gibt die Verteilung eines erhobenen Merkmals an und ordnet jeder Ausprägung die jeweilige Häufigkeit zu. Bsp.: 100 Studenten werden gefragt, was sie studieren.

Mehr

Statistische Tests (Signifikanztests)

Statistische Tests (Signifikanztests) Statistische Tests (Signifikanztests) [testing statistical hypothesis] Prüfen und Bewerten von Hypothesen (Annahmen, Vermutungen) über die Verteilungen von Merkmalen in einer Grundgesamtheit (Population)

Mehr

Modellanpassung und Parameterschätzung. A: Übungsaufgaben

Modellanpassung und Parameterschätzung. A: Übungsaufgaben 7 Modellanpassung und Parameterschätzung 1 Kapitel 7: Modellanpassung und Parameterschätzung A: Übungsaufgaben [ 1 ] Bei n unabhängigen Wiederholungen eines Bernoulli-Experiments sei π die Wahrscheinlichkeit

Mehr

Zufallsvariablen [random variable]

Zufallsvariablen [random variable] Zufallsvariablen [random variable] Eine Zufallsvariable (Zufallsgröße) X beschreibt (kodiert) die Versuchsausgänge ω Ω mit Hilfe von Zahlen, d.h. X ist eine Funktion X : Ω R ω X(ω) Zufallsvariablen werden

Mehr

Willkommen zur Vorlesung Statistik (Master)

Willkommen zur Vorlesung Statistik (Master) Willkommen zur Vorlesung Statistik (Master) Thema dieser Vorlesung: Punkt- und Prof. Dr. Wolfgang Ludwig-Mayerhofer Universität Siegen Philosophische Fakultät, Seminar für Sozialwissenschaften Prof. Dr.

Mehr

Vorlesung: Statistik II für Wirtschaftswissenschaft

Vorlesung: Statistik II für Wirtschaftswissenschaft Vorlesung: Statistik II für Wirtschaftswissenschaft Prof. Dr. Helmut Küchenhoff Institut für Statistik, LMU München Sommersemester 2017 Einführung 1 Wahrscheinlichkeit: Definition und Interpretation 2

Mehr

2.2 Binomialverteilung, Hypergeometrische Verteilung, Poissonverteilung

2.2 Binomialverteilung, Hypergeometrische Verteilung, Poissonverteilung 2.2 Binomialverteilung, Hypergeometrische Verteilung, Poissonverteilung Die einfachste Verteilung ist die Gleichverteilung, bei der P(X = x i ) = 1/N gilt, wenn N die Anzahl möglicher Realisierungen von

Mehr

Statistische Tests. Kapitel Grundbegriffe. Wir betrachten wieder ein parametrisches Modell {P θ : θ Θ} und eine zugehörige Zufallsstichprobe

Statistische Tests. Kapitel Grundbegriffe. Wir betrachten wieder ein parametrisches Modell {P θ : θ Θ} und eine zugehörige Zufallsstichprobe Kapitel 4 Statistische Tests 4.1 Grundbegriffe Wir betrachten wieder ein parametrisches Modell {P θ : θ Θ} und eine zugehörige Zufallsstichprobe X 1,..., X n. Wir wollen nun die Beobachtung der X 1,...,

Mehr

Mathematische Statistik Aufgaben zum Üben. Schätzer

Mathematische Statistik Aufgaben zum Üben. Schätzer Prof. Dr. Z. Kabluchko Wintersemester 2016/17 Philipp Godland 14. November 2016 Mathematische Statistik Aufgaben zum Üben Keine Abgabe Aufgabe 1 Schätzer Es seien X 1,..., X n unabhängige und identisch

Mehr

Trim Size: 176mm x 240mm Lipow ftoc.tex V1 - March 9, :34 P.M. Page 11. Über die Übersetzerin 9. Einleitung 19

Trim Size: 176mm x 240mm Lipow ftoc.tex V1 - March 9, :34 P.M. Page 11. Über die Übersetzerin 9. Einleitung 19 Trim Size: 176mm x 240mm Lipow ftoc.tex V1 - March 9, 2016 6:34 P.M. Page 11 Inhaltsverzeichnis Über die Übersetzerin 9 Einleitung 19 Was Sie hier finden werden 19 Wie dieses Arbeitsbuch aufgebaut ist

Mehr

Inferenzstatistik und Hypothesentests. Hierbei geht es um die Absicherung eines Untersuchungsergebnisses gegen ein Zufallsereignis.

Inferenzstatistik und Hypothesentests. Hierbei geht es um die Absicherung eines Untersuchungsergebnisses gegen ein Zufallsereignis. Statistik II und Hypothesentests Dr. Michael Weber Aufgabenbereich Hierbei geht es um die Absicherung eines Untersuchungsergebnisses gegen ein Zufallsereignis. Ist die zentrale Fragestellung für alle statistischen

Mehr

7. Hypothesentests. Ausgangssituation erneut: ZV X repräsentiere einen Zufallsvorgang. X habe die unbekannte VF F X (x)

7. Hypothesentests. Ausgangssituation erneut: ZV X repräsentiere einen Zufallsvorgang. X habe die unbekannte VF F X (x) 7. Hypothesentests Ausgangssituation erneut: ZV X repräsentiere einen Zufallsvorgang X habe die unbekannte VF F X (x) Interessieren uns für einen unbekannten Parameter θ der Verteilung von X 350 Bisher:

Mehr

Methodenlehre. Vorlesung 10. Prof. Dr. Björn Rasch, Cognitive Biopsychology and Methods University of Fribourg

Methodenlehre. Vorlesung 10. Prof. Dr. Björn Rasch, Cognitive Biopsychology and Methods University of Fribourg Methodenlehre Vorlesung 10 Prof. Dr., Cognitive Biopsychology and Methods University of Fribourg 1 Methodenlehre I Woche Datum Thema 1 FQ Einführung, Verteilung der Termine 1 25.9.13 Psychologie als Wissenschaft

Mehr

k np g(n, p) = Pr p [T K] = Pr p [T k] Φ. np(1 p) DWT 4.1 Einführung 359/467 Ernst W. Mayr

k np g(n, p) = Pr p [T K] = Pr p [T k] Φ. np(1 p) DWT 4.1 Einführung 359/467 Ernst W. Mayr Die so genannte Gütefunktion g gibt allgemein die Wahrscheinlichkeit an, mit der ein Test die Nullhypothese verwirft. Für unser hier entworfenes Testverfahren gilt ( ) k np g(n, p) = Pr p [T K] = Pr p

Mehr

Zweiseitiger Test für den unbekannten Mittelwert µ einer Normalverteilung bei unbekannter Varianz

Zweiseitiger Test für den unbekannten Mittelwert µ einer Normalverteilung bei unbekannter Varianz Grundlage: Zweiseitiger Test für den unbekannten Mittelwert µ einer Normalverteilung bei unbekannter Varianz Die Testvariable T = X µ 0 S/ n genügt der t-verteilung mit n 1 Freiheitsgraden. Auf der Basis

Mehr

70 Wichtige kontinuierliche Verteilungen

70 Wichtige kontinuierliche Verteilungen 70 Wichtige kontinuierliche Verteilungen 70. Motivation Zufallsvariablen sind nicht immer diskret, sie können oft auch jede beliebige reelle Zahl in einem Intervall [c, d] einnehmen. Beispiele für solche

Mehr

Testen von Hypothesen:

Testen von Hypothesen: Testen von Hypothesen: Ein Beispiel: Eine Firma produziert Reifen. In der Entwicklungsabteilung wurde ein neues Modell entwickelt, das wesentlich ruhiger läuft. Vor der Markteinführung muss aber auch noch

Mehr

Lösungen zu den Übungsaufgaben in Kapitel 10

Lösungen zu den Übungsaufgaben in Kapitel 10 Lösungen zu den Übungsaufgaben in Kapitel 10 (1) In einer Stichprobe mit n = 10 Personen werden für X folgende Werte beobachtet: {9; 96; 96; 106; 11; 114; 114; 118; 13; 14}. Sie gehen davon aus, dass Mittelwert

Mehr

Schließende Statistik

Schließende Statistik Schließende Statistik Die schließende Statistik befasst sich mit dem Rückschluss von einer Stichprobe auf die Grundgesamtheit (Population). Die Stichprobe muss repräsentativ für die Grundgesamtheit sein.

Mehr

2 Wiederholung statistischer Grundlagen Schließende Statistik empirischen Information aus Stichprobenrealisation x von X

2 Wiederholung statistischer Grundlagen Schließende Statistik empirischen Information aus Stichprobenrealisation x von X Hypothesentests Bisher betrachtet: Punkt- bzw. Intervallschätzung des unbekannten Mittelwerts Hierzu: Verwendung der 1 theoretischen Information über Verteilung von X empirischen Information aus Stichprobenrealisation

Mehr

Beurteilende Statistik

Beurteilende Statistik Beurteilende Statistik Wahrscheinlichkeitsrechnung und Beurteilende Statistik was ist der Unterschied zwischen den beiden Bereichen? In der Wahrscheinlichkeitstheorie werden aus gegebenen Wahrscheinlichkeiten

Mehr

Statistik Einführung // Stichprobenverteilung 6 p.2/26

Statistik Einführung // Stichprobenverteilung 6 p.2/26 Statistik Einführung Kapitel 6 Statistik WU Wien Gerhard Derflinger Michael Hauser Jörg Lenneis Josef Leydold Günter Tirler Rosmarie Wakolbinger Statistik Einführung // 6 p.0/26 Lernziele 1. Beschreiben

Mehr

Statistics, Data Analysis, and Simulation SS 2017

Statistics, Data Analysis, and Simulation SS 2017 Mainz, 8. Juni 2017 Statistics, Data Analysis, and Simulation SS 2017 08.128.730 Statistik, Datenanalyse und Simulation Dr. Michael O. Distler Dr. Michael O. Distler

Mehr

Kapitel 3 Schließende Statistik

Kapitel 3 Schließende Statistik Beispiel 3.4: (Fortsetzung Bsp. 3.) bekannt: 65 i=1 X i = 6, also ˆp = X = 6 65 = 0, 4 Überprüfen der Voraussetzungen: (1) n = 65 30 () n ˆp = 6 10 (3) n (1 ˆp) = 39 10 Dr. Karsten Webel 194 Beispiel 3.4:

Mehr

Biostatistik, Sommer 2017

Biostatistik, Sommer 2017 1/39 Biostatistik, Sommer 2017 Wahrscheinlichkeitstheorie: Gesetz der großen Zahl, Zentraler Grenzwertsatz Schließende Statistik: Grundlagen Prof. Dr. Achim Klenke http://www.aklenke.de 9. Vorlesung: 16.06.2017

Mehr

Institut für Stochastik, SoSe K L A U S U R , 13:

Institut für Stochastik, SoSe K L A U S U R , 13: Institut für Stochastik, SoSe 2014 Mathematische Statistik Paravicini/Heusel 1. K L A U S U R 12.7.2014, 13:00-16.00 Name: Geburtsdatum: Vorname: Matrikelnummer: Übungsgruppe bei: Studiengang & angestrebter

Mehr

Statistik II für Betriebswirte Vorlesung 1

Statistik II für Betriebswirte Vorlesung 1 Statistik II für Betriebswirte Vorlesung 1 Dr. Andreas Wünsche TU Bergakademie Freiberg Institut für Stochastik 16. Oktober 2017 Dr. Andreas Wünsche Statistik II für Betriebswirte Vorlesung 1 Version:

Mehr

0 sonst. a) Wie lautet die Randwahrscheinlichkeitsfunktion von Y? 0.5 y = 1

0 sonst. a) Wie lautet die Randwahrscheinlichkeitsfunktion von Y? 0.5 y = 1 Aufgabe 1 (2 + 2 + 2 + 1 Punkte) Gegeben sei folgende gemeinsame Wahrscheinlichkeitsfunktion f(x, y) = P (X = x, Y = y) der Zufallsvariablen X und Y : 0.2 x = 1, y = 1 0.3 x = 2, y = 1 f(x, y) = 0.45 x

Mehr

Klausur zur Wahrscheinlichkeitstheorie für Lehramtsstudierende

Klausur zur Wahrscheinlichkeitstheorie für Lehramtsstudierende Universität Duisburg-Essen Essen, den 15.0.009 Fachbereich Mathematik Prof. Dr. M. Winkler C. Stinner Klausur zur Wahrscheinlichkeitstheorie für Lehramtsstudierende Lösung Die Klausur gilt als bestanden,

Mehr

Einführung in die Maximum Likelihood Methodik

Einführung in die Maximum Likelihood Methodik in die Maximum Likelihood Methodik Thushyanthan Baskaran thushyanthan.baskaran@awi.uni-heidelberg.de Alfred Weber Institut Ruprecht Karls Universität Heidelberg Gliederung 1 2 3 4 2 / 31 Maximum Likelihood

Mehr

Wiederholung Hypothesentests Zusammenfassung. Hypothesentests. Statistik I. Sommersemester Statistik I Hypothesentests I (1/36)

Wiederholung Hypothesentests Zusammenfassung. Hypothesentests. Statistik I. Sommersemester Statistik I Hypothesentests I (1/36) Statistik I Sommersemester 2009 Statistik I I (1/36) Wiederholung Grenzwertsatz Konfidenzintervalle Logik des 0.0 0.1 0.2 0.3 0.4 4 2 0 2 4 Statistik I I (2/36) Zum Nachlesen Agresti/Finlay: Kapitel 6+7

Mehr

Statistik. Sommersemester Prof. Dr. Stefan Etschberger HSA. für Betriebswirtschaft und International Management

Statistik. Sommersemester Prof. Dr. Stefan Etschberger HSA. für Betriebswirtschaft und International Management Statistik für Betriebswirtschaft und International Management Sommersemester 2014 Prof. Dr. Stefan Etschberger HSA Streuungsparameter Varianz Var(X) bzw. σ 2 : [x i E(X)] 2 f(x i ), wenn X diskret Var(X)

Mehr

10. Die Normalverteilungsannahme

10. Die Normalverteilungsannahme 10. Die Normalverteilungsannahme Dr. Antje Kiesel Institut für Angewandte Mathematik WS 2011/2012 Bisher haben wir vorausgesetzt, daß die Beobachtungswerte normalverteilt sind. In diesem Fall kann man

Mehr

Dynamische Systeme und Zeitreihenanalyse // Multivariate Normalverteilung und ML Schätzung 11 p.2/38

Dynamische Systeme und Zeitreihenanalyse // Multivariate Normalverteilung und ML Schätzung 11 p.2/38 Dynamische Systeme und Zeitreihenanalyse Multivariate Normalverteilung und ML Schätzung Kapitel 11 Statistik und Mathematik WU Wien Michael Hauser Dynamische Systeme und Zeitreihenanalyse // Multivariate

Mehr

Aufgabe 1 (8= Punkte) 13 Studenten haben die folgenden Noten (ganze Zahl) in der Statistikklausur erhalten:

Aufgabe 1 (8= Punkte) 13 Studenten haben die folgenden Noten (ganze Zahl) in der Statistikklausur erhalten: Aufgabe 1 (8=2+2+2+2 Punkte) 13 Studenten haben die folgenden Noten (ganze Zahl) in der Statistikklausur erhalten: Die Zufallsvariable X bezeichne die Note. 1443533523253. a) Wie groß ist h(x 5)? Kreuzen

Mehr

Hypothesentests für Erwartungswert und Median. Statistik (Biol./Pharm./HST) FS 2015

Hypothesentests für Erwartungswert und Median. Statistik (Biol./Pharm./HST) FS 2015 Hypothesentests für Erwartungswert und Median Statistik (Biol./Pharm./HST) FS 2015 Normalverteilung X N μ, σ 2 X ist normalverteilt mit Erwartungswert μ und Varianz σ 2 pdf: pdf cdf:??? cdf 1 Zentraler

Mehr

Universität Basel Wirtschaftswissenschaftliches Zentrum. Zufallsvariablen. Dr. Thomas Zehrt

Universität Basel Wirtschaftswissenschaftliches Zentrum. Zufallsvariablen. Dr. Thomas Zehrt Universität Basel Wirtschaftswissenschaftliches Zentrum Zufallsvariablen Dr. Thomas Zehrt Inhalt: 1. Einführung 2. Zufallsvariablen 3. Diskrete Zufallsvariablen 4. Stetige Zufallsvariablen 5. Erwartungswert

Mehr

8. Konfidenzintervalle und Hypothesentests

8. Konfidenzintervalle und Hypothesentests 8. Konfidenzintervalle und Hypothesentests Dr. Antje Kiesel Institut für Angewandte Mathematik WS 2011/2012 Beispiel. Sie wollen den durchschnittlichen Fruchtsaftgehalt eines bestimmten Orangennektars

Mehr

Statistik II. IV. Hypothesentests. Martin Huber

Statistik II. IV. Hypothesentests. Martin Huber Statistik II IV. Hypothesentests Martin Huber 1 / 22 Übersicht Weitere Hypothesentests in der Statistik 1-Stichproben-Mittelwert-Tests 1-Stichproben-Varianz-Tests 2-Stichproben-Tests Kolmogorov-Smirnov-Test

Mehr

Statistische Methoden in den Umweltwissenschaften

Statistische Methoden in den Umweltwissenschaften Statistische Methoden in den Umweltwissenschaften t-test Varianzanalyse (ANOVA) Übersicht Vergleich von Mittelwerten 2 Gruppen: t-test einfaktorielle ANOVA > 2 Gruppen: einfaktorielle ANOVA Seeigel und

Mehr

Einführung in Quantitative Methoden

Einführung in Quantitative Methoden Einführung in Quantitative Methoden Karin Waldherr & Pantelis Christodoulides 11. Mai 2011 Waldherr / Christodoulides Einführung in Quantitative Methoden- 8.VO 1/40 Poisson-Verteilung Diese Verteilung

Mehr

Klausur zu Methoden der Statistik II (mit Kurzlösung) Sommersemester Aufgabe 1

Klausur zu Methoden der Statistik II (mit Kurzlösung) Sommersemester Aufgabe 1 Lehrstuhl für Statistik und Ökonometrie der Otto-Friedrich-Universität Bamberg Prof. Dr. Susanne Rässler Klausur zu Methoden der Statistik II (mit Kurzlösung) Sommersemester 2013 Aufgabe 1 In einer Urne

Mehr

T-Test für den Zweistichprobenfall

T-Test für den Zweistichprobenfall T-Test für den Zweistichprobenfall t-test (unbekannte, gleiche Varianzen) Test auf Lageunterschied zweier normalverteilter Grundgesamtheiten mit unbekannten, aber gleichen Varianzen durch Vergleich der

Mehr

Übungsaufgaben zu Statistik II

Übungsaufgaben zu Statistik II Übungsaufgaben zu Statistik II Prof. Dr. Irene Prof. Dr. Albrecht Ungerer Die Kapitel beziehen sich auf das Buch: /Ungerer (2016): Statistik für Wirtschaftswissenschaftler Springer Gabler 4 Übungsaufgaben

Mehr

1. Einführung in die induktive Statistik

1. Einführung in die induktive Statistik Wichtige Begriffe 1. Einführung in die induktive Statistik Grundgesamtheit: Statistische Masse, die zu untersuchen ist, bzw. über die Aussagen getroffen werden soll Stichprobe: Teil einer statistischen

Mehr

Statistik III. Walter Zucchini Fred Böker Andreas Stadie

Statistik III. Walter Zucchini Fred Böker Andreas Stadie Statistik III Walter Zucchini Fred Böker Andreas Stadie Inhaltsverzeichnis 1 Zufallsvariablen und ihre Verteilung 1 1.1 Diskrete Zufallsvariablen........................... 1 1.2 Stetige Zufallsvariablen............................

Mehr

6.2 Approximation der Binomialverteilung

6.2 Approximation der Binomialverteilung 56 6.2 Approximation der Binomialverteilung Im Beispiel auf den Seiten 52 53 haben wir gesehen, dass die Wahrscheinlichkeiten P 50 (k) der dort betrachteten Binomialverteilung durch die Werte der Funktion

Mehr

Allgemeines zu Tests. Statistische Hypothesentests

Allgemeines zu Tests. Statistische Hypothesentests Statistische Hypothesentests Allgemeines zu Tests Allgemeines Tests in normalverteilten Grundgesamtheiten Asymptotische Tests Statistischer Test: Verfahren Entscheidungsregel), mit dem auf Basis einer

Mehr

Kapitel 7. Regression und Korrelation. 7.1 Das Regressionsproblem

Kapitel 7. Regression und Korrelation. 7.1 Das Regressionsproblem Kapitel 7 Regression und Korrelation Ein Regressionsproblem behandelt die Verteilung einer Variablen, wenn mindestens eine andere gewisse Werte in nicht zufälliger Art annimmt. Ein Korrelationsproblem

Mehr

Statistik und Wahrscheinlichkeitsrechnung

Statistik und Wahrscheinlichkeitsrechnung Statistik und Wahrscheinlichkeitsrechnung Dr. Jochen Köhler 1 Inhalt der heutigen Vorlesung Kurze Zusammenfassung der letzten Vorlesung Schätzung und Modellentwicklung Überblick Statistische Signifikanztests

Mehr

Kapitel VII - Funktion und Transformation von Zufallsvariablen

Kapitel VII - Funktion und Transformation von Zufallsvariablen Universität Karlsruhe (TH) Institut für Statistik und Mathematische Wirtschaftstheorie Wahrscheinlichkeitstheorie Kapitel VII - Funktion und Transformation von Zufallsvariablen Markus Höchstötter Lehrstuhl

Mehr

Einführung in die (induktive) Statistik

Einführung in die (induktive) Statistik Einführung in die (induktive) Statistik Typische Fragestellung der Statistik: Auf Grund einer Problemmodellierung sind wir interessiert an: Zufallsexperiment beschrieben durch ZV X. Problem: Verteilung

Mehr

Grundlagen der Statistik

Grundlagen der Statistik www.nwb.de NWB Studium Betriebswirtschaft Grundlagen der Statistik Band 2: Wahrscheinlichkeitsrechnung und induktive Statistik Von Professor Dr. Jochen Schwarze 9., vollständig überarbeitete Auflage STUDIUM

Mehr

2 Zufallsvariable und Verteilungsfunktionen

2 Zufallsvariable und Verteilungsfunktionen 8 2 Zufallsvariable und Verteilungsfunktionen Häufig ist es so, dass den Ausgängen eines Zufallexperiments, d.h. den Elementen der Ereignisalgebra, eine Zahl zugeordnet wird. Das wollen wir etwas mathematischer

Mehr