Teil II. Der Weg zur schließenden Statistik: Von den Daten zu Wahrscheinlichkeiten. StatSoz 127

Größe: px
Ab Seite anzeigen:

Download "Teil II. Der Weg zur schließenden Statistik: Von den Daten zu Wahrscheinlichkeiten. StatSoz 127"

Transkript

1 Teil II Der Weg zur schließenden Statistik: Von den Daten zu Wahrscheinlichkeiten StatSoz 127

2 6 Zufallsstichprobe und Parameter 6.1 Parameter einer Grundgesamtheit 6.2 Zufallsstichprobe und Bias 6.3 Stichprobenfehler und Stichprobenverteilung des Mittelwertes 6.1 Parameter einer Grundgesamtheit Würde man alle Werte der Merkmalsträger einer Grundgesamtheit beobachten (Vollerhebung), so könnte man diese Daten mit deskriptiven Methoden (Häufigkeitsverteilung, statistische Maßzahlen) auswerten. Man bestimmt aber damit statistische Maßzahlen einer Population und nicht einer Stichprobe. Deshalb heißen sie Populations Mittelwert (µ), Populations Standardabweichung (σ), etc. StatSoz 128

3 Maßzahlen einer Population (Grundgesamtheit) werden als Parameter bezeichnet. Symbolisch werden sie üblicherweise durch griechische Buchstaben dargestellt. Bezeichnungen: N Anzahl der Merkmalsträger einer Grundgesamtheit y 1,..., y N Ausprägungen der von 1 bis N durchnummerierten Merkmalsträger n Stichprobenumfang x 1,..., x n Stichprobe Die wichtigsten Parameter und ihre empirischen Gegenstücke sind in der folgenden Tabelle zusammengefasst. StatSoz 129

4 Tabelle 6 1 Wichtige Parameter und ihre empirischen Gegenstücke Grundgesamtheit (Populations )Mittelwert Stichprobe (Daten) Stichprobenmittel µ = 1 N N j=1 y j x = 1 n n i=1 x i (Populations )Varianz Stichprobenvarianz σ 2 = 1 N N j=1 (y j µ) 2 s 2 = 1 n n 1 i=1 (x i x n ) 2 (Populations ) Stichproben Standardabweichung standardabweichung σ = σ 2 s = s 2 (Populations )Median Stichproben Median y ( N+1 ), N ungerade x 2 ( n+1 2 ), n ungerade ( y( N 2 ) + y ) ( ) ( N /2, 2 +1) x( n 2 ) + x ( n 2 +1) /2, N gerade n gerade StatSoz 130

5 Bemerkung: Zwischen Maßzahlen einer Stichprobe und Maßzahlen einer Population (den sogenannten Parametern) besteht ein wesentlicher gedanklicher Unterschied: Maßzahlen einer Population sind nicht variabel, sondern fest und daher vom,,zufall nicht beeinflussbar. Man bezeichnet sie auch als theoretische Maßzahlen (µ, σ,...) im Unterschied zu den empirischen Maßzahlen ( x, s,...), die sich auf eine Stichprobe beziehen. Mit,,theoretisch ist nicht gemeint, dass diese Zahlen nur theoretisch exisitieren; sie existieren real, sind aber meistens nicht bekannt und müssen durch empirische Untersuchungen bestimmt (,,geschätzt ) werden. Die Variabilität steckt in den Daten (Stichproben) und somit auch in den empirischen Kenngrößen! (vgl. Tab. 6 2 in Abschnitt 6.3) StatSoz 131

6 6.2 Zufallsstichprobe und Bias Um von einer Stichprobe auf Eigenschaften einer Grundgesamtheit schließen zu können, muss die Stichprobe eine darstellen. Zufallsauswahl Bei einer zufälligen Stichprobe darf man am ehesten annehmen, dass sie auch repräsentativ ist, die tatsächliche Situation in einer Grundgesamtheit also am besten widerspiegelt. Zufallsauswahl: Jeder Merkmalsträger gelangt mit einer berechenbaren Chance (Wahrscheinlichkeit) in die Stichprobe. Eine Zufallsauswahl ist keine willkürliche Auswahl. Die Merkmalsträger werden auch nicht bewusst (gezielt) gezogen. Auf keinen Fall darf StatSoz 132

7 das Auswahlprinzip im Zusammenhang mit dem zu untersuchenden Merkmal stehen! Grundlegende statistische Verfahren setzen einfache Stichproben voraus! Einfache Zufallsstichprobe (simple random sample) bedeutet 1. Uneingeschränktheit: Jeder Merkmalsträger besitzt die gleiche Chance (Wahrscheinlichkeit), in die Stichprobe aufgenommen zu werden. 2. Unabhängigkeit: Die Ziehungen erfolgen unabhängig. Die Wahrscheinlichkeit ausgewählt zu werden ist bei jeder Ziehung gleich. Bei homogenen Grundgesamtheiten erhält man uneingeschränkte Stichproben durch die beiden folgenden Auswahlmodelle: StatSoz 133

8 Ziehen mit Zurücklegen (sampling with replacement) Ziehen ohne Zurücklegen (sampling without replacement) Für beide Auswahlmodelle gilt: Die Chance eines Merkmalsträgers, in eine Stichprobe vom Umfang n aus einer Grundgesamtheit mit N Merkmalsträgern aufgenommen zu werden, beträgt n N Auswahlmodell,,Ziehen mit Zurücklegen : Nachteil: Mehrfachziehung eines Merkmalsträgers ist möglich. Vorteil: Unabhängigkeit, d. h.,,ziehen mit Zurücklegen führt zu einer einfachen Stichprobe. StatSoz 134

9 Bemerkung: Wenn die Grundgesamtheit im Verhältnis zum Stichprobenumfang sehr groß ist, wenn also N wesentlich größer als n ist (was in der Praxis überwiegend der Fall ist), so besteht zwischen,,ziehen mit Zurücklegen und,,ziehen ohne Zurücklegen kein bedeutender Unterschied. Eine durch,,ziehen ohne Zurücklegen resultierende (uneingeschränkte) Stichprobe lässt sich dann näherungsweise als eine einfache Stichprobe auffassen. In der Praxis wird eine durch,,ziehen ohne Zurücklegen gewonnene Stichprobe als einfach angesehen, falls folgende Faustregel erfüllt ist: n N 0.05 Der Quotient n/n heißt Auswahlsatz. StatSoz 135

10 Bias Das Schließen von einer Stichprobe auf eine Grundgesamtheit ist nur dann zulässig, wenn nur zufällige Fehler vorkommen (Stichprobenfehler). In diesem Fall gilt die Stichprobe als repräsentativ im Sinne von,,kein systematischer Fehler. Treten in einer Stichprobe systematische Fehler auf, werden Resultate bzw. statistische Aussagen als verfälscht, verzerrt (biased) bezeichnet. Systematische Fehler beeinflussen die Validität (Gültigkeit, Rechtskräftigkeit) statistischer Auswertungen. Zufällige Fehler hingegen beeinflussen wohl die Genauigkeit statistischer Ergebnisse und die daraus resultierenden Schlußfolgerungen, nicht aber deren Validität! StatSoz 136

11 Man unterscheidet drei allgemeine Kategorien von Bias Fehlern: Bias durch die Auswahl der Merkmalsträger in einer Stichprobe (sampling bias), wenn z. B. bestimmte Merkmalsträger eine größere Chance besitzen in die Stichprobe aufgenommen zu werden, Bias durch Vermengung, wenn einflussreiche Faktoren (Alter, Geschlecht, soziale Indikatoren) nicht berücksichtigt werden, Bias durch Falschinformation, verursacht etwa durch systematisch verfälschte Messungen oder Antworten bei Umfragen. Bemerkung: Bias Fehler können nur durch andere, vergleichende Untersuchungen entdeckt werden. StatSoz 137

12 6.3 Stichprobenfehler und Stichprobenverteilung des Mittelwertes Frage: Welcher Zusammenhang besteht zwischen dem Populations Mittelwert µ und dem Stichprobenmittel x? Eine Antwort auf diese Frage geben die folgenden Überlegungen: Hinweis: Es handelt sich im Folgenden um einen theoretischen Gedankengang ein Gedankenexperiment nicht um eine Anleitung zur praktischen Vorgehensweise. Erst aus diesen theoretischen Überlegungen heraus wird klar, warum theoretische Verteilungen ins Spiel kommen (müssen) und welche statistische Aussagen zu erwarten sind. Zunächst ein Zahlenbeispiel 6.1: StatSoz 138

13 Grundgesamtheit mit N = 5 Merkmalsträgern Einheit Wert A 2.2 B 2.0 C 1.6 D 2.4 E 1.8 Populations Mittelwert: µ = 1 5 ( ) = 2 Populations Varianz: σ 2 = 1 5 ((2.2 2) (1.8 2) 2) = 0.08 Betrachtet werden Zufallsstichproben vom Umfang n = 3. Auswahlprinzip ist,,ziehen ohne Zurücklegen. Es soll dabei nicht auf die Reihenfolge der Datenerhebung ankommen. Dann StatSoz 139

14 gibt es ( ) N n = ( ) 5 3 = 5! 2! 3! = 10 mögliche Stichproben. Tab. 6 2: Mögliche Stichproben vom Umfang 3 mit ihren Kennwerten x und s 2 Stichprobe Daten x s 2 Nr. 1: ABC 2.2, 2.0, 1.6 x 1 = 1.93 s 2 1 = Nr. 2: ABD 2.2, 2.0, 2.4 x 2 = 2.20 s 2 2 = Nr. 3: ABE 2.2, 2.0, 1.8 x 3 = 2.00 s 2 3 = Nr. 4: ACD 2.2, 1.6, 2.4 x 4 = 2.07 s 2 4 = Nr. 5: ACE 2.2, 1.6, 1.8 x 5 = 1.87 s 2 5 = Nr. 6: ADE 2.2, 2.4, 1.8 x 6 = 2.13 s 2 6 = Nr. 7: BCD 2.0, 1.6, 2.4 x 7 = 2.00 s 2 7 = Nr. 8: BCE 2.0, 1.6, 1.8 x 8 = 1.80 s 2 8 = Nr. 9: BDE 2.0, 2.4, 1.8 x 9 = 2.07 s 2 9 = Nr. 10 CDE 1.6, 2.4, 1.8 x 10 = 1.93 s 2 10 = StatSoz 140

15 Beachte: Es muss nicht x = µ sein. In den meisten Fällen wird x µ gelten. Im Zahlenbeispiel gilt für 2 (von insgesamt 10) Stichproben x = 2 = µ. Alle anderen Stichproben führen zu anderen Mittelwerten. Diese Abweichungen vom Populationsmittelwert µ = 2 sind rein zufälliger Natur, sind also ausschließlich auf die Variabilität der Daten zurückzuführen (Stichprobenfehler!). Bildet man in Bsp. 6.1 den Mittelwert über alle 10 Stichprobenmittelwerte, so gilt 1 10 ( ) = 2 = µ Dieser Zusammenhang gilt ganz allgemein: Sei ( ) N m = n die Anzahl der möglichen Stichproben vom Umfang n aus einer N elementigen Grundgesamt- StatSoz 141

16 heit (Ziehen ohne Zurücklegen, keine Berücksichtigung der Reihenfolge). Bezeichnen x 1,..., x m die Mittelwerte von Stichprobe Nr. 1 bis Stichprobe Nr. m, so gilt 1 m m i=1 x i = µ (6.1) In Worten: Arithmetisches Mittel aller Stichprobenmittel zum festen Stichprobenumfang ist gleich dem Mittelwert µ der Grundgesamtheit. (6.1) besagt Folgendes: Der Populationsmittelwert µ wird durch das Stichprobenmittel x weder systematisch unter noch überschätzt. Man StatSoz 142

17 spricht von einer erwartungstreuen oder unverzerrten Schätzung (unbiased estimation). Man kann die Streuung der Stichprobenmittel x 1, x 2,..., x m um den Populations Mittelwert µ berechnen: σ 2 x = 1 m m j=1 ( xj µ ) 2 = σ 2 n N n N 1 (6.2) Verifizierung von Formel (6.2) anhand Bsp. 6.1: Hier ist N = 5, n = 3, µ = 2 und σ 2 = Man erhält σ 2 n N n N 1 = = = StatSoz 143

18 und gemäß den Werten aus Tab. 6 2, vorletzte Spalte, gilt j=1 ( xj 2 ) 2 = 1 10 ( (1.93 2) 2 + (2.20 2) (1.93 2) 2 ) = Zieht man in (6.2) die Wurzel, so erhält man σ x = 1 m m ( x j µ) 2 j=1 = σ n N n N 1 StatSoz 144

19 Der Parameter σ x (= Stichprobenfehler von x) heißt Standardfehler des Mittelwertes (standard error mean, SEM): SEM = σ n N n N 1 (6.3) Bemerkung: Bei einfachen Stichproben (,,Ziehen mit Zurücklegen ) gilt Standardfehler des Mittelwertes: SEM = σ n (6.4) Der zusätzliche Faktor in (6.3), N n N 1 StatSoz 145

20 wird häufig als Endlichkeitsfaktor bezeichnet. Ist N im Verhältnis zu n groß, so ist N n N 1 = N N 1 n N 1 1 n N 1 und der Endlichkeitsfaktor kann vernachlässigt werden. Faustregel: n/n 0.05 In Bsp. 6.1 erhält man nach Formel (6.3) SEM = σ n N n N 1 = = = (nach Formel (6.4) erhält man SEM = 0.163). Formeln (6.3) und (6.4) zeigen Folgendes: Mit StatSoz 146

21 wachsendem Stichprobenumfang n nimmt die Streuung der Stichprobenmittel um den Populationsmittelwert µ ab! Anschaulich gesprochen bedeutet dies Folgendes. Bildet man ein Histogramm bezüglich aller Stichprobenmittel x 1, x 2,..., x m so konzentriert sich das Histogramm mit wachsendem Stichprobenumfang n mehr und mehr um die Mitte µ. Die Häufigkeitsverteilung sämtlicher Stichprobenmittel (zum festen Stichprobenumfang) nennt man die Stichprobenverteilung von x. Genauer spricht man auch von einer Stichprobenkennwertverteilung. StatSoz 147

22 Aus Tab. 6 2 ergibt sich die folgende Stichprobenverteilung von x: Tabelle 6 3 Ohne Klassierung Wert von x relative Häufigkeit /10 = /10 = /10 = /10 = /10 = /10 = /10 = 0.1 Tabelle 6 4 Mit Klassierung Klasse Intervall Fläche Klasse 1 [170, 190) F 1 = 0.2 Klasse 2 [190, 210) F 2 = 0.6 Klasse 3 [210, 230) F 3 = 0.2 Im Histogramm wird als Darstellungsmittel die Fläche gewählt, d.h. die Flächen repräsentieren die relativen Klassenhäufigkeiten. (Zur Erinnerung: Gesamtfläche = Summe der relativen Klassenhäufigkeiten = 1) StatSoz 148

23 Zusammenfassung: Kennwerte der Verteilung einer Grundgesamtheit: Mittelwert µ Standardabweichung σ Verteilung einer Stichprobe: empirischer Mittelwert x empirische Standardabweichung s Stichprobenverteilung von x: Mittelwert µ (nach Formel (6.1)) Standardabweichung σ x = SEM SEM = σ n N n N 1 (nach Formel (6.3)) SEM = σ n (nach Formel (6.4)) StatSoz 149

24 Bei Bekanntheit der Stichprobenverteilung von x wäre man in der Lage, die Präzision der Parameterschätzung x genau zu beschreiben. Erwartet wird, dass die,,meisten Stichprobenmittelwerte innerhalb der Grenzen µ ± SEM liegen: µ SEM x µ + SEM (6.5) In Bsp. 6.1 ergeben sich die Grenzen = und = und nach Tab. 6.3 bzw. Tab. 6.4 liegen 60% ( ˆ= Flächenanteil F 2 ) der Stichprobenmittel innerhalb dieser beiden Grenzen. Frage: Wie lässt sich die Präzision der Parameterschätzung x beurteilen, wenn die Stichprobenverteilung nicht bekannt ist? StatSoz 150

25 Häufig zeigt das Histogramm der Stichprobenverteilung von x (wenn die Flächen die relativen Klassenhäufigkeiten repräsentieren) einen glockenkurvenförmigen Verlauf (Dichte der Normalverteilung). Diese empirische Tatsache lässt sich durch ein wahrscheinlichkeitstheoretisches Gesetz begründen, der zentrale Grenzwertsatz (Kap. 8). Die Stichprobenverteilung des Mittelwertes lässt sich somit annähernd durch eine Normalverteilung beschreiben. Daran ändert sich auch nichts, wenn man die Stichprobenverteilung des standardisierten Stichprobenmittels betrachtet. x µ SEM StatSoz 151

26 Warum? Durch die Standardisierung (dies ist eine lineare Transformation) ändert sich die Form der Verteilung nicht, vgl. Abschnitt 4.4. D. h. die Stichprobenverteilung des standardisierten Mittelwertes ( x µ)/sem lässt sich ebenfalls durch einen glockenkurvenförmigen Verlauf darstellen. Dies ist dann die Dichte der Standard Normalverteilung ϕ. Dass es sich um eine Standardisierung handelt ist klar (vgl. Abschnitt 4.4): Die standardisierten Stichprobenmittelwerte z i = x i µ SEM x, i = 1,..., m haben die Lage 0 und die Streuung 1: 1 m m i=1 z i = 0 und SEM z = 1 StatSoz 152

27 Zurück zur Beantwortung der Frage: Zunächst ist (6.5) gleichbedeutend mit 1 x µ SEM 1 Folglich ist der Anteil der Stichprobenmittelwerte, die (6.5) erfüllen gleich dem Anteil der standardisierten Stichprobenmittelwerte, die zwischen 1 und 1 liegen. Und dieser Anteil beträgt 60% ( ˆ= Flächenanteil F 2 im Histogramm nach Tab. 6.4). Dieser Anteilswert entspricht annährend der Fläche zwischen der Dichte der ϕ und dem Achsenabschnitt [ 1, 1]. Die Fläche beträgt 1 1 ϕ(x) dx = 0.68 StatSoz 153

28 Abbildung 6 1 Fläche zwischen ϕ und dem Achsenabschnitt [ 1, 1] Schätzen des Standardfehlers Die Bedingung (6.5) ist genau dann erfüllt, wenn der Populationsmittelwert µ im Bereich x±sem liegt: x SEM µ x + SEM (6.6) Für die statistische Anwendung ist (6.6) wesentlich interessanter. Denn µ ist unbekannt und man versucht einen Bereich anzugeben, so dass µ mit einer gewissen Wahrscheinlichkeit in diesem Bereich liegen wird (Intervallschätzung). StatSoz 154

29 Da σ und somit SEM unbekannt ist, verwendet man bei Vorliegen einer konkreten Stichprobe x 1,..., x n die Stichprobenstandardabweichung s als Schätzwert für σ und erhält mit Formel (6.4) den geschätzten Standardfehler des Mittelwertes (estimated standard error mean, ESEM): ESEM = s n Man weiß also, in welcher Größenordnung die (zufällige) Abweichung eines Stichprobenmittels x vom Populationsmittelwert µ erwartet werden kann! Bemerkung: (i) Formel (6.3) ist zum Schätzen des Standardfehlers nicht geeignet, da N im Allgemeinen nicht bekannt ist. StatSoz 155

30 (ii) Bei einfachen Stichproben (,,Ziehen mit Zurücklegen ) ist die Stichprobenvarianz s 2 eine unverzerrte Schätzung des Parameters σ 2. In Bsp. 6.1 gilt SEM = σ n = = Bei Vorliegen der Stichprobe Nr. 4 ist s 2 = und man erhält ESEM = s n = = Alle Werte, die nur zufallsbedingt von x abweichen, sind neben der (erwartungstreuen) Schätzung x ebenfalls plausible Schätzwerte für den Parameter µ, also etwa alle Werte im Intervall [ x s n, x + s ] n StatSoz 156

31 Man spricht von einer Intervallschätzung (Kap. 9). Beachte: Die Variabilität steckt im Intervall, denn die Intervallgrenzen x ± s n hängen von den empirischen Kenngrößen x und s ab. Der Parameter µ ist fest und muss nicht im obigen Intervall liegen. In Bsp. 6.1 führt die Stichprobe Nr. 4 ( x = 2.07) zum Intervall [ , ] = [1.83, 2.31] Der Populationsmittelwert µ = 2 liegt in diesem Intervall. Dies ist sicher. Aber: Diese 100%ige Sicherheit ist nur vorhanden, weil µ = 2 bekannt ist!!! StatSoz 157

32 Die Crux ist: µ ist i. A. unbekannt! Konsequenz: Es besteht keine 100%ige Sicherheit darüber, ob der Mittelwert µ im obigen Intervall liegt. Wie bewertet, quantifiziert man diese (Un ) Sicherheit? Rein logisch gesehen gibt es nur zwei Möglichkeiten: Entweder µ liegt in diesem Intervall oder nicht. Ad hoc Lösung: Jede Möglichkeit besitzt die gleiche Wahrscheinlichkeit, also 50%ige Sicherheit. Die Chancen stehen fifty fifty. Aber: Die Sicherheit darüber, dass µ im Intervall [ x s/ n, x + s/ n] liegt, kann höher bewertet werden! Dazu folgende Tabelle: StatSoz 158

33 Tab. 6 5: Geschätzte Standardfehler und Intervallschätzungen der Stichproben aus Tab. 6 2 Stichprobe ESEM = s/ n [ x s/ n, x + s/ n] Nr. 1: ABC s 1 / 3 = [1.864, 1.996] Nr. 2: ABD s 2 / 3 = [2.085, 2.315] Nr. 3: ABE s 3 / 3 = [1.885, 2.115] Nr. 4: ACD s 4 / 3 = [1.830, 2.310] Nr. 5: ACE s 5 / 3 = [1.694, 2.046] Nr. 6: ADE s 6 / 3 = [1.954, 2.306] Nr. 7: BCD s 7 / 3 = [1.769, 2.231] Nr. 8: BCE s 8 / 3 = [1.685, 1.915] Nr. 9: BDE s 9 / 3 = [1.894, 2.246] Nr. 10 CDE s 10 / 3 = [1.690, 2.170] Von den 10 Stichproben führen nur 3 Stichproben (Nr. 1, 2 und 8) zu einer Intervallschätzung, die den Parameter µ = 2 nicht enthalten. Die Chance, dass ein konkret vorliegendes Intervall den Parameter µ = 2 enthält, wäre also sinn- StatSoz 159

34 vollerweise mit 7/10, also mit 70% zu bewerten. Dies ist ein rein theoretischer Gedankengang, da µ nicht bekannt ist und in der Praxis nur eine Stichprobe zur Verfügung steht. Die Stichprobenverteilung von x ist ebenfalls nicht bekannt. Trotzdem kann die Sicherheit annähernd mit 70% quantifiziert werden, wenn man theoretische Verteilungen (z. B. die Normalverteilung) zulässt! Zunächst: x s n µ x + s n ist genau dann erfüllt, falls gilt. 1 x µ s/ n 1 StatSoz 160

35 Wenn der Stichprobenumfang n 30 ist, dann lässt sich die Stichprobenverteilung von x µ s/ n durch die Diche ϕ der Standard Normalverteilung beschreiben (zentraler Grenzwertsatz, Kap. 8). Folglich kann man sagen: Mit einer Wahrscheinlichkeit von ca liegt der Parameter µ im Intervall [ x s/ n, x + s/ n]. Zur Erinnerung: 1 1 ϕ(x) dx = 0.68 StatSoz 161

36 Theoretische Verteilungen (man spricht auch von Modellen) beruhen auf dem Begriff der Wahrscheinlichkeit. Dies sind Zahlen, die zwischen 0 (völlige Unsicherheit) und 1 (völlige Sicherheit) liegen. Statistische Entscheidungen sind immer Entscheidungen unter Unsicherheit. Durch Wahrscheinlichkeitsaussagen wird diese Unsicherheit nicht aufgehoben, wohl aber quantitativ erfassbar! Die statistische Welt liegt zwischen 0 und 1 StatSoz 162

8 Stichprobenkennwerteverteilung

8 Stichprobenkennwerteverteilung 8 Stichprobenkennwerteverteilung 8.1 Vorbemerkungen 8.2 Die Normalverteilung: Teil 2 8.3 Die t Verteilung 8.4 Normalverteilungs Approximation: Der zentrale Grenzwertsatz 8.1 Vorbemerkungen Daten x 1,...,

Mehr

Grundgesamtheit und Stichprobe

Grundgesamtheit und Stichprobe Grundgesamtheit und Stichprobe Definition 1 Die Menge der Untersuchungseinheiten {U 1,U 2,...,U N } heißt Grundgesamtheit. Die Anzahl N der Einheiten ist der Umfang der Grundgesamtheit. Jeder Einheit U

Mehr

Grundgesamtheit und Stichprobe

Grundgesamtheit und Stichprobe Grundgesamtheit und Stichprobe Definition 1 Die Menge der Untersuchungseinheiten {U 1,U 2,...,U N } heißt Grundgesamtheit. Die Anzahl N der Einheiten ist der Umfang der Grundgesamtheit. Jeder Einheit U

Mehr

Schließende Statistik

Schließende Statistik Schließende Statistik [statistical inference] Sollen auf der Basis von empirischen Untersuchungen (Daten) Erkenntnisse gewonnen und Entscheidungen gefällt werden, sind die Methoden der Statistik einzusetzen.

Mehr

Statistik für Studierende der Sozialwissenschaften Wintersemester 2010/2011 F. Marohn

Statistik für Studierende der Sozialwissenschaften Wintersemester 2010/2011 F. Marohn Statistik für Studierende der Sozialwissenschaften Wintersemester 2010/2011 F. Marohn,,Es ist mir noch heute rätselhaft, dass man herausbringt, was sechzig Millionen Menschen denken, wenn man zweitausend

Mehr

Stichprobenverteilung bei unterschiedlichen Auswahlsätzen

Stichprobenverteilung bei unterschiedlichen Auswahlsätzen Stichprobenverteilung bei unterschiedlichen Auswahlsätzen Begleitende Unterlagen zur Übung Induktive Statistik Michael Westermann Universität Essen Inhaltsverzeichnis 1 Einleitung.......................................................

Mehr

Statistik für Studierende der Naturwissenschaften und Biomedizin Wintersemester 2010/2011 F. Marohn

Statistik für Studierende der Naturwissenschaften und Biomedizin Wintersemester 2010/2011 F. Marohn Statistik für Studierende der Naturwissenschaften und Biomedizin Wintersemester 2010/2011 F. Marohn Vorlesung und Aufgabenblätter im Internet unter der Homepage des Lehrstuhls für Statistik: http://statistik.mathematik.uni-wuerzburg.de/

Mehr

5. Schließende Statistik (Inferenzstatistik, konfirmatorische Verfahren)

5. Schließende Statistik (Inferenzstatistik, konfirmatorische Verfahren) 5. Schließende Statistik (Inferenzstatistik, konfirmatorische Verfahren) 5.1. Einführung Schätzen unbekannter Parameter im Modell, z.b. Wahrscheinlichkeiten p i (Anteile in der Gesamtmenge), Erwartungswerte

Mehr

Statistik. Sommersemester Stefan Etschberger. für Betriebswirtschaft, Internationales Management, Wirtschaftsinformatik und Informatik

Statistik. Sommersemester Stefan Etschberger. für Betriebswirtschaft, Internationales Management, Wirtschaftsinformatik und Informatik Stefan Etschberger für Betriebswirtschaft, Internationales Management, Wirtschaftsinformatik und Informatik Sommersemester 2017 Rechenregeln für den Erwartungswert Ist f symmetrisch bzgl. a, so gilt E(X)

Mehr

Statistik Einführung // Stichprobenverteilung 6 p.2/26

Statistik Einführung // Stichprobenverteilung 6 p.2/26 Statistik Einführung Kapitel 6 Statistik WU Wien Gerhard Derflinger Michael Hauser Jörg Lenneis Josef Leydold Günter Tirler Rosmarie Wakolbinger Statistik Einführung // 6 p.0/26 Lernziele 1. Beschreiben

Mehr

5. Schließende Statistik (Inferenzstatistik, konfirmatorische Verfahren)

5. Schließende Statistik (Inferenzstatistik, konfirmatorische Verfahren) 5. Schließende Statistik (Inferenzstatistik, konfirmatorische Verfahren) 5.1. Einführung Schätzen unbekannter Parameter im Modell, z.b. Wahrscheinlichkeiten p i (Anteile in der Gesamtmenge), Erwartungswerte

Mehr

Wahrscheinlichkeitsverteilungen

Wahrscheinlichkeitsverteilungen Universität Bielefeld 3. Mai 2005 Wahrscheinlichkeitsrechnung Wahrscheinlichkeitsrechnung Das Ziehen einer Stichprobe ist die Realisierung eines Zufallsexperimentes. Die Wahrscheinlichkeitsrechnung betrachtet

Mehr

4. Schließende Statistik (Inferenzstatistik, konfirmatorische Verfahren)

4. Schließende Statistik (Inferenzstatistik, konfirmatorische Verfahren) 4. Schließende Statistik (Inferenzstatistik, konfirmatorische Verfahren) 4.1. Einführung Schätzen unbekannter Parameter im Modell, z.b. Wahrscheinlichkeiten p i (Anteile in der Gesamtmenge), Erwartungswerte

Mehr

Statistik. Sommersemester Prof. Dr. Stefan Etschberger HSA. für Betriebswirtschaft und International Management

Statistik. Sommersemester Prof. Dr. Stefan Etschberger HSA. für Betriebswirtschaft und International Management Statistik für Betriebswirtschaft und International Management Sommersemester 2014 Prof. Dr. Stefan Etschberger HSA Streuungsparameter Varianz Var(X) bzw. σ 2 : [x i E(X)] 2 f(x i ), wenn X diskret Var(X)

Mehr

Teil 3: Schließende Statistik

Teil 3: Schließende Statistik Teil 3: Schließende Statistik Grundfragen der schließenden Statistik 1. Welcher Parameter passt am besten zu den Beobachtungen? 2. Welche Parameterwerte sind mit den Beobachtungen vereinbar? 3. Sind die

Mehr

Statistik K urs SS 2004

Statistik K urs SS 2004 Statistik K urs SS 2004 3.Tag Grundlegende statistische Maße Mittelwert (mean) Durchschnitt aller Werte Varianz (variance) s 2 Durchschnittliche quadrierte Abweichung aller Werte vom Mittelwert >> Die

Mehr

Biostatistik, WS 2017/18 Der Standardfehler

Biostatistik, WS 2017/18 Der Standardfehler 1/70 Biostatistik, WS 2017/18 Matthias Birkner http://www.staff.uni-mainz.de/birkner/biostatistik1718/ 24.11.2017 3/70 Ein Versuch Hirse Bild: Panicum miliaceum 4/70 Ein Versuch Ein Versuch Versuchsaufbau:

Mehr

Methodenlehre. Vorlesung 10. Prof. Dr. Björn Rasch, Cognitive Biopsychology and Methods University of Fribourg

Methodenlehre. Vorlesung 10. Prof. Dr. Björn Rasch, Cognitive Biopsychology and Methods University of Fribourg Methodenlehre Vorlesung 10 Prof. Dr., Cognitive Biopsychology and Methods University of Fribourg 1 Methodenlehre I Woche Datum Thema 1 FQ Einführung, Verteilung der Termine 1 25.9.13 Psychologie als Wissenschaft

Mehr

Statistik I für Betriebswirte Vorlesung 13

Statistik I für Betriebswirte Vorlesung 13 Statistik I für Betriebswirte Vorlesung 13 Dr. Andreas Wünsche TU Bergakademie Freiberg Institut für Stochastik 6. Juli 2017 Dr. Andreas Wünsche Statistik I für Betriebswirte Vorlesung 13 Version: 7. Juli

Mehr

Thema der Stunde. I. Die Form der Stichprobenkennwerteverteilung. II. Schlüsse von der Stichprobe auf die Population

Thema der Stunde. I. Die Form der Stichprobenkennwerteverteilung. II. Schlüsse von der Stichprobe auf die Population Thema der Stunde I. Die Form der Stichprobenkennwerteverteilung II. Schlüsse von der Stichprobe auf die Population III. t-test für unabhängige und abhängige Stichproben Stichprobenkennwerte Population

Mehr

Forschungsstatistik I

Forschungsstatistik I Prof. Dr. G. Meinhardt 6. Stock, Taubertsberg R. 06-06 (Persike) R. 06-31 (Meinhardt) Sprechstunde jederzeit nach Vereinbarung Forschungsstatistik I Dr. Malte Persike persike@uni-mainz.de http://psymet03.sowi.uni-mainz.de/

Mehr

Medizinische Statistik

Medizinische Statistik Medizinische Statistik Angewandte Biometrie für Ärzte und Gesundheitsberufe Bearbeitet von Wilhelm Gaus, Rainer Muche 1. Auflage 2013. Buch. 640 S. Hardcover ISBN 978 3 7945 2931 5 Format (B x L): 16,5

Mehr

Wahrscheinlichkeitsrechnung und Statistik für Biologen 2. Der Standardfehler

Wahrscheinlichkeitsrechnung und Statistik für Biologen 2. Der Standardfehler Wahrscheinlichkeitsrechnung und Statistik für Biologen 2. Der Standardfehler Noémie Becker & Dirk Metzler 15. April 2016 Inhaltsverzeichnis 1 Der Standardfehler 1 1.1 Ein Versuch............................................

Mehr

Man kann also nicht erwarten, dass man immer den richtigen Wert trifft.

Man kann also nicht erwarten, dass man immer den richtigen Wert trifft. 2.2.2 Gütekriterien Beurteile die Schätzfunktionen, also das Verfahren an sich, nicht den einzelnen Schätzwert. Besonders bei komplexeren Schätzproblemen sind klar festgelegte Güteeigenschaften wichtig.

Mehr

Statistik I für Betriebswirte Vorlesung 13

Statistik I für Betriebswirte Vorlesung 13 Statistik I für Betriebswirte Vorlesung 13 Prof. Dr. Hans-Jörg Starkloff TU Bergakademie Freiberg Institut für Stochastik 4. Juli 2016 Prof. Dr. Hans-Jörg Starkloff Statistik I für Betriebswirte Vorlesung

Mehr

Willkommen zur Vorlesung Statistik (Master)

Willkommen zur Vorlesung Statistik (Master) Willkommen zur Vorlesung Statistik (Master) Thema dieser Vorlesung: Punkt- und Prof. Dr. Wolfgang Ludwig-Mayerhofer Universität Siegen Philosophische Fakultät, Seminar für Sozialwissenschaften Prof. Dr.

Mehr

Statistik Testverfahren. Heinz Holling Günther Gediga. Bachelorstudium Psychologie. hogrefe.de

Statistik Testverfahren. Heinz Holling Günther Gediga. Bachelorstudium Psychologie. hogrefe.de rbu leh ch s plu psych Heinz Holling Günther Gediga hogrefe.de Bachelorstudium Psychologie Statistik Testverfahren 18 Kapitel 2 i.i.d.-annahme dem unabhängig. Es gilt also die i.i.d.-annahme (i.i.d = independent

Mehr

Modellanpassung und Parameterschätzung. A: Übungsaufgaben

Modellanpassung und Parameterschätzung. A: Übungsaufgaben 7 Modellanpassung und Parameterschätzung 1 Kapitel 7: Modellanpassung und Parameterschätzung A: Übungsaufgaben [ 1 ] Bei n unabhängigen Wiederholungen eines Bernoulli-Experiments sei π die Wahrscheinlichkeit

Mehr

Probleme bei kleinen Stichprobenumfängen und t-verteilung

Probleme bei kleinen Stichprobenumfängen und t-verteilung Probleme bei kleinen Stichprobenumfängen und t-verteilung Fassen wir zusammen: Wir sind bisher von der Frage ausgegangen, mit welcher Wahrscheinlichkeit der Mittelwert einer empirischen Stichprobe vom

Mehr

Teil VIII. Zentraler Grenzwertsatz und Vertrauensintervalle. Woche 6: Zentraler Grenzwertsatz und Vertrauensintervalle. Lernziele. Typische Situation

Teil VIII. Zentraler Grenzwertsatz und Vertrauensintervalle. Woche 6: Zentraler Grenzwertsatz und Vertrauensintervalle. Lernziele. Typische Situation Woche 6: Zentraler Grenzwertsatz und Vertrauensintervalle Patric Müller ETHZ Teil VIII Zentraler Grenzwertsatz und Vertrauensintervalle WBL 17/19, 29.05.2017 Wahrscheinlichkeit

Mehr

Stichwortverzeichnis. Symbole

Stichwortverzeichnis. Symbole Stichwortverzeichnis Symbole 50ste Perzentil 119 A Absichern, Ergebnisse 203 Abzählbar unendliche Zufallsvariable 146 Alternativhypothese 237 238 formulieren 248 Anekdote 340 Annäherung 171, 191 Antwortquote

Mehr

Einführung in die Statistik für Wirtschaftswissenschaftler für Betriebswirtschaft und Internationales Management

Einführung in die Statistik für Wirtschaftswissenschaftler für Betriebswirtschaft und Internationales Management Einführung in die Statistik für Wirtschaftswissenschaftler für Betriebswirtschaft und Internationales Management Sommersemester 2013 Hochschule Augsburg Lageparameter: Erwartungswert d) Erwartungswert

Mehr

Zentraler Grenzwertsatz/Konfidenzintervalle

Zentraler Grenzwertsatz/Konfidenzintervalle / Statistik I Sommersemester 2009 Statistik I ZGWS/ (1/37) Kann Ahmadinejad die Wahl gewonnen haben? Im wesentlichen Dreiteilung der polit. Elite 2005: 17.3 Millionen Stimmen (Stichwahl), Wahlbeteiligung

Mehr

von x-würfeln bei wachsendem n? Zur Beantwortung führen wir ein Simulationsexperiment durch.

von x-würfeln bei wachsendem n? Zur Beantwortung führen wir ein Simulationsexperiment durch. Zentraler Grenzwertsatz Die Normalverteilung verdankt ihre universelle theoretische und praktische Bedeutung dem zentralen Grenzwertsatz. Unabhängig von der konkreten k Ausgangsverteilung konvergiert die

Mehr

Methodenlehre. Vorlesung 10. Prof. Dr. Björn Rasch, Cognitive Biopsychology and Methods University of Fribourg

Methodenlehre. Vorlesung 10. Prof. Dr. Björn Rasch, Cognitive Biopsychology and Methods University of Fribourg Methodenlehre Vorlesung 10 Prof. Dr., Cognitive Biopsychology and Methods University of Fribourg 1 Methodenlehre II Woche Datum Thema 1 FQ Einführung, Verteilung der Termine 1 18.2.15 Psychologie als Wissenschaft

Mehr

Zufallsvariablen. Diskret. Stetig. Verteilung der Stichprobenkennzahlen. Binomial Hypergeometrisch Poisson. Normal Lognormal Exponential

Zufallsvariablen. Diskret. Stetig. Verteilung der Stichprobenkennzahlen. Binomial Hypergeometrisch Poisson. Normal Lognormal Exponential Zufallsvariablen Diskret Binomial Hypergeometrisch Poisson Stetig Normal Lognormal Exponential Verteilung der Stichprobenkennzahlen Stetige Zufallsvariable Verteilungsfunktion: Dichtefunktion: Integralrechnung:

Mehr

Willkommen zur Vorlesung Statistik (Master)

Willkommen zur Vorlesung Statistik (Master) Willkommen zur Vorlesung Statistik (Master) Thema dieser Vorlesung: Punkt- und Prof. Dr. Wolfgang Ludwig-Mayerhofer Universität Siegen Philosophische Fakultät, Seminar für Sozialwissenschaften Prof. Dr.

Mehr

Vorlesung 3: Schätzverfahren

Vorlesung 3: Schätzverfahren Vorlesung 3: Schätzverfahren 1. Beispiel: General Social Survey 1978 2. Auswahl einer Zufallsstichprobe und Illustration des Stichprobenfehlers 3. Stichprobenverteilung eines Regressionskoeffizienten 4.

Mehr

Statistik I. Methodologie der Psychologie

Statistik I. Methodologie der Psychologie Statistik I Methodologie der Psychologie Thomas Schmidt & Lena Frank Wintersemester 2003/2004 Georg-Elias-Müller-Institut für Psychologie Uni Göttingen Literatur: Glantz, S.A. (2002). Primer of Biostatistics.

Mehr

Zufallsvariablen [random variable]

Zufallsvariablen [random variable] Zufallsvariablen [random variable] Eine Zufallsvariable (Zufallsgröße) X beschreibt (kodiert) die Versuchsausgänge ω Ω mit Hilfe von Zahlen, d.h. X ist eine Funktion X : Ω R ω X(ω) Zufallsvariablen werden

Mehr

Wahrscheinlichkeit und Statistik: Zusammenfassung

Wahrscheinlichkeit und Statistik: Zusammenfassung HSR Hochschule für Technik Rapperswil Wahrscheinlichkeit und Statistik: Zusammenfassung beinhaltet Teile des Skripts von Herrn Hardy von Lukas Wilhelm lwilhelm.net 12. Januar 2007 Inhaltsverzeichnis 1

Mehr

Mathematische und statistische Methoden II

Mathematische und statistische Methoden II Methodenlehre e e Prof. Dr. G. Meinhardt 6. Stock, Wallstr. 3 (Raum 06-206) Sprechstunde jederzeit nach Vereinbarung und nach der Vorlesung. Mathematische und statistische Methoden II Dr. Malte Persike

Mehr

6. Schätzverfahren für Parameter

6. Schätzverfahren für Parameter 6. Schätzverfahren für Parameter Ausgangssituation: Ein interessierender Zufallsvorgang werde durch die ZV X repräsentiert X habe eine unbekannte Verteilungsfunktion F X (x) Wir interessieren uns für einen

Mehr

7. Grenzwertsätze. Dr. Antje Kiesel Institut für Angewandte Mathematik WS 2011/2012

7. Grenzwertsätze. Dr. Antje Kiesel Institut für Angewandte Mathematik WS 2011/2012 7. Grenzwertsätze Dr. Antje Kiesel Institut für Angewandte Mathematik WS 2011/2012 Mittelwerte von Zufallsvariablen Wir betrachten die arithmetischen Mittelwerte X n = 1 n (X 1 + X 2 + + X n ) von unabhängigen

Mehr

Verteilung von Summen

Verteilung von Summen Verteilung von Summen Beispiel: Würfelwurf Frage: Wie verhält sich die Verteilung der Augensumme von -Würfeln bei wachsendem? Zur Beantwortung führen wir ein Simulationseperiment durch. 6 Würfe mit 1 Würfel

Mehr

Statistik für NichtStatistiker

Statistik für NichtStatistiker Statistik für NichtStatistiker Zufall und Wahrscheinlichkeit von Prof. Dr. Karl Bosch 5., verbesserte Auflage R. Oldenbourg Verlag München Wien Inhaltsverzeichnis 1. ZufalLsexperimente und zufällige Ereignisse

Mehr

So berechnen Sie einen Schätzer für einen Punkt

So berechnen Sie einen Schätzer für einen Punkt htw saar 1 EINFÜHRUNG IN DIE STATISTIK: SCHÄTZEN UND TESTEN htw saar 2 Schätzen: Einführung Ziel der Statistik ist es, aus den Beobachtungen eines Merkmales in einer Stichprobe Rückschlüsse über die Verteilung

Mehr

Trim Size: 176mm x 240mm Lipow ftoc.tex V1 - March 9, :34 P.M. Page 11. Über die Übersetzerin 9. Einleitung 19

Trim Size: 176mm x 240mm Lipow ftoc.tex V1 - March 9, :34 P.M. Page 11. Über die Übersetzerin 9. Einleitung 19 Trim Size: 176mm x 240mm Lipow ftoc.tex V1 - March 9, 2016 6:34 P.M. Page 11 Inhaltsverzeichnis Über die Übersetzerin 9 Einleitung 19 Was Sie hier finden werden 19 Wie dieses Arbeitsbuch aufgebaut ist

Mehr

Wahrscheinlichkeitsrechnung und Statistik

Wahrscheinlichkeitsrechnung und Statistik 9. Vorlesung - 2017 Monte Carlo Methode für numerische Integration Sei g : [0, 1] R stetige Funktion; man möchte 1 0 g(t)dt numerisch approximieren mit Hilfe von Zufallszahlen: Sei (U n ) n eine Folge

Mehr

2.3 Intervallschätzung

2.3 Intervallschätzung 2.3.1 Motivation und Hinführung Bsp. 2.15. [Wahlumfrage] Der wahre Anteil der rot-grün Wähler unter allen Wählern war 2009 auf eine Nachkommastelle gerundet genau 33.7%. Wie groß ist die Wahrscheinlichkeit,

Mehr

Verteilungen eindimensionaler stetiger Zufallsvariablen Stetige Verteilungen. Chi-Quadrat-Verteilung Studentverteilung Fisher-Verteilung

Verteilungen eindimensionaler stetiger Zufallsvariablen Stetige Verteilungen. Chi-Quadrat-Verteilung Studentverteilung Fisher-Verteilung Verteilungen eindimensionaler stetiger Zufallsvariablen Stetige Verteilungen Chi-Quadrat-Verteilung Studentverteilung Fisher-Verteilung Typisierung der stetigen theoretischen Verteilungen Bibliografie:

Mehr

2.3 Intervallschätzung

2.3 Intervallschätzung 2.3.1 Motivation und Hinführung Bsp. 2.11. [Wahlumfrage] Der wahre Anteil der rot-grün Wähler 2009 war genau 33.7%. Wie groß ist die Wahrscheinlichkeit, in einer Zufallsstichprobe von 1000 Personen genau

Mehr

Stichproben und statistische Fehler

Stichproben und statistische Fehler Kapitel 0 Stichproben und statistische Fehler 0. Verfahren zur Auswahl von Stichproben Stichprobenauswahl als Bestandteil von Teilerhebungen: Aus dem Ergebnis der Untersuchung der Stichprobe soll dann

Mehr

1 Wahrscheinlichkeitsrechnung. 2 Zufallsvariablen und ihre Verteilung. 3 Statistische Inferenz. 4 Intervallschätzung

1 Wahrscheinlichkeitsrechnung. 2 Zufallsvariablen und ihre Verteilung. 3 Statistische Inferenz. 4 Intervallschätzung 0 Einführung 1 Wahrscheinlichkeitsrechnung Zufallsvariablen und ihre Verteilung 3 Statistische Inferenz 4 Intervallschätzung Motivation und Hinführung Der wahre Anteil der rot-grün Wähler 009 war genau

Mehr

Mehrdimensionale Zufallsvariablen

Mehrdimensionale Zufallsvariablen Mehrdimensionale Zufallsvariablen Im Folgenden Beschränkung auf den diskreten Fall und zweidimensionale Zufallsvariablen. Vorstellung: Auswerten eines mehrdimensionalen Merkmals ( ) X Ỹ also z.b. ω Ω,

Mehr

Wahrscheinlichkeitsrechnung und Statistik für Biologen 2. Der Standardfehler

Wahrscheinlichkeitsrechnung und Statistik für Biologen 2. Der Standardfehler Wahrscheinlichkeitsrechnung und Statistik für Biologen 2. Der Standardfehler Martin Hutzenthaler & Dirk Metzler 27. April 2010 Inhaltsverzeichnis 1 Eine kurze Wiederholung zur deskriptiven Statistik 2

Mehr

Konkretes Durchführen einer Inferenzstatistik

Konkretes Durchführen einer Inferenzstatistik Konkretes Durchführen einer Inferenzstatistik Die Frage ist, welche inferenzstatistischen Schlüsse bei einer kontinuierlichen Variablen - Beispiel: Reaktionszeit gemessen in ms - von der Stichprobe auf

Mehr

Grundlagen der Kombinatorik

Grundlagen der Kombinatorik Statistik 1 für SoziologInnen Grundlagen der Kombinatorik Univ.Prof. Dr. Marcus Hudec Zufallsauswahl aus Grundgesamtheiten In der statistischen Praxis kommt dem Ziehen von Stichproben größte Bedeutung

Mehr

Statistik für SozialwissenschaftlerInnen II p.85

Statistik für SozialwissenschaftlerInnen II p.85 Schätzverfahren Statistik für SozialwissenschaftlerInnen II p.85 Schätzverfahren Ziel von Schätzverfahren: Ausgehend von Stichproben Aussagen über Populationskennwerte machen Kenntnis der Abweichung des

Mehr

3 Konfidenzintervalle

3 Konfidenzintervalle 3 Konfidenzintervalle Konfidenzintervalle sind das Ergebnis von Intervallschätzungen. Sicheres Wissen über Grundgesamtheiten kann man anhand von Stichproben nicht gewinnen. Aber mit Hilfe der Statistik

Mehr

Übungen mit dem Applet Rangwerte

Übungen mit dem Applet Rangwerte Rangwerte 1 Übungen mit dem Applet Rangwerte 1 Statistischer Hintergrund... 2 1.1 Verteilung der Einzelwerte und der Rangwerte...2 1.2 Kurzbeschreibung des Applets...2 1.3 Ziel des Applets...4 2 Visualisierungen

Mehr

Parameterschätzung. Kapitel 14. Modell Es sei {P θ θ Θ}, Θ R m eine Familie von Verteilungen auf χ (sog. Stichprobenraum),

Parameterschätzung. Kapitel 14. Modell Es sei {P θ θ Θ}, Θ R m eine Familie von Verteilungen auf χ (sog. Stichprobenraum), Kapitel 14 Parameterschätzung Modell Es sei {P θ θ Θ}, Θ R m eine Familie von Verteilungen auf χ (sog. Stichprobenraum), = ( 1,..., n ) sei eine Realisierung der Zufallsstichprobe X = (X 1,..., X n ) zu

Mehr

Wahrscheinlichkeitsrechnung und Statistik für Biologen 2. Der Standardfehler

Wahrscheinlichkeitsrechnung und Statistik für Biologen 2. Der Standardfehler Wahrscheinlichkeitsrechnung und Statistik für Biologen 2. Der Standardfehler Martin Hutzenthaler & Dirk Metzler http://www.zi.biologie.uni-muenchen.de/evol/statgen.html 27. April 2010 1 Eine kurze Wiederholung

Mehr

5. Stichproben und Statistiken

5. Stichproben und Statistiken 5. Stichproben und Statistiken Problem: Es sei X eine ZV, die einen interessierenden Zufallsvorgang repräsentiere Man möchte die tatsächliche Verteilung von X kennenlernen (z.b. mittels der VF F X (x)

Mehr

von x-würfeln bei wachsendem n? Zur Beantwortung führen wir ein Simulationsexperiment durch.

von x-würfeln bei wachsendem n? Zur Beantwortung führen wir ein Simulationsexperiment durch. Zentraler Grenzwertsatz Die Normalverteilung verdankt ihre universelle theoretische und praktische Bedeutung dem zentralen Grenzwertsatz. Unabhängig von der konkreten k Ausgangsverteilung konvergiert nämlich

Mehr

Bereiche der Statistik

Bereiche der Statistik Bereiche der Statistik Deskriptive / Exploratorische Statistik Schließende Statistik Schließende Statistik Inferenz-Statistik (analytische, schließende oder konfirmatorische Statistik) baut auf der beschreibenden

Mehr

Wichtige Definitionen und Aussagen

Wichtige Definitionen und Aussagen Wichtige Definitionen und Aussagen Zufallsexperiment, Ergebnis, Ereignis: Unter einem Zufallsexperiment verstehen wir einen Vorgang, dessen Ausgänge sich nicht vorhersagen lassen Die möglichen Ausgänge

Mehr

Elisabeth Aufhauser, unveröffentlichter Text Unterrichtsmaterial Statistik-UE für Soziologie

Elisabeth Aufhauser, unveröffentlichter Text Unterrichtsmaterial Statistik-UE für Soziologie Elisabeth Aufhauser, unveröffentlichter Text Unterrichtsmaterial Statistik-UE für Soziologie Konfidenzintervall Statistische Analyse von Stichproben Der Datensatz aus der Übung (social survey 2003) besteht

Mehr

UE Statistische Mustererkennung WS 2018 Angaben zur 2ten Aufgabengruppe

UE Statistische Mustererkennung WS 2018 Angaben zur 2ten Aufgabengruppe UE Statistische Mustererkennung WS 2018 Angaben zur 2ten Aufgabengruppe 1 Aufgabe UE-II.1 Generieren Sie je 1000 Stichproben (samples) mit Umfang 5/30/100/500 für die Normalverteilung N(µ, σ 2 ) = N(4,

Mehr

Inhaltsverzeichnis. Inhalt Teil I: Beschreibende (Deskriptive) Statistik Seite. 1.0 Erste Begriffsbildungen Merkmale und Skalen 5

Inhaltsverzeichnis. Inhalt Teil I: Beschreibende (Deskriptive) Statistik Seite. 1.0 Erste Begriffsbildungen Merkmale und Skalen 5 Inhaltsverzeichnis Inhalt Teil I: Beschreibende (Deskriptive) Statistik Seite 1.0 Erste Begriffsbildungen 1 1.1 Merkmale und Skalen 5 1.2 Von der Urliste zu Häufigkeitsverteilungen 9 1.2.0 Erste Ordnung

Mehr

1. Einführung in die induktive Statistik

1. Einführung in die induktive Statistik Wichtige Begriffe 1. Einführung in die induktive Statistik Grundgesamtheit: Statistische Masse, die zu untersuchen ist, bzw. über die Aussagen getroffen werden soll Stichprobe: Teil einer statistischen

Mehr

Notgepäck Genauigkeit

Notgepäck Genauigkeit Notgepäck Genauigkeit Beat Hulliger Dienst Statistische Methoden, Bundesamt für Statistik 20.4.2006 1 Was ist Genauigkeit genau? Um zu beschreiben, was Genauigkeit in der Statistik ist, müssen wir untersuchen,

Mehr

Auswahlverfahren. Zufallsauswahl Bewusste Auswahl Willkürliche Auswahl. Dipl.-Päd. Ivonne Bemerburg

Auswahlverfahren. Zufallsauswahl Bewusste Auswahl Willkürliche Auswahl. Dipl.-Päd. Ivonne Bemerburg Auswahlverfahren Zufallsauswahl Bewusste Auswahl Willkürliche Auswahl Blockseminar: Methoden quantitativer Grundgesamtheit und Stichprobe Die Festlegung einer Menge von Objekten, für die die Aussagen der

Mehr

Statistik für Dummies

Statistik für Dummies Bearbeitet von Deborah Rumsey, Reinhard Engel 3. aktualisierte Auflage 2015. Buch. 368 S. Softcover ISBN 978 3 527 71156 7 Format (B x L): 17,6 x 24 cm Wirtschaft > Betriebswirtschaft: Theorie & Allgemeines

Mehr

Empirische Wirtschaftsforschung

Empirische Wirtschaftsforschung Empirische Wirtschaftsforschung Prof. Dr. Bernd Süßmuth Universität Leipzig Institut für Empirische Wirtschaftsforschung Volkswirtschaftslehre, insbesondere Ökonometrie 1 3. Momentenschätzung auf Stichprobenbasis

Mehr

Stichproben und statistische Fehler

Stichproben und statistische Fehler Kapitel 0 Stichproben und statistische Fehler 0. Verfahren zur Auswahl von Stichproben Stichprobenauswahl als Bestandteil von Teilerhebungen: Aus dem Ergebnis der Untersuchung der Stichprobe soll dann

Mehr

Wahrscheinlichkeitsrechnung und Statistik

Wahrscheinlichkeitsrechnung und Statistik 10. Vorlesung - 2018 Grundbegriffe der Statistik statistische Einheiten = Objekte an denen interessierende Größen erfaßt werden z.b. Bevölkerung einer Stadt; Schüler einer bestimmten Schule; Patienten

Mehr

o o o o o o o o o o o o

o o o o o o o o o o o o Klumpen-Stichproben = Cluster Sampling Obs.: Bei einer uneingeschränkten Zufallsauswahl wird pro Randomisierungs- Schritt genau eine Beobachtung gemacht. Ein ganz wesentlicher Punkt : Jedes zufällig ausgewählte

Mehr

Stichproben Parameterschätzung Konfidenzintervalle:

Stichproben Parameterschätzung Konfidenzintervalle: Stichproben Parameterschätzung Konfidenzintervalle: Beispiel Wahlprognose: Die Grundgesamtheit hat einen Prozentsatz p der Partei A wählt. Wenn dieser Prozentsatz bekannt ist, dann kann man z.b. ausrechnen,

Mehr

Zentraler Grenzwertsatz

Zentraler Grenzwertsatz Statistik 2 für SoziologInnen Zentraler Grenzwertsatz Univ.Prof. Dr. Marcus Hudec Statistik für SoziologInnen 1 Zentraler Grenzwertsatz Inhalte Themen dieses Kapitels sind: Der zentrale Grenzwertsatz und

Mehr

Konfidenzintervalle Grundlegendes Prinzip Erwartungswert Bekannte Varianz Unbekannte Varianz Anteilswert Differenzen von Erwartungswert Anteilswert

Konfidenzintervalle Grundlegendes Prinzip Erwartungswert Bekannte Varianz Unbekannte Varianz Anteilswert Differenzen von Erwartungswert Anteilswert Konfidenzintervalle Grundlegendes Prinzip Erwartungswert Bekannte Varianz Unbekannte Varianz Anteilswert Differenzen von Erwartungswert Anteilswert Beispiel für Konfidenzintervall Im Prinzip haben wir

Mehr

Statistik I für Betriebswirte Vorlesung 4

Statistik I für Betriebswirte Vorlesung 4 Statistik I für Betriebswirte Vorlesung 4 Prof. Dr. Hans-Jörg Starkloff TU Bergakademie Freiberg Institut für Stochastik 25. April 2016 Prof. Dr. Hans-Jörg Starkloff Statistik I für Betriebswirte Vorlesung

Mehr

Herzlich willkommen zur Vorlesung. Methoden der empirischen Sozialforschung I. Stichproben

Herzlich willkommen zur Vorlesung. Methoden der empirischen Sozialforschung I. Stichproben FB 1 W. Ludwig-Mayerhofer Methoden I Stichproben 1 Einstieg/Überblick Paradigmen Werturteile/Ethik Forschungslogik Hypothesen Forschungsdesign Messung Standardisierte Befragung Qualitative Interviews Beobachtung

Mehr

Kapitel 10. Stichproben

Kapitel 10. Stichproben Kapitel 10 n In der deskriptiven Statistik werden die Charakteristika eines Datensatzes durch Grafiken verdeutlicht und durch Maßzahlen zusammengefasst. In der Regel ist man aber nicht nur an der Verteilung

Mehr

Auswertung und Lösung

Auswertung und Lösung Dieses Quiz soll Ihnen helfen, Kapitel 4.6 und 4.7 besser zu verstehen. Auswertung und Lösung Abgaben: 59 / 265 Maximal erreichte Punktzahl: 8 Minimal erreichte Punktzahl: 0 Durchschnitt: 4.78 1 Frage

Mehr

Empirische Wirtschaftsforschung

Empirische Wirtschaftsforschung Empirische Wirtschaftsforschung Prof. Dr. Bernd Süßmuth Universität Leipzig Institut für Empirische Wirtschaftsforschung Volkswirtschaftslehre, insbesondere Ökonometrie 1 4. Basiskonzepte der induktiven

Mehr

Grundlagen der Kombinatorik

Grundlagen der Kombinatorik Statistik 1 für SoziologInnen Grundlagen der Kombinatorik Univ.Prof. Dr. Marcus Hudec Zufallsauswahl aus Grundgesamtheiten In der statistischen Praxis kommt dem Ziehen von Stichproben große Bedeutung zu,

Mehr

Population und Stichprobe Wahrscheinlichkeitstheorie II

Population und Stichprobe Wahrscheinlichkeitstheorie II Population und Stichprobe Wahrscheinlichkeitstheorie II 5. Sitzung 1 S. Peter Schmidt 2003 1 Stichprobenziehung als Zufallsexperiment Definition Stichprobe: Teilmenge der Elemente der Grundgesamtheit bzw.

Mehr

Häufigkeiten. Verteilungen. Lageparameter Mittelwert. oder

Häufigkeiten. Verteilungen. Lageparameter Mittelwert. oder Formelsammlung Beschreibende Statistik Univariate Häufigkeitsverteilungen X ist ein diskretes Merkmal, mit k Ausprägungen TR: Mode 2 1 = AC absolute relative Häufigkeit Häufigkeiten Bivariate Häufigkeitsverteilungen

Mehr

Evaluation & Forschungsstrategien. B.Sc.-Seminar. Sitzung IV: Konfidenzintervalle // Normalverteilungstests

Evaluation & Forschungsstrategien. B.Sc.-Seminar. Sitzung IV: Konfidenzintervalle // Normalverteilungstests Evaluation & Forschungsstrategien B.Sc.-Seminar Sitzung V: Konfidenzintervalle // Normalverteilungstests Seminarinhalte Sitzung V: 16.05.2018 Konfidenzintervalle bei bekannter Varianz Konfidenzintervalle

Mehr

Beschreibende Statistik Deskriptive Statistik. Schließende Statistik Inferenzstatistik. Schluss von der Stichprobe auf die Grundgesamtheit

Beschreibende Statistik Deskriptive Statistik. Schließende Statistik Inferenzstatistik. Schluss von der Stichprobe auf die Grundgesamtheit Beschreibende Statistik Deskriptive Statistik Schließende Statistik Inferenzstatistik Beschreibung der Stichprobe Schluss von der Stichprobe auf die Grundgesamtheit Keine Voraussetzungen Voraussetzung:

Mehr

Konfidenzintervalle so einfach wie möglich erklärt

Konfidenzintervalle so einfach wie möglich erklärt Konfidenzintervalle so einfach wie möglich erklärt Wolfgang Ludwig-Mayerhofer, Universität Siegen, FB 1, Fach Soziologie Das Problem SozialwissenschaftlerInnen erheben sehr oft Daten aus Stichproben. Es

Mehr

3 Häufigkeitsverteilungen

3 Häufigkeitsverteilungen 3 Häufigkeitsverteilungen 3.1 Absolute und relative Häufigkeiten 3.2 Klassierung von Daten 3.3 Verteilungsverläufe 3.1 Absolute und relative Häufigkeiten Datenaggregation: Bildung von Häufigkeiten X nominal

Mehr