Statistik Vorlesung Statistik 1
|
|
|
- Clemens Färber
- vor 7 Jahren
- Abrufe
Transkript
1 Statistik Vorlesung Statistik 1 K.Gerald van den Boogaart Statistik p. 1
2 Organisation Webseite Bildungsserver Folien sind Folien (um Bemerkungen zur Vorlesung zu notieren) Skript (gibt es zuzätzlich) Probeklausuren (später auf OPAL) Organisation Übungen Klausur (Anmeldung 1+2, Hilfsmittel) Vorlesung Wie bestehe ich? (Vorlesung, Lernen, Übungen) Statistik p. 2
3 Inhalt heute (Grundlagen) Was ist Statistik? Grundmodelle der Statistik Datenmatrix Skala Datentafel Statistik p. 3
4 Was ist Statistik? Wortwurzel: Aufstellungen (lat. stare) Bedeutungen: Datensammlung des Staats (ursprüngliche Bedeutung) Wissenschaft von der Auswertung von Daten/vom Schließen aus Daten Aus beobachteten Zufallsvariablen berechnete weitere Zufallsvariablen (z.b. der Mittelwert) X = 1 n (X X n ) Statistik p. 4
5 Die Landkarte der Vorlesung Daten Schätzung Test Mathe Die Datenminen Riesige Halde mit nichtrepräsentativen Daten Die unwegsamen Ausreißerberge Bayes-Land Gletscherspalte der gleichen Messwerte Klippe der unüberprüfbaren Voraussetzungen Vorhersagebereich Rangviertel ML-City Schätzervorstadt Statistika Modell-Platz Aussichtsturm Grafingen Vertrauensbereich Normalviertel Klippe der unüberprüfbaren Voraussetzungen Sequenzielle Passage Momentenmethoden u. Lineare Modelle t-dorf Steppe der unwesentlich verletzten Voraussetzungen Todeswüste, der nicht erfüllten Voraussetzungen Posthoc robuster Weg Steig der Nichtparametrik Bonferroni Passage Sümpfe des multiplen Testens Benjamini Passage Nacht der angenommen Hypothesen Schlaraffia oder das Land des gelungen statistischen Nachweis Land des offenen Betrugs Statistik p. 5
6 Repräsentative Daten Nur mit repräsentativen Daten kann man statistische Schlüsse ziehen. Repräsentativ heißt: identisch verteilt: alle Beobachtungen folgen dem gleichen (uns interessierenden) Zufallsgesetz. stochastisch unabhängig: jede Beobachtung ist neu nach diesem Zufallsgesetz zustandegekommen. Statistik p. 6
7 Es gibt zwei grundsätzlich verschiedene Wege zu repräsentativen Daten: Zufällige und faire Auswahl einer Stichprobe aus einer Grundgesamtheit. Unabhängiger Wiederholung identischer Zufallsexperimente. Statistik p. 7
8 Repräsentative Daten durch Stichprobe und Grundgesamtheit Statistik p. 8
9 Grundbegriffe Grundgesamtheit statistisches Individuen Stichprobe repräsentativ Zufallsvariable Realisierung der Zufallsvariable Statistik p. 9
10 Beispiel: Bodenqualität Grundgesamtheit: Alle Punkte des Bodens im Untersuchungsgebiet. Stichprobe: Zufällig ausgewählte Untersuchungspunkte. Zufallsvariablen: Nährstoffgehalt in an diesen Stellen genommenen Bodenproben. Realisierungen: 5.34%,7,45%,... Statistik p. 10
11 Beispiel: Werkstückprüfung Grundgesamtheit: Alle gefertigten Zahnräder der Teilenummer 45632N. Stichprobe: Zufällig zu Testzwecken entnommen Zahnräder. Zufallsvariablen: Betriebstunden im Testbetrieb bis Defekt. Realisierungen: 5343h, 7342h,... Statistik p. 11
12 Vollerhebung Die Vollerhebung ist eine spezielle Art der Stichprobennahme. Bei Vollerhebung ist die Stichprobe gleich der Grundgesamtheit. Unabhängigkeit: alle kommen unabhängig von allen anderen sicher in die Stichprobe. gleiche Wahrscheinlichkeit: Wahrscheinlichkeit in die Stichprobe zu kommen ist 1. Statistik p. 12
13 Zufallsexperimente Repräsentative Daten durch Zufallsexperimente Statistik p. 13
14 Grundbegriffe Vorschrift für ein Zufallsexpriment Zufallsexperiment identisch verteilt unabhängig repräsentativ Zufallsvariable Realisierung der Zufallsvariable Statistik p. 14
15 Fadenbrüche Anzahl Fadenbrüche bei verschiedenen Rahmenbedingungen: > warpbreaks breaks wool tension 1 26 A L 2 30 A L 3 54 A L 4 25 A L 5 70 A L 6 52 A L 7 51 A L 8 26 A L 9 67 A L A M A M Statistik p. 15
16 Beispiel: Lichtgeschwindigkeitsmessungen > lightspeeds [1] [9] [17] [25] [33] [41] [49] [57] [65] [73] [81] [89] [97] Statistik p. 16
17 Beispiel: Lichtgeschwindigkeitsmessungen > dotchart(lightspeeds,main="michelsons Lichtgeschwindigk Michelsons Lichtgeschwindigkeitsmessungen Statistik p. 17
18 Repräsentativität Allgemein (resultierende Zufallsvariablen) identisch verteilt stochastisch unabhängig Stichproben (zufällige Auswahl) mit der gleichen Wahrscheinlichkeit unabhängig voneinander Zufallsexperimente (Experiment mit zufälligem Ausgang) nach gleicher Vorschrift durchgeführt unabhängig voneinander Statistik p. 18
19 Mehrstichprobenmodell Oft finden wir in einem Datensatz zwei oder mehrer Gruppen von Daten, die von unterschiedlichen Grundgesamtheit oder Zufallsexperimenten (Experimentiervorschriften) herrühren. Ein Datensatz kann also mehrer Stichproben enthalten. Man spricht dann von einer Zweistichproben- oder Mehrstichprobensituation. Statistik p. 19
20 Zufälligkeit der Daten Ein repräsentativer Datensatz ist grundsätzlich zufällig, da die Auswahl der Beobachtungen zufällig zustandegekommen ist, oder die Experimente zufällige Ergebnisse haben. Wir interessieren uns aber nicht für die konkreten Daten, sondern für die dahinterstehenden Gesetzte: z.b. für die Zahlräder, die tatsächlich ausgeliefert werden, was alle Deutschen wählen, oder welche Maschieneneinstellung in Zukunft die besten Ergebnisse liefert. Statistik p. 20
21 Zufälligkeit der Kenngrößen Das erste Ergebnis einer statistischen Analyse sind oft Kenngrößen, wie z.b. der Mittelwert. Der Mittelwert als Zufallsvariable und Statistik X := 1 n n i=1 X i = 1 n (X 1 +X X n ) Der Mittelwert ist selbst zufällig!!!. Der Mittelwert als abstrakte Realisierung x := 1 n n i=1 x n = 1 n (x 1 +x x n ) Der realisierte Mittelwert [1] Statistik p. 21
22 Repräsentation statistischer Daten Datenliste Datenmatrix Fälle Variablen Skala (bestimmt die Auswertung!!!) Datentafel Statistik p. 22
23 Beispiel einer Datenliste > lightspeeds [1] [9] [17] [25] [33] [41] [49] [57] [65] [73] [81] [89] [97] Statistik p. 23
24 Beispiel Datenlisten $setosa [1] [16] [31] [46] $versicolor [1] [16] [31] [46] $virginica [1] [16] [31] Statistik p. 24
25 Beispiel einer Datenmatrix Ausschnitt eines Datensatzes: > X Sepal.Length Sepal.Width Species setosa setosa setosa versicolor versicolor versicolor versicolor Statistik p. 25
26 Die Datenmatrix X ij,i = 1,...,n, j = 1,...,m sind die Einträge einer Datenmatrix. Jede Zeile X i gehört zu einem statistischen Individuum Jede Spalte X j gehört zu einem Merkmal Der Eintrag X ij entspricht der Ausprägung des j-ten Merkmals am i-ten Individuum. Die Einträge einer Datenmatrix sind Zufallsvariablen bzw. ihre Realisierungen. Die Einträge einer Datenmatrix sind nicht unbedingt reelle Zahlen! Statistik p. 26
27 Fälle Die Zeile der Datenmatrix heißen Fälle. Sie entsprechen den statistischen Individuen. > X Sepal.Length Sepal.Width Species setosa setosa setosa versicolor versicolor versicolor versicolor Statistik p. 27
28 Der Begriff der Skala Zu jeder Variable gehört eine Skala, also ein Wertebereich mit gewissen sinnvollen mathematischen Operationen. Kriterien zur Bestimmung der Skala sind: Welche Werte sind möglich? Wieviele Werte sind möglich? Sind die möglichen Werte geordnet? (Fachabi<Abi?) Sind die Abstände der Werte vergleichbar? Ist die Differenz ein guter Unterschiedsbegriff? Ist das Verhältnis ein guter Unterschiedsbegriff? Statistik p. 28
29 Skalen diskrete Skalen haben voneinander getrennte Werte nominal (), dichotom (= NOT), kategoriell(=), ordinal(=<), Intervallskala(=< ), Anzahlen(=< ) stetige Skalen Anteil< /, positiv< /, reell< spezielle Skalen z.b. Richtungen, Zusammensetzungen, Orientierungen, Winkel, Zuordnungen,... Statistik p. 29
30 Diskrete Skalen nominal kategoriell ordinal dichotom intervallskaliert Anzahl Statistik p. 30
31 Die diskreten Skalen Name Geschlecht Fach Stufe Note Kinder 1 Maier m Chemie Abi Huber w Biologie Vordiplom Mueller m Geographie Hauptdiplom 2 4 Statistik p. 31
32 Stetige Skalen reell ratio / positiv reell /Verhältnisskala Anteilskala / Wahrscheinlichkeitskala Statistik p. 32
33 Die stetigen Skalen AlkoholAnteil Menge Temperatur Statistik p. 33
34 Grobeinteilung der Skalen Die Skala bestimmt welche statistischen Verfahren angewendet werden können. Oft genügt im ersten Schritt schon eine Grobeinteilung: diskret Variablen mit diskreten Skalen heißen oft auch Faktor. Die Möglichen Werte heißen dann Stufen des Faktors. stetig Variablen mit stetigen Skalen können ein unendlich viele verschiedene Zahlenwerte annehmen. Treten dabei der gleiche Wert mehrfach auf, so spricht man von Bindungen. spezielle Variablen, die nicht ins Schema passen haben eine spezielle Skala. Statistik p. 34
35 Das feinste Skalenniveau diskret nominal stetig rell alle reellen Zahlen vorher bekannte Kategorien kategoriell geordnete Kategorien genau zwei Kategorien mit gleichem Abstand ordinal dichtom Intervall log ratio x>0 Id log Id logit mit Abstand "1 mehr" Anzahl Anteil 0<x<1 Statistik p. 35
36 Versuchen wir es selbst Ausschnitt des Iris Blueten Datensatzes: > X Sepal.Length Sepal.Width Petal.Length Petal.Width Species setosa setosa setosa versicolor versicolor versicolor versicolor Welche Spalte hat welche Skala? Statistik p. 36
37 Wozu Skala? Die Skala bestimmt welche weiteren Verfahren angewendet werden sollten. Die Skala gibt Hinweise was in der weiteren Analyse beachtet werden sollte. Die Skala bestimmt, wie die Daten zusammengefaßt und beschrieben werden können. Die Bestimmung der Skala der Variablen ist daher der erste Schritt jeder Datenanalyse. Statistik p. 37
38 Datentafel Die Datentafel ist eine alternative Darstellung zur Datenmatrix, wenn nur diskrete Skalen auftreten. Statistik p. 38
39 Datentafel (Beispiel) > data(titanic) > ftable(titanic,col.vars=c("class","survived")) Class 1st 2nd 3rd Crew Survived No Yes No Yes No Yes No Yes Sex Age Male Child Adult Female Child Adult Statistik p. 39
40 Erklaerung Datentafel Statistik p. 40
41 Die Datentafel Jede Zelle der Datenmatrix enthält die Anzahl statistischer Individuen in der Stichprobe mit der gegeben Faktorkombination. Statistik p. 41
42 Erste Analyseschritte Eine Datenauswertung beginnt grundsätzlich mit den folgenden Analyseschritten: Wie liegen die Daten vor? Welche Variablen gibt es und was bedeuten Sie? Welche Skala haben die einzelnen Variablen? Ein-, Zwei- oder Mehrstichprobensituation? Was sind die Grundgesamtheiten? Sind die Daten für die Grundgesamtheit repräsentativ? Statistik p. 42
43 Wozu die ersten Analyseschritte? Eine Datenauswertung beginnt grundsätzlich mit den folgenden Analyseschritten: Wie liegen die Daten vor? Welche Variablen gibt es und was bedeuten Sie? Welche Skala haben die einzelnen Variablen? Ein-, Zwei- oder Mehrstichprobensituation? Was sind die Grundgesamtheiten? Sind die Daten für die Grundgesamtheit repräsentativ? Statistik p. 43
44 Repräsentation statistischer Daten Datenliste Nur ein Merkmal!!! alle Skalen Datenmatrix mehrere Variablen alle Skalen Datentafel mehrere Variablen nur kategorielle Skalen Statistik p. 44
45 Zusammenfassung Repräsentativität statistischer Daten Repräsentation statistischer Daten Skalen statistischer Daten Zufälligkeit statistischer Daten Statistik p. 45
46 Zusammenfassung Repräsentativität statistischer Daten Nur diese Daten erlauben Rückschlüsse. Repräsentation statistischer Daten Nur diese Daten versteht jemand. Skalen statistischer Daten Das bestimmt das Auswertungsverfahren. Zufälligkeit statistischer Daten Das ist das Kernproblem bei der Auswertung. Statistik p. 46
47 Einordnung Daten Schätzung Test Mathe Die Datenminen Riesige Halde mit nichtrepräsentativen Daten Die unwegsamen Ausreißerberge Bayes-Land Gletscherspalte der gleichen Messwerte Klippe der unüberprüfbaren Voraussetzungen Vorhersagebereich Rangviertel ML-City Schätzervorstadt Statistika Modell-Platz Aussichtsturm Grafingen Vertrauensbereich Normalviertel Klippe der unüberprüfbaren Voraussetzungen Sequenzielle Passage Momentenmethoden u. Lineare Modelle t-dorf Steppe der unwesentlich verletzten Voraussetzungen Todeswüste, der nicht erfüllten Voraussetzungen Posthoc robuster Weg Steig der Nichtparametrik Bonferroni Passage Sümpfe des multiplen Testens Benjamini Passage Nacht der angenommen Hypothesen Schlaraffia oder das Land des gelungen statistischen Nachweis Land des offenen Betrugs Statistik p. 47
Stochastik und Statistik
Stochastik und Statistik p. 1/44 Stochastik und Statistik Vorlesung 2 (Graphik I) K.Gerald van den Boogaart http://www.stat.boogaart.de Stochastik und Statistik p. 2/44 Daten Schätzung Test Mathe Die Datenminen
Datenanalyse und Statistik
Datenanalyse und Statistik p. 1/44 Datenanalyse und Statistik Vorlesung 2 (Graphik I) K.Gerald van den Boogaart http://www.stat.boogaart.de Datenanalyse und Statistik p. 2/44 Daten Schätzung Test Mathe
Überblick und Ausblick
Letzte Vorlesung Statistik Vorlesung Datenanalyse und Statistik Gliederung 1 Sortiert nach dem Inhalt der Vorlesung Sortiert nach Daten 2 Kovarianzmatrizen Klusteranalyse Hauptkomponentenanalyse Faktorenanalyse
Statistik für Ingenieure Vorlesung 8
Statistik für Ingenieure Vorlesung 8 Prof. Dr. Hans-Jörg Starkloff TU Bergakademie Freiberg Institut für Stochastik 12. Dezember 2016 Bezeichnungen und Klassifikationen von Merkmalen Bezeichnungen: Grundgesamtheit:
Angewandte Statistik 3. Semester
Angewandte Statistik 3. Semester Übung 5 Grundlagen der Statistik Übersicht Semester 1 Einführung ins SPSS Auswertung im SPSS anhand eines Beispieles Häufigkeitsauswertungen Grafiken Statistische Grundlagen
Statistik II: Grundlagen und Definitionen der Statistik
Medien Institut : Grundlagen und Definitionen der Statistik Dr. Andreas Vlašić Medien Institut (0621) 52 67 44 [email protected] Gliederung 1. Hintergrund: Entstehung der Statistik 2. Grundlagen
2.Übung Stochastik und Statistik WS09/10 (Boogaart, Jansen)
2.Übung Stochastik und Statistik WS09/10 (Boogaart, Jansen) Aufgabe 1: Ein Versuch mit einem Schlafmittel In einem klinischen Versuch sollte die Wirksamkeit eines Schlafmittels getestet werden. Dazu wurden
Zusammenfassung Mathe II. Themenschwerpunkt 2: Stochastik (ean) 1. Ein- und mehrstufige Zufallsexperimente; Ergebnismengen
Zusammenfassung Mathe II Themenschwerpunkt 2: Stochastik (ean) 1. Ein- und mehrstufige Zufallsexperimente; Ergebnismengen Zufallsexperiment: Ein Vorgang, bei dem mindestens zwei Ereignisse möglich sind
3. Merkmale und Daten
3. Merkmale und Daten Ziel dieses Kapitels: Vermittlung des statistischen Grundvokabulars Zu klärende Begriffe: Grundgesamtheit Merkmale (Skalenniveau etc.) Stichprobe 46 3.1 Grundgesamtheiten Definition
P (X = 2) = 1/36, P (X = 3) = 2/36,...
2.3 Zufallsvariablen 2.3 Zufallsvariablen Meist sind die Ereignisse eines Zufallseperiments bereits reelle Zahlen. Ist dies nicht der Fall, kann man Ereignissen eine reelle Zahl zuordnen. Zum Beispiel
Daten, Datentypen, Skalen
Bildung kommt von Bildschirm und nicht von Buch, sonst hieße es ja Buchung. Daten, Datentypen, Skalen [main types of data; levels of measurement] Die Umsetzung sozialwissenschaftlicher Forschungsvorhaben
Forschungsmethoden in der Sozialen Arbeit
Forschungsmethoden in der Sozialen Arbeit Fachhochschule für Sozialarbeit und Sozialpädagogik Alice- Salomon Hochschule für Soziale arbeit, Gesundheit, Erziehung und Bildung University of Applied Sciences
Bivariate Analyseverfahren
Bivariate Analyseverfahren Bivariate Verfahren beschäftigen sich mit dem Zusammenhang zwischen zwei Variablen Beispiel: Konservatismus/Alter Zusammenhangsmaße beschreiben die Stärke eines Zusammenhangs
4. Schließende Statistik (Inferenzstatistik, konfirmatorische Verfahren)
4. Schließende Statistik (Inferenzstatistik, konfirmatorische Verfahren) 4.1. Einführung Schätzen unbekannter Parameter im Modell, z.b. Wahrscheinlichkeiten p i (Anteile in der Gesamtmenge), Erwartungswerte
Vorlesung Grundlagen der Biometrie WS 2011/12 1. Grundbegriffe
Vorlesung Grundlagen der Biometrie WS 2011/12 1. Grundbegriffe Dr. Antje Kiesel Institut für Angewandte Mathematik WS 2011/2012 1. Grundbegriffe der beschreibenden Statistik Statistische Einheiten, Grundgesamtheit
Statistikpraktikum. Carsten Rezny. Sommersemester Institut für angewandte Mathematik Universität Bonn
Statistikpraktikum Carsten Rezny Institut für angewandte Mathematik Universität Bonn Sommersemester 2016 Anmeldung in Basis: 06. 10.06.2016 Organisatorisches Einführung Statistik Analyse empirischer Daten
Statistik. Jan Müller
Statistik Jan Müller Skalenniveau Nominalskala: Diese Skala basiert auf einem Satz von qualitativen Attributen. Es existiert kein Kriterium, nach dem die Punkte einer nominal skalierten Variablen anzuordnen
Lösungen zur Klausur GRUNDLAGEN DER WAHRSCHEINLICHKEITSTHEORIE UND STATISTIK
Institut für Stochastik Dr. Steffen Winter Lösungen zur Klausur GRUNDLAGEN DER WAHRSCHEINLICHKEITSTHEORIE UND STATISTIK für Studierende der INFORMATIK vom 17. Juli 01 (Dauer: 90 Minuten) Übersicht über
Skalenniveaus =,!=, >, <, +, -
ZUSAMMENHANGSMAßE Skalenniveaus Nominalskala Ordinalskala Intervallskala Verhältnisskala =,!= =,!=, >, < =,!=, >, ,
Teil I: Deskriptive Statistik
Teil I: Deskriptive Statistik 2 Grundbegriffe 2.1 Merkmal und Stichprobe 2.2 Skalenniveau von Merkmalen 2.3 Geordnete Stichproben und Ränge 2.1 Merkmal und Stichprobe An (geeignet ausgewählten) Untersuchungseinheiten
Statistik II: Signifikanztests /1
Medien Institut : Signifikanztests /1 Dr. Andreas Vlašić Medien Institut (0621) 52 67 44 [email protected] Gliederung 1. Noch einmal: Grundlagen des Signifikanztests 2. Der chi 2 -Test 3. Der t-test
Wiederholung Statistik I. Statistik für SozialwissenschaftlerInnen II p.8
Wiederholung Statistik I Statistik für SozialwissenschaftlerInnen II p.8 Konstanten und Variablen Konstante: Merkmal hat nur eine Ausprägung Variable: Merkmal kann mehrere Ausprägungen annehmen Statistik
Mathematik IV für Maschinenbau und Informatik (Stochastik) Universität Rostock, Institut für Mathematik Sommersemester 2007
Mathematik IV für Maschinenbau und Informatik Stochastik Universität Rostock, Institut für Mathematik Sommersemester 007 Prof. Dr. F. Liese Dipl.-Math. M. Helwich Serie Termin: 9. Juni 007 Aufgabe 3 Punkte
Informatik II Grundbegriffe der Wahrscheinlichkeitsrechnung
lausthal Informatik II rundbegriffe der Wahrscheinlichkeitsrechnung. Zachmann lausthal University, ermany [email protected] Begriffe Definition: Unter einem Zufallsexperiment versteht man einen,
Einführung in die Statistik für Politikwissenschaftler Sommersemester 2011
Einführung in die Statistik für Politikwissenschaftler Sommersemester 2011 Es können von den Antworten alle, mehrere oder keine Antwort(en) richtig sein. Nur bei einer korrekten Antwort (ohne Auslassungen
Deskriptive Statistik 1 behaftet.
Die Statistik beschäftigt sich mit Massenerscheinungen, bei denen die dahinterstehenden Einzelereignisse meist zufällig sind. Statistik benutzt die Methoden der Wahrscheinlichkeitsrechnung. Fundamentalregeln:
Seminar zur Energiewirtschaft:
Seminar zur Energiewirtschaft: Ermittlung der Zahlungsbereitschaft für erneuerbare Energien bzw. bessere Umwelt Vladimir Udalov 1 Modelle mit diskreten abhängigen Variablen 2 - Ausgangssituation Eine Dummy-Variable
Standardisierte Vorgehensweisen und Regeln zur Gewährleistung von: Eindeutigkeit Schlussfolgerungen aus empirischen Befunden sind nur dann zwingend
Standardisierte Vorgehensweisen und Regeln zur Gewährleistung von: Eindeutigkeit Schlussfolgerungen aus empirischen Befunden sind nur dann zwingend oder eindeutig, wenn keine alternativen Interpretationsmöglichkeiten
Statistik Testverfahren. Heinz Holling Günther Gediga. Bachelorstudium Psychologie. hogrefe.de
rbu leh ch s plu psych Heinz Holling Günther Gediga hogrefe.de Bachelorstudium Psychologie Statistik Testverfahren 18 Kapitel 2 i.i.d.-annahme dem unabhängig. Es gilt also die i.i.d.-annahme (i.i.d = independent
Computergestützte Methoden. Master of Science Prof. Dr. G. H. Franke WS 07/08
Computergestützte Methoden Master of Science Prof. Dr. G. H. Franke WS 07/08 1 Seminarübersicht 1. Einführung 2. Recherchen mit Datenbanken 3. Erstellung eines Datenfeldes 4. Skalenniveau und Skalierung
Teil: lineare Regression
Teil: lineare Regression 1 Einführung 2 Prüfung der Regressionsfunktion 3 Die Modellannahmen zur Durchführung einer linearen Regression 4 Dummyvariablen 1 Einführung o Eine statistische Methode um Zusammenhänge
Kategoriale Daten. Johannes Hain. Lehrstuhl für Mathematik VIII Statistik 1/17
Johannes Hain Lehrstuhl für Mathematik VIII Statistik 1/17 Übersicht Besitzen die Daten, die statistisch ausgewertet werden sollen, kategoriales Skalenniveau, unterscheidet man die folgenden Szenarien:
Warum Stichproben? Vollerhebungen sind teuer Nehmen (zu)viel Zeit in Anspruch Sind evtl. destruktiv
Warum Stichproben? Vollerhebungen sind teuer Nehmen (zu)viel Zeit in Anspruch Sind evtl. destruktiv Voraussetzung für die Anwendung von Stichproben: Stichproben müssen repräsentativ sein, d.h. ein verkleinertes
Auswahlverfahren. Zufallsauswahl Bewusste Auswahl Willkürliche Auswahl. Dipl.-Päd. Ivonne Bemerburg
Auswahlverfahren Zufallsauswahl Bewusste Auswahl Willkürliche Auswahl Blockseminar: Methoden quantitativer Grundgesamtheit und Stichprobe Die Festlegung einer Menge von Objekten, für die die Aussagen der
Statistische Grundlagen I
Statistische Grundlagen I Arten der Statistik Zusammenfassung und Darstellung von Daten Beschäftigt sich mit der Untersuchung u. Beschreibung von Gesamtheiten oder Teilmengen von Gesamtheiten durch z.b.
P (A B) P (B) = P ({3}) P ({1, 3, 5}) = 1 3.
2 Wahrscheinlichkeitstheorie Beispiel. Wie wahrscheinlich ist es, eine Zwei oder eine Drei gewürfelt zu haben, wenn wir schon wissen, dass wir eine ungerade Zahl gewürfelt haben? Dann ist Ereignis A das
Zusammenhangsanalyse in Kontingenztabellen
Zusammenhangsanalyse in Kontingenztabellen Bisher: Tabellarische / graphische Präsentation Jetzt: Maßzahlen für Stärke des Zusammenhangs zwischen X und Y. Chancen und relative Chancen Zunächst 2 2 - Kontingenztafel
Was sind Zusammenhangsmaße?
Was sind Zusammenhangsmaße? Zusammenhangsmaße beschreiben einen Zusammenhang zwischen zwei Variablen Beispiele für Zusammenhänge: Arbeiter wählen häufiger die SPD als andere Gruppen Hochgebildete vertreten
Wahrscheinlichkeitsrechnung und Quantentheorie
Physikalische Chemie II: Atombau und chemische Bindung Winter 2013/14 Wahrscheinlichkeitsrechnung und Quantentheorie Messergebnisse können in der Quantenmechanik ganz prinzipiell nur noch mit einer bestimmten
Einführung in die Wahrscheinlichkeitsrechnung und Statistik für Ingenieure
Einführung in die Wahrscheinlichkeitsrechnung und Statistik für Ingenieure Von Prof. Hubert Weber Fachhochschule Regensburg 3., überarbeitete und erweiterte Auflage Mit zahlreichen Bildern, Tabellen sowie
Konfidenzintervalle Grundlegendes Prinzip Erwartungswert Bekannte Varianz Unbekannte Varianz Anteilswert Differenzen von Erwartungswert Anteilswert
Konfidenzintervalle Grundlegendes Prinzip Erwartungswert Bekannte Varianz Unbekannte Varianz Anteilswert Differenzen von Erwartungswert Anteilswert Beispiel für Konfidenzintervall Im Prinzip haben wir
4. Grundzüge der Wahrscheinlichkeitsrechnung
4. Grundzüge der Wahrscheinlichkeitsrechnung Dr. Antje Kiesel Institut für angewandte Mathematik WS 2010/2011 In der beschreibenden Statistik haben wir verschiedene Kennzahlen (Statistiken) für Stichproben
Nachhol-Klausur - Schätzen und Testen - Wintersemester 2013/14
Prof. Dr. Rainer Schwabe 08.07.2014 Otto-von-Guericke-Universität Magdeburg Institut für Mathematische Stochastik Nachhol-Klausur - Schätzen und Testen - Wintersemester 2013/14 Name:, Vorname: Matr.-Nr.
Inhaltsverzeichnis. Teil 1 Basiswissen und Werkzeuge, um Statistik anzuwenden
Inhaltsverzeichnis Teil 1 Basiswissen und Werkzeuge, um Statistik anzuwenden 1 Statistik ist Spaß 3 Warum Statistik? 3 Checkpoints 4 Daten 4 Checkpoints 7 Skalen - lebenslang wichtig bei der Datenanalyse
Inhaltsverzeichnis. Inhalt Teil I: Beschreibende (Deskriptive) Statistik Seite. 1.0 Erste Begriffsbildungen Merkmale und Skalen 5
Inhaltsverzeichnis Inhalt Teil I: Beschreibende (Deskriptive) Statistik Seite 1.0 Erste Begriffsbildungen 1 1.1 Merkmale und Skalen 5 1.2 Von der Urliste zu Häufigkeitsverteilungen 9 1.2.0 Erste Ordnung
Mathematik für Biologen
Mathematik für Biologen Prof. Dr. Rüdiger W. Braun Heinrich-Heine-Universität Düsseldorf 10. November 2010 1 Bedingte Wahrscheinlichkeit Satz von der totalen Wahrscheinlichkeit Bayessche Formel 2 Grundprinzipien
Zusammenhangsanalyse mit SPSS. Messung der Intensität und/oder der Richtung des Zusammenhangs zwischen 2 oder mehr Variablen
- nominal, ordinal, metrisch In SPSS: - Einfache -> Mittelwerte vergleichen -> Einfaktorielle - Mehrfaktorielle -> Allgemeines lineares Modell -> Univariat In SPSS: -> Nichtparametrische Tests -> K unabhängige
Lösungen zur Klausur WAHRSCHEINLICHKEITSTHEORIE UND STATISTIK (STOCHASTIK)
Institut für Stochastik Dr. Steffen Winter Lösungen zur Klausur WAHRSCHEINLICHKEITSTHEORIE UND STATISTIK (STOCHASTIK) für Studierende des Maschinenbaus vom 7. Juli (Dauer: 8 Minuten) Übersicht über die
Zufallsvariablen [random variable]
Zufallsvariablen [random variable] Eine Zufallsvariable (Zufallsgröße) X beschreibt (kodiert) die Versuchsausgänge ω Ω mit Hilfe von Zahlen, d.h. X ist eine Funktion X : Ω R ω X(ω) Zufallsvariablen werden
Glossar Biometrie / Statistik. Auszug für Fragebogen Fallzahlberechnung/-begründung
Glossar Biometrie / Statistik A Äquivalenztest Der Äquivalenztest beurteilt die Gleichwertigkeit von Therapien. Beim Äquivalenztest werden als Hypothesen formuliert: Nullhypothese H 0 : Die Präparate sind
Modul 04: Messbarkeit von Merkmalen, Skalen und Klassierung. Prof. Dr. W. Laufner Beschreibende Statistik
Modul 04: Messbarkeit von Merkmalen, Skalen und 1 Modul 04: Informationsbedarf empirische (statistische) Untersuchung Bei einer empirischen Untersuchung messen wir Merkmale bei ausgewählten Untersuchungseinheiten
Ein- und Zweistichprobentests
(c) Projekt Neue Statistik 2003 - Lernmodul: Ein- Zweistichprobentests Ein- Zweistichprobentests Worum geht es in diesem Modul? Wiederholung: allgemeines Ablaufschema eines Tests Allgemeine Voraussetzungen
Vorlesung Stichproben WS 2009/2010
Institut für Statistik Statistisches Beratungslabor Prof. Dr. Helmut Küchenhoff WS 2009/2010 http://www.stat.uni-muenchen.de/~helmut/stichproben_0910.html Übung: Monia Mahling donnerstags 08:00 bis 10:00
STATISTIK FÜR STATISTIK-AGNOSTIKER Teil 1 (wie mich)
WS 07/08-1 STATISTIK FÜR STATISTIK-AGNOSTIKER Teil 1 (wie mich) Nur die erlernbaren Fakten, keine Hintergrundinfos über empirische Forschung etc. (und ich übernehme keine Garantie) Bei der Auswertung von
Grundgesamtheit und Stichprobe
Grundgesamtheit und Stichprobe Definition 1 Die Menge der Untersuchungseinheiten {U 1,U 2,...,U N } heißt Grundgesamtheit. Die Anzahl N der Einheiten ist der Umfang der Grundgesamtheit. Jeder Einheit U
Einführung in die Statistik Einführung
Professur E-Learning und Neue Medien Institut für Medienforschung Philosophische Fakultät Einführung in die Statistik Einführung Professur E-Learning und Neue Medien www.tu-chemnitz.de/phil/imf/elearning
Grundlegende Eigenschaften von Punktschätzern
Grundlegende Eigenschaften von Punktschätzern Worum geht es in diesem Modul? Schätzer als Zufallsvariablen Vorbereitung einer Simulation Verteilung von P-Dach Empirische Lage- und Streuungsparameter zur
1 Vorbemerkungen 1. 2 Zufallsexperimente - grundlegende Begriffe und Eigenschaften 2. 3 Wahrscheinlichkeitsaxiome 4. 4 Laplace-Experimente 6
Inhaltsverzeichnis 1 Vorbemerkungen 1 2 Zufallsexperimente - grundlegende Begriffe und Eigenschaften 2 3 Wahrscheinlichkeitsaxiome 4 4 Laplace-Experimente 6 5 Hilfsmittel aus der Kombinatorik 7 1 Vorbemerkungen
Kapitel 6. Kapitel 6 Mehrstufige Zufallsexperimente
Mehrstufige Zufallsexperimente Inhalt 6.1 6.1 Mehrstufige Experimente 6.2 6.2 Bedingte Wahrscheinlichkeiten Seite 2 6.1 Mehrstufige Experimente Grundvorstellung: Viele Viele Experimente werden der der
Biostatistik Erne Einfuhrung fur Biowissenschaftler
Matthias Rudolf Wiltrud Kuhlisch Biostatistik Erne Einfuhrung fur Biowissenschaftler PEARSON Studium Inhaltsverzeichnis Vorwort xi Kapitel 1 Einfiihrung 1 1.1 Biostatistik als Bestandteil biowissenschafllicher
Kapitel 5. Univariate Zufallsvariablen. 5.1 Diskrete Zufallsvariablen
Kapitel 5 Univariate Zufallsvariablen Im ersten Teil dieses Skriptes haben wir uns mit Daten beschäftigt und gezeigt, wie man die Verteilung eines Merkmals beschreiben kann. Ist man nur an der Population
Prof. Dr. Christoph Kleinn Institut für Waldinventur und Waldwachstum Arbeitsbereich Waldinventur und Fernerkundung
Systematische Stichprobe Rel. große Gruppe von Stichprobenverfahren. Allgemeines Merkmal: es existiert ein festes, systematisches Muster bei der Auswahl. Wie passt das zur allgemeinen Forderung nach Randomisierung
Kapitel III - Merkmalsarten
Universität Karlsruhe (TH) Institut für Statistik und Mathematische Wirtschaftstheorie Statistik 1 - Deskriptive Statistik Kapitel III - Merkmalsarten Markus Höchstötter Lehrstuhl für Statistik, Ökonometrie
Deskriptive Statistik Kapitel III - Merkmalsarten
Deskriptive Statistik Kapitel III - Merkmalsarten Georg Bol [email protected] [email protected] April 26, 2006 Typeset by FoilTEX Agenda 1. Merkmalsarten 2. Skalen 3.
Teil I: Deskriptive Statistik
Teil I: Deskriptive Statistik 2 Grundbegriffe 2.1 Merkmal und Stichprobe 2.2 Skalenniveau von Merkmalen 2.3 Geordnete Stichproben und Ränge 2.1 Merkmal und Stichprobe An (geeignet ausgewählten) Untersuchungseinheiten
Stichprobenauslegung. für stetige und binäre Datentypen
Stichprobenauslegung für stetige und binäre Datentypen Roadmap zu Stichproben Hypothese über das interessierende Merkmal aufstellen Stichprobe entnehmen Beobachtete Messwerte abbilden Schluss von der Beobachtung
Statistik für das Psychologiestudium
Dieter Rasch / Klaus D. Kubinger Statistik für das Psychologiestudium Mit Softwareunterstützung zur Planung und Auswertung von Untersuchungen sowie zu sequentiellen Verfahren ELSEVIER SPEKTRUM AKADEMISCHER
I. Zahlen, Rechenregeln & Kombinatorik
XIV. Wiederholung Seite 1 I. Zahlen, Rechenregeln & Kombinatorik 1 Zahlentypen 2 Rechenregeln Brüche, Wurzeln & Potenzen, Logarithmen 3 Prozentrechnung 4 Kombinatorik Möglichkeiten, k Elemente anzuordnen
4 Diskrete Wahrscheinlichkeitsverteilungen
4 Diskrete Wahrscheinlichkeitsverteilungen 4.1 Wahrscheinlichkeitsräume, Ereignisse und Unabhängigkeit Definition: Ein diskreter Wahrscheinlichkeitsraum ist ein Paar (Ω, Pr), wobei Ω eine endliche oder
Statistik, Geostatistik
Geostatistik Statistik, Geostatistik Statistik Zusammenfassung von Methoden (Methodik), die sich mit der wahrscheinlichkeitsbezogenen Auswertung empirischer (d.h. beobachteter, gemessener) Daten befassen.
Grundlagen der Datenanalyse am Beispiel von SPSS
Grundlagen der Datenanalyse am Beispiel von SPSS Einführung Dipl. - Psych. Fabian Hölzenbein [email protected] Einführung Organisatorisches Was ist Empirie? Was ist Statistik? Dateneingabe
Grundlagen der Statistik
Grundlagen der Statistik Übung 15 009 FernUniversität in Hagen Alle Rechte vorbehalten Fachbereich Wirtschaftswissenschaft Übersicht über die mit den Übungsaufgaben geprüften Lehrzielgruppen Lehrzielgruppe
Bivariate Zusammenhänge
Bivariate Zusammenhänge Tabellenanalyse: Kreuztabellierung und Kontingenzanalyse Philosophische Fakultät Institut für Soziologie Berufsverläufe und Berufserfolg von Hochschulabsolventen Dozent: Mike Kühne
Aufgaben zu Kapitel 7:
Aufgaben zu Kapitel 7: Aufgabe 1: In einer Klinik sollen zwei verschiedene Therapiemethoden miteinander verglichen werden. Zur Messung des Therapieerfolges werden die vorhandenen Symptome einmal vor Beginn
Methodenlehre. Vorlesung 5. Prof. Dr. Björn Rasch, Cognitive Biopsychology and Methods University of Fribourg
Methodenlehre Vorlesung 5 Prof. Dr., Cognitive Biopsychology and Methods University of Fribourg 1 Methodenlehre I Woche Datum Thema 1 FQ 20.2.13 Einführung, Verteilung der Termine 1 25.9.13 Psychologie
3 Bedingte Wahrscheinlichkeit, Unabhängigkeit
3 Bedingte Wahrscheinlichkeit, Unabhängigkeit Bisher : (Ω, A, P) zur Beschreibung eines Zufallsexperiments Jetzt : Zusatzinformation über den Ausgang des Experiments, etwa (das Ereignis) B ist eingetreten.
Elementare Wahrscheinlichkeitsrechnung
Johann Pfanzagl Elementare Wahrscheinlichkeitsrechnung 2., überarbeitete und erweiterte Auflage W DE G Walter de Gruyter Berlin New York 1991 Inhaltsverzeichnis 1. Zufallsexperimente und Wahrscheinlichkeit
Prüfung aus Statistik 1 für SoziologInnen. Musterlösung
Prüfung aus Statistik 1 für SoziologInnen Gesamtpunktezahl =80 1) Wissenstest (maximal 20 Punkte) Prüfungsdauer: 2 Stunden Musterlösung Kreuzen ( ) Sie die jeweils richtige Antwort an. Jede richtige Antwort
1.6 Der Vorzeichentest
.6 Der Vorzeichentest In diesem Kapitel soll der Vorzeichentest bzw. Zeichentest vorgestellt werden, mit dem man Hypothesen bezüglich des Medians der unabhängig und identisch stetig verteilten Zufallsvariablen
Florian Frötscher und Demet Özçetin
Statistische Tests in der Mehrsprachigkeitsforschung Aufgaben, Anforderungen, Probleme. Florian Frötscher und Demet Özçetin [email protected] SFB 538 Mehrsprachigkeit Max-Brauer-Allee 60
Statistik II. Statistische Tests. Statistik II
Statistik II Statistische Tests Statistik II - 12.5.2006 1 Test auf Anteilswert: Binomialtest Sei eine Stichprobe unabhängig, identisch verteilter ZV (i.i.d.). Teile diese Stichprobe in zwei Teilmengen
Deskriptive Statistik Lösungen zu Blatt 1 Christian Heumann, Susanne Konrath SS Lösung Aufgabe 1
1 Deskriptive Statistik Lösungen zu Blatt 1 Christian Heumann, Susanne Konrath SS 2011 Lösung Aufgabe 1 (a) Es sollen die mathematischen Vorkenntnisse der Studenten, die die Vorlesung Statistik I für Statistiker,
b) Bestimmen Sie die Varianz der beiden Schätzer. c) Ist ein oder sind beide Schätzer konsistent? Begründen Sie!
Aufgabe 1 (3 + 3 + 2 Punkte) Ein Landwirt möchte das durchschnittliche Gewicht von einjährigen Ferkeln bestimmen lassen. Dies möchte er aus seinem diesjährigen Bestand an n Tieren schätzen. Er kann dies
Mathematische und statistische Methoden II
Sprechstunde jederzeit nach Vereinbarung und nach der Vorlesung Wallstr. 3, 6. Stock, Raum 06-206 Mathematische und statistische Methoden II Dr. Malte Persike [email protected] lordsofthebortz.de lordsofthebortz.de/g+
Regression ein kleiner Rückblick. Methodenseminar Dozent: Uwe Altmann Alexandra Kuhn, Melanie Spate
Regression ein kleiner Rückblick Methodenseminar Dozent: Uwe Altmann Alexandra Kuhn, Melanie Spate 05.11.2009 Gliederung 1. Stochastische Abhängigkeit 2. Definition Zufallsvariable 3. Kennwerte 3.1 für
Grundbegriffe (1) Grundbegriffe (2)
Grundbegriffe (1) S.1 Äquivalenzklasse Unter einer Äquivalenzklasse versteht man eine Klasse von Objekten, die man hinsichtlich bestimmter Merkmalsausprägungen als gleich (äquivalent) betrachtet. (z.b.
If something has a 50% chance of happening, then 9 times out of 10 it will. Yogi Berra
If something has a 50% chance of happening, then 9 times out of 10 it will. Yogi Berra If you torture your data long enough, they will tell you whatever you want to hear. James L. Mills Warum Biostatistik?
I. Deskriptive Statistik 1
I. Deskriptive Statistik 1 1. Einführung 3 1.1. Grundgesamtheit und Stichprobe.................. 5 1.2. Merkmale und Verteilungen..................... 6 1.3. Tabellen und Grafiken........................
Allgemeine diskrete Wahrscheinlichkeitsräume II. Beispiel II. Beispiel I. Definition 6.3 (Diskreter Wahrscheinlichkeitsraum)
Allgemeine diskrete Wahrscheinlichkeitsräume I Allgemeine diskrete Wahrscheinlichkeitsräume II Verallgemeinerung von Laplaceschen Wahrscheinlichkeitsräumen: Diskrete Wahrscheinlichkeitsräume Ω endlich
Übungsaufgaben, Statistik 1
Übungsaufgaben, Statistik 1 Kapitel 3: Wahrscheinlichkeiten [ 4 ] 3. Übungswoche Der Spiegel berichtet in Heft 29/2007 von folgender Umfrage vom 3. und 4. Juli 2007:,, Immer wieder werden der Dalai Lama
Zufallsgröße. Würfelwurf mit fairem Würfel. Wahrscheinlichkeitsverteilung einer diskreten
Zufallsgrößen Ergebnisse von Zufallsexperimenten werden als Zahlen dargestellt 0 Einführung Wahrscheinlichkeitsrechnung 2 Zufallsvariablen und ihre Verteilung 3 Statistische Inferenz 4 Hypothesentests
