Gewichtung und Fehlerquellen
|
|
- Carl Hase
- vor 6 Jahren
- Abrufe
Transkript
1 Universität Bielefeld 18. April 2005
2 Gewichtung
3 Gewichtung Unter einer Gewichtung wird die Vergabe von positiven reellen Zahlen an die Merkmalsträger im Datensatz verstanden, die als Gewichtungsfaktoren bezeichnet werden. In der Regel wird auf die Fallzahl gewichtet, d. h. die Gewichte werden so normiert, daß die gewichtete Fallzahl der ungewichteten gleicht. Es ergibt sich eine natürliche maximale Spannweite der Gewichtungsfaktoren zwischen 0.00 und 9.99, wobei ein Wert von 0.00 zu vermeiden ist, da dann die Fälle aus dem Datensatz entfernt werden. Üblicherweise wird eine Untergrenze von 0.01 verwendet.
4 Aus welchen Gründen wird gewichtet: 1. Design-Erfordernisse 2. Versuch der Reduktion des Zufallsfehlers durch eine Schichtung a posteriori 3. Gewichtung auf Grund einer empirischen Hypothese Design-Gewichtung Wenn die Stichprobe disproportional auf Schichten aufgeteilt ist, erfordert der Stichprobenplan eine nachträgliche Gewichtung der Stichprobe. Diese Gewichtungen werden Design-Gewichtungen genannt, die sich daraus ergebenden Gewichte entsprechend Design-Gewichte. Design-Gewichte können prinzipiell als Faktor proportional zur inversen Auswahlwahrscheinlichkeit gebildet werden.
5 Beispiel: Ost-West-Gewichtungen bei Auswertungen mit dem ALLBUS 2000 für Gesamtdeutschland Methodenbericht ALLBUS 2000 (S3451MET.PDF) Wenn man mit den Daten des ALLBUS 2000 eine Auswertung für ganz Deutschland durchführen will, ist die Disproportionalität der Teilstichproben für West- und Ostdeutschland durch eine Gewichtung auszugleichen. Für Vergleichszwecke werden die Gewichte w i grundsätzlich normiert. Im Westen wird die Summe der Gewichte auf den Umfang der Weststichprobe n W festgesetzt, im Osten auf den Umfang der Oststichprobe n O. Treten bei den interessierenden Merkmalen fehlende Werte auf, so sind diese als eigene Kategorie zu behandeln. Mit N W und N O werden die Umfänge der Grundgesamtheiten bezeichnet.
6 Folgende Gewichtungsfaktoren (Transformationsgewichte) sind konstruiert worden: NW N Westdeutschland: w i = n n W Ostdeutschland: w i = n n O w i = = NO N w i = = n = n W + n O ist der Gesamtumfang der Stichprobe, N = N W + N O ist der Gesamtumfang der Grundgesamtheit, die aus dem Mikrozensus 1997 gebildet wurde. Die Gewichtungsfaktoren können als Ausprägungen einer Variable verwendet werden. Bei Auswertungen für Gesamtdeutschland werden dann die Westdeutschen hoch- und die Ostdeutschen heruntergewichtet.
7 Schichtung a posteriori Merkmale, deren Verteilung man hinreichend genau kennt (beispielsweise durch die amtliche Statistik) können in einer nachträglichen Schichtung mittels Gewichtung Verwendung finden. Diese wird mit einem Anpassungsverfahren (redressment) realisiert. Häufig werden mehrere Redressment-Variablen verwendet (Alter, Geschlecht). Die Kombination einzelner Ausprägungen dieser Merkmale werden Gewichtungszellen genannt. Beispiel: Kriminologische Schülerbefragung in Münster Methodenbericht aus dem Jahre 2001
8 Die Gewichtung wird hier verwendet, um kleinere Verzerrungen zwischen Stichprobenparametern und Referenzdaten aus der Grundgesamtheit auszugleichen. Die einzelne Gewichtung mit nur einem Merkmal ist vergleichsweise einfach (hier am Beispiel Geschlecht): w männlich= %N männlich %n männlich w weiblich = %N weiblich %n weiblich Es entsteht ein Gewichtungsfaktor mit zwei Gewichten: einmal für die Kategorie männlich, zum anderen für die Kategorie weiblich. Personen mit einem fehlenden Wert bei der Gewichtungsvariable bekommen ein Gewicht von 1, da kein Gewicht berechnet werden kann. Der jeweilige Fall soll erhalten bleiben.
9 Beispiel: Berechnung der Gewichte für das Merkmal Geschlecht aus der Schülerbefragung Ergebnis: Schulstatistik Stichprobe männlich weiblich männlich weiblich w männlich= 1366/ /1915 = w weiblich = 1285/ /1915 =
10 Für eine simultane Gewichtung mit den Merkmalen Schulform und Geschlecht kann man zwei Varianten unterscheiden: 1. Multiplikation der beiden Einzelgewichte: Kombinierte Einzelgewichte männlich weiblich Gesamt Hauptschule HS*männlich HS*weiblich Realschule RS*männlich RS*weiblich Gymnasium GY*männlich GY*weiblich Sonderschule So*männlich So*weiblich Gesamt
11 Bildung der Gewichte unter Ausschöpfung der Ursprungsinformationen: w HS/männlich= %N HS/männlich %n HS/männlich Kombination an Hand der Originaltabelle männlich weiblich Gesamt Hauptschule % Grundges. % Grundges. Realschule % Grundges. % Grundges. Gymnasium % Grundges. % Grundges. Sonderschule % Grundges. % Grundges. Gesamt
12 Beispiel: Berechnung an Hand der Originaltabelle aus der Schülerbefragung Schulstatistik Stichprobe Gewicht männlich weiblich männlich weiblich männlich weiblich HS RS GY SO Ges w HS/männlich= 274/ /1915 =
13 In der Regel wird die 2. Variante der simultanen Gewichtung aus theoretischen Gründen die naheliegende sein. Beide Gewichtungsvarianten sind nicht wechselseitig ineinander überführbar oder identisch. Grundsätzlich sind die Effekte der Gewichtung abhängig von: Größe der Verzerrung der Stichprobe je Gewichtungsmerkmal Anzahl der fehlenden Werte Stärke des Zusammenhangs der Gewichtungsmerkmale mit dem interessierenden Merkmal
14 Gewichtung auf Grund einer empirischen Hypothese Ein Beispiel für die Gewichtungsprozedur auf Grund einer empirischen Hypothese ist die in der Wahlforschung übliche Praxis, mit dem Resultat der Rückerinnerungsfrage (Recallfrage) zu gewichten. Recallfrage: Wie haben Sie sich bei der letzten Wahl entschieden? Aus dem Vergleich der Rückerinnerung mit dem tatsächlichen Wahlergebnis wird dann ein Gewicht berechnet. Liegt eine Unterschätzung in der Rückerinnerung vor, so kann entsprechend hochgewichtet werden, liegt eine Überschätzung vor, so kann entsprechend heruntergewichtet werden.
15 Gewichtung mit der Rückerinnerungsfrage FDP Grüne SPD CDU Sonstige Wahlergebnis Rückerinnerung Gewicht 6/3 8/8 38/35 42/45 6/9 Verteilung Stichprobe Verteilung 2.5 (6/3) 9 (8/8) 36 (38/35) 44 (42/45) 8.5 (6/9) nach = 5 =9 = 39 = 44 = 5.7 Gewichtung Dieser Gewichtungsprozedur liegt die Hypothese zugrunde, daß die Rückerinnerungsverzerrung in Richtung und Stärke der Verzerrung der Verteilung in der Stichprobe entspricht.
16 Gewichtung Es werden drei Kategorien von unterschieden: 1. Zufallsfehler der Stichprobe (sampling variability) 2. Systematische Fehler auf Grund des Verfahrens der Stichprobenauswahl 3. Verzerrungen, die nicht direkt durch das Auswahlverfahren produziert wurden (non-sampling bias) Unter Meßfehler werden verstanden: im Interview Diskrepanz zwischen Zielpopulation und Surveypopulation Non-Response
17 Zunächst lassen sich nonsampling errors weiter untergliedern nach nonobservation errors und measurement errors. Die nonobservation errors treten dann auf, wenn beispielsweise eine Befragung aufgrund der Abwesenheit der zu befragenden Person nicht durchgeführt werden kann (noncoverage errors oder wenn die Befragung ganz oder teilweise verweigert wird (nonresponse errors). Die measurement errors lassen sich weiter unterscheiden nach response errors, beispielsweise verursacht durch Interviewerfehler oder sozial erwünschtes Antwortverhalten, und nach processing errors, die auf Übertragungsfehler bei der Dateneingabe oder Codierungsfehler zurückzuführen sind. Die nonresponse errors führen zu zwei Typen von fehlenden Werten im Datenmaterial: unit nonresponse item nonresponse.
18 Differenzierung der nonsampling errors nonsampling errors nonobservation errors measurement errors noncoverage nonresponse response errors errors errors unit nonresponse item nonresponse temporary nonresponse permanent nonresponse processing errors
19 Muster fehlender Werte bei item nonresponse x = Messwerte Variablen y 1 y 2 y 3 y 4 y 5 x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x
20 Monotones Muster fehlender Werte bei unit nonresponse Panel t 1 t 2 t 3 t 4 t 5 x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x = Messwerte, t 1 bis t 5 = Befragungszeitpunkte
21 Wenn eine statistische Berücksichtigung fehlender Werte bei der Datenanalyse und Modellierung vorgenommen werden soll, sind zunächst verschiedene Prozesse zu betrachten, die zu den fehlenden Werten führen. Für die weitere Erläuterung wird von zwei Variablen x und y ausgegangen, wobei x vollständig gemessen ist und y fehlende Werte aufweist. x = Alter und y = Einkommen: 1. Hängt die Wahrscheinlichkeit einer Antwort weder von der Variablen x noch von der Variablen y ab, dann sind beobachtete und fehlende Werte zufällig verteilt. In diesem Fall werden fehlende Werte als missing completely at random (im folgenden abgekürzt MCAR) bezeichnet. Jede zufällig gezogene Substichprobe mit vollständigen Daten unterscheidet sich dann nicht von der Gesamtstichprobe mit den fehlenden Werten. Die MCAR-Annahme gilt beispielsweise nicht, wenn Personen mit fehlenden Einkommensangaben im Durchschnitt älter sind, als Personen mit vollständigen Daten.
22 2. Hängt die Wahrscheinlichkeit einer Antwort von der Variablen x nicht aber von der Variablen y ab, dann sind die beobachteten Werte nicht zufällig, die fehlenden Werte aber zufällig verteilt. Formal gilt dann folgender Ausdruck: Pr(y missing y, x) = Pr(y missing x) Die konditionale Wahrscheinlichkeit (Pr) für fehlende Werte in der Variablen y unter der Bedingung der Variablen x und y ist gleich der konditionalen Wahrscheinlichkeit für fehlende Werte in y unter der Bedingung, wenn nur x gegeben ist. In diesem Fall werden fehlende Werte als missing at random (im folgenden abgekürzt MAR) bezeichnet. Die MAR-Annahme ist dann beispielsweise erfüllt, wenn die fehlenden Einkommensangaben vom Alter abhängig sind, aber in jeder Altersgruppe die Wahrscheinlichkeit für die fehlenden Werte beim Einkommen unabhängig von der Verteilung der gültigen Einkommensangaben sind.
23 3. Hängt die Wahrscheinlichkeit einer Antwort sowohl von der Variablen x als auch von der Variablen y ab, dann sind weder beobachtete noch fehlende Werte zufällig verteilt. Formal gilt dann folgender Ausdruck: Pr(y missing y, x) = Pr(y missing y) In diesem Fall werden fehlende Werte als missing not at random (im folgenden abgekürzt MNAR) bezeichnet. Die fehlenden Einkommensangaben sind vom Alter abhängig und von der Verteilung der gültigen Einkommensangaben.
24 Graphische Veranschaulichung der unterschiedlichen Ausfallprozesse x y z r (a) MCAR x z y r (b) MAR x z y r (c) MNAR Neben den erwähnten Variablen x (Variable mit vollständigen Werten) und y (Variable mit fehlenden Werten) steht die Variable z für die Ursache der fehlenden Werte und die Variable r für das Ausfallmuster. Wenn das Ausfallmuster von den Verteilungen der Werte in x und y abhängt, dann gilt für die fehlenden Werte die dritte Ausfallsituation (MNAR) und der Ausfallprozeß kann nicht ignoriert werden.
25 Vielmehr müssen dann statistische Modelle herangezogen werden, die den Mechanismus fehlender Werte explizit berücksichtigen (selection models und pattern mixture models). Aus der folgenden Tabelle wird ersichtlich, daß die einfachsten Methoden zur Handhabung fehlender Werte den restriktivsten Ausfallprozeß voraussetzen (MCAR), während elaboriertere Methoden weniger restriktive Anforderungen stellen (MAR). Fallweiser und paarweiser Ausschluß fehlender Werte sind die am häufigsten benutzten Behandlungsmöglichkeiten in der statistischen Datenanalyse, was auch durch die einfache Handhabung in Statistikprogrammpaketen verursacht wird.
26 Übersicht über die klassischen Verfahren zur Behandlung fehlender Werte Klassische Verfahren Methode Vorteile Nachteile Ausfall Programm Fallweiser Erzeugt Drastische MCAR SPSS Ausschluß konsistente Reduktion der SAS fehlender Werte Matrizen Fallzahl möglich STATA Paarweiser Benutzt alle Inkonsistente MCAR SPSS Ausschluß verfügbaren Varianz-/Kovarianz- SAS fehlender Werte Werte matrizen möglich STATA Ersetzung Einfache Varianzreduktion, MAR SPSS durch Handhabung abnorme Werte SAS Mittelwerte möglich STATA Regressions- Einfache Verzerrungen der MAR SPSS basierte Handhabung Schätzer, keine SAS einfache Standardfehler STATA Ersetzung ermittelbar
27 Beispiel: Ausschöpfung beim Schweizer Umweltsurvey 1994 Bruttostichprobe: 8218 (100%) Stichprobenneutrale Ausfälle: 3396 (41,32%) Bereinigter Stichprobenumfang: = 4822 Durchgeführte Interviews: 3019 (62,6% von 4822). Ausschöpfungsquote: (3019/4822) 100 = 62,6% Rechnet man bei dem Beispiel die Kategorie Anrufbeantworter, Krankheit, abwesend und nicht erreichbar zu den systematischen Ausfällen, dann vermindert sich die Ausschöpfungsquote auf 52,6%. Das Beispiel bezieht sich ausschließlich auf Ausfälle von ganzen Befragungen (unit-nonresponse). Dazu kommen noch Verweigerung von einzelnen Fragen (z.b. Einkommensangaben). Dieser Verweigerungen werden als item-nonresponse bezeichnet.
28 Liegt die Ausschöpfungsquote der Umfrage bei 70% und liegen Antworten bei den Befragten auf die Einkommensfrage wiederum nur bei 70%, dann wird hier nur eine Ausschöpfungsquote von 50% erreicht ( = 0.5). Beispiel: Ausfälle und Ausschöpfung für den ALLBUS 2000 Methodenbericht ALLBUS 2000 (S3451MET.PDF)
Imputation (Ersetzen fehlender Werte)
Imputation (Ersetzen fehlender Werte) Gliederung Nonresponse bias Fehlende Werte (missing values): Mechanismen Imputationsverfahren Überblick Mittelwert- / Regressions Hot-Deck-Imputation Row-Column-Imputation
MehrGewichtung in der Umfragepraxis. Von Tobias Hentze
Gewichtung in der Umfragepraxis Von Tobias Hentze Gliederung 1. Einführung 2. Gewichtungsarten 1. Designgewichtung 2. Non-Response-Gewichtung 3. Zellgewichtung 3. Fazit Gewichtung Definition: Ein Gewicht
MehrExperimentelle und quasiexperimentelle
Experimentelle und quasiexperimentelle Designs Experimentelle Designs Quasi- experimenttel Designs Ex- post- facto- Desingns Experimentelle Designs 1. Es werden mindestens zwei experimentelle Gruppen gebildet.
MehrGewichtungsverfahren und Kriterien der Gewichtung
Gewichtungsverfahren und Kriterien der Gewichtung Überblick 1. Gewichtung zum Ausgleich unterschiedlicher Auswahlwahrscheinlichkeiten prinzipielles Vorgehen a) disproportionial geschichtete Auswahl b)
MehrGewichtung und Validierung der Nettostichprobe (Welle 1 des Projekts Lebensziele und Lebensverläufe in Ostdeutschland )
Gewichtung und Validierung der Nettostichprobe (Welle 1 des Projekts Lebensziele und Lebensverläufe in Ostdeutschland ) Gewichtung Da es sich bei dieser Studie um eine Einwohnermeldeamtsstudie handelt,
MehrMissing Data. VL Forschungsmethoden
Missing Data VL Forschungsmethoden Missing Data VL Forschungsmethoden VL Forschungsmethoden Missing Data (0/27) Übersicht Missing Data: Typen Vor- und Nachteile : Ansatz Implementation VL Forschungsmethoden
MehrAuswahlverfahren. Verfahren, welche die prinzipiellen Regeln zur Konstruktion von Stichproben angeben
Auswahlverfahren Verfahren, welche die prinzipiellen Regeln zur Konstruktion von Stichproben angeben Definition der Grundgesamtheit Untersuchungseinheit: Objekt an dem Messungen vorgenommen werden Grundgesamtheit
MehrTEIL 5: AUSWAHLVERFAHREN
TEIL 5: AUSWAHLVERFAHREN Dozent: Dawid Bekalarczyk GLIEDERUNG Auswahlverfahren eine Umschreibung Grundbegriffe Graphische Darstellung: Grundgesamtheit und Stichprobe Vor- und Nachteile: Voll- vs. Teilerhebung
MehrMissing Data. Missing Data. VL Forschungsmethoden. VL Forschungsmethoden. Missing Data: Typen Strategien Fazit
Missing Data VL Forschungsmethoden Missing Data VL Forschungsmethoden VL Forschungsmethoden Missing Data (0/27) Übersicht 1 2 Vor- und Nachteile : Ansatz Implementation 3 VL Forschungsmethoden Missing
MehrUmgang mit fehlenden Werten in der psychologischen Forschung
Umgang mit fehlenden Werten in der psychologischen Forschung Oliver Lüdtke Max-Planck-Institut für Bildungsforschung Alexander Robitzsch Institut zur Qualitätsentwicklung im Bildungswesen Programm Montag
MehrFGW-Umfrage zur Glaubwürdigkeit verschiedener Medien und von Nachrichtensendungen verschiedener Fernsehsender
FGW-Umfrage zur Glaubwürdigkeit verschiedener und von Nachrichtensendungen verschiedener Fernsehsender Ergebnisse aktuelle FGW-Umfrage Juni 2017 Großes Vertrauen in öffentlich-rechtlichen Rundfunk und
MehrStatistische Matching-Verfahren
Statistische Matching-Verfahren Erste Statistik-Tage 2012 Bamberg Fürth 26./27. Juli 2012 in Bamberg Prof. Dr. Susanne Rässler Lehrstuhl für Statistik und Ökonometrie in den Sozial- und Wirtschaftswissenschaften
MehrWas sind Zusammenhangsmaße?
Was sind Zusammenhangsmaße? Zusammenhangsmaße beschreiben einen Zusammenhang zwischen zwei Variablen Beispiele für Zusammenhänge: Arbeiter wählen häufiger die SPD als andere Gruppen Hochgebildete vertreten
MehrZufallsstichproben. Gabriele Doblhammer: Empirische Sozialforschung Teil II, SS 2004 1/21
Zufallsstichproben Zufallsstichprobe Varianz der Grundgesamtheit Streuung des Mittelwertes Stichprobengröße Konfidenzintervall Ziehen einer einfachen Zufallsstichprobe Geschichtete Zufallsstichproben Klumpenstichprobe
MehrKlausurvorbereitung - Statistik
Aufgabe 1 Klausurvorbereitung - Statistik Studenten der Politikwissenschaft der Johannes Gutenberg-Universität wurden befragt, seit wie vielen Semestern sie eingeschrieben sind. Berechnen Sie für die folgenden
Mehr3.2 Stichprobenauswahl (Sampling)
3.2 Stichprobenauswahl (Sampling) Stichprobe = als Stichprobe bezeichnet man eine Teilmenge einer Grundgesamtheit, die unter bestimmten Gesichtspunkten ausgewählt wurde. Der Stichprobenentnahme vorgelagert
Mehr5. Schließende Statistik (Inferenzstatistik, konfirmatorische Verfahren)
5. Schließende Statistik (Inferenzstatistik, konfirmatorische Verfahren) 5.1. Einführung Schätzen unbekannter Parameter im Modell, z.b. Wahrscheinlichkeiten p i (Anteile in der Gesamtmenge), Erwartungswerte
MehrGrundlagen der empirischen Sozialforschung
Grundlagen der empirischen Sozialforschung Sitzung 5 - Auswahlverfahren Jan Finsel Lehrstuhl für empirische Sozialforschung Prof. Dr. Petra Stein 17. November 2008 1 / 24 Online-Materialien Die Materialien
MehrNONRESPONSE in der Umfragepraxis
NONRESPONSE in der Umfragepraxis Universität zu Köln Lehrstuhl für Empirische Sozial- und Wirtschaftsforschung Hauptseminar: Praxis der Umfrageforschung Dozenten: H. J. Andreß / H. Lohmann Referentin:
MehrHypothesentests mit SPSS
Beispiel für einen chi²-test Daten: afrikamie.sav Im Rahmen der Evaluation des Afrikamie-Festivals wurden persönliche Interviews durchgeführt. Hypothese: Es gibt einen Zusammenhang zwischen dem Geschlecht
MehrStatistische Tests (Signifikanztests)
Statistische Tests (Signifikanztests) [testing statistical hypothesis] Prüfen und Bewerten von Hypothesen (Annahmen, Vermutungen) über die Verteilungen von Merkmalen in einer Grundgesamtheit (Population)
MehrDie Analyse von unvollständigen Kontingenztabellen im MZ-Panel: Statistische Methodik
Die Analyse von unvollständigen Kontingenztabellen im MZ-Panel: Statistische Methodik Edin Basic Freie Universität Berlin 12.Oktober 2005 Überblick Überblick Y = Untersuchungsvariable - Missing, falls
MehrStichproben und statistische Fehler
Kapitel 0 Stichproben und statistische Fehler 0. Verfahren zur Auswahl von Stichproben Stichprobenauswahl als Bestandteil von Teilerhebungen: Aus dem Ergebnis der Untersuchung der Stichprobe soll dann
Mehr5. Seminar Statistik
Sandra Schlick Seite 1 5. Seminar 5. Seminar Statistik 30 Kurztest 4 45 Testen von Hypothesen inkl. Übungen 45 Test- und Prüfverfahren inkl. Übungen 45 Repetitorium und Prüfungsvorbereitung 15 Kursevaluation
MehrProf. Dr. Christoph Kleinn Institut für Waldinventur und Waldwachstum Arbeitsbereich Waldinventur und Fernerkundung
Systematische Stichprobe Rel. große Gruppe von Stichprobenverfahren. Allgemeines Merkmal: es existiert ein festes, systematisches Muster bei der Auswahl. Wie passt das zur allgemeinen Forderung nach Randomisierung
MehrMathematische und statistische Methoden II
Methodenlehre e e Prof. Dr. G. Meinhardt 6. Stock, Wallstr. 3 (Raum 06-06) Sprechstunde jederzeit nach Vereinbarung und nach der Vorlesung. Mathematische und statistische Methoden II Dr. Malte Persike
MehrWarum Stichproben? Vollerhebungen sind teuer Nehmen (zu)viel Zeit in Anspruch Sind evtl. destruktiv
Warum Stichproben? Vollerhebungen sind teuer Nehmen (zu)viel Zeit in Anspruch Sind evtl. destruktiv Voraussetzung für die Anwendung von Stichproben: Stichproben müssen repräsentativ sein, d.h. ein verkleinertes
MehrStichwortverzeichnis. Symbole
Stichwortverzeichnis Symbole 50ste Perzentil 119 A Absichern, Ergebnisse 203 Abzählbar unendliche Zufallsvariable 146 Alternativhypothese 237 238 formulieren 248 Anekdote 340 Annäherung 171, 191 Antwortquote
MehrStatistik Testverfahren. Heinz Holling Günther Gediga. Bachelorstudium Psychologie. hogrefe.de
rbu leh ch s plu psych Heinz Holling Günther Gediga hogrefe.de Bachelorstudium Psychologie Statistik Testverfahren 18 Kapitel 2 i.i.d.-annahme dem unabhängig. Es gilt also die i.i.d.-annahme (i.i.d = independent
MehrParametrische vs. Non-Parametrische Testverfahren
Parametrische vs. Non-Parametrische Testverfahren Parametrische Verfahren haben die Besonderheit, dass sie auf Annahmen zur Verteilung der Messwerte in der Population beruhen: die Messwerte sollten einer
MehrDeskription, Statistische Testverfahren und Regression. Seminar: Planung und Auswertung klinischer und experimenteller Studien
Deskription, Statistische Testverfahren und Regression Seminar: Planung und Auswertung klinischer und experimenteller Studien Deskriptive Statistik Deskriptive Statistik: beschreibende Statistik, empirische
MehrPraxis der Umfrageforschung
Praxis der Umfrageforschung Gliederung Vorbesprechung Thema und Gliederung der Veranstaltung Teilnahmevoraussetzungen Klausur und Hausarbeiten Organisatorisches Überblick: Problemstellungen der Umfrageforschung
MehrErmitteln Sie auf 2 Dezimalstellen genau die folgenden Kenngrößen der bivariaten Verteilung der Merkmale Weite und Zeit:
1. Welche der folgenden Kenngrößen, Statistiken bzw. Grafiken sind zur Beschreibung der Werteverteilung des Merkmals Konfessionszugehörigkeit sinnvoll einsetzbar? A. Der Modalwert. B. Der Median. C. Das
MehrKlassifikation von Signifikanztests
Klassifikation von Signifikanztests nach Verteilungsannahmen: verteilungsabhängige = parametrische Tests verteilungsunabhängige = nichtparametrische Tests Bei parametrischen Tests werden im Modell Voraussetzungen
MehrStatistik I. Sommersemester 2009
I Sommersemester 2009 I Wiederholung/Einführung χ 2 =?!? I Wiederholung/Einführung χ 2 =?!? Nächste Woche: Maße für ordinale, nominal/intervallskalierte und intervallskalierte Daten I Zum Nachlesen Agresti/Finlay:
MehrStatistik I. Sommersemester 2009
I Sommersemester 2009 I χ 2 =?!? Nächste Woche: Maße für ordinale, nominal/intervallskalierte und intervallskalierte Daten I Zum Nachlesen Agresti/Finlay: Kapitel 8.1-8.4 Gehring/Weins: Kapitel 7.1 Schumann:
MehrJan A. Fuhse. Ethnizität, Akkulturation und persönliche Netzwerke von italienischen Migranten, Leverkusen, Barbara Budrich-Verlag 2008.
Jan A. Fuhse Ethnizität, Akkulturation und persönliche Netzwerke von italienischen Migranten, Leverkusen, Barbara Budrich-Verlag 2008. Dissertation an der Universität Stuttgart Anhang B: Hintergrund der
MehrZufriedenheit Rathauspolitik Zufriedenheit OB Dieter Reiter
Zufriedenheit Rathauspolitik Zufriedenheit OB Dieter Reiter Bevölkerungsrepräsentative Mehrthemenbefragung - April / Mai 2016 mifm München Institut für Marktforschung Helmut Aumüller 85551 Kirchheim Latschenweg
MehrKapitel 17. Unabhängigkeit und Homogenität Unabhängigkeit
Kapitel 17 Unabhängigkeit und Homogenität 17.1 Unabhängigkeit Im Rahmen der Wahrscheinlichkeitsrechnung ist das Konzept der Unabhängigkeit von zentraler Bedeutung. Die Ereignisse A und B sind genau dann
MehrAufgaben zu Kapitel 9
Aufgaben zu Kapitel 9 Aufgabe 1 Für diese Aufgabe benötigen Sie den Datensatz Nominaldaten.sav. a) Sie arbeiten für eine Marktforschungsfirma und sollen überprüfen, ob die in diesem Datensatz untersuchte
MehrUmfrage zum Thema Beteiligung der DFL an Polizeikosten bei Risikospielen Eine Studie im Auftrag des WDR / Sport inside
Umfrage zum Thema Beteiligung der DFL an Polizeikosten bei Risikospielen Eine Studie im Auftrag des WDR / Sport inside Umfrage zum Thema Beteiligung der DFL an Polizeikosten bei Risikospielen Studieninformation
MehrTeil: lineare Regression
Teil: lineare Regression 1 Einführung 2 Prüfung der Regressionsfunktion 3 Die Modellannahmen zur Durchführung einer linearen Regression 4 Dummyvariablen 1 Einführung o Eine statistische Methode um Zusammenhänge
Mehr1. Einführung und statistische Grundbegriffe. Grundsätzlich unterscheidet man zwei Bedeutungen des Begriffs Statistik:
. Einführung und statistische Grundbegriffe Beispiele aus dem täglichen Leben Grundsätzlich unterscheidet man zwei Bedeutungen des Begriffs Statistik: Quantitative Information Graphische oder tabellarische
MehrUmgang mit und Ersetzen von fehlenden Werten bei multivariaten Analysen
Umgang mit und Ersetzen von fehlenden Werten bei multivariaten Analysen Warum überhaupt Gedanken machen? Was fehlt, ist doch weg, oder? Allgegenwärtiges Problem in psychologischer Forschung Bringt Fehlerquellen
MehrDatenstrukturen. Querschnitt. Grösche: Empirische Wirtschaftsforschung
Datenstrukturen Datenstrukturen Querschnitt Panel Zeitreihe 2 Querschnittsdaten Stichprobe von enthält mehreren Individuen (Personen, Haushalte, Firmen, Länder, etc.) einmalig beobachtet zu einem Zeitpunkt
MehrBundesweite Volksabstimmung
Bundesweite Volksabstimmung Eine repräsentative Umfrage von infratest dimap im Auftrag von OMNIBUS für Direkte Demokratie und Mehr Demokratie / April 2017 Bundesweite Volksabstimmung Untersuchungsanlage
MehrAufgaben zu Kapitel 9
Aufgaben zu Kapitel 9 Aufgabe 1 Für diese Aufgabe benötigen Sie den Datensatz Nominaldaten.sav. a) Sie arbeiten für eine Marktforschungsfirma und sollen überprüfen, ob die in diesem Datensatz untersuchte
MehrAuswahlverfahren. Schnell, R. Hill, P. B. Esser, E. 1999, Methoden der empirischen Sozialforschung. München: Oldenbourg. Seiten ;
Auswahlverfahren Objektbereich & Grundgesamtheit Vollerhebung Volkszählung Teilerhebung angestrebte Grundgesamtheit Auswahlgesamtheit Inferenzpopulation Willkürliche Auswahl Bewußte Auswahl Schnell, R.
MehrBivariater Zusammenhang in der Vierfeldertafel PEΣO
Bivariater Zusammenhang in der Vierfeldertafel PEΣO 12. Oktober 2001 Zusammenhang zweier Variablen und bivariate Häufigkeitsverteilung Die Bivariate Häufigkeitsverteilung gibt Auskunft darüber, wie zwei
MehrWichtigste Probleme in der Stadt München Bevölkerungsrepräsentative Mehrthemenbefragung - April / Mai 2016
Wichtigste Probleme in der Stadt München Bevölkerungsrepräsentative Mehrthemenbefragung - April / Mai 2016 mifm München Institut für Marktforschung Helmut Aumüller 85551 Kirchheim Latschenweg 11 Tel. +49
MehrStichproben und Grundgesamtheit
Zusammenfassung und Beispiele Ziel einer Stichprobe Mit der Stichprobe soll ein exemplarischer Ausschnitt aus der Grundgesamtheit (GG) befragt werden, die Ergebnisse der Datenanalyse sollen für die GG
MehrSozialwissenschaftlerInnen II
Statistik für SozialwissenschaftlerInnen II Henning Best best@wiso.uni-koeln.de Universität zu Köln Forschungsinstitut für Soziologie Statistik für SozialwissenschaftlerInnen II p.1 Testen von Hypothesen
Mehr2. Beschreibende ( deskriptive ) Statistik 2.1 Grundbegriffe 2.2 Stichproben 2.3 Fehler, Ausreißer und fehlende Werte 2.4 Merkmale 2.
2.1 Grundbegriffe 2.3 Fehler, Ausreißer und fehlende Werte 2.4 Merkmale 2.5 Definition: Urliste, relative und absolute Häufigkeit 2.6 Tabellarische und graphische Darstellung: Häufigkeit 2.7 Klasseneinteilung
MehrZur Stichprobenziehung innerhalb der PISA-Erweiterung:
Zur Stichprobenziehung innerhalb der PISA-Erweiterung: Die Stichprobenziehung innerhalb der PISA-Erweiterung folgt den Prinzipien einer disproportional geschichteten Stichprobe, bei der zu Ermittlung von
MehrStatistik und Wahrscheinlichkeitsrechnung
Statistik und Wahrscheinlichkeitsrechnung 3. Vorlesung Dr. Jochen Köhler 1 Inhalte der heutigen Vorlesung Ziel: Daten Modellbildung Probabilistisches Modell Wahrscheinlichkeit von Ereignissen Im ersten
MehrTelefonische Omnibus-Befragung zur persönlichen Vorsorge
Telefonische Omnibus-Befragung zur persönlichen Vorsorge Quantitative Befragung im Auftrag von Pro Senectute Schweiz gfs-zürich, Markt- & Sozialforschung Dr. Andrea Umbricht, Projektleiterin Zürich, August
MehrZufriedenheit Rathauspolitik Zufriedenheit OB Dieter Reiter
Zufriedenheit Rathauspolitik Zufriedenheit OB Dieter Reiter Bevölkerungsrepräsentative Mehrthemenbefragung - April / Mai 2015 mifm München Institut für Marktforschung Helmut Aumüller 85551 Kirchheim Latschenweg
MehrInhaltsverzeichnis: Aufgaben zur Vorlesung Statistik Seite 1 von 10 Prof. Dr. Karin Melzer, Prof. Dr. Gabriele Gühring, Fakultät Grundlagen
Inhaltsverzeichnis: 1. Aufgabenlösungen... Lösung zu Aufgabe 1:... Lösung zu Aufgabe... Lösung zu Aufgabe 3... Lösung zu Aufgabe 4... Lösung zu Aufgabe 5... 3 Lösung zu Aufgabe... 3 Lösung zu Aufgabe 7...
MehrTEIL 5: AUSWAHLVERFAHREN
TEIL 5: AUSWAHLVERFAHREN 1 Auswahlverfahren eine Umschreibung Beschäftigen sich mit der Problematik, wie Objekte (Personen, Gruppen, Organisationen, Staaten etc.) für eine Untersuchung (Befragung, Experiment
MehrPROC MEANS. zum Berechnen statistischer Maßzahlen (für quantitative Merkmale)
PROC MEAS zum Berechnen statistischer Maßzahlen (für quantitative Merkmale) Allgemeine Form: PROC MEAS DATA=name Optionen ; VAR variablenliste ; CLASS vergleichsvariable ; Beispiel und Beschreibung der
MehrSchätzverfahren, Annahmen und ihre Verletzungen, Standardfehler. Oder: was schiefgehen kann, geht schief
Schätzverfahren, Annahmen und ihre Verletzungen, Standardfehler. Oder: was schiefgehen kann, geht schief Statistik II Literatur Kategoriale Unabhängige, Interaktion, nicht-lineare Effekte : Schätzung Statistik
MehrKapitel 10. Stichproben
Kapitel 10 n In der deskriptiven Statistik werden die Charakteristika eines Datensatzes durch Grafiken verdeutlicht und durch Maßzahlen zusammengefasst. In der Regel ist man aber nicht nur an der Verteilung
MehrKapitel 3 Datengewinnung und Auswahlverfahren 3.1. Erhebungsarten und Studiendesigns
Kapitel 3 Datengewinnung und Auswahlverfahren 3.1. Erhebungsarten und Studiendesigns Daten Erhebungsdesign: Werte eines /mehrere Merkmale in einer Grundgesamtheit von Merkmalsträgern Planung der Datengewinnung
MehrVorlesung 3: Schätzverfahren
Vorlesung 3: Schätzverfahren 1. Beispiel: General Social Survey 1978 2. Auswahl einer Zufallsstichprobe und Illustration des Stichprobenfehlers 3. Stichprobenverteilung eines Regressionskoeffizienten 4.
Mehrkein Abschluss, Hauptschulabschluss 45 bis 64 Jahre 65 Jahre und älter 25 bis 44 Jahre
Ergebnisse Stichprobengröße: 2016 Feldzeit: 11.08.2017-15.08.2017 Geschlecht Alter Bildung Wahlverhalten Bundestagswahl 2013 Gesamt männlich weiblich 18 bis 24 Jahre 25 bis 44 Jahre 45 bis 64 Jahre 65
Mehrkein Abschluss, Hauptschulabschluss 45 bis 64 Jahre 65 Jahre und älter 25 bis 44 Jahre
Ergebnisse Stichprobengröße: 2005 Feldzeit: 18.08.2017-22.08.2017 Geschlecht Alter Bildung Wahlverhalten Bundestagswahl 2013 Gesamt männlich weiblich 18 bis 24 Jahre 25 bis 44 Jahre 45 bis 64 Jahre 65
Mehrkein Abschluss, Hauptschulabschluss 45 bis 64 Jahre 65 Jahre und älter 25 bis 44 Jahre
Ergebnisse Stichprobengröße: 2000 Feldzeit: 08.09.2017-12.09.2017 Geschlecht Alter Bildung Wahlverhalten Bundestagswahl 2013 Gesamt männlich weiblich 18 bis 24 Jahre 25 bis 44 Jahre 45 bis 64 Jahre 65
Mehr4. Schließende Statistik (Inferenzstatistik, konfirmatorische Verfahren)
4. Schließende Statistik (Inferenzstatistik, konfirmatorische Verfahren) 4.1. Einführung Schätzen unbekannter Parameter im Modell, z.b. Wahrscheinlichkeiten p i (Anteile in der Gesamtmenge), Erwartungswerte
MehrTrim Size: 176mm x 240mm Lipow ftoc.tex V1 - March 9, :34 P.M. Page 11. Über die Übersetzerin 9. Einleitung 19
Trim Size: 176mm x 240mm Lipow ftoc.tex V1 - March 9, 2016 6:34 P.M. Page 11 Inhaltsverzeichnis Über die Übersetzerin 9 Einleitung 19 Was Sie hier finden werden 19 Wie dieses Arbeitsbuch aufgebaut ist
MehrWahlumfrage
Wahlumfrage 27.07.2017 Stichprobengröße: 2000 Feldzeit: 21.07.2017-25.07.2017 Geschlecht Alter Bildung Wahlverhalten Bundestagswahl 2013 Gesamt männlich weiblich 18 bis 24 Jahre 25 bis 44 Jahre 45 bis
MehrMethodenlehre. Vorlesung 12. Prof. Dr. Björn Rasch, Cognitive Biopsychology and Methods University of Fribourg
Methodenlehre Vorlesung 12 Prof. Dr., Cognitive Biopsychology and Methods University of Fribourg 1 Methodenlehre II Woche Datum Thema 1 FQ Einführung, Verteilung der Termine 1 18.2.15 Psychologie als Wissenschaft
Mehr1 Univariate Statistiken
1 Univariate Statistiken Im ersten Kapitel berechnen wir zunächst Kenngrößen einer einzelnen Stichprobe bzw. so genannte empirische Kenngrößen, wie beispielsweise den Mittelwert. Diese können, unter gewissen
MehrLage- und Streuungsparameter
Lage- und Streuungsparameter Beziehen sich auf die Verteilung der Ausprägungen von intervall- und ratio-skalierten Variablen Versuchen, diese Verteilung durch Zahlen zu beschreiben, statt sie graphisch
MehrKapitel 41 Interaktive Diagramme
Kapitel 41 Interaktive Diagramme Bei den Interaktiven Grafiken handelt es sich um eine Gruppen von Diagrammen, die bei SPSS erst seit der Version 8.0 zur Verfügung stehen. Vom grundlegenden Diagrammtyp
MehrHypothesentests mit SPSS
Beispiel für eine zweifaktorielle Varianzanalyse mit Messwiederholung auf einem Faktor (univariate Lösung) Daten: POKIII_AG4_V06.SAV Hypothese: Die physische Attraktivität der Bildperson und das Geschlecht
MehrMissing Data. Regressionsmodelle für Politikwissenschaftler
Regressionsmodelle für Politikwissenschaftler TSCS Regression in Stata Struktur definieren:. xtset id year panel variable: id (strongly balanced) time variable: year, 1996 to 2004, but with gaps delta:
Mehrerwartete Häufigkeit n=80 davon 50% Frauen fe=40 davon 50% Männer fe=40 Abweichung der beobachteten von den erwarteten Häufigkeiten:
Verfahren zur Analyse von Nominaldaten Chi-Quadrat-Tests Vier-Felder Kontingenztafel Mehrfach gestufte Merkmale Cramers V, Kontingenzkoeffizient, Phi-Koeffizient Muster aller Chi-Quadrat-Verfahren eine
MehrDer χ 2 -Test (Chiquadrat-Test)
Der χ 2 -Test (Chiquadrat-Test) Der Grundgedanke Mit den χ 2 -Methoden kann überprüft werden, ob sich die empirischen (im Experiment beobachteten) Häufigkeiten einer nominalen Variable systematisch von
MehrAuswahlverfahren. Zufallsauswahl Bewusste Auswahl Willkürliche Auswahl. Dipl.-Päd. Ivonne Bemerburg
Auswahlverfahren Zufallsauswahl Bewusste Auswahl Willkürliche Auswahl Blockseminar: Methoden quantitativer Grundgesamtheit und Stichprobe Die Festlegung einer Menge von Objekten, für die die Aussagen der
MehrNotgepäck Genauigkeit
Notgepäck Genauigkeit Beat Hulliger Dienst Statistische Methoden, Bundesamt für Statistik 20.4.2006 1 Was ist Genauigkeit genau? Um zu beschreiben, was Genauigkeit in der Statistik ist, müssen wir untersuchen,
MehrWeitere Korrelationskoeffizienten (1)
Weitere Korrelationskoeffizienten () Welche Korrelationskoeffizienten man für die Analyse von Zusammenhängen benutzen kann, hängt entscheidend von dem Skalenniveau der beteiligen Variablen und der Fragestellung
MehrKonfidenzintervall für den Anteilswert θ. Konfidenzintervalle. Jost Reinecke. Universität Bielefeld. 13. Juni 2005
Universität Bielefeld 13. Juni 2005 Einführung Einführung Wie kann die Kenntnis der Wahrscheinlichkeitsverteilung der Parameter einer Stichprobe dazu verhelfen auf die wahren Werte der Grundgesamtheit
MehrStandardisierte Vorgehensweisen und Regeln zur Gewährleistung von: Eindeutigkeit Schlussfolgerungen aus empirischen Befunden sind nur dann zwingend
Standardisierte Vorgehensweisen und Regeln zur Gewährleistung von: Eindeutigkeit Schlussfolgerungen aus empirischen Befunden sind nur dann zwingend oder eindeutig, wenn keine alternativen Interpretationsmöglichkeiten
MehrHäufigkeitsauszählungen, zentrale statistische Kennwerte und Mittelwertvergleiche
Lehrveranstaltung Empirische Forschung und Politikberatung der Universität Bonn, WS 2007/2008 Häufigkeitsauszählungen, zentrale statistische Kennwerte und Mittelwertvergleiche 30. November 2007 Michael
MehrDer Tagesspiegel. Ihr starker Werbepartner in Berlin
Der Tagesspiegel Ihr starker Werbepartner in Berlin Die Berliner Abonnement-Zeitungen Aktuelle Auflagen Die Auflagen am Werktag Am Werktag verkauft der Tagesspiegel* fast 130.000 Exemplare. Werktage im
MehrStatistische Methoden in den Umweltwissenschaften
Statistische Methoden in den Umweltwissenschaften t-test Varianzanalyse (ANOVA) Übersicht Vergleich von Mittelwerten 2 Gruppen: t-test einfaktorielle ANOVA > 2 Gruppen: einfaktorielle ANOVA Seeigel und
MehrStatistische Methoden in den Umweltwissenschaften
Statistische Methoden in den Umweltwissenschaften Korrelationsanalysen Kreuztabellen und χ²-test Themen Korrelation oder Lineare Regression? Korrelationsanalysen - Pearson, Spearman-Rang, Kendall s Tau
MehrDer Tagesspiegel. Ihr starker Werbepartner in Berlin
Der Tagesspiegel Ihr starker Werbepartner in Berlin Die Berliner Tageszeitungen Aktuelle Auflagen Die Auflagen am Werktag Am Werktag verkauft der Tagesspiegel* fast 130.000 Exemplare. Werktage im Quartalsdurchschnitt
MehrVorlesung: Multivariate Statistik für Psychologen
Vorlesung: Multivariate Statistik für Psychologen 10. Vorlesung: 1.0.2003 Agenda 3. Multivariate Varianzanalyse i. Einführung in die multivariate Variananalyse Grundidee und Ziele der MANOVA Beispiele
MehrSchätzverfahren, Annahmen und ihre Verletzungen, Standardfehler. Oder: was schiefgehen kann, geht schief. Statistik II
Schätzverfahren, Annahmen und ihre Verletzungen, Standardfehler. Oder: was schiefgehen kann, geht schief Statistik II Wiederholung Literatur Kategoriale Unabhängige, Interaktion, nicht-lineare Effekte
MehrHypothesenprüfung. Darüber hinaus existieren zahlreiche andere Testverfahren, die alle auf der gleichen Logik basieren
Hypothesenprüfung Teil der Inferenzstatistik Befaßt sich mit der Frage, wie Hypothesen über eine (in der Regel unbekannte) Grundgesamtheit an einer Stichprobe überprüft werden können Behandelt werden drei
MehrTesttheorie und Gütekriterien von Messinstrumenten. Objektivität Reliabilität Validität
Testtheorie und Gütekriterien von Messinstrumenten Objektivität Reliabilität Validität Genauigkeit von Messungen Jede Messung zielt darauf ab, möglichst exakte und fehlerfreie Messwerte zu erheben. Dennoch
MehrSchließende Statistik
Schließende Statistik [statistical inference] Sollen auf der Basis von empirischen Untersuchungen (Daten) Erkenntnisse gewonnen und Entscheidungen gefällt werden, sind die Methoden der Statistik einzusetzen.
MehrEinführung in die Statistik für Politikwissenschaftler Sommersemester 2011
Einführung in die Statistik für Politikwissenschaftler Sommersemester 2011 Es können von den Antworten alle, mehrere oder keine Antwort(en) richtig sein. Nur bei einer korrekten Antwort (ohne Auslassungen
MehrWillkommen zur Vorlesung Statistik (Master)
Willkommen zur Vorlesung Statistik (Master) Thema dieser Vorlesung: Verteilung diskreter Zufallsvariablen Prof. Dr. Wolfgang Ludwig-Mayerhofer Universität Siegen Philosophische Fakultät, Seminar für Sozialwissenschaften
MehrStatistik II: Signifikanztests /1
Medien Institut : Signifikanztests /1 Dr. Andreas Vlašić Medien Institut (0621) 52 67 44 vlasic@medien-institut.de Gliederung 1. Noch einmal: Grundlagen des Signifikanztests 2. Der chi 2 -Test 3. Der t-test
MehrKOMPLEXE STICHPROBEN MERKMALE KONSEQUENZEN KORREKTE ANALYSE
KOMPLEXE STICHPROBEN MERKMALE KONSEQUENZEN KORREKTE ANALYSE Johann Bacher Linz, 2016 ÜBERSICHT 1. Merkmale und Beispiele aus der Sozialforschung 2. Designeffekt und effektive Stichprobengröße 3. Konsequenzen
MehrForschungsstatistik II
Prof. Dr. G. Meinhardt 6. Stock, Taubertsberg R. 06-06 (Persike) R. 06-3 (Meinhardt) Sprechstunde jederzeit nach Vereinbarung Forschungsstatistik II Dr. Malte Persike persike@uni-mainz.de http://psymet03.sowi.uni-mainz.de/
MehrBerufliche Orientierung und Berufswahlverhalten nach Abschluss allgemeinbildender Schulen und beruflicher Vollzeitschulen
Berufliche Orientierung und Berufswahlverhalten nach Abschluss allgemeinbildender Schulen und beruflicher Vollzeitschulen Schuljahr 2011/2012 Feldbericht 14. Dezember 2012 q2570/27539 Hr/ Ma Max-Beer-Str.
Mehr