5.3 Konzeptspezifikation, Operationalisierung, Messung

Ähnliche Dokumente
0 Einführung: Was ist Statistik

Dr. habil. Rüdiger Jacob Methoden und Techniken der empirischen Sozialforschung Vorlesung mit Diskussion

Partial Credit Model und Tutz Model

Prof. Dr. Carolin Strobl

Umgang mit und Ersetzen von fehlenden Werten bei multivariaten Analysen

Empirische Sozialforschung

Prinzipien der Fragebogenkonstruktion. Allgemeine Bestandteile. Richtlinien zur Formulierung. Die 10 Gebote der Frageformulierung (II)

Grundlagen der Datenanalyse

Dr. Heidemarie Keller

Einführung in die quantitative und qualitative Sozialforschung

Fragebogenkonstruktion

Kategoriale abhängige Variablen: Logit- und Probit -Modelle. Statistik II

a) Zeichnen Sie in das nebenstehende Streudiagramm mit Lineal eine Regressionsgerade ein, die Sie für passend halten.

Messen im psychologischen Kontext II: Reliabilitätsüberprüfung und explorative Faktorenanalyse

Multiple Regression. Ziel: Vorhersage der Werte einer Variable (Kriterium) bei Kenntnis der Werte von zwei oder mehr anderen Variablen (Prädiktoren)

1,11 1,12 1,13 1,14 1,15 1,16 1,17 1,17 1,17 1,18

Übung: Praktische Datenerhebung

ε heteroskedastisch BINARY CHOICE MODELS Beispiele: Wahlentscheidung Kauf langlebiger Konsumgüter Arbeitslosigkeit Schätzung mit OLS?

Behandlung fehlender Werte

Forschungsmethoden in der Sozialen Arbeit

5. MESSUNG & DATENERHEBUNG IN DEN SOWI

Analyse von Tabellen und kategorialen Daten

Kategoriale abhängige Variablen:

Quantitative empirische Sozialforschung

2. Statistische Methoden in der Diagnostik. Elemente des Studiendesigns

Multivariate Statistik

Grundlagen der empirischen Sozialforschung

Skript zur Übung: Grundlagen der empirischen Sozialforschung - Datenanalyse

Deskriptive Statistik

Sozialwissenschaftliche Methoden I

3 Messmethoden und Messtechniken

Messen im medizinischen Kontext II: Expositionsmessung

Inhaltsverzeichnis. Vorwort zur 3. Auflage 11. Kapitel 1 Einführung 13. Kapitel 2 Testtheoretische Grundlagen 29

Grundlagen empirische Sozialforschung Befragung und Fragebogen im Unternehmen. Marco Skulschus Marcus Wiederstein

Prof. Dr. Gabriele Helga Franke TESTTHEORIE UND TESTKONSTRUKTION

Multinomiale logistische Regression

Datenanalyse mit Excel. Wintersemester 2013/14

Gütekriterien für evaluative Messinstrumente in der Rehabilitation

Weitere Fragestellungen im Zusammenhang mit einer linearen Einfachregression

Modul G.1 WS 07/08: Statistik Die Korrelation ist ein standardisiertes Maß für den linearen Zusammenhangzwischen zwei Variablen.

Willkommen zur Vorlesung Statistik (Master)

1. GEGENSTAND UND GRUNDBEGRIFFE DER STATISTIK

6. Bayes-Klassifikation. (Schukat-Talamazzini 2002)

Teil II: Einführung in die Statistik

Zufriedenheitsforschung

Auswertung mit dem Statistikprogramm SPSS:

Hypothesenentwicklung und Fragebogengestaltung

Bedeutung des Rasch-Modells für die Entwicklung psychologischer Tests

Messsystemanalyse (MSA)

Grundbegriffe (1) Grundbegriffe (2)

Fehlende Werte in der (Regressions-) Analyse von Datensätzen: zwei SAS-Makros

Formen sozialwissenschaftlicher standardisierter Befragungsverfahren (Bosnjak 2002)

Kapitel 4: Binäre Regression

Faktorenanalyse. 1. Grundlegende Verfahren. Bacher, SoSe2007

Herzlich Willkommen zur Vorlesung Statistik

Zufallsstichproben. Gabriele Doblhammer: Empirische Sozialforschung Teil II, SS /21

5.1. Die Itemcharakteristik als zentrales Konzept probabilistischer Testmodelle

Lernen von Entscheidungsbäumen. Volker Tresp Summer 2014

Grundlagen der Inferenzstatistik: Was Ihnen nicht erspart bleibt!

erm: ein Open Source Paket für IRT Modelle

Textmining Klassifikation von Texten Teil 1: Naive Bayes

Profilierung von Einrichtungen

Glück ist wie ein Schmetterling?

Einführung in die Geostatistik (7) Fred Hattermann (Vorlesung), Michael Roers (Übung),

- Eine typische Ausfallrate, wie sie bei vielen technischen Anwendungen zu sehen ist hat die Form einer Badewanne, deshalb nennt man diese Kurve auch

XIV. fragebogen. Wirtschaftsstatistik Datenproduktion und -analyse in der amtlichen Statistik. Statistisches Bundesamt

Elektrische Einheiten und ihre Darstellung

Korrelation (II) Korrelation und Kausalität


Intrinsisch motivierte Mitarbeiter als Erfolgsfaktor für das Ideenmanagement: Eine empirische Untersuchung

A. Mystery Shopping - Kin Instrument zur Evaluation der Dienstleistungsqualität

Messgeräte: Mess-System-Analyse und Messmittelfähigkeit

Analyse alt- und mittelpaläolithischer Steinartefaktinventare mittels Parallelkoordinatenplots

Einführung in die statistische Datenanalyse I

Universität Ulm. Fakultät für Mathematik und Wirtschaftswissenschaften. ulm university Universität I

DOE am Beispiel Laserpointer

IRT-Skalierung. mit ConQuest. Workshop für das Nachwuchsnetzwerk Deutschdidaktik. Dipl.-Psych. Nina Jude. Hamburg, 23.

Analyse bivariater Kontingenztafeln

Thema: Praxis der Personaldiagnostik in der privaten Krankenversicherungsbranche

Grundlagen der Inferenzstatistik

E. Farin-Glattacker. Lebensqualität, Patientenzufriedenheit und andere patient reported outcomes : Der Weg zum richtigen Instrument

Messung von Veränderungen. Dr. Julia Kneer Universität des Saarlandes

Veränderungsmessung mit dem Linear Logistic Test Model

Die Analyse sozialen Wandels auf Basis wiederholter Querschnittserhebungen

Messen Bedarfsgrade Pflegebedürftigkeit besser als Pflegestufen? 3. DGP-Hochschultag. Katholische Hochschule Mainz

Einführung in die Methoden der empirischen Sozialforschung Interviews und Inhaltsanalyse

Stichprobenauslegung. für stetige und binäre Datentypen

Statistik im Bachelor-Studium der BWL und VWL

Eine computergestützte Einführung mit

Portfolio-Optimierung und Capital Asset Pricing

Oliver Kuß*; Dorothee Twardella**; Maria Blettner***; Thomas L. Diepgen**

Grundlagen quantitativer Sozialforschung Interferenzstatistische Datenanalyse in MS Excel

Log-lineare Analyse I

Statistical Matching

Studiendesign/ Evaluierungsdesign

Binäre abhängige Variablen

Algorithmische Modelle als neues Paradigma

Ein SAS-Modul zur Konstruktion psychologischer Tests nach dem Rasch-Modell

Transkript:

5.3.1 Begriffe (Konzepte), Begriffsintension und -extension Zwei Begriffsarten: *logische(und,wenn,...) *empirische(außerlogische): Intension (Inhalt): Menge der Merkmale, die für Vorliegen des Begriffs gegeben sein müssen. Extension (Umfang): Menge aller Objekte, die die Intension erfüllen (kann leer sein). Exkurs: Fuzzy Sets 5EmpirischeSozial-undWirtschaftsforschung 43

Dispositionsbegriff, Operationalisierung Solche Begriffe bezeichnen Eigenschaften, die sich nur unter bestimmten Bedingungen ermitteln lassen. So zeigt Zucker seine Disposition löslich nur, wenn man ihn ins Wasser gibt. Der Dispositionsbegriff Löslichkeit läßt sich also nur durch die zusätzliche Angabe bestimmter Bedingungen bzw. Situationen operationalisieren. Die überwiegende Mehrzahl der sozialwissenschaftlich relevanten theoretischen Begriffe dürfte zur Klasse der Dispositionsmerkmale gehören. [...] Hier müssen mit Hilfe von Fragen oder andere Methoden (T.A.) solche Situationen, in denen sich dispositionale Eigenschaften zeigen, generiert werden. (Schnell, Hill, Esser: 67) 5EmpirischeSozial-undWirtschaftsforschung 44

Typische Dispositionsmerkmale in den Sozialwissenschaften sind: Politische Einstellung Schicht Religiösität Rechtsextremismus 5EmpirischeSozial-undWirtschaftsforschung 45

Dispositionsbegriff latente Variablen Wenn eine Variable nicht immer direkt beobachtbar ist, gilt der Dispositionsbegriff. In der Psychologie wird bei nicht beobachtbaren Größen von latenten Eigenschaften (latent trait im metrischen Fall z.b. Intelligenz oder latent class im kategorialen Fall z.b. schizophren) gesprochen. Da man im Regelfall während der Erhebung keine Situation herstellen kann, in der sich die Größe direkt zeigt, werden als Messsituation oft Fragen gestellt. Fragen zu Indikator(en) Fragebatterie, Itembatterie Datenerhebung nach jeweiligem Messverfahren 5EmpirischeSozial-undWirtschaftsforschung 46

Korrespondenzproblem und Basissätze So ist die empirische Basis der objektiven Wissenschaft nichts Absolutes ; die Wissenschaft baut nicht auf Felsengrund. Es ist eher Sumpfland... Popper(1976;p.75) zitiert nach Schnell, Hill, Esser (2005; p. 82) Operationalisierung Die Festlegung von Korrespondenzregeln, mit deren Hilfe Konstrukte und Indikatoren in Beziehung gesetzt werden, wird insbesondere in der Sozialwissenschaft als Operationalisierung bezeichnet. Vor allem in der amtlichen Statistik wird die Frage der Passung von Konstrukten und Indikatoren als Adäquation problematisiert. Typischerweise operationalistische Indikatorenbildung *DirekteDefinitiondesBegriffsüber Messvorschrift (operationale Definition von Begriffen) *T.A:PhysikalischeEinheiten:EinAmpereistdieStärke eines zeitlich unveränderlichen elektrischen Stromes, der, durch zwei im Vakuum parallel im Abstand 1 Meter voneinander angeordnete, geradlinige, unendlich lange Leiter von vernachlässigbar 5EmpirischeSozial-undWirtschaftsforschung 47

kleinem, kreisförmigem Querschnitt fließend, zwischen diesen Leitern pro 1 Meter Leiterlänge die Kraft 2 10 7 Newton hervorrufen würde. *Z.B.Intelligenzistdas,waseinIntelligenztestmisst *Forschungsleistung:MitdenImpact-FactorderZeitschrift gewichtete Anzahl von Publikationen * Problem: Theorienvergleich nur möglich, wenn gleiche Operationalisierung verwendet wurde. 5EmpirischeSozial-undWirtschaftsforschung 48

5.3.2 Messen in der empirischen Sozialforschung Skalenniveaus und zulässige Verfahren werden hier natürlich nicht mehr besprochen. 5EmpirischeSozial-undWirtschaftsforschung 49

Messung Eine Messung im Sinne der Meßtheorie liegt vor, wenn (=def.) ein Isomorphismus oder ein Homomorphismus zwischen einem empirischen und einem numeri- schen Relativ existiert. (Diekmann 247); Skala 5EmpirischeSozial-undWirtschaftsforschung 50

Das Grundmodell der klassischen Testtheorie gemeint! Testtheorie im Sinne der Psychologie E(δ) und Var(δ) existieren. gemessener Wert T = θ + δ wahrer Wert Messfehler 1. Kein systematischer Messfehler, d.h. es gilt: E(δ) =0. 2. θ und δ sind unkorreliert (oder unabhängig) 3. Messfehler bei verschiedenen Variablen sind unkorreliert (bzw. von einander unabhängig) 4. Messfehler korrelieren auch nicht mit wahren Werten anderer Variablen (bzw. sind davon unabhängig) 5EmpirischeSozial-undWirtschaftsforschung 51

5.3.3 Gütekriterien: Objektivität, Reliabilität, Validität Eine Messung als Homomorphismus kann zunächst relativ willkürlich und inhaltlich sinnlos sein. Bei der Berurteilung der Güte einer Messung unterscheidet man typischerweise drei Aspekte: i) Objektivität: Grad der Unabhängigkeit der Messung von Einflüssen außerhalb der befragten bzw. untersuchten Person, Einheit *Durchführungsobjektivität: *Auswertungsobjektivität: *Interpretationsobjektivität: 5EmpirischeSozial-undWirtschaftsforschung 52

ii) Reliabilität (Zuverlässigkeit) In welchem Ausmaß führt eine wiederholte Messung zu demselben Ergebnis? iii) Validität (Gültigkeit) Grad der Genauigkeit, mit ein Verfahren oder eine Messung das misst,wasesmessen soll 5EmpirischeSozial-undWirtschaftsforschung 53

Beurteilung der Reliabilität Maßzahl für die Reliabilität: Strukturelles Modell : θ selbst zufällig! (damit hat θ selbst eine Varianz) Sind die entsprechenden Varianzen > 0, sodefiniertmandiereliabilität des Indikators groß für die Variable θ bei Gültigkeit des Grundmodells der klassischen Testtheorie als: Rel(θ, T) := Var(θ) Var(T ) = Zusammenhang zur Korrelation Schätzung der Reliabilität * Validierungsdaten: *Test-Retest-Methode: 5EmpirischeSozial-undWirtschaftsforschung 54

*Paralleltestmethode: *Split-Half-MethodenzurErzeugungparallelerTests: *CronbachsAlpha(berücksichtigt die verschiedenen Aufteilungsmöglichkeiten) Normierte Form: n ρ α = 1+ ρ(n 1) 5EmpirischeSozial-undWirtschaftsforschung 55

Beurteilung der Validität Inhaltsvalidität Kriteriumsvalidität Konstruktvalidität Theoretische Validität: ρ(t,θ), zusätzlich E(δ) =0 Inhaltsvalidität: AlleDimensionendesKonstruktserfasst undnurdiese! Empirische Validität: Korrelation zu beobachtbarer Variable, die als Kriterium dient 5EmpirischeSozial-undWirtschaftsforschung 56

Kriteriumsvalidität: HoherZusammenhangzwischenMesswertenundeinemanderen gemessenem Kriterium ( externes Kriterium ) *Prädiktive Validität: *KonkurrenteValidität: Konstruktvalidität: 5EmpirischeSozial-undWirtschaftsforschung 57

5.3.4 Indexbildung, Skalierungsverfahren 5EmpirischeSozial-undWirtschaftsforschung 58

Indexbildung Zusammenfassung mehrerer Indikatoren eines Konstrukts zu einer Kennzahl. (vgl. Kap. 2.2: kollektive Kennzahl, die durch Kobination verschiedener Größen gebildet wird.) Oft sind Konstrukte mehrdimensional *WerdendieDimensionenjeweilsdurchIndikatorerfasst? *WelcheDimensionenfließenein? *Wiewerdensiekombiniert? *JederAusprägungskombination wird ein Wert zugeordnet *Zuordnungsregel:additiverIndex *Zuordnungsregel:multiplikativerIndex 5EmpirischeSozial-undWirtschaftsforschung 59

*Zuordnungsregel:gewichteterIndex k j=1 g j t j,wobeit j mit j =1,...,kdie Items bzw. Indikatoren widerspiegeln und g j die (festgesetzten) Gewichte darstellen Die Verknüpfungen durch Rechenoperationen als solche setzen ein höheres Skaleniveau voraus. Daher Verwendung von Indizes in vielen Situationen kritisch zu hinterfragen. Index kontinuierlicher Variablen 5EmpirischeSozial-undWirtschaftsforschung 60

Skalierungsverfahren Methoden zur Konstruktion von Messinstrumenten 5EmpirischeSozial-undWirtschaftsforschung 61

Vorbereitung der Skalierungsverfahren Notation Personen i mit i =1,...,n Stimuli, Items, Aufgaben j mit j =1,...,k Personenfähigkeit, Einstellung etc. als latente Variable θ Fähigkeit der Person i ist θ i Aufgabenparameter, Schwierigkeit des Items, Extremheit des Items β Schwierigkeit der Aufgabe j ist β j Antwort auf eine dichotome Aufgabe (Fähigkeit) oder eine Zustimmungsfrage (ja oder nein, 0/1). 5EmpirischeSozial-undWirtschaftsforschung 62

Antwort der Person i auf Item j wird mit U ij bezeichnet U ij =0Nicht-Lösung, Ablehnung U ij =1Lösung, Zustimmung *ModelliertwirdoftP (U ij = U ij θ i,β j ) 5EmpirischeSozial-undWirtschaftsforschung 63

Exkurs: Einige Regeln zur Formulierung von Items eindimensionale Items Frage nach gegenwärtigem Zustand keine Tatsachenbeschreiben, Suggestion Items sollten den Wertebereich, indem die Befragten liegen abdecken einfache, klare, kurze, verständliche Struktur, keine Mehrdeutigkeit, keine doppelte Verneinung Antwortkategorien erschöpfend 5EmpirischeSozial-undWirtschaftsforschung 64

Likert-Skala Ziel: Messe Eigenschaft der Person aufgrund einer großen Anzahl von Items Annahmen: Eindimensionalität, Aussagen zu Statements hängen nur mit der Eigenschaft zusammen übliches Vorgehen: *Statementsvon stimme voll zu, stimme eher zu, teils/teils, stimme eher nicht zu, stimme nicht zu *sogenannte Ratings werden aufsummiert ( Intervallskala vorausgesetzt!?) *Prüfung der Trennschärfe (wie gut werden hohe Eigenschaftswerte und niedrige Eigenschaftswerte durch die Kategorien separiert) und der Reliabilität (Cronbachs α) 5EmpirischeSozial-undWirtschaftsforschung 65

*ausreichendreliableundtrennscharfeitemsbleiben,ausdiesen wird Summe oder Mittelwert gebildet Probleme *Eindimensionalität häufig verletzt *keinnachweiseinesskalenniveaus *abhängig von der Stichprobe *VerfahrenistingewisserWeisezirkulär. 5EmpirischeSozial-undWirtschaftsforschung 66

Itemcharakteristische Funktionen für binäre Items Neuer Aspekt: Vergleich zwischen Subjekt und Stimuli (bzw. Item). Die Veranschaulichung erfolgt mithilfe sogenannter ICCs (item characteristic curve, traceline oder Itemcharakteristik); Die Grundform der ICCs wird in einigen Verfahren als bekannt (z.b. logistische Kurve) angenommen. Latente Variable wird auf der Abszisse abgetragen. Lösungswahrscheinlichkeit bzw. Zustimmungswahrscheinlichkeit auf der Ordinate Interpretation monotoner Verlauf: Mit steigendem Wert der latenten Eigenschaft steigt Lösungs- oder Zustimmungswahrscheinlichkeit. *Je fähiger die Person, desto höher Lösungswahrscheinlichkeit. *Je extremer die Einstellung der Person,desto höher Zustimmungswahrscheinlichkeit. 5EmpirischeSozial-undWirtschaftsforschung 67

Trennschärfe erkennt man an der Steigung der ICCs (verlaufen die Items parallel,so haben sie die gleiche Trennschärfe.) 5EmpirischeSozial-undWirtschaftsforschung 68

Rasch-Skala und Rasch-Modell Item Response Theorie (IRT) umfasst viele Skalierungsverfahren, das wohl bekannteste ist das Rasch-Modell. Ziel ist wieder die Schätzung eindimensionaler latenter Personeneigenschaften wie Fähigkeiten (z.b.: Mathekompetenz von Schülern, Lesekompetenz) oder Einstellungen. Auch in der PISA Studie werden das Rasch-Modell und einige Erweiterungen verwendet um die Vorbereitung von 15-jährigen Schülern auf die Wissensgesellschaft zu messen. Ziel: Schätze latente Eigenschaft der Person z.b. Mathefähigkeit (PISA) oder Einstellung; Wenn das Modell gilt, erhält man eine Messung auf mindestens Intervallskalenniveau (genauer: Differenzenskala.) 5EmpirischeSozial-undWirtschaftsforschung 69

Itemcharakteristiken Wahrscheinlichkeit für richtige Antwort 0.0 0.2 0.4 0.6 0.8 1.0 Item i1 Item i2 10 5 0 5 10 Latente Dimension 5EmpirischeSozial-undWirtschaftsforschung 70

Modell: P ((U ij = u ij θ i,β j ) i=1,...,n,j=1,...k )= n k P (U ij = u ij θ i,β j ) i=1 j=1 mit P (U ij = u ij θ i,β j )= exp[(θ i β j ) u ij ] 1+exp(θ i β j ) 5EmpirischeSozial-undWirtschaftsforschung 71

ICCs im Rasch-Modell Modell: P (U ij = u ij θ i,β j )= exp[(θ i β j ) u ij ] 1+exp(θ i β j ) Vorgehen: 1. Schätzung der Aufgabenschwierigkeiten 2. Schätzung der Personenparameter 5EmpirischeSozial-undWirtschaftsforschung 72

Nichtstandard-Fall im Maximum-Likelihood-Kontext Zur Schätzung der Parameter kann z.b. die sog. bedingte Maximum-Likelihood Schätzung oder die sog. marginale Likelihood-Schätzung verwendet werden. Wenn das Rasch-Modell gilt, entsprechen die Personenparameter (mindestens) einer Intervallskala. Wenn das Rasch-Modell gilt, dann ist die geschätzte Fähigkeit oder Einstellung eine monotone Transformation der Summe der gelösten Items. Diese bilden dann eine ordinale Skala. Zentraler Vorteil der IRT Modelle ist, dass die Annahmen explizit angegeben werden können und Tests zur empirischen Überprüfng der Annahmen existieren. 5EmpirischeSozial-undWirtschaftsforschung 73

Weitere Skalierungsverfahren Mehrdimensionale Rasch-Modelle Birnbaum Modell (auch 2 PL-Modell genannt) 3PL-Modell Partial-Credit Modell, Rating-Scale-Modell, Graded-Response Modell 5EmpirischeSozial-undWirtschaftsforschung 74

5.4 Erhebungsarten 5.4 Erhebungsarten Befragung Beobachtung Inhaltsanalyse Nicht-reaktive Verfahren 5EmpirischeSozial-undWirtschaftsforschung 75

5.4.1 Befragung 5.4 Erhebungsarten 5EmpirischeSozial-undWirtschaftsforschung 76

Arten der Befragung 5.4 Erhebungsarten face-to-face ( persönlich ) telefonische Befragung schriftliche Befragung CATI, CAPI: Computer Assisted Telefone Interview, - Personal Interview 5EmpirischeSozial-undWirtschaftsforschung 77

5.4 Erhebungsarten Charakteristika der persönlichen Befragung (Befragung als soziale Situation) Reaktivität: Interviewsituation: Interviewereffekte: Strukturierungsgrad: neutrale Interviewtechnik: Befragung setzt auf: 1. Kooperation im Regelfall 2. Norm der Aufrichtigkeit 3. gemeinsame Sprache 5EmpirischeSozial-undWirtschaftsforschung 78

5.4 Erhebungsarten Beachten sollte man (je nach Möglichkeiten) neutrale Interviewtechnik Retrospektivfragen heikle Fragen Incentives 5EmpirischeSozial-undWirtschaftsforschung 79

5.4 Erhebungsarten Befragtenmerkmale: Ja-Sager (Akquieszenz), Meinungslose, Pseudo-Opinions, Soziale Erwünschtheit, Response Sets Interview(er)merkmale: Situation, Interviewer Fragemerkmale: z.b. Dimension der Fragen, Reihenfolge, Antwortmöglichkeiten 5EmpirischeSozial-undWirtschaftsforschung 80

5.4.2 Beobachtung i.e.s. 5.4 Erhebungsarten 5EmpirischeSozial-undWirtschaftsforschung 81

Arten und Charakteristika der Beobachtung 5.4 Erhebungsarten Feld versus Labor teilnehmend versus nicht-teilnehmend offen versus verdeckt unstrukturiert versus strukturiert 5EmpirischeSozial-undWirtschaftsforschung 82

5.4.3 Inhaltsanalyse 5.4 Erhebungsarten 5EmpirischeSozial-undWirtschaftsforschung 83

5.4.4 Nicht-reaktive Verfahren 5.4 Erhebungsarten 5EmpirischeSozial-undWirtschaftsforschung 84

5.5 Zur statistischen Modellierung defizitärer Daten 5.5 Zur statistischen Modellierung defizitärer Daten 5EmpirischeSozial-undWirtschaftsforschung 85

5.5 Zur statistischen Modellierung defizitärer Daten Statistische Methoden zur Behandlung unvermeidlicher Fehler: 5.5.1 Messfehlermodelle (siehe Übung) Regressionsmodelle zwischen dem Grundmodell der klassischen Testtheorie gehorchenden latenten Variablen. 5.5.2 Fehlklassifikation Univariater Fall Ausgangssituation im binären Fall: θ wahre binäre Variable T beobachtete binäre Variable 5EmpirischeSozial-undWirtschaftsforschung 86

Defizitätsmodell 5.5 Zur statistischen Modellierung defizitärer Daten P (T =1 θ =1) =: π 11 Sensitivität P (T =0 θ =0) =: π 00 Spezifität P (T =0 θ =1) = 1 π 11 =: π 01 P (T =1 θ =0) = 1 π 00 =: π 10 Fehlklassifikationsmatrix ( ) π00 π π = 01 π 10 π 11 Auf der Diagonale: Wahrscheinlichkeiten konkreter Klassifikationen. Auswirkungen der Fehlklassifikation gesucht P (θ =1)=:p 5EmpirischeSozial-undWirtschaftsforschung 87

naiver Schätzer: ˆp = 1 n n i=1 T i 5.5 Zur statistischen Modellierung defizitärer Daten P (T =1) = P (t =1 θ =1) P (θ =1) +P (t =1 θ =0) P (θ =0) = π 11 P (θ =1)+π 10 P (θ =0) Ausmaß des Bias P (T =1) P (θ =1) = π 11 P (θ =1)+π 10 P (θ =0) (π 11 + π 01 ) P (θ =1) = π 10 P (θ =0) π 01 P (θ =1) 5EmpirischeSozial-undWirtschaftsforschung 88

5.5 Zur statistischen Modellierung defizitärer Daten Bias =0,fallsP (θ =1)und π 00 = π 11 positiver wie negativer Bias möglich 5EmpirischeSozial-undWirtschaftsforschung 89

Korrektur 5.5 Zur statistischen Modellierung defizitärer Daten P (T =1)konsistent schätzbar Löse Gleichung nach P (θ =1)auf P (θ =1)= P (T =1) π 10 π 11 + π 00 1 P (T =1) = π 11 P (θ =1)+π 10 P (θ =0) = π 11 P (θ =1)+ }{{} π 10 (1 P (θ =1)) 1 π 00 Voraussetzungen π 11,π 00 bekannt π 11 + π 00 > 1 (z.b. bei π 11 > 1/2, π 11 > 1/2; Klassifikationsollbesserseinals fälliges klassifizieren)) 5EmpirischeSozial-undWirtschaftsforschung 90

5.5 Zur statistischen Modellierung defizitärer Daten p* = p sens + (1 p)(1 spec) p* 0.0 0.2 0.4 0.6 0.8 1.0 sens = 1, spec = 0.4 sens = 1, spec = 0.6 sens = 1, spec = 0.8 sens = 1, spec = 1 0.0 0.2 0.4 0.6 0.8 1.0 p 5EmpirischeSozial-undWirtschaftsforschung 91

5.5 Zur statistischen Modellierung defizitärer Daten p* = p sens + (1 p)(1 spec) p* 0.0 0.2 0.4 0.6 0.8 1.0 sens = 0.8, spec = 0.4 sens = 0.6, spec = 0.6 sens = 0.8, spec = 0.8 sens = 1, spec = 1 0.0 0.2 0.4 0.6 0.8 1.0 p 5EmpirischeSozial-undWirtschaftsforschung 92

Multinomialer Fall 5.5 Zur statistischen Modellierung defizitärer Daten Fehlklassifikationswahrscheinlichkeiten π ij = P (T = i θ = j) Fehlklassifikationsmatrix Π (bekannt oder konsistent geschätzt) P (T =1) P (T =2). P (T = k) =Π P (θ =1) P (θ =2). P (θ = k) 5EmpirischeSozial-undWirtschaftsforschung 93

5.5 Zur statistischen Modellierung defizitärer Daten Matrixmethode P (θ =1) P (θ =2). P (θ = k) =Π 1 P (T =1) P (T =2). P (T = k) nicht immer zielführend, die Schätzungen mancher Komponenten nicht im Intervall [0; 1] liegen müssen. 5EmpirischeSozial-undWirtschaftsforschung 94

Erweiterungen 5.5 Zur statistischen Modellierung defizitärer Daten Bivariater Fall, insbesondere 2 2 Tafeln Regressionsmodelle *Fehlklassifikationinbinärer abhängiger Variable: Hausmann et al (Journal of Econometrics, 1998), Neuhaus (Biometrika, 1999) Likelihood bei bekannter Fehlklassifikationsmatrix *ErweiterungSIMEX-Verfahren:Küchenhoff & Lesaffre (2006, Biometrics) 5EmpirischeSozial-undWirtschaftsforschung 95

5.5.3 Fehlende Daten 5.5 Zur statistischen Modellierung defizitärer Daten Little, R.J.A., Rubin, D.B. (2002): Statistical Analysis with Missing Data, 2nd edition, New York: John Wiley Spieß, M. (2009): Missing Data: Analyse von Daten mit fehlenden Werten, Lit Verlag Grundlegende Begriffe unit-nonresponse: *keineinformationüber Fall, *vollständige Verweigerung, allgemein * non coverage, *Ausschöpfungsquote 5EmpirischeSozial-undWirtschaftsforschung 96

5.5 Zur statistischen Modellierung defizitärer Daten item-nonresponse: nur Werte bestimmter Variablen fehlen, hier im folgenden Complete Case Analysis: *AnalysierenurdieFälle, bei denen zu allen Variablen die Ausprägungen vorliegen * wennfehlennichtzufällig Verzerrung, z.b. Zensierung *aufallefälle Effizienzverlust *eventuellbleibennurwenigefälle übrig Available Case Analysis benutze jeweils alle Fälle, die bezüglich der jeweils betrachteten Frage vollständig sind Imputation Fülle Datanmatrix auf verschiedene Verfahren 5EmpirischeSozial-undWirtschaftsforschung 97

komplexe Schätzverfahren: 5.5 Zur statistischen Modellierung defizitärer Daten *EM-Algorithmus *BayesianischeMethoden *Gewichtung(Horvitz-Thompson) Fehlendmechanismen bei partiell fehlendem Response Y und Kovariable X *betrachteindikatorvariable i = { 1 Yi beobachtet 0 Y i nicht beobachtet *unddiewahrscheinlichkeitp ( i =1) *unterscheidediefolgendenfälle: i hängt *[α)] wedervonxnochvony *[β)] vonx,abernichtvony 5EmpirischeSozial-undWirtschaftsforschung 98

5.5 Zur statistischen Modellierung defizitärer Daten *[γ)] vony,abernichtvonx *[δ)] vonyundvonx ab. *bei α) spricht man von Missing completely at random MCAR (Beobachtete Daten sind eine echte Zufallsstichprobe aller Daten) *beiβ) spricht man von Missing at random: MAR Beobachtete Daten sind in jeder bezüglich x gebildeten Klasse eine Zufallsstichprobe * γ) und δ) Hier fehlen die Daten nicht zufällig; Man spricht von: Missing not at random (MNAR) Viele Verfahren, mit fehlenden Daten umzugehen, benötigen MAR Was tun bei MCAR? *Defizitätsprozess modellieren *MARistnichttestbar 5EmpirischeSozial-undWirtschaftsforschung 99

Vorsichtige Analyse fehlender Daten, Sensitivitätsanalyse 5.5 Zur statistischen Modellierung defizitärer Daten * Ökonometrie: insbesondere Manski (2003): Partial Identification of Probability Distributions, Springer *Biometrie:systematischeSensitivitätsanalyse (Vansteelandt, Goetghebeur, Kenward, Molenberghts. Statistica Sinica, 2006.) *Manski s Law of Decreasing Credibility Die Glaubwürdigkeit statistischer Aussagen sinkt mit der Stärke der Annahmen, auf denen sie beruhen. *GibdenAnspruchauf,jedestatistischeAnalysemüsse eine eindeutige Antwort geben *BetrachtedieMengealler mit den Daten verträglichen Modelle * Partielle Identifikation statt Punktidentifikation z.b. Intervallwertige Punktschätzer für Parameter oft für substanzwissenschaftlich relevante Aussagen ausreichend. 5EmpirischeSozial-undWirtschaftsforschung 100

5.5 Zur statistischen Modellierung defizitärer Daten *unschärfere, aber dafür glaubwürdigere Aussagen *insbesonderewirddeutlich,wiestarkgewisseannahmendiesubstanzwissenschaftlichen Folgerungen prägen. *aktuellerforschungsgegenstand 5EmpirischeSozial-undWirtschaftsforschung 101