Seminar: Statistische Modellierung latenter Strukturen in den Lebens-, Sozial- und Wirtschaftswissenschaften. Institut für Statistik, LMU München

Ähnliche Dokumente
Das Rasch-Modell und seine zentralen Eigenschaften

Was ist eine Testtheorie? Grundlagen der Item-Response. Response-Theorie. Modelle mit latenten Variablen

Lehrbuch Testtheorie - Testkonstruktion

Verallgemeinerungen der Rasch-Modells

2.4 Indexbildung und Einblick in Skalierungsverfahren

Überblick über die ProbabilistischeTesttheorie

Bildungsurlaub-Seminare: Lerninhalte und Programm

PISA-Studie. Ausgewählte Aspekte der Wirtschafts- und Sozialstatistik. Jenny Steindl. LMU München, Institut für Statistik

Raschmodelle und generalisierte Regression. Sven Hilbert

5.Tutorium Generalisierte Regression

Partial Credit Model und Tutz Model

Das Partial Credit Modell

Was ist eine Testtheorie?

Interdisziplinäres Seminar. Multivariate Statistik bei psychologischen Fragestellungen. Markus Bühner und Helmut Küchenhoff WS 2008/09

Seminar: Psychometrische Modelle: Theorie und Anwendungen. Institut für Statistik, LMU München

Einführung in die Theorie psychologischer Tests

Item Response Theorie für binäre Daten

Testtheorie und Testkonstruktion

SOZIALWISSENSCHAFTLICHE FORSCHUNGSMETHODEN

Klassische Testtheorie (KTT) Klassische Testtheorie (KTT) Klassische Testtheorie (KTT)

Ordinale abhängige Variablen. Einführung Regressionsmodelle für ordinale Variablen Empirisches Beispiel Ausblick

Personenparameter + Itemparameter

Vorlesung Testtheorien. Dr. Tobias Constantin Haupt, MBA Sommersemester 2007

Klassische Testtheorie (KTT) Klassische Testtheorie (KTT) Klassische Testtheorie (KTT)

Statistik Einführung // Kategoriale Daten 10 p.2/26

06./ Vortrag im Rahmen des Masterseminars Psychometrische Modelle: Theorie und Anwendungen am Institut für Statistik (LMU)

Testtheorie und Gütekriterien von Messinstrumenten. Objektivität Reliabilität Validität

Psychologische Tests und mehrwertige Logik

Tests der Annahmen des Rasch-Modells

Item-Response-Theorie Probabilistische Testtheorie. Christian Stroppel

Carolin Strobl: Das Rasch-Modell. Eine verständliche Einführung für Studium und Praxis

Standardisierte Vorgehensweisen und Regeln zur Gewährleistung von: Eindeutigkeit Schlussfolgerungen aus empirischen Befunden sind nur dann zwingend

Das Rasch-Modell. Emil Fazli. 17. Juni Betreuer: Dr. Marco Cattaneo

John Komlos Bernd Süssmuth. Empirische Ökonomie. Eine Einführung in Methoden und Anwendungen. 4y Springer

Der Barthel-Index zur Messung von Alltagskompetenzen bei Demenz

Wahrscheinlichkeitsrechnung und Statistik

Psychometrie. Lena Straub

RASCH-SKALIERUNG

Rekodierung invertierter Items

Mehrdimensionale Zufallsvariablen

1 Einführung Ökonometrie... 1

Vorlesung: Statistik II für Wirtschaftswissenschaft

Reliabilitäts- und Itemanalyse

Was ist ein Test? Grundlagen psychologisch- diagnostischer Verfahren. Rorschach-Test

Anwendung von Multi-Level Moderation in Worst Performance Analysen

Faktorenanalysen höherer Ordnung

Statistik II. I. Einführung. Martin Huber

1. Eigenschaften einer Zufallsstichprobe

Zufallsvariablen. Diskret. Stetig. Verteilung der Stichprobenkennzahlen. Binomial Hypergeometrisch Poisson. Normal Lognormal Exponential

erm: ein Open Source Paket für IRT Modelle

Messtherorie Definitionen

Konfirmatorische Faktorenanalyse. Regressionsmodelle für Politikwissenschaftler

Inhalt. I Einführung. Kapitel 1 Konzept des Buches Kapitel 2 Messen in der Psychologie... 27

Ein SAS -Makro zur Schätzung des Stereotype Regressionsmodells

Universität Potsdam Institut für Informatik Lehrstuhl Maschinelles Lernen. Sprachtechnologie. Tobias Scheffer Thomas Vanck

Testtheorie und Testkonstruktion

Statistik II. IV. Hypothesentests. Martin Huber

5.3 Konzeptspezifikation, Operationalisierung, Messung

Prüfung im Fach Mikroökonometrie im Wintersemester 2012/13 Aufgaben

Beispielberechnung Vertrauensintervalle

Die Pairwise-Methode zur Parameterschätzung im ordinalen Rasch-Modell

Vorlesung: Statistik II für Wirtschaftswissenschaft

Statistik I für Betriebswirte Vorlesung 13

Seminar zur Energiewirtschaft:

Methodenlehre. Vorlesung 10. Prof. Dr. Björn Rasch, Cognitive Biopsychology and Methods University of Fribourg

Statistische Modellierung Merkblatt

Übung zur Vorlesung - Theorien Psychometrischer Tests II

Allgemeine lineare Modelle

Bestimmung der Zuverlässigkeit / Reliabilität einer additiven Itemskala. Cronbach s. 1 (k 1)r

Konfirmatorische Faktorenanalyse

Einführung in die Induktive Statistik: Testen von Hypothesen

Methodenlehre. Vorlesung 10. Prof. Dr. Björn Rasch, Cognitive Biopsychology and Methods University of Fribourg

Willkommen zur Vorlesung Statistik (Master)

Goethe-Universität Frankfurt

Testlet Response Theory - Scoright

Kategorielle Zielgrössen

Korrektur des Bias Feldes in MR Aufnahmen

Testtheorie und Testkonstruktion

Statistische Tests Übersicht

Verfahren zur Skalierung. A. Die "klassische" Vorgehensweise - nach der Logik der klassischen Testtheorie

1 Inhaltsverzeichnis. 1 Einführung...1

Fakultät Verkehrswissenschaften Friedrich List Professur für Ökonometrie und Statistik, insb. im Verkehrswesen. Statistik II. Prof. Dr.

4.2 Methoden um Tests zu finden: Likelihood Quotienten Tests (LRT) Falls X 1,..., X n iid aus f(x θ), so gilt für die Likelihood Funktion

Forschungsmethoden VORLESUNG SS 2017

Forschungsmethoden VORLESUNG SS 2017

Statistische Datenanalyse

Freisetzen und Fixieren von Parametern in Strukturgleichungsmodellen

Dr. Maike M. Burda. Welchen Einfluss hat die Körperhöhe auf das Körpergewicht? Eine Regressionsanalyse. HU Berlin, Econ Bootcamp

Methodenlehre. Vorlesung 12. Prof. Dr. Björn Rasch, Cognitive Biopsychology and Methods University of Fribourg

A discrete shipment size choice model with latent classes of shippers attributes Vortrag zur Konferenz Verkehrsökonomik und -politik

Psychologische Diagnostik

5. Schließende Statistik (Inferenzstatistik, konfirmatorische Verfahren)

Fehlende Daten. Seminarvortrag im Rahmen des Seminars: Statistische Herausforderungen sozialwissenschaftlicher Studien.

Stochastik Praktikum Parametrische Schätztheorie

Deskriptive Beschreibung linearer Zusammenhänge

Vorlesung: Statistik II für Wirtschaftswissenschaft

Klassen diskreter Variablen

Vorlesung: Statistik II für Wirtschaftswissenschaft

Transkript:

Seminar: Statistische Modellierung latenter Strukturen in den Lebens-, Sozial- und Wirtschaftswissenschaften Institut für Statistik, LMU München 18.01.2014

Grundfrage der Psychometrie Wie kann man Eigenschaften, Persönlichkeitsmerkmale (z.b. Intelligenz, Extraversion, Depression, Kompetenzen,...) messen/ messbar machen? Problem: Eigenschaften sind nicht direkt beobachtbar. Lösung: Schluss auf Eigenschaftsausprägungen über Verhalten. Antworten auf Items als Manifestation von Verhalten. Von diesen dann Schluss auf latente Merkmale. Das Ausgangsmaterial sind also Antworten von Personen auf viele Items zu einem Konstrukt. Auf welcher Basis soll der Schluss von Antwortverhalten auf Merkmalsausprägungen erfolgen? Modellfrage

(Personenvariablen kontinuierlich) (Personenvariablen diskret) kombinierte

Klassische Testtheorie () Ausgangsbasis: X beobachteter Wert T wahrer Wert E Fehler X = T + E X z.b.summenwert mehrerer Itemantworten. Annahmen: Erw(E) = 0 r(e, T ) = 0 r(e X, T Y ) = 0 (Y : andere beobachtete Variable) r(e X, E Y ) = 0 zentraler Kennwert ist die Reliabilität: r tt = var(t X ) var(x ) nur Messfehlertheorie

: Item Response Theory Rasch Modell (1PL Modell) 2PL Modell 3PL Modell (mehrdimensional, mehrkategorial) ( mit Probit oder anderen Responsefunktionen)

für die aufgeführten Beispielmodelle Response { 1, wenn Antwort richtig/zustimmung* x pi = 0, wenn Antwort falsch/ablehnung* * von Person p auf Item i. also Matrix mit Nullen und Einsen

-Bsp.: Das P(X pi = 1) = exp(θ p β i ), p = 1,..., P; i = 1,..., I 1 + exp(θ p β i ) θ p wird bezeichnet als Personenparameter der Person p β i wird bezeichnet als Itemparameter des Items i Es ergeben sich also P + I 1 Parameter (Restriktion nötig) Beispiel für drei Item-Response Funktionen

Eigenschaften des s Suffiziente Statistiken sowohl für Item- als auch Personenparameter vorhanden (Randsummen der Antwortmatrix). Schätzung β über jml, cml oder mml θ ist herauskonditionierbar cml-schätzung der Itemparameter. Unabhängig von nuisance und konsistent. Jedes Item zeigt gleiche Diskrimination, dadurch Rangreihe der Items für jede Person identisch. Beliebtes Modell, da Bestimmung von θ unabhängig von konkreten Items (also β ) immer gleich. Dadurch ist adaptives Testen ermöglicht, also Testung mit individueller Itemzusammenstellung.

Das Zusätzliche Einführung eines Diskriminationsparameters α i für jedes Item i: P(X pi = 1) = exp(α i(θ p β i )) 1 + exp(α i (θ p β i ))

Eigenschaften des s Flexibler als das. Viele Eigenschaften fallen jedoch im Gegensatz zum weg. Suffiziente Statistiken nun I α i x pi. Beim i=1 also ausschlaggebend, welche Items genau gelöst wurden. Rangreihe der Items kann für Personen verschieden ausfallen. Größere Stichproben zur zuverlässigen Schätzung der αi notwendig. Spezifiziert man die α i vor der Analyse, so zeigt das resultierende OPLM (One-Parameter-Logistic-Model, nicht zu verwechseln mit 1PL) wieder die wünschenswerten Eigenschaften des s (Personenwerte wieder unabhängig von ItemSP identisch schätzbar).

Das Weitere Einführung eines Rateparameters γ i für jedes Item i: exp(α i (θ p β i )) P(X pi = 1) = γ i + (1 γ i ) 1 + exp(α i (θ p β i ))

der - mehrdimensionale mit θ T = (θ 1, θ 2,..., θ m ). mehrdimensionales multidimensional random coefficient multinomial logit model (MRCMLM)... auf mehrkategoriale Items, z.b. x pi {0, 1, 2, 3, 4}. (Generalised) Partial-Credit-Modell (GPCM/PCM) Ratingscale-Modell (RSM)... Mischverteilungsmodelle Mixed- Hybrid...

: Cognitive Diagnosis Models Grundidee: diskrete Skills als Grundlage, Diagnostik der Skills als Ziel. Skillvektor einer Person p α p {0, 1} K mit K = Anzahl verschiedener Skills Bsp. Mathematikfähigkeiten Skill 1: Addition Skill 2: Multiplikation Skill 3: Wurzelziehen Skill 4: Punkt vor Strich Aufgabe: 2 + 2 3 =? benötigte Skills: 1,2,4 Q-Matrix Eintrag q i = (1, 1, 0, 1). Die Q-Matrix enthält die Anforderungsprofile aller Items i des Tests. Verrechnung von α p mit q i zu η pi = K α q ik pk k=1

-Bsp.: Das als Beispiel (Deterministic inputs, noisy and gate) Einfachstes. Interpretation: P i (α p ) = P(X pi = 1 α p ) = g 1 η pi i (1 s i ) η pi g i Rateparameter. Kommt zum tragen, wenn η pi = 0, wenn Person p mindestens einen für Item i benötigten Skill k nicht beherrscht. si Parameter für Leichtsinnsfehler (Slips). Das Komplement kommt zum tragen, wenn mindestens alle benötigten Skills von Person p beherrscht werden. Besonderheit: deterministischer Anteil im Modell durch η pi. Schätzung über mml mithilfe EM-Algorithmus.

: mehrstufige Skills (GDINA) weitere Parameter, wie z.b. Vollständigkeitsparameter (sind alle erforderlichen Skills in der Q-Matrix enthalten?) Kombination mit -Anteilen, RUM (Reparametrized Unified Model) RUM mit Prioris für Skills: Fusion Model.

r Forced-Choice Antwortformate, Präferenzantworten unfolding Antwortmodelle (statt dominance response) Dominance-Response (alle heute behandelten ): monoton steigende Item-Response Funktionen Unfolding-: eingipflige IRF, die Zustimmungswahrscheinlichkeit sinkt nach beiden Seiten ab (Näherelation).

Herzlichen Dank für die Aufmerksamkeit

Rost J (2004). Lehrbuch Testtheorie - Testkonstruktion. Aus dem Programm Huber: Psychologie-Lehrbuch. Huber Hans. von Davier M, Carstensen C (2007). Multivariate and Mixture Distribution Rasch Models: Extensions and Applications. Statistics for Social Science and Behavorial Sciences. Springer Science + Business Media, LLC, New York.