Die Pairwise-Methode zur Parameterschätzung im ordinalen Rasch-Modell

Ähnliche Dokumente
Das Rasch-Modell und seine zentralen Eigenschaften

erm: ein Open Source Paket für IRT Modelle

Partial Credit Model und Tutz Model

Umgang mit und Ersetzen von fehlenden Werten bei multivariaten Analysen

PELTIER-HOCHLEISTUNGSMODULE

Missing Data. Missing Data. VL Forschungsmethoden. VL Forschungsmethoden. Missing Data: Typen Strategien Fazit

PISA-Studie. Ausgewählte Aspekte der Wirtschafts- und Sozialstatistik. Jenny Steindl. LMU München, Institut für Statistik

Missing Data. VL Forschungsmethoden

Syntax. Ausgabe *Ü12. *1. corr it25 with alter li_re kontakt.

Quadt Kunststoffapparatebau GmbH

Kontrolle und Aufbereitung der Daten. Peter Wilhelm Herbstsemester 2014

Vorlesung: Statistik II für Wirtschaftswissenschaft

a) Name and draw three typical input signals used in control technique.

DER KAPPA-KOEFFIZIENT: DISKUSSION EINES MISSVERSTÄNDNISSES UND EIN MODIFIZIERUNGSVORSCHLAG

Item-Response-Theorie Probabilistische Testtheorie. Christian Stroppel

Research Collection. Digital estimation of continuous-time signals using factor graphs. Doctoral Thesis. ETH Library. Author(s): Bolliger, Lukas

Tube Analyzer LogViewer 2.3

Imputation (Ersetzen fehlender Werte)

Causal Analysis in Population Studies

Bayesian Networks. Syntax Semantics Parametrized Distributions Inference in Bayesian Networks. Exact Inference. Approximate Inference

Statistische Matching-Verfahren

Bayesian updating in natural hazard risk assessment

CABLE TESTER. Manual DN-14003

Statistics, Data Analysis, and Simulation SS 2015

Missing Data. Regressionsmodelle für Politikwissenschaftler

DevCan - neue Wege der Kommunikation von Registerdaten?

Wie kompetent sind S(s)ie?

Imputationsverfahren

Einführung in die Theorie psychologischer Tests

AS Path-Prepending in the Internet And Its Impact on Routing Decisions

Employment and Salary Verification in the Internet (PA-PA-US)

v+s Output Quelle: Schotter, Microeconomics, , S. 412f

Correlational analysis

Softwareschnittstellen

Weitere Korrelationskoeffizienten (1)

DIBELS TM. German Translations of Administration Directions

Fundamentale Matrix: 8-Punkte Algorithmus

Testtheorie und Testkonstruktion

Extended Ordered Paired Comparison Models An Application to the Data from Bundesliga Season 2013/14

Fortgeschrittenes Programmieren mit R. Christoph Beck. Di, 14:00-15:30 (3065)

FEBE Die Frontend-Backend-Lösung für Excel

Checkliste. Verantwortlich: Benedikt Pawletta K-SIPE-2 Status:

Schätzverfahren ML vs. REML & Modellbeurteilung mittels Devianz, AIC und BIC. Referenten: Linda Gräfe & Konstantin Falk

Oliver Kuß*; Dorothee Twardella**; Maria Blettner***; Thomas L. Diepgen**

Auswertungsbericht Lehrveranstaltungsevaluation an die Lehrenden

Knowledge-Based system. Inference Engine. Prof. Dr. T. Nouri.

Auswertungsbericht Lehrveranstaltungsevaluation an die Lehrenden

Interdisziplinäres Seminar. Multivariate Statistik bei psychologischen Fragestellungen. Markus Bühner und Helmut Küchenhoff WS 2008/09

Harry gefangen in der Zeit Begleitmaterialien

Einsatz einer Dokumentenverwaltungslösung zur Optimierung der unternehmensübergreifenden Kommunikation

FIVNAT-CH. Annual report 2002

Prediction of Binary Fick Diffusion Coefficients using COSMO-RS

Der Adapter Z250I / Z270I lässt sich auf folgenden Betriebssystemen installieren:

Tabellarischer Lebenslauf und Publikationen

Load Test DEFAULT : 750 logged in users buying an item every 60 -

Eine Beschwerdenliste mit den wichtigsten, in der Literatur mit elektromagnetischen Feldern in Verbindung gebrachten Befindlichkeitsstörungen

General info on using shopping carts with Ogone

Attention: Give your answers to problem 1 and problem 2 directly below the questions in the exam question sheet. ,and C = [ ].

Newest Generation of the BS2 Corrosion/Warning and Measurement System

J RG IMMENDORFF STANDORT F R KRITIK MALEREI UND INSPIRATION ERSCHEINT ZUR AUSSTELLUNG IM MUSEUM LU

Statistik II Übung 1: Einfache lineare Regression

Berechnung von Strukturgleichungsmodellen mit Amos. Im folgenden kurze Einführung: Arbeiten mit Amos Graphics

Bestimmung der Zuverlässigkeit / Reliabilität einer additiven Itemskala. Cronbach s. 1 (k 1)r

Mensch-Maschine-Interaktion 2 Übung 1

Grundlagen der Bioinformatik Assignment 3: Hierarchical Clustering SS Yvonne Lichtblau/Johannes Starlinger

Wissenschaftliche Arbeitsgemeinschaft für Raketentechnik und Raumfahrt. Lehrstuhl für Raumfahrttechnik Technische Universität München

fh management, communication & it Constantin von Craushaar FH-management, communication & it Statistik Angewandte Statistik

Call Centers and Low Wage Employment in International Comparison

Anwendung von Multi-Level Moderation in Worst Performance Analysen

Einführung in die Statistik

Exercise (Part II) Anastasia Mochalova, Lehrstuhl für ABWL und Wirtschaftsinformatik, Kath. Universität Eichstätt-Ingolstadt 1

SOZIALWISSENSCHAFTLICHE FORSCHUNGSMETHODEN

3. Lektion: Deskriptive Statistik

John Komlos Bernd Süssmuth. Empirische Ökonomie. Eine Einführung in Methoden und Anwendungen. 4y Springer

Einführung in die Statistik

Advanced Track and Tire Modeling using SIMPACK User Routines

1 Einführung Ökonometrie... 1

Anwendungs hinweise Application hints

Dr. Johannes Bauer Institut für Soziologie, LMU München. Directed Acyclic Graphs (DAG)

Dr. Maike M. Burda. Welchen Einfluss hat die Körperhöhe auf das Körpergewicht? Eine Regressionsanalyse. HU Berlin, Econ Bootcamp

BID EVALUATION DOWNLOAD. powered by

Darstellung und Anwendung der Assessmentergebnisse

Ergebnisse der empirischen Studie zum Thema Second Screen im Unterricht

ISO SPICE Erste Eindrücke

Statistik, Geostatistik

Computer-gestützter Entwurf von absatzweise arbeitenden chemischen Mehrproduktanlagen

Log-lineare Analyse I

Einige Grundbegriffe der Statistik

Künstliche Intelligenz

DIPLOMARBEIT. Angefertigt bei: KPMG Deutsche Treuhand-Gesellschaft AG Advisory. Herr Prof. Dr. Liebstückel. Abgabetermin: 23.

Konfirmatorische Faktorenanalyse oder Item-Response-Theory-Analyse? Ein Vergleich beider Verfahren zur Entwicklung eines Leistungstests

ANALYSIS REPORT No DATE: PAGE 1/1

Was Sie schon immer über Teneriffa wissen wollten: Erklärungen & Wissenswertes, Tipps & Highlights (German Edition)

Conjoint Measurement:

Wie man heute die Liebe fürs Leben findet

Ökonometrie. Hans Schneeweiß. 3., durchgesehene Auflage. Physica-Verlag Würzburg-Wien 1978 ISBN

-Programmierbeispiele - ADF Rich Client Faces Komponente PanelSpringBoard

Die Kunst des Programmierens...

Im Fluss der Zeit: Gedanken beim Älterwerden (HERDER spektrum) (German Edition)

Transkript:

Die Pairwise-Methode zur Parameterschätzung im ordinalen Rasch-Modell Jörg Henrik Heine 1 & Christian Tarnai 2 1 Ludwig-Maximilians Universität München 1 Technische Universität München 2 Universität der Bundeswehr Neubiberg (bei München) 20. September 2013 Heine (LMU München) Die Pairwise-Methode 20. September 2013 1 / 16

Hintergrund Drei Standard Schätzmethoden zur Bestimmung von Item (und Personenparametern) im Raschmodell 1 CML: Getrennte Schätzung von Item und Personenparametern Unabhängig von der Score Verteilung Problematisch bei hohen missing Anteilen (z.b. Booklet Design) 2 MML: Getrennte Schätzung von Item und Personenparametern Unproblematisch bei Booklet Design Datensätzen (missing by design) Problematisch bei Verletzung der Normalverteilungsannahme (z.b. kleine Datensätze, selektive Stichproben) 3 JML: Gleichzeitige Schätzung von Item und Personenparametern Personenparameter Schätzer stets ungenauer als Itemparameter Schätzer Heine (LMU München) Die Pairwise-Methode 20. September 2013 2 / 16

Zwischenfazit CML, MML, JML Allgemein ist bei mehrstufigen Antwortformaten und kleinen Datensätzen mit geringen Kategoriehäufigkeiten zu rechnen, was in der Regel zu Schätzproblemen führt. These conditional methods of parameter estimation for items with more than two ordered categories involve sufficient statistics for the threshold parameters that involve directly the frequencies of responses in the adjacent categories. This is also a feature of other methods of estimation, for example, the marginal maximum likelihood (Bock and Aitkin, 1981) and the joint maximum likelihood (Wright and Douglas, 1977) methods. As a result, and in the case of some dislocation of persons and items which can result in some categories of some items having low frequencies, the estimates of corresponding thresholds will be unstable. (Andrich & Luo, 2003) Heine (LMU München) Die Pairwise-Methode 20. September 2013 3 / 16

Die Pairwise Methode als Alternative Explizite Berechnung der Itemparameter nach der Methode des paarweisen Itemvergleichs und anschließende ML Schätzung der Personenparameter 1 zentrale Literatur zu Pairwise: Entwicklung der Methode zur Itemkalibrierung in Itembanken (Choppin, 1968, 1983) Generalisierung auf polytome Items (Garner & Engelhard Jr, 2002; Wright & Masters, 1982) 2 Prinzip: Zählen der der Lösungs Häufigkeiten von Item j unter Voraussetzung das Item i nicht gelöst wurde Bildung der negativ reziproken Häufigkeits-Matrix Logarithmieren der Zeilenrandsummen Detailiertere Darstellung (für dichotome Daten) vgl. (Heine, Tarnai & Hartmann, 2011) Heine (LMU München) Die Pairwise-Methode 20. September 2013 4 / 16

Die Pairwise Methode als Alternative 1 Vorteile: Getrennte Schätzung von Item und Personenparametern the method is simpler to implement than the CML (Andrich & Luo, 2003) Konsistenz nachgewiesen für dichtome Items (Zwinderman, 1995) Und schließlich... A special advantage of PAIR is that it can be used to analyze the incomplete data matrices which result when some items are not taken by some persons in the calibration sample. (Wright & Masters, 1982, S. 69) Heine (LMU München) Die Pairwise-Methode 20. September 2013 5 / 16

das R Paket {pairwise} 1 Versions Historie: Erste Version (0.1.3) auf CRAN verfügbar seit 11. Februar 2013 Aktuelle Version ist die Version (0.1.4; seit 11. Juli 2013) (Heine, 2013) Kommende Version (0.1.5) als vorab Paket unter: www.joerg-henrik-heine.de 2 Funktionsumfang: Itemparameter Berechnung für dichotome und polytome Items Graphischer Modelltest (nach verschiedenen Splitting Kriterien) Standardfehler Berechnung implementiert über bootstrap bzw. jack knive S3 methods für Ergebnisobjekte: summary() und plot() 3 geplanter Funktionsumfang: Integration der Personenparameter Schätzung Ggf. weitere Modelltests... Zusammenfassung der einzelnen Funktionen in einer zentralen wrapper Funktion (Anwenderfreundlichkeit) Heine (LMU München) Die Pairwise-Methode 20. September 2013 6 / 16

Fragestellung 1 Verlässlichkeit der Parameterschätzung: Wie gut lassen sich die wahren Itemparameter mit {pairwise} anhand von unvollständigen Daten bestimmen? Wie schneiden andere Methoden im Vergleich dazu ab? Wie groß sind die zu erwartenden Abweichungen bei der Parameterschätzung mit unvollständigen Daten im Vergleich zu vollständigen Daten? 2 Standardfehler: Wie gut lassen sich die Standardfehler mit {pairwise} bestimmen...... bei unvollständigen Daten? Wie schneiden andere Methoden im Vergleich dazu ab? Heine (LMU München) Die Pairwise-Methode 20. September 2013 7 / 16

Datenbasis 1 Stichprobenbeschreibung: Männliche Studierende der Universität der Bundeswehr (1999-2002) Erhebung im Rahmen der Methoden Ausbildung im Studiengang Diplom Pädagogik. n = 620 (Vollständige Daten) 2 Skalenbeschreibung: 8 Items der NEO PI R Facette Befangenheit (N4) Das ursprünglich 5 Stufige Antwortformat wurde durch zusammenlegen der 3. und 4. Kategorie auf 4 Stufen reduziert 3 Erzeugung fehlender Werte: Erzeugen von (künstlich) fehlenden Werten in der empirischen Datenmatrix Ansteigender prozentualer Anteil an missings : in 5% Schritten von 5% bis 40%. Zufälliger Ausfallmechanismus Heine (LMU München) Die Pairwise-Methode 20. September 2013 8 / 16

Inhalte der Items pol nam text + Im Umgang mit anderen befürchte ich häufig, daß ich unangenehm auffallen könnte. + Manchmal war mir etwas so peinlich, daß ich mich am liebsten versteckt hätte. - Es bringt mich nicht besonders in Verlegenheit, wenn andere mich verspotten und lächerlich machen. - Ich bin selten verlegen, wenn ich unter Leuten bin. + Ich fühle mich anderen oft unterlegen. - In Gegenwart meiner Chefs oder anderer Autoritäten fühle ich mich wohl. + Wenn ich einer Person etwas falsches gesagt oder angetan habe, kann ich es kaum ertragen, ihr noch einmal zu begegnen. + Wenn meine Bekannten dummen Unfug treiben, so ist mir das peinlich. Heine (LMU München) Die Pairwise-Methode 20. September 2013 9 / 16

Vorgehen 1 Daten (Baseline): Aufbereitung der Daten Entfernung von unit non respondern und Personen mit konstanten Antwortvektoren > vollständige Datenmatrix Prüfung der Modellgeltung (PCM) mit WINMIRA, {pairwise} und ALMO Bestimmung der Itemparameter als Baseline für Vergleich mit... 2 Auswertung der Datensätze mit fehlenden Werten: Bestimmung der Itemparameter bei zunehmendem Anteil fehlender Werte...... mit CML Schätzung (WINMIRA; von Davier, 2001)... mit PAIR Berechnung ({pairwise}; Heine, 2013)... mit Imputation mit SPSS und CML Schätzung (WINMIRA; von Davier, 2001)... mit MML Schätzung (ACER ConQuest; Wu, Adams, Wilson & Halda, 2012) Vergleich des Verlaufs der Abweichung der jeweiligen Punktschätzer von den Punktschätzern auf Basis des vollständigen Datensatzes Vergleich des Veränderung der Standardfehler Heine (LMU München) Die Pairwise-Methode 20. September 2013 10 / 16

Graphischer Modelltest {pairwise} pairwise: Modelltest Mediansplit; 0 % missing Sample_2 (über Median) 4 0 2 4 6 8 6 8 Sample_1 Heine (LMU München) Die Pairwise-Methode 20. September 2013 11 / 16

Abweichung CML vs {pairwise} CML vs PAIR: 0 % missing; ( n = 620 ) rote Linien: CML Parameter Schätzung mit WINMIRA grüne Linien: PAIR Parameter Berechnung mit {pairwise} Heine (LMU München) Die Pairwise-Methode 20. September 2013 12 / 16

Itemparameter Schätzung bei fehlenden Werten CML: 0 % missing; (n = 620 ; listwise) PAIR: 0 % missing; (n = 620 ) CML imputiert: 0 % missing; (n = 620 ) MML: 0 % missing; (n = 620 ) Heine (LMU München) Die Pairwise-Methode 20. September 2013 13 / 16

Itemparameter Schätzung bei fehlenden Werten CML: 5 % missing; (n = 418 ; listwise) PAIR: 5 % missing; (n = 620 ) CML imputiert: 5 % missing; (n = 620 ) MML: 5 % missing; (n = 620 ) Heine (LMU München) Die Pairwise-Methode 20. September 2013 13 / 16

Itemparameter Schätzung bei fehlenden Werten CML: 10 % missing; (n = 255 ; listwise) PAIR: 10 % missing; (n = 620 ) CML imputiert: 10 % missing; (n = 620 ) MML: 10 % missing; (n = 620 ) Heine (LMU München) Die Pairwise-Methode 20. September 2013 13 / 16

Itemparameter Schätzung bei fehlenden Werten CML: 15 % missing; (n = 176 ; listwise) PAIR: 15 % missing; (n = 620 ) CML imputiert: 15 % missing; (n = 620 ) MML: 15 % missing; (n = 620 ) Heine (LMU München) Die Pairwise-Methode 20. September 2013 13 / 16

Itemparameter Schätzung bei fehlenden Werten CML: 20 % missing; (n = 117 ; listwise) PAIR: 20 % missing; (n = 620 ) CML imputiert: 20 % missing; (n = 620 ) MML: 20 % missing; (n = 620 ) Heine (LMU München) Die Pairwise-Methode 20. September 2013 13 / 16

Itemparameter Schätzung bei fehlenden Werten CML: 25 % missing; (n = 69 ; listwise) PAIR: 25 % missing; (n = 620 ) CML imputiert: 25 % missing; (n = 620 ) MML: 25 % missing; (n = 620 ) Heine (LMU München) Die Pairwise-Methode 20. September 2013 13 / 16

Itemparameter Schätzung bei fehlenden Werten CML: 30 % missing; (n = 30 ; listwise) PAIR: 30 % missing; (n = 620 ) CML imputiert: 30 % missing; (n = 620 ) MML: 30 % missing; (n = 620 ) Heine (LMU München) Die Pairwise-Methode 20. September 2013 13 / 16

Itemparameter Schätzung bei fehlenden Werten CML: 35 % missing; (n = 19 ; listwise) PAIR: 35 % missing; (n = 620 ) CML imputiert: 35 % missing; (n = 620 ) MML: 35 % missing; (n = 620 ) Heine (LMU München) Die Pairwise-Methode 20. September 2013 13 / 16

Itemparameter Schätzung bei fehlenden Werten CML: 40 % missing; (n = 6 ; listwise) PAIR: 40 % missing; (n = 620 ) CML imputiert: 40 % missing; (n = 620 ) MML: 40 % missing; (n = 620 ) Heine (LMU München) Die Pairwise-Methode 20. September 2013 13 / 16

Range der Abweichung Itemparameter Schätzung Min / Max Abweichung Itemthresholds über jeweils 8 Items 3 2 1 0 1 2 3 grüne Linie: PAIR {pairwise} blaue Linie: CML imputiert (WinMira) rote Linie: CML (WinMira) missing_prob=0.00 missing_prob=0.1 missing_prob=0.2 missing_prob=0.3 missing_prob=0.4 Heine (LMU München) Die Pairwise-Methode 20. September 2013 14 / 16

Zusammenfassung 1 Standardfehler: Mit zunehmendem Anteil fehlender Werte...... kontinuierliche Vergößerung der Standardfehler mit CLM Schätzung... bleibt die Größe der Standardfehler mit {pairwise} und MML Schätzung stabil 2 Punktschätzer: Mit zunehmendem Anteil fehlender Werte...... werden die Abweichung von den ursprünglich geschätzten Werten bei CLM Schätzung größer... verbessert die Imputation die CLM Schätzung nur bedingt... steigen die Abweichungen von den ursprünglich berechneten Werten mit {pairwise} und MML Schätzung nicht so stark an 3 Kritik: {pairwise} Standardfehler bei wenig fehlenden Daten größer 4 Fazit für die Praxis: Itemparameterschätzung mit {pairwise} auch bei löchrigen Daten möglich > (relative) Stabilität der Punktschätzer {pairwise} als gute Alternative zu MML (komerzielles Programm ConQuest). Frage: Relevanz von größeren Standardfehlern mit {pairwise} insbesondere bei Skalenentwicklung bzw. Pretest Daten Heine (LMU München) Die Pairwise-Methode 20. September 2013 15 / 16

Literatur Andrich, D. & Luo, G. (2003). Conditional pairwise estimation in the rasch model for ordered response categories using principal components. Journal of Applied Measurement, 4 (3), 205 221. Choppin, B. (1968). Item bank using sample-free calibration. Nature, 219 (5156), 870 872. Choppin, B. (1983). a fully conditional estimation procedure for rasch model parameters (CSE Report Nr. 196). Garner, M. & Engelhard Jr, G. (2002). An eigenvector method for estimating item parameters of the dichotomous and polytomous rasch models. Journal of Applied Measurement, 1 (3), 107 128. Heine, J.-H. (2013). pairwise: Rasch model parameters by pairwise algorithm (v 0.1.4). Zugriff auf http://cran.r-project.org/web/packages/pairwise/index.html (R package version 0.1.2) Heine, J.-H., Tarnai, C. & Hartmann, F. G. (2011). Eine methode zur parameterbestimmung im rasch-modell bei fehlenden werten. Bamberg. (21.09.2011-23.09. 2011) von Davier, M. (2001). WINMIRA 2001. Groningen, The Netherlands: ASC-Assessment Systems Corporation USA and Science Plus Group. Wright, B. D. & Masters, G. N. (1982). Rating scale analysis. Chicago: MESA Press. Wu, M., Adams, R. J., Wilson, M. & Halda. (2012). ACER ConQuest: generalised item response modeling software. Melbourne: ACER. Zwinderman, A. H. (1995). Pairwise parameter estimation in rasch models. Applied Psychological Measurement, 19 (4), 369 375. Heine (LMU München) Die Pairwise-Methode 20. September 2013 16 / 16