erm: ein Open Source Paket für IRT Modelle

Ähnliche Dokumente

Partial Credit Model und Tutz Model

ε heteroskedastisch BINARY CHOICE MODELS Beispiele: Wahlentscheidung Kauf langlebiger Konsumgüter Arbeitslosigkeit Schätzung mit OLS?

Statistische Analyse von Ereigniszeiten

Lineare Modelle in R: Einweg-Varianzanalyse

Grundlagen Statistik Angewandte Statistik 3. Semester

Lösung zu Kapitel 11: Beispiel 1

Anleitung zur Installation und Verwendung von eclipseuml 2.1.0

fh management, communication & it Constantin von Craushaar fh-management, communication & it Statistik Angewandte Statistik

Übungen zur Veranstaltung Statistik 2 mit SPSS

Copyright 2014 Delta Software Technology GmbH. All Rights reserved.

SUB-ID- VERWALTUNG MIT GPP SETUP-GUIDE FÜR PUBLISHER

Software Engineering. Zur Architektur der Applikation Data Repository. Franz-Josef Elmer, Universität Basel, HS 2015

Clients in einer Windows Domäne für WSUS konfigurieren

Das Rasch-Modell und seine zentralen Eigenschaften

Agile Vorgehensmodelle in der Softwareentwicklung: Scrum

GS-Buchhalter/GS-Office 2015 Saldovorträge in folgenden Wirtschaftsjahren erfassen

1.3 Die Beurteilung von Testleistungen

Name (in Druckbuchstaben): Matrikelnummer: Unterschrift:

Professionelle Seminare im Bereich MS-Office

Code wiederverwenden: Objektorientierte Programmierung (OOP) sinnvoll nutzen Roland Wagner Automatisierungstreff IT & Automation 2015

Stellvertretenden Genehmiger verwalten. Tipps & Tricks

Analog zu Aufgabe 16.1 werden die Daten durch folgenden Befehl eingelesen: > kredit<-read.table("c:\\compaufg\\kredit.

Eine Bürokratiekostenfolgenabschätzung zum zweiten Gesetz für moderne Dienstleistungen am Arbeitsmarkt im Hinblick auf die Einführung einer Gleitzone

FIS: Projektdaten auf den Internetseiten ausgeben

Übungen zur Softwaretechnik

Abschnitt 16: Objektorientiertes Design

Einführung in wxwidgets & wxdev-c++

Musterlösung zu Serie 14

Klausur zur Vorlesung Multivariate Verfahren, SS Kreditpunkte, 90 min

SJ OFFICE - Update 3.0

Metadaten bei der Digitalisierung von analogen archivalischen Quellen. Kathrin Mileta, Dr. Martina Wiech

Umgang mit und Ersetzen von fehlenden Werten bei multivariaten Analysen

Sehr geehrte Faktor-IPS Anwender,

OpenVPN unter Linux mit KVpnc Stand: 16. Mai 2013

Oracle. 1. Software-Download 2. Lifetime-Support

FreieSoftwareOG. Creative Commons und freie Lizenzen- Ein kurzer Überblick

crm-now/ps Webforms Webdesigner Handbuch Erste Ausgabe

Bachelorabschlussseminar Dipl.-Kfm. Daniel Cracau

Was ist EMF? Wie wird EMF eingesetzt? Was ist ecore? Das Generatormodell Fazit

Eclipse Plugins für die komfortablere Verwendung von ibatis SQLMaps

Auswerten mit Excel. Viele Video-Tutorials auf Youtube z.b.

Folgende Voraussetzungen für die Konfiguration müssen erfüllt sein:

Client-Server-Beziehungen

Log-lineare Analyse I

2. ERSTELLEN VON APPS MIT DEM ADT PLUGIN VON ECLIPSE

Gemischte Modelle. Fabian Scheipl, Sonja Greven. SoSe Institut für Statistik Ludwig-Maximilians-Universität München

GS-Programme 2015 Allgemeines Zentralupdate

Aufgaben zur Flächenberechnung mit der Integralrechung

Übersicht: Modul 2. Methoden der empirischen Sozialforschung, Statistik und computergestützte Datenanalyse. Dr. H.-G. Sonnenberg

Eclipse Equinox als Basis für Smart Client Anwendungen. Christian Campo, compeople AG, Java Forum Stuttgart 2007

Autorisierung von ArcGIS 10.3 for Server mit Internetverbindung

Agile Software Verteilung

InfoPoint vom 9. November 2011

Inhalt... 1 Einleitung... 1 Systemanforderungen... 1 Software Download... 1 Prüfdokumentation... 4 Probleme... 5 Hintergrund... 5

AUTOMATISCHE -ARCHIVIERUNG. 10/07/28 BMD Systemhaus GmbH, Steyr Vervielfältigung bedarf der ausdrücklichen Genehmigung durch BMD!

Migrationspfad zu BES 10 (1)

SQL Server 2008 Standard und Workgroup Edition

Programmiersprachen 2 (SS 2013)

Kapitel 4: Binäre Regression

ANLEITUNG SPSS 23 INSTALLATION - WINDOWS

Statistische Datenanalyse mit SPSS

Angewandte Ökonometrie, WS 2012/13, 1. Teilprüfung am Lösungen. Das folgende Modell ist ein GARCH(1,1)-Modell:

SMS-Tool. Seite 1 von 8

Installationsanleitung für. SugarCRM Open Source. Windows Einzelplatz

90-minütige Klausur Statistik für Studierende der Kommunikationswissenschaft

RDS Consulting. Support Handbuch. Version 1.0

Installation & Konfiguration AddOn CopyObjects

4D Server v12 64-bit Version BETA VERSION

SCHULUNG MIT SYSTEM: E-LEARNING VON RAUM21

Stellen Sie bitte den Cursor in die Spalte B2 und rufen die Funktion Sverweis auf. Es öffnet sich folgendes Dialogfenster

Auswertung Kundenbefragung Essen auf Räder

Dokumentation. Black- und Whitelists. Absenderadressen auf eine Blacklist oder eine Whitelist setzen. Zugriff per Webbrowser

Halten Sie Ihre Kunden auf dem Laufenden. software hardware organisation beratung

SharePoint Demonstration

OSEK-OS. Oliver Botschkowski. PG AutoLab Seminarwochenende Oktober AutoLab

Backup-Server einrichten

IBM Software Demos Tivoli Provisioning Manager for OS Deployment

Korrelation (II) Korrelation und Kausalität

LINGO: Eine kleine Einführung

Was ist pcon.update? Girsberger Manual Registrierung pcon.update Service - Marketing Edition Sep Seite 1

Häufigkeitstabellen. Balken- oder Kreisdiagramme. kritischer Wert für χ2-test. Kontingenztafeln

Die Installation von D-Link WLAN Karten unter Windows Vista

Berechnung von Strukturgleichungsmodellen mit Amos. Im folgenden kurze Einführung: Arbeiten mit Amos Graphics

Was ist Open Source Software und wem gehört sie?

Institut für Computational Engineering ICE. N ä h e r d ra n a m S ys t e m d e r Te c h n i k d e r Z u ku n f t. w w w. n t b.

Industrie 4.0 in Deutschland

Diese Ansicht erhalten Sie nach der erfolgreichen Anmeldung bei Wordpress.

PC-Kaufmann 2014 Neues Buchungsjahr anlegen

How to do? Projekte - Zeiterfassung

Einfach wie noch nie. Der mypackage-ansatz. Ihre Lösung zur automatisierten Client-Bereitstellung. mypackage im Überblick

Grundlagen der Datenanalyse am Beispiel von SPSS

arlanis Software AG SOA Architektonische und technische Grundlagen Andreas Holubek

Version 0.3. Installation von MinGW und Eclipse CDT

Die Downloadarea ist nur noch bedingt mit den bestehenden Dingen befüllt, wird aber nicht mehr aktualisiert.

objectif Import von Excel-Daten Bei Fragen nutzen Sie bitte unseren Support: Telefon: +49 (30)

RT Request Tracker. Benutzerhandbuch V2.0. Inhalte

Verwendung von LS-OPT zur Generierung von Materialkarten am Beispiel von Schaumwerkstoffen

Inhalt. 1 Einleitung AUTOMATISCHE DATENSICHERUNG AUF EINEN CLOUDSPEICHER

Kurs 9.3: Forschungsmethoden II

Transkript:

erm: ein Open Source Paket für IRT Modelle Reinhold Hatzinger Department für Statistik und Mathematik Wirtschaftsuniversität Wien

Was ist erm? erm steht für extended Rasch modelling ist ein R package ist open source: keine Lizenzgebühren, Quellcode verfügbar, Änderungen und Weitergabe erlaubt (GPL Lizenz) aktuell implementierte Modelle: LPCM, PCM, LRSM, RSM, LLTM, RM, (LLRA) verwendet CML Schätzmethode

Was ist R? eine general-purpose Umgebung zur Datenanalyse und Erzeugung von Graken. R ist open source Implementierung der Sprache S ist lingua franca im Bereich der computational statistics zunehmend Verbreitung nicht nur in der akademischen Welt: von groÿen Konzernen bis zur Verwendung in Schulen objektorientiert ('everything in S is an object') Struktur: neues objekt <- funktion(objekt, optionen) User sind `ProgrammiererInnen'

Rasch Modellfür (dichotome Items) P (X vi = 1 θ v, β i ) = exp(θ v β i ) 1 + exp(θ v β i ) X vi... Person v löst Aufgabe i θ v... `Fähigkeit' der Person v β i... `Schwierigkeit' des Items i I 1 I 2 I 3 I 4 r v P 1 1 0 0 0 1 P 2 1 0 1 0 2 P 3 1 1 0 0 2 P 4 0 1 1 1 3 s i 3 2 2 1 i x vi = r v v x vi = s i

Itemcharakteristik (ICC) ICC plot for item I3 Probability to Solve 0.0 0.2 0.4 0.6 0.8 1.0 4 2 0 2 4 Latent Dimension

Rasch Modell Eigenschaften Eindimensionalität P (X vi = 1 θ v, β i, ϕ) = P (X vi = 1 θ v, β i ) Lösungswahrscheinlichkeit hängt nicht von anderen Variablen ab Suzienz i x vi = r v f(x vi,..., x vk θ v ) = g(r v θ v )h(x vi,..., x vk ) in Summe der Antworten ist gesamte Information über Fähigleit, unabhängig welche Items gelöst wurden bedingte Unabängigkeit X vi X vj θ v bei xem θ keine Korrelation zwischen zwei Items Monotonizität mit zunehmender Fähigkeit steigt Lösungswahrscheinlichkeit

Parameterschätzung im Rasch Modell Joint Maximum Likelihood (JML) L u = exp( v θ v r v ) exp( i β i s i ) v i(1 + exp(θ v β i )) Conditional Maximum Likelihood (CML) (bedingen auf r v ) L c = exp( β i s i )/ exp( i r x r i x i β i ) n r Marginal Maximum Likelihood (MML) (Verteilung für θ) L m = exp( n r exp(θr) β i s i )) ki=1 r i (1 + exp(θ β i )) dg(θ)

polytome Erweiterungen Partial Credit Modell (PCM) P (X vi = h) = exp[h(θ v + β i ) + ω hi ] m i l=0 exp[l(θ v + β i ) + ω li ] h... Responsekategorien (h = 0,..., m i ) ω hi... Kategorienparameter Rating Scale Modell (RSM) m i = m... alle Items haben gleich viele Kategorien ω hi = ω h... `equistant scoring'

ICC für ein polytomes Item ICC plot for item I2 Probability to Solve 0.0 0.2 0.4 0.6 0.8 1.0 Category 0 Category 1 Category 2 Category 3 4 2 0 2 4 Latent Dimension

erm Basics Kern ist das lineare partial credit model: wobei P (X vi = h) = exp(hθ v + β ih ) m i l=0 exp(lθ v + β ih ) β ih = m p w ih,p η p je nach Spezikation der Designmatrix W = (w ih,p ) lassen sich verschiedene Modelle schätzen aktuell implementierte Modelle: LPCM, PCM, LRSM, RSM, LLTM, RM, (LLRA)

Modellhierarchie LPCM PCM LRSM RSM LLTM RM

Was kann erm? Modelle: RM, RSM, PCM, LLTM, LRSM, LPCM, (LLRA) automatisierte Behandlung von missing values(mcar) verschiedene Constraints Design Matrix (automatisiert/benutzerdeniert) Parameterschätzung: Itemparameter, Basis- bzw. Eektparameter, Thresholdparameter mittels CML Personenparameter (JML) für alle: Varianz-Kovarianzmatrizen (Kondenzintervalle)

Was kann erm? Diagnostik, Modelltests und Fitstatistiken: Andersen LR-test, Wald Test auf Item Basis Itemt, Persont (über standardisierte Residuen) Informationskriterien (AIC, BIC, caic) Prüfung auf Schätzbarkeit (`well-conditioned datamatrix') für RM Plots: Goodness-of-t Plots ICC-Plots fur einzelne Items (optional mit empirischen ICC's) gemeinsame Plots für RM (alle Items oder Subsets von Items in einem Plot)

Rasch Modell > rm.res <- RM(rdat) > rm.res Results of RM estimation: Call: RM(X = rdat) Conditional log-likelihood: -95.48076 Number of iterations: 8 Number of parameters: 3 Basic Parameters eta: eta 1 eta 2 eta 3 Estimate 1.0921364-0.3970642-1.0152016 Std.Err 0.2147963 0.2027998 0.2204647

> summary(rm.res) Results of RM estimation: Call: RM(X = rdat) Conditional log-likelihood: -95.48076 Number of iterations: 8 Number of parameters: 3 Basic Parameters (eta) with 0.95 CI: Estimate Std. Error lower CI upper CI eta 1 1.092 0.215 0.671 1.513 eta 2-0.397 0.203-0.795 0.000 eta 3-1.015 0.220-1.447-0.583 Item Parameters (beta) with 0.95 CI: Estimate Std. Error lower CI upper CI beta I1 0.320 0.199-0.070 0.710 beta I2 1.092 0.215 0.671 1.513 beta I3-0.397 0.203-0.795 0.000 beta I4-1.015 0.220-1.447-0.583

Modelltests: > rm.lr <- LRtest(rm.res, splitcr = "mean") > rm.lr Andersen LR-test: LR-value: 2.216 Chi-square df: 3 p-value: 0.529 > Waldtest(rm.res) Wald test on item level (z-values): z-statistic p-value beta I1-0.533 0.594 beta I2-0.280 0.780 beta I3 0.652 0.515 beta I4 0.511 0.610

> plotgof(rm.lr) Graphical Model Check Beta Group 2 3 2 1 0 1 2 3 I4 I3 I1 I2 3 2 1 0 1 2 3 Beta Group 1

Rating Scale Modell > rsm.res <- RSM(rsmdat) > rsm.res Results of RSM estimation: Call: RSM(X = rsmdat) Conditional log-likelihood: -107.5618 Number of iterations: 11 Number of parameters: 7 Basic Parameters eta: eta 1 eta 2 eta 3 eta 4 eta 5 eta 6 Estimate -0.3051523-0.2558638-0.06730786 0.1601342 0.4442440 0.1673936 Std.Err 0.2053696 0.2028161 0.19650733 0.1965178 0.2084872 0.4596570 eta 7 Estimate -0.1379066 Std.Err 0.7324954

> ploticc(rsm.res, item.subset = 1) ICC plot for item I1 Probability to Solve 0.0 0.2 0.4 0.6 0.8 1.0 Category 0 Category 1 Category 2 Category 3 4 2 0 2 4 Latent Dimension

Thresholds: > thresholds(rsm.res) Design Matrix Block 1: Location Threshold 1 Threshold 2 Threshold 3 I1 0.02202-0.02395-0.19134 0.28135 I2 0.35112 0.30515 0.13776 0.61045 I3 0.30183 0.25586 0.08847 0.56116 I4 0.11328 0.06731-0.10009 0.37261 I5-0.11417-0.16013-0.32753 0.14517 I6-0.39828-0.44424-0.61164-0.13894

Partial Credit Modell: Veränderungsmessung Setting über Designmatrix zu spezizieren oder automatische Generierung von Standard-Designmatrizen Zeitpunkte (mpoints) Treatmentgruppen (groupvec - Spalte in Datenle) Beispiel: 3 Items (0-3) - 2 Zeitpunkte - Treatment-/Kontrollgruppe Pseudodesign: Items Trend Treatment KG t 1 1 t 2 1 1 TG t 1 1 t 2 1 1 1

> lpcm.res <- LPCM(lpcmdat, mpoints = 2, groupvec = G) > lpcm.res Results of LPCM estimation: Call: LPCM(X = lpcmdat, mpoints = 2, groupvec = G) Conditional log-likelihood: -103.7225 Number of iterations: 28 Number of parameters: 10 Basic Parameters eta: eta 1 eta 2 eta 3 eta 4 eta 5 eta 6 Estimate 0.4121568-0.2989829-0.1345081 0.03489371-0.4288746-0.2864050 Std.Err 0.3965853 0.4942288 0.4091779 0.39432809 0.4784496 0.4488165 eta 7 eta 8 eta 9 eta 10 Estimate 0.1641184 0.1007373-0.2014872 1.0940382 Std.Err 0.3992023 0.4351064 0.2608237 0.3870406

Weiterverabeitung der Ergebnisse in R Varianzanalyse für Personenparameter nach 3 Altersgruppen: > data(raschdat1) > res <- RM(raschdat1) > pres <- person.parameter(res) > pp <- pres$thetapar$nagroup1 > summary(aov(pp ~ age)) Df Sum Sq Mean Sq F value Pr(>F) age 2 94.236 47.118 163.74 < 2.2e-16 Residuals 97 27.914 0.288

Weiterverabeitung der Ergebnisse in R Alternative Grak für Thresholds: > tp <- thresholds(rsm.res)$threshpar > tpm <- matrix(tp, nc = 3, byrow = TRUE) > plot(c(min(tpm), max(tpm)), c(0.5, 6.5), type = "n", xlab = "Latent Dimension", + ylab = "Items") > for (i in 1:6) lines(tpm[i, ], rep(i, 3)) > for (i in 1:6) points(tpm[i, ], rep(i, 3)) > label <- paste("item", 1:6, sep = "") > text(tpm[, 3], 1:6, label, pos = 3)

Items 1 2 3 4 5 6 ITEM6 ITEM5 ITEM1 ITEM4 ITEM3 ITEM2 0.6 0.4 0.2 0.0 0.2 0.4 0.6 Latent Dimension

Wiederverwenden der Ergebnisse > rm.res <- RM(rdat) > save(rm.res, "rm.res.rdata") später: > load("rm.res") Inhalt: > names(rm.res) [1] "X" "X01" "model" "loglik" "npar" [6] "iter" "convergence" "etapar" "se.eta" "hessian" [11] "betapar" "se.beta" "W" "call" dann z.b. > colsums(rm.res$x/nrow(rm.res$x)) I1 I2 I3 I4 0.47 0.62 0.33 0.22

Wie wird erm-0.9-xx aussehen? aktuelle Version: erm-0.9-5 `exakte' Modelltests, Martin-Löf, Glas-Verhelst (für das RM) LLRA `wrapper' (benutzerfreundliche Funktion) Mixed Rasch Modell OPLM (Verhelst & Glas)...

Weitere Informationen zu R: R Projekt Homepage: http://www.r-project.org/ Comprehensive R Archive Network: http://cran.r-project.org/ R und Packages download Links zu Dokumentationen Diskussions- und Hilfe Foren Task Views z.b. Psychometric Models and Methods R Wiki http://wiki.r-project.org/ Dokumentationen, Foren, Tipps, Beispiele sehr hilfreich für Einsteiger!

Weitere Informationen zu erm: R Forge: http://r-forge.r-project.org/ Entwicklungsplattform download der jeweils neuesten Versionen Diskussions- und Hilfe-Foren Projekthomepage http://erm.r-forge.r-project.org/ Manuals: im Entstehen bzw. in Planung H. Poinstingl (Psychologische Diagnostik, Uni Wien) R. Alexandrowics (Inst.f.Psychologie, Uni Klagenfurt) Publikationen: Mair, P., and Hatzinger, R. (2007). J. Statistical Software Mair, P., and Hatzinger, R. (2007). Psychology Science