Item-Response-Theorie Probabilistische Testtheorie. Christian Stroppel



Ähnliche Dokumente
Überblick über die ProbabilistischeTesttheorie

Was ist eine Testtheorie? Grundlagen der Item-Response. Response-Theorie. Modelle mit latenten Variablen

Vorlesung Testtheorien. Dr. Tobias Constantin Haupt, MBA Sommersemester 2007

Personenparameter + Itemparameter

Das Rasch-Modell und seine zentralen Eigenschaften

Einführung in die Theorie psychologischer Tests

2.4 Indexbildung und Einblick in Skalierungsverfahren

Testtheorie und Testkonstruktion

Klausuraufgaben für Probeklausur. 1.Die Zuverlässigkeit von Kodierern in der Inhaltsanalyse kann man berechnen.

Das Rasch-Modell. Emil Fazli. 17. Juni Betreuer: Dr. Marco Cattaneo

Lehrbuch Testtheorie - Testkonstruktion

Klassische Testtheorie (KTT)

Psychometrie. Lena Straub

Kenngrößen von Zufallsvariablen

Item Response Theorie für binäre Daten

Seminar: Statistische Modellierung latenter Strukturen in den Lebens-, Sozial- und Wirtschaftswissenschaften. Institut für Statistik, LMU München

Partial Credit Model und Tutz Model

Testtheorie und Testkonstruktion

RASCH-SKALIERUNG

Inhaltsverzeichnis. Vorwort zur 3. Auflage 11

Vorlesung Testtheorien. Dr. Tobias Constantin Haupt, MBA Sommersemester 2007

Das Partial Credit Modell

Einführung in die Test- und Fragebogenkonstruktion

Veränderungsmessung mit dem Linear Logistic Test Model

Was heißt messen? Konzeptspezifikation Operationalisierung Qualität der Messung

Statistik mit MATHCAD und MATLAB

Anwendung probabilistisch-testtheoretischer Modelle auf Statistikklausuren des Grundstudiums

SOZIALWISSENSCHAFTLICHE FORSCHUNGSMETHODEN

Statistik für Bachelorund Masterstudenten

Skript zur Vorlesung Theorien psychometrischer Tests II WS 2009/2010

4.2 Grundlagen der Testtheorie. Wintersemester 2008 / 2009 Hochschule Magdeburg-Stendal (FH) Frau Prof. Dr. Gabriele Helga Franke

Bedeutung des Rasch-Modells für die Entwicklung psychologischer Tests

5.1. Die Itemcharakteristik als zentrales Konzept probabilistischer Testmodelle

Bildungsurlaub-Seminare: Lerninhalte und Programm

Vorlesung Testtheorien. Dr. Tobias Constantin Haupt, MBA Sommersemester 2007

Teil 2 Entwicklung einer Bilderskala zur Messung markenrelevanter Emotionen

Was ist eine Testtheorie?

Theorie Parameterschätzung Ausblick. Schätzung. Raimar Sandner. Studentenseminar "Statistische Methoden in der Physik"

Inhaltsverzeichnis. Vorwort zur 3. Auflage 11. Kapitel 1 Einführung 13. Kapitel 2 Testtheoretische Grundlagen 29

IRT-Skalierung. mit ConQuest. Workshop für das Nachwuchsnetzwerk Deutschdidaktik. Dipl.-Psych. Nina Jude. Hamburg, 23.

Ein SAS-Modul zur Konstruktion psychologischer Tests nach dem Rasch-Modell

2.5 Skalierungsverfahren

PISA-Studie. Ausgewählte Aspekte der Wirtschafts- und Sozialstatistik. Jenny Steindl. LMU München, Institut für Statistik

Einführung in die Test- und Fragebogenkonstruktion

Hypothesentests mit SPSS. Beispiel für eine einfaktorielle Varianzanalyse Daten: museum_m_v05.sav

Grundlagen der Testkonstruktion

Statistische Grundlagen I

1 Wahrscheinlichkeitsrechnung. 2 Zufallsvariablen und ihre Verteilung. 3 Statistische Inferenz. 4 Intervallschätzung. 5 Hypothesentests.

10. Vorlesung. Grundlagen in Statistik. Seite 291. Martin-Luther-Universität Halle/Wittenberg

Inferenzstatistik (=schließende Statistik)

Dr. Matthias Rudolf: M3 Multivariate Statistik Vorlesung LogRA. Folie Nr. 1

Uwe Hassler. Statistik im. Bachelor-Studium. Eine Einführung. für Wirtschaftswissenschaftler. ^ Springer Gabler

Mathematische und statistische Methoden I

Elementare Stochastik

VU Testtheorie und Testkonstruktion WS 08/09; Lengenfelder, Fritz, Moser, Kogler

Klassische Testtheorie (KTT) Klassische Testtheorie (KTT) Klassische Testtheorie (KTT)

Seminar: Psychometrische Modelle: Theorie und Anwendungen. Institut für Statistik, LMU München

3. Die Item Response Theorie

Carolin Strobl: Das Rasch-Modell. Eine verständliche Einführung für Studium und Praxis

Philipp Sibbertsen Hartmut Lehne. Statistik. Einführung für Wirtschafts- und. Sozialwissenschaftler. 2., überarbeitete Auflage. 4^ Springer Gabler

Versuchsplanung. Teil 2 Varianzanalyse (ANOVA) Dr. Tobias Kiesling

3.2 Grundlagen der Testtheorie Methoden der Reliabilitätsbestimmung

Elementare Stochastik

Inhalt. I Einführung. Kapitel 1 Konzept des Buches Kapitel 2 Messen in der Psychologie... 27

GDCP Methodenworkshop 2014

Konfirmatorische Faktorenanalyse. Regressionsmodelle für Politikwissenschaftler

STATISTISCHE METHODEN UND IHRE ANWENDUNGEN

Vorlesung: Statistik II für Wirtschaftswissenschaft

Eine Beschwerdenliste mit den wichtigsten, in der Literatur mit elektromagnetischen Feldern in Verbindung gebrachten Befindlichkeitsstörungen

Qualitätssicherung tssicherung und Bildungsstandards im evangelischen Religionsunterricht

Grundkurs Statistik für Politologen und Soziologen

1 Inhaltsverzeichnis. 1 Einführung...1

1 Grundlagen der Wahrscheinlichkeitsrechnung Wahrscheinlichkeitsräume. Ein erster mathematischer Blick auf Zufallsexperimente...

Die Korrelation von Merkmalen

erm: ein Open Source Paket für IRT Modelle

Deskriptive Statistik

Concept-Map. Pospeschill / Spinath: Psychologische Diagnostik 2009 by Ernst Reinhardt Verlag, GmbH und Co KG, Verlag, München

Die Pairwise-Methode zur Parameterschätzung im ordinalen Rasch-Modell

Verallgemeinerungen der Rasch-Modells

Das Rasch-Modell: Modellprüfung & Informationskriterien. Vortrag von Manuela Gärtner, Jörg-Henrik Heine und Sarah Hofer

Einführung in die Test- und Fragebogenkonstruktion

SPSS-Beispiel zum Kapitel 4: Deskriptivstatistische Evaluation von Items (Itemanalyse) und Testwertverteilungen

Biostatistik Erne Einfuhrung fur Biowissenschaftler

Standardisierte Vorgehensweisen und Regeln zur Gewährleistung von: Eindeutigkeit Schlussfolgerungen aus empirischen Befunden sind nur dann zwingend

Auswahl von Testaufgaben

Stochastik in den Ingenieu rwissenschaften

Statistik. Jan Müller

Reliabilitäts- und Itemanalyse

Statistik für NichtStatistiker

Von der Normalverteilung zu z-werten und Konfidenzintervallen

Signifikanztests zur Prüfung von Unterschieden in der zentralen Tendenz -Teil 1-

Wahrscheinlichkeitsrechnung mathematische Statistik und statistische Qualitätskontrolle

SozialwissenschaftlerInnen II

Forschungsmethoden in der Sozialen Arbeit

STATISTIK FÜR STATISTIK-AGNOSTIKER Teil 1 (wie mich)

TEIL 7: EINFÜHRUNG UNIVARIATE ANALYSE TABELLARISCHE DARSTELLUNG / AUSWERTUNG

limhatewerzeoelhiniii

GLIEDERUNG Das Messen eine Umschreibung Skalenniveaus von Variablen Drei Gütekriterien von Messungen Konstruierte Skalen in den Sozialwissenschaften

Transkript:

Item-Response-Theorie Probabilistische Testtheorie Referat von: Christian Stroppel

Testtheorie Personenparameter Latente Variable ξ Testtheorie Manifeste Variable Xvi Eine Testtheorie beschreibt in welchem Zusammenhang das zu testende Merkmal mit den im Test tatsächlich beobachtbaren Antworten steht. Antwort

Testtheorien unterteilt in Item-Response-Theorie Propabilistische Testtheorie Klassische Testtheorie Vorteile Vorteile Skalendignität: Intervallskala Stichprobenunabhängigkeit der Paramaterschätzung Homogenität der Skala Überprüfbar durch Lokale stochastische Unabhängigkeit Weniger aufwendig (ökonomisch) führt zu ähnlichem Ergebnis wie IRT

wird unterteilt in Modelle der IRT wird unterteilt in Latent-Trait-Modelle Latent-Class- Modelle Mixed-Rasch- Modelle Linear-logistische- Modelle Antwortformat: dichotom polytom wird unterteilt in Deterministische Modelle z. B. Propabilistische Modelle wird unterteilt in wird unterteilt in Linear-logistisches- Test-mModell Guttman- Skala Rasch-Modell (1PL) Birnbaum-Modell (2PL) (3PL) Polytomes Rasch-Modell Ratingskalenmodell von Andrich Intervallskalierter Personenparameter (ξ) oder (θ) Nominaler Personenparameter 1 Itemschwierigkeit (σ) Itemdiskriminanzparameter λ i oder α Intervallskala innerhalb der Klassen 0 0 0 Ratewahrscheinlichkeit c klassen- spezifische Itemcharakteristiken Schwierigkeits- parameter als Linearkombination Logistische Funktion ist in der IRT eine Itemcharacteristic-Curve(ICC) ist die Darstellung einer Itemcharakteristische Funktion ordnet t y(achse) Antwort-W Wahrscheinlichkeit zu zu (x-achse) joint scale d aus: bestehen Personenparameter (ξ) oder (θ) minus Itemschwierigkeit (σ)

Verbundwahrscheilichkeit Bedingtee Wahrscheinlichkeit p(antwort=ja Schw-Pers=x) y(achse) Antwort-Wahrscheinlichkeit bestehend aus: Logistische Funktion hat die Achsenbezeichnungen ist in der IRT eine Itemcharacteristic-Curve(ICC) ist die Darstellung einer Itemcharakteristische Funktion (x-achse) joint scale Personenparameter (ξ) oder (θ) minus Itemschwierigkeit (σ) ist eine latente Variable

Verfälschungstendenz Modellannahmen überprüft Manifeste Antworten (Xvi) eine bilden erschöpfende (suffiziente) i Statistik ist Vorraus- setzung für eine Rasch-Homogenitiät überprüft üft durch Person-fit-indices indices am Besten auf Basis einer Likelihood- Funktion Spezifische Objektivität der Vergleiche von Skala und Items überprüft durch Personenparameter (ξ) oder (θ) Itemschwierigkeit (σ) t über bestimmt für die Parameterschätzung erfolgt über die Conditional Maximum-Likelihood-Methode ist Lokale stochastische Unabhängigkeit Stichprobenunabhängigkeit der Kennwerte führt falls inhaltlich Homogen wird überprüft durch einen unkorreliertheit der Messfehler bei konstantem Personenparameter Graphischer Modelltest Likelodhood- Quotenten-Test ist ein iteratives Verfahren zur Maximierung Likelihoodfunktion

Spezifische Objektivität der Vergleiche von Skala und Items Iteminformationsfunktion Lösungswahrscheinlichkeit multipliziert mit AID ermöglicht ist ein Maß für Diskriminationsleistung Nichtlösungswahrscheinlichkeit branched testing unterteil in Adaptives Testen Trotz wenigen Aufgaben hohe für alle Items auf summiert gibt die Testgesamtinformation tailored testing verbessert bestimmt die Breite des FAKT Testökonomie Konfidenzintervall

Rasch-Homogenität Die ICCs verlaufen entsprechend dem Schätzmodell (z.b. 1PL-, 2PL oder 3PL- Modell)

Spezifische Objektivität von Skala und Items Wenn ein zwei Probanden 10 Items beantworten X hat 5 richtig (Rangplatz 1) Y hat 3 richtig (Rangplatz 2) Dann sollten sich auch bei der Beantwortung von anderen Items die Rangplätze nicht tauschen. Item die einen Rangplatztausch zuließen würden eleminiert. Fisseni, 1990, S.139

Lokale stochastische Unabhängigkeit Wenn alle Items ausschließlich Indikatoren der latenten Variable sind, so sollten die Korrelationen zwischen den Items verschwinden, wenn die latente Variable auf einer Stufe konstant gehalten wird.

Lokale stochastische Unabhängigkeit it r=0 (Unkorreliert falls nur Probandem mit gleichem Personenparameter) r=1 Item B ja Item B nein Item A Item A Item A Item A ja nein ja nein 5 5 10 5 5 10 Item B ja Item B nein 14 0 14 0 6 6 10 10 20 14 6 20 Item A ja Item A nein Item B ja 0 6 6 p AB (5/20)=p A (10/20)*p B (10/20) Item B 14 0 14 nein 14 6 20 p AB (¼)=p A (½) * p B (½) r=-1 Multiplukationstheorem für unabhängige Ereignisse Korrelation

Stichprobenunabhängigkeit der Parameterschätzung Amelang & Schmidt-Atzert, 2006, S.77 Man konstruiert den Fragebogen anhand zweier Stichproben zum Beispiel Deutschland und Österreich und kontrolliert ob die Itemparameter gleich ausfallen, was bei Stichprobenunabhängigkeit der Konstruktion so sein müsste.

Deterministisches Modell Frage: Sind die schwerer als 80 kg? p(ja) 1 Itemcharakteristische Kurve (ICC) Eine Person mit 60 kg antwortet ganz sicher P(ja)=0 mit nein Eine Person mit 120 kg antwortet ganz sicher P(ja)=1 mit ja 0 60 80 100 120 140 kg (Propabilistisches mit unendlicher Steigung)

Rasch-Modell

1PL-Rasch-Modell

2-PL-(Birnbaum)-Modell

3-PL-Raschmodell

Polytome Latent-Trait-Modelle 1 p(x=0) p(x=3) 05 0,5 p(x=1) p(x=2) 0-5 -3-1 1 3 5 (Personenparameter)

Latent-Class-Modelle p(ja) 1 2 3 4 (Personenparameter)

Downloads Exceltabellen mit logistischen Funktionen http://www.geocities.com/c.stroppel/irt.xls pp