Rekodierung invertierter Items

Ähnliche Dokumente
4.2 Grundlagen der Testtheorie. Wintersemester 2008 / 2009 Hochschule Magdeburg-Stendal (FH) Frau Prof. Dr. Gabriele Helga Franke

VU Testtheorie und Testkonstruktion WS 08/09; Lengenfelder, Fritz, Moser, Kogler

4.2 Grundlagen der Testtheorie. Wintersemester 2008 / 2009 Hochschule Magdeburg-Stendal (FH) Frau Prof. Dr. Gabriele Helga Franke

3. KTT und PTT KTT allgemein Axiome & Annahmen der KTT Kritik an der KTT

Kreisdiagramm, Tortendiagramm

Wiederholung - Vertiefung Testkonstruktion

3. Deskriptive Statistik

Befehl: Analysieren > Deskriptive Statistiken > Häufigkeiten. Unter: Statistiken: Angabe Kurtosis/ Schiefe/ andere Lagemasse

Was heißt messen? Konzeptspezifikation Operationalisierung Qualität der Messung

Einführung in die Test- und Fragebogenkonstruktion

Reliabilitäts- und Itemanalyse

3.2 Grundlagen der Testtheorie Methoden der Reliabilitätsbestimmung

Empirische Verteilungsfunktion

grundsätzlich: der Fehler ist reiner Zufallsfehler, korreliert mit nichts - ist statistisch berechenbar

Statistik II: Grundlagen und Definitionen der Statistik

Auswahl von Testaufgaben

Statistik. Jan Müller

TESTTHEORIE UND TESTKONSTRUKTION - PRAKTISCHE ANWENDUNG - TEIL 3

Übung 4 im Fach "Biometrie / Q1"

Messen im psychologischen Kontext I. Testentwicklung, Entwicklung von Items, Trennschärfeanalyse und Normierung

Standardisierte Vorgehensweisen und Regeln zur Gewährleistung von: Eindeutigkeit Schlussfolgerungen aus empirischen Befunden sind nur dann zwingend

Deskription, Statistische Testverfahren und Regression. Seminar: Planung und Auswertung klinischer und experimenteller Studien

RETESTRELIABILITÄT. Teststabilität. Korrelation wiederholter Testdurchführungen. Persönlichkeitstests. Stabilität des Zielmerkmals.

Zweifache Varianzanalyse

Was ist eine Testtheorie? Grundlagen der Item-Response. Response-Theorie. Modelle mit latenten Variablen

Mathematische und statistische Methoden II

Einführung in die Statistik Testgütekriterien

Faktorenanalysen mit SPSS. Explorative Faktorenanalyse als Instrument der Dimensionsreduktion. Interpretation des SPSS-Output s

Faktorenanalysen mit SPSS. Explorative Faktorenanalyse als Instrument der Dimensionsreduzierung. Interpretation des SPSS-Output s

Inhaltsverzeichnis. Vorwort zur 3. Auflage 11

5. Lektion: Einfache Signifikanztests

Tutorium Testtheorie. Termin 3. Inhalt: WH: Hauptgütekriterien- Reliabilität & Validität. Charlotte Gagern

= = =0,2=20% 25 Plätze Zufallsübereinstimmung: 0.80 x x 0.20 = %

Einführung in die Statistik für Politikwissenschaftler Sommersemester 2011

Informationen zur KLAUSUR am

SPSS-Beispiel zum Kapitel 4: Deskriptivstatistische Evaluation von Items (Itemanalyse) und Testwertverteilungen

Personenparameter + Itemparameter

Objektivität und Validität. Testgütekriterien. Objektivität. Validität. Reliabilität. Objektivität

Häufigkeitsauszählungen, zentrale statistische Kennwerte und Mittelwertvergleiche

TESTTHEORIE UND TESTKONSTRUKTION - PRAKTISCHE ANWENDUNG - TEIL 1

Methodenlehre. Vorlesung 12. Prof. Dr. Björn Rasch, Cognitive Biopsychology and Methods University of Fribourg

Der Barthel-Index zur Messung von Alltagskompetenzen bei Demenz

Inhaltsverzeichnis. 1 Über dieses Buch Zum Inhalt dieses Buches Danksagung Zur Relevanz der Statistik...

Übersicht Klassische Testtheorie (KTT) Axiomatik der klassischen Testtheorie

Datenstrukturen. Querschnitt. Grösche: Empirische Wirtschaftsforschung

Das Rasch-Modell und seine zentralen Eigenschaften

Statistik und Wahrscheinlichkeitsrechnung

Anteile Häufigkeiten Verteilungen Lagemaße Streuungsmaße Merkmale von Verteilungen. Anteile Häufigkeiten Verteilungen

Testen von Unterschiedshypothesen mit parametrischen Verfahren Der t-test

Einführung in Quantitative Methoden

1 Einleitung und Grundlagen 1

0 Einführung: Was ist Statistik

Eigene MC-Fragen SPSS. 1. Zutreffend auf die Datenerfassung und Datenaufbereitung in SPSS ist

Was ist eine Testtheorie?

Testentwicklung. Kapitel 3 Direkt übernommen von Bühner, 2003

Teilklausur des Moduls Kurs 42221: Vertiefung der Statistik

TestOS-Probeversion. Der Patient befand sich zum Zeitpunkt der Testbearbeitung in der Probatorik-Phase.

Beispielberechnung Vertrauensintervall

Es können keine oder mehrere Antworten richtig sein. Eine Frage ist NUR dann richtig beantwortet, wenn ALLE richtigen Antworten angekreuzt wurden.

Inhaltsverzeichnis. Über die Autoren Einleitung... 21

Eine Skala ist also Messinstrument, im einfachsten Fall besteht diese aus einem Item

Grundlagen sportwissenschaftlicher Forschung Inferenzstatistik 2

Heinz Holling & Günther Gediga. Statistik - Deskriptive Verfahren

Grundlagen sportwissenschaftlicher Forschung Deskriptive Statistik 2 Inferenzstatistik 1

Forschungsstatistik I

Klausur in "Biomathematik" WS 2007 / 2008 Montag, den 28. Januar 2008

GLIEDERUNG Das Messen eine Umschreibung Skalenniveaus von Variablen Drei Gütekriterien von Messungen Konstruierte Skalen in den Sozialwissenschaften

Ringversuchsorganisation, Durchführung und Auswertung Klara Leclercq, Rosemarie Gosemärker, Shaike Landau, Yury Chernov, Claudia Caspers

fh management, communication & it Constantin von Craushaar fh-management, communication & it Statistik Angewandte Statistik

Deskriptive Statistik

Bildungsurlaub-Seminare: Lerninhalte und Programm

Brückenkurs Statistik für Wirtschaftswissenschaften

Einführung in SPSS. Sitzung 4: Bivariate Zusammenhänge. Knut Wenzig. 27. Januar 2005

Der Mittelwert (arithmetisches Mittel)

Hausaufgaben. Antwort und 4 guten Distraktoren zum gelesenen Text!

Prüfung aus Statistik 1 für SoziologInnen

Kapitel 5. Prognose. Zeitreihenanalyse wird aus drei Gründen betrieben: Beschreibung des Verlaufs von Zeitreihen.

Einführung 17. Teil I Kopfüber eintauchen in die Statistik 23. Kapitel 1 Kategoriale Daten zusammenfassen: Häufigkeiten und Prozente 25

Univariate Kennwerte mit SPSS

einzelne Items werden mit Zahlen verknüpft und nach festgelegten Regeln zu einem Score verrechnet

Name Vorname Matrikelnummer Unterschrift

Gundlagen empirischer Forschung & deskriptive Statistik. Statistische Methoden in der Korpuslinguistik Heike Zinsmeister WS 2008/09

VS PLUS

Die Subskala besteht aus folgenden Items (Ausschnitt aus dem Codeplan):

Kapitel 1: Deskriptive Statistik

Empirisches Relativ: Eine Menge von Objekten, über die eine Relation definiert wurde.

1. Maße der zentralen Tendenz Beispiel: Variable Anzahl der Geschwister aus Jugend '92. Valid Cum Value Frequency Percent Percent Percent

Ja-Prozente bei 6-stufigen Antwortskalen

Explorative Faktorenanalyse

Weitere Lagemaße: Quantile/Perzentile I

Testtheorie und Testkonstruktion

1. Inhaltsverzeichnis. 2. Abbildungsverzeichnis

Statistische Messdatenauswertung

Statistisches Testen

Angewandte Statistik 3. Semester

Testtheorie und Gütekriterien von Messinstrumenten. Objektivität Reliabilität Validität

Methodenlehre. Vorlesung 10. Prof. Dr. Björn Rasch, Cognitive Biopsychology and Methods University of Fribourg

Statistik für Psychologen

Lagemaße Übung. Zentrale Methodenlehre, Europa Universität - Flensburg

Transkript:

16.Testkonstruktion Items analysieren (imrahmen der KTT) Pretest Aussortieren / Umschreiben von unverständlichen, uneindeutigen oder inakzeptablen Items empirische Prüfung Kennwerte: Itemschwierigkeit Wieviel % haben dieses Item richtig gelöst? Trennschärfe Korrelation Item + eigene/andere Skala Aussagekraft Faktorenanalyse Homogenität paarweise Korrelation Item + Item Modellverträglichkeit Dimensionalität Wie viele Faktoren werden in den Items abgebildet? eindimensionaler / mehrdimensionaler Test Rekodierung invertierter Items Der gleiche Wert kann einmal auf eine hohe Merkmalsausprägung hinweisen, in einen anderen Item auf eine niedrige Merkmalsausprägung: z.b.: auf gesunde Ernährung achten Wie oft essen Sie... Item Obst Pommes nie 0 selten 1 manchmal 2 oft 3 sehr oft 4 X X Item Pommes wird umgepolt aus 4 wird 0 (aus 3 wird 1...) (alternativ: in einer Skala -2-1 0 1 2 aus 2 wird -2 ) univariate Verteilungseigenschaften? Test auf ormalverteilung + Histogramme Interpretation der deskriptiven Statistiken (Danke an Korrekturleserin P.T.! fehlende Daten? Standardabweichung Schiefe /Excess... bei extremen Verteilungswerten Item eleminieren Pommes und Äpfel gibt s hier: http://www.openclipart.org/detail/4641 http://www.openclipart.org/detail/86977

17.Testkonstruktion Items analysieren (KTT) Itemschwierigkeit nach der KTT: Itemschwierigkeitsindex P P= R R = alle richtiglösenden Vpn = alle Vpn Itemleichtigkeit : je mehr richtige Lösungen, desto höher der Index = je höher der Index, desto einfacher das Item P mit Zufallskorrektur P ZK Herausrechnen der Ratewahrscheinlichkeit R F m 1 P ZK = F = alle falschlösenden Vpn m = Anzahl der Wahlmöglichkeiten m-1 = Anzahl der Distraktoren bei dichotomen Aufgaben fällt (m-1) weg P ZK = R F P mit Inangriffnahmekorrektur P IK P IK = R B B = alle Vpn, die die Aufgabe bearbeitet haben P ZK,IK R F m 1 P ZK, IK = B Ratingskalen: Transformation zur Schwierigkeitsanalyse theoretisches Minum = 0-2 -1 0 1 2 + 2 0 1 2 3 4 P= M i x max M i = (transformierter) Mittelwert des Items x max = (transformierter) Maximalwert des Items M i = x i Mittelwert des Items: = Itemmittelwert der Itemantworten über alle Personen einer Stichprobe X i = X vi v=1 x vi = Itemrohwert der Person v in Item i

18.Testkonstruktion Items analysieren (KTT) Itemschwierigkeit Bedeutung der Itemschwierigkeit richtig = Zustimmung in Schlüsselrichtung der Skala z.b. Ich bin traurig bei Messung von Depression Ja = richtig Schlüsselrichtung: hohe Ausprägung der Depressivität maximale theoretische Unterscheidung bei mittlerer Schwierigkeit 100 Personen 50 Personen falsch 50 % 50 Personen richtig 1 Person unterscheidet sich von 50 anderen 1 Person unterscheidet sich von 50 anderen A B E R : ohne extrem leichte/schwierige Items kann in den Randbereichen des Testes keine Unterscheidung mehr gemacht werden 50% mag der maximale Informationsgehalt eines Items sein aber wie sieht es mit dem Gesamtinformationsgehalt des Items bezüglich des untersuchten Merkmals aus? gewisse Varianz der Itemschwierigkeit als Voraussetzung für die Korrelation mit anderen Variablen Differenzierungsbereiche eines Items Schwierigkeitsindex Differenzierung > 50% unterschiedlich einfache Items im unteren Merkmalsbereich < 50% unterschiedlich schwierige Items im oberen Merkmalsbereich Item ausschließen bis 5% und ab 95% wird es unsinnig, ein Item im Test zu lassen

19.Testkonstruktion Items analysieren (KTT) Trennschärfe Eigenschaft Skala Wie gut spiegelt ein einzelnes Item die Skala wieder? Wie typisch ist dieses Item für die diese Eigenschaft? Wie gut lässt sich das Testergebnis der Gesamtskala aus diesem einzelnen Item vorhersagen? Voraussetzung: Validität der Skala Wie gut messen die Items insgesamt diese Eigenschaft? Korrelation (Eigentrennschärfe) einzelnes Item / alle (übrigen) Items der Skala (Werte zwischen -1 und 1) (Trennschärfeanalyse ersetzt nicht Validierungsstudien!) Part-Whole-Korrektur: zu untersuchendes Item muss aus dem Gesamtwert der Skala rausgerechnet werden, sonst wird es ja teilweise mit sich selbst verglichen künstlich erhöhte Korrelation mögliche Befunde hohe Korrelation alle Items erfassen das gleiche Konstrukt Homogenität Problem bei sehr hoher Korrelation: redundante Items Wenn 2 Items ziemlich genau das gleiche erfassen, ist eins von ihnen überflüssig sieht zwar reliabel und trennscharf aus, bringt mich aber inhaltlich nicht weiter, weil keine zusätzlichen Erkenntnisse durch das zusätzliche Item negative Korrelation negative Trennschärfe Item ausschließen Vorsicht: korrekte Rekodierung?? (siehe ApfelPommesSkala) Trennschärfe bei Ratingskalen Produkt-Moment-Korrelation Trennschärfe bei dichotomen Items punktbiserale Korrelation

20.Testkonstruktion Items analysieren (KTT) Trennschärfe verzerrte Trennschärfen wegen... erweiterte Varianz Ausreißer bimodale Verteilungen durch eingeschränkte Varianz Zusammenhang Schwierigkeit + Trennschärfe! Schiefe extreme Schwierigkeiten Prüfung statistisch oder visuell Schwierigkeitsanalyse Histogramme Ausreißer wirken sich bei Ratingskalen aufgrund der eingeschränkten Möglichkeiten selten gravierend aus bimodale Verteilungen entstehen bei Ratingskalen, wenn die Mittelkategorie selten gewählt wird erhebliche Varianzerweiterungen schiefe Verteilungen häufig, aber... gegen inhaltliche Vorteile durch das Beibehalten des entsprechenden Items abzuwägen extreme Schwierigkeiten sollten zumindest mit hohen Trennschärfen kombiniert sein! Selektionskennwert als Korrektur der Trennschärfe: Trennschärfe schwieriger Items wird nach oben korrigiert Ziel: Items werden trotz der aufgrund extremer Schwierigkeiten eingeschränkten Varianz nicht voreilig aussortiert auch in den Extrembereichen können Merkmalsausprägungen erfasst werden alternativ: Moosbrugger + Ziegler schwierigkeitsproportionale Stichprobenverteilung Beurteilung von Trennschärfen... immer auch unter Beachtung des Inhaltsvalidität: Unterscheidungen aufgrund des Items sollten mit den entsprechenden Unterschieden in der Merkmalsausprägung einhergehen! inhaltliche Verkürzungen der Skala vermeiden! Trennschärfen nahe 0 messen etwas anderes, als sie (im Sinne der Skala) messen sollten Fremdtrennschärfe Korrelation Item / fremde Skala