Einführung in die Testtheorie und konstruktion Skript Lengenfelder WS 07/08

Größe: px
Ab Seite anzeigen:

Download "Einführung in die Testtheorie und konstruktion Skript Lengenfelder WS 07/08"

Transkript

1 Einführung in die Testtheorie und -konstruktion TEIL A: Einführung 1. Begrifflichkeiten Klassische Testtheorie: hauptsächlich korrelationsstatistische Betrachtung und deterministisches nicht prüfbares Modell bezüglich Zusammenhang zwischen Testwert und wahre Eigenschaftsintensität einer Person. Probabilistische Testtheorie: prüfbare Modelle; Wahrscheinlichkeitstheoretischer Zusammenhang zwischen Testwert und wahre Eigenschaftsintensität einer Person. Wozu eine Theorie über psychometrische Tests? Vernünftiges Umgehen mit dem Phänomen des Messfehlers Begründete Rückschließung auf Ausprägungsgrade nicht beobachtbarer latenter Variablen von beobachtbaren Indikatoren (den Testantworten) aus Wappnung gegen den pauschalierenden Vorwurf, formale Methoden und Psychologie passten nicht zusammen Bestimmung standardisierbarer Kennwerte der Qualität eines Testes Psychologische Diagnostik ist das systematische Sammeln und Aufbereiten von Informationen mit dem Ziel, Entscheidungen und daraus resultierende Handlungen zu begründen, zu kontrollieren, zu optimieren. (Jäger und Petermann) Psychodiagnostik ist eine Methodenlehre im Dienste der Angewandten Psychologie. (Amelang und Schmidt-Atzert) Wichtige Anwendungsfelder der Testtheorie und Testkonstruktion in der psychologischen Praxis (= Diagnostik) Fahreignungsdiagnostik (TÜV Rot-Grün-Blindheit) Rehabilitations- und Behindertendiagnostik (Ausmaß der Beeinträchtigung / Erholung messen) Diagnostik in Psychiatrischen Kliniken (Art und Ausprägung eine Störung erheben) Berufwahl unterstützende Diagnostik (Arbeitsamt, Self-Assessment) Auswahl von Führungskräften Auswahl von Mitarbeitern Auswahl von Auszubildenden (Studierendenauswahl) Flugeignugsuntersuchung (z.b. Lufthansa, Bundeswehr) Diagnostik im pädagogischen Bereich (z.b. Sonderschulzuweisung Minderbegabung vs. Hochbegabung) Hochschulzulassung (z.b. Medizinstudium) Zuweisung militärischer Funktionen Rechtspsychologie (z.b. Glaubwürdigkeitsfeststellung, Täterprognose, Zurechnungsfähigkeit) Erziehungsberatung (Defizite in der Erziehung) Therapie-Evaluation Merkmale eines Tests: Standardisiert hinsichtlich Durchführung, Auswertung und Interpretation vorgegebene Regeln zur Durchführung, Auswertung und Interpretation sollte ein objektiv kontrolliertes Verfahren sein 1/10

2 Verhaltensweisen werden ausgelöst Stichproben aus einem Universum von Verhaltensweisen, das bestimmte Fähigkeiten oder Eigenschaften indiziert. Messung (Quantifizierung) wird angestrebt Wissenschaftliches Verfahren, dessen Wissenschaftlichkeit durch den Nachweis der Hauptgütekriterien (Objektivität, Reliabilität, Validität) und Nebengütekriterien (Normierung, Ökonomie, Ethik) erbracht wird. Lienert & Raatz (1998): Ein Test ist ein wissenschaftliches Routineverfahren zur Untersuchung eines oder mehrerer empirisch abgrenzbarer Persönlichkeitsmerkmale mit dem Ziel einer möglichst quantitativen Aussage über den relativen Grad der individuellen Merkmalsausprägung. 2.Hauptgütekriterien eines Tests Objektivität: Ausmaß der Abhängigkeit der Testergebnisse vom Versuchsleiter. Reliabilität: Messgenauigkeit; Genauigkeit eines Verfahrens das ein Merkmal erfasst (unabhängig ob es um das intendierte Merkmal geht). Validität: Gültigkeit; Maß an Genauigkeit, mit dem der Test das Merkmal misst, was er vorgibt zu messen. 3. Messtheorie Ablaufschema Testkonstruktion Bestimmung des Gegenstandsbereiches der zu erfassenden Dimensionen; Geltungsbereich, Operationalisierungsvarianten Formulierung und Zusammenstellung von Items Gewinnung einer Analysestichprobe (Zielgruppe, Stichprobengröße) Durchführung der Itemanalyse Einzelschritte der Testevaluation Wahl eines testtheoretischen Modells Prüfung bestimmter Gütekriterien Selektion von Items (z.b. mittels Faktorenanalyse) Endgültige Itemzusammenstellung und abschließende Berechnung der Gütekriterien Durchführung von Validierungsstudien Testnormierung 2/10

3 Modell= reduzierte Abbild der Wirklichkeit auf die Elemente und Strukturen, die von Interesse sind. Messen ist die Bestimmung der Ausprägung einer Eigenschaft eines (Mess-) Objektes und erfolgt durch eine Zuordnung von Zahlen zu Messobjekten wenn die (numerischen) Beziehungen zwischen Messwerten empirische Beziehungen zwischen den Messpbjekten ausdrücken. (Orth, 1999) Skalenniveaus Absolutskala x =x Identitäsformation (Transformation nur in sich selbst möglich Differenzenskala x =x+b Translation (Nullpunkt festgelegt) Verhältnisskala x =a*x proportionale Transformation Intervallskala x =a*x+b lineare Transformation (Nullpunkt & Einheit unklar) Verhältnisse prüfen A A = B B Ordinalskala x =f(x) mit x>y f(x) >f(y) monotone Transformation Nominalskala x =y für alle x äquivalente Transformation TEIL B: Klassische Testtheorie 4. Axiomatik Axiome: nicht geprüfte Basisannahmen, die gesetzt werden oder sich logisch ergeben (logisch wahr empirisch nicht prüfbar) (1) X = T + E T=True, E= Error Verknüpfungsaxiom Messwert = Summe des wahren und des Fehlerwertes (Abweichung des Messwertes zum wahren Wert (2) M ( E) I = 0 M ( E) P = 0 Mittelwert der Fehler unähnlicher Messungen Mittelwert der Fehler eine Population einer Person verschiedener Bedingungen (3) r ( E, T ) = 0 r ( E, E A B ) = 0 r ( E, T ) = 0 A B Alle Korrelationen mit irgendeinem Fehlerterm ist gleich Null (4) M ( X ) = T Existenzaxiom Mittelwert der Messwerte = True (Verhaltenstendenz einer Person in einer Situation) 5.Erstellen der Testversion Antwortkategorien Freie Beantwortung: (Antwortformat nicht vorgegeben oder sehr frei) - ohne spezielle Vorgabe (z.b. Rorschach) - formale Vorgabe (z.b. 2+4=?) - Lückenvorgabe (z.b ) Gebundene Beantwortung: (Eindeutig in der Antwort) - Zweifachwahl (z.b. ja/nein) - Mehrfachwahl multiple choice (z.b. 2+4= 5, 6, 7, 8 ) Ratewahrscheinlichkeit reduziert sich - Zuordnungsaufgabe (z.b. 1 c, 2 b, 3 d, 4 a) - Umordungsaufgabe (z.b. HAWIE) Gebundene Beantwortung: 1) exhaustiv / 2) disjunkt 1) Bereich der Antworten wird vollständig abgedeckt: - ja: exhaustiv -nein: nicht exhaustiv 2) Antwortmöglichkeiten schließen sich gegenseitig aus: - ja: disjunkt -nein: nicht disjunkt 3/10

4 BSP.: (3*5)/9=x exhaustiv nicht echaustiv diskunkt x 1,3 1,3 < x < 1,5 x 1,5 x = 1,2 x = 1,7 x = 1,9 nicht disjunkt x < 1,3 1,2 < x < 1,8 x > 1,6 x < 1,5 1,2 < x < 1,9 x = 2,1 Kriterien für Items Inhaltliche Kriterien (itemspezifische Kriterien) - leichte Verständlichkeit - keine doppelte Verneinung - keine zwei Tatbestände - einfache Durchführbarkeit - kurze Lösungszeit - geringer Materialverbrauch - leichte Auswertbarkeit - geringe Häufigkeit von Zufallslösungen - geringe Abhängigkeit von Gedächtnisleistung - Ausschluss von Antworttendenzen - Gegenseitige Unabhängigkeit der Items - Geschlechtsneutrale Formulierung Formale Kriterien - Schwierigkeit - Trennschärfe - Validitätskoeffizient - FA (Ladung) - Aufgabeninterkorrelationen 6. Itemanalyse Gewinnung von empirischen Kennwerten für jedes Item und damit auch für die einzelnen Skalen und deren Relationen. Die berechneten Kennwerte dienen der Beschreibung und Bewertung der Items und der Skalen. Die berechneten Kennwerte bilden die Basis für ein eventuell erforderliche Testrevision A: Kennwerte der Itemanalyse 1) Item-Kennwerte - Schwierigkeit p i (Differenzierungskraft des Items, nicht alle geben selbe Antwort) - Trennschärfe r it (misst Item das, was es messen soll?) - Validitätskoeffizient r il - Aufgabeninterkorrelation ( FAanalyse) (prüft, ob Items der Dimension Lebenszufriedenheit homogen messen, d.h. was anderes messen, als die Items von sozialer Orientierung) 2) evtl. Faktorenanalyse 3) Kennwert für Skalen - Rohwertverteilung - Konsistenz (Reliabilität) B: Gütekriterien - Objektivität - Reliabilität - Validität C: Normen 4/10

5 ACHTUNG bei Med ex : U, untere Grenze der Medianklasse; N ; NS, Anzahl bis zur Medianklasse; NM, Anzahl in der Medianklasse; I, Klassenbreite Rohwertberechnung Intervalldaten: Aufsummierung mit Gewichtung Kategorien Skalenrohwert = untransformierter, unveränderter Testwert leicht g 1 =0 n 1 =8 mittel g 2 =1 n 2 =7 schwer g 3 =2 n 3 =5 Transformierte Werte im Skalensinn Rohwert: X=(g 1 x n 1 ) + (g 2 x n 2 ) + (g 3 x n 3 ) + + (g i x n i ) g i : Gewicht der Kategorie i; n i : Anzahl der Antworten in Kat. i Trennschärfe Inhaltlich: wie gut spiegelt ein Item eine Skale, di aus den restlichen Items gebildet wird wider bzw. wie prototypisch ist ein Item für diese Skala. Korrigierte Korrelation einer Aufgabe mit einer Skala (Part-whole-Korrektur) Bewertung der Trennschärfe r T +1 ok r T 0 schlecht eliminieren r T +1 ok umpolen Part-Wohle-Korrektur von Trennschärfen r it Korr. Item x mit Test Test = Itemsumme = I1 + I2 + I3 Skalenkonstruktion mittels Faktorenanalyse (Ablaufschema) (1) Berechnung der Korrelationsmatrix R (Iteminterkorrelationen) (2) Hauptkomponentenanalyse (Diagonale der Korrelationsmatrix R:1) (3) Analyse Eigenwertverlauf Indikator für Faktorenzahl f (4) Rotation der f Faktoren (orthogonal oder schiefwinklig) (5) Itemauswahl aufgrund der rotierten Ladungsmatrix Rohwertverteilung Schiefe und Exzess 1. links: linkssteil, linksgipflig 1. rechts: rechtssteil, rechtsgipflig Signifikanzprüfung: One-Sample-T-Test df=n-1 Wenn Sch<0 dann rechtssteil oder rechtsgipflig Wenn Sch=0 dann symmetrisch Wenn Sch>0 dann linkssteil oder linksgipflig Wenn Ex groß dann schmalgipflig Wenn Ex = 0,263 dann normalverteilt Wenn Ex klein dann breitgipflig Die Schiefe beschreibt die Neigungsstärke einer statistischen Verteilung X. Sie zeigt an, ob und wie stark die Verteilung nach links (positive Schiefe) oder nach rechts (negative Schiefe) geneigt ist. Der Exzess beschreibt die Abweichung des Verlaufs der gegebenen Wahrscheinlichkeitsverteilung zum Verlauf einer Normalverteilung. 7. Gütekriterien Objektivität Ausmaß der Abhängigkeit / Unabhängigkeit der Test-Ergebnisse vom Versuchsleiter (Kennwert: z.b. 0%-100%, Intraklass-Korrelation) 5/10

6 Bezüglich: - Durchführung - Auswertung - Interpretation Objetivität Durchführung Auswertung Interpretation hohe Werte Selbstbeurteilungs-Fragebogen; Leistungstests Selbstbeurteilungs- Fragebogen; Leistungstests Computerdiagnostik bzw. formalisierte Auswertung niedrige Werte projektive Verfahren Verfahren mit offenen übrige Fälle Antworten (projektive Verfahren Verbesserung Standardisierung der Formalisierte Auswertung Formalisierte Regeln Untersuchungs-situation (Schablonen, Computer) z.b. Aufnahmeverfahren klare Anleitung an Testdurchführer und teilnehmer (teilweise übergenau) Schulung der Versuchsleiter Vorlegen des gleichen Materials an zwei Verschiedene Personen gleicher Rohwert? Reliabilität 1. Retestmethode (Korrelation T1/T2: 4 Woche) Zwei Tests, die das gleiche Messen (fast unmöglich) Korrelation Merkmalsstabilität Reliabilität 1 sig. (p<.05) und hoch ja hoch 2 n. sig. (p>.05) oder ja niedrig 3 n. sig. (p>.05) oder nein 3a) hoch 4 n. sig. (p>.05) oder ja, aber unterschiedliche Lern-, Motivationseffekte 3b) niedrig 4a) hoch 4b) niedrig gleiches Material zwei verschiedenen Versuchsleitern vorlegen kommen sie zu gleicher Interpretation? 2. Paralleltestmethode (Testversion A, B; Korrelation T1(A)/T2(B) 7 Tage) Selbe Test wird mit der gleichen Vpn-Gruppe zweimal durchgeführt: Zeitabstand einerseits groß kein Erinnerungseffekt, andererseits klein keine Veränderung des Merkmals Korrelation Merkmalsstabilität Parallelität Reliabilität 1 sig. (p<.05) und hoch ja ja A, B: hoch 2 n. sig. (p>.05) oder 3 n. sig. (p>.05) oder 4 n. sig. (p>.05) oder 5 n. sig. (p>.05) oder 6 n. sig. (p>.05) oder A, B: ja A, B: ja A, B: niedrig A, B: ja A, B: nein 3a) A, B: hoch 3b) A, B: niedrig 3c) A: hoch, B: niedrig 3d) A: niedrig, B: hoch A, B: nein A, B: ja 4a) A, B: hoch 4b) A, B: niedrig A, B: nein A, B: nein 5a) A, B: hoch 5b) A, B: niedrig 5c) A: hoch, B: niedrig 5d) A: niedrig, B: hoch 3. Konsistenzanalysen (innere) a) Testhalbierung Test halbieren und Ähnlichkeit der beiden Hälften untersuchen b) jedes Item wird als eigenständiger Teil angesehen Cronbach α (Maß der inneren Konsistenz) Homogenität der Items 6/10

7 Nomogramm für die graphische Lösung Validität In welchem Ausmaß misst der Test das, was ich messen will? 1. Testverhalten Verhalten außerhalb 1.1. Repräsentationsschluss Inhaltsvalidität (content validity) Testverhalten ist der Beste Schluss auf (gewünschtes) Verh. (sportl. Wettkampf, Klausuren, Aufnahmeprüfung) 1.2. Korrelationsschluss Zeitgleiches Kriterium Übereinstimmungsvalidität (concurrent validity) Wir kennen das Ergebnis schon, aber wir möchten wissen, ob unser Test das auch misst Künftiges Kriterium Vorhersagevalidität (predictive validity) gilt nur für den unersuchten Zeitraum (Eignungsdiagnostik, Studienauswahl, Rückfalldiagnose) 2. Testverhalten Eigenschaft Konstruktvalidität 2.1. konvergente Validität Korrelation mit Tests, die einen ähnlichen Validitätsanspruch erheben (Bereiche: ;.40 1) 2.2. diskriminante / divergente Validität Vergleich mit methodisch ähnlichen Tests, die etwas ähnliches messen, oder auch etwas anderes messen (Bereich: ) 2.3. faktorielle Validität Faktorenanalyse mit eigenem Test, anderem Test und Außenkriterien 2.4. Expertenanalyse inhaltlich, logische Analyse durch Experten 2.5. Intraindividuell Unterschiede innerhalb der selben Gruppe (mehrere Messwerte pro Vpn; vorher, nachher Design) 2.6. Interindividuell Unterschiede zwischen Gruppen (oder Personen) 2.7. Außenkriterien Gegenüberstellung des Testergebnisses mit mehr oder weniger klaren Außenkriterien Es gibt nur die Validität im Bezug auf die Kriterien (Validität des Testes gibt es nicht) Weitere Kriterien z.b.: Testgrundlage (diagnostische Zielsetzung, Theoretische Grundlage, Nachvollziehbarkeit der Testkonstruktion) Testdurchführung (Durchführungsobjektivität, Test Transparenz, Zumutbarkeit für den Diagnostizierten, Ausmaß der Verfälschbarkeit, Störanfälligkeit) Testverwertung (Auswertungsobjektivität, ja Reliabilität, Validität, Normierung, Bandbreite, Informationsausschöpfung, Kein Validierungs- Änderungssensitivität) Hinweis für Test Testevaluation (Ökonomie, Fairness, Akzeptanz durch Benutzer, Vergleichbarkeit, Bewährung) Äußere Gestaltung (Verständlichkeit, probandenfreundliche Gestaltung) 7/10 Theoretisches Bezugssystem Hypothese(n) i Mit empirischer Überprüfung Bestätigung nein Validierungs- Hinweis für Test

8 8. Normen Interprtationsobjektivität Gewinnung vergleichbarer Daten Eichstichprobe je größer desto besser z.b. Geschlechterunterschiede Geschlechter durch Normierung vergleichbar 1. Standardnormen (mind. normalverteilte Intervalldaten Normierung mgl.) 2. Prozentrangnormen 3. Äquivalenznormen (werden heut nicht mehr verwendet) X=MW(der Norm)+s(d.N.)*z Stanine-Skala: nur 1-10, immer Rundung auf ganze Werte (Bereich von 1 und 9 größer) Skalentransformation x x z-transformation: z = Transformation in Skala y: y = y + sy * z s x 9. Testprofil Testbatterie Statistische Interpretation von Testresultaten Profilmittelwert (-höhe) k X Ai i= X A = 1 A: Personenindex, k: Anzahl Untertests k Profilstandardabweichung k 2 ( X A X ) i A i= 1 S A = k 1 Verlaufsgestalt ( X ) A i X A ( X A i X A) / S A Profilvergleich mit Profilhöhe und Verlaufsgestalt: Distanzmaß ohne Profilhöhe und Standardabweichung, nur Verlaufsgestalt: Produkt-Monument- Korrelation Vertrauensintervall eines Testwertes X = X ± z * s = x ± z * s 1 r z: kritischer Wert gem. Signifikanzniveau α (zweiseitig) V E tt z ± = 1 normal z ± > 1 über-/unterdurchschnittlich z ± > 1,5 deutlich über-/unterdurchschnittlich Mit einer Irrtumswahrscheinlichkeit von 5% zweiseitig hat Vpn. X einen durchschnittlichen bis deutlich überdurchschnittlichen (Z.B. IQ) (Beispiel Werte waren 110,2 129,8; bei IQ MW=100 und S= normal, >115 überdurchschnittlich ) Profildifferenz (2 Testungen bei gleicher Person; Vergleich 2 Personen in einem Test d beob d crit : Unterschied signifikant 8/10

9 Profildifferenz (2 verschiedene Tests / Untertests; gleiche Person) d beob d crit : Unterschied signifikant Teil C: Weiter Ansätze 10. Probabilistische und Deterministische Ansätze Deterministische und Probabilistische Modelle in der Testtheorie Deterministischer Ansatz: Guttman-Modell Bedingte Wahrscheinlichkeit: Vorbedingung vorhanden Unplausibel: sprunghafter Anstieg keine Differenzierung bei denen mit p=1 menschliche Natur Fähigkeit ist nicht jeden Tag gleich Probabilistischer Ansatz: Binomial-Modell Mindestausprägung notwendig (z.b. Eigenschaftsausp. Von - 2 notwendig, damit Wahrscheinlichkeit steigt) Trennschärfe = Steigung der Kurve (bei probabilistischen Ansätzen) Je höher die Eigenschaftsausprägung, desto höher die Lösungswahrscheinlichkeit Probleme: keine Differenzierung bei Wahrscheinlichkeit 0 und 1 sprunghafter Anstieg Probabilistischer Ansatz: Rasch-Modell Asymptotische Annäherung monotone Steigung Weitere probabilistische Modelle: Weniger Anforderungen Probabilistischer Ansatz: Birnbaum-Modell Durchgezogene Linie: leichtestes Item Die Itemschwierigkeit ist konstant Probabilistischer Ansatz: Mokken-Skala Rangordnung der Items bleibt erhalten Das dichotome Raschmodell: Eigenschaften des Modells 9/10

10 Spezifische Objektivität: Der Vergleich zweier Personen ist unabhängig von der gewählten Versuchsbedingung; bei der Modellkonformität fallen für einen Probanden die Item- und Personenparameter immer gleich aus, gleichgültig welche Items bearbeitet werden. Lokale Stochastische Unabhängigkeit: Die Wahrscheinlichkeit des richtigen Lösens von Item 1 hat keinen Einfluss auf die Wahrscheinlichkeit des richtigen Lösens von Item 2. Die lokale stochastische Unabhängigkeit zeigt sich durch Null-Korrelationen zwischen den Items bei Konstanthalten de Personenparameters. Stichprobenunabhängigkeit der Parameterschätzung: (oder auch Teilgruppenkonstanz) Die Schätzung der Itemparameter kann vorgenommen werden, ohne die Personenparameter zu kennen oder Verteilungen darüber annehmen zu müssen. Schätzungen auf Basis von Subgruppen führen zu gleichen Itemparametern. Erschöpfende Statistik: Für die Schätzung des Personenparameters führt das richtige Lösen der Items 3 und 4 zu gleichen Lösungen wie das richtige Lösen der Items 1 und 2. Jede Teilmenge von Items charakterisiert die Ausprägung der latenten Dimension erschöpfend. Unterschiede zwischen Klassischer und Probabilistischer Testtheorie klassische Testtheorie probabilistische Testtheorie Manifeste Variable wird interpretiert Latente Variable wird geschätzt Axiome beziehen sich ausschließlich auf den Messfehler Latente Variable wird über Modell (=Formel) mit Manifester (Messfehlertheorie?) Variable in Verbindung gebracht Itemschwierigkeit ist abhängig von der Itemschwierigkeit ist unabhängig von den Eigenschaftsausprägung der Personen Personenparametern Messgenauigkeit wird durch Reliabilität geschätzt (Verhältnis Konzept der Reliabilität kommt nicht vor in den Varianz der wahren Werte zu Varianz der beobachteten probabilistischen Ansätzen Werte) Mehrere Selektionskriterien für Itemauswahl vorhanden, die Selektionskriterien für Itemauswahl eindeutig sich z.t. gegeseitig widersprechen Weitere Faktoren die auf das Testverhalten wirken, können erst nachträglich bestimmt werden, sind aber nicht Teil des Messmodells Annahmen über die Messfehler werden nicht überprüft Anwendung relativ einfach Auswertungssoftware ausreichend vorhanden Anwendungsbereich sehr breit gestreut Erschöpfende Statistik nicht überprüft, wird aber angenommen Modell zum Testverhalten kann beliebig gestaltet werden und bringt alle Faktoren im Messmodell zueinander (z.b. Raten bei Aufgaben) Theoretisch gut fundiert für den Test wird Modellgeltung überprüft Modellüberprüfung relativ aufwendig Auswertungssoftware nur bedingt vorhanden Anwendungsbereich durch oftmaliges Fehlschlagen der Modellgeltung auf eher spezifische Eigenschaften beschränkt (z.b. spezifische kognitive Leistungen) Erschöpfende Statistik ermöglicht Testergebnis konkreten Leistungsbereichen zuordnen zu können und liefert Belege für die Vergleichbarkeit von Ergebnissen (PISA Studie) Zugänglichkeit der Logik anfangs eher schwierig später aber klar und an verschiedenste Gegebenheiten anpassbar Zugänglichkeit der Logik anfangs eher einfach später aber problematisch durch Lücken im theoretischen Ansatz Rost (1999) stellt fest, dass beide Methoden parallel auf dasselbe Datenmaterial zur Testkonstruktion angewandt zu sehr ähnlichen Ergebnissen kommen. Beide Methoden basieren auf ähnlichen Annahmen und sollten nicht als konkurrierende, sondern sich gegenseitig ergänzende Verfahren betrachtete werden. Bisher sind ca. 90% der psychologischen Tests nach der klassischen Testtheorie konstruiert. 11. Entscheidungsfehler Sensitivität der Zuordnungsregel: Anteil der richtig diagnostizierten Kranken in der Gruppe der Kranken obere Zeile Spezifität der Zuordnungsregel: Anteil der richtig diagnostizierten Gesunden in der Gruppe der Gesunden untere Zeile Prädiktiver Wert einer positiven Zuordnung: Anteil der richtig diagnostizierten Kranke an allen an krank diagnostizierten Personen linke Spalte Prädiktiver Wert einer negativen Zuordnung: Anteil der richtig diagnostizierten Gesunden in der Gruppe der als gesund diagnostizierten Personen rechte Spalte 10/10

Messtherorie Definitionen

Messtherorie Definitionen Messtherorie Definitionen Begriff Definition Beispiel Relationen Empirisches Relativ eine Menge von Objekten und ein oder mehreren beobachtbaren Relationen zwischen dieses Objekten Menge der Objekte =

Mehr

Überblick über die ProbabilistischeTesttheorie

Überblick über die ProbabilistischeTesttheorie Überblick über die ProbabilistischeTesttheorie Schwächen der Klassischen Testtheorie Axiome Theoretische Festlegungen nicht überprüfbar! Einige sind kontraintuitiv und praktisch nicht haltbar Stichprobenabhängigkeit

Mehr

Testtheorie und Gütekriterien von Messinstrumenten. Objektivität Reliabilität Validität

Testtheorie und Gütekriterien von Messinstrumenten. Objektivität Reliabilität Validität Testtheorie und Gütekriterien von Messinstrumenten Objektivität Reliabilität Validität Genauigkeit von Messungen Jede Messung zielt darauf ab, möglichst exakte und fehlerfreie Messwerte zu erheben. Dennoch

Mehr

Objektivität und Validität. Testgütekriterien. Objektivität. Validität. Reliabilität. Objektivität

Objektivität und Validität. Testgütekriterien. Objektivität. Validität. Reliabilität. Objektivität Objektivität und Objektivität: Inwieweit ist das Testergebnis unabhängig von externen Einflüssen Effekte des Versuchsleiters, Auswertung, Situation, Itemauswahl : Inwieweit misst der Test das, was er messen

Mehr

Tutorium Testtheorie. Termin 3. Inhalt: WH: Hauptgütekriterien- Reliabilität & Validität. Charlotte Gagern

Tutorium Testtheorie. Termin 3. Inhalt: WH: Hauptgütekriterien- Reliabilität & Validität. Charlotte Gagern Tutorium Testtheorie Termin 3 Charlotte Gagern charlotte.gagern@gmx.de Inhalt: WH: Hauptgütekriterien- Reliabilität & Validität 1 Hauptgütekriterien Objektivität Reliabilität Validität 2 Hauptgütekriterien-Reliabilität

Mehr

Forschungsmethoden VORLESUNG WS 2017/2018

Forschungsmethoden VORLESUNG WS 2017/2018 Forschungsmethoden VORLESUNG WS 2017/2018 SOPHIE LUKES Überblick Letzte Woche: - Stichprobenziehung und Stichprobeneffekte Heute: -Gütekriterien I Rückblick Population und Stichprobe verschiedene Arten

Mehr

Verfahren zur Skalierung. A. Die "klassische" Vorgehensweise - nach der Logik der klassischen Testtheorie

Verfahren zur Skalierung. A. Die klassische Vorgehensweise - nach der Logik der klassischen Testtheorie Verfahren zur Skalierung A. Die "klassische" Vorgehensweise - nach der Logik der klassischen Testtheorie 1. Daten: z. Bsp. Rating-Skalen, sogenannte "Likert" - Skalen 2. Ziele 1. Eine Skalierung von Items

Mehr

Gütekriterien: Validität (15.5.)

Gütekriterien: Validität (15.5.) Gütekriterien: Validität (15.5.) Besprechung der Hausaufgaben Validität: Arten und Schätzmethoden Inhaltsvalidität Empirische Validität Konstruktvalidität Testfairness Normierung Nebengütekriterien Zusammenfassung

Mehr

Forschungsmethoden VORLESUNG SS 2017

Forschungsmethoden VORLESUNG SS 2017 Forschungsmethoden VORLESUNG SS 2017 SOPHIE LUKES Überblick Letzte Woche: - Stichprobenziehung und Stichprobeneffekte Heute: -Gütekriterien I Rückblick Population und Stichprobe verschiedene Arten der

Mehr

Welche Gütekriterien sind bei der Bewertung von Lernleistungen

Welche Gütekriterien sind bei der Bewertung von Lernleistungen Welche Gütekriterien sind bei der Bewertung von Lernleistungen wichtig? Anne Spensberger; Ramona Dutschke; überarbeitet von Susanne Narciss Eine gerechte Bewertung von Lernleistungen setzt voraus, dass

Mehr

VU Testtheorie und Testkonstruktion WS 08/09; Lengenfelder, Fritz, Moser, Kogler

VU Testtheorie und Testkonstruktion WS 08/09; Lengenfelder, Fritz, Moser, Kogler VU Testtheorie und Testkonstruktion WS 08/09; Lengenfelder, Fritz, Moser, Kogler Hausübung In der Übung Übungsblatt 06 1. Gegeben: Skala zur Messung der Gesundheitssorge mit 20 Items (dichotomes Antwortformat).

Mehr

Reliabilitäts- und Itemanalyse

Reliabilitäts- und Itemanalyse Reliabilitäts- und Itemanalyse In vielen Wissenschaftsdisziplinen stellt die möglichst exakte Messung von hypothetischen Prozessen oder Merkmalen sogenannter theoretischer Konstrukte ein wesentliches Problem

Mehr

Forschungsmethoden VORLESUNG SS 2017

Forschungsmethoden VORLESUNG SS 2017 Forschungsmethoden VORLESUNG SS 2017 SOPHIE LUKES Überblick Letzte Woche: - Gütekriterien I Heute: -Gütekriterien II Rückblick Gütekriterien der qualitativen Forschung Gütekriterien der quantitativen Forschung:

Mehr

Eigene MC-Fragen Testgütekriterien (X aus 5) 2. Das Ausmaß der Auswertungsobjektivität lässt sich in welcher statistischen Kennzahl angeben?

Eigene MC-Fragen Testgütekriterien (X aus 5) 2. Das Ausmaß der Auswertungsobjektivität lässt sich in welcher statistischen Kennzahl angeben? Eigene MC-Fragen Testgütekriterien (X aus 5) 1. Wenn verschieden Testanwender bei Testpersonen mit demselben Testwert zu denselben Schlussfolgerungen kommen, entspricht dies dem Gütekriterium a) Durchführungsobjektivität

Mehr

Forschungsmethoden VORLESUNG WS 2017/2018

Forschungsmethoden VORLESUNG WS 2017/2018 Forschungsmethoden VORLESUNG WS 2017/2018 SOPHIE LUKES Überblick Letzte Sitzung: - Gütekriterien I Heute: -Gütekriterien II Rückblick Gütekriterien der qualitativen Forschung Gütekriterien der quantitativen

Mehr

Einführung in die Theorie psychologischer Tests

Einführung in die Theorie psychologischer Tests Gerhard H. Fischer Einführung in die Theorie psychologischer Tests Grundlagen und Anwendungen VERLAG HANS HUBER BERN STUTTGART WIEN Inhaltsverzeichnis Vorwort 9 Die Notation 12 Teil 1: Abriss der klassischen

Mehr

Einführung in die Statistik Testgütekriterien

Einführung in die Statistik Testgütekriterien Professur Psychologie digitaler Lernmedien Institut für Medienforschung Philosophische Fakultät Einführung in die Statistik Testgütekriterien Überblick Einleitung Objektivität Reliabilität Validität Nebengütekriterien

Mehr

Klassische Testtheorie (KTT) Klassische Testtheorie (KTT) Klassische Testtheorie (KTT)

Klassische Testtheorie (KTT) Klassische Testtheorie (KTT) Klassische Testtheorie (KTT) Klassische Testtheorie (KTT) Die KTT stellt eine Sammlung von Methoden dar, die seit Beginn des vorigen Jahrhunderts zur exakten und ökonomischen Erfassung interindividueller Unterschiede entwickelt wurden.

Mehr

RETESTRELIABILITÄT. Teststabilität. Korrelation wiederholter Testdurchführungen. Persönlichkeitstests. Stabilität des Zielmerkmals.

RETESTRELIABILITÄT. Teststabilität. Korrelation wiederholter Testdurchführungen. Persönlichkeitstests. Stabilität des Zielmerkmals. Basiert auf RETESTRELIABILITÄT Wird auch genannt Teststabilität Geeignet für Korrelation wiederholter Testdurchführungen Abhängig von beeinflusst Stabilität des Zielmerkmals Persönlichkeitstests Speedtests

Mehr

Klassische Testtheorie (KTT)

Klassische Testtheorie (KTT) Onlinestudie Folie 1 Klassische Testtheorie (KTT) Eigenschaften psychologischer Testverfahren, die auf Basis der Klassischen Testtheorie (KTT) konstruiert wurden: -Gleicher SEE für alle Mitglieder einer

Mehr

TESTTHEORIE UND TESTKONSTRUKTION - PRAKTISCHE ANWENDUNG - TEIL 3

TESTTHEORIE UND TESTKONSTRUKTION - PRAKTISCHE ANWENDUNG - TEIL 3 TESTTHEORIE UND TESTKONSTRUKTION - PRAKTISCHE ANWENDUNG - TEIL 3 Prof. Dr. Franke SS2012 Hochschule Magdeburg-Stendal (FH) M.Sc. Rehabilitationspsychologie Gliederung Reliabilität 1. Überblick 2. Berechnung

Mehr

SF-36 Fragebogen zum Gesundheitszustand. Seminar: Testen und Entscheiden Dozentin: Susanne Jäger Referentin: Julia Plato Datum:

SF-36 Fragebogen zum Gesundheitszustand. Seminar: Testen und Entscheiden Dozentin: Susanne Jäger Referentin: Julia Plato Datum: SF-36 Fragebogen zum Gesundheitszustand Seminar: Testen und Entscheiden Dozentin: Susanne Jäger Referentin: Julia Plato Datum: 03.02.2010 Gliederung 1. Überblicksartige Beschreibung 2. Testgrundlage 3.

Mehr

Was ist ein Test? Grundlagen psychologisch- diagnostischer Verfahren. Rorschach-Test

Was ist ein Test? Grundlagen psychologisch- diagnostischer Verfahren. Rorschach-Test Was ist ein Test? Ein Test ist ein wissenschaftliches Routineverfahren zur Untersuchung eines oder mehrerer empirisch abgrenzbarer Persönlichkeitsmerkmale mit dem Ziel einer möglichst quantitativen Aussage

Mehr

4.2 Grundlagen der Testtheorie

4.2 Grundlagen der Testtheorie 4.2 Grundlagen der Testtheorie Januar 2009 HS MD-SDL(FH) Prof. Dr. GH Franke Kapitel 5 Vertiefung: Reliabilität Kapitel 5 Vertiefung: Reliabilität 5.1 Definition Die Reliabilität eines Tests beschreibt

Mehr

GLIEDERUNG Das Messen eine Umschreibung Skalenniveaus von Variablen Drei Gütekriterien von Messungen Konstruierte Skalen in den Sozialwissenschaften

GLIEDERUNG Das Messen eine Umschreibung Skalenniveaus von Variablen Drei Gütekriterien von Messungen Konstruierte Skalen in den Sozialwissenschaften TEIL 3: MESSEN UND SKALIEREN GLIEDERUNG Das Messen eine Umschreibung Skalenniveaus von Variablen Drei Gütekriterien von Messungen Objektivität Reliabilität Validität Konstruierte Skalen in den Sozialwissenschaften

Mehr

Grundlagen sportwissenschaftlicher Forschung Test

Grundlagen sportwissenschaftlicher Forschung Test Grundlagen sportwissenschaftlicher Forschung Test Dr. Jan-Peter Brückner jpbrueckner@email.uni-kiel.de R.216 Tel. 880 4717 Was ist Messen? Grundlagen des Messens Zuordnen von Objekten (oder Ereignissen)

Mehr

3.2 Grundlagen der Testtheorie Methoden der Reliabilitätsbestimmung

3.2 Grundlagen der Testtheorie Methoden der Reliabilitätsbestimmung 3.2 Grundlagen der Testtheorie 3.2.6 Methoden der Reliabilitätsbestimmung 6.1 Was ist Reliabilität? 6.2 Retest-Reliabilität 6.3 Paralleltest-Reliabilität 6.4 Splithalf-(Testhalbierungs-)Reliabilität 6.5

Mehr

Grundlagen der Testkonstruktion

Grundlagen der Testkonstruktion Professur E-Learning und Neue Medien Institut für Medienforschung Philosophische Fakultät Grundlagen der Testkonstruktion Maik Beege M.Sc. Test und Fragebogen Fragebogen: Sammelausdruck für vielfältige

Mehr

Das Rasch-Modell und seine zentralen Eigenschaften

Das Rasch-Modell und seine zentralen Eigenschaften Das Rasch-Modell und seine zentralen Eigenschaften Stella Bollmann Seminar Psychometrische Modelle: Theorie und Anwendungen Institut für Statistik, LMU München München, 27. Mai 2014 Stella Bollmann Das

Mehr

Klassische Testtheorie (KTT) Klassische Testtheorie (KTT) Klassische Testtheorie (KTT)

Klassische Testtheorie (KTT) Klassische Testtheorie (KTT) Klassische Testtheorie (KTT) Klassische Testtheorie (KTT) Die KTT stellt eine Sammlung von Methoden dar, die seit Beginn des vorigen Jahrhunderts zur exakten und ökonomischen Erfassung interindividueller Unterschiede entwickelt wurden.

Mehr

Was ist eine Testtheorie?

Was ist eine Testtheorie? Was ist eine Testtheorie? Eine Testtheorie bezeichnet eine Gesamtheit von Methoden zur Behandlung der Fragestellungen, welche sich bei der Testkonstruktion und -auswertung ergeben. Dieser Begriff ist nicht

Mehr

Standardisierte Vorgehensweisen und Regeln zur Gewährleistung von: Eindeutigkeit Schlussfolgerungen aus empirischen Befunden sind nur dann zwingend

Standardisierte Vorgehensweisen und Regeln zur Gewährleistung von: Eindeutigkeit Schlussfolgerungen aus empirischen Befunden sind nur dann zwingend Standardisierte Vorgehensweisen und Regeln zur Gewährleistung von: Eindeutigkeit Schlussfolgerungen aus empirischen Befunden sind nur dann zwingend oder eindeutig, wenn keine alternativen Interpretationsmöglichkeiten

Mehr

Screening für Somatoforme Störungen. Seminar: Testen und Entscheiden Dozentin: Susanne Jäger Referentin: Maria Kortus Datum:

Screening für Somatoforme Störungen. Seminar: Testen und Entscheiden Dozentin: Susanne Jäger Referentin: Maria Kortus Datum: Screening für Somatoforme Störungen Seminar: Testen und Entscheiden Dozentin: Susanne Jäger Referentin: Maria Kortus Datum: 20.01.2010 Überblicksartige Beschreibung Autoren: Winfried Rief, Wolfgang Hiller

Mehr

Leistungs- und Persönlichkeitsmessung SoSe 2010 Prof. Dr. G. H. Franke/ S. Jäger, M.Sc. NEO-PI-R: NEO- PERSÖNLICHKEITSINVENTAR, REVIDIERTE FASSUNG

Leistungs- und Persönlichkeitsmessung SoSe 2010 Prof. Dr. G. H. Franke/ S. Jäger, M.Sc. NEO-PI-R: NEO- PERSÖNLICHKEITSINVENTAR, REVIDIERTE FASSUNG Leistungs- und Persönlichkeitsmessung SoSe 2010 Prof. Dr. G. H. Franke/ S. Jäger, M.Sc. NEO-PI-R: NEO- PERSÖNLICHKEITSINVENTAR, REVIDIERTE FASSUNG GLIEDERUNG: 1. Überblicksartige Beschreibung 2. Testgrundlage

Mehr

2.4 Indexbildung und Einblick in Skalierungsverfahren

2.4 Indexbildung und Einblick in Skalierungsverfahren 2.4 Indexbildung und Einblick in Skalierungsverfahren 79 15. November 2013 2.4.1 Indexbildung Zusammenfassung mehrerer Indikatoren eines Konstrukts zu einer Kennzahl. Oft sind Konstrukte mehrdimensional

Mehr

Methodenlehre. Vorlesung 4. Prof. Dr. Björn Rasch, Cognitive Biopsychology and Methods University of Fribourg

Methodenlehre. Vorlesung 4. Prof. Dr. Björn Rasch, Cognitive Biopsychology and Methods University of Fribourg Methodenlehre Vorlesung 4 Prof. Dr., Cognitive Biopsychology and Methods University of Fribourg 1 Methodenlehre II Woche Datum Thema 1 FQ Einführung, Verteilung der Termine 1 18.2.15 Psychologie als Wissenschaft

Mehr

Testtheorie und Testkonstruktion

Testtheorie und Testkonstruktion v *»» Testtheorie und Testkonstruktion von Michael Eid und Katharina Schmidt HOGREFE GÖTTINGEN BERN WIEN PARIS OXFORD PRAG TORONTO BOSTON AMSTERDAM KOPENHAGEN STOCKHOLM FLORENZ HELSINKI Inhaltsverzeichnis

Mehr

Rekodierung invertierter Items

Rekodierung invertierter Items 16.Testkonstruktion Items analysieren (imrahmen der KTT) Pretest Aussortieren / Umschreiben von unverständlichen, uneindeutigen oder inakzeptablen Items empirische Prüfung Kennwerte: Itemschwierigkeit

Mehr

Trierer Alkoholismusinventar

Trierer Alkoholismusinventar Trierer Alkoholismusinventar Seminar: Testen & Entscheiden Dozentin: Susanne Jäger Referent: Michael Gabriel 1. Überblicksartige Beschreibung Titel: Trierer Alkoholismusinventar (TAI) Autoren: Wilma Funke,

Mehr

Gütekriterien HS Sprachstandsdiagnose und Sprachförderung SS2011 Referentin: Meghann Munro

Gütekriterien HS Sprachstandsdiagnose und Sprachförderung SS2011 Referentin: Meghann Munro Gütekriterien HS Sprachstandsdiagnose und Sprachförderung SS2011 Referentin: Meghann Munro Vorüberlegungen Wie objektiv ist der Test in seiner Durchführung, Auswertung und Interpretation? Misst das Verfahren

Mehr

Prof. Dr. Gabriele Helga Franke TESTTHEORIE UND TESTKONSTRUKTION

Prof. Dr. Gabriele Helga Franke TESTTHEORIE UND TESTKONSTRUKTION Prof. Dr. Gabriele Helga Franke TESTTHEORIE UND TESTKONSTRUKTION 1. FS Master Rehabilitationspsychologie, SoSe 2012 Normierung 2 Begriffsbestimmung Zweck der Normierung Vorgehen bei der Normierung Exkurs:

Mehr

FH Magdeburg-Stendal, Studiengang Rehabilitationspsychologie Seminar Testen und Entscheiden Dozentin Susanne Jäger Referentin Angela Franke, 1. Sem.

FH Magdeburg-Stendal, Studiengang Rehabilitationspsychologie Seminar Testen und Entscheiden Dozentin Susanne Jäger Referentin Angela Franke, 1. Sem. FH Magdeburg-Stendal, Studiengang Rehabilitationspsychologie Seminar Testen und Entscheiden Dozentin Susanne Jäger Referentin Angela Franke, 1. Sem. Master 09.12.2009 1. Überblicksartige Beschreibung Patientenfragebogen

Mehr

Empirische Forschung. Übung zur Vorlesung Kognitive Modellierung. Kognitive Modellierung Dorothea Knopp Angewandte Informatik/ Kognitve Systeme

Empirische Forschung. Übung zur Vorlesung Kognitive Modellierung. Kognitive Modellierung Dorothea Knopp Angewandte Informatik/ Kognitve Systeme Empirische Forschung Übung zur Vorlesung Kognitive Modellierung S. 1 Gliederung 1. Was ist empirische Forschung? 2. Empirie Theorie 3. Gütekriterien empirischer Forschung 4. Sammlung von Daten 5. Beschreibung

Mehr

Auswahl von Testaufgaben

Auswahl von Testaufgaben Auswahl von Testaufgaben Auswahl von Testaufgaben Itemformat Formulierung Probleme/Verfälschungen Itemanalyse Skalen Itemformat Nach Bortz Offene Beantwortung Nach Bühning Freies Itemformat Halboffene

Mehr

I-S-T 2000-R: INTELLIGENZ- STRUKTUR TEST 2000-R BITTE HANDBUCH ANSEHEN

I-S-T 2000-R: INTELLIGENZ- STRUKTUR TEST 2000-R BITTE HANDBUCH ANSEHEN Leistungs- und Persönlichkeitsmessung SoSe 2010 Prof. Dr. G. H. Franke/ S. Jäger, M.Sc. I-S-T 2000-R: INTELLIGENZ- STRUKTUR TEST 2000-R BITTE HANDBUCH ANSEHEN GLIEDERUNG: 1. Überblicksartige Beschreibung

Mehr

Aufbau des Testberichts. 1. Problemstellung / inhaltliche Einführung. 2. Methode

Aufbau des Testberichts. 1. Problemstellung / inhaltliche Einführung. 2. Methode Aufbau des Testberichts Titelblatt (Beliebig) Zusammenfassung Inhaltsverzeichnis Einführung / theoretisch-inhaltlicher Hintergrund Methode: Konstruktion und Aufbau des Tests, Datenerhebung Ergebnisse Diskussion

Mehr

Was ist eine Testtheorie? Grundlagen der Item-Response. Response-Theorie. Modelle mit latenten Variablen

Was ist eine Testtheorie? Grundlagen der Item-Response. Response-Theorie. Modelle mit latenten Variablen Was ist eine Testtheorie? Eine Testtheorie beschäftigt sich also mit dem Zusammenhang zwischen Testverhalten und dem zu erfassenden Merkmal. Testauswertung Persönlichkeitsmerkmal (z.b. Emotionalität, Fähigkeit)

Mehr

Beispielberechnung Normierung

Beispielberechnung Normierung 1 Beispielberechnung Normierung Auszug Kursunterlagen MAS ZFH in Berufs-, Studien- und Laufbahnberatung Prof. Dr. Marc Schreiber, Dezember 2016 Verschiedene Formen der Normierung (interaktiv) Referenz:

Mehr

Lehrbuch Testtheorie - Testkonstruktion

Lehrbuch Testtheorie - Testkonstruktion Jürgen Rost Lehrbuch Testtheorie - Testkonstruktion Zweite, vollständig überarbeitete und erweiterte Auflage Verlag Hans Huber Bern Göttingen Toronto Seattle Inhaltsverzeichnis Vorwort zur zweiten Auflage

Mehr

Klausur Testtheorie: Antworten und Lösungen

Klausur Testtheorie: Antworten und Lösungen Name: Matrikelnummer: Klausur Testtheorie: Antworten und Lösungen Psychologisches Institut der JGU Mainz Freitag, 24. 07. 09 Bitte vergessen Sie nicht, Ihren Namen und Ihre Matrikelnummer anzugeben! 1.

Mehr

= = =0,2=20% 25 Plätze Zufallsübereinstimmung: 0.80 x x 0.20 = %

= = =0,2=20% 25 Plätze Zufallsübereinstimmung: 0.80 x x 0.20 = % allgemein Klassifizierung nach Persönlichkeitseigenschaften Messung von Persönlichkeitseigenschaften Zuordnung von Objekten zu Zahlen, so dass die Beziehungen zwischen den Zahlen den Beziehungen zwischen

Mehr

fh management, communication & it Constantin von Craushaar fh-management, communication & it Statistik Angewandte Statistik

fh management, communication & it Constantin von Craushaar fh-management, communication & it Statistik Angewandte Statistik fh management, communication & it Folie 1 Überblick Grundlagen (Testvoraussetzungen) Mittelwertvergleiche (t-test,..) Nichtparametrische Tests Korrelationen Regressionsanalyse... Folie 2 Überblick... Varianzanalyse

Mehr

Hausaufgaben. Antwort und 4 guten Distraktoren zum gelesenen Text!

Hausaufgaben. Antwort und 4 guten Distraktoren zum gelesenen Text! Hausaufgaben Welche wesentlichen Vorteile haben formelle Schulleistungstests? Welche Nachteile haben Schulleistungstests? Überlegen Sie sich 2 gute Multiplechoice-Fragen mit je einer richtigen Antwort

Mehr

Dozent: Dawid Bekalarczyk Universität Duisburg-Essen Fachbereich Gesellschaftswissenschaften Institut für Soziologie Lehrstuhl für empirische

Dozent: Dawid Bekalarczyk Universität Duisburg-Essen Fachbereich Gesellschaftswissenschaften Institut für Soziologie Lehrstuhl für empirische TEIL 3: MESSEN UND SKALIEREN 1 Das Messen eine Umschreibung Feststellung der Merkmalsausprägungen von Untersuchungseinheiten (z.b. Feststellung, wie viel eine Person wiegt oder Feststellung, wie aggressiv

Mehr

Psychologische Diagnostik

Psychologische Diagnostik Dr. Andreas Eickhorst Pädagogische Psychologie Psychologische Diagnostik Themen 1. Was ist Diagnostik? 2. Was ist psychologische Diagnostik? 3. Arten diagnostischer Verfahren 4. Diagnostik in der Schule

Mehr

Vorlesung Testtheorien. Dr. Tobias Constantin Haupt, MBA Sommersemester 2007

Vorlesung Testtheorien. Dr. Tobias Constantin Haupt, MBA Sommersemester 2007 Vorlesung Testtheorien Dr. Tobias Constantin Haupt, MBA Sommersemester 2007 Formale Kriterien einer guten Testaufgabe Objektivität: Sie muss von verschiedenen Auswertern gleichermaßen als richtig oder

Mehr

Grundlagen sportwissenschaftlicher Forschung Deskriptive Statistik 2 Inferenzstatistik 1

Grundlagen sportwissenschaftlicher Forschung Deskriptive Statistik 2 Inferenzstatistik 1 Grundlagen sportwissenschaftlicher Forschung Deskriptive Statistik 2 Inferenzstatistik 1 Dr. Jan-Peter Brückner jpbrueckner@email.uni-kiel.de R.216 Tel. 880 4717 Rückblick: Besonders wichtige Themen Wissenschaftstheoretischer

Mehr

Vorlesung Testtheorien. Dr. Tobias Constantin Haupt, MBA Sommersemester 2007

Vorlesung Testtheorien. Dr. Tobias Constantin Haupt, MBA Sommersemester 2007 Vorlesung Testtheorien Dr. Tobias Constantin Haupt, MBA Sommersemester 2007 Probabilistische Testtheorie # 2 Itemcharakteristische Funktionen (Itemcharakteristiken, IC - Funktion): Diese beschreibt die

Mehr

Statistik II: Grundlagen und Definitionen der Statistik

Statistik II: Grundlagen und Definitionen der Statistik Medien Institut : Grundlagen und Definitionen der Statistik Dr. Andreas Vlašić Medien Institut (0621) 52 67 44 vlasic@medien-institut.de Gliederung 1. Hintergrund: Entstehung der Statistik 2. Grundlagen

Mehr

einzelne Items werden mit Zahlen verknüpft und nach festgelegten Regeln zu einem Score verrechnet

einzelne Items werden mit Zahlen verknüpft und nach festgelegten Regeln zu einem Score verrechnet 1 Psychologische Testverfahren: Definition Definition Lienert und Raatz (1998, S.1) ein eines oder mehrerer mit dem Ziel einer über den relativen Grad der wissenschaftliches Routineverfahren zur Untersuchung

Mehr

DATENERHEBUNG: MESSEN-OPERATIONALISIEREN - SKALENARTEN

DATENERHEBUNG: MESSEN-OPERATIONALISIEREN - SKALENARTEN DATENERHEBUNG: MESSEN-OPERATIONALISIEREN - SKALENARTEN Was ist Messen? Messen - im weitesten Sinne - ist die Zuordnung von Zahlen zu Objekten und Ereignissen entsprechend einer Regel (Def. nach Stevensen

Mehr

Tests. Eine Einführung

Tests. Eine Einführung Eine Einführung Dr. Uwe Wiest, Delmenhorst 2005, 2018 Testaufgaben Wozu der ganze Umstand? Sauber konstruierte und normierte Tests erlauben es, über die Leistungsfähigkeit einer Person in einem definierten

Mehr

Vorlesung Testtheorien. Dr. Tobias Constantin Haupt, MBA Sommersemester 2007

Vorlesung Testtheorien. Dr. Tobias Constantin Haupt, MBA Sommersemester 2007 Vorlesung Testtheorien Dr. Tobias Constantin Haupt, MBA Sommersemester 2007 Konstruktvalidität: MTMM # 2 Konstruktvalidität: MTMM # 3 Konstruktvalidität: Probleme der MTMM Die Analysekriterien der MTMM

Mehr

Was heißt messen? Konzeptspezifikation Operationalisierung Qualität der Messung

Was heißt messen? Konzeptspezifikation Operationalisierung Qualität der Messung Was heißt messen? Ganz allgemein: Eine Eigenschaft eines Objektes wird ermittelt, z.b. die Wahlabsicht eines Bürgers, das Bruttosozialprodukt eines Landes, die Häufigkeit von Konflikten im internationalen

Mehr

Statistik. Jan Müller

Statistik. Jan Müller Statistik Jan Müller Skalenniveau Nominalskala: Diese Skala basiert auf einem Satz von qualitativen Attributen. Es existiert kein Kriterium, nach dem die Punkte einer nominal skalierten Variablen anzuordnen

Mehr

Pädagogisch-psychologische Diagnostik und Evaluation

Pädagogisch-psychologische Diagnostik und Evaluation Pädagogisch-psychologische Diagnostik und Evaluation G H R D ab 3 HSe 2stg. Mo 16 18, KG IV Raum 219 Prof. Dr. C. Mischo Sprechstunde: Mittwoch 16:00-17:00, KG IV Raum 213 Folien unter http://home.ph-freiburg.de/mischofr/lehre/diagss06/

Mehr

Bildungsurlaub-Seminare: Lerninhalte und Programm

Bildungsurlaub-Seminare: Lerninhalte und Programm Bildungsurlaub-Seminare: Lerninhalte und Programm Seminartitel Einführung Testtheorie und Testkonstruktion für Psychologen/innen (BH16116) Termin Mo, den 30.05. bis Fr, den 03.06.2016 Kursgebühr: 179,-

Mehr

Methodenlehre. Vorlesung 12. Prof. Dr. Björn Rasch, Cognitive Biopsychology and Methods University of Fribourg

Methodenlehre. Vorlesung 12. Prof. Dr. Björn Rasch, Cognitive Biopsychology and Methods University of Fribourg Methodenlehre Vorlesung 12 Prof. Dr., Cognitive Biopsychology and Methods University of Fribourg 1 Methodenlehre II Woche Datum Thema 1 FQ Einführung, Verteilung der Termine 1 18.2.15 Psychologie als Wissenschaft

Mehr

Angewandte Statistik 3. Semester

Angewandte Statistik 3. Semester Angewandte Statistik 3. Semester Übung 5 Grundlagen der Statistik Übersicht Semester 1 Einführung ins SPSS Auswertung im SPSS anhand eines Beispieles Häufigkeitsauswertungen Grafiken Statistische Grundlagen

Mehr

6. Faktorenanalyse (FA) von Tests

6. Faktorenanalyse (FA) von Tests 6. Faktorenanalyse (FA) von Tests 1 6. Faktorenanalyse (FA) von Tests 1 6.1. Grundzüge der FA nach der Haupkomponentenmethode (PCA) mit anschliessender VARIMAX-Rotation:... 2 6.2. Die Matrizen der FA...

Mehr

1. Maße der zentralen Tendenz Beispiel: Variable Anzahl der Geschwister aus Jugend '92. Valid Cum Value Frequency Percent Percent Percent

1. Maße der zentralen Tendenz Beispiel: Variable Anzahl der Geschwister aus Jugend '92. Valid Cum Value Frequency Percent Percent Percent Deskriptive Statistik 1. Verteilungsformen symmetrisch/asymmetrisch unimodal(eingipflig) / bimodal (zweigipflig schmalgipflig / breitgipflig linkssteil / rechtssteil U-förmig / abfallend Statistische Kennwerte

Mehr

Einführung in die Test- und Fragebogenkonstruktion

Einführung in die Test- und Fragebogenkonstruktion Markus Bühner 1 Einführung in die Test- und Fragebogenkonstruktion 2., aktualisierte und erweiterte Auflage PEARSON Studium ein Imprint von Pearson Education München Boston San Francisco Harlow, England

Mehr

Forschungsmethoden VORLESUNG WS 2017/2018

Forschungsmethoden VORLESUNG WS 2017/2018 Forschungsmethoden VORLESUNG WS 2017/2018 SOPHIE LUKES Übersicht Letzte Sitzung: Psychologie als empirische Wissenschaft Heute: Messen Rückblick: Qualitativer vs. quantitativer Ansatz Qualitativ Quantitativ

Mehr

Item-Response-Theorie Probabilistische Testtheorie. Christian Stroppel

Item-Response-Theorie Probabilistische Testtheorie. Christian Stroppel Item-Response-Theorie Probabilistische Testtheorie Referat von: Christian Stroppel Testtheorie Personenparameter Latente Variable ξ Testtheorie Manifeste Variable Xvi Eine Testtheorie beschreibt in welchem

Mehr

Forschungsstatistik I

Forschungsstatistik I Psychologie Prof. Dr. G. Meinhardt 6. Stock, TB II R. 06-206 (Persike) R. 06-321 (Meinhardt) Sprechstunde jederzeit nach Vereinbarung Forschungsstatistik I Dr. Malte Persike persike@uni-mainz.de http://psymet03.sowi.uni-mainz.de/

Mehr

4.2 Grundlagen der Testtheorie. Wintersemester 2008 / 2009 Hochschule Magdeburg-Stendal (FH) Frau Prof. Dr. Gabriele Helga Franke

4.2 Grundlagen der Testtheorie. Wintersemester 2008 / 2009 Hochschule Magdeburg-Stendal (FH) Frau Prof. Dr. Gabriele Helga Franke 4.2 Grundlagen der Testtheorie Wintersemester 2008 / 2009 Hochschule Magdeburg-Stendal (FH) Frau Prof. Dr. Gabriele Helga Franke GHF im WiSe 2008 / 2009 an der HS MD-SDL(FH) im Studiengang Rehabilitationspsychologie,

Mehr

Psychologische Diagnostik

Psychologische Diagnostik Psychologische Diagnostik von Andre Beauducel und Anja Leue '> -HpGREFE GÖTTINCEN BERN WIEN PARIS OXFORD PRAG TORONTO BOSTON AMSTERDAM KOPENHAGEN STOCKHOLM FLORENZ - HELSINKI Inhaltsverzeichnis Vorwort

Mehr

Methodenlehre. Vorlesung 11. Prof. Dr. Björn Rasch, Cognitive Biopsychology and Methods University of Fribourg

Methodenlehre. Vorlesung 11. Prof. Dr. Björn Rasch, Cognitive Biopsychology and Methods University of Fribourg Methodenlehre Vorlesung 11 Prof. Dr., Cognitive Biopsychology and Methods University of Fribourg 1 03.12.13 Methodenlehre I Woche Datum Thema 1 FQ Einführung, Verteilung der Termine 1 25.9.13 Psychologie

Mehr

Methodenlehre. Vorlesung 10. Prof. Dr. Björn Rasch, Cognitive Biopsychology and Methods University of Fribourg

Methodenlehre. Vorlesung 10. Prof. Dr. Björn Rasch, Cognitive Biopsychology and Methods University of Fribourg Methodenlehre Vorlesung 10 Prof. Dr., Cognitive Biopsychology and Methods University of Fribourg 1 Methodenlehre I Woche Datum Thema 1 FQ Einführung, Verteilung der Termine 1 25.9.13 Psychologie als Wissenschaft

Mehr

Inventar zur Erfassung interpersonaler Probleme (IIP-D)

Inventar zur Erfassung interpersonaler Probleme (IIP-D) Inventar zur Erfassung interpersonaler Probleme (IIP-D) Referentin: Sabrina Schulz Seminar: Testen und Entscheiden Dozentin: Frau Franke Datum: 19.01.2010 1. Überblicksartige Beschreibung Titel: Inventar

Mehr

TRIERER INVENTAR ZUM CHRONISCHEN STRESS

TRIERER INVENTAR ZUM CHRONISCHEN STRESS TRIERER INVENTAR ZUM CHRONISCHEN STRESS Daniel Nowik, Testen und Entscheiden, 01.12.2009 Überblicksartige Beschreibung Autoren: Peter Schulz, Wolff Schlotz & Peter Becker Erschienen: 2004 im Hogrefe Verlag

Mehr

Methodenlehre. Vorlesung 10. Prof. Dr. Björn Rasch, Cognitive Biopsychology and Methods University of Fribourg

Methodenlehre. Vorlesung 10. Prof. Dr. Björn Rasch, Cognitive Biopsychology and Methods University of Fribourg Methodenlehre Vorlesung 10 Prof. Dr., Cognitive Biopsychology and Methods University of Fribourg 1 Methodenlehre II Woche Datum Thema 1 FQ Einführung, Verteilung der Termine 1 18.2.15 Psychologie als Wissenschaft

Mehr

Testen und Entscheiden Referentin: Christiane Beck Datum: Dozentin: Susanne Jäger. Hochschule Magdeburg-Stendal (FH)

Testen und Entscheiden Referentin: Christiane Beck Datum: Dozentin: Susanne Jäger. Hochschule Magdeburg-Stendal (FH) Seminar: Testen und Entscheiden Referentin: Christiane Beck Datum: 03.01.2010 Dozentin: Susanne Jäger Hochschule Magdeburg-Stendal (FH) 1. Überblicksartige Beschreibung 2. Testgrundlage 3. Testdurchführung

Mehr

Inhalt. I Einführung. Kapitel 1 Konzept des Buches Kapitel 2 Messen in der Psychologie... 27

Inhalt. I Einführung. Kapitel 1 Konzept des Buches Kapitel 2 Messen in der Psychologie... 27 Inhalt I Einführung Kapitel 1 Konzept des Buches........................................ 15 Kapitel 2 Messen in der Psychologie.................................. 27 2.1 Arten von psychologischen Messungen....................

Mehr

Der Stressverarbeitungsfragebogen von Janke und Erdmann angepasst für Kinder und Jugendliche (SVF-KJ)

Der Stressverarbeitungsfragebogen von Janke und Erdmann angepasst für Kinder und Jugendliche (SVF-KJ) Der Stressverarbeitungsfragebogen von Janke und Erdmann angepasst für Kinder und Jugendliche (SVF-KJ) Testen und Entscheiden 12.01.2010 Dozentin: Prof. Dr. G. H. Franke Referentin: Gunhild Seuthe Überblicksartige

Mehr

1 x 1 y 1 2 x 2 y 2 3 x 3 y 3... n x n y n

1 x 1 y 1 2 x 2 y 2 3 x 3 y 3... n x n y n 3.2. Bivariate Verteilungen zwei Variablen X, Y werden gemeinsam betrachtet (an jedem Objekt werden gleichzeitig zwei Merkmale beobachtet) Beobachtungswerte sind Paare von Merkmalsausprägungen (x, y) Beispiele:

Mehr

Parametrische vs. Non-Parametrische Testverfahren

Parametrische vs. Non-Parametrische Testverfahren Parametrische vs. Non-Parametrische Testverfahren Parametrische Verfahren haben die Besonderheit, dass sie auf Annahmen zur Verteilung der Messwerte in der Population beruhen: die Messwerte sollten einer

Mehr

Dr. Barbara Lindemann. Fragebogen. Kolloquium zur Externen Praxisphase. Dr. Barbara Lindemann 1

Dr. Barbara Lindemann. Fragebogen. Kolloquium zur Externen Praxisphase. Dr. Barbara Lindemann 1 Dr. Barbara Lindemann Fragebogen Kolloquium zur Externen Praxisphase Dr. Barbara Lindemann 1 Überblick 1. Gütekriterien quantitativer Forschungen 2. Fragebogenkonstruktion 3. Statistische Datenanalyse

Mehr

Daten, Datentypen, Skalen

Daten, Datentypen, Skalen Bildung kommt von Bildschirm und nicht von Buch, sonst hieße es ja Buchung. Daten, Datentypen, Skalen [main types of data; levels of measurement] Die Umsetzung sozialwissenschaftlicher Forschungsvorhaben

Mehr

Statistik II. IV. Hypothesentests. Martin Huber

Statistik II. IV. Hypothesentests. Martin Huber Statistik II IV. Hypothesentests Martin Huber 1 / 41 Übersicht Struktur eines Hypothesentests Stichprobenverteilung t-test: Einzelner-Parameter-Test F-Test: Multiple lineare Restriktionen 2 / 41 Struktur

Mehr

Exploratorische Faktorenanalyse. Exploratorische Faktorenanalyse. Exploratorische Faktorenanalyse

Exploratorische Faktorenanalyse. Exploratorische Faktorenanalyse. Exploratorische Faktorenanalyse Exploratorische Faktorenanalyse Der Begriff Faktorenanalyse umfasst eine Gruppe multivariater Analyseverfahren, mit denen zugrundeliegende gemeinsame Dimensionen von Variablenmengen (z.b. Fragebogenitems)

Mehr

Allgemeines zu Tests. Statistische Hypothesentests

Allgemeines zu Tests. Statistische Hypothesentests Statistische Hypothesentests Allgemeines zu Tests Allgemeines Tests in normalverteilten Grundgesamtheiten Asymptotische Tests Statistischer Test: Verfahren Entscheidungsregel), mit dem auf Basis einer

Mehr

Softwaretechnik. Prof. Dr. Rainer Koschke. Fachbereich Mathematik und Informatik Arbeitsgruppe Softwaretechnik Universität Bremen

Softwaretechnik. Prof. Dr. Rainer Koschke. Fachbereich Mathematik und Informatik Arbeitsgruppe Softwaretechnik Universität Bremen Softwaretechnik Prof. Dr. Rainer Koschke Fachbereich Mathematik und Informatik Arbeitsgruppe Softwaretechnik Universität Bremen Wintersemester 2010/11 Überblick I Statistik bei kontrollierten Experimenten

Mehr

Bivariate Analyseverfahren

Bivariate Analyseverfahren Bivariate Analyseverfahren Bivariate Verfahren beschäftigen sich mit dem Zusammenhang zwischen zwei Variablen Beispiel: Konservatismus/Alter Zusammenhangsmaße beschreiben die Stärke eines Zusammenhangs

Mehr

Regression ein kleiner Rückblick. Methodenseminar Dozent: Uwe Altmann Alexandra Kuhn, Melanie Spate

Regression ein kleiner Rückblick. Methodenseminar Dozent: Uwe Altmann Alexandra Kuhn, Melanie Spate Regression ein kleiner Rückblick Methodenseminar Dozent: Uwe Altmann Alexandra Kuhn, Melanie Spate 05.11.2009 Gliederung 1. Stochastische Abhängigkeit 2. Definition Zufallsvariable 3. Kennwerte 3.1 für

Mehr

Klausur Statistik I Dr. Andreas Voß Wintersemester 2005/06

Klausur Statistik I Dr. Andreas Voß Wintersemester 2005/06 Klausur Statistik I Dr. Andreas Voß Wintersemester 2005/06 Hiermit versichere ich, dass ich an der Universität Freiburg mit dem Hauptfach Psychologie eingeschrieben bin Name: Mat.Nr.: Unterschrift: Bearbeitungshinweise:

Mehr

Faktorenanalysen mit SPSS. Explorative Faktorenanalyse als Instrument der Dimensionsreduzierung. Interpretation des SPSS-Output s

Faktorenanalysen mit SPSS. Explorative Faktorenanalyse als Instrument der Dimensionsreduzierung. Interpretation des SPSS-Output s Explorative Faktorenanalyse als Instrument der Dimensionsreduzierung Beispiel: Welche Dimensionen charakterisieren die Beurteilung des sozialen Klimas in der Nachbarschaft? Variablen: q27a bis q27g im

Mehr

Grundlagen sportwissenschaftlicher Forschung Untersuchungsplanung 2 und Grundlagen des Messens

Grundlagen sportwissenschaftlicher Forschung Untersuchungsplanung 2 und Grundlagen des Messens Grundlagen sportwissenschaftlicher Forschung Untersuchungsplanung 2 und Grundlagen des Messens Dr. Jan-Peter Brückner jpbrueckner@email.uni-kiel.de R.216 Tel. 880 4717 AUFGABE 1. Beschreibe einen experimentellen

Mehr