Gütekriterien: Validität (15.5.)

Ähnliche Dokumente
Forschungsmethoden VORLESUNG SS 2017

Forschungsmethoden VORLESUNG WS 2017/2018

Vorlesung Testtheorien. Dr. Tobias Constantin Haupt, MBA Sommersemester 2007

Testtheorie und Gütekriterien von Messinstrumenten. Objektivität Reliabilität Validität

Eigene MC-Fragen Testgütekriterien (X aus 5) 2. Das Ausmaß der Auswertungsobjektivität lässt sich in welcher statistischen Kennzahl angeben?

Tutorium Testtheorie. Termin 3. Inhalt: WH: Hauptgütekriterien- Reliabilität & Validität. Charlotte Gagern

Einführung in die Statistik Testgütekriterien

Welche Gütekriterien sind bei der Bewertung von Lernleistungen

Gütekriterien von Messungen

I-S-T 2000-R: INTELLIGENZ- STRUKTUR TEST 2000-R BITTE HANDBUCH ANSEHEN

Forschungsmethoden VORLESUNG WS 2017/2018

Objektivität und Validität. Testgütekriterien. Objektivität. Validität. Reliabilität. Objektivität

Hausaufgaben. Antwort und 4 guten Distraktoren zum gelesenen Text!

Forschungsmethoden VORLESUNG SS 2017

Tests. Eine Einführung

GLIEDERUNG Das Messen eine Umschreibung Skalenniveaus von Variablen Drei Gütekriterien von Messungen Konstruierte Skalen in den Sozialwissenschaften

Grundlagen sportwissenschaftlicher Forschung Test

TRIERER INVENTAR ZUM CHRONISCHEN STRESS

Gütekriterien HS Sprachstandsdiagnose und Sprachförderung SS2011 Referentin: Meghann Munro

RETESTRELIABILITÄT. Teststabilität. Korrelation wiederholter Testdurchführungen. Persönlichkeitstests. Stabilität des Zielmerkmals.

Messung Emotionaler Intelligenz. Prof. Dr. Astrid Schütz - Universität Bamberg

Pädagogisch-psychologische Diagnostik und Evaluation

Messtherorie Definitionen

SF-36 Fragebogen zum Gesundheitszustand. Seminar: Testen und Entscheiden Dozentin: Susanne Jäger Referentin: Julia Plato Datum:

Screening für Somatoforme Störungen. Seminar: Testen und Entscheiden Dozentin: Susanne Jäger Referentin: Maria Kortus Datum:

Psychologische Diagnostik

Beispielberechnung Normierung

6. Zusammenfassende Diskussion

Auszubildend einstellen ohne Noten? Geht das? Ein neuer Weg der Rekrutierung

= = =0,2=20% 25 Plätze Zufallsübereinstimmung: 0.80 x x 0.20 = %

Einführung in die sonderpädagogische Diagnostik

GHF SoSe 2011 HS MD-SDL

T E S T G Ü T E K R I T E R I E N W O R K S H O P I N F R E I B U R G N O V E M B E R

Methodenlehre. Vorlesung 4. Prof. Dr. Björn Rasch, Cognitive Biopsychology and Methods University of Fribourg

Grundintelligenztest CFT 20-R

Vorlesung Testtheorien. Dr. Tobias Constantin Haupt, MBA Sommersemester 2007

Leistungs- und Persönlichkeitsmessung SoSe 2010 Prof. Dr. G. H. Franke/ S. Jäger, M.Sc. NEO-PI-R: NEO- PERSÖNLICHKEITSINVENTAR, REVIDIERTE FASSUNG

FH Magdeburg-Stendal, Studiengang Rehabilitationspsychologie Seminar Testen und Entscheiden Dozentin Susanne Jäger Referentin Angela Franke, 1. Sem.

DATENERHEBUNG: MESSEN-OPERATIONALISIEREN - SKALENARTEN

Inhaltsverzeichnis Abkürzungsverzeichnis... 9 Einleitung und Aufbau der Arbeit... 11

Dozent: Dawid Bekalarczyk Universität Duisburg-Essen Fachbereich Gesellschaftswissenschaften Institut für Soziologie Lehrstuhl für empirische

Empirische Forschung. Übung zur Vorlesung Kognitive Modellierung. Kognitive Modellierung Dorothea Knopp Angewandte Informatik/ Kognitve Systeme

Inhaltsverzeichnis 4. Band ALLGEMEINE PROBLEMSTELLUNG AUFBAU DER ARBEIT ALLGEMEINE ANMERKUNGEN UND EINSCHRÄN- KUNGEN 36

Grundlagen empirischer Forschung 3. LV. Gütekriterien von Erhebungsverfahren, Tests. Studieren für die berufliche Praxis.

Trierer Alkoholismusinventar

Sozialkapital Messen, Erkennen, Nutzen

MMGC Das Multi Motiv Gitter für Anschluss, Leistung und Macht in der Computerdarbietung

Markt- und Werbepsychologie. Band 1 Grundlagen

Dr. Barbara Lindemann. Fragebogen. Kolloquium zur Externen Praxisphase. Dr. Barbara Lindemann 1

Messung, Skalen, Indices

Patientenfragebogen zur Erfassung der Rehabilitations-Motivation PAREMO-20

Studienseminar Koblenz. Diagnostische Expertise - Leistungsmessung

BIP. Bochumer Inventar zur berufsbezogenen Persönlichkeitsbeschreibung

GÜTEKRITERIEN SPEZIFISCH p. 1

Prinzipien der Fahreignungsdiagnostik Wie sind Tests und Testergebnisse zu beurteilen?

Eine Vielzahl von Tests sind gebräuchlich, jedoch sollte man bei der Entscheidung über den Einsatz folgende 4 Merksätze bedenken:

Reliabilitäts- und Itemanalyse

Diagnostik und Förderung des Leseverständnisses mit ELFE 1-6 und ELFE T. November 2010 Dr. Alexandra Lenhard 1 PSYCHOLOGISCHEN

Dozent: Dawid Bekalarczyk Universität Duisburg-Essen Fachbereich Gesellschaftswissenschaften Institut für Soziologie Lehrstuhl für empirische

Kognitive Profile bei kinder- und jugendpsychiatrischen Störungsbildern

Welche psychometrischen Tests sollte der Arzt kennen und interpretieren können? Dipl.-Psych. Patricia Albert Schmerzzentrum

Testtheorie und Fragebogenkonstruktion

Verfahren zur Skalierung. A. Die "klassische" Vorgehensweise - nach der Logik der klassischen Testtheorie

Grundlagen der Testkonstruktion

I Überblicksartige Beschreibung. II Testgrundlage. III Testdurchführung. IV Testverwertung. V Erfahrungen BDI-II

Methoden der Psychologie Dr. Z. Shi Wiss. Arbeiten

Intelligenz, Wissen und Problemlösen

IMPULS-Test 2 Wissenschaftliche Basis. Mag. Leonard Schünemann

Testtheoretische Kritik mündlicher und schriftliche Prüfungen (29.5)

Methode der Naturwissenschaften

Einschulungspraxis Das Konstrukt der Schulreife nach Artur Kern Tests zur Erfassung der Schulreife Kritik am Konzept und an der prognostischen

Insbesondere Selektionsdiagnostik/Eignungsdiagnostik gerät immer wieder gesellschaftspolitisch in Verruf Modifikationsdiagnostik gewinnt an Bedeutung:

4.2 Grundlagen der Testtheorie

Jetzt für. Jährige IDS-2. Intelligenz- und Entwicklungsskalen für Kinder und Jugendliche

Empirisches Relativ: Eine Menge von Objekten, über die eine Relation definiert wurde.

Inhaltsverzeichnis. Vorwort... 11

Methodenlehre. Vorlesung 4. Prof. Dr. Björn Rasch, Cognitive Biopsychology and Methods University of Fribourg

Psychologische Diagnostik

Leistungs- und Persönlichkeitsmessung SoSe 2010 Prof. Dr. G. H. Franke/ S. Jäger, M.Sc. TEST d2: AUFMERKSAMKEITS- BELASTUNGS-TEST

Gütekriterien. Gütekriterien. Gütekriterien. Reliabilität Validität. Spezifität. Sensitivität. Praktikabilität.

Grundlagen der empirischen Sozialforschung

Auch in der Testkonstruktion ist weniger manchmal mehr

Übung Methodenlehre I, SeKo

Vorlesung Testtheorien. Dr. Tobias Constantin Haupt, MBA Sommersemester 2007

Testtheorie 11. Juni Testtheorie. Dr. Sascha Borchers Regionale Schulberatungsstelle des Kreises Borken

Testen und Entscheiden Referentin: Christiane Beck Datum: Dozentin: Susanne Jäger. Hochschule Magdeburg-Stendal (FH)

IBS-KJ Interviews zu Belastungsstörungen bei Kindern und Jugendlichen

Einführung in die sonderpädagogische Diagnostik

(1) Was sind wichtige Kriterien von Diagnostik im Sinne zweckgebundenen Messens? (2) Warum sollte Diagnostik so systematisch wie möglich erfolgen?

Fragebögen leicht gemacht Psychometrie für Nicht-Psychologen

Diplomarbeit. Titel der Arbeit

Fakultät für Psychologie Ru h r-u n iversität- Boch u m. Diplomarbeit Vorgelegt dem Ausschuss Für die Diplom-Prüfung der Psychologen.

Das Minimale Dokumentationssystem (MIDOS²) als deutsche Version der Edmonton Symptom Assessment Scale (ESAS): - Ein Instrument für die Pflege?

Leseselbstkonzept zu Beginn der Grundschulzeit

Fragebögen leicht gemacht Psychometrie für Nicht-Psychologen

Lehrbuch Psychologische Diagnostik

Transkript:

Gütekriterien: Validität (15.5.) Besprechung der Hausaufgaben Validität: Arten und Schätzmethoden Inhaltsvalidität Empirische Validität Konstruktvalidität Testfairness Normierung Nebengütekriterien Zusammenfassung

Validität (Gültigkeit) Grad in dem ein Test das misst, was er messen soll Beispiel: Waage zur Größenmessung Waage

Validität (Gültigkeit) Grad, in dem ein Test das misst, was er messen soll Validität Inhaltsvalidität Empirische V. Entweder Item- Stichprobe aus gesamten Verhaltenbereich (nicht testbar) Oder Experten- Rating (subjektiv) (Kriteriumsv.) Konstruktval. Einbettung in Zusammenhang mit nomologisches Verhaltensweisen Netzwerk (anderer Test: innere Faktorielle Validität Validität; oder anderer Verhaltensaspekt: äußere Diskriminante und Validität): konvergente Val. Gleichzeitigkeitsvalidität MTMM Vorhersagevalidität Verfälschbarkeit Testfairness Keine Benachteiligung von Subgruppen (sofern nicht hypothesenkonform)

Zur empirischen Validität: innere und äußere Validität, Gleichzeitigkeits- und Vorhersagevalidität innere Validität gleichzeitig zukünftig (prognostisch) äußere Validität

Zur empirischen Validität: innere und äußere Validität, Gleichzeitigkeits- und Vorhersagevalidität innere Validität äußere Validität gleichzeitig z.b. Korrelation der Skalen induktives Denken (Thurstone) und fluide Intelligenz (Cattell) beide gemessen zu t1 z.b. Korrelation der Skala induktives Denken (Thurstone) und Schulnoten beide gemessen zu t1 zukünftig (prognostisch) z.b. Korrelation der Skalen induktives Denken (Thurstone) gemessen zu t1 und fluide Intelligenz (Cattell) gemessen zu t2 z.b. Korrelation der Skala induktives Denken (Thurstone) gemessen zu t1 und Examensnote gemessen zu t2

Zur Vorhersage-Validität bei Selektionsentscheidungen A = richtig Positive B = falsch Negative Kriterium Y erfolgreich Grenzwert der Bewährung nicht erfolgreich C = falsch Positive D = richtig Negative abgelehnt B D A C Grenzwert der Eignung Effektivität: (A+D)/ (A+B+C+D) x 100 Spezifität: A/ (A+B) x 100 Sensitivität: D/ (C+D) x 100 Prädiktor X aufgenommen

Zur Konstruktvalidität: konvergente/ diskriminante Validität, multitraitmultimethod-matrix (MTMM); Beispiel aus Fisseni

Zur Konstruktvalidität: konvergente/ diskriminante Validität, multitraitmultimethod-matrix (MTMM); Beispiel aus Fisseni Reliabilitäten

Zur Konstruktvalidität: konvergente/ diskriminante Validität, multitraitmultimethod-matrix (MTMM); Beispiel aus Fisseni konvergente Validitäten

Zur Konstruktvalidität: konvergente/ diskriminante Validität, multitraitmultimethod-matrix (MTMM); Beispiel aus Fisseni diskriminante Validitäten bei gleicher Methode

Zur Konstruktvalidität: konvergente/ diskriminante Validität, multitrait-multimethod- Matrix (MTMM); Beispiel aus Fisseni diskriminante Validitäten bei verschiedenen Methoden

Verhältnis von Reliabilität Reliabilität ist eine notwendige aber nicht hinreichende Bedingung für Validität! Ein Test kann nicht valider sein, als er reliabel ist und Validität

Testnormierung Einordnung des Testergebnisses in Bezugssystem Normierung Intraindividuelle N. Interindividuelle N. Idealnorm Funktionen Rückmeldung Motivierung u. Förderung (Selbst-)Kontrolle Funktionen Selektion Berechtigung Funktionen Analyse Bericht (Selbst-)Kontrolle

Zur Normierung: Einige Normierungen bei interindividueller Norm Rohwerte aus verschiedenen Tests lassen sich transformieren (und damit vergleichen) Äquivalentnormen: z.b. bei Berechnung des IA (Binet) Abweichungsnormen: z.b. IQ = 100 + 15 (x-m)/s Prozentränge:

Beispiel: Theoretische Verteilung der Intelligenz

Nebengütekriterien Ökonomie Nützlichkeit und Zumutbarkeit Vergleichbarkeit Akzeptanz

Zusammenfassung der Gütekriterien Objektivität, Reliabilität (Zuverlässigkeit) und Validität (Gültigkeit) als wichtigste Gütekriterien Objektivität ist die Voraussetzung für Reliabilität und Validität Ein Messverfahren ist dann reliabel, wenn der Messfehler-Anteil gering ist (-> kleineres Vertrauensintervall für den wahren Wert) Validität als wichtigstes Kriterium: Ein Messverfahren muss das messen, was es messen soll, und nichts anderes! Ein Test kann nicht valider sein, als er reliabel ist!