Objektivität und Validität. Testgütekriterien. Objektivität. Validität. Reliabilität. Objektivität

Ähnliche Dokumente
RETESTRELIABILITÄT. Teststabilität. Korrelation wiederholter Testdurchführungen. Persönlichkeitstests. Stabilität des Zielmerkmals.

Testtheorie und Gütekriterien von Messinstrumenten. Objektivität Reliabilität Validität

Tutorium Testtheorie. Termin 3. Inhalt: WH: Hauptgütekriterien- Reliabilität & Validität. Charlotte Gagern

Methodenlehre. Vorlesung 4. Prof. Dr. Björn Rasch, Cognitive Biopsychology and Methods University of Fribourg

Empirische Forschung. Übung zur Vorlesung Kognitive Modellierung. Kognitive Modellierung Dorothea Knopp Angewandte Informatik/ Kognitve Systeme

Welche Gütekriterien sind bei der Bewertung von Lernleistungen

T E S T G Ü T E K R I T E R I E N W O R K S H O P I N F R E I B U R G N O V E M B E R

Grundlagen sportwissenschaftlicher Forschung Test

Einführung in die Statistik Testgütekriterien

Eigene MC-Fragen Testgütekriterien (X aus 5) 2. Das Ausmaß der Auswertungsobjektivität lässt sich in welcher statistischen Kennzahl angeben?

GLIEDERUNG Das Messen eine Umschreibung Skalenniveaus von Variablen Drei Gütekriterien von Messungen Konstruierte Skalen in den Sozialwissenschaften

Gütekriterien: Validität (15.5.)

Grundlagen der Testkonstruktion

Definition von Validität

Gütekriterien von Messungen

Messtherorie Definitionen

3.2 Grundlagen der Testtheorie Methoden der Reliabilitätsbestimmung

I-S-T 2000-R: INTELLIGENZ- STRUKTUR TEST 2000-R BITTE HANDBUCH ANSEHEN

Vorlesung Testtheorien. Dr. Tobias Constantin Haupt, MBA Sommersemester 2007

Forschungsmethoden VORLESUNG WS 2017/2018

Forschungsmethoden VORLESUNG SS 2017

Psychologische Diagnostik Einführung, Hintergründe. Dr. Dr. Marcel Baumgärtler

Reliabilitäts- und Itemanalyse

Dozent: Dawid Bekalarczyk Universität Duisburg-Essen Fachbereich Gesellschaftswissenschaften Institut für Soziologie Lehrstuhl für empirische

Testtheorie und Testkonstruktion

Vorlesung Testtheorien. Dr. Tobias Constantin Haupt, MBA Sommersemester 2007

GÜTEKRITERIEN SPEZIFISCH p. 1

Glossar. Cause of Effects Behandelt die Ursache von Auswirkungen. Debriefing Vorgang der Nachbesprechung der experimentellen Untersuchung.

Verfahren zur Skalierung. A. Die "klassische" Vorgehensweise - nach der Logik der klassischen Testtheorie

Eine Skala ist also Messinstrument, im einfachsten Fall besteht diese aus einem Item

Informationen zur KLAUSUR am

Methode der Naturwissenschaften

GRUNDLAGEN DER TESTTHEORIE

PST. Personality Subconscious Test H A N D B U C H

Standardisierte Vorgehensweisen und Regeln zur Gewährleistung von: Eindeutigkeit Schlussfolgerungen aus empirischen Befunden sind nur dann zwingend

Messung Emotionaler Intelligenz. Prof. Dr. Astrid Schütz - Universität Bamberg

Aufgaben und Ziele der Wissenschaften

= = =0,2=20% 25 Plätze Zufallsübereinstimmung: 0.80 x x 0.20 = %

Einführung in die Theorie psychologischer Tests

Empirisches Relativ: Eine Menge von Objekten, über die eine Relation definiert wurde.

4.2 Grundlagen der Testtheorie

Was ist ein Test? Grundlagen psychologisch- diagnostischer Verfahren. Rorschach-Test

Explorative Faktorenanalyse

Grundlagen empirischer Forschung 3. LV. Gütekriterien von Erhebungsverfahren, Tests. Studieren für die berufliche Praxis.

Regression ein kleiner Rückblick. Methodenseminar Dozent: Uwe Altmann Alexandra Kuhn, Melanie Spate

Messung, Skalen, Indices

I Überblicksartige Beschreibung. II Testgrundlage. III Testdurchführung. IV Testverwertung. V Erfahrungen BDI-II

Methodenlehre. Vorlesung 4. Prof. Dr. Björn Rasch, Cognitive Biopsychology and Methods University of Fribourg

Grundlagen der empirischen Sozialforschung

Theorien der Persönlichkeit

VL Organisationspsychologie

Name Vorname Matrikelnummer Unterschrift

SF-36 Fragebogen zum Gesundheitszustand. Seminar: Testen und Entscheiden Dozentin: Susanne Jäger Referentin: Julia Plato Datum:

Identifikation hochbegabter Schüler

Lösungen zu Janssen/Laatz, Statistische Datenanalyse mit SPSS 1

Auswertung mit dem Statistikprogramm SPSS:

Rekodierung invertierter Items

1.1 Defininition. Als Test gelten demnach nur solche Untersuchungsverfahren, die

Was ist eine Testtheorie?

Grundlagen der psychologischen Testtheorie. WS 2016 Dr. Michael Weber

Bildungsurlaub-Seminare: Lerninhalte und Programm

6. Faktorenanalyse (FA) von Tests

Testen und Entscheiden Referentin: Christiane Beck Datum: Dozentin: Susanne Jäger. Hochschule Magdeburg-Stendal (FH)

Screening für Somatoforme Störungen. Seminar: Testen und Entscheiden Dozentin: Susanne Jäger Referentin: Maria Kortus Datum:

Grundlagen der Statistik

Faktorenanalysen mit SPSS. Explorative Faktorenanalyse als Instrument der Dimensionsreduktion. Interpretation des SPSS-Output s

Leistungs- und Persönlichkeitsmessung SoSe 2010 Prof. Dr. G. H. Franke/ S. Jäger, M.Sc. NEO-PI-R: NEO- PERSÖNLICHKEITSINVENTAR, REVIDIERTE FASSUNG

Faktorenanalysen mit SPSS. Explorative Faktorenanalyse als Instrument der Dimensionsreduzierung. Interpretation des SPSS-Output s

Statistik II. Lineare Regressionsrechnung. Wiederholung Skript 2.8 und Ergänzungen (Schira: Kapitel 4) Statistik II

Hypothesentests mit SPSS

TRIERER INVENTAR ZUM CHRONISCHEN STRESS

Was heißt messen? Konzeptspezifikation Operationalisierung Qualität der Messung

Trierer Alkoholismusinventar

eher kristalline als fluide Intelligenz geteilte Varianz mit fluider Intelligenz nur bei 1%, für kristalline Intelligenz 11% (entspricht r=.3-.

Methoden der Psychologie Dr. Z. Shi Wiss. Arbeiten

Messen und Statistik

Multivariate Analysemethoden

Klassische Testtheorie (KTT) Klassische Testtheorie (KTT) Klassische Testtheorie (KTT)

σ 2 (x) = σ 2 (τ) + σ 2 (ε) ( x) ( ) ( x) ( ) ( ) σ =σ τ +σ ε σ τ σ σ ε ( ) ( x) Varianzzerlegung Varianzzerlegung und Definition der Reliabilität

GHF SoSe 2011 HS MD-SDL

Prinzipien der Fahreignungsdiagnostik Wie sind Tests und Testergebnisse zu beurteilen?

einzelne Items werden mit Zahlen verknüpft und nach festgelegten Regeln zu einem Score verrechnet

Ziel: Vorhersage eines Kriteriums/Regressand Y durch einen Prädiktor/Regressor X.

Sportmotorische Testverfahren

Familiäre Pflege: Welche Bedeutung haben Ressourcen für pflegende Angehörige? Assessment zur Erfassung Ressourcen pflegender Angehöriger (RPA)

Inhaltsverzeichnis. Vorwort... 11

Multivariate Analysemethoden

Das Minimale Dokumentationssystem (MIDOS²) als deutsche Version der Edmonton Symptom Assessment Scale (ESAS): - Ein Instrument für die Pflege?

Dr. Barbara Lindemann. Fragebogen. Kolloquium zur Externen Praxisphase. Dr. Barbara Lindemann 1

Was ist eine Testtheorie? Grundlagen der Item-Response. Response-Theorie. Modelle mit latenten Variablen

Drittvariablenkontrolle in der linearen Regression: Trivariate Regression

ruhr-universität bochum

Statistik II: Klassifikation und Segmentierung

Gütekriterien. Gütekriterien. Gütekriterien. Reliabilität Validität. Spezifität. Sensitivität. Praktikabilität.

Hausaufgaben. Antwort und 4 guten Distraktoren zum gelesenen Text!

Einsatz eines Fragebogenverfahrens zur Leistungsmotivation im Rahmen eines Assessment Centers

IBS-KJ Interviews zu Belastungsstörungen bei Kindern und Jugendlichen

Lernzielkatalog für das Modul Einführung in die Wissenschaftstheorie

Transkript:

Objektivität und Objektivität: Inwieweit ist das Testergebnis unabhängig von externen Einflüssen Effekte des Versuchsleiters, Auswertung, Situation, Itemauswahl : Inwieweit misst der Test das, was er messen soll Grad der Gültigkeit der Messung, Aussagefähigkeit des Testergebnisses Testgütekriterien Objektivität und stehen im Zusammenhang mit der Reliabilität eines Tests Reliabilität Objektivität Objektivität Die Objektivität der Testdurchführung ist eine Voraussetzung für Reliabilität und Das Testergebnis sollte unabhängig davon sein, Wer den Test vorgibt (Durchführungsobjektivität) Wer den Test auswertet (Auswertungsobjektivität) Wer den Test interpretiert (Interpretationsobjektivität) Die Unabhängigkeit von der Testsituation hängt Zusammen mit der der Ergebnisse und ihrer Generalisierbarkeit.

Spezifische Objektivität Unabhängigkeit eines Testergebnisses von der spezifischen Itemauswahl aus einem hypothetischen Item-Universum. Abhängig von der Eigenschaft des Testmodells Relevant bei der Auswahl von Items aus einem Itempool: Zum Beispiel bei der Klausur zu Testkonstruktion oder Schülerleistungstests oder Intelligenztestaufgaben Objektivität und (aus Rost, 2004) Die Konstanthaltung der Objektivität der Testsituation kann die interne und externe der Ergebnisse beeinflussen. Externe = Generalisierbarkeit der Ergebnisse über die Testsituation hinaus Bei Konstanthaltung der Testsituation kann die interne steigen, die externe jedoch sinken. Unter der (Gültigkeit) eines Tests versteht man das Ausmaß in dem der Test das misst, was er messen soll. Vom (beobachtbaren) Verhalten in der Testsituation wird geschlossen auf das (ebenfalls beobachtbare) Verhalten außerhalb der Testsituation = Repräsentations- oder Korrelationsschluß Vom Verhalten in der Testsituation wird geschlossen auf Fähigkeiten, Dispositionen oder Persönlichkeitsmerkmale als Grundlagen oder Bedingungen des Verhaltens, also auf unbeobachtbare Konstrukte = Konstruktvalidität

Inhaltsvalidität Auch face validity oder Augenscheinvalidität Ein Test ist insoweit inhaltlich valide, wie die von ihm erfasste Verhaltensstichprobe repräsentativ ist für den interessierenden Verhaltensbereich Bewertet wird diese nach Plausibilität oder durch ein Expertenrating Bsp. Wissenstests die augenscheinlich das spezifisch gefragte Wissen erfassen (Vokabeltest, Stenografiekenntnisse) Kriteriumsbezogene Auch Korrelationsschluss, überprüft die Enge der Beziehung zwischen Testverhalten und Kriteriumsverhalten mittels Korrelation (Außenkriterium) Konkurrente/Übereinstimmungsvalidität liegt vor, wenn die Varianz der Testwerte sich auf die Varianz des Kriteriums zurückführen lässt Prädiktive/Vorhersagevalidität bezeichnet den Stellenwert des Tests aufgrund der Brauchbarkeit seiner Vorhersagen Kriteriumsbezogene Echtes Kriterium: Indizierung derselben Merkmalsdimension, verlässlich, entscheidungsrelevant Quasikriterien: Validierung an einem bereits existierenden Test, der das gleiche Merkmal erfasst Target-Variablen: Effektivität von Skalen, Maximierung der Vorhersagequote

Kriteriumsbezogene Einfachvalidierung: Korrelation zwischen Testund Kriteriumswerten, lineare Regression Multiple : Vorhersage eines komplexen Kriteriums durch mehrere Tests (Testbatterie), multiple lineare Regression Inkrementelle bezeichnet das Ansteigen der multiplen durch Hinzunahme einer weiteren Testvariablen in die Testbatterie Differentielle Mehrere skoeffizienten werden für verschiedene Innen- und/ oder Außenkriterien berechnet; mit mehreren Kriterien werden mehrere einfache Korrelationen gerechnet; und/ oder Unterschiedliche Stichproben werden herangezogen. Der Test zeigt dann eine hohe (differentielle), wenn alle Koeffizienten ähnlich hoch sind. Der Test kann zur Messung eines Merkmals bei ganz unterschiedlichen Klienten eingesetzt werden und/ oder Es existieren Moderatorvariablen (z.b. Alter), die eine Population in Untergruppen mit unterschiedlicher trennen; (z.b. Auswirkung der Schulbildung auf Leistungstests, hohe für Minderbegabte, aber niedrige für Höherbegabte). Konstruktvalidität Beziehung zwischen Verhalten in der Testsituation und zugrundeliegenden Konstrukten Synthese aus inhaltlicher und kriteriumsbezogener Validierung als Prozess der Einbettung eines Tests in das nomologische Netzwerk anderer, hypothesenprüfendes Verfahren Fischer: Konstrukt = latente Dimension: Wie stark lässt sich das Testverhalten durch latente Dimensionen erklären?

Konstruktvalidität Multitrait-Multimethod-Analyse (Campell & Fiske): Ergebnisse wissenschaftlichen Messens hängen von der gewählten Methode ab Trennung von Konstrukten und Methoden: mit verschiedenen Methoden erhobene Maße desselben Konstrukts sollen miteinander hoch korrelieren (konvergente ) Unterschiedliche Konstrukte, die mit ähnlichen Methoden erhoben werden sollen niedrig korrelieren (diskriminante ) Konstruktvalidität Explorative Faktorenanalyse Faktorenanalyse: Jede beobachtbare Testvariable ist als Linearkombination von Faktorwerten in einer latenten Dimension darstellbar. Der Zusammenhang zwischen den Testvariablen wird durch ihre Korrelation bemessen. Ähnlichkeiten bestimmter Gruppen von Variablen lassen auf gemeinsame Variation durch dahinterliegende latente Variablen schließen. Die Faktorenanalyse ordnet Items nach ihrer korrelativen Ähnlichkeit mit zunehmender Reliabilität steigt auch die an bei mittlerer Homogenität ist die am höchsten, während bei geringer und hoher Homogenität die abnimmt partielle Inkompatibilität zwischen Reliabilität und : Große Homogenität der Aufgaben führt zu einer geringen aber hohen Reliabilität, während eine höhere eher durch heterogene Aufgaben gewährleistet wird Testbatterie