Vorlesung Testtheorien. Dr. Tobias Constantin Haupt, MBA Sommersemester 2007

Ähnliche Dokumente
Vorlesung Testtheorien. Dr. Tobias Constantin Haupt, MBA Sommersemester 2007

Auswahl von Testaufgaben

Tests. Eine Einführung

Übersicht Klassische Testtheorie (KTT) Axiomatik der klassischen Testtheorie

1.1 Defininition. Als Test gelten demnach nur solche Untersuchungsverfahren, die

Was ist eine Testtheorie?

Vortrag Evaluation und Fragebogenkonstruktion

Hausaufgaben. Antwort und 4 guten Distraktoren zum gelesenen Text!

Grundlagen sportwissenschaftlicher Forschung Test

Rekodierung invertierter Items

Objektivität und Validität. Testgütekriterien. Objektivität. Validität. Reliabilität. Objektivität

Klassische Testtheorie (KTT) Klassische Testtheorie (KTT) Klassische Testtheorie (KTT)

Tutorium Testtheorie. Termin 3. Inhalt: WH: Hauptgütekriterien- Reliabilität & Validität. Charlotte Gagern

Was ist ein Test? Grundlagen psychologisch- diagnostischer Verfahren. Rorschach-Test

Eigene MC-Fragen Testgütekriterien (X aus 5) 2. Das Ausmaß der Auswertungsobjektivität lässt sich in welcher statistischen Kennzahl angeben?

Welche Gütekriterien sind bei der Bewertung von Lernleistungen

Klassische Befragungsmethoden: Fragebogendesign (PAPI)

Pilotierung der Unterrichtsbeispiele im Schuljahr 2008/2009 Englisch

Pilotierung der Unterrichtsbeispiele im Schuljahr 2008/2009 Bautechnik

Screening für Somatoforme Störungen. Seminar: Testen und Entscheiden Dozentin: Susanne Jäger Referentin: Maria Kortus Datum:

3.2 Grundlagen der Testtheorie Methoden der Reliabilitätsbestimmung

Pilotierung der Unterrichtsbeispiele im Schuljahr 2008/2009 E-Technik

Vorlesung Testtheorien. Dr. Tobias Constantin Haupt, MBA Sommersemester 2007

MATERIALIEN UND NORMWERTE FÜR DIE NEUROPSYCHOLOGISCHE DIAGNOSTIK MNND. Testhandbuch

Differenzierung und Systematik diagnostischer Testverfahren

Pilotierung der Unterrichtsbeispiele im Schuljahr 2007/2008. Naturwissenschaften

Forschungsmethoden VORLESUNG SS 2017

Reliabilitäts- und Itemanalyse

Leistungs- und Persönlichkeitsmessung SoSe 2010 Prof. Dr. G. H. Franke/ S. Jäger, M.Sc. NEO-PI-R: NEO- PERSÖNLICHKEITSINVENTAR, REVIDIERTE FASSUNG

Forschungsmethoden VORLESUNG WS 2017/2018

I-S-T 2000-R: INTELLIGENZ- STRUKTUR TEST 2000-R BITTE HANDBUCH ANSEHEN

Aufbau des Testberichts. 1. Problemstellung / inhaltliche Einführung. 2. Methode

Testtheorie und Gütekriterien von Messinstrumenten. Objektivität Reliabilität Validität

Grundintelligenztest CFT 20-R

Psychologische Diagnostik

Funktionen und Zwecke der Prüfungen Diagnosetests Lernfortschrittstest Leistungstests Tests erfüllen im Wesentlichen dreilerei Funktion: Optimierung d

Forschungsmethoden VORLESUNG WS 2017/2018

Untersuchungsarten im quantitativen Paradigma

Forschungsmethoden VORLESUNG SS 2018

Informationen für Kinder über die Vergleichsarbeit. Informationsstunde zur Hinführung

Inventar zur Erfassung interpersonaler Probleme (IIP-D)

einzelne Items werden mit Zahlen verknüpft und nach festgelegten Regeln zu einem Score verrechnet

T E S T G Ü T E K R I T E R I E N W O R K S H O P I N F R E I B U R G N O V E M B E R

Testen und Entscheiden Referentin: Christiane Beck Datum: Dozentin: Susanne Jäger. Hochschule Magdeburg-Stendal (FH)

Forschungsmethoden VORLESUNG WS 2017/2018

Dr. Barbara Lindemann. Fragebogen. Kolloquium zur Externen Praxisphase. Dr. Barbara Lindemann 1

IBS-KJ Interviews zu Belastungsstörungen bei Kindern und Jugendlichen

Reflexion zur Anwendung des Testverfahrens ELFE 1-6

GLIEDERUNG Das Messen eine Umschreibung Skalenniveaus von Variablen Drei Gütekriterien von Messungen Konstruierte Skalen in den Sozialwissenschaften

Standardisierte Vorgehensweisen und Regeln zur Gewährleistung von: Eindeutigkeit Schlussfolgerungen aus empirischen Befunden sind nur dann zwingend

Gütekriterien HS Sprachstandsdiagnose und Sprachförderung SS2011 Referentin: Meghann Munro

Thema: Multiple Choice-Tests. Clevere Strategien zur Lösung von Multiple Choice-Tests

Überblick über die ProbabilistischeTesttheorie

Fragebogen zu den Beispielaufgaben für das Zentralabitur im Fach Chemie / Berlin

Vorgehen bei der Testkonstruktion. Allgemeines zur Testkonstruktions-Hausarbeit. Mögliche Themenbereiche der

Trainerschulung ANQ Qualitätsmessung Psychiatrie

2.4 Indexbildung und Einblick in Skalierungsverfahren

4.2 Grundlagen der Testtheorie. Wintersemester 2008 / 2009 Hochschule Magdeburg-Stendal (FH) Frau Prof. Dr. Gabriele Helga Franke

Klassische Testtheorie (KTT) Klassische Testtheorie (KTT) Klassische Testtheorie (KTT)

Forschungsmethoden VORLESUNG WS 2017/2018

Vorlesung Testtheorien. Dr. Tobias Constantin Haupt, MBA Sommersemester 2007

Forschungsmethoden VORLESUNG SS 2017

Klaas Macha. Ökonomische Kompetenz messen. Theoretisches Modell und Ergebnisse der Economic Competencies Study (ECOS)

Messen im psychologischen Kontext I. Testentwicklung, Entwicklung von Items, Trennschärfeanalyse und Normierung

1 EINLEITUNG... 1 TEIL I: STAND DER FORSCHUNG PROFESSIONELLES WISSEN UND HANDELN VON LEHRKRÄFTEN Fachwissen...

PST. Personality Subconscious Test H A N D B U C H

Güteaspekte bei der Konzeption von Klausuraufgaben

Haus-Baum-Feuer-Wasser-Mensch Test

Eine Skala ist also Messinstrument, im einfachsten Fall besteht diese aus einem Item

Inhaltsverzeichnis. 1 Warum und für wen dieses Buch Ziele Überblick Benutzungshinweise... 4

Testtheorie und Testpraxis II Teilstandardisierte Verfahren. 4. Übungen zur Leitfadenerstellung

Verfahren zur Skalierung. A. Die "klassische" Vorgehensweise - nach der Logik der klassischen Testtheorie

3. Sitzung. Wie schreibe ich eine Hausarbeit?

Wenn ich mit ihm zusammen bin, habe ich das Gefühl er versucht manchmal, mich zu bevormunden er wirkt sehr selbstsicher auf mich 1 2

Einführung in die Statistik Testgütekriterien

Forschungszentrum für den Schulsport und den Sport von Kindern und Jugendlichen Engler-Bunte-Ring 15, Geb Karlsruhe

Lehrbuch Testtheorie - Testkonstruktion

Grundlagen der Testkonstruktion

AUSWERTUNG UND INTERPRETATION. Elektronische Auswertung und mehr Informationen über abcde123456

Bildungsurlaub-Seminare: Lerninhalte und Programm

Was heißt messen? Konzeptspezifikation Operationalisierung Qualität der Messung

SF-36 Fragebogen zum Gesundheitszustand. Seminar: Testen und Entscheiden Dozentin: Susanne Jäger Referentin: Julia Plato Datum:

4.2 Grundlagen der Testtheorie

Standardisierte Testverfahren

Lernerfolgskontrolle

Psychologische Tests. Name

Der Stressverarbeitungsfragebogen von Janke und Erdmann angepasst für Kinder und Jugendliche (SVF-KJ)

Anleitung für die Teilnehmer/innen zur Benutzung von Testaufgaben-Online

Zentrale Abschlussprüfungen Sek I (ESA/MSA) Deutsch Übersicht. Funktion Rahmenbedingungen Vorbereitung Beispiele Rückmeldung

AWST-R Aktiver Wortschatztest für 3- bis 5- jährige -Revision-

Dozent: Dawid Bekalarczyk Universität Duisburg-Essen Fachbereich Gesellschaftswissenschaften Institut für Soziologie Lehrstuhl für empirische

Schüler/-innen Feedback Oberstufe

Pädagogisch-psychologische Diagnostik und Evaluation

ELEKTRONISCHES TESTARCHIV

Deutsch. Übersicht. Schleswig-Holstein Der echte Norden. Zentrale Abschlussarbeiten Deutsch 2018 ESA/MSA

Transkript:

Vorlesung Testtheorien Dr. Tobias Constantin Haupt, MBA Sommersemester 2007

Inhaltsfolie # 2

Arten von Tests Überblick IIb nach Art des zu erfassenden Merkmals (Anwendungsbereich): Persönlichkeitstests: Tests in denen Persönlichkeitsmerkmale bzw. Charaktermerkmale wie Eigenschaften, Motive, Interessen, Einstellungen etc. erfasst werden. Dabei spielen objektive Beurteilungsmaßstäbe keine Rolle. # 3

Arten von Tests Überblick III a nach Zeitbemessung (bei Leistungstests): Speed -Tests (Schnelligkeits- oder Geschwindigkeitstests): Enthalten relativ leichte Aufgaben in einer Anzahl, die von praktisch keinem Pb innerhalb der knapp bemessenen, vorgegebenen Testzeit alle beantwortet werden können. Die Differenzierung zwischen Versuchspersonen wird nur durch die Begrenzung der Bearbeitungszeit erreicht. Je schneller die Aufgaben (richtig) gelöst werden, desto höher der Testwert. # 4

Arten von Tests Überblick III b Power-Tests (Niveautests): Enthalten Aufgaben, die in ihrem Schwierigkeitsgrad kontinuierlich so weit ansteigen, daß die letzten Aufgaben trotz fehlender oder großzügig bemessener Zeitbegrenzung nur von sehr wenigen Probanden (Pb) beantwortet werden können. Mit derartigen Verfahren wird primär das intellektuelle Niveau oder die Denkkraft (Power) ermittelt. Die meisten Tests sind Mischformen (da die Aufgabenschwierigkeiten oft stark streuen und Zeitbegrenzung vorliegt). # 5

Arten von Tests Überblick IV nach Anzahl der zu erfassenden Persönlichkeitsoder Leistungsmerkmale: eindimensionale Tests: Wenn ein Test nur ein Merkmal, bzw. ein Konstrukt erfasst. mehrdimensionale Tests: Wenn ein Test mehr als ein Merkmal erfaßt. Die KTT (klass. Testtheorie) befaßt sich nur mit eindimensionalen Tests, so daß die einzelnen Dimensionen mehrdimensionaler Tests separat (in Subtests) zu analysieren sind. Dimensionalitätsüberprüfung: Ob ein Test wirklich eine best. (die intendierte) Anzahl von Konstrukten erfasst, lässt sich mittels einer Faktorenanalyse überprüfen # 6

Arten von Tests Überblick V nach Ausmaß des erforderlichen subjektiven Urteils des Auswerters: objektive Tests: Wenn das Testergebnis rein mechanisch gewonnen werden kann, d.h. wenn es praktisch keinen subjektiven Interpretationsspielraum für den Testauswerter gibt. nicht-objektive Tests: Wenn ein subjektives Urteil des Auswerters eine Rolle spielt, wie dies etwa bei projektiven Tests der Fall ist. # 7

Arten von Tests Überblick VI nach Art der Durchführung: Individualtests: Tests, die lediglich einzeln mit den Versuchspersonen durchgeführt werden können, z.b. HAWIE-R, alle projektiven Tests. Gruppentests: Tests, die auch in Gruppen durchführbar sind, was besonders in institutioneller Diagnostik erheblich zeitökonomischer ist. # 8

Arten von Tests Überblick VII Nach Art der Aufgabenbeantwortung: gebundene Aufgabenbeantwortung Wenn bei einer Aufgabe bereits Antwortalternativen vorgegeben sind. freie Aufgabenbeantwortung Wenn der Pb selbst eine Antwort auf eine Frage oder Aufgabenstellung finden muß. # 9

Testbestandteile Materialbestandteile: Testmanual: Beschreibung, Entstehung und wissenschaftliche Grundlegung des Testes Durchführungs- und Interpretationsanweisungen samt Normen Testmaterial: Stimulus- und Reaktionsmaterial Auswertungshilfen: Kontrollblätter, Lochfolien, Schablonen, Messgeräte Durchführungsbestandteile: Testanweisung für Testleiter (Bedingungen, Durchführung und Auswertung des Tests) # 10

Testinstruktion I Instruktion für Probanden ist die Anweisung an den Probanden zur Testsituation Ziel: Verständliche Einführung in das Material; auf die Testsituation einstimmen; Unterstützung der Motivation des Probanden Inhalt: Technische Anweisungen zur Aufgabenbeantwortung, z. B auch Hinweis, keine Daten auszulassen (vgl. missing - value Problematik) # 11

Testinstruktion II Hauptfunktion: Werbung ; erwecken von Teilnahmemotivation, Aufbau eines Vertrauensverhältnisses. z.b.: Die Daten werden vertraulich behandelt. Es gibt keine richtigen oder falschen Antworten. Sie werden auf den folgenden Seiten eine Reihe von Aussagen über best. Verhaltensweisen, Einstellungen o. ä. finden. Sie können entweder mit... oder... antworten. Überlegen Sie bitte nicht erst, welche Antwort den besten Eindruck machen könnte. Setzen Sie bitte immer ein Kreuz,... Belohnung: Was haben die Probanden von der Teilnahme? Geld, Feedback (z.b. Persönlichkeitsprofil), Duplo? # 12

Sprachliche Gestaltung der Items I Jedes Item sollte so beschaffen sein, daß Personen mit unterschiedlichen Standpunkten gegenüber dem jeweiligen Einstellungsobjekt unterschiedlich auf das Item reagieren. Probleme können sein: zu allgemeine (vieldeutige) Formulierung (Proband muß Item vage interpretieren) Generalisierungen vermeiden Formulierung möglichst an konkretem Verhalten orientieren unklarer Antwortbezug Fremdwörter mehrere Gedanken in einem Satz (z. B. Ich gehe regelmäßig in die Kirche, teile aber die offizielle Auffassung der katholischen Kirche zum Thema Sexualität nicht ) Negationen (Mehrfachverneinungen vermeiden); Extreme Formulierungen (provozieren einheitliche Antworten) # 13

Sprachliche Gestaltung der Items II Die Items müssen also sinnvoll sein, gewisse ethische Grundprinzipien beachten und auch wohlformuliert sein. Leichter gesagt als getan! # 14

Sprachliche Gestaltung der Items III Vermeide mehrdeutige Begriffe (u. a. oft ) Vermeide Begriffe, die nur einem Teil der Pbn geläufig sind Jede Aufgabe soll nur einen Aspekt oder Gedanken enthalten, d.h. keine durch und verbundenen Aussagen Möglichst positive Aussagen, Fragen oder Formulierungen ( ( doppelte Verneinung) Vermeide Verallgemeinerungen jeder Art, besonders solche, die nur zeitweise Gültigkeit G haben Vermeide umständliche Länge L oder telegrafische Kürze K im Aufgabentext Prüfe die Eindeutigkeit der Frage an einer kleinen Teststichprobe ( Fragentext( ist eindeutig / nicht ganz / unklar ) # 15

Antwortmodi I Dichotom Essen Sie gerne Spaghetti? ja nein Das Jahr 2000 ist ein Schaltjahr stimmt stimmt nicht # 16

Antwortmodi I a dichotome Antworten Vorteil: Proband muß sich entscheiden; reliablere Ergebnisse, jedoch auf Kosten der Validität (wir werden noch sehen, warum). Nachteil: durch fehlende mittlere Antwortmöglichkeiten muß die Antwort nicht der tatsächlichen Einstellung des Probanden entsprechen; Gefahr der Suggestivwirkung und Ja-Sage-Tendenz # 17

Antwortmodi I b Geeignet wenn... ein Test schnell konstruiert bzw. improvisiert werden soll die Testdurchführung wenig Zeit beanspruchen soll Auswertung durch Hilfspersonal geschieht Aufgabeninhalt leicht verständlich ist Informationen über ein Persönlichkeitsmerkmal auf möglichst breiter Basis durch möglichst viele Fragen und Aufgaben erzielt werden soll gedankliche Verarbeitung und Gedächtnisleistung keine Rolle spielt Zufallslösungen irrelevant sind oder berücksichtigt werden (Zufallskorrektur) # 18

Antwortmodi IIa Schätzskalen (Ratings) 0 1 2 3 4 lehne ab stimme zu Vorteil: Antworten können besser den tatsächlichen Einstellungen des Pb entsprechen # 19

Antwortmodi IIb Nachteil: bei ungerader Zahl von Antwortmöglichkeiten ist die mittlere Kategorie oft nicht eindeutig interpretierbar; es bleiben auch noch weitere Interpretationsmöglichkeiten offen: Unentschiedenheit ( Flucht kategorie) mangelnde Kompetenz des PB zur Beantwortung des Items Gleichgültigkeit/Faulheit/Motivationsprobleme des Probanden! werden außerdem i.d.r. auch als Intervallskala behandelt (ist aber umstritten) besser: Schätzskala mit gerader Anzahl von Ratingmöglichkeiten # 20

Antwortmodi III graphische Angaben Multiple-Choice Choice-Fragen Kreuzen Sie eine oder mehrere Alternativen an: Deutschland war Fußballweltmeister... a) 1968 b) 1980 c) 1974 d) 1984 Ich komme gerne in dieses Seminar: Immer oft manchmal selten nie Vorteile und Nachteile: ökonomische Durchführung hrung und Auswertung geringe Ratewahrscheinlichkeit, wenn Distraktoren gut sind Erfahrung zur Formulierung von Items nötig n # 21

Testaufgabentypen offene Antwortmöglichkeit Offene Antworten Wie beurteilen Sie dieses Seminar? wichtige Form zur Erfassung bestimmter Eigenschaften wie z.b. Ausdrucksfähigkeit, Wortschatz etc. Auswertungsobjektivität problematisch zu erreichen Auswertung zeitaufwendig # 22

Testaufgabenbeispiele Blitz : Hören = Donner :? Sortiere die folgenden Brüche der Größe nach, beginne mit dem Größten 4/9... 3/4... 2/3... 7/12... 5/6 # 23

Testaufgabenbeispiele Lückentext Die menschliche Persönlichkeit und deren ist eine sehr Angelegenheit. frei von Zufallseinflüssen Antwortformulierung nach freiem Ermessen -> Gefahr von Suggestivwirkung Antwortformulierung nach freiem Ermessen zeitaufwendig nicht immer eindeutig (Objektivität!) # 24

Testaufgabenbeispiele Zuordnungsaufgaben Welches Verb gehört zu welchem Substantiv? 1) ein Vortrag a) erzählen 2) eine Geschichte b) machen 3) eine Erklärung c) halten 4) ein Gespräch d) abgeben 5) einen Vorschlag e) führen eignen sich gut zur Feststellung erworbenen Wissens große Anzahl von Aufgaben auf kleiner Fläche möglich Lösungsfindung erfolgt nicht selbstständig, da Antworten vorgegeben # 25

Testaufgabenbeispiele - halboffene Antwortmöglichkeit An welchen Flüssen liegen die folgenden Städte? Nürnberg: Frankfurt: Hamburg: Berlin: Bremen: # 26

Formulierung der Items Eindeutigkeit hinsichtlich des Konstruktes Konstrukt: Abhängigkeit der Stimmung vom Wetter Sonne hellt meine Stimmung auf. Bei miesem Wetter werde ich schneller ungeduldig als sonst. Trübes Wetter hat keinen Einfluß auf meine Stimmung. Bei gutem Wetter fällt es mir leichter, freundlich zu anderen zu sein. An sonnigen Tagen lache ich häufiger. # 27

Formulierung der Items Eindeutigkeit hinsichtlich des Konstruktes Konstrukt: Einstellung zu Psychotherapie Psychotherapie sollte denselben Stellenwert haben wie medizinische Behandlung. Therapeuten haben selbst psychische Probleme. Wer sich in Therapie begibt, ist unfähig, seine Probleme selbst zu lösen. Ich kann mir nicht vorstellen, jemals eine Psychotherapie zu brauchen. # 28

Formulierung der Items Abstufung über die Antwortmöglichkeiten Meine Arbeit ist eintönig und langweilt mich. Meine Arbeit ist meistens eintönig und langweilt mich fast immer. Wenn ich zum Zahnarzt muß, habe ich jedesmal extreme Angst. Ich habe Angst, wenn ich zum Zahnarzt muß. 1 trifft überhaupt nicht zu trifft nicht zu trifft eher zu trifft eher nicht zu trifft zu 2 3 4 5 6 trifft überhaupt nicht zu trifft nicht zu trifft eher zu trifft eher nicht zu trifft zu 1 2 3 4 5 6 trifft sehr zu trifft sehr zu # 29

Formale Kriterien einer guten Testaufgabe Objektivität: Sie muss von verschiedenen Auswertern gleichermaßen als richtig oder falsch bewertet werden Reliabilität: Gleiche Antworten bei kurzeitiger Testwiederholung muss erwartet werden Validität: Eine Aufgabe ist dann valide, wenn sie von Pbn mit starker Merkmalsaufprägung häufiger richtig beantwortet wird als von Pbn mit geringer Merkmalsausprägung (vgl. Trennschärfe) # 30