T E S T G Ü T E K R I T E R I E N W O R K S H O P I N F R E I B U R G N O V E M B E R

Ähnliche Dokumente
Testtheorie und Gütekriterien von Messinstrumenten. Objektivität Reliabilität Validität

Gütekriterien HS Sprachstandsdiagnose und Sprachförderung SS2011 Referentin: Meghann Munro

GLIEDERUNG Das Messen eine Umschreibung Skalenniveaus von Variablen Drei Gütekriterien von Messungen Konstruierte Skalen in den Sozialwissenschaften

Objektivität und Validität. Testgütekriterien. Objektivität. Validität. Reliabilität. Objektivität

Welche Gütekriterien sind bei der Bewertung von Lernleistungen

Dozent: Dawid Bekalarczyk Universität Duisburg-Essen Fachbereich Gesellschaftswissenschaften Institut für Soziologie Lehrstuhl für empirische

Tests. Eine Einführung

Empirische Forschung. Übung zur Vorlesung Kognitive Modellierung. Kognitive Modellierung Dorothea Knopp Angewandte Informatik/ Kognitve Systeme

Eigene MC-Fragen Testgütekriterien (X aus 5) 2. Das Ausmaß der Auswertungsobjektivität lässt sich in welcher statistischen Kennzahl angeben?

Methode der Naturwissenschaften

Prüfen und Testen im DaF- Unterricht. Mag. Norbert Conti, Österreich Institut Brno, Seminar am

Modulabschlussprüfung SM 2

Funktionen und Zwecke der Prüfungen Diagnosetests Lernfortschrittstest Leistungstests Tests erfüllen im Wesentlichen dreilerei Funktion: Optimierung d

Inhaltsverzeichnis Danksagung Einleitung Forschungshintergrund Sprachkompetenz...20

Gütekriterien: Validität (15.5.)

Methodenlehre. Vorlesung 4. Prof. Dr. Björn Rasch, Cognitive Biopsychology and Methods University of Fribourg

Forschungsmethoden VORLESUNG WS 2017/2018

Forschungsmethoden VORLESUNG WS 2017/2018

Tutorium Testtheorie. Termin 3. Inhalt: WH: Hauptgütekriterien- Reliabilität & Validität. Charlotte Gagern

Forschungsmethoden VORLESUNG SS 2017

Glossar. Cause of Effects Behandelt die Ursache von Auswirkungen. Debriefing Vorgang der Nachbesprechung der experimentellen Untersuchung.

Grundlagen sportwissenschaftlicher Forschung Test

Forschungsmethoden VORLESUNG SS 2017

Hausaufgaben. Antwort und 4 guten Distraktoren zum gelesenen Text!

Einführung in die Statistik Testgütekriterien

VERA 8 STAATSINSTITUT FÜR SCHULQUALITÄT UND BILDUNGSFORSCHUNG MÜNCHEN

Dozent: Dawid Bekalarczyk Universität Duisburg-Essen Fachbereich Gesellschaftswissenschaften Institut für Soziologie Lehrstuhl für empirische

Gütekriterien von Messungen

1.1 Defininition. Als Test gelten demnach nur solche Untersuchungsverfahren, die

Einführung in die sonderpädagogische Diagnostik

Dr. Barbara Lindemann. Fragebogen. Kolloquium zur Externen Praxisphase. Dr. Barbara Lindemann 1

Studienseminar Koblenz. Diagnostische Expertise - Leistungsmessung

Reflexion zur Anwendung des Testverfahrens ELFE 1-6

Individuelle Schülerleistungen erfassen beschreiben bewerten

SCHRIFTLICHE PRÜFUNGEN UND PÄDAGOGISCHE DIAGNOSTISCHE TESTVERFAHREN

Die vier Prüfungsteile Alle Themen und Aufgaben dieser Prüfung haben einen Bezug zum Hochschulkontext. Prüfungsteil Aufgaben

Screening für Somatoforme Störungen. Seminar: Testen und Entscheiden Dozentin: Susanne Jäger Referentin: Maria Kortus Datum:

Neue Formen der Leistungsmessung und Leistungsbeurteilung

Leistungs- und Persönlichkeitsmessung SoSe 2010 Prof. Dr. G. H. Franke/ S. Jäger, M.Sc. NEO-PI-R: NEO- PERSÖNLICHKEITSINVENTAR, REVIDIERTE FASSUNG

Psychologische Diagnostik

3.2 Grundlagen der Testtheorie Methoden der Reliabilitätsbestimmung

Psychologische Diagnostik

Sorbet. Testverfahren. Testverfahren. 1. Sinnvoll? 2. Objektiv? 3. Realistisch? 4. Bereich? 5. Entwicklung? 6. Testverfahren?

Fächerspezifische Ergänzungen zur Leistungsbewertung im Fach Erdkunde

Zentrale Abschlussprüfungen Sek I (ESA/MSA) Deutsch Übersicht. Funktion Rahmenbedingungen Vorbereitung Beispiele Rückmeldung

I-S-T 2000-R: INTELLIGENZ- STRUKTUR TEST 2000-R BITTE HANDBUCH ANSEHEN

RETESTRELIABILITÄT. Teststabilität. Korrelation wiederholter Testdurchführungen. Persönlichkeitstests. Stabilität des Zielmerkmals.

Reliabilitäts- und Itemanalyse

Programmatischer Text

Grundlagen der empirischen Sozialforschung

Trierer Alkoholismusinventar

PST. Personality Subconscious Test H A N D B U C H

Orientierungshilfe für LehrerInnen, Eltern und Kinder: Tests als Unterstützung standardisierter Schulleistungs-Test

ANLEITUNG ZUR KORREKTUR VON KURZANTWORTFRAGEN (KAF) Medizinische Fakultät. Institut für Medizinische Lehre IML

WAS IST LEBENSQUALITÄT? DIPL. PGW R. BECKER

SF-36 Fragebogen zum Gesundheitszustand. Seminar: Testen und Entscheiden Dozentin: Susanne Jäger Referentin: Julia Plato Datum:

M.A. Daniel Kittel. Institut für Erziehungswissenschaft Abteilung für Bildungsforschung und Schulentwicklung Pädagogische Hochschule Freiburg

IBS-KJ Interviews zu Belastungsstörungen bei Kindern und Jugendlichen

Teil I: Methoden der Politikwissenschaft

MATERIALIEN UND NORMWERTE FÜR DIE NEUROPSYCHOLOGISCHE DIAGNOSTIK MNND. Testhandbuch

Grundlagen empirischer Forschung 3. LV. Gütekriterien von Erhebungsverfahren, Tests. Studieren für die berufliche Praxis.

Empirisches Relativ: Eine Menge von Objekten, über die eine Relation definiert wurde.

Leistungsbewertung Bedeutung als Feedback für Lernende und Lehrende

Im Frühjahr machen Schülerinnen und Schüler des 8. Schuljahres eine webbasierte, individuelle Standortbestimmung.

Messtherorie Definitionen

Indikatoren für Gesundheit. Dr. Joachim Hartlieb, MPH. Entwicklung von Indikatoren für Gesundheit in Kitas und Familienzentren

Das neue Zeugnis für die Primarstufe

Sportmotorische Testverfahren

Der TOEFL Junior Standard Test

Was ist ein Test? Grundlagen psychologisch- diagnostischer Verfahren. Rorschach-Test

Theorien der Persönlichkeit

AUSWERTUNG UND INTERPRETATION. Elektronische Auswertung und mehr Informationen über abcde123456

Evaluation Fremdsprachen BKZ

Messung Emotionaler Intelligenz. Prof. Dr. Astrid Schütz - Universität Bamberg

ruhr-universität bochum

Testen, Diagnostizieren und Fördern, aber online. Dr. Alexander Westphal,

Auszubildend einstellen ohne Noten? Geht das? Ein neuer Weg der Rekrutierung

Optimierung der Fahrerlaubnisprüfung in Deutschland. Dr. Frank Prücher Bundesanstalt für Straßenwesen

Schülerfragebogen zur Beurteilung des Unterrichts

Erste Rückmeldung zur Lernstandserhebung im Fach Englisch VERA Schule '***', Klasse '***', Testheft '1', Rückmeldegruppe 'HS'

Staatl. Studienseminar für das Lehramt an Gymnasien Trier/TDS Daun. Leistungsfeststellung und Leistungsbeurteilung 2016

4.2 Grundlagen der Testtheorie

Schulzeugnisse und Beurteilung verstehen

Messung, Skalen, Indices

Welche psychometrischen Tests sollte der Arzt kennen und interpretieren können? Dipl.-Psych. Patricia Albert Schmerzzentrum

Prinzipien der Fahreignungsdiagnostik Wie sind Tests und Testergebnisse zu beurteilen?

Ansprüche an Testverfahren

KOMPIK Kompetenzen und Interessen von Kindern IFP-Projektgruppe KOMPIK Toni Mayr, Christina Bauer & Martin Krause

Standardisiertes Testverfahren im Eingangsverfahren zur Eingliederung der HW

2.3 Das Grundmodell der klassischen Testtheorie (KTT)

Testtheoretische Kritik mündlicher und schriftliche Prüfungen (29.5)

Evangelische Religionslehre

2

BEURTEILEN UND BEWERTEN IM KUNSTUNTERRICHT

Transkript:

Testen und Prüfen T E S T G Ü T E K R I T E R I E N W O R K S H O P I N F R E I B U R G N O V E M B E R 2 0 1 4

Testen und Prüfen Testgütekriterien

Folgende Fragen sollten Sie am Ende des Vortrags beantworten können Zweck und Ziel der Testgütekriterien Welche Testgütekriterien sind wichtig? Wozu benötigen wir Testgütekriterien?

Folgende Fragen sind mittels Testverfahren zu klären Über welche Sprachkompetenz verfügt der Lerner aktuell? Wie kann die Sprachleistung eingeordnet werden? Gibt es Hinweise auf mögliche Förderbedarfe, besondere Fehlerschwerpunkte, Schwächen bei Teilfertigkeiten?

Funktionen der Leistungsbeurteilung Beurteilungen von Leistungen liefern: Informationen über das Leistungsversmögen, das Sprachniveau der Lerngruppe geben der Lehrkraft Hinweise zu ihrem Unterricht helfen Leistungsdefizite bzw. Lerndefizite aufzudecken geben den Lernenden eine Rückmeldung

Testverfahren wozu? Durch Testverfahren werden Informationen über die kognitive und sprachliche Lernausgangslage sowie über zuvor erworbene Sprachkenntnisse und die Herkunft bzw. den sozioökonomischen Hintergrund erhoben. Wie und wozu diese Informationen verwendet werden, hängt damit zusammen, wie Testergebnisse erhoben und ausgewertet werden.

Testverfahren informell formell Bezugsgruppenorientiert Sozial kriterienorientiert

Informelle Testverfahren - sind nicht geeicht oder normiert - Erfassung der Ergebnisse von Lehr-Lernprozessen - Zuverlässigkeit und Gültigkeit werden nicht durch statistische Verfahren nachgewiesen - Bemühung um Objektivität - häufig standardisierte Verfahren (z.b. Klassenarbeiten)

Formelle Testverfahren - standardisierte Testverfahren - langwierige Testkonstruktion - werden an einer Stichprobe geeicht, d.h. während des Entwicklungsprozesses wird genau diejenige Population untersucht, für die der Test konzipiert wird - sie müssen die Testgütekriterien erfüllen

bezugsgruppenorientierter Vergleich zielt auf die konkreten Lernentwicklung einzelner Lerner bzw. Lerngruppen ab. Der Fokus liegt auf der individuellen Entwicklung

kriterienorientierter Vergleich Haben die Lerner ein bestimmtes Lernziel erreicht oder sich angenähert? Vergleich erfolgt bezüglich e.iner sachlichen Norm

der soziale Vergleich 3. zielt auf die Vergleich verschiedener Lerner oder Lerngruppen; 4. die individuelle Lernentwicklung wird einer sozialen Bezugsgruppe zugeordnet er dient auch zur Beurteilung des Unterrichts

Tetsgütekriterien Objektivität Reliabilität Validität

Objektivität Objektivität heißt, dass unter Anwendung eines Messinstruments Ergebnisse erzielt werden, die vom Forscher unabhängig sind. Bezogen auf das Zielen mit Pfeil und Bogens heißt das, wenn mehrere Schützen denselben Bogen und dieselben Pfeile benutzen, treffen sie stets dieselben Stellen.

Objektivität Standardisierung Durchführungsobjektivität Auswertungsobjektivität

Standardisierung Vereinheitlichte Ausführung des Testformats der Testdurchführung der Testauswertung der Testinterpretation

Durchführungsobjektivität Durchführungsobjektivität Bezieht sich auf die Unabhängigkeit der Testergebnisse von der Durchführung der Tests Die Durchführungsobjektivität hängt vor allem von der Qualität der Standardisierung ab

Auswertungsobjektivität Entsteht durch die Klarheit und Standardisierung der Auswertungskriterien Was wird beurteilt und wie wird es beurteilt, wie wird es beurteilt es gibt normierte Lösungen

Interpretationsobjektivität Der Grad der Unabhängigkeit der Testbewerter bestimmt das Ausmaß der Objektivität allen Prüfern müssen die Auswerungsvorgaben bekannt sein es gibt normierte Lösungen

Reliabilität Reliabilität heißt: unser Messinstrument misst genau das, was es messen soll. Bezogen auf eine Zielscheibe bedeutet dies, dass ein und derselbe Schütze in etwa immer die gleiche Stelle trifft. Achtung: Es kann sein, dass der Schütze zwar nie die Zielscheibe trifft, jedoch immer an derselben Stelle, z.b. immer ziemlich genau 1m zu weit links von der Zielscheibe. Dann ist das Messinstrument zwar reliabel, weil genau, aber nicht valide, weil offensichtlich ungeeignet.

Reliabilität Reliabilität Zuverlässigkeit bezieht sich auf die Genauigkeit Je größer die Zahl der Items (Testaufgaben), desto zuverlässiger wird gemessen bei Testwiederholung dürfen die Ergebnisse nicht abweichen

Validität Validität bedeutet, dass unser Messinstrument genau das und nichts anderes misst als es messen soll Validität bedeutet, dass wir mit Pfeil und Bogen ein Forschungsinstrument gewählt haben, dass sich für das angestrebte Ziel Zielscheibe treffen eignet. Validität bedeutet also, dass wir mit unserem Pfeil und Bogen prinzipiell im Stande sind, die Zielscheibe zu treffen.

Validität Augenscheinvalidität Kriteriumsvalidität Inhaltsvalidität Konstruktvalidität

Augenscheinvalidität Augenscheinvalidität betrifft die Gültigkeit bzw. Relevanz, die ein Test in den Auge der Prüflinge hat kann durch gezielte Information und Testtransparenz erlangt werden Zweck und Ziel des Tests muss klar sein

Inhaltsvalidität bestimmte Aspekte eines Lernstoffs werden erfasst wird von Experten, Lehrpersonen ermittelt es sollte die Fertigkeit erfasst werden, die getestet werden soll es sollte das geprüft werden, was zuvor gelernt wurde

Kriteriumsvalidität Kriteriumsvalidität es sollte tatsächlich gemessen werden, was der Test vorgibt zu messen bei Vergleich mit einer mit einem anderen Außenkriterium, z.b. der Schulnote muss sich ein annähernd gleiches Resultat ergeben

Konstruktvalidität Konstruktvalidität basiert auf theoretischen Modellen (z.b. der Sprachkompetenz) die zu untersuchende liegende Fertigkeit, Kompetenz muss definiert sein muss überprüfbar sein durch die Korrelation mit anderen Kriterien

Leistungsmessung in Form von Tests und Prüfungen Eine Sammlung von Informationen über den Kenntnisstand der geprüften Personen, verbunden mit einem bestimmten Ziel

Testverfahren Testverfahren sollten sich also immer an den Testgütekriterien orientieren, unabhängig davon, ob sie standardisiert sind oder ob es sich um informelle Verfahren handelt. Diagnostische Verfahren können sein: Tests Beobachtungsverfahren Analyseverfahren Portfolios Erhebungen des Sprachstands oder der Sprachkompetenz Profilanalysen

Handwerkliche Regeln Handwerkliche Regeln (Vgl. Kniffka/Siebert-Ott) Es sollte immer das abgefragt werden, was getestet werden soll, d.h. die Aufgaben sollten dementsprechend gestellt sein und nicht z.b. durch Weltwissen oder Hintergrundwissen beantwortet werden können. z.b. Hörtest: 1. Fragen sollten Hörverstehen nicht Erinnerungsvermögen abtesten 2. Auf sprachliche Formulierung achten 3. Aufgaben müssen ausschl. über das Hören des Textes lösbar sein 4. Fragen nicht auf sehr enge aufeinander folgende Textpassagen beziehen 5. Es sollte nur eine Lösung möglichsein 6. Einzelne Aspekte müssen eindeutig sein, nicht überlappend

Handwerkliche Regeln Beispielsweise Multiple-Choice-Test Hör-/Leseverstehen: 1. Die Abfolge der Aufgaben muss der Chronologie des Textes entsprechen, d.h. es darf kein Hin- und Herspringen erfolgen, da sonst möglicherweise etwas anderes gemessen wird als Hörverstehen. 2. Die Aufgaben sollten sprachlich leichter sein als der Text Lernende scheitern womöglich nicht am Text selbst, sondern am Leseverständnis der Aufgaben. 3. Die Aufgaben sollten ausschließlich über das Hören/Lesen des Textes zu beantworten sein und nicht etwa mit Weltwissen. 4. Die Aufgaben sollten sich möglichst nicht auf zu dicht aufeinander folgende Textpassagen beziehen sonst besteht die Gefahr, dass die Lernenden nicht alle zur Lösung erforderlichen Informationen mitbekommen : Während die erste Aufgabe noch verarbeitet wird, folgt schon die nächste das ist unfair. 5. Es darf nur eine Lösung geben. 6. Die einzelnen Optionen müssen eindeutig formuliert sein. Sie sollten sich auf keinen Fall überlappen. (Übernommen aus ppt von Gabriele Kniffka)

Formen von Testaufgaben Aufgaben, die die vier Grundfertigkeiten, Hören, Sprechen, Lesen, schreiben prüfen Typologisierung der Aufgaben nach dem Offenheitsgrad Ja Nein Aufgaben Multiple-Choice-Aufgaben Offene, komplexe Aufgaben, die Interpretation und Mitgestaltung einer kommunikativen Situation fordern

Fazit Test können verschiedene Funktionen erfüllen. Sie ermöglichen u.a. an Standards wie z.b. dem GER orientierte Beurteilungen vorzunehmen. Zuverlässige standardisierte Testverfahren sollten die Gütekriterien Validität, Reliabilität und Objektivität erfüllen. Testergebnisse wirken auf den Unterricht zurück, daher sollten Testaufgaben so konzipiert sein, dass sie den Zielen bzw. unterrichtlichen Konzeptionen entsprechen.

Nun sind Sie an der Reihe, können Sie dir folgenden Fragen beantworten? Welchen Zweck und welches Ziel haben Testgütekriterien? Welche Testgütekriterien kennen Sie? Wozu benötigen wir Testgütekriterien? Sie haben 8 min. für eine Gruppenarbeit, um diese Fragen zu diskutieren.

???? Haben Sie Fragen?? Vielen Dank für Ihre Aufmerksamkeit!??????