Messen und Skalen. Frank Fuhlbrück Seminar: Noten, Studienpunkte und Automatisierung WiSe 2010/11. 1 von 1 Frank Fuhlbrück Messen & Skalen

Ähnliche Dokumente
0 Einführung: Was ist Statistik

Einführung in die Maximum Likelihood Methodik

I. Zahlen, Rechenregeln & Kombinatorik

Anteile Häufigkeiten Verteilungen Lagemaße Streuungsmaße Merkmale von Verteilungen. Anteile Häufigkeiten Verteilungen

Statistik II: Grundlagen und Definitionen der Statistik

DATENERHEBUNG: MESSEN-OPERATIONALISIEREN - SKALENARTEN

Statistik Testverfahren. Heinz Holling Günther Gediga. Bachelorstudium Psychologie. hogrefe.de

Statistik. Jan Müller

Dr. Barbara Lindemann. Fragebogen. Kolloquium zur Externen Praxisphase. Dr. Barbara Lindemann 1

Statistik für das Psychologiestudium

Wiederholung Statistik I. Statistik für SozialwissenschaftlerInnen II p.8

Kapitel 12 Stetige Zufallsvariablen Dichtefunktion und Verteilungsfunktion. stetig. Verteilungsfunktion

GLIEDERUNG Das Messen eine Umschreibung Skalenniveaus von Variablen Drei Gütekriterien von Messungen Konstruierte Skalen in den Sozialwissenschaften

Konfidenzintervalle Grundlegendes Prinzip Erwartungswert Bekannte Varianz Unbekannte Varianz Anteilswert Differenzen von Erwartungswert Anteilswert

Was heißt messen? Konzeptspezifikation Operationalisierung Qualität der Messung

Forschungsmethoden in der Sozialen Arbeit

Übung 1: Wiederholung Wahrscheinlichkeitstheorie

4. Schließende Statistik (Inferenzstatistik, konfirmatorische Verfahren)

Statistik 2 für SoziologInnen. Normalverteilung. Univ.Prof. Dr. Marcus Hudec. Themen dieses Kapitels sind:

Statistische Tests für unbekannte Parameter

Grundgesamtheit und Stichprobe

Skalenniveaus =,!=, >, <, +, -

1.1.1 Ergebnismengen Wahrscheinlichkeiten Formale Definition der Wahrscheinlichkeit Laplace-Experimente...

Inhaltsverzeichnis. Inhalt Teil I: Beschreibende (Deskriptive) Statistik Seite. 1.0 Erste Begriffsbildungen Merkmale und Skalen 5

STATISTIK FÜR STATISTIK-AGNOSTIKER Teil 1 (wie mich)

Univariates Datenmaterial

Statistische Grundlagen I

Mathematische und statistische Methoden I

P (X = 2) = 1/36, P (X = 3) = 2/36,...

Die Varianz (Streuung) Definition

Übung zu Empirische Ökonomie für Fortgeschrittene SS 2009

Campbell (1920): "... die Zuweisung von Zahlen, um Eigenschaften darzustellen."

Messen und Statistik

Bitte am PC mit Windows anmelden!

Daten, Datentypen, Skalen

Mathematik für Biologen

ETWR Teil B. Spezielle Wahrscheinlichkeitsverteilungen (stetig)

k np g(n, p) = Pr p [T K] = Pr p [T k] Φ. np(1 p) DWT 4.1 Einführung 359/467 Ernst W. Mayr

K8 Stetige Zufallsvariablen Theorie und Praxis

Biostatistische Studienplanung. Dr. Matthias Kohl SIRS-Lab GmbH

Fachrechnen für Tierpfleger

Teil: lineare Regression

Zufallsvariablen [random variable]

Nachhol-Klausur - Schätzen und Testen - Wintersemester 2013/14

1 Dichte- und Verteilungsfunktion

7.2 Moment und Varianz

Statistik-Klausur vom

Klausur Statistik I. Dr. Andreas Voß Wintersemester 2005/06

Statistikpraktikum. Carsten Rezny. Sommersemester Institut für angewandte Mathematik Universität Bonn

Signalverarbeitung 2. Volker Stahl - 1 -

Stochastik. 1. Wahrscheinlichkeitsräume

Auswahl von Schätzfunktionen

Das Histogramm ist glockenförmig. Es würde bei mehr als vier Fehlerquellen sich der Glockenform noch besser annähern.

Hausaufgaben. Antwort und 4 guten Distraktoren zum gelesenen Text!

Beispiel für Anwendung: z-tabelle kann genutzt werden, um z.b. Poissonverteilung näherungsweise zu integrieren. Beispiel: wie wahrscheinlich ist es

Hinweise zu den mündlichen Abiturprüfungen nach OAVO

1. Maße der zentralen Tendenz Beispiel: Variable Anzahl der Geschwister aus Jugend '92. Valid Cum Value Frequency Percent Percent Percent

Angewandte Statistik 3. Semester

Markt- und Werbepsychologie. Band 1 Grundlagen

STATISTIK Teil 2 Wahrscheinlichkeitsrechnung und schließende Statistik

Mathematik IV für Maschinenbau und Informatik (Stochastik) Universität Rostock, Institut für Mathematik Sommersemester 2007

Varianz und Kovarianz

Lage- und Streuungsparameter

Grundbegriffe (1) Grundbegriffe (2)


Übungsblatt 9. f(x) = e x, für 0 x

Alle weiteren Messoperationen schließen die Klassifikation als Minimaloperation ein.

Klausur zu Methoden der Statistik II (mit Kurzlösung) Sommersemester Aufgabe 1

Statistische Tests. Kapitel Grundbegriffe. Wir betrachten wieder ein parametrisches Modell {P θ : θ Θ} und eine zugehörige Zufallsstichprobe

3. Deskriptive Statistik

Statistik und Wahrscheinlichkeitsrechnung

Prüfungstutorat: Angewandte Methoden der Politikwissenschaft. Polito Seminar Carl Schweinitz

Test auf den Erwartungswert

8. Statistik Beispiel Noten. Informationsbestände analysieren Statistik

Standardisierte Vorgehensweisen und Regeln zur Gewährleistung von: Eindeutigkeit Schlussfolgerungen aus empirischen Befunden sind nur dann zwingend

Hypothesenprüfung. Darüber hinaus existieren zahlreiche andere Testverfahren, die alle auf der gleichen Logik basieren

Willkommen zur Vorlesung Statistik (Master)

Lösungen zur Klausur GRUNDLAGEN DER WAHRSCHEINLICHKEITSTHEORIE UND STATISTIK

3.2 Streuungsmaße. 3 Lage- und Streuungsmaße 133. mittlere Variabilität. geringe Variabilität. große Variabilität

Lösungen zur Biomathe-Klausur Gruppe A Montag, den 16. Juli 2001

Mathematik für Biologen

Inhaltsverzeichnis. Vorwort

Aufgabenblock 4. Da Körpergröße normalverteilt ist, erhalten wir aus der Tabelle der t-verteilung bei df = 19 und α = 0.05 den Wert t 19,97.

Prüfung aus Statistik 1 für SoziologInnen. Musterlösung

Einführung in die (induktive) Statistik

Grundsätze (vgl. Richtlinien und Lehrpläne, Geschichte Sekundarstufe II, NRW, 1999, S.91ff) Anforderungs- und Bewertungskriterien bei Klausuren

Entscheidung zwischen zwei Möglichkeiten auf der Basis unsicherer (zufälliger) Daten

Inhaltsverzeichnis. 2 Kurzbeschreibung von SPSS Der SPSS-Dateneditor Statistische Analysen mit SPSS DieDaten...

Lösungen zu den Übungsaufgaben in Kapitel 10

Modul G.1 WS 07/08: Statistik

Was ist Physik? Modell der Natur universell es war schon immer so

b) Bestimmen Sie die Varianz der beiden Schätzer. c) Ist ein oder sind beide Schätzer konsistent? Begründen Sie!

Methodenlehre. Vorlesung 10. Prof. Dr. Björn Rasch, Cognitive Biopsychology and Methods University of Fribourg

Klausur zu Statistik II

Glossar Biometrie / Statistik. Auszug für Fragebogen Fallzahlberechnung/-begründung

Kapitel 5 Kenngrößen empirischer Verteilungen 5.1. Lagemaße. x mod (lies: x-mod) Wofür? Lageparameter. Modus/ Modalwert Zentrum. Median Zentralwert

Elementare Wahrscheinlichkeitsrechnung

Medizinische Biometrie (L5)

3 Lage- und Streuungsmaße

Zusammenfassung Mathe II. Themenschwerpunkt 2: Stochastik (ean) 1. Ein- und mehrstufige Zufallsexperimente; Ergebnismengen

Transkript:

Messen und Skalen Frank Fuhlbrück Seminar: Noten, Studienpunkte und Automatisierung WiSe 2010/11 2010-11-29 1 von 1 Frank Fuhlbrück Messen & Skalen

Inhalstverzeichnis 2 von 1 Frank Fuhlbrück Messen & Skalen

Grundlagen Messen und Skalieren 3 von 1 Frank Fuhlbrück Messen & Skalen

Grundlagen Messen und Skalieren Begriffe Skalieren und Messen Relative Definition (Relativ) Sei A eine Menge und R i,1 i k Relationen auf A. Dann heißt A = A, R 1,..., R k Relationalstruktur oder Relativ und A Grundmenge von A. empirisches und numerisches Relativ Grundmenge enthält Objekte der Anschauung empirisches Relativ Grundmenge enthält Zahlen numerisches Relativ 4 von 1 Frank Fuhlbrück Messen & Skalen

Grundlagen Messen und Skalieren Begriffe Skalieren und Messen Messen, Skalieren, Skala Die folgende Definition sollte semantisch der in [Ath74] entsprechen (mathematisch Formulierung eher der in [Fri72]). Definition (Skalieren,Skala) Seien A = A, R 1,..., R k und B = B, S 1,..., S k Relationalstrukturen (R i, S i Relationen auf A bzw. B). Skalieren ist die Konstruktion einer homomorphen Funktion f von A nach B. Das Tripel S = (A, B, f) wird dann als Skala bezeichnet. Definition (Messen) Abhängig vom Skalenniveau (s.u.) wird Skalieren als Messen bezeichnet. 5 von 1 Frank Fuhlbrück Messen & Skalen

Grundlagen Messen und Skalieren Begriffe Skalieren und Messen fundamentale und abgeleitete Skalierung fundamental und abgeleitet Skala S = (A, B, f): A empirisch: fundamentale Skalierung/Messung A bereits numerisch: abgeleitete Messung Beispiel (fundamental und abgeleitet) Strecke und Zeit werden fundamental gemessen, Geschwindigkeit abgeleitet 6 von 1 Frank Fuhlbrück Messen & Skalen

Grundlagen Messen und Skalieren Begriffe Skalieren und Messen Zufallsvariable implizit definierte ZV Skala S = (A, B, f) und A = n: f kann auch als B-wertige ZV aufgefasst werden Wahrscheinlichkeitsraum (A, (A), P ) mit P (A ) = A n aus zufälliger, gleichverteilter Ziehung aus A. Notation: X S := f f.a. A A 7 von 1 Frank Fuhlbrück Messen & Skalen

Grundlagen Messen und Skalieren Skalentypen Klassen von Skalen Transformationen Transformation t: isomorphe Abbildung von B nach C für zwei Skalen (A, B, f) und (A, C, g) Klassifikation von Skalen B und C R: Klasse/Niveau von (A, B, f) ist Menge der möglichen Transformationen. Je kleiner die Menge der möglichen Transformationen, desto höher der Informationsgehalt. 4 gängige Skalentypen (keinesfalls die einzigen). 8 von 1 Frank Fuhlbrück Messen & Skalen

Grundlagen Messen und Skalieren Skalentypen Nominalskala Transformationen Jede bijektive Abbildung. Relation zweistellige Relation a b: Objekte stimmen in Eigenschaft überein mögliche Maßzahlen und Tests Modalwert, einzelne Häufigkeiten, χ 2 - Unabhängigkeitstest Beispiel Zugehörigkeit zu Gruppe o.ä. 9 von 1 Frank Fuhlbrück Messen & Skalen

Grundlagen Messen und Skalieren Skalentypen Ordinalskala Transformationen Jede streng monotone Abbildung. Relation zusätzlich zweistellige Relation a b: Eigenschaft von a steht in Rangfolge vor der von b mögliche Maßzahlen Median, Extremwerte, Quantile, Spearman-Korrelationskoeffizient Beispiel Präferenzordnung (z.b. bei Wahlen) 10 von 1 Frank Fuhlbrück Messen & Skalen

Grundlagen Messen und Skalieren Skalentypen Intervallskala Transformationen Jede affine Abbildung ohne Multiplikation mit 0. Relation zusätzlich vierstellige Relation R d (a, b, c, d) R d : Unterschied von a zu b entspricht dem von c zu d. mögliche Maßzahlen ar. Mittelwert, (emp.) Varianz, MAD, Interquartilsabstand, Pearson-Kor., lineare Modelle Beispiel Temperatur 11 von 1 Frank Fuhlbrück Messen & Skalen

Grundlagen Messen und Skalieren Skalentypen Intervallskala Transformationen Jede affine Abbildung ohne Multiplikation mit 0. Relation zusätzlich vierstellige Relation R d (a, b, c, d) R d : Unterschied von a zu b entspricht dem von c zu d. mögliche Maßzahlen ar. Mittelwert, (emp.) Varianz, MAD, Interquartilsabstand, Pearson-Kor., lineare Modelle Beispiel Jahreszahlen 11 von 1 Frank Fuhlbrück Messen & Skalen

Grundlagen Messen und Skalieren Skalentypen Verhältnisskala Transformationen Jede lineare Abbildung außer Multiplikation mit 0. Relation zusätzlich vierstellige Relation R r (a, b, c, d) R r : a verhält sich zu b, wie c zu d. mögliche Maßzahlen geom. Mittelwert Beispiel Temperatur 12 von 1 Frank Fuhlbrück Messen & Skalen

Grundlagen Messen und Skalieren statistische Maßzahlen und Verteilungen Maßzahlen Definition (empirisches Quantil) Sei x = (x 1,..., x n ) eine Stichprobe. Für p [0, 1] ist ein p-quantil x p ein Wert, sodass {x i x i x p } 1 n p und {x i x i x p } 1 n 1 p. Das 0.5-Quantil x 0.5 heißt Median. Definition (arithmetisches Mittel) Sei x = (x 1,..., x n ) eine Stichprobe. x = 1 n Mittel. n x i heißt arithmetisches i=1 Definition (empirische Standardabweichung) Sei x = (x 1,..., x n ) eine Stichprobe. s x mit s 2 x = 1 n 1 empirische Standardabweichung. n x 2 i heißt i=1 13 von 1 Frank Fuhlbrück Messen & Skalen

Grundlagen Messen und Skalieren statistische Maßzahlen und Verteilungen Normalverteilung Funktionsgraph f(x), f Dichtefunktion von X N (0, 1) 0 0.1 0.2 0.3 0.4 3 2 1 0 1 2 3 x 14 von 1 Frank Fuhlbrück Messen & Skalen

Grundlagen Messen und Skalieren statistische Maßzahlen und Verteilungen Normalverteilung Definition (normalverteilt) Stetige ZV X mit Dichte f(x) = (X N (µ, σ)). Satz (Zentraler Grenzwertsatz) ( ) 1 1 x µ 2σ 2 π e 2 σ 2 heißt normalverteilt Seien X i,1 i n unabhängige, identisch verteilte ZV mit Erwartungswert n µ und Varianz σ 2, sowie X n = 1 n X i. Dann gilt für i=1 X n µ Z := lim n : Z N (0, 1). n σ 15 von 1 Frank Fuhlbrück Messen & Skalen

Grundlagen Messen und Skalieren statistische Maßzahlen und Verteilungen Normalverteilung: Verteilung von Messfehlern Fehlermodell beim Messen/Skalieren X tatsächlicher Wert, Y idealer Wert, E Messfehler X = Y + E Normalverteilungsannahme für E Ann.: Fehler ist Summe vieler einzelner Fehler (mit ähnlicher Vert.) E ist annähernd normalverteilt. 16 von 1 Frank Fuhlbrück Messen & Skalen

Grundlagen Messen und Skalieren statistische Maßzahlen und Verteilungen Normalverteilung: Verteilung in Populationen Beobachtungen viele Eigenschaften in Popul. sind annähernd normalverteilt: Körpergröße etc. Eigenschaften des Individuums beruhen auf vielen unabhängigen Faktoren: Genetik, (abiotische) Umwelt, Kultur... Schluss Postulat: (bestimmte) psychologische und soziologische Eigenschaften werden als normalverteilt angenommen. 17 von 1 Frank Fuhlbrück Messen & Skalen

Grundlagen Messen und Skalieren Prozess des Messens bzw. Skalierens Was wird gemessen/skaliert? Theoretisches Konstrukt häufig vorwissenschaftliche Bedeutung grobe Klassifikation (Zustand/Prozess/Individuum/Gruppe) Zusammenhang mit anderen Konstrukten Beispiel (Schulleistung [Fri72, S.25]) Schulleistung ist das Ergebnis [Zustand] des schulischen und außerschulischen Lernens [Prozess] eines Schülers. 18 von 1 Frank Fuhlbrück Messen & Skalen

Grundlagen Messen und Skalieren Prozess des Messens bzw. Skalierens Wie wird gemessen/skaliert? Operationalisiertes Konstrukt Welche Beobachtung entspricht welcher Ausprägung des Konstrukts? Repräsentationsproblem Begründung des postulierten Homomorphismus Notfalls Anpassung der operationalisierten Definition (z.b. NV-Annahme). Beispiel (Schulleistung) Schulleistung ist die Anzahl der Punkte in meinem Test. Schulleistung ist das Ergebnis eines Standardtests mein Test muss die Schüler in der selben Reihenfolge ordnen. 19 von 1 Frank Fuhlbrück Messen & Skalen

Grundlagen Messen und Skalieren Prozess des Messens bzw. Skalierens Skalierung und Interpretation? Eindeutigkeitsproblem Welche numerischen Zusammenhänge dürfen interpretiert werden? Welches Skalenniveau liegt tatsächlich vor? 20 von 1 Frank Fuhlbrück Messen & Skalen

Grundlagen Messen und Skalieren Prozess des Messens bzw. Skalierens Testgütekriterien Validität Messe ich, was ich verspreche zu messen? Reliabilität Liefert mehrmaliges Testen ähnliche Ergebnisse? Objektivität Hängt der Test nicht vom Versuchsleiter ab? (Normierbarkeit) Lassen sich die Testergebnisse von Individuen in die einer Population einordnen? 21 von 1 Frank Fuhlbrück Messen & Skalen

Zensurengebung 22 von 1 Frank Fuhlbrück Messen & Skalen

Zensurengebung Definition der Noten Beispiel (Schulnoten Deutschland) [... ]Skala anzuwenden: 1. sehr gut (1) - wenn die Leistung den Anforderungen in besonderem Maße entspricht, 2. gut (2) - wenn die Leistung den Anforderungen voll entspricht, 3. befriedigend (3) - wenn die Leistung im Allgemeinen den Anforderungen entspricht, 4. ausreichend (4) - wenn die Leistung zwar Mängel aufweist, aber im Ganzen den An- forderungen noch entspricht, 5. mangelhaft (5) - wenn die Leistung den Anforderungen nicht entspricht, jedoch er- kennen lässt, dass die notwendigen Grundkenntnisse vorhanden sind und die Mängel in absehbarer Zeit behoben werden können, 6. ungenügend (6) - wenn die Leistung den Anforderungen nicht entspricht und selbst die Grundkenntnisse so lückenhaft sind, dass die Mängel in absehbarer Zeit nicht behoben werden können. 23[Berliner von 1 Schulgesetz 58 Frank Abs. Fuhlbrück 3] Messen & Skalen

Zensurengebung Prozesse der Zensurengebung 1.Fall Zensur als erste (fundamentale) Skalierung Was wird skaliert? unterschiedliche theoretische Konstrukte (s. Beispiel) gemeinsam: Fähigkeit, Leistung o.ä. Zeit teilweise explizit in Definition [Ath74] Wie wird skaliert? Gutachter beurteilt/en anhand von nominalen Kriterien (s. Beispiel) (und einigen sich ggf.) Ausrichtung an Aufgaben-/Anforderungsbereichen 24 von 1 Frank Fuhlbrück Messen & Skalen

Zensurengebung Prozesse der Zensurengebung 1.Fall Zensur als erste (fundamentale) Skalierung Beispiel (mündl. Abitur deutsch [Kul02, S. 32]) Eine Leistung kann mit gut bewertet werden, wenn der Inhalt des vorgegebenen Materials präzise erfasst und eigenständig dargestellt wird das Thema bzw. Problem differenziert erläutert wird Struktur, Funktion und Intention des Materials und dessen Stilmittel zutreffend bezeichnet sowie Wirkungsmöglichkeiten überzeugend eingeschätzt werden differenzierte Kenntnisse und Einsichten nachgewiesen werden Zusammenhänge eigenständig erkannt werden ggf. ein Urteil oder eine Stellungnahme begründet dargelegt werden der Vortrag strukturiert erfolgt eine überzeugende sprachliche Darstellung in Vortrag und Gespräch geleistet wird. 25 von 1 Frank Fuhlbrück Messen & Skalen

Zensurengebung Prozesse der Zensurengebung 1.Fall Zensur als erste (fundamentale) Skalierung Beispiel (Theoretisches Konstrukt) Die Diplomarbeit soll zeigen, dass der Prüfling in der Lage ist, innerhalb einer vorgegebenen Frist ein Problem aus seinem Fach selbständig nach wissenschaftlichen Methoden zu bearbeiten. [Prüfungsordnung Informatik 2003 19 Abs. 1, Hervorhebung hinzugefügt] Eine operationale Definition wird nicht angegeben! 26 von 1 Frank Fuhlbrück Messen & Skalen

Zensurengebung Prozesse der Zensurengebung 2.Fall Zensur als zweite, abgeleitete Skalierung Was wird skaliert? unterschiedliche theoretische Konstrukte (s. Beispiel) gemeinsam: Fähigkeit, Leistung o.ä. Zeit teilweise explizit in Definition [Ath74] Wie wird skaliert? Punktbewertung (Bewertungseinheiten) ähnlich wie Zensurenbewertung im Fall 1 Skalierung Punkte Zensur mittels Tabelle oder Prozentwerten und/oder Skalierung sodass (Normal-)Verteilung in Gruppe erfüllt ist Verteilung der Punkte an AFB orientiert Punkte aus verschiedenen Teilgebieten (z.b. Analysis und Algebra) werden addiert 27 von 1 Frank Fuhlbrück Messen & Skalen

Zensurengebung Prozesse der Zensurengebung 2.Fall Zensur als zweite, abgeleitete Skalierung Beispiel (Schriftliche Abiturprüfungen Berlin [Sen10, S.13]) 1+ ab 95%, dann in 5%-Schritten bis 4 ab 45%, dann in 9%-Schritten bis 5- ab 9% zwei getrennte (affine) Transformationen von Intervallen (z.b. [0.95, 1] auf 15(Punkte)) 28 von 1 Frank Fuhlbrück Messen & Skalen

Zensurengebung Operationen und Gesamtnoten Operationen gewichtetes arithmetisches Mittel Noten werden mit Faktoren gewichtet und (ggf. in mehreren Schritten) addiert, dann wird durch Gesamtgewicht geteilt. mögliche stochastische Erklärung/Deutung Für Zensurenskala Z wird E(X Z ) geschätzt mit (mod.) x. x ist ML-Schätzer für N und erwartungstreu. Gewicht entspricht der Zuverlässigkeit der Messung oder der Auftretenswahrscheinlichkeit der Situation. Bei bekannter Verteilung (inkl. Varianz): Schätzung für Erwartungswert zeigt Leistungsspektrum 29 von 1 Frank Fuhlbrück Messen & Skalen

Zensurengebung auftretende Skalen auftretende Skalen Bewertungseinheitenskala wird als Intervallskala oder sogar Verhältnisskala ( ausreichend bei der Hälfte der maximalen Leistung) begriffen Zensurenskala wird als Intervallskala oder Ordinalskala begriffen (s. Operationen) 30 von 1 Frank Fuhlbrück Messen & Skalen

Zensurengebung Verteilungsannahmen Verteilungsannahmen Verteilung der Zensuren in Klasse/Kurs... Glockenkurve ist zumindest erwünschtes Ergebnis. Annahme Normalverteilung der Leistung in Population (ähnlich Intelligenz). Verteilung der Zensuren einer Person Normalverteilungsannahme für Messfehler? Zeitpunkt der Bewertung wird meist kaum berücksichtigt 31 von 1 Frank Fuhlbrück Messen & Skalen

Zensurengebung Verteilungsannahmen Verteilungsannahmen Beispielbewertung nach NV 6 5 4 3 2 1 Note 32 von 1 Frank Fuhlbrück Messen & Skalen

Kritik und Alternativen 33 von 1 Frank Fuhlbrück Messen & Skalen

Kritik und Alternativen Prozess und Testgüte Prozess Theoretisches Konstrukt, Was? existiert z.t., aber variiert operationalisiertes Konstrukt, Wie? existiert kaum (nicht z.b. bei [Ath74], PO 2003) Begründung des Homomorphismus, Wie? ohne operationalisiertes Konstrukt nicht möglich Operationen und Deutung, Wie? normierte Deutung (bundesweite Zulassungsgrundlage) ohne Normierung, Intervallskaladeutung von Ordinalskala (s.u.) 34 von 1 Frank Fuhlbrück Messen & Skalen

Kritik und Alternativen Prozess und Testgüte Testgütekriterien Validität Konstruktvalidität ohne operationale Definition kaum möglich, Vorhersagevalidität Abitur für Studiumsleistung gut (r = 0, 35 laut [KB10]) für Arbeitsleistung nicht unbedingt Reliabilität Wiederholung schwierig Objektivität variiert (mündliche Mitarbeitsnoten über mündl. Prüfungen bis zentrale Prüfung) (aber z.b. Scholastic Aptitude Test) (Normierbarkeit) insbesondere nicht wie bei z.b. Intelligenztests 35 von 1 Frank Fuhlbrück Messen & Skalen

Kritik und Alternativen Verteilungsannahmen Verteilungsannahmen Individuum Normalverteilung bei Individuum (Messfehler) führt Funktion der Rückmeldung zur Verbesserung ad absurdum Problem bei Extremen: kein Ausgleich möglich (obwohl nach NV bel. gutes Ergebnis möglich sein müsste) Beispiel Noten: 4,3,2,1,1,1,1 Gesamtnote: 2 Noten: 6,5,4,3,4,3,1,2,1,2,1,1,1,1,1,1,1,1,1,1,1 Gesamtnote: 2 (bei p χ 2 < 0.05) Noten: 2,3,4,1,1 Gesamtnote: 2 Noten: 1,2,3,1+,1+ Gesamtnote(ohne Beachtung Tendenz): 2 (tritt bei Tendenz entsprechend für 15+ Punkte auf) 36 von 1 Frank Fuhlbrück Messen & Skalen

Kritik und Alternativen Verteilungsannahmen Verteilungsannahmen Individuum Alternativen zeitliche Entwicklung einrechnen (z.b. lineares Modell mit Zeit als UV)? auf Verteilungen testen und ggf. weitere Maße (z.b. Streuung) mit angeben? anderen (robusteren) Schätzer für Erwartungswert (z.b. getrimmte Mittel, Median)? 37 von 1 Frank Fuhlbrück Messen & Skalen

Kritik und Alternativen Verteilungsannahmen Verteilungsannahmen Gruppe Normalverteilung in Gruppe sign. Unterschiede in Vergleichsarbeiten u. Tests nicht jede Gruppe repräsentativ Unterschiede in Jahrgang u.ä. wird nicht sichtbar Alternativen keine Annahme über Verteilung in Gruppe nutzen? reale Verteilung vorab testen und an diese anpassen? 38 von 1 Frank Fuhlbrück Messen & Skalen

Kritik und Alternativen Operationen Bewertungseinheiten und Zensuren Auswirkung verschiedener Transformationen Tests mit Punkten 18/100 und 60/100 Schätzung E(X B ) = 36 E(X Z ) = 4 Punkte? aber Noten 2 Punkte und 8 Punkte E(X Z ) = 5 Punkte? Rundungsfehler Tests mit Punkten 94/100, 94/100 und 97/100 ergeben als Gesamtnote: 14 Punkte Transformation Die Notenermittlung ist keine erlaubte Transformation für Intervallskalen. 39 von 1 Frank Fuhlbrück Messen & Skalen

Kritik und Alternativen Operationen Median Median und andere Quantile bei symm. Verteilung robuster Schätzer für E(X Z ) ggf. zusätzliche andere Quantile (x 0.1, x 0.9 ) als Streuungsmaß auch für Ordinalskala definiert Beispiel Noten: 4,3,2,1,1,1,1 Gesamtnote: 1 (1,4) Noten: 6,5,4,3,4,3,1,2,1,2,1,1,1,1,1,1,1,1,1,1,1 Gesamtnote: 1(1,4) Noten: 2,3,4,1,1 Gesamtnote: 2 (1,4) Noten: 1,2,3,1+,1+ Gesamtnote(ohne Beachtung Tendenz): 1(1,3) Noten: 1,4,1,4,1,4 Gesamtnote:?(1,4) Noten: 1,4,1,4,1,4,1 Gesamtnote: 1(1,4) 40 von 1 Frank Fuhlbrück Messen & Skalen

Kritik und Alternativen Untersuchung von Athanasiadis Untersuchung von Athanasiadis [Ath74] Vorgehen Bildung von Referenzgruppen nach Prüfern (schriftlich, mündlich) Zuordnung von Valenzen zu Prüfungsnoten nach NV in Referenzgruppen Untersuchung Unterschied Valenzen zu Noten an exemplarischen Prüfungsergebnissen Resultate Existenz milder und strenger Prüfer Differenzen mittlerer Valenzen und Noten von 1 und mehr möglich (und realistisch) auch Umkehrung der ordinalen Relation Auswirkung auf Zulassung zur Promotion zu erwarten 41 von 1 Frank Fuhlbrück Messen & Skalen

Quellen und Verweise Quellen und Verweise I [Ath74] [Fri72] Th. Athanasiadis, Zum System der Leistungsbewertung mit Zensuren: Ein Beitrag zur Quantifizierung von Leistungsvergleichen, Statistische Studien, vol. 7, Franz Steiner Verlag, Wiesbaden, 1974. R. Fricke, Über Meßmodelle in der Schulleistungsdiagnostik, Studien zur Lehrforschung, vol. 2, Pädagogischer Verlag Schwann, Düsseldorf, 1972. [Wec76] H. Weck, Leistungsermittlung und Leistungsbewertung im Unterricht, Volk und Wissen Verlag, Berlin, 1976. [Czi96] [Kai99] [Kul02] U. Czienskowski, Wissenschaftliche Experimente: Planung Auswertung Interpretation, Psychologische VerlagsUnion, Weinheim, 1996. G. Kaiser, Unterichtswirklichkeit in England und Deutschland: Vergleichende Untersuchungen am Beispiel des Mathematikunterrichts, Deutscher Studien Verlag, Weinheim, 1999. Kultusministerkonderenz, Einheitliche Prüfungsanforderungen in der Abiturprüfung Deutsch (2002). [Sen10] Senatsverwaltung für Bildung, Wissenschaft und Forschung, Ausführungsvorschriften über schulische Prüfungen (2010). 42 von 1 Frank Fuhlbrück Messen & Skalen

Quellen und Verweise Quellen und Verweise II [KB10] O. Köller and J. Baumert, Das Abitur - immer noch ein gültiger Indikator für die Studierfähigkeit? (2010). 43 von 1 Frank Fuhlbrück Messen & Skalen