Wiederholung - Vertiefung Testkonstruktion

Größe: px
Ab Seite anzeigen:

Download "Wiederholung - Vertiefung Testkonstruktion"

Transkript

1 Wiederholung - Vertiefung Testkonstruktion Kapitel 3 Bühner (2006). Text: direkt aus Bühner 2006 übernommen Danke schön Einführung in die Test- und Fragebogenkonstruktion, Pearson Education 2003, Markus Bühner, 1

2 3.1 Stufen der Testentwicklung (1) Anforderungsanalyse und Problemstellung (2) Planung und Literatursuche (3) Eingrenzung des Merkmals und Arbeitsdefinition (4) Testentwurf (5) Überprüfung des Testentwurfs (6) Verteilungsanalyse (7) Itemanalyse und Itemselektion (8) Kriterienkontrolle (9) Revision des Tests (10) Eichung / Cut-Off-Werte Einführung in die Test- und Fragebogenkonstruktion, Pearson Education 2003, Markus Bühner, 2 2

3 (1) Anforderungsanalyse und Problemstellung Bezieht sich auf spezifischen Tätigkeitsbereich (tätigkeitsspezifisch oder tätigkeitsübergreifend) 3 Ansätze (Schuler, 2001): erfahrungsgeleitet-intuitive Methode:?? Beschäftigung mit den Eigentümlichkeiten des Tätigkeitsbereichs analytisch-empirische Methode: Tätigkeiten in konkreten Situationen personenbezogen-empirische Methode: Zusammenhang zwischen Merkmalen der tätigen Personen und Kriterien Informationsquellen: Beobachtung, mündliche Befragung, Fragebogenverfahren, Beschäftigung mit dem Material, Auswertung des Materials, Arbeitsausführung einer Tätigkeit Einführung in die Test- und Fragebogenkonstruktion, Pearson Education 2003, Markus Bühner, 3 3

4 (2) Planung und Literatursuche Eingrenzung des zu erfassenden Merkmals mithilfe von: Überblicksartikeln oder Lehrbüchern (z.b. Psyndex, PsycINFO) Befragung von Laien oder Experten anforderungsbezogener Test (ohne expliziten theoretischen Hintergrund) Einführung in die Test- und Fragebogenkonstruktion, Pearson Education 2003, Markus Bühner, 4 4

5 (3) Arbeitsdefinition Erstellung einer Arbeitsdefinition: Sammlung und Analyse von Definitionen (z.b. wiederkehrende Definitionsmerkmale herausgreifen) rationale Fragebogenkonstruktion (Fragebogenkonstruktion basiert auf inhaltlichen Gesichtspunkten) Testkonstruktion wird explizit aus einer Theorie abgeleitet = deduktive Methode (Konstrukte wie z.b. Intelligenz oder Aufmerksamkeit) induktive Fragebogenkonstruktion (Fragebogenkonstruktion basiert auf Befragungsergebnissen von Experten oder Laien) Einführung in die Test- und Fragebogenkonstruktion, Pearson Education 2003, Markus Bühner, 5 5

6 (4) Testentwurf Überlegungen: 1. Zielgruppe 2. Art der Informationen (subjektive oder objektive Informationen) 3. Zweck des Tests (z.b. verschiedene Gruppen voneinander trennen oder Eigenschaftsbeschreibungen) Überlegungen münden in der Auswahl der Testart und damit verbunden der Itemauswahl Merke: - Wichtig für die Inhaltsvalidität ist eine repräsentative Itemmenge - Prototypenansatz: die ausgewählten Items sind besonders charakteristisch für einen bestimmten Bereich Einführung in die Test- und Fragebogenkonstruktion, Pearson Education 2003, Markus Bühner, 6 6

7 (5) Überprüfung des Testentwurfs geeignete und ausreichend große Stichprobe rekrutieren (Mindestgrenze N = 100) (6) Verteilungsanalyse Betrachtung der Itemverteilungen anhand der Rohdaten, um mögliche Decken- und Bodeneffekte zu vermeiden Einführung in die Test- und Fragebogenkonstruktion, Pearson Education 2003, Markus Bühner, 7 7

8 (7) Itemanalyse und Itemselektion Statistische Itemanalyse: Berechnung von Itemschwierigkeit und Itemtrennschärfe Items, die von allen oder keinem Probanden der interessierenden Stichprobe gelöst werden sowie Items mit geringer Trennschärfe werden nicht weiter berücksichtigt, weil sie zur Unterscheidung der Probanden nichts beitragen können Einführung in die Test- und Fragebogenkonstruktion, Pearson Education 2003, Markus Bühner, 8 8

9 (8) Kriterienkontrolle Bestimmung der primären Gütekriterien Reliabilität und Validität des Tests (9) Revision des Tests Anhand der gewonnenen Informationen sollte der Test revidiert werden und erneut einer psychometrischen Prüfung unterzogen werden Einführung in die Test- und Fragebogenkonstruktion, Pearson Education 2003, Markus Bühner, 9 9

10 (10) Eichung (Normierung) / Cut-Off- Werte Mit der Testendform werden Normen an möglichst repräsentativen, geschichteten oder speziell interessierenden Populationen erhoben In vielen Fällen benötigt man nur einen Cut-Off-Wert, ab dem eine psychische Störung vorliegt oder ein bestimmtes (z.b. Lern- )Ziel erreicht wurde Einführung in die Test- und Fragebogenkonstruktion, Pearson Education 2003, Markus Bühner, 10 10

11 3.2 Auswahl von Testaufgaben (1) Gebundene Aufgabenbeantwortung (2) Allgemeine Probleme gebundener Antwortformate (3) Freie Aufgabenbeantwortung (4) Atypische Aufgabenbeantwortung (5) Probleme bei der Formulierung von Fragebogenitems (6) Hilfen zur Aufgabenkonstruktion (7) Erkennen eines Itembias Einführung in die Test- und Fragebogenkonstruktion, Pearson Education 2003, Markus Bühner, 11 11

12 (1) Gebundenes Antwortformat Bei der gebundenen Beantwortung werden festgelegte Antwortkategorien vorgegeben Es gibt keinen Freiraum für eigene Antworten Beispiele für gebunden Antwortformate: mehrstufige Ratingskalen Richtig-Falsch-Aufgaben Mehrfach-Wahlaufgaben Zuordnungsaufgaben Umordnungsaufgaben Einführung in die Test- und Fragebogenkonstruktion, Pearson Education 2003, Markus Bühner, 12 12

13 (1) Gebundenes Antwortformat mehrstufige Ratingskalen: Ratingskalen bestehen aus mehr als zwei Antwortkategorien Sie sollen die qualitative Beurteilung einer Merkmals-ausprägung ermöglichen Wie differenziert die Antwortkategorien abgestuft werden sollen (z.b. 3-stufig, 4-stufig oder 10-stufig), kann festgelegt werden Ratingskalen können bipolar oder unipolar sein Einführung in die Test- und Fragebogenkonstruktion, Pearson Education 2003, Markus Bühner, 13 13

14 (1) Gebundenes Antwortformat mehrstufige Ratingskalen: Einführung in die Test- und Fragebogenkonstruktion, Pearson Education 2003, Markus Bühner, 14 14

15 (1) Gebundenes Antwortformat Vorteile mehrstufige Ratingskalen: Man erhält sehr differenzierte Informationen über die Ausprägung eines Merkmals Durchführung und die Auswertung sind ökonomisch Die Differenziertheit der Fragen kann dem Untersuchungszweck und der Fähigkeit der Probanden angeglichen werden Einführung in die Test- und Fragebogenkonstruktion, Pearson Education 2003, Markus Bühner, 15 15

16 (1) Gebundenes Antwortformat Nachteile mehrstufige Ratingskalen: Eventuell werden die Abstufungen subjektiv unterschiedlich aufgefasst Antworttendenzen können auftreten, z.b. Neigung zu extremen Antworten oder die Tendenz zu mittleren Urteilen Probanden eine mittlere oder neutrale Kategorie vorzuenthalten kann problematisch sein, da sie so zu einer Entscheidung gezwungen werden Einführung in die Test- und Fragebogenkonstruktion, Pearson Education 2003, Markus Bühner, 16 16

17 (1) Gebundenes Antwortformat Richtig-Falsch-Aufgaben: Richtig-Falsch-Aufgaben bestehen nur aus zwei Antwortmöglichkeiten Sie kommen als Leistungstestaufgaben (Richtig-Falsch- Aufgaben) oder auch Ja-Nein-Fragen (Trifft zu / Trifft nicht zu) in Persönlichkeitstests vor Der Antwortmodus reicht von Ankreuzen über Durchstreichen bis dahin, ein Item mit einem Haken zu versehen Einführung in die Test- und Fragebogenkonstruktion, Pearson Education 2003, Markus Bühner, 17 17

18 (1) Gebundenes Antwortformat Richtig-Falsch-Aufgaben: Einführung in die Test- und Fragebogenkonstruktion, Pearson Education 2003, Markus Bühner, 18 18

19 (1) Gebundenes Antwortformat Vorteile der Richtig-Falsch-Aufgaben: Die Bearbeitungs-, Auswertungs- und Lösungszeit ist meist kurz Für die Probanden ist die Testinstruktion in der Regel leicht zu verstehen Die Items können von den Probanden schnell und auch relativ leicht beantwortet werden Einführung in die Test- und Fragebogenkonstruktion, Pearson Education 2003, Markus Bühner, 19 19

20 (1) Gebundenes Antwortformat Nachteile der Richtig-Falsch-Aufgaben: Ja-Nein-Items müssen so formuliert werden, dass sie eindeutig beantwortet werden können Im Gegensatz zum Ratingformat ist ein hoher Prozentsatz an Zufallslösungen möglich (50 Prozent) Man erhält wenig differenzierte Informationen Es Hinweise dafür, dass bei Ja-Nein-Items eine erhöhte Ja-sage- Tendenz zu beobachten ist (Krosnick, 1999, S. 552) Einführung in die Test- und Fragebogenkonstruktion, Pearson Education 2003, Markus Bühner, 20 20

21 (1) Gebundenes Antwortformat Mehrfach-Wahlaufgaben: Mehrfach-Wahlaufgaben haben mehr als zwei Antwortalternativen Eine bekannte Art sind Multiple-Choice-Items, die insbesondere zur Erfassung von Wissen und zur Messung der Intelligenz eingesetzt werden Einführung in die Test- und Fragebogenkonstruktion, Pearson Education 2003, Markus Bühner, 21 21

22 (1) Gebundenes Antwortformat Mehrfach-Wahlaufgaben: Einführung in die Test- und Fragebogenkonstruktion, Pearson Education 2003, Markus Bühner, 22 22

23 (1) Gebundenes Antwortformat Vorteile der Mehrfach-Wahlaufgaben: Durchführung und Auswertung sind ökonomisch Eine zufällige Beantwortung der Items durch den Probanden ist weniger problematisch, je mehr Antwortalternativen zur Verfügung stehen und wenn darüber hinaus Kombinationen aus mehreren Antwortalternativen die Richtigantwort bilden Einführung in die Test- und Fragebogenkonstruktion, Pearson Education 2003, Markus Bühner, 23 23

24 (1) Gebundenes Antwortformat Nachteile der Mehrfach-Wahlaufgaben: Antwortalternativen zu finden ist eventuell schwierig, da alle falschen Antwortalternativen gleichwahrscheinlich gewählt werden sollten Nur ein Wiedererkennen von Material oder Wissen wird verlangt, keine Reproduktion Die Antworten können schon Hinweise auf die richtige Lösung enthalten Einführung in die Test- und Fragebogenkonstruktion, Pearson Education 2003, Markus Bühner, 24 24

25 (1) Gebundenes Antwortformat Zuordnungsaufgaben: Bei Zuordnungsaufgaben werden bestimmte Zeichen oder Inhalte anderen Zeichen oder Inhalten zugeordnet Einführung in die Test- und Fragebogenkonstruktion, Pearson Education 2003, Markus Bühner, 25 25

26 (1) Gebundenes Antwortformat Vorteile der Zuordnungsaufgaben: Durchführung und Auswertung sind ökonomisch Die zufällige Beantwortung ist bei diesem Aufgabentyp unproblematisch Eignet sich auch zur Überprüfung von Wissen Einführung in die Test- und Fragebogenkonstruktion, Pearson Education 2003, Markus Bühner, 26 26

27 (1) Gebundenes Antwortformat Nachteile der Zuordnungsaufgaben: Antwortalternativen zu finden ist eventuell schwierig, da alle falschen Antwortalternativen gleichwahrscheinlich gewählt werden sollten Statt Reproduktion wird nur Wiedererkennen von Material verlangt, was nicht für alle Konstrukte sinnvoll ist Einführung in die Test- und Fragebogenkonstruktion, Pearson Education 2003, Markus Bühner, 27 27

28 (1) Gebundenes Antwortformat Umordnungsaufgaben: Bei Umordnungsaufgaben müssen vorgegebene Fragmente der Reihenfolge entsprechend sortiert werden Einführung in die Test- und Fragebogenkonstruktion, Pearson Education 2003, Markus Bühner, 28 28

29 (1) Gebundenes Antwortformat Vorteile der Umordnungsaufgaben: Dieser Aufgabentyp ist bei Materialbearbeitungstests einsetzbar, beispielsweise beim HAWIE-R (Tewes, 1991) Nachteile der Umordnungsaufgaben: Speziell bei Gruppentestungen muss das Material, falls es sich um Kärtchen oder Ähnliches handelt, in großen Stückzahlen verfügbar sein Das Itemformat ist nur für wenige spezifische Fragestellungen anwendbar Einführung in die Test- und Fragebogenkonstruktion, Pearson Education 2003, Markus Bühner, 29 29

30 (2) Allgemeine Probleme gebundener Antwortformate Für manche Konstrukte schwierig anzuwenden Absichtliches Fälschen (Simulation und Dissimulation), Raten, Antworttendenzen (Ja-sage oder Nein-sage-Tendenz), Soziale Erwünschtheit, Motivation, Reihenfolgeeffekte Auswirkungen von Verfälschungen: deutliche Verzerrungen der Skalenwerte Strategien gegen Verfälschung: Forced-Choice-Items Spezielle Fragebögen zur Erfassung sozialer Erwünschtheit Validitätsskalen (z.b. L-, F- und K-Skala im MMPI-II) Einführung in die Test- und Fragebogenkonstruktion, Pearson Education 2003, Markus Bühner, 30 30

31 (3) Freie Aufgabenbeantwortung Für die Aufgabenbeantwortung werden keine festen Kategorien vorgegeben, sie ist frei oder teilstrukturiert (teilstrukturiert bedeutet, dass Teile der Lösung vorgegeben sind) Z.B. Ergänzungsaufgaben, Kurzaufsatz Einführung in die Test- und Fragebogenkonstruktion, Pearson Education 2003, Markus Bühner, 31 31

32 (4) Atypische Aufgabenbeantwortung Umfasst Antwortformate, die sich den oben erwähnten Kategorien nicht zuordnen lassen Z.B. ZVT Einführung in die Test- und Fragebogenkonstruktion, Pearson Education 2003, Markus Bühner, 32 32

33 (5) Probleme bei der Formulierung von Fragebogenitems Itempolung (Vorsicht bei negativ formulierten Items) Doppelte Verneinung Registrierung von Verhaltenshäufigkeiten (z.b. oft, selten, ) Einführung in die Test- und Fragebogenkonstruktion, Pearson Education 2003, Markus Bühner, 33 33

34 (6) Hilfen zur Aufgabenkonstruktion Begriffe mit mehreren Bedeutungen sollten vermieden werden Begriffe und Formulierungen vermeiden, die nur einem Teil der Zielgruppe (z.b. nur Akademikern) geläufig sind Einführung in die Test- und Fragebogenkonstruktion, Pearson Education 2003, Markus Bühner, 34 34

35 (6) Hilfen zur Aufgabenkonstruktion Jedem Item nur einen sachlichen Inhalt / Gedanken zugrunde legen Keine doppelten Verneinungen verwenden, da diese die Verständlichkeit verringern und zu einer längeren Aufgabenbearbeitung führen können Einführung in die Test- und Fragebogenkonstruktion, Pearson Education 2003, Markus Bühner, 35 35

36 (6) Hilfen zur Aufgabenkonstruktion Verallgemeinerungen vermeiden Umständliche Längen und telegraphische Kürzen vermeiden Einführung in die Test- und Fragebogenkonstruktion, Pearson Education 2003, Markus Bühner, 36 36

37 (6) Hilfen zur Aufgabenkonstruktion Wichtiges durch Fettdruck oder Unterstreichen oder Ähnlichem hervorheben Der Zeitpunkt bzw. die Zeitspanne, auf die Bezug genommen wird, sollte eindeutig definiert sein Einführung in die Test- und Fragebogenkonstruktion, Pearson Education 2003, Markus Bühner, 37 37

38 (7) Erkennen eines Antwortbias Antwortbias bezeichnet einen systematischen Fehler im Prozess des Messens Ein systematischer Bias beeinflusst alle Messungen in der gleichen Weise, er hat einen verstärkenden oder mindernden Effekt In der Testtheorie wird ein Item als biasfrei bezeichnet, wenn die Erfolgswahrscheinlichkeit, das Item zu lösen, für alle Personen mit gleicher Fähigkeit und aus derselben Untergruppe (z.b. Geschlecht oder Alter) gleich ist Methoden zum Identifizieren eines Antwort- oder Itembias: für jedes Item werden die ICC-Kurven für zwei unterschiedliche Stichproben verglichen Vergleich der Rangreihen der Itemschwierigkeiten in zwei Stichproben Einführung in die Test- und Fragebogenkonstruktion, Pearson Education 2003, Markus Bühner, 38 38

39 3.3 Skalenniveau Bei der empirischen Überprüfung von Theorien müssen Messmodelle abgeleitet werden, die Theorie und Empirie verknüpfen Ziel ist es,relationen zwischen Objekten (empirisches Relativ) möglichst exakt in Zahlen (numerisches Relativ) umzusetzen (homomorphe Abbildung) Welche Interpretationen später mit den Testergebnissen möglich sind, hängt von der Ebene (Skalenniveau) ab, auf der gemessen werden konnte Jedes Skalenniveau zeichnet sich durch bestimmte Eigenschaften aus Einführung in die Test- und Fragebogenkonstruktion, Pearson Education 2003, Markus Bühner, 39 39

40 3.3 Skalenniveau Nominalskalenniveau Antwortformate, die lediglich eine Zuordnung in wertfreie Kategorien verlangen (ja-nein o.ä.) haben Nominalskalenniveau Die Anzahl der Kategorien ist dabei beliebig. Die daraus resultierenden Daten erlauben nur Aussagen über Gleichheit / Ungleichheit bzw. zwischen Anteilswerten (relative Häufigkeiten oder Prozentwerte) - Im Freiburger Persönlichkeitsinventar, revidierte Form (FPI-R, Fahrenberg, Hampel und Selg, 2002) werden Probanden beispielsweise Aussagen vorgegeben, die mit nein (0) oder ja (1) beantwortet werden müssen Einführung in die Test- und Fragebogenkonstruktion, Pearson Education 2003, Markus Bühner, 40 40

41 3.3 Skalenniveau Ordinalskalenniveau Daten, die vergleichende Aussagen ( größer / kleiner oder besser / schlechter und gleich / ungleich ) zulassen haben Ordinalskalenniveau (z.b. Schulnoten) Auf Ordinalskalenniveau macht es keinen Sinn, Differenzen zwischen Kategorien zu vergleichen - Der Leistungsunterschied zwischen den Schulnote 1" und 3" muss nicht dem Leistungsunterschied zwischen den Noten 4" und 6" entsprechen) Einführung in die Test- und Fragebogenkonstruktion, Pearson Education 2003, Markus Bühner, 41 41

42 3.3 Skalenniveau Intervallskalenniveau Daten, die Differenzbildung ( A - B = C - D ), Relationen ( größer / kleiner oder besser / schlechter ) und Aussagen über Unterschiede ( Gleichheit / Ungleichheit ) zulassen, haben Intervallskalenniveau Beispiel: Maßeinheiten wie Zentimeter oder Kilogramm - Der Unterschied zwischen 20 cm und 10 cm ist exakt der gleiche wie zwischen 90 cm und 80 cm, dieser ist in beiden Fällen genau 10 cm Einführung in die Test- und Fragebogenkonstruktion, Pearson Education 2003, Markus Bühner, 42 42

43 3.4 Ermittlung der Itemrohwerte (1) Verteilungen: Maße der zentralen Tendenz und Dispersion (2) Erstellen eines Histogramms mit SPSS (3) Prüfung auf Normalverteilung mit SPSS (4) Beispiel für die Normalverteilungsprüfung mit SPSS (5) Schwierigkeitsanalyse (6) Ermitteln von deskriptiven Statistiken mit SPSS (7) Beispiel für die Durchführung einer Schwierigkeitsanalyse mit SPSS Einführung in die Test- und Fragebogenkonstruktion, Pearson Education 2003, Markus Bühner, 43 43

44 3.4 Ermittlung der Itemrohwerte Der Probandenrohwert ist der Wert eines Probanden bei der Beantwortung eines einzelnen Items Den über alle Probanden summierten oder gemittelten Probandrohwert nennt man Itemrohwert Mehrere Itemrohwerte können sinnvoll zu Skalen oder Untertestwerten zusammengefasst werden Bei Mehrfachwahlaufgaben kann ein Item auch durch Raten richtig gelöst worden sein, hier kann ein Itemrohwert mit Zufallskorrektur berechnet werden Einführung in die Test- und Fragebogenkonstruktion, Pearson Education 2003, Markus Bühner, 44 44

45 (1) Verteilungen: Maße der zentralen Tendenz und Dispersion Eigenschaften der Normalverteilung: glockenförmiger Verlauf Symmetrie zwischen einer (zwei) Standardabweichung(en) links und rechts vom Mittelwert liegen 68 (95) Prozent der Probanden Einführung in die Test- und Fragebogenkonstruktion, Pearson Education 2003, Markus Bühner, 45 45

46 (1) Verteilungen: Maße der zentralen Tendenz und Dispersion Maße der zentralen Tendenz: - Mittelwert - Median - Modus/Modalwert Einführung in die Test- und Fragebogenkonstruktion, Pearson Education 2003, Markus Bühner, 46 46

47 (1) Verteilungen: Maße der zentralen Tendenz und Dispersion Dispersionsmaße: - Varianz - Standardabweichung - Interquartilabstand - Spannweite Einführung in die Test- und Fragebogenkonstruktion, Pearson Education 2003, Markus Bühner, 47 47

48 (1) Verteilungen: Maße der zentralen Tendenz und Dispersion - Schiefe - Exzess Schiefe und Exzess (Maß für die Schmal-oder Breitgipfligkeit einer Verteilung) sind wichtig um Verteilungsvoraussetzungen von Items zu prüfen, wenn sie weiteren statistischen Analysen unterzogen werden sollen (z.b. linearen Strukturgleichungsmodellen) Einführung in die Test- und Fragebogenkonstruktion, Pearson Education 2003, Markus Bühner, 48 48

49 (2) Erstellen eines Histogramms mit SPSS Einführung in die Test- und Fragebogenkonstruktion, Pearson Education 2003, Markus Bühner, 49 49

50 (3) Prüfung auf Normalverteilung mit SPSS Einführung in die Test- und Fragebogenkonstruktion, Pearson Education 2003, Markus Bühner, 50 50

51 (4) Beispiel für die Normalverteilungsprüfung mit SPSS - Nullhypothese: Normalverteilung liegt vor - Die asymptotische (= näherungsweise bestimmte) Signifikanz (α) liegt aber im Beispiel in allen Fällen deutlich unter.05 - Die asymptotische (näherungsweise bestimmte) Prüfgröße ist z- verteilt, das heißt, ein Wert z > 1.96 bedeutet, dass eine signifikante Abweichung von der Normalverteilung vorliegt Einführung in die Test- und Fragebogenkonstruktion, Pearson Education 2003, Markus Bühner, 51 51

52 (5) Schwierigkeitsanalyse Bei Ratingskalen wird fast immer der Mittelwert als Schwierigkeitsindex herangezogen, da bei Ratingskalen in der Regel Intervalldatenniveau unterstellt wird In diesem Abschnitt werden daher die folgenden Schwierigkeitsindizes für Nominaldatenniveau behandelt: Schwierigkeitsindex ohne Korrektur Schwierigkeitsindex mit Zufallskorrektur Schwierigkeitsindex mit Inangriffnahmekorrektur Schwierigkeitsindex mit Zufallskorrektur und Inangriffnahmekorrektur Einführung in die Test- und Fragebogenkonstruktion, Pearson Education 2003, Markus Bühner, 52 52

53 (5) Schwierigkeitsanalyse Schwierigkeitsindex ohne Korrektur Einsatz beispielsweise bei Persönlichkeitstests, bei denen Raten eine untergeordnete Rolle spielt Ein hoher Prozentwert steht für eine leichte Aufgabe, ein geringer Prozentwert dagegen für eine schwere Aufgabe Einführung in die Test- und Fragebogenkonstruktion, Pearson Education 2003, Markus Bühner, 53 53

54 (5) Schwierigkeitsanalyse Schwierigkeitsindex mit Zufallskorrektur Einsatz vorwiegend bei Leistungstests, bei denen es eine richtige Lösung gibt oder bei Fragebögen, bei denen zufällige Itembeantwortung eine Rolle spielt Einführung in die Test- und Fragebogenkonstruktion, Pearson Education 2003, Markus Bühner, 54 54

55 (5) Schwierigkeitsanalyse Schwierigkeitsindex mit Inangriffnahmekorrektur Einsatz beispielsweise bei Intelligenztests oder bei zeitbegrenzten Niveautests, bei denen nicht alle Aufgaben von allen Probanden gelöst werden Einführung in die Test- und Fragebogenkonstruktion, Pearson Education 2003, Markus Bühner, 55 55

56 (5) Schwierigkeitsanalyse Schwierigkeitsindex mit Zufallskorrektur und Inangriffnahmekorrektur Bei dieser Methode wird sowohl berücksichtigt, dass Probanden geraten haben könnten, als auch die Tatsache, dass manche Probanden Items aufgrund von Zeitmangel nicht bearbeitet haben bzw. die Itembearbeitung begonnen, aber nicht fertiggestellt haben Einführung in die Test- und Fragebogenkonstruktion, Pearson Education 2003, Markus Bühner, 56 56

57 (5) Schwierigkeitsanalyse Beziehung des Schwierigkeitsindex zu anderen Werten Mittlere P-Werte (Schwierigkeiten) bei dichotomen Items erhöhen die Wahrscheinlichkeit für hohe Streuungen der Itembeantwortung und damit eine hohe Differenzierung zwischen den Probanden (=Voraussetzung für hohe Korrelationen) Extreme Schwierigkeiten ermöglichen eine Differenzierung in Randbereichen, führen aber meist zu reduzierter Homogenität und zu reduzierten Trennschärfen Die Standardabweichung einer Aufgabe mit dichotomen Itemformat rechnerisch vom Schwierigkeitsindex ab: Einführung in die Test- und Fragebogenkonstruktion, Pearson Education 2003, Markus Bühner, 57 57

58 (6) Ermitteln von deskriptiven Statistiken mit SPSS Einführung in die Test- und Fragebogenkonstruktion, Pearson Education 2003, Markus Bühner, 58 58

59 (7) Beispiel für die Durchführung einer Schwierigkeitsanalyse mit SPSS Beispiel für ein Item, bei dem die Breite der Antwortkategorien nicht ausgenutzt wurde, d.h. Antwortalternative 0 wurde von keinem Probanden gewählt M =2,65 SD = ,0 1,0 2,0 3,0 4,0 N12 nicht besonder fröhlich" Einführung in die Test- und Fragebogenkonstruktion, Pearson Education 2003, Markus Bühner, 59 59

60 (7) Beispiel für die Durchführung einer Schwierigkeitsanalyse mit SPSS Beispiel für ein Item, das besonders stark streut, d.h die Probanden unterscheiden sich in der Beantwortung dieser Items sehr M =1,83 SD =1, ,0 1,0 2,0 3,0 4,0 N22 gern im Mittelpunkt stehen" Einführung in die Test- und Fragebogenkonstruktion, Pearson Education 2003, Markus Bühner, 60 60

61 (7) Beispiel für die Durchführung einer Schwierigkeitsanalyse mit SPSS Beispiel für ein Item, das extrem schief verteilt ist M =3,13 SD = ,0 1,0 2,0 3,0 4,0 N17 gerne mit anderen unterhalten" Einführung in die Test- und Fragebogenkonstruktion, Pearson Education 2003, Markus Bühner, 61 61

62 3.5 Trennschärfenanalyse (1) Berechnung von Trennschärfen (2) Inhaltliche Erläuterungen zu Trennschärfe und Schwierigkeit (3) Fremdtrennschärfen (4) Berechnung von Trennschärfen mit SPSS (5) Beispiel einer Trennschärfenanalyse Einführung in die Test- und Fragebogenkonstruktion, Pearson Education 2003, Markus Bühner, 62 62

63 3.5 Trennschärfenanalyse Eine Trennschärfe stellt die korrigierte Korrelation (Part-whole- Korrektur) einer Aufgabe mit einer Skala dar Inhaltlich drückt eine Trennschärfe aus, wie gut ein Item eine Skala, die aus den restlichen Items gebildet wird, widerspiegelt Eigentrennschärfe: Korrelation Item mit Skala; Skala und Item messen das gleiche Kriterium Fremdtrennschärfe: Korrelation Item mit Skalen oder Testwerten andere Fragebögen oder Kriterien Einführung in die Test- und Fragebogenkonstruktion, Pearson Education 2003, Markus Bühner, 63 63

64 3.5 Trennschärfenanalyse Part-whole-Korrektur: Ohne part-whole-korrektur kommt es zu einer Überschätzung der Trennschärfe, da das betreffende Item selbst Bestandteil der Skala ist Ohne part-whole-korrektur ginge ein Teil der Skalenstreuung auf das entsprechende Item zurück, mit dem die Skala korreliert wird Je größer die Itemanzahl einer Skala ist, desto geringer sind die Auswirkungen der Korrektur auf die Trennschärfe, denn mit zunehmender Itemzahl wird der Beitrag eines einzelnen Items relativ zum Gesamtskalenwert geringer Je homogener eine Skala ist, desto weniger ändern sich die Trennschärfen durch eine part-whole- Korrektur Einführung in die Test- und Fragebogenkonstruktion, Pearson Education 2003, Markus Bühner, 64 64

65 (1) Berechnung von Trennschärfen Produkt-Moment-Korrelation als Trennschärfe: Folgende Formel wird zur Berechnung der part-wholekorrigierten Trennschärfe zwischen einem intervallskalierten Item ( Ich bin ein offener Mensch trifft zu trifft nicht zu) und einer intervallskalierten Skala ( Extraversion ) herangezogen: Einführung in die Test- und Fragebogenkonstruktion, Pearson Education 2003, Markus Bühner, 65 65

66 (1) Berechnung von Trennschärfen Punktbiseriale-Korrelation als Trennschärfe: Grundlage bildet auch hier die Produkt-Moment-Korrelation, wobei ein dichotomes Item (z.b. Beispiel Ich gehe gerne aus Ja-Nein) mit einer in der Regel intervallskalierten Skala (z.b. Extraversion ) korreliert wird Die entsprechende part-whole-korrigierte Formel lautet: Einführung in die Test- und Fragebogenkonstruktion, Pearson Education 2003, Markus Bühner, 66 66

67 (2) Inhaltliche Erläuterungen zu Trennschärfe und Schwierigkeit Zusammenhang zwischen Schwierigkeit und Trennschärfe Items mit mittlerer Schwierigkeit differenzieren am besten zwischen Probanden, die ein Item lösen ( Löser ), und Probanden, die ein Item nicht lösen ( Nicht-Löser ) Bei dichotomen Items ist die Itemstreuung rechnerisch vollkommen durch die Itemschwierigkeit determiniert Reichen die Itemschwierigkeiten bei intervallskalierten Items an den Rand der Antwortskala, spricht man von Boden- oder Deckeneffekten Beide Effekte haben zur Folge, dass zwischen Individuen mit verschiedenen Merkmalsausprägungen nicht mehr ausreichend differenziert werden kann Einführung in die Test- und Fragebogenkonstruktion, Pearson Education 2003, Markus Bühner, 67 67

68 (2) Inhaltliche Erläuterungen zu Trennschärfe und Schwierigkeit Beispiel Zusammenhang zwischen Schwierigkeit und Trennschärfe bei dichtomem Item: Item mit mittlerer Schwierigkeit (50 Löser und 50 Nichtlöser ) ermöglicht 50 x 50 = Unterscheidungen zwischen den Probanden Item mit hoher Schwierigkeit (20 Löser und 80 Nichtlöser ) ermöglicht nur 20 x 80 = Unterscheidungen zwischen den Probanden Item mit extrem niedriger Schwierigkeit (95 Löser und 5 Nichtlöser ) ermöglicht lediglich 95 x 5 = 475 Unterscheidungen zwischen den Probanden Einführung in die Test- und Fragebogenkonstruktion, Pearson Education 2003, Markus Bühner, 68 68

69 (2) Inhaltliche Erläuterungen zu Trennschärfe und Schwierigkeit Beispiel Unterschiedliche Trennschärfen bei gleicher Itemschwierigkeit: Bildung von zwei Gruppen von Probanden: Eine Gruppe, die das mittelschwere Intelligenztestitems gelöst hat und eine Gruppe, die es nicht gelöst hat Eine sehr gute Trennschärfe liegt vor, wenn jeder Proband aus der Gruppe der Löser einen Testwert (z.b. IQ ) über 100 und jeder Proband aus der Gruppe der Nicht-Löser einen Testwert ( IQ ) unter 100 aufweist Eine geringe Trennschärfe liegt vor, wenn in der Gruppe der Probanden mit einem IQ von über 100 geringfügig mehr Probanden das entsprechende Item gelöst oder nicht gelöst haben und dies auch für die Gruppe der Probanden mit einem IQ von unter 100 zutrifft 69 Einführung in die Test- und Fragebogenkonstruktion, Pearson Education 2003, Markus Bühner, 69

70 (2) Inhaltliche Erläuterungen zu Trennschärfe und Schwierigkeit Kombination unterschiedlicher Itemschwierigkeiten mit unterschiedlichen Trennschärfen: Einführung in die Test- und Fragebogenkonstruktion, Pearson Education 2003, Markus Bühner, 70 70

71 (2) Inhaltliche Erläuterungen zu Trennschärfe und Schwierigkeit Je steiler der Anstieg der Item Characteristic Curves (ICC), desto größer ist die Trennschärfe Einführung in die Test- und Fragebogenkonstruktion, Pearson Education 2003, Markus Bühner, 71 71

72 (2) Inhaltliche Erläuterungen zu Trennschärfe und Schwierigkeit Item A ist ideal trennscharf (p =.50, rit. 1). Nur mit diesem Item alleine ließe sich entscheiden, ob ein Proband beispielsweise unter- oder überdurchschnittlich intelligent ist Einführung in die Test- und Fragebogenkonstruktion, Pearson Education 2003, Markus Bühner, 72 72

73 (2) Inhaltliche Erläuterungen zu Trennschärfe und Schwierigkeit Mit Aufgabe I (p =.20, rit. 1) ließe sich entscheiden, ob ein Proband zu den etwa 20 Prozent intelligentesten Probanden (IQ. 113) gehört oder nicht Einführung in die Test- und Fragebogenkonstruktion, Pearson Education 2003, Markus Bühner, 73 73

74 (2) Inhaltliche Erläuterungen zu Trennschärfe und Schwierigkeit Item B (p =.50, rit = 0) dagegen ist vollkommen nutzlos, da es Intelligente von Nicht-Intelligenten nicht unterscheidet, obwohl es aufgrund seiner mittleren Schwierigkeit eigentlich gute Voraussetzungen besitzt Einführung in die Test- und Fragebogenkonstruktion, Pearson Education 2003, Markus Bühner, 74 74

75 (2) Inhaltliche Erläuterungen zu Trennschärfe und Schwierigkeit Item C wird von keinem Probanden mit einem IQ unter 85 und von allen Probanden mit einem IQ über 115 richtig beantwortet (erkennbar durch das Auftreffen der ICC auf die X1-Achse bzw. X2-Achse), es hat also eine hohe Trennschärfe Einführung in die Test- und Fragebogenkonstruktion, Pearson Education 2003, Markus Bühner, 75 75

76 (2) Inhaltliche Erläuterungen zu Trennschärfe und Schwierigkeit Das Item D (p =.50, rit..30) stellt den weitaus häufigsten Fall eines Items mit mittlerer Trennschärfe bei gleichzeitig geringer bis mittlerer Itemschwierigkeit dar Mit Items dieser Art kann man eine Differenzierung entlang der gesamten Testskala erreichen Einführung in die Test- und Fragebogenkonstruktion, Pearson Education 2003, Markus Bühner, 76 76

77 (2) Inhaltliche Erläuterungen zu Trennschärfe und Schwierigkeit Im Gegensatz zu allen bisherigen Items, wird Item E von den weniger intelligenten Probanden etwas häufiger gelöst als von den intelligenten; es hat folglich eine geringe und negative Trennschärfe Solche Items sind ebenso wie Item B für die Testkonstruktion unbrauchbar Einführung in die Test- und Fragebogenkonstruktion, Pearson Education 2003, Markus Bühner, 77 77

78 (2) Inhaltliche Erläuterungen zu Trennschärfe und Schwierigkeit Die Items F und H differenzieren gut, aber nur in extremen Schwierigkeitsbereichen (IQ. 87 und 113) Die Items C, F und H haben zwar die gleiche Trennschärfe (gleicher Anstieg der ICC), aber unterschiedliche Schwierigkeit Einführung in die Test- und Fragebogenkonstruktion, Pearson Education 2003, Markus Bühner, 78 78

79 (2) Inhaltliche Erläuterungen zu Trennschärfe und Schwierigkeit Die Items A, B, C, D und E haben die gleiche Schwierigkeit (ICC ś schneiden sich bei IQ = 100), aber unterschiedliche Trennschärfen (unterschiedlicher Anstieg der ICĆs) Item G hat eine mittlere Trennschärfe (flacher Anstieg der ICC) bei einer Schwierigkeit von p =.20 (p wie bei Item I) Einführung in die Test- und Fragebogenkonstruktion, Pearson Education 2003, Markus Bühner, 79 79

80 (2) Inhaltliche Erläuterungen zu Trennschärfe und Schwierigkeit Insgesamt differenzieren Tests mit homogen mittelschweren Items am besten bei mittleren Merkmalsausprägungen Da bei mittlerer Itemschwierigkeit die Wahrscheinlichkeit für hohe Trennschärfen ansteigt, ist für solche Skalen auch eine höhere Reliabilität zu erwarten Um auch in Randbereichen eines Merkmalsbereichs zu differenzieren, muss die Skala auch extremere Schwierigkeitsbereiche mit Items abdecken Meist erreichen Items mit extremen Schwierigkeiten geringere Trennschärfen als mittelschwere Items. Dies reduziert die Itemhomogenität und daher sind für solche Skalen nicht ganz so hohe Reliabilitäten wie für Skalen mit ausschließlich mittelschweren Items zu erwarten Einführung in die Test- und Fragebogenkonstruktion, Pearson Education 2003, Markus Bühner, 80 80

81 (3) Fremdtrennschärfen Von Fremdtrennschärfen wird gesprochen, wenn eine Korrelation zwischen einem Item und einem Kriteriumswert erhoben wird Es werden nur die Items ausgewählt, die hoch mit dem Kriterium korrelieren, die restlichen Items werden ausgesondert Fremdtrennschärfen maximieren damit die Kriteriums-Validität eines Tests, während Eigentrennschärfen die Homogenität eines Tests maximieren Einführung in die Test- und Fragebogenkonstruktion, Pearson Education 2003, Markus Bühner, 81 81

82 (3) Fremdtrennschärfen Beispiel: Itemauswahl durch Analyse der Fremdtrennschärfe Mit einem Eignungstest wurden Bewerber für eine betriebliche Ausbildung ausgewählt und dann wurde zwei Jahre später die Leistung im Abschlusstest (erzielte Punkte) gemessen Die Abbildung zeigt die Korrelation der einzelnen Testitems im Eingangstest mit der Gesamtpunktzahl im Abschlusstest (= Kriterium für Ausbildungserfolg) Einführung in die Test- und Fragebogenkonstruktion, Pearson Education 2003, Markus Bühner, 82 82

83 (3) Fremdtrennschärfen Insbesondere die Items 18 und 19 sind besonders gut geeignet, die Leistung im Abschlusstest vorherzusagen, da sie hoch mit den Punkten im Abschlusstest korrelieren Lediglich auf Item 3 würde man wahrscheinlich verzichten, da es eine extrem geringe Fremdtrennschärfe aufweist Einführung in die Test- und Fragebogenkonstruktion, Pearson Education 2003, Markus Bühner, 83 83

84 (4) Berechnung von Trennschärfen mit SPSS Einführung in die Test- und Fragebogenkonstruktion, Pearson Education 2003, Markus Bühner, 84 84

85 (5) Beispiel einer Trennschärfeanalyse Führt man eine Trennschärfeanalyse wie oben beschrieben durch, erhält man die folgende SPSS-Ausgabe Einführung in die Test- und Fragebogenkonstruktion, Pearson Education 2003, Markus Bühner, 85 85

86 (5) Beispiel einer Trennschärfeanalyse Die Itemschwierigkeit variiert von 1.68 bis 3.13 Es werden etwa 29 Prozent (Range: = 1.44) der theoretisch möglichen Breite der 5-stufigen Antwortskala ausgeschöpft, dabei zu einem größeren Anteil die rechte Skalenhälfte (Zustimmung) Einführung in die Test- und Fragebogenkonstruktion, Pearson Education 2003, Markus Bühner, 86 86

87 (5) Beispiel einer Trennschärfeanalyse Die Itemstreuungen bewegen sich in einem Bereich von.82 bis 1.08 Einführung in die Test- und Fragebogenkonstruktion, Pearson Education 2003, Markus Bühner, 87 87

88 (5) Beispiel einer Trennschärfeanalyse Item N47 weist eine sehr geringe Trennschärfe ( Corrected item total correlation ) auf Diese geringe Trennschärfe wirkt sich auch auf die Messgenauigkeit der Skala ( Alpha ) negativ aus: Das Cronbachalpha steigt an, wenn man das Item nicht in die Itemanalyse aufnehmen würde ( alpha if item deleted ) 88 Einführung in die Test- und Fragebogenkonstruktion, Pearson Education 2003, Markus Bühner, 88

89 (5) Beispiel einer Trennschärfeanalyse Allerdings sollten die Itemtrennschärfen immer im Zusammenhang mit der Itemschwierigkeit betrachtet werden Einführung in die Test- und Fragebogenkonstruktion, Pearson Education 2003, Markus Bühner, 89 89

90 (5) Beispiel einer Trennschärfeanalyse Bei den Items N47, N7 und N17 handelt es sich um Items mit extremer Schwierigkeit, da sie an den Endpunkten der Schwierigkeitsverteilung liegen Einführung in die Test- und Fragebogenkonstruktion, Pearson Education 2003, Markus Bühner, 90 90

91 (5) Beispiel einer Trennschärfeanalyse N37, N52 und N12 sind mindestens genauso weit oder weiter als das Item N47 von der Skalenmitte (bezüglich der Schwierigkeit der Items) entfernt und weisen somit einen mindestens vergleichbaren Schwierigkeitsgrad bei höherer Trennschärfe auf 91 Einführung in die Test- und Fragebogenkonstruktion, Pearson Education 2003, Markus Bühner, 91

92 (5) Beispiel einer Trennschärfeanalyse das Item N47 ist als einziges Item linkssteil verteilt, während die Items N37, N52 und N12 rechtssteil verteilt sind (ähnlich wie die anderen Items der Skala) Einführung in die Test- und Fragebogenkonstruktion, Pearson Education 2003, Markus Bühner, 92 92

93 (5) Beispiel einer Trennschärfeanalyse Die andersartige Verteilung oder die geringe Itemschwierigkeit des Items N47 können ein Grund für seine geringe Trennschärfe sein Auch für Items mit extremen Schwierigkeiten sind relativ hohe Trennschärfen möglich, wie die Trennschärfe des Items N17 zeigt 93 Einführung in die Test- und Fragebogenkonstruktion, Pearson Education 2003, Markus Bühner, 93

94 (5) Beispiel einer Trennschärfeanalyse Auch eine Betrachtung der Itemstreuung im Zusammenhang mit der Itemschwierigkeit ist sinnvoll Einführung in die Test- und Fragebogenkonstruktion, Pearson Education 2003, Markus Bühner, 94 94

95 (5) Beispiel einer Trennschärfeanalyse Mittelschwere Items weisen in der Regel die höchsten Streuungen auf Bei extremen Schwierigkeiten (geringe oder hohe) nimmt dagegen die Wahrscheinlichkeit für eine hohe Streuungen ab Einführung in die Test- und Fragebogenkonstruktion, Pearson Education 2003, Markus Bühner, 95 95

96 (5) Beispiel einer Trennschärfeanalyse Items, deren Itemschwierigkeit unter der Skalenmitte liegen, kommen in diesem Beispiel fast nicht vor Für solche Items ist die Wahrscheinlichkeit hoch, dass die Itemstreuungen umso geringer ausfallen, je weiter die Itemschwierigkeit nach rechts von der Mittelkategorie abweicht 96 Einführung in die Test- und Fragebogenkonstruktion, Pearson Education 2003, Markus Bühner, 96

97 (5) Beispiel einer Trennschärfeanalyse Im Folgenden wird der Zusammenhang zwischen Streuung und Trennschärfe betrachtet Einführung in die Test- und Fragebogenkonstruktion, Pearson Education 2003, Markus Bühner, 97 97

98 (5) Beispiel einer Trennschärfeanalyse Es lässt sich im Beispiel kein positiver Zusammenhang zwischen Streuung und Trennschärfe finden (je höher die Streuung, desto höher die Trennschärfe: Im Idealfall liegen die Punkte auf einer Geraden von links unten nach rechts oben) Einführung in die Test- und Fragebogenkonstruktion, Pearson Education 2003, Markus Bühner, 98 98

99 (5) Beispiel einer Trennschärfeanalyse Items mit einer hohen Streuung korrelieren mit höherer Wahrscheinlichkeit mit den anderen Items oder Kriterien als Items, in denen sich Probanden mit geringer Streuung Dies trifft nur dann zu, wenn es sich um systematische und nicht um zufällige (durch Messfehler bedingte) Streuungen handelt Einführung in die Test- und Fragebogenkonstruktion, Pearson Education 2003, Markus Bühner, 99 99

100 (5) Beispiel einer Trennschärfeanalyse Die Streuung des Items N47 fällt im Vergleich zu anderen höher aus, jedoch die Trennschärfe ist gering Das heißt, dass sich die Antworten der Probanden auf Item N47 zwar stark unterscheiden, diese Unterscheidungen fallen aber nur in einem geringen Maße im Sinne der Erwartung aus 100 Einführung in die Test- und Fragebogenkonstruktion, Pearson Education 2003, Markus Bühner, 100

101 (5) Beispiel einer Trennschärfeanalyse Die Streuung des Items N17 im Vergleich zu den anderen Items ist geringer, aber die Trennschärfe dennoch hoch Das heißt, dass sich die Antworten der Probanden auf Item N17 nicht stark unterscheiden, diese Unterscheidungen aber im Sinne der Erwartung ausfallen 101 Einführung in die Test- und Fragebogenkonstruktion, Pearson Education 2003, Markus Bühner, 101

102 (5) Beispiel einer Trennschärfeanalyse Item N2 weist im Vergleich zu den anderen Items eine relativ hohe Streuung und eine hohe Trennschärfe auf Je höher die Ausprägungen der Probanden auf Item N2 sind, desto höher fallen auch die Ausprägungen auf den restlichen Items der Skala aus Einführung in die Test- und Fragebogenkonstruktion, Pearson Education 2003, Markus Bühner,

103 (5) Beispiel einer Trennschärfeanalyse Eine weitere nützliche Betrachtungsweise der Items besteht darin, auf Itemstufen eines Items die Mittelwerte der restlichen Items einer Skala abzubilden Beispiel:Die Probanden, die auf dem Item N47 eine geringe Ausprägung aufweisen, sollten auch auf allen anderen Items der Skala Extraversion eine niedrige Ausprägung aufweisen Das heißt, betrachtet man die Probanden, die Item N47 mit starker Ablehnung beantwortet haben, sollten diese einen niedrigeren Skalenwert Extraversion aufweisen als Probanden, die Item N47 mit Ablehnung beantwortet haben Einführung in die Test- und Fragebogenkonstruktion, Pearson Education 2003, Markus Bühner,

104 (5) Beispiel einer Trennschärfeanalyse Dazu erstellt man einen Boxplot, das die Summenwerte (ohne Item 47) der Skala Extraversion auf den Itemabstufungen des Items 47 abbildet Einführung in die Test- und Fragebogenkonstruktion, Pearson Education 2003, Markus Bühner,

105 (5) Beispiel einer Trennschärfeanalyse Mit zunehmender Ausprägung auf dem jeweiligen Item steigt die Ausprägung auf den restlichen Items nicht an Genau diese Annahme müsste man aber treffen, wenn ein Item hoch mit der Skala korreliert 105 Einführung in die Test- und Fragebogenkonstruktion, Pearson Education 2003, Markus Bühner, 105

106 (5) Beispiel einer Trennschärfeanalyse Dieses Beispiel zeigt den gleichen Boxplot für ein trennscharfes Item Es lässt sich erkennen, dass mit zunehmender Itemausprägung auch die Ausprägung auf der Skala Extraversion ansteigt Einführung in die Test- und Fragebogenkonstruktion, Pearson Education 2003, Markus Bühner,

Testentwicklung. Kapitel 3 Direkt übernommen von Bühner, 2003

Testentwicklung. Kapitel 3 Direkt übernommen von Bühner, 2003 Testentwicklung Kapitel 3 Direkt übernommen von Bühner, 2003 Einführung in die Test- und Fragebogenkonstruktion, Pearson Education 2003, Markus Bühner, 1 3.1 Stufen der Testentwicklung (1) Anforderungsanalyse

Mehr

Einführung in die Test- und Fragebogenkonstruktion

Einführung in die Test- und Fragebogenkonstruktion Markus Bühner 1 Einführung in die Test- und Fragebogenkonstruktion 2., aktualisierte und erweiterte Auflage PEARSON Studium ein Imprint von Pearson Education München Boston San Francisco Harlow, England

Mehr

Messen im psychologischen Kontext I. Testentwicklung, Entwicklung von Items, Trennschärfeanalyse und Normierung

Messen im psychologischen Kontext I. Testentwicklung, Entwicklung von Items, Trennschärfeanalyse und Normierung Messen im psychologischen Kontext I Testentwicklung, Entwicklung von Items, Trennschärfeanalyse und Normierung Messen im psychologischen Kontext I 1. Psychologische Tests 2. Die Klassische Testtheorie

Mehr

Rekodierung invertierter Items

Rekodierung invertierter Items 16.Testkonstruktion Items analysieren (imrahmen der KTT) Pretest Aussortieren / Umschreiben von unverständlichen, uneindeutigen oder inakzeptablen Items empirische Prüfung Kennwerte: Itemschwierigkeit

Mehr

4.2 Grundlagen der Testtheorie. Wintersemester 2008 / 2009 Hochschule Magdeburg-Stendal (FH) Frau Prof. Dr. Gabriele Helga Franke

4.2 Grundlagen der Testtheorie. Wintersemester 2008 / 2009 Hochschule Magdeburg-Stendal (FH) Frau Prof. Dr. Gabriele Helga Franke 4.2 Grundlagen der Testtheorie Wintersemester 2008 / 2009 Hochschule Magdeburg-Stendal (FH) Frau Prof. Dr. Gabriele Helga Franke GHF im WiSe 2008 / 2009 an der HS MD-SDL(FH) im Studiengang Rehabilitationspsychologie,

Mehr

Auswahl von Testaufgaben

Auswahl von Testaufgaben Auswahl von Testaufgaben Auswahl von Testaufgaben Itemformat Formulierung Probleme/Verfälschungen Itemanalyse Skalen Itemformat Nach Bortz Offene Beantwortung Nach Bühning Freies Itemformat Halboffene

Mehr

Verfahren zur Skalierung. A. Die "klassische" Vorgehensweise - nach der Logik der klassischen Testtheorie

Verfahren zur Skalierung. A. Die klassische Vorgehensweise - nach der Logik der klassischen Testtheorie Verfahren zur Skalierung A. Die "klassische" Vorgehensweise - nach der Logik der klassischen Testtheorie 1. Daten: z. Bsp. Rating-Skalen, sogenannte "Likert" - Skalen 2. Ziele 1. Eine Skalierung von Items

Mehr

4.2 Grundlagen der Testtheorie. Wintersemester 2008 / 2009 Hochschule Magdeburg-Stendal (FH) Frau Prof. Dr. Gabriele Helga Franke

4.2 Grundlagen der Testtheorie. Wintersemester 2008 / 2009 Hochschule Magdeburg-Stendal (FH) Frau Prof. Dr. Gabriele Helga Franke 4.2 Grundlagen der Testtheorie Wintersemester 2008 / 2009 Hochschule Magdeburg-Stendal (FH) Frau Prof. Dr. Gabriele Helga Franke GHF im WiSe 2008 / 2009 an der HS MD-SDL(FH) im Studiengang Rehabilitationspsychologie,

Mehr

Was ist eine Testtheorie?

Was ist eine Testtheorie? Was ist eine Testtheorie? Eine Testtheorie bezeichnet eine Gesamtheit von Methoden zur Behandlung der Fragestellungen, welche sich bei der Testkonstruktion und -auswertung ergeben. Dieser Begriff ist nicht

Mehr

Welche Stufen muss ein Test innerhalb des Konstruktionsprozesses durchlaufen?

Welche Stufen muss ein Test innerhalb des Konstruktionsprozesses durchlaufen? Kapitel 3 Testkonstruktion Wie gehe ich bei der Testkonstruktion vor? Zur Testkonstruktion sind eine Reihe sorgfältig geplanter Schritte nötig. Wie man bei der Testentwicklung vorgehen kann, wird im folgenden

Mehr

Statistik. Jan Müller

Statistik. Jan Müller Statistik Jan Müller Skalenniveau Nominalskala: Diese Skala basiert auf einem Satz von qualitativen Attributen. Es existiert kein Kriterium, nach dem die Punkte einer nominal skalierten Variablen anzuordnen

Mehr

Klassische Testtheorie (KTT) Klassische Testtheorie (KTT) Klassische Testtheorie (KTT)

Klassische Testtheorie (KTT) Klassische Testtheorie (KTT) Klassische Testtheorie (KTT) Klassische Testtheorie (KTT) Die KTT stellt eine Sammlung von Methoden dar, die seit Beginn des vorigen Jahrhunderts zur exakten und ökonomischen Erfassung interindividueller Unterschiede entwickelt wurden.

Mehr

Parametrische vs. Non-Parametrische Testverfahren

Parametrische vs. Non-Parametrische Testverfahren Parametrische vs. Non-Parametrische Testverfahren Parametrische Verfahren haben die Besonderheit, dass sie auf Annahmen zur Verteilung der Messwerte in der Population beruhen: die Messwerte sollten einer

Mehr

Anteile Häufigkeiten Verteilungen Lagemaße Streuungsmaße Merkmale von Verteilungen. Anteile Häufigkeiten Verteilungen

Anteile Häufigkeiten Verteilungen Lagemaße Streuungsmaße Merkmale von Verteilungen. Anteile Häufigkeiten Verteilungen DAS THEMA: VERTEILUNGEN LAGEMAßE - STREUUUNGSMAßE Anteile Häufigkeiten Verteilungen Lagemaße Streuungsmaße Merkmale von Verteilungen Anteile Häufigkeiten Verteilungen Anteile und Häufigkeiten Darstellung

Mehr

fh management, communication & it Constantin von Craushaar fh-management, communication & it Statistik Angewandte Statistik

fh management, communication & it Constantin von Craushaar fh-management, communication & it Statistik Angewandte Statistik fh management, communication & it Folie 1 Überblick Grundlagen (Testvoraussetzungen) Mittelwertvergleiche (t-test,..) Nichtparametrische Tests Korrelationen Regressionsanalyse... Folie 2 Überblick... Varianzanalyse

Mehr

= = =0,2=20% 25 Plätze Zufallsübereinstimmung: 0.80 x x 0.20 = %

= = =0,2=20% 25 Plätze Zufallsübereinstimmung: 0.80 x x 0.20 = % allgemein Klassifizierung nach Persönlichkeitseigenschaften Messung von Persönlichkeitseigenschaften Zuordnung von Objekten zu Zahlen, so dass die Beziehungen zwischen den Zahlen den Beziehungen zwischen

Mehr

TESTTHEORIE UND TESTKONSTRUKTION - PRAKTISCHE ANWENDUNG - TEIL 3

TESTTHEORIE UND TESTKONSTRUKTION - PRAKTISCHE ANWENDUNG - TEIL 3 TESTTHEORIE UND TESTKONSTRUKTION - PRAKTISCHE ANWENDUNG - TEIL 3 Prof. Dr. Franke SS2012 Hochschule Magdeburg-Stendal (FH) M.Sc. Rehabilitationspsychologie Gliederung Reliabilität 1. Überblick 2. Berechnung

Mehr

Methodenlehre. Vorlesung 12. Prof. Dr. Björn Rasch, Cognitive Biopsychology and Methods University of Fribourg

Methodenlehre. Vorlesung 12. Prof. Dr. Björn Rasch, Cognitive Biopsychology and Methods University of Fribourg Methodenlehre Vorlesung 12 Prof. Dr., Cognitive Biopsychology and Methods University of Fribourg 1 Methodenlehre II Woche Datum Thema 1 FQ Einführung, Verteilung der Termine 1 18.2.15 Psychologie als Wissenschaft

Mehr

Angewandte Statistik 3. Semester

Angewandte Statistik 3. Semester Angewandte Statistik 3. Semester Übung 5 Grundlagen der Statistik Übersicht Semester 1 Einführung ins SPSS Auswertung im SPSS anhand eines Beispieles Häufigkeitsauswertungen Grafiken Statistische Grundlagen

Mehr

Inhaltsverzeichnis. 1 Über dieses Buch Zum Inhalt dieses Buches Danksagung Zur Relevanz der Statistik...

Inhaltsverzeichnis. 1 Über dieses Buch Zum Inhalt dieses Buches Danksagung Zur Relevanz der Statistik... Inhaltsverzeichnis 1 Über dieses Buch... 11 1.1 Zum Inhalt dieses Buches... 13 1.2 Danksagung... 15 2 Zur Relevanz der Statistik... 17 2.1 Beispiel 1: Die Wahrscheinlichkeit, krank zu sein, bei einer positiven

Mehr

Reliabilitäts- und Itemanalyse

Reliabilitäts- und Itemanalyse Reliabilitäts- und Itemanalyse In vielen Wissenschaftsdisziplinen stellt die möglichst exakte Messung von hypothetischen Prozessen oder Merkmalen sogenannter theoretischer Konstrukte ein wesentliches Problem

Mehr

VU Testtheorie und Testkonstruktion WS 08/09; Lengenfelder, Fritz, Moser, Kogler

VU Testtheorie und Testkonstruktion WS 08/09; Lengenfelder, Fritz, Moser, Kogler VU Testtheorie und Testkonstruktion WS 08/09; Lengenfelder, Fritz, Moser, Kogler Hausübung In der Übung Übungsblatt 06 1. Gegeben: Skala zur Messung der Gesundheitssorge mit 20 Items (dichotomes Antwortformat).

Mehr

Beispielberechnung Normierung

Beispielberechnung Normierung 1 Beispielberechnung Normierung Auszug Kursunterlagen MAS ZFH in Berufs-, Studien- und Laufbahnberatung Prof. Dr. Marc Schreiber, Dezember 2016 Verschiedene Formen der Normierung (interaktiv) Referenz:

Mehr

Statistik II: Grundlagen und Definitionen der Statistik

Statistik II: Grundlagen und Definitionen der Statistik Medien Institut : Grundlagen und Definitionen der Statistik Dr. Andreas Vlašić Medien Institut (0621) 52 67 44 vlasic@medien-institut.de Gliederung 1. Hintergrund: Entstehung der Statistik 2. Grundlagen

Mehr

Messtherorie Definitionen

Messtherorie Definitionen Messtherorie Definitionen Begriff Definition Beispiel Relationen Empirisches Relativ eine Menge von Objekten und ein oder mehreren beobachtbaren Relationen zwischen dieses Objekten Menge der Objekte =

Mehr

Methodenlehre. Vorlesung 10. Prof. Dr. Björn Rasch, Cognitive Biopsychology and Methods University of Fribourg

Methodenlehre. Vorlesung 10. Prof. Dr. Björn Rasch, Cognitive Biopsychology and Methods University of Fribourg Methodenlehre Vorlesung 10 Prof. Dr., Cognitive Biopsychology and Methods University of Fribourg 1 Methodenlehre I Woche Datum Thema 1 FQ Einführung, Verteilung der Termine 1 25.9.13 Psychologie als Wissenschaft

Mehr

3.2 Grundlagen der Testtheorie Methoden der Reliabilitätsbestimmung

3.2 Grundlagen der Testtheorie Methoden der Reliabilitätsbestimmung 3.2 Grundlagen der Testtheorie 3.2.6 Methoden der Reliabilitätsbestimmung 6.1 Was ist Reliabilität? 6.2 Retest-Reliabilität 6.3 Paralleltest-Reliabilität 6.4 Splithalf-(Testhalbierungs-)Reliabilität 6.5

Mehr

Inhaltsverzeichnis. Vorwort zur 3. Auflage 11

Inhaltsverzeichnis. Vorwort zur 3. Auflage 11 Vorwort zur 3. Auflage 11 Kapitel 1 Einführung 13 1.1 Ziel des Buches 14 1.2 Testanwendungsbereiche 18 1.3 Arten von Tests 20 1.3.1 Raven Progressive Matrices 23 1.3.2 NEO-FFI und NEO-PI-R 24 1.3.3 Thematischer

Mehr

Was ist ein Test? Grundlagen psychologisch- diagnostischer Verfahren. Rorschach-Test

Was ist ein Test? Grundlagen psychologisch- diagnostischer Verfahren. Rorschach-Test Was ist ein Test? Ein Test ist ein wissenschaftliches Routineverfahren zur Untersuchung eines oder mehrerer empirisch abgrenzbarer Persönlichkeitsmerkmale mit dem Ziel einer möglichst quantitativen Aussage

Mehr

TESTTHEORIE UND TESTKONSTRUKTION - PRAKTISCHE ANWENDUNG - TEIL 1

TESTTHEORIE UND TESTKONSTRUKTION - PRAKTISCHE ANWENDUNG - TEIL 1 TESTTHEORIE UND TESTKONSTRUKTION - PRAKTISCHE ANWENDUNG - TEIL 1 Prof. Dr. Franke SS2012 Hochschule Magdeburg-Stendal (FH) M.Sc. Rehabilitationspsychologie Gliederung Einführung in Datensatz Stichprobenbeschreibung

Mehr

Ja-Prozente bei 6-stufigen Antwortskalen

Ja-Prozente bei 6-stufigen Antwortskalen Ja-Prozente bei 6-stufigen Antwortskalen Andreas Kögel Zusammenfassung Im Gegensatz zu den gängigeren 5er-Skalen sind bei Antwortskalen mit 6 Antwortabstufungen zwei Varianten der Ermittlung von Ja-Prozenten

Mehr

'+4 Elisabeth Raab-Steiner / Michael Benesch. Der Fragebogen. Von der Forschungsidee zur SPSS-Auswertung. 4., aktualisierte und überarbeitete Auflage

'+4 Elisabeth Raab-Steiner / Michael Benesch. Der Fragebogen. Von der Forschungsidee zur SPSS-Auswertung. 4., aktualisierte und überarbeitete Auflage '+4 Elisabeth Raab-Steiner / Michael Benesch Der Fragebogen Von der Forschungsidee zur SPSS-Auswertung 4., aktualisierte und überarbeitete Auflage facultas «4 Inhaltsverzeichnis 1 Elementare Definitionen

Mehr

Was heißt messen? Konzeptspezifikation Operationalisierung Qualität der Messung

Was heißt messen? Konzeptspezifikation Operationalisierung Qualität der Messung Was heißt messen? Ganz allgemein: Eine Eigenschaft eines Objektes wird ermittelt, z.b. die Wahlabsicht eines Bürgers, das Bruttosozialprodukt eines Landes, die Häufigkeit von Konflikten im internationalen

Mehr

Deskription, Statistische Testverfahren und Regression. Seminar: Planung und Auswertung klinischer und experimenteller Studien

Deskription, Statistische Testverfahren und Regression. Seminar: Planung und Auswertung klinischer und experimenteller Studien Deskription, Statistische Testverfahren und Regression Seminar: Planung und Auswertung klinischer und experimenteller Studien Deskriptive Statistik Deskriptive Statistik: beschreibende Statistik, empirische

Mehr

Hausaufgaben. Antwort und 4 guten Distraktoren zum gelesenen Text!

Hausaufgaben. Antwort und 4 guten Distraktoren zum gelesenen Text! Hausaufgaben Welche wesentlichen Vorteile haben formelle Schulleistungstests? Welche Nachteile haben Schulleistungstests? Überlegen Sie sich 2 gute Multiplechoice-Fragen mit je einer richtigen Antwort

Mehr

Wahrscheinlichkeitsverteilungen

Wahrscheinlichkeitsverteilungen Universität Bielefeld 3. Mai 2005 Wahrscheinlichkeitsrechnung Wahrscheinlichkeitsrechnung Das Ziehen einer Stichprobe ist die Realisierung eines Zufallsexperimentes. Die Wahrscheinlichkeitsrechnung betrachtet

Mehr

4.2 Grundlagen der Testtheorie

4.2 Grundlagen der Testtheorie 4.2 Grundlagen der Testtheorie Januar 2009 HS MD-SDL(FH) Prof. Dr. GH Franke Kapitel 5 Vertiefung: Reliabilität Kapitel 5 Vertiefung: Reliabilität 5.1 Definition Die Reliabilität eines Tests beschreibt

Mehr

Statistische Grundlagen I

Statistische Grundlagen I Statistische Grundlagen I Arten der Statistik Zusammenfassung und Darstellung von Daten Beschäftigt sich mit der Untersuchung u. Beschreibung von Gesamtheiten oder Teilmengen von Gesamtheiten durch z.b.

Mehr

Methodenlehre. Vorlesung 13. Prof. Dr. Björn Rasch, Cognitive Biopsychology and Methods University of Fribourg

Methodenlehre. Vorlesung 13. Prof. Dr. Björn Rasch, Cognitive Biopsychology and Methods University of Fribourg Methodenlehre Vorlesung 13 Prof. Dr., Cognitive Biopsychology and Methods University of Fribourg 1 19.05.15 Methodenlehre II Woche Datum Thema 1 FQ Einführung, Verteilung der Termine 1 18.2.15 Psychologie

Mehr

Vortrag Evaluation und Fragebogenkonstruktion

Vortrag Evaluation und Fragebogenkonstruktion Vortrag Evaluation und Fragebogenkonstruktion Dipl. Soz. David Schneider, Hochschulreferat Studium und Lehre 25.04.2012 Was erwarten unsere Benutzerinnen und Benutzer von uns? Umfragen in Bibliotheken

Mehr

Vorlesung Testtheorien. Dr. Tobias Constantin Haupt, MBA Sommersemester 2007

Vorlesung Testtheorien. Dr. Tobias Constantin Haupt, MBA Sommersemester 2007 Vorlesung Testtheorien Dr. Tobias Constantin Haupt, MBA Sommersemester 2007 Wie läßt sich die Reliabilität erhöhen? Testlänge erhöhen (Kann zu Durchführungseinschränkungen führen; Testökonomie und Zumutbarkeit

Mehr

Methodenlehre. Vorlesung 11. Prof. Dr. Björn Rasch, Cognitive Biopsychology and Methods University of Fribourg

Methodenlehre. Vorlesung 11. Prof. Dr. Björn Rasch, Cognitive Biopsychology and Methods University of Fribourg Methodenlehre Vorlesung 11 Prof. Dr., Cognitive Biopsychology and Methods University of Fribourg 1 03.12.13 Methodenlehre I Woche Datum Thema 1 FQ Einführung, Verteilung der Termine 1 25.9.13 Psychologie

Mehr

Concept-Map. Pospeschill / Spinath: Psychologische Diagnostik 2009 by Ernst Reinhardt Verlag, GmbH und Co KG, Verlag, München

Concept-Map. Pospeschill / Spinath: Psychologische Diagnostik 2009 by Ernst Reinhardt Verlag, GmbH und Co KG, Verlag, München Abb. 1.1: Concept-Map zu den Kennzeichen von Diagnostik Abb. 1.2: Concept-Map zu den Arten und Strategien von Diagnostik Abb. 2.3: Concept-Map zur Item-Response-Theorie Abb. 2.4: Concept-Map zur Konstruktionsweise

Mehr

Statistik für Psychologen

Statistik für Psychologen Peter Zöfel Statistik für Psychologen Im Klartext Higher Education München Harlow Amsterdam Madrid Boston San Francisco Don Mills Mexico City Sydney a part of Pearson plc worldwide Statistik für Psychologen

Mehr

GLIEDERUNG Das Messen eine Umschreibung Skalenniveaus von Variablen Drei Gütekriterien von Messungen Konstruierte Skalen in den Sozialwissenschaften

GLIEDERUNG Das Messen eine Umschreibung Skalenniveaus von Variablen Drei Gütekriterien von Messungen Konstruierte Skalen in den Sozialwissenschaften TEIL 3: MESSEN UND SKALIEREN GLIEDERUNG Das Messen eine Umschreibung Skalenniveaus von Variablen Drei Gütekriterien von Messungen Objektivität Reliabilität Validität Konstruierte Skalen in den Sozialwissenschaften

Mehr

Beispielberechnung Vertrauensintervalle

Beispielberechnung Vertrauensintervalle Beispielberechnung Vertrauensintervalle Auszug Kursunterlagen MAS Berufs-, Studien- und Laufbahnberatung Juni 2015 Prof. Dr. Marc Schreiber Beispielberechnung Vertrauensintervalle Vorbereitung - Statistische

Mehr

Ermitteln Sie auf 2 Dezimalstellen genau die folgenden Kenngrößen der bivariaten Verteilung der Merkmale Weite und Zeit:

Ermitteln Sie auf 2 Dezimalstellen genau die folgenden Kenngrößen der bivariaten Verteilung der Merkmale Weite und Zeit: 1. Welche der folgenden Kenngrößen, Statistiken bzw. Grafiken sind zur Beschreibung der Werteverteilung des Merkmals Konfessionszugehörigkeit sinnvoll einsetzbar? A. Der Modalwert. B. Der Median. C. Das

Mehr

Übung Methodenlehre I, SeKo

Übung Methodenlehre I, SeKo Datenerhebung: Übung Methodenlehre I, SeKo Vivien Röder Professur für Forschungsmethodik & Evaluation Heute Wiederholung Messen & Testen Gütekriterien Befragung Beobachtung www.tu-chemnitz.de 2 Wiederholung

Mehr

SPSS-Beispiel zum Kapitel 4: Deskriptivstatistische Evaluation von Items (Itemanalyse) und Testwertverteilungen

SPSS-Beispiel zum Kapitel 4: Deskriptivstatistische Evaluation von Items (Itemanalyse) und Testwertverteilungen SPSS-Beispiel zum Kapitel 4: Deskriptivstatistische Evaluation von Items (Itemanalyse) und Testwertverteilungen Augustin Kelava 22. Februar 2010 Inhaltsverzeichnis 1 Einleitung zum inhaltlichen Beispiel:

Mehr

Mittelwert und Standardabweichung

Mittelwert und Standardabweichung Professur E-Learning und Neue Medien Institut für Medienforschung Philosophische Fakultät Einführung in die Statistik Mittelwert und Standardabweichung Überblick Mittelwert Standardabweichung Weitere Maße

Mehr

Was ist eine Testtheorie? Grundlagen der Item-Response. Response-Theorie. Modelle mit latenten Variablen

Was ist eine Testtheorie? Grundlagen der Item-Response. Response-Theorie. Modelle mit latenten Variablen Was ist eine Testtheorie? Eine Testtheorie beschäftigt sich also mit dem Zusammenhang zwischen Testverhalten und dem zu erfassenden Merkmal. Testauswertung Persönlichkeitsmerkmal (z.b. Emotionalität, Fähigkeit)

Mehr

Erstellung und Auswertung eines Fragebogens. Gruppe Formalwissenschaften

Erstellung und Auswertung eines Fragebogens. Gruppe Formalwissenschaften Erstellung und Auswertung eines Fragebogens Gruppe Formalwissenschaften Version 1.1 / 28.03.2014 Ablauf Theorie Fragebogen erstellen Julia Pöll (Mathematik) Martin Tintel (Informatik) Theorie Fragebogen

Mehr

Vorlesung Testtheorien. Dr. Tobias Constantin Haupt, MBA Sommersemester 2007

Vorlesung Testtheorien. Dr. Tobias Constantin Haupt, MBA Sommersemester 2007 Vorlesung Testtheorien Dr. Tobias Constantin Haupt, MBA Sommersemester 2007 Konstruktvalidität: MTMM # 2 Konstruktvalidität: MTMM # 3 Konstruktvalidität: Probleme der MTMM Die Analysekriterien der MTMM

Mehr

Tutorium Testtheorie. Termin 3. Inhalt: WH: Hauptgütekriterien- Reliabilität & Validität. Charlotte Gagern

Tutorium Testtheorie. Termin 3. Inhalt: WH: Hauptgütekriterien- Reliabilität & Validität. Charlotte Gagern Tutorium Testtheorie Termin 3 Charlotte Gagern charlotte.gagern@gmx.de Inhalt: WH: Hauptgütekriterien- Reliabilität & Validität 1 Hauptgütekriterien Objektivität Reliabilität Validität 2 Hauptgütekriterien-Reliabilität

Mehr

Statistische Tests (Signifikanztests)

Statistische Tests (Signifikanztests) Statistische Tests (Signifikanztests) [testing statistical hypothesis] Prüfen und Bewerten von Hypothesen (Annahmen, Vermutungen) über die Verteilungen von Merkmalen in einer Grundgesamtheit (Population)

Mehr

Forschungsstatistik I

Forschungsstatistik I Psychologie Prof. Dr. G. Meinhardt 6. Stock, TB II R. 06-206 (Persike) R. 06-321 (Meinhardt) Sprechstunde jederzeit nach Vereinbarung Forschungsstatistik I Dr. Malte Persike persike@uni-mainz.de http://psymet03.sowi.uni-mainz.de/

Mehr

Grundlagen sportwissenschaftlicher Forschung Untersuchungsplanung 2 und Grundlagen des Messens

Grundlagen sportwissenschaftlicher Forschung Untersuchungsplanung 2 und Grundlagen des Messens Grundlagen sportwissenschaftlicher Forschung Untersuchungsplanung 2 und Grundlagen des Messens Dr. Jan-Peter Brückner jpbrueckner@email.uni-kiel.de R.216 Tel. 880 4717 AUFGABE 1. Beschreibe einen experimentellen

Mehr

Objektivität und Validität. Testgütekriterien. Objektivität. Validität. Reliabilität. Objektivität

Objektivität und Validität. Testgütekriterien. Objektivität. Validität. Reliabilität. Objektivität Objektivität und Objektivität: Inwieweit ist das Testergebnis unabhängig von externen Einflüssen Effekte des Versuchsleiters, Auswertung, Situation, Itemauswahl : Inwieweit misst der Test das, was er messen

Mehr

Statistische Methoden in den Umweltwissenschaften

Statistische Methoden in den Umweltwissenschaften Statistische Methoden in den Umweltwissenschaften Post Hoc Tests A priori Tests (Kontraste) Nicht-parametrischer Vergleich von Mittelwerten 50 Ergebnis der ANOVA Sprossdichte der Seegräser 40 30 20 10

Mehr

Forschungsstatistik I

Forschungsstatistik I Prof. Dr. G. Meinhardt 6. Stock, Taubertsberg 2 R. 06-206 (Persike) R. 06-214 (Meinhardt) Sprechstunde jederzeit nach Vereinbarung Forschungsstatistik I Dr. Malte Persike persike@uni-mainz.de http://psymet03.sowi.uni-mainz.de/

Mehr

Auswertung und Lösung

Auswertung und Lösung Dieses Quiz soll Ihnen helfen, Kapitel 4.6 und 4.7 besser zu verstehen. Auswertung und Lösung Abgaben: 59 / 265 Maximal erreichte Punktzahl: 8 Minimal erreichte Punktzahl: 0 Durchschnitt: 4.78 1 Frage

Mehr

Eine Skala ist also Messinstrument, im einfachsten Fall besteht diese aus einem Item

Eine Skala ist also Messinstrument, im einfachsten Fall besteht diese aus einem Item KONSTRUKTION UND ANALYSE VON SKALEN Ziel Skalen und Tests Systematisierung von Tests Itemarten Skalenarten im Detail Die Likert Skala Skala: Eine Skala ist ein Instrument zur Messung von (theoretischen)

Mehr

Testen von Unterschiedshypothesen mit parametrischen Verfahren Der t-test

Testen von Unterschiedshypothesen mit parametrischen Verfahren Der t-test Schäfer A & Schöttker-Königer T, Statistik und quantitative Methoden für (2015) Arbeitsblatt 1 SPSS Kapitel 5 Seite 1 Testen von Unterschiedshypothesen mit parametrischen Verfahren Der t-test Im Folgenden

Mehr

1. Maße der zentralen Tendenz Beispiel: Variable Anzahl der Geschwister aus Jugend '92. Valid Cum Value Frequency Percent Percent Percent

1. Maße der zentralen Tendenz Beispiel: Variable Anzahl der Geschwister aus Jugend '92. Valid Cum Value Frequency Percent Percent Percent Deskriptive Statistik 1. Verteilungsformen symmetrisch/asymmetrisch unimodal(eingipflig) / bimodal (zweigipflig schmalgipflig / breitgipflig linkssteil / rechtssteil U-förmig / abfallend Statistische Kennwerte

Mehr

4.1. Nullhypothese, Gegenhypothese und Entscheidung

4.1. Nullhypothese, Gegenhypothese und Entscheidung rof. Dr. Roland Füss Statistik II SS 8 4. Testtheorie 4.. Nullhypothese, Gegenhypothese und Entscheidung ypothesen Annahmen über die Verteilung oder über einzelne arameter der Verteilung eines Merkmals

Mehr

Inhaltsverzeichnis. Über die Autoren Einleitung... 21

Inhaltsverzeichnis. Über die Autoren Einleitung... 21 Inhaltsverzeichnis Über die Autoren.... 7 Einleitung... 21 Über dieses Buch... 21 Was Sie nicht lesen müssen... 22 Törichte Annahmen über den Leser... 22 Wie dieses Buch aufgebaut ist... 23 Symbole, die

Mehr

Chi-Quadrat Verfahren

Chi-Quadrat Verfahren Chi-Quadrat Verfahren Chi-Quadrat Verfahren werden bei nominalskalierten Daten verwendet. Die einzige Information, die wir bei Nominalskalenniveau zur Verfügung haben, sind Häufigkeiten. Die Quintessenz

Mehr

Standardisierte Vorgehensweisen und Regeln zur Gewährleistung von: Eindeutigkeit Schlussfolgerungen aus empirischen Befunden sind nur dann zwingend

Standardisierte Vorgehensweisen und Regeln zur Gewährleistung von: Eindeutigkeit Schlussfolgerungen aus empirischen Befunden sind nur dann zwingend Standardisierte Vorgehensweisen und Regeln zur Gewährleistung von: Eindeutigkeit Schlussfolgerungen aus empirischen Befunden sind nur dann zwingend oder eindeutig, wenn keine alternativen Interpretationsmöglichkeiten

Mehr

Mathematische und statistische Methoden II

Mathematische und statistische Methoden II Methodenlehre e e Prof. Dr. G. Meinhardt 6. Stock, Wallstr. 3 (Raum 06-06) Sprechstunde jederzeit nach Vereinbarung und nach der Vorlesung. Mathematische und statistische Methoden II Dr. Malte Persike

Mehr

Bivariater Zusammenhang in der Vierfeldertafel PEΣO

Bivariater Zusammenhang in der Vierfeldertafel PEΣO Bivariater Zusammenhang in der Vierfeldertafel PEΣO 12. Oktober 2001 Zusammenhang zweier Variablen und bivariate Häufigkeitsverteilung Die Bivariate Häufigkeitsverteilung gibt Auskunft darüber, wie zwei

Mehr

Gliederung. Ursachen von Ergebnisverfälschung. Antworttendenzen/Urteilsfehler. Empirische Forschungsmethoden

Gliederung. Ursachen von Ergebnisverfälschung. Antworttendenzen/Urteilsfehler. Empirische Forschungsmethoden SoSe 2017 6. Sitzung 23. Mai 2017 Gliederung Datenerhebung quantitative Forschung (Planungs- und Erhebungsphase): Urteilsverfälschung/Messfehler Maße der zentralen Tendenz 1 2 6) Quantitative empirische

Mehr

Prof. Dr. Gabriele Helga Franke TESTTHEORIE UND TESTKONSTRUKTION

Prof. Dr. Gabriele Helga Franke TESTTHEORIE UND TESTKONSTRUKTION Prof. Dr. Gabriele Helga Franke TESTTHEORIE UND TESTKONSTRUKTION 1. FS Master Rehabilitationspsychologie, SoSe 2012 Normierung 2 Begriffsbestimmung Zweck der Normierung Vorgehen bei der Normierung Exkurs:

Mehr

Statistische Messdatenauswertung

Statistische Messdatenauswertung Roland Looser Statistische Messdatenauswertung Praktische Einführung in die Auswertung von Messdaten mit Excel und spezifischer Statistik-Software für naturwissenschaftlich und technisch orientierte Anwender

Mehr

Inhaltsverzeichnis. Teil 1 Basiswissen und Werkzeuge, um Statistik anzuwenden

Inhaltsverzeichnis. Teil 1 Basiswissen und Werkzeuge, um Statistik anzuwenden Inhaltsverzeichnis Teil 1 Basiswissen und Werkzeuge, um Statistik anzuwenden 1 Statistik ist Spaß 3 Warum Statistik? 3 Checkpoints 4 Daten 4 Checkpoints 7 Skalen - lebenslang wichtig bei der Datenanalyse

Mehr

Dozent: Dawid Bekalarczyk Universität Duisburg-Essen Fachbereich Gesellschaftswissenschaften Institut für Soziologie Lehrstuhl für empirische

Dozent: Dawid Bekalarczyk Universität Duisburg-Essen Fachbereich Gesellschaftswissenschaften Institut für Soziologie Lehrstuhl für empirische TEIL 3: MESSEN UND SKALIEREN 1 Das Messen eine Umschreibung Feststellung der Merkmalsausprägungen von Untersuchungseinheiten (z.b. Feststellung, wie viel eine Person wiegt oder Feststellung, wie aggressiv

Mehr

Untersuchungsarten im quantitativen Paradigma

Untersuchungsarten im quantitativen Paradigma Untersuchungsarten im quantitativen Paradigma Erkundungsstudien / Explorationsstudien, z.b.: Erfassung der Geschlechterrollenvorstellungen von Jugendlichen Populationsbeschreibende Untersuchungen, z.b.:

Mehr

Statistik Testverfahren. Heinz Holling Günther Gediga. Bachelorstudium Psychologie. hogrefe.de

Statistik Testverfahren. Heinz Holling Günther Gediga. Bachelorstudium Psychologie. hogrefe.de rbu leh ch s plu psych Heinz Holling Günther Gediga hogrefe.de Bachelorstudium Psychologie Statistik Testverfahren 18 Kapitel 2 i.i.d.-annahme dem unabhängig. Es gilt also die i.i.d.-annahme (i.i.d = independent

Mehr

Methodenlehre. Vorlesung 12. Prof. Dr. Björn Rasch, Cognitive Biopsychology and Methods University of Fribourg

Methodenlehre. Vorlesung 12. Prof. Dr. Björn Rasch, Cognitive Biopsychology and Methods University of Fribourg Methodenlehre Vorlesung 12 Prof. Dr., Cognitive Biopsychology and Methods University of Fribourg 1 Methodenlehre I Woche Datum Thema 1 FQ Einführung, Verteilung der Termine 1 25.9.13 Psychologie als Wissenschaft

Mehr

Klassische Testtheorie (KTT) Klassische Testtheorie (KTT) Klassische Testtheorie (KTT)

Klassische Testtheorie (KTT) Klassische Testtheorie (KTT) Klassische Testtheorie (KTT) Klassische Testtheorie (KTT) Die KTT stellt eine Sammlung von Methoden dar, die seit Beginn des vorigen Jahrhunderts zur exakten und ökonomischen Erfassung interindividueller Unterschiede entwickelt wurden.

Mehr

Forschungsmethoden VORLESUNG WS 2017/2018

Forschungsmethoden VORLESUNG WS 2017/2018 Forschungsmethoden VORLESUNG WS 2017/2018 SOPHIE LUKES Überblick Letzte Woche: - Stichprobenziehung und Stichprobeneffekte Heute: -Gütekriterien I Rückblick Population und Stichprobe verschiedene Arten

Mehr

Stichwortverzeichnis. Symbole

Stichwortverzeichnis. Symbole Stichwortverzeichnis Symbole 50ste Perzentil 119 A Absichern, Ergebnisse 203 Abzählbar unendliche Zufallsvariable 146 Alternativhypothese 237 238 formulieren 248 Anekdote 340 Annäherung 171, 191 Antwortquote

Mehr

Hypothesentests mit SPSS

Hypothesentests mit SPSS Beispiel für eine einfache Regressionsanalyse (mit Überprüfung der Voraussetzungen) Daten: bedrohfb_v07.sav Hypothese: Die Skalenwerte auf der ATB-Skala (Skala zur Erfassung der Angst vor terroristischen

Mehr

Beispielberechnung Vertrauensintervall

Beispielberechnung Vertrauensintervall Beispielberechnung Vertrauensintervall Auszug Kursunterlagen MAS ZFH in Berufs-, Studien- und Laufbahnberatung Prof. Dr. Marc Schreiber, Dezember 2016 Beispielberechnung Vertrauensintervall Statistische

Mehr

Lage- und Streuungsparameter

Lage- und Streuungsparameter Lage- und Streuungsparameter Beziehen sich auf die Verteilung der Ausprägungen von intervall- und ratio-skalierten Variablen Versuchen, diese Verteilung durch Zahlen zu beschreiben, statt sie graphisch

Mehr

7. Lösungen weitere Übungsaufgaben Statistik für Ingenieure WiSe 16/17

7. Lösungen weitere Übungsaufgaben Statistik für Ingenieure WiSe 16/17 7. Lösungen weitere Übungsaufgaben Statistik für Ingenieure WiSe 16/17 1. Aufgabe: a) Grundgesamtheit sind alle Reifen aus der Produktion von Langstone aus dem Monat März der entsprechenden Reifentypen.

Mehr

Übungen mit dem Applet Zentraler Grenzwertsatz

Übungen mit dem Applet Zentraler Grenzwertsatz Zentraler Grenzwertsatz 1 Übungen mit dem Applet Zentraler Grenzwertsatz 1 Statistischer Hintergrund... 1.1 Zentraler Grenzwertsatz... 1. Beispiel Würfeln... 1.3 Wahrscheinlichkeit und relative Häufigkeit...3

Mehr

Einführung in die Test- und Fragebogenkonstruktion

Einführung in die Test- und Fragebogenkonstruktion Markus Bühner Einführung in die Test- und Fragebogenkonstruktion 3., aktualisierte und erweiterte Auflage ein Imprint von Pearson Education München Boston San Francisco Harlow, England Don Mills, Ontario

Mehr

Methodenlehre. Vorlesung 4. Prof. Dr. Björn Rasch, Cognitive Biopsychology and Methods University of Fribourg

Methodenlehre. Vorlesung 4. Prof. Dr. Björn Rasch, Cognitive Biopsychology and Methods University of Fribourg Methodenlehre Vorlesung 4 Prof. Dr., Cognitive Biopsychology and Methods University of Fribourg 1 Methodenlehre II Woche Datum Thema 1 FQ Einführung, Verteilung der Termine 1 18.2.15 Psychologie als Wissenschaft

Mehr

Informationen zur KLAUSUR am

Informationen zur KLAUSUR am Wiederholung und Fragen 1 Informationen zur KLAUSUR am 24.07.2009 Raum: 032, Zeit : 8:00 9:30 Uhr Bitte Lichtbildausweis mitbringen! (wird vor der Klausur kontrolliert) Erlaubte Hilfsmittel: Alle Unterlagen,

Mehr

Allgemeines zu Tests. Statistische Hypothesentests

Allgemeines zu Tests. Statistische Hypothesentests Statistische Hypothesentests Allgemeines zu Tests Allgemeines Tests in normalverteilten Grundgesamtheiten Asymptotische Tests Statistischer Test: Verfahren Entscheidungsregel), mit dem auf Basis einer

Mehr

ÜBUNGSAUFGABEN ZUR DESKRIPTIVEN UND EXPLORATIVEN DATENANALYSE

ÜBUNGSAUFGABEN ZUR DESKRIPTIVEN UND EXPLORATIVEN DATENANALYSE ÜBUNGSAUFGABEN ZUR DESKRIPTIVEN UND EXPLORATIVEN DATENANALYSE 1.1 Füllen Sie bitte folgenden Lückentext aus. Daten, die in Untersuchungen erhoben werden, muss man grundsätzlich nach ihrem unterscheiden.

Mehr

Inhaltsverzeichnis. Vorwort

Inhaltsverzeichnis. Vorwort V Vorwort XI 1 Zum Gebrauch dieses Buches 1 1.1 Einführung 1 1.2 Der Text in den Kapiteln 1 1.3 Was Sie bei auftretenden Problemen tun sollten 2 1.4 Wichtig zu wissen 3 1.5 Zahlenbeispiele im Text 3 1.6

Mehr

5.5 PRE-Maße (Fehlerreduktionsmaße) 6

5.5 PRE-Maße (Fehlerreduktionsmaße) 6 359 5.5 PRE-Maße (Fehlerreduktionsmaße) 6 5.5.1 Die grundlegende Konstruktion Völlig andere, sehr allgemeine Grundidee zur Beschreibung von Zusammenhängen. Grundlegendes Prinzip vieler statistischer Konzepte.

Mehr

Einführung Fehlerrechnung

Einführung Fehlerrechnung Einführung Fehlerrechnung Bei jeder Messung, ob Einzelmessung oder Messreihe, muss eine Aussage über die Güte ( Wie groß ist der Fehler? ) des Messergebnisses gemacht werden. Mögliche Fehlerarten 1. Systematische

Mehr

Auswahlverfahren. Verfahren, welche die prinzipiellen Regeln zur Konstruktion von Stichproben angeben

Auswahlverfahren. Verfahren, welche die prinzipiellen Regeln zur Konstruktion von Stichproben angeben Auswahlverfahren Verfahren, welche die prinzipiellen Regeln zur Konstruktion von Stichproben angeben Definition der Grundgesamtheit Untersuchungseinheit: Objekt an dem Messungen vorgenommen werden Grundgesamtheit

Mehr

Exakter Binomialtest als Beispiel

Exakter Binomialtest als Beispiel Prinzipien des statistischen Testens Entscheidungsfindung Exakter Binomialtest als Beispiel Statistische Tests Nullhypothese Alternativhypothese Fehlentscheidungen Ausgangspunkt: Forschungshypothese Beispiele:.

Mehr

5. Lektion: Einfache Signifikanztests

5. Lektion: Einfache Signifikanztests Seite 1 von 7 5. Lektion: Einfache Signifikanztests Ziel dieser Lektion: Du ordnest Deinen Fragestellungen und Hypothesen die passenden einfachen Signifikanztests zu. Inhalt: 5.1 Zwei kategoriale Variablen

Mehr

Eigene MC-Fragen Testgütekriterien (X aus 5) 2. Das Ausmaß der Auswertungsobjektivität lässt sich in welcher statistischen Kennzahl angeben?

Eigene MC-Fragen Testgütekriterien (X aus 5) 2. Das Ausmaß der Auswertungsobjektivität lässt sich in welcher statistischen Kennzahl angeben? Eigene MC-Fragen Testgütekriterien (X aus 5) 1. Wenn verschieden Testanwender bei Testpersonen mit demselben Testwert zu denselben Schlussfolgerungen kommen, entspricht dies dem Gütekriterium a) Durchführungsobjektivität

Mehr

Forschungsmethoden VORLESUNG SS 2017

Forschungsmethoden VORLESUNG SS 2017 Forschungsmethoden VORLESUNG SS 2017 SOPHIE LUKES Überblick Letzte Woche: - Stichprobenziehung und Stichprobeneffekte Heute: -Gütekriterien I Rückblick Population und Stichprobe verschiedene Arten der

Mehr