3. KTT und PTT KTT allgemein Axiome & Annahmen der KTT Kritik an der KTT

Größe: px
Ab Seite anzeigen:

Download "3. KTT und PTT KTT allgemein Axiome & Annahmen der KTT Kritik an der KTT"

Transkript

1 - gegenwärtig die Grundlage der meisten psychologischen Testverfahren - nach Rost basieren 95% aller Tests auf der KTT - klassisch heißt die KTT, weil sie die erste Theorie war, die zur Konstruktion von psychologischen Tests herangezogen wurde (Gulliksen, 1950) - einige Schwächen, die von PTT (allerdings auf Kosten erheblich größerer mathematischer Komplexität) überwunden werden - einfache Anwendbarkeit - Tests haben sich bewährt - Die KTT machte keine Annahmen darüber, wie Items beantwortet werden oder wie eine Testleistung zustande kommt - Die KTT macht nur Annahmen darüber, aus welchen Komponenten Messwerte bestehen (X = T + E) - trotz gravierender Mängel bzw. Kritikpunkte hat sich die KTT in der Praxis bewährt - Die Brauchbarkeit eines Tests hängt v.a. von der inhaltlich begründeten Konstruktion der Items und Test ab - die KTT untersucht Rohwertvarianzen und Kovarianzen - Systematische Fehler werden indirekt der wahren Varianz zugeschlagen 3. KTT und PTT KTT allgemein Axiome & Annahmen der KTT Kritik an der KTT 1. Die KTT ist eine Theorie der Messfehler bzw. der Reliabilität - die KTT umgeht das Problem des - Die KTT trägt dem Umstand Rechnung, dass Testergebnisse einzelner Intervallskalenniveaus durch per-fiat - Personen mit dem gleichen Test zwischen verschiedenen Messzeitpunkten Messung: durch Aufsummierung der variieren Anzahl richtiger Lösungen oder - berücksichtigt werden nur unsystematische Fehler (unsystematische Itemantworten nähert man sich innere/äußere Einflüsse, z.b. Lärm, stickige Luft, Müdigkeit, mangelnde generell Differenzen an und somit ist X Konzentration) = T+E wieder zulässig - nicht berücksichtigt werden systematische Fehler (Übungs- und Transfereffekte) - systematische Fehler (Bias) werden dem wahren Wert zugerechnet, was zu einer Erhöhung der Reliabilität führt 2. Die KTT unterstellt Zufallsziehung und Zufallsfehler - Annahme bezieht sich auf intraindividuelle und interindividuelle Varianz - Annahme, dass das Testergebnis derselben Person bei mehreren Testungen rein zufallsabhängig variiert. - Bei beliebiger Anzahl an Testwiederholungen bei einer Person i mit dem gleichen Test und unter den gleichen Bedingungen, nähern sich die Testergebnisse Xi einer Normalverteilung an, deren Mittelwert Ti (wahrer Wert) ist Existenzaxiom 3. Das zentrale Grundaxiom der KTT besagt, dass sich jeder beobachtete Wert additiv aus einem wahren Wert Ti und einer Fehlerkomponente zusammensetzt (X = T +E) 4. Messfehler verteilen sich um den Wert Null, d.h. der wahre Wert wird in einer einzelnen Messung also gleicher Wahrscheinlichkeit über- oder unterschätzt und mittelt sich über viele Messungen tendenziell aus. a) Sowohl bei einer Person i bei unendlich vielen Messungen M(E)i = 0 b) Mittelwert der Fehler in einer Population/Teilpopulation M(E)P = 0 5. Wahrer Wert und Fehler sind unkorreliert, d.h. es besteht kein Zusammenhang zwischen dem Messfehler und dem wahren Wert gilt sowohl für eine Person als auch für Population bzw. Teilpopulation: r(e,t) = 0 6. Fehler verschiedener Tests sind unkorreliert, d.h. der Messfehler eines Tests A weist keinen Zusammenhang r mit dem Messfehler eines anderen Tests B auf. (gilt nur bei experimenteller, nicht bei emprischer, Abhängigkeit!) 7. Kreuzweise Unkorreliertheit von Messfehlern und wahren Werten verschiedener Tests, d.h. die Messfehler eines Tests A weisen keinen Zusammenhang mit dem wahren Wert eines Tests B auf: r(ea,eb = 0) 1 - Die KTT fasst Reliabilität als Anteil wahrer Varianz an der gesamten Testvarianz auf, wobei die Varianz der wahren Werte nicht beobachtbar ist und geschätzt werden muss. - Die Reliabilität ist die wesentliche Information zur Bestimmung von Standardmess- und Standschätzfehler (Beurteilung, wie gut man sich auf das Testergebnis einer Testperson verlassen kann). - Anhand der Formel für die Reliabilität kann der Unterschied zur Validität vorgenommen werden: Der Bias (systematische Fehler; nicht intendierte systematische Varianzanteile) hat im Grunde nichts mit dem Zielkonstrukt zu tun, wird in den Axiomen der KTT dem wahren Wert bzw. der wahren Varianz zugeschlagen und trägt so zur Erhöhung der Reliabilität bei. - Bei der Validität hingegen geht es ausschließlich um die Messung des Zielkonstrukts bzw. um die Gültigkeit inhaltlicher Aussagen auf der Grundlage von Testergebnissen. - Bei der Validität geht es um das Ausmaß, in dem ein Test in der jeweiligen Testsituation das misst, was er messen soll. - Die Validität ist der Anteil der Konstruktvarianz an der Gesamtvarianz 1. Axiome der KTT sind in der Praxis nicht immer haltbar - nicht intendierte systematische Varianzanteile (Bias) werden dem wahren Wert zugerechnet - die KTT stellt keine Verbindung zwischen einer Fähigkeit, einem Merkmal oder einer Eigenschaft und der Itembeantwortung her - Übungs- und Transfereffekte wirken sich u.u. systematisch auf die Testleistung auf und verändern die wahre Leistungsfähigkeit, werden aber einfach als Bias der wahren Varianz zugeordnet - die KTT macht keine Annahmen hinsichtlich des Zustandekommens der Leistungen - unter Verletzung der Annahme der Eindimensionalität werden Ti und Reliabilität eines Tests über- oder z.t. auch unterschätzt. Annahme des fehlenden Zusammenhangs zwischen T und E zu bezweifeln, ebenso die Konstanz des wahren Wertes über verschiedene Messwiederholungen (Existenzaxiom) 2. Ungenaue Messung in Extrembereichen - Fischer weist darauf hin, dass insb. bei extrem hohen/niedrigen Fähigkeitsausprägungen die Leistungen ungenauer als im mittleren Bereich gemessen werden. - Items mit extremen Schwierigkeiten aber notwendig/nützlich für die Differenzierung von Testpersonen - dieselbe Messgenauigkeit in allen Eigenschafts- bzw. Fähigkeitsbereichen ist wichtige Voraussetzung für die Einzelfalldiagnostik 3. KTT setzt Eindimensionalität voraus (Annahme des fehlenden Zusammenhangs zwischen verschiedenen Fehlerwerten r(ea,eb) = 0 ), prüft diese Annahme aber an keiner Stelle PTT prüft diese Voraussetzung Verwendung CFA 4. Stichprobenabhängigkeit der Testwerte - je nach Referenzgruppe erhält individuelle Testleistung andere Bedeutung PTT ermittelt stichprobenunabhängige Item- und Personenkennwerte KTT behilft sich mit Gütekriterien zu verschiedenen Teilstichproben

2 3. Itemanalyse: Kürzung und Revision des Entwurfs Itemanalyse nach KTT Rekodierung Deskriptive Itemanalyse Interpretation: Itemschwierigkeit Nun liegt eine erste Prüfung univariater Verteilungseigenschaften: - Mittelwerte der Items bilden bei den Rohfassung des Testentwurfs vorliegenden Ratingskalen des BFI de vor, d.h. eine geordnete Grundlage zur Berechnung von Itemschwierigkeiten Itemsammlung Pretest der ersten Rohfassung, um die Items auf Verständlichkeit, Eindeutigkeit zu testen - ebenso Erfassung möglicher Probleme mit der Akzeptanz (invasive, belastende oder inakzeptable Fragen qualitative Erhebung mit Kommentarmöglichkeit - kleine Stichprobe genügt - diese sollte allerdings zur Zielgruppe des Tests gehören Identifikation und ggf. Elimination oder Umformulierung besonders missverständlicher und inakzeptabler Items Nun kann empirische, quantitative Prüfung der Vorform des Tests in größerem Rahmen beginnen (anhand von empirischen Kennwerten für die einzelnen Items) Kennwerte werden genutzt, um Unterschiede in den Messeigenschaften einzelner Items zu identifizieren und zur Kürzung der Vorform des Tests bzw. Eliminierung weniger guter Aufgaben genutzt Beispieldatensatz: -SPSS, Stichprobe (1999) zu BFI -Insg. 44 Items, je 7-10 für O,C,E,A,N -Fünfstufige, bipolare Ratingskalen -Kurze Satzfragmente -Rational konstruiert, zur Messung eines faktorenanalytisch begründeten Persönlichkeistmodells Rekodierung, da die Items des BFI unterschiedlich gepolt (hohe Werte stehen mal für Ausprägungen, mal für niedrige Merkmalsausprägungen) so dass alle Items gleich gepolt 1.) TRANSFORMIEREN UMKODIEREN IN DIESELBEN (oder IN ANDERE) VARIABLEN 2.) Verschiebung der Items in Liste NUMERISCHE VARIABLEN 3.) Rekodierung spezifizieren über ALTE UND NEUE WERTE 4. jeweils HINZUFÜGEN 5. WEITER (nicht OK, wegen Syntax!) Wichtigste Kennwerte - zentrale Tendenz: Mittelwert, Median, Modus - Streuung: Varianz, Percentile, Streubreite - Form: Schiefe, Exzess - Grafische Hilfsmittel: Histogramme, Diagramme ANALYSIEREN DESKRIPTIVE STATISTIKEN DESKRIPTIVE STATISTIK - alle 44 Items in Liste VARIABLEN verschieben - OPTIONEN: wichtigste Kennwerte inkl. Schiefe und Kurtosis auswählen WEITER ANALYSIEREN DESKRIPTIVE STATISTIKEN DIAGRAMME - Tests auf Normalverteilung - Histogramme Itemschwierigkeit = der prozentuale Anteil der richtigen Lösungen (bzw. Zustimmungen) an allen Lösungen eines Items innerhalb einer Stichprobe - einer der wichtigsten Kennwerte in der Itemanalyse - =empirischer Lösungsmittelwert einer Stichprobe - je nach Skalenniveau unterscheidet sich Berechnung Hoher Wert = geringe Schwierigkeit niedriger Wert = hohe Schwierigkeit Itemschwierigkeitsindex ohne Korrektur Itemschwierigkeitsindex mit Zufallskorrektur Itemschwierigkeitsindex mit Inangriffnahmekorrektur z.b. bei zeitbegrenzten Leistungstests wird im Nenner die Anzahl N B der Personen, die Item bearbeitet haben B Itemleichtigkeit B Transformation bei Ratingskalen - zunächst Transformation der Ratingskala auf das theoretische Minimum mit Wert Null - Anschließend Berechnung Itemschwierigkeitsindex ohne Korrektur, aber mit Modifizierungen: N R = (transf.) Mittelwert M i des Items i N = (transf.) Maximalwert x max des Items P = M i x max Bedeutung der Itemschwierigkeit - Zahl theoretisch möglicher Unterscheidungen und somit die Informationshaltigkeit eines Items hängt von dessen Schwierigkeit ab. - bei mittlerer Schwierigkeit liegt das theoretische Maximum 50% (Da 50*50 = 2500 Unterscheidungen) Ein Item, das niemand oder alle lösen können, enthalt keinerlei empirische Informationen & ist somit wertlos! Zusammenhang zw. Itemschwierigkeit und Informationshaltigkeit ist umgekehrt u-förmig mit Maximum in der Mitte Interpretation der Itemschwierigkeit - Faustregeln mit Vorsicht genießen, da a) Die Lösungswkt eines Items annahmegemäß von der individuellen Ausprägung des gemessenen Merkmals abhängt b) Schwierigkeit nur etwas über die maximal in einem Item enthaltene Information aussagt, aber nichts über die tatsächliche Informationshaltigkeit Die Schwierigkeit beeinflusst die VArianz, die wiederum notwendige aber nicht hinreichende Bedingung für die Korrelation mit anderen Variablen ist Test mit nur extremen Schwierigkeiten ist eingeschränkt hinsichtlich Itemhomogenität, Trennschärfe, Reliabilität, Validität (Kennwerte & Gütekriterien) und hinsichtlich der Korrelation der Items untereinander, wenn viele links- & rechtsschiefe (schwierige / einfache) items kombiniert werden Aber: Stets abzuwägen gegen die Notwendigkeit einer vollständigen Abdeckung des Merkmalsbereichs 2 Die Standardabweichung sollte bei einer 5-stufigen Skala idealerweise den Wert 1 annehmen ( beste Annäherung an Normalverteilung)

3 3.1.2 Trennschärfeanalyse Defintion/Allgemeines Part-Whole-Korrektur Trennschärfen bei Ursachen für verzerrte Trennschärfen Schwierigkeitskorrektur Trennschärfe Gibt die Stärke der Übereinstimmung der mit dem jeweiligen Item erzielten Differenzierung zwischen den VPn und der Differenzierung durch den Gesamttest an in der KTT der wichtigste Indikator dafür, wie gut jedes einzelne Items das zugrunde liegende Merkmal abbildet Eigentrennschärfe: Stellt inhaltlich dar, wie gut ein Item eine Skala, die aus den restlichen Itemsgebildet wird, widerspeigelt bzw. wie prototypisch ein Item für eine Skala ist Vorausssetzung: valide Messung des Merkmals Part-Whole-Korrektur! Fremdtrennschärfe Korrelationen von Items mit Skalen/Testwerten anderer Fragebögen/Kriterien Wird insb. bei der externalen Testkonstruktion hernagezogen - keine Part-Whole-Korrektur notwendig! Part-Whole-Korrektur notwendig, weil sonst das betreffende Item mit in den Skalenwert einfließt Teil der Skalenstreuung geht auf das entsprechende Item zurück Überschätzung der Trennschärfe unkorrigierter Wert ist partielle Eigenkorrelation Artefakt der partiellen Eigenkorrelation ist umso größer a) je kürzer die Skala (anteiliges Gewicht des Items steigt) b) je heterogener die Skala (Items korrelieren im Mittel geringer untereinander bei heterogener Skala Trennschärfe und Reliabilität bedingen sich zt gegenseitig) Je homogener eine Skala, desto weniger ändert sich die Trennschärfe durch die Part- Whole-Korrektur. Ratingskalen Trennschärfe entspricht der Produkt- Moment-Korrelation nach Part-Whole- Korrektur Dichotomen Items Trennschärfe entspricht der punktibiserialen Korrelation nach Part- Whole-Korrektur (wird in SPSS automatisch berechnet) Verzerrungen der Trennschärfe sind möglich durch - Erweiterung der Varianz (Ausreißer, bimodale Verteilungen) - Einschränkung der Varianz (Schiefe, extreme Schwierigkeiten) Überprüfbarkeit - statististisch (Schwierigekitsnalayse) - visuell (Inspektion Histogramme) Folgen von Verzerrungen - Ratinskala robust gegen Ausreißer - bimodale Verteilungen erhebliche Varianzerweiterungen -Schiefe Verteilungen häufig Varianzeinschränkungen Alternatives Verfahren zur Korrektur der Ternnschärfe von Items mit extremen Schwierigkeiten von Moosbrugger & Zistler (1993): - Aufwertung der Trennschärfe dichotomer Items durch die Berechnung eines sog. Selektionskenntwertes Stellt eine Art Korrektur der Trennschärfe um VArainzeinschränkung dar) Selektion von Items, bei der solche Items mit extremen Schwierigkeiten weniger stark benachteiligt werden als bei Anwendung der unkorrigierten Trennschärfe Trennschärfe ist eine Korrelation zwischen einem Item und einer Skala und liegt immer zwischen -1 und +1. Skala Mehrere aufsummierte/gemittelte Items, die inhaltlich dieselbe Eigenschaft/Fähigeit erfassen sollen 3

4 Trennschärfeanalyse in SPSS Berechnung von Fremdtrennschärfen Selektion von Items aufgrund der Itemanalyse ANALYSIEREN SKALIERUNG RELIABILITÄTSANALYSE Items in die Itemliste verschieben (bei mehrdimensionalen Inventaren die Items für jede Dimension einzeln verschieben!) Mittelwert und Korrelationen liefern Infos zur mittleren Schwierigkeit der Items, deren Bandbreite & der mittleren Interkorrelationen der Items untereinander ( interpretierbar als Indikator für Itemhomogenität) STATISTIKEN SKALA WENN ITEM GELÖSCHT ANALYSIEREN KORRELATION BIVARIAT Korrelation von ob35i mit den Skalen Extraversion Verträglichkeit, Gewissenhaftigkeit und Neurotizismus Item ob35i korreliert auch mit drei dieser Skalen (Extraversion (.215),, Gewissenhaftigkeit (.135), und Neurotizismus (-.159)), aber in keinem Fall höher als mit der eigenen Skala (.221) - Indikatoren Itemschwierigkeit und Trennschärfe, ggf. auch Varianz und andere deskriptive Statistiken sowie die Korrelationen mit Außenkriterien simulzan betrachten und gegen inhaltliche Gesichtspunkte abwägen - korrelative Kennwerte (Trennschärfe und bei inhaltl. Begrüdnung mit Außenkriterien) bedeutsamer als univariate Indizes - die Beibehaltung von extrem schwierigen Items lässt sich nur (und nur dann!) rechtfertigen, wenn gleichzeitig angemessen hohe Trennschärfen (umgekehrt kann unzureichende Trennschärfe eine mittlere Schwierigkeit keinesfalls kompensieren). Ausnahme: Bei strikt external konstruierte Skalen ist Korrelation mit Zielkriterium inkl. der Unterscheidung von Gruppen der alles überragende Faktor zur Beurteilung einzelner Items Behalte Items bei, solange sie positiv zur Erhöhung der Reliabilität beitragen! Itemschwierigkeit Trennschärfe Reliabilität Aber: - stichprobenabhängig - gerade bei längeren Skalen ist Einfluss einzelner Items auf Reliabilität oft minimal aber in ähnlicher Höhe im Falle von Extraversion (.215) vor Selektion aber noch faktorenanalytisch untersuchen! Selektion von Items ist im Rahmen der KTT ein nicht automatisierbarer Prozess des Abwägens und Begründens 4

5 PTT Rasch-Modell Wird Modell durch Modelltest nicht abgelehnt - überwindet einige Schwächen der KTT - erheblich größerer mathematischer Komplexität - Das Rasch-Modell ist ein Modell aus der Familie der PTT: praktische Bedeutung - es geht in der PTT darum, wie Antworten auf Items zustande kommen - es geht in der PTT um den Zusammenhang zwischen der Fähigkeit (oder Eigenschaft) einer Person und der Wahrscheinlichkeit, mit der diese Person eine Aufgabe löst bzw. einer Aussage zustimmt, welche die besagte Fähigkeit messen soll - die Erfüllung der mathematischen Annahmen wird durch Modelltests geprüft - die PTT untersucht Antwortmuster (nicht Rohvarianzen/Kovarianzen), die einem bestimmten Modell folgen müssen - in der PTT heißt erschöpfende Statistik, dass der Summenwert einer Person alle Informationen über die Fähigkeitsausprägung dieser Person liefert - Die Lösungswahrscheinlichkeit für ein bestimmtes Item hängt ab von Personparamter (Fähigkeit/Eigenschaftsausprägung der Person) und Itemparamter (Schwierigkeit eines Items) - Person- und Itemparameter werden empirisch geschätzt - Beziehung zwischen Item- und Personparameter ist probabilistisch, d.h. auch eine Person mit geringer Fähigkeitsausprägung im Vergleich zur Itemschwierigkeit hat eine gewisse Wahrscheinlichkeit ein solches Item zu lösen - Das Rasch-Modell sagt voraus, dass mit steigender Personenfähigkeit die Wahrscheinlichkeit einer Itemlösung zunimmt (einer bestimmbaren mathematischen Funktion folgende) Falsch: Die Personparamter besitzen Intervallskalenniveau 1. erschöpfende Statistik - Summenwert der Itemantworten sagt wirklich etwas über den Ausprägungsgrad einer Person auf der latenten Variable (Fähigkeit) aus - Summenwert einer Person liefert alle Informationen über die Fähigkeitsausprägung der Person - Antwortmuster muss nicht mehr Item für Item betrachtet werden Erschöpfende Statistik der Personfähigkeit 2. Itemhomogenität Ein Item ist dann ein guter Indikator für eine latente Variable, wenn die Leistung in diesem Item komplett auf die Fähigkeitsausprägung auf der latenten Variable zurückzuführen ist und nicht auf andere Fähigkeiten Wünschenswerte Annahme für die Testkonstruktion 3. lokale stochastische Unabhängigkeit - Formalisierung der Itemhomogenität - man darf die Lösungswahrscheinlichkeiten der Items für alle Personen multiplizieren Rasch-Modell impliziert eine echte Messtheorie in der Psychologie 5

6 3.2 Überblick über die PTT PTT In der PTT geht es (im Gegensatz zur KTT) darum, WIE Antworten auf Items zustande kommen. Antwortmuster werden untersucht Es geht um den Zusammenhang zwischen der Fähigkeit/Eigenschaft einer Person und der Wahrscheinlichkeit, mit der diese Person eine Aufgabe löst bzw. einer Aussage zustimmt, welche besagte Fähigkeit/Eigenschaft messen soll Das Rasch-Modell gilt als das wichtigste Modell der PTT Von praktischer Bedeutung Rasch-Modell ist aber nur ein Modell aus der Familie der PTT Terminologie (wie bei KTT) aus der Intelligenzmessung abgeleitet - Das Rasch-Modell sagt voraus, dass mit steigender Personenfähigkeit die Wahrscheinlichkeit einer Itemlösung zunimmt Lösungswkt eines Items hängt ab von 1. Fähigkeit/Eigenschaftsausprägung (Personparameter) 2. Schwierigkeit des Items (Itemparameter) - im Rahmen der PTT können verschiedene Modelltest durchgeführt werden. Wird das Rasch-Modell durch einen Modelltest nicht abgelehnt, dann trifft eine Reihe von Annahmen zu: - Die Lösungswahrscheinlichkeit wird durch eine logistische Funktion (ICC) beschrieben - Summenwerte sind suffiziente oder erschöpfende Statistiken der Personfähigkeit - Vergleiche zwischen Items und Personen sind spezifisch objektiv - Items sind (Abgesehen von wenigen Ausnahmen) eindimensional, d.h. die Forderung der lokalen stochastischen Unabhängigkeit ist erfüllt - dichotomes Rasch-Modell: alle Items besitzen die gleiche Trennschärfe Voraussetzung für erschöpfende Statistiken - ordinales Raschmodell: geordnete Antwortschwellen (Nicht gleiche Itemtrennschärfen) notwendige Voraussetzung Grundlagen des Rasch-Modells (1-Parameter-Modell) Erschöpfende Statistik - wird das Rasch-Modell durch den Modelltest nicht abgelehnt, sagt der ungewichtete Summenwert der Itemantworten auch wirklich etwas übe den Ausprägungsgrad einer Person auf der latenten Variable aus - der Summenwert einer Person liefert alle Informationen über die Fähigkeitsausprägung einer Person - Antwortmuster muss nicht mehr Item für Item betrachtet werden - aber: nur wenn alle Items gleich viel wert sind, ist das Zählen/einfach Verrechnen der Itemantworten erlaubt Eindimensionalität - Antwort auf das Item kann komplett auf eine einzige Fähigkeits- oder Eigenschaftsausprägung zurückgeführt werden und nicht auf mehrere - wenn das Rasch-Modell durch Modelltest nicht verworfen wird, ist der Test eindimensional - formal ist Eindimensionalität gegeben, wenn die Korrelation zwischen den Testitems nach Auspartilisierung der latenten Eigenschaft verschwindet (lokale Unabhängigkeit) - lokale stochastische Unabhängigkeit heißt, die Lösungswkt zweier beliebiger Items dürfen multipliziert werden, um die kombinierte Lösungswahrscheinlichkeit zu erhalten Spezifische Objektivität - unter Geltung des Raschmodells sind Vergleiche zwischen Personen spezifisch objektiv, d.h. 1. invarianz über alle Items bei Personenvergleichen 2. Invarianz über spezifische Personen bei Vergleichen zwischen Items 6 Modellparameter Itemparameter Sigma Personparamter Theta Schätzung der Modellparameter Um die Personfähigkeit festzustellen, benötigt man zunächst die Itemparameter Schätzung mit Hilfe der cml Einheit der Modellparameter Logit-Einheit Abstrakte Einheit für Intervallskalierung - Logit-Transformation ist die Transformation der Rohwerte in die Logit- Einheit - nichtlineare Transformation - sichert Differenzskalenniveau - lässt im Gegensatz zu Ordinalskalierung die Interpretation von Differenzen zwischen Fähigkeits- oder Eigenschaftsausprägungen zu - gleiche Einheit und subtraktive Verknüpfung ermöglichen kriteriumsorientierte Interpretation der Personparamter Wertebereich der Modellparameter Plus/minus unendlich i.d.r. zwischen +/-3 negative Werte kennzeichne leichte Items positive Werte kennzeichnen schwere Items Verknüpfung der Modellparameter Kennt man Item- und Personparamter kann man die Lösungswkt für ein Item direkt berechnen - Parameter sind additiv (subtraktiv) verknüpft - ICC Rückgriff auf Normstichprobe zur Interpretation eines Personparameters nicht unbedingt erforderlich ICC Idee des Rasch-Modells ist, dass die Lösung eines Items immer wahrscheinlicher wird, je weiter die Personfähigkeit die Itemschwierigkeit übersteigt Vorhersage der Itemlösungswahrscheinlichkeit Es ist möglich, aufgrund des Person- und Itemparamters die Wkt zu bestimmen, mit der eine Person ein Item löst Modelltests und Stichprobenunabhängigkeit - ob das Rasch-Modell durch die Daten abgelehn werden muss, wird durch Modelltests festgestellt grafische Modelltests: Streudiagramm - Schätzung der Itemparameter sollte unabhängig von Teilstichprobe sein - Nachteil: grafischer Modelltest ist kein Signifikanztest Signifikanztests und Modellvergleiche - Anderson Likelihood-Quotienten-Test - Person-Chiquadrat-Test - Bootstrap-Methode - auch die Möglichkeit, die Passung verschiedener konkurrierender Modell relativ zueinander testen

7 3.2.2 Weitere probabilistische Testmodelle 2-Parameter-Modell 3-Parameter-Modell Ordinales Raschmodell Mixed-Rasch-Modelle (Birnbaum-Modell) Trennschärfe als zusätzliche Einflussgröße der Berücksichtigt zusätzlich die - beschäftigt sich mit Items, die über mehr als 2 Quantifizieren und klassifizieren zugleich Itemlösung Ratewahrscheinlichkeit geordnete Antwortkategorien verfügen - Trennschärfe isst anders formalisiert als in der KTT: In der PTT wird die Trennschärfe durch die Steigung der ICC widergespiegelt - Je höher die Trennschärfe, desto steiler die ICC - im 2-Paramter-Modell unterscheiden sich die Trennschärfen einzelner Items d.h. eine Person besitzt eine gewisse Lösungswahrscheinlichkeit, ein Item trotz mangelnder Personfähigkeit zu lösen Umgekehrt besitzt ein fähige Person immer auch eine gewisse Irrtumswahrscheinlichkeit Schwellenkonzept - welche Kategorie eine Person wählt, hängt ab von Person- und Itemparameter - Treshold entsprechen dem WP der logistischen Funktion ICC sowie zugleich dem Itemparameter (bei 2 Antwortkategorien) - das Schwellenkonzept lässt sich auch auf mehr als zwei geordnete Antwortkategorien übertragen: CCC Das Mixed-Rasch-Modell sucht nach Personengruppen, die sich in ihrem Antwortmuster maximal unterscheiden; Innerhalb einer jeden klasse gilt aber das Rasch-Modell MRM sind für die Testkonstruktion sehr nützlich, das sie Verletzungen von der Annahme der Eindimensionalität für jedes Item anzeigen können. (Items können entfernt werden) Unterschiedliche Trennschärfen kritisch - es kann passieren, dass ein schweres Item trotz geringerer Personfähigkeit gelöst wird im Ggs. Zu Person mit hoher Personfähigkeit (Umkehrung der Lösungswahrscheinlichkeiten) - die unterschiedlichen Trennschärfen müssen zusätzlich geschätzt werden - ungewichtete Summenbildung nicht mehr zulässig - Beschaffenheit der Distraktoren dient zur Kontrolle der Ratewahrscheinlichkeit - Distraktoren so gestalten, dass schwierig genug - Anzahl der Distraktoren erhöhen Vorhersage der Itemlösungswkt erfolgt durch das Partial-Credit-Modell Voraussetzung: Antwortschwellen dürfen sich nicht überschneiden 7

8 Unterschiede KTT und PTT Gemeinsamkeiten KTT und PTT - Im Rahmen der PTT kann ein Modelltests durchgeführt werden, der die Erfüllung der - die Terminologie ist aus der Intelligenzdiagnostik abgleitet Voraussetzungen prüft - sowohl in KTT als auch in PTT müssen Items validiert werden - PTT prüft Zulässigkeit der Summation und somit indirekt das Skalenniveau - Ermittlung von Itemschwierigkeiten - PTT untersucht Antwortmuster und beschäftigt sich damit, wie Antworten auf Items zustande kommen - PTT beschäftigt sich mit dem Zusammenhang zwischen Fähigkeit einer Person und Wahrscheinlichkeit, eine Aufgabe zu lösen - probabilistischer Zusammenhang zwischen Personfähigkeit und Itemlösewahrscheinlichkeit - In der KTT werden Rohwertvarianzen und Kovarianzen untersucht Falsch: - Annahmen über das Zustandekommen (WIE) der Antworten - identischer Ablauf der Itemanalyse - ungeprüfte Voraussetzung des Skalenniveaus eines aggregierten testwertes - Untersuchung Rohwertvarianzen - Eindimensionalität wird ungeprüft vorausgesetzt - Schwierigkeiten in der KTT sind: Bias werden dem wahren Wert zugerechnet, die Annahme unkorrelierter Fehlerwerte wird nicht empirisch geprüft, die Vorstellung dass sich wahre Werte über mehrere Messungen hinweg nicht verändern ist nur für kurze Zeiträume und bestimmte Merkmalsbereiche haltbar, Kennwerte sind stichprobenabhängig - Im Unterscheid zur KTT wird in der PTT die Erfüllung der mathematischen Annahmen durch Modelltests regelmäßig geprüft (falsch: geprüft, wie wahrscheinlich die Lösung einer Aufgabe in der Population im Mittel ist, die inhaltliche Übereinstimmung zwischen Konstrukt und Messwert geprüft, die Rohwertvarianzen und Kovarianzen untersucht, der Messwert als Ausprägung der individuellen Fähigkeit geprüft - Sowohl in der KTT als auch in der PTT müssen die Items validiert werden (Falsch: Annahmen über das Zustandekommen von Antworten, identischer Ablauf einer Itemanalyse, ungeprüfte Voraussetzung der Eindimensionalität, ungeprüfte Voraussetzung des Skalenniveaus eines aggregierten Testwerts (Summenwert) - Sowohl in der KTT als auch in der PTT wird die Schwierigkeit eines Items ermittelt (falsch: Untersuchung Rohwertvarianzen) - Die KTT war die erste Theorie, die zur Testkonstruktion herangezogen wurde, nach Rost basieren 95% der Tests auf KTT, wird auch als Theorie der Reliabilität bezeichnet (falsch: überwindet einige Schwächen der PTT, als Theorie der Objektivität/Validität bezeichnet) - Systematische Fehler werden in der KTT indirekt der wahren Varianz zugeschlagen (falsch: indirekte Fehlerkomponente, indirekt Fehlerkomponente UND wahre Varianz, mit Fehlerkomponente gleichgesetzt, mit der beobachteten Varianz gleichgesetzt) 8

9 Konstruktionsschritte (Vergleich) KTT PTT Ausgangspunkt: Gesamttest Ausgangspunkt: einzelne Items Testentwurf & Itemkonstruktion Itementwicklung Aufgbenanalyse Logit-Transformation - Schwierigkeit Separate Schätzung von Item- und Trennschärfe Personparameter - erste Schätzung Reliabilität und Validität Selektion & Revision Items Erneute emprische Prüfung (Reliabilität, Validität) Testeichung (Normung) Modelltest (Grafisch) Eliminierung von Items, die die strengen Modellannahmen nicht erfüllen Zusammenstellung des Gesamttests Vorteile der PTT - empirische Überprüfung der Modellannahmen - Stichprobenunabhängigekit der Parameter - INtervallskalennievau liegt gesichtert bir - weiterte Vorzüge, z.b. adaptives Testen Einwände gegen die PTT - sehr komplex - hoher Konstruktionsaufwand - praktisch haben sich auch Tests nach KTT bewährt - enge Merkmalsbereiche - seltene Anwendund Top-Down Bottom-Up 9

Rekodierung invertierter Items

Rekodierung invertierter Items 16.Testkonstruktion Items analysieren (imrahmen der KTT) Pretest Aussortieren / Umschreiben von unverständlichen, uneindeutigen oder inakzeptablen Items empirische Prüfung Kennwerte: Itemschwierigkeit

Mehr

Personenparameter + Itemparameter

Personenparameter + Itemparameter 9.Testtheorie: Probabilistische Testtheorie PTT - Grundideen Grundgedanke: Item-Response-Theory IRT probabilistischer Zusammenhang! Wie wahrscheinlich ist es, dass sich eine bestimmte Merkmalsausprägung

Mehr

Das Rasch-Modell und seine zentralen Eigenschaften

Das Rasch-Modell und seine zentralen Eigenschaften Das Rasch-Modell und seine zentralen Eigenschaften Stella Bollmann Seminar Psychometrische Modelle: Theorie und Anwendungen Institut für Statistik, LMU München München, 27. Mai 2014 Stella Bollmann Das

Mehr

Einführung in die Theorie psychologischer Tests

Einführung in die Theorie psychologischer Tests Gerhard H. Fischer Einführung in die Theorie psychologischer Tests Grundlagen und Anwendungen VERLAG HANS HUBER BERN STUTTGART WIEN Inhaltsverzeichnis Vorwort 9 Die Notation 12 Teil 1: Abriss der klassischen

Mehr

Reliabilitäts- und Itemanalyse

Reliabilitäts- und Itemanalyse Reliabilitäts- und Itemanalyse In vielen Wissenschaftsdisziplinen stellt die möglichst exakte Messung von hypothetischen Prozessen oder Merkmalen sogenannter theoretischer Konstrukte ein wesentliches Problem

Mehr

Was ist eine Testtheorie? Grundlagen der Item-Response. Response-Theorie. Modelle mit latenten Variablen

Was ist eine Testtheorie? Grundlagen der Item-Response. Response-Theorie. Modelle mit latenten Variablen Was ist eine Testtheorie? Eine Testtheorie beschäftigt sich also mit dem Zusammenhang zwischen Testverhalten und dem zu erfassenden Merkmal. Testauswertung Persönlichkeitsmerkmal (z.b. Emotionalität, Fähigkeit)

Mehr

4.2 Grundlagen der Testtheorie. Wintersemester 2008 / 2009 Hochschule Magdeburg-Stendal (FH) Frau Prof. Dr. Gabriele Helga Franke

4.2 Grundlagen der Testtheorie. Wintersemester 2008 / 2009 Hochschule Magdeburg-Stendal (FH) Frau Prof. Dr. Gabriele Helga Franke 4.2 Grundlagen der Testtheorie Wintersemester 2008 / 2009 Hochschule Magdeburg-Stendal (FH) Frau Prof. Dr. Gabriele Helga Franke GHF im WiSe 2008 / 2009 an der HS MD-SDL(FH) im Studiengang Rehabilitationspsychologie,

Mehr

Parametrische vs. Non-Parametrische Testverfahren

Parametrische vs. Non-Parametrische Testverfahren Parametrische vs. Non-Parametrische Testverfahren Parametrische Verfahren haben die Besonderheit, dass sie auf Annahmen zur Verteilung der Messwerte in der Population beruhen: die Messwerte sollten einer

Mehr

4.2 Grundlagen der Testtheorie. Wintersemester 2008 / 2009 Hochschule Magdeburg-Stendal (FH) Frau Prof. Dr. Gabriele Helga Franke

4.2 Grundlagen der Testtheorie. Wintersemester 2008 / 2009 Hochschule Magdeburg-Stendal (FH) Frau Prof. Dr. Gabriele Helga Franke 4.2 Grundlagen der Testtheorie Wintersemester 2008 / 2009 Hochschule Magdeburg-Stendal (FH) Frau Prof. Dr. Gabriele Helga Franke GHF im WiSe 2008 / 2009 an der HS MD-SDL(FH) im Studiengang Rehabilitationspsychologie,

Mehr

Einführung in die Test- und Fragebogenkonstruktion

Einführung in die Test- und Fragebogenkonstruktion Markus Bühner 1 Einführung in die Test- und Fragebogenkonstruktion 2., aktualisierte und erweiterte Auflage PEARSON Studium ein Imprint von Pearson Education München Boston San Francisco Harlow, England

Mehr

= = =0,2=20% 25 Plätze Zufallsübereinstimmung: 0.80 x x 0.20 = %

= = =0,2=20% 25 Plätze Zufallsübereinstimmung: 0.80 x x 0.20 = % allgemein Klassifizierung nach Persönlichkeitseigenschaften Messung von Persönlichkeitseigenschaften Zuordnung von Objekten zu Zahlen, so dass die Beziehungen zwischen den Zahlen den Beziehungen zwischen

Mehr

Standardisierte Vorgehensweisen und Regeln zur Gewährleistung von: Eindeutigkeit Schlussfolgerungen aus empirischen Befunden sind nur dann zwingend

Standardisierte Vorgehensweisen und Regeln zur Gewährleistung von: Eindeutigkeit Schlussfolgerungen aus empirischen Befunden sind nur dann zwingend Standardisierte Vorgehensweisen und Regeln zur Gewährleistung von: Eindeutigkeit Schlussfolgerungen aus empirischen Befunden sind nur dann zwingend oder eindeutig, wenn keine alternativen Interpretationsmöglichkeiten

Mehr

Testtheorie und Gütekriterien von Messinstrumenten. Objektivität Reliabilität Validität

Testtheorie und Gütekriterien von Messinstrumenten. Objektivität Reliabilität Validität Testtheorie und Gütekriterien von Messinstrumenten Objektivität Reliabilität Validität Genauigkeit von Messungen Jede Messung zielt darauf ab, möglichst exakte und fehlerfreie Messwerte zu erheben. Dennoch

Mehr

Verfahren zur Skalierung. A. Die "klassische" Vorgehensweise - nach der Logik der klassischen Testtheorie

Verfahren zur Skalierung. A. Die klassische Vorgehensweise - nach der Logik der klassischen Testtheorie Verfahren zur Skalierung A. Die "klassische" Vorgehensweise - nach der Logik der klassischen Testtheorie 1. Daten: z. Bsp. Rating-Skalen, sogenannte "Likert" - Skalen 2. Ziele 1. Eine Skalierung von Items

Mehr

Befehl: Analysieren > Deskriptive Statistiken > Häufigkeiten. Unter: Statistiken: Angabe Kurtosis/ Schiefe/ andere Lagemasse

Befehl: Analysieren > Deskriptive Statistiken > Häufigkeiten. Unter: Statistiken: Angabe Kurtosis/ Schiefe/ andere Lagemasse Grundeinstellungen Befehl: Bearbeiten >Optionen > Allgemein: Namen anzeigen Häufigkeiten Befehl: Analysieren > Deskriptive Statistiken > Häufigkeiten Unter: Statistiken: Angabe Kurtosis/ Schiefe/ andere

Mehr

Vorlesung Testtheorien. Dr. Tobias Constantin Haupt, MBA Sommersemester 2007

Vorlesung Testtheorien. Dr. Tobias Constantin Haupt, MBA Sommersemester 2007 Vorlesung Testtheorien Dr. Tobias Constantin Haupt, MBA Sommersemester 2007 Probabilistische Testtheorie # 2 Itemcharakteristische Funktionen (Itemcharakteristiken, IC - Funktion): Diese beschreibt die

Mehr

Klassische Testtheorie (KTT) Klassische Testtheorie (KTT) Klassische Testtheorie (KTT)

Klassische Testtheorie (KTT) Klassische Testtheorie (KTT) Klassische Testtheorie (KTT) Klassische Testtheorie (KTT) Die KTT stellt eine Sammlung von Methoden dar, die seit Beginn des vorigen Jahrhunderts zur exakten und ökonomischen Erfassung interindividueller Unterschiede entwickelt wurden.

Mehr

4.2 Grundlagen der Testtheorie

4.2 Grundlagen der Testtheorie 4.2 Grundlagen der Testtheorie Januar 2009 HS MD-SDL(FH) Prof. Dr. GH Franke Kapitel 5 Vertiefung: Reliabilität Kapitel 5 Vertiefung: Reliabilität 5.1 Definition Die Reliabilität eines Tests beschreibt

Mehr

Inhaltsverzeichnis. 1 Über dieses Buch Zum Inhalt dieses Buches Danksagung Zur Relevanz der Statistik...

Inhaltsverzeichnis. 1 Über dieses Buch Zum Inhalt dieses Buches Danksagung Zur Relevanz der Statistik... Inhaltsverzeichnis 1 Über dieses Buch... 11 1.1 Zum Inhalt dieses Buches... 13 1.2 Danksagung... 15 2 Zur Relevanz der Statistik... 17 2.1 Beispiel 1: Die Wahrscheinlichkeit, krank zu sein, bei einer positiven

Mehr

Deskription, Statistische Testverfahren und Regression. Seminar: Planung und Auswertung klinischer und experimenteller Studien

Deskription, Statistische Testverfahren und Regression. Seminar: Planung und Auswertung klinischer und experimenteller Studien Deskription, Statistische Testverfahren und Regression Seminar: Planung und Auswertung klinischer und experimenteller Studien Deskriptive Statistik Deskriptive Statistik: beschreibende Statistik, empirische

Mehr

Was heißt messen? Konzeptspezifikation Operationalisierung Qualität der Messung

Was heißt messen? Konzeptspezifikation Operationalisierung Qualität der Messung Was heißt messen? Ganz allgemein: Eine Eigenschaft eines Objektes wird ermittelt, z.b. die Wahlabsicht eines Bürgers, das Bruttosozialprodukt eines Landes, die Häufigkeit von Konflikten im internationalen

Mehr

Hausaufgaben. Antwort und 4 guten Distraktoren zum gelesenen Text!

Hausaufgaben. Antwort und 4 guten Distraktoren zum gelesenen Text! Hausaufgaben Welche wesentlichen Vorteile haben formelle Schulleistungstests? Welche Nachteile haben Schulleistungstests? Überlegen Sie sich 2 gute Multiplechoice-Fragen mit je einer richtigen Antwort

Mehr

Klassische Testtheorie (KTT) Klassische Testtheorie (KTT) Klassische Testtheorie (KTT)

Klassische Testtheorie (KTT) Klassische Testtheorie (KTT) Klassische Testtheorie (KTT) Klassische Testtheorie (KTT) Die KTT stellt eine Sammlung von Methoden dar, die seit Beginn des vorigen Jahrhunderts zur exakten und ökonomischen Erfassung interindividueller Unterschiede entwickelt wurden.

Mehr

Eigene MC-Fragen SPSS. 1. Zutreffend auf die Datenerfassung und Datenaufbereitung in SPSS ist

Eigene MC-Fragen SPSS. 1. Zutreffend auf die Datenerfassung und Datenaufbereitung in SPSS ist Eigene MC-Fragen SPSS 1. Zutreffend auf die Datenerfassung und Datenaufbereitung in SPSS ist [a] In der Variablenansicht werden für die betrachteten Merkmale SPSS Variablen definiert. [b] Das Daten-Editor-Fenster

Mehr

Objektivität und Validität. Testgütekriterien. Objektivität. Validität. Reliabilität. Objektivität

Objektivität und Validität. Testgütekriterien. Objektivität. Validität. Reliabilität. Objektivität Objektivität und Objektivität: Inwieweit ist das Testergebnis unabhängig von externen Einflüssen Effekte des Versuchsleiters, Auswertung, Situation, Itemauswahl : Inwieweit misst der Test das, was er messen

Mehr

Beispielberechnung Vertrauensintervalle

Beispielberechnung Vertrauensintervalle Beispielberechnung Vertrauensintervalle Auszug Kursunterlagen MAS Berufs-, Studien- und Laufbahnberatung Juni 2015 Prof. Dr. Marc Schreiber Beispielberechnung Vertrauensintervalle Vorbereitung - Statistische

Mehr

Forschungsmethoden VORLESUNG SS 2017

Forschungsmethoden VORLESUNG SS 2017 Forschungsmethoden VORLESUNG SS 2017 SOPHIE LUKES Überblick Letzte Woche: - Stichprobenziehung und Stichprobeneffekte Heute: -Gütekriterien I Rückblick Population und Stichprobe verschiedene Arten der

Mehr

Was ist eine Testtheorie?

Was ist eine Testtheorie? Was ist eine Testtheorie? Eine Testtheorie bezeichnet eine Gesamtheit von Methoden zur Behandlung der Fragestellungen, welche sich bei der Testkonstruktion und -auswertung ergeben. Dieser Begriff ist nicht

Mehr

Statistische Grundlagen I

Statistische Grundlagen I Statistische Grundlagen I Arten der Statistik Zusammenfassung und Darstellung von Daten Beschäftigt sich mit der Untersuchung u. Beschreibung von Gesamtheiten oder Teilmengen von Gesamtheiten durch z.b.

Mehr

Teil: lineare Regression

Teil: lineare Regression Teil: lineare Regression 1 Einführung 2 Prüfung der Regressionsfunktion 3 Die Modellannahmen zur Durchführung einer linearen Regression 4 Dummyvariablen 1 Einführung o Eine statistische Methode um Zusammenhänge

Mehr

Statistik. Jan Müller

Statistik. Jan Müller Statistik Jan Müller Skalenniveau Nominalskala: Diese Skala basiert auf einem Satz von qualitativen Attributen. Es existiert kein Kriterium, nach dem die Punkte einer nominal skalierten Variablen anzuordnen

Mehr

Eigene MC-Fragen Kap. 4 Faktorenanalyse, Aggregation, Normierung. 1. Welche Aussage zu den Prinzipien der Faktorenanalyse ist zutreffend?

Eigene MC-Fragen Kap. 4 Faktorenanalyse, Aggregation, Normierung. 1. Welche Aussage zu den Prinzipien der Faktorenanalyse ist zutreffend? Eigene MC-Fragen Kap. 4 Faktorenanalyse, Aggregation, Normierung 1. Welche Aussage zu den Prinzipien der Faktorenanalyse ist zutreffend? a) Die Faktorenanalyse hat ihren Ursprung in der theoretischen Intelligenzforschung.

Mehr

Beispielberechnung Vertrauensintervall

Beispielberechnung Vertrauensintervall Beispielberechnung Vertrauensintervall Auszug Kursunterlagen MAS ZFH in Berufs-, Studien- und Laufbahnberatung Prof. Dr. Marc Schreiber, Dezember 2016 Beispielberechnung Vertrauensintervall Statistische

Mehr

SPSS-Beispiel zum Kapitel 4: Deskriptivstatistische Evaluation von Items (Itemanalyse) und Testwertverteilungen

SPSS-Beispiel zum Kapitel 4: Deskriptivstatistische Evaluation von Items (Itemanalyse) und Testwertverteilungen SPSS-Beispiel zum Kapitel 4: Deskriptivstatistische Evaluation von Items (Itemanalyse) und Testwertverteilungen Augustin Kelava 22. Februar 2010 Inhaltsverzeichnis 1 Einleitung zum inhaltlichen Beispiel:

Mehr

TESTTHEORIE UND TESTKONSTRUKTION - PRAKTISCHE ANWENDUNG - TEIL 3

TESTTHEORIE UND TESTKONSTRUKTION - PRAKTISCHE ANWENDUNG - TEIL 3 TESTTHEORIE UND TESTKONSTRUKTION - PRAKTISCHE ANWENDUNG - TEIL 3 Prof. Dr. Franke SS2012 Hochschule Magdeburg-Stendal (FH) M.Sc. Rehabilitationspsychologie Gliederung Reliabilität 1. Überblick 2. Berechnung

Mehr

Statistische Tests (Signifikanztests)

Statistische Tests (Signifikanztests) Statistische Tests (Signifikanztests) [testing statistical hypothesis] Prüfen und Bewerten von Hypothesen (Annahmen, Vermutungen) über die Verteilungen von Merkmalen in einer Grundgesamtheit (Population)

Mehr

Bildungsurlaub-Seminare: Lerninhalte und Programm

Bildungsurlaub-Seminare: Lerninhalte und Programm Bildungsurlaub-Seminare: Lerninhalte und Programm Seminartitel Einführung Testtheorie und Testkonstruktion für Psychologen/innen (BH16116) Termin Mo, den 30.05. bis Fr, den 03.06.2016 Kursgebühr: 179,-

Mehr

TESTTHEORIE UND TESTKONSTRUKTION - PRAKTISCHE ANWENDUNG - TEIL 1

TESTTHEORIE UND TESTKONSTRUKTION - PRAKTISCHE ANWENDUNG - TEIL 1 TESTTHEORIE UND TESTKONSTRUKTION - PRAKTISCHE ANWENDUNG - TEIL 1 Prof. Dr. Franke SS2012 Hochschule Magdeburg-Stendal (FH) M.Sc. Rehabilitationspsychologie Gliederung Einführung in Datensatz Stichprobenbeschreibung

Mehr

VU Testtheorie und Testkonstruktion WS 08/09; Lengenfelder, Fritz, Moser, Kogler

VU Testtheorie und Testkonstruktion WS 08/09; Lengenfelder, Fritz, Moser, Kogler VU Testtheorie und Testkonstruktion WS 08/09; Lengenfelder, Fritz, Moser, Kogler Hausübung In der Übung Übungsblatt 06 1. Gegeben: Skala zur Messung der Gesundheitssorge mit 20 Items (dichotomes Antwortformat).

Mehr

Anteile Häufigkeiten Verteilungen Lagemaße Streuungsmaße Merkmale von Verteilungen. Anteile Häufigkeiten Verteilungen

Anteile Häufigkeiten Verteilungen Lagemaße Streuungsmaße Merkmale von Verteilungen. Anteile Häufigkeiten Verteilungen DAS THEMA: VERTEILUNGEN LAGEMAßE - STREUUUNGSMAßE Anteile Häufigkeiten Verteilungen Lagemaße Streuungsmaße Merkmale von Verteilungen Anteile Häufigkeiten Verteilungen Anteile und Häufigkeiten Darstellung

Mehr

Statistik und Wahrscheinlichkeitsrechnung

Statistik und Wahrscheinlichkeitsrechnung Statistik und Wahrscheinlichkeitsrechnung 3. Vorlesung Dr. Jochen Köhler 1 Inhalte der heutigen Vorlesung Ziel: Daten Modellbildung Probabilistisches Modell Wahrscheinlichkeit von Ereignissen Im ersten

Mehr

Vorlesung Testtheorien. Dr. Tobias Constantin Haupt, MBA Sommersemester 2007

Vorlesung Testtheorien. Dr. Tobias Constantin Haupt, MBA Sommersemester 2007 Vorlesung Testtheorien Dr. Tobias Constantin Haupt, MBA Sommersemester 2007 Inhaltsfolie # 2 KTT Axiome 4. Axiom Die Höhe des Messfehlers E ist unabhängig vom Ausprägungsgrad der wahren Werte T anderer

Mehr

Was ist ein Test? Grundlagen psychologisch- diagnostischer Verfahren. Rorschach-Test

Was ist ein Test? Grundlagen psychologisch- diagnostischer Verfahren. Rorschach-Test Was ist ein Test? Ein Test ist ein wissenschaftliches Routineverfahren zur Untersuchung eines oder mehrerer empirisch abgrenzbarer Persönlichkeitsmerkmale mit dem Ziel einer möglichst quantitativen Aussage

Mehr

Dr. Maike M. Burda. Welchen Einfluss hat die Körperhöhe auf das Körpergewicht? Eine Regressionsanalyse. HU Berlin, Econ Bootcamp

Dr. Maike M. Burda. Welchen Einfluss hat die Körperhöhe auf das Körpergewicht? Eine Regressionsanalyse. HU Berlin, Econ Bootcamp Dr. Maike M. Burda Welchen Einfluss hat die Körperhöhe auf das Körpergewicht? Eine Regressionsanalyse. HU Berlin, Econ Bootcamp 8.-10. Januar 2010 BOOTDATA.GDT: 250 Beobachtungen für die Variablen... cm:

Mehr

Messtherorie Definitionen

Messtherorie Definitionen Messtherorie Definitionen Begriff Definition Beispiel Relationen Empirisches Relativ eine Menge von Objekten und ein oder mehreren beobachtbaren Relationen zwischen dieses Objekten Menge der Objekte =

Mehr

3.2 Grundlagen der Testtheorie Methoden der Reliabilitätsbestimmung

3.2 Grundlagen der Testtheorie Methoden der Reliabilitätsbestimmung 3.2 Grundlagen der Testtheorie 3.2.6 Methoden der Reliabilitätsbestimmung 6.1 Was ist Reliabilität? 6.2 Retest-Reliabilität 6.3 Paralleltest-Reliabilität 6.4 Splithalf-(Testhalbierungs-)Reliabilität 6.5

Mehr

Methodenlehre. Vorlesung 10. Prof. Dr. Björn Rasch, Cognitive Biopsychology and Methods University of Fribourg

Methodenlehre. Vorlesung 10. Prof. Dr. Björn Rasch, Cognitive Biopsychology and Methods University of Fribourg Methodenlehre Vorlesung 10 Prof. Dr., Cognitive Biopsychology and Methods University of Fribourg 1 Methodenlehre I Woche Datum Thema 1 FQ Einführung, Verteilung der Termine 1 25.9.13 Psychologie als Wissenschaft

Mehr

Empirische Forschung. Übung zur Vorlesung Kognitive Modellierung. Kognitive Modellierung Dorothea Knopp Angewandte Informatik/ Kognitve Systeme

Empirische Forschung. Übung zur Vorlesung Kognitive Modellierung. Kognitive Modellierung Dorothea Knopp Angewandte Informatik/ Kognitve Systeme Empirische Forschung Übung zur Vorlesung Kognitive Modellierung S. 1 Gliederung 1. Was ist empirische Forschung? 2. Empirie Theorie 3. Gütekriterien empirischer Forschung 4. Sammlung von Daten 5. Beschreibung

Mehr

GLIEDERUNG Das Messen eine Umschreibung Skalenniveaus von Variablen Drei Gütekriterien von Messungen Konstruierte Skalen in den Sozialwissenschaften

GLIEDERUNG Das Messen eine Umschreibung Skalenniveaus von Variablen Drei Gütekriterien von Messungen Konstruierte Skalen in den Sozialwissenschaften TEIL 3: MESSEN UND SKALIEREN GLIEDERUNG Das Messen eine Umschreibung Skalenniveaus von Variablen Drei Gütekriterien von Messungen Objektivität Reliabilität Validität Konstruierte Skalen in den Sozialwissenschaften

Mehr

Eigene MC-Fragen Testgütekriterien (X aus 5) 2. Das Ausmaß der Auswertungsobjektivität lässt sich in welcher statistischen Kennzahl angeben?

Eigene MC-Fragen Testgütekriterien (X aus 5) 2. Das Ausmaß der Auswertungsobjektivität lässt sich in welcher statistischen Kennzahl angeben? Eigene MC-Fragen Testgütekriterien (X aus 5) 1. Wenn verschieden Testanwender bei Testpersonen mit demselben Testwert zu denselben Schlussfolgerungen kommen, entspricht dies dem Gütekriterium a) Durchführungsobjektivität

Mehr

grundsätzlich: der Fehler ist reiner Zufallsfehler, korreliert mit nichts - ist statistisch berechenbar

grundsätzlich: der Fehler ist reiner Zufallsfehler, korreliert mit nichts - ist statistisch berechenbar Definition psych. Tests: wissenschaftlich Routineverfahren Untersuchung eines o. mehrerer empirisch abgrenzbarer Persönlichkeitsmerkmale Ziel mgl. quantitative Aussagen über den relativen Grad der indiv.

Mehr

Informationen zur KLAUSUR am

Informationen zur KLAUSUR am Wiederholung und Fragen 1 Informationen zur KLAUSUR am 24.07.2009 Raum: 032, Zeit : 8:00 9:30 Uhr Bitte Lichtbildausweis mitbringen! (wird vor der Klausur kontrolliert) Erlaubte Hilfsmittel: Alle Unterlagen,

Mehr

Forschungsstatistik I

Forschungsstatistik I Psychologie Prof. Dr. G. Meinhardt 6. Stock, TB II R. 06-206 (Persike) R. 06-321 (Meinhardt) Sprechstunde jederzeit nach Vereinbarung Forschungsstatistik I Dr. Malte Persike persike@uni-mainz.de http://psymet03.sowi.uni-mainz.de/

Mehr

Brückenkurs Statistik für Wirtschaftswissenschaften

Brückenkurs Statistik für Wirtschaftswissenschaften Peter von der Lippe Brückenkurs Statistik für Wirtschaftswissenschaften Weitere Übungsfragen UVK Verlagsgesellschaft mbh Konstanz Mit UVK/Lucius München UVK Verlagsgesellschaft mbh Konstanz und München

Mehr

Inhaltsverzeichnis. Vorwort zur 3. Auflage 11. Kapitel 1 Einführung 13. Kapitel 2 Testtheoretische Grundlagen 29

Inhaltsverzeichnis. Vorwort zur 3. Auflage 11. Kapitel 1 Einführung 13. Kapitel 2 Testtheoretische Grundlagen 29 Vorwort zur 3. Auflage 11 Kapitel 1 Einführung 13 1.1 Ziel des Buches............................................... 14 1.2 Testanwendungsbereiche........................................ 18 1.3 Arten von

Mehr

Item-Response-Theorie Probabilistische Testtheorie. Christian Stroppel

Item-Response-Theorie Probabilistische Testtheorie. Christian Stroppel Item-Response-Theorie Probabilistische Testtheorie Referat von: Christian Stroppel Testtheorie Personenparameter Latente Variable ξ Testtheorie Manifeste Variable Xvi Eine Testtheorie beschreibt in welchem

Mehr

Bivariater Zusammenhang in der Vierfeldertafel PEΣO

Bivariater Zusammenhang in der Vierfeldertafel PEΣO Bivariater Zusammenhang in der Vierfeldertafel PEΣO 12. Oktober 2001 Zusammenhang zweier Variablen und bivariate Häufigkeitsverteilung Die Bivariate Häufigkeitsverteilung gibt Auskunft darüber, wie zwei

Mehr

Tutorium Testtheorie. Termin 3. Inhalt: WH: Hauptgütekriterien- Reliabilität & Validität. Charlotte Gagern

Tutorium Testtheorie. Termin 3. Inhalt: WH: Hauptgütekriterien- Reliabilität & Validität. Charlotte Gagern Tutorium Testtheorie Termin 3 Charlotte Gagern charlotte.gagern@gmx.de Inhalt: WH: Hauptgütekriterien- Reliabilität & Validität 1 Hauptgütekriterien Objektivität Reliabilität Validität 2 Hauptgütekriterien-Reliabilität

Mehr

Messen im psychologischen Kontext I. Testentwicklung, Entwicklung von Items, Trennschärfeanalyse und Normierung

Messen im psychologischen Kontext I. Testentwicklung, Entwicklung von Items, Trennschärfeanalyse und Normierung Messen im psychologischen Kontext I Testentwicklung, Entwicklung von Items, Trennschärfeanalyse und Normierung Messen im psychologischen Kontext I 1. Psychologische Tests 2. Die Klassische Testtheorie

Mehr

Statistik II: Grundlagen und Definitionen der Statistik

Statistik II: Grundlagen und Definitionen der Statistik Medien Institut : Grundlagen und Definitionen der Statistik Dr. Andreas Vlašić Medien Institut (0621) 52 67 44 vlasic@medien-institut.de Gliederung 1. Hintergrund: Entstehung der Statistik 2. Grundlagen

Mehr

Lage- und Streuungsparameter

Lage- und Streuungsparameter Lage- und Streuungsparameter Beziehen sich auf die Verteilung der Ausprägungen von intervall- und ratio-skalierten Variablen Versuchen, diese Verteilung durch Zahlen zu beschreiben, statt sie graphisch

Mehr

Angewandte Statistik 3. Semester

Angewandte Statistik 3. Semester Angewandte Statistik 3. Semester Übung 5 Grundlagen der Statistik Übersicht Semester 1 Einführung ins SPSS Auswertung im SPSS anhand eines Beispieles Häufigkeitsauswertungen Grafiken Statistische Grundlagen

Mehr

Ein- und Zweistichprobentests

Ein- und Zweistichprobentests (c) Projekt Neue Statistik 2003 - Lernmodul: Ein- Zweistichprobentests Ein- Zweistichprobentests Worum geht es in diesem Modul? Wiederholung: allgemeines Ablaufschema eines Tests Allgemeine Voraussetzungen

Mehr

Signifikanzprüfung. Peter Wilhelm Herbstsemester 2014

Signifikanzprüfung. Peter Wilhelm Herbstsemester 2014 Signifikanzprüfung Peter Wilhelm Herbstsemester 2014 1.) Auswahl des passenden Tests 2.) Begründete Festlegung des Alpha- Fehlers nach Abschätzung der Power 3.) Überprüfung der Voraussetzungen 4.) Durchführung

Mehr

Welche Gütekriterien sind bei der Bewertung von Lernleistungen

Welche Gütekriterien sind bei der Bewertung von Lernleistungen Welche Gütekriterien sind bei der Bewertung von Lernleistungen wichtig? Anne Spensberger; Ramona Dutschke; überarbeitet von Susanne Narciss Eine gerechte Bewertung von Lernleistungen setzt voraus, dass

Mehr

fh management, communication & it Constantin von Craushaar fh-management, communication & it Statistik Angewandte Statistik

fh management, communication & it Constantin von Craushaar fh-management, communication & it Statistik Angewandte Statistik fh management, communication & it Folie 1 Überblick Grundlagen (Testvoraussetzungen) Mittelwertvergleiche (t-test,..) Nichtparametrische Tests Korrelationen Regressionsanalyse... Folie 2 Überblick... Varianzanalyse

Mehr

Faktorenanalysen mit SPSS. Explorative Faktorenanalyse als Instrument der Dimensionsreduktion. Interpretation des SPSS-Output s

Faktorenanalysen mit SPSS. Explorative Faktorenanalyse als Instrument der Dimensionsreduktion. Interpretation des SPSS-Output s Explorative Faktorenanalyse als Instrument der Dimensionsreduktion Beispiel: Welche Dimensionen charakterisieren die Beurteilung des sozialen Klimas in der Nachbarschaft? Variablen: q27a bis q27g im Datensatz

Mehr

Faktorenanalysen mit SPSS. Explorative Faktorenanalyse als Instrument der Dimensionsreduzierung. Interpretation des SPSS-Output s

Faktorenanalysen mit SPSS. Explorative Faktorenanalyse als Instrument der Dimensionsreduzierung. Interpretation des SPSS-Output s Explorative Faktorenanalyse als Instrument der Dimensionsreduzierung Beispiel: Welche Dimensionen charakterisieren die Beurteilung des sozialen Klimas in der Nachbarschaft? Variablen: q27a bis q27g im

Mehr

Regression ein kleiner Rückblick. Methodenseminar Dozent: Uwe Altmann Alexandra Kuhn, Melanie Spate

Regression ein kleiner Rückblick. Methodenseminar Dozent: Uwe Altmann Alexandra Kuhn, Melanie Spate Regression ein kleiner Rückblick Methodenseminar Dozent: Uwe Altmann Alexandra Kuhn, Melanie Spate 05.11.2009 Gliederung 1. Stochastische Abhängigkeit 2. Definition Zufallsvariable 3. Kennwerte 3.1 für

Mehr

Die Subskala besteht aus folgenden Items (Ausschnitt aus dem Codeplan):

Die Subskala besteht aus folgenden Items (Ausschnitt aus dem Codeplan): Beispiel für eine Itemanalyse mit der SPSS-Prozedur Reliabilitätsanalyse (RELIABILITY) Daten: POKIII_AG1_V06.SAV (POK III, AG 1) Die Skala Körperbewusstsein von Löwe und Clement (1996) 1 besteht aus zwei

Mehr

5. Seminar Statistik

5. Seminar Statistik Sandra Schlick Seite 1 5. Seminar 5. Seminar Statistik 30 Kurztest 4 45 Testen von Hypothesen inkl. Übungen 45 Test- und Prüfverfahren inkl. Übungen 45 Repetitorium und Prüfungsvorbereitung 15 Kursevaluation

Mehr

Dr. Maike M. Burda. Welchen Einfluss hat die Körperhöhe auf das Körpergewicht? Eine Regressionsanalyse. HU Berlin, Econ Bootcamp 7.-9.

Dr. Maike M. Burda. Welchen Einfluss hat die Körperhöhe auf das Körpergewicht? Eine Regressionsanalyse. HU Berlin, Econ Bootcamp 7.-9. Dr. Maike M. Burda Welchen Einfluss hat die Körperhöhe auf das Körpergewicht? Eine Regressionsanalyse. HU Berlin, Econ Bootcamp 7.-9. Januar 2011 BOOTDATA11.GDT: 250 Beobachtungen für die Variablen...

Mehr

Übung 4 im Fach "Biometrie / Q1"

Übung 4 im Fach Biometrie / Q1 Universität Ulm, Institut für Epidemiologie und Medizinische Biometrie, D-89070 Ulm Institut für Epidemiologie und Medizinische Biometrie Leiter: Prof. Dr. D. Rothenbacher Schwabstr. 13, 89075 Ulm Tel.

Mehr

Analytische Statistik II

Analytische Statistik II Analytische Statistik II Institut für Geographie 1 Schätz- und Teststatistik 2 Das Testen von Hypothesen Während die deskriptive Statistik die Stichproben nur mit Hilfe quantitativer Angaben charakterisiert,

Mehr

Statistische Methoden in den Umweltwissenschaften

Statistische Methoden in den Umweltwissenschaften Statistische Methoden in den Umweltwissenschaften Korrelationsanalysen Kreuztabellen und χ²-test Themen Korrelation oder Lineare Regression? Korrelationsanalysen - Pearson, Spearman-Rang, Kendall s Tau

Mehr

Grundlagen sportwissenschaftlicher Forschung Deskriptive Statistik 2 Inferenzstatistik 1

Grundlagen sportwissenschaftlicher Forschung Deskriptive Statistik 2 Inferenzstatistik 1 Grundlagen sportwissenschaftlicher Forschung Deskriptive Statistik 2 Inferenzstatistik 1 Dr. Jan-Peter Brückner jpbrueckner@email.uni-kiel.de R.216 Tel. 880 4717 Rückblick: Besonders wichtige Themen Wissenschaftstheoretischer

Mehr

Grundlagen der Statistik

Grundlagen der Statistik Grundlagen der Statistik Übung 6 2009 FernUniversität in Hagen Alle Rechte vorbehalten Fakultät für Wirtschaftswissenschaft Übersicht über die mit den insendeaufgaben geprüften Lehrzielgruppen Lehrzielgruppe:

Mehr

6. Faktorenanalyse (FA) von Tests

6. Faktorenanalyse (FA) von Tests 6. Faktorenanalyse (FA) von Tests 1 6. Faktorenanalyse (FA) von Tests 1 6.1. Grundzüge der FA nach der Haupkomponentenmethode (PCA) mit anschliessender VARIMAX-Rotation:... 2 6.2. Die Matrizen der FA...

Mehr

Bivariate Analyseverfahren

Bivariate Analyseverfahren Bivariate Analyseverfahren Bivariate Verfahren beschäftigen sich mit dem Zusammenhang zwischen zwei Variablen Beispiel: Konservatismus/Alter Zusammenhangsmaße beschreiben die Stärke eines Zusammenhangs

Mehr

Pflichtlektüre: Kapitel 12 - Signifikanztest Wie funktioniert ein Signifikanztest? Vorgehensweise nach R. A. Fisher.

Pflichtlektüre: Kapitel 12 - Signifikanztest Wie funktioniert ein Signifikanztest? Vorgehensweise nach R. A. Fisher. Pflichtlektüre: Kapitel 12 - Signifikanztest Überblick Signifikanztest Populationsparameter Ein Verfahren zur Überprüfung von Hypothesen, Grundlage bilden auch hier Stichprobenverteilungen, das Ergebnis

Mehr

Auswahl von Testaufgaben

Auswahl von Testaufgaben Auswahl von Testaufgaben Auswahl von Testaufgaben Itemformat Formulierung Probleme/Verfälschungen Itemanalyse Skalen Itemformat Nach Bortz Offene Beantwortung Nach Bühning Freies Itemformat Halboffene

Mehr

Dr. Barbara Lindemann. Fragebogen. Kolloquium zur Externen Praxisphase. Dr. Barbara Lindemann 1

Dr. Barbara Lindemann. Fragebogen. Kolloquium zur Externen Praxisphase. Dr. Barbara Lindemann 1 Dr. Barbara Lindemann Fragebogen Kolloquium zur Externen Praxisphase Dr. Barbara Lindemann 1 Überblick 1. Gütekriterien quantitativer Forschungen 2. Fragebogenkonstruktion 3. Statistische Datenanalyse

Mehr

Name Vorname Matrikelnummer Unterschrift

Name Vorname Matrikelnummer Unterschrift Dr. Hans-Otfried Müller Institut für Mathematische Stochastik Fachrichtung Mathematik Technische Universität Dresden Klausur Statistik II (Sozialwissenschaft, Nach- und Wiederholer) am 26.10.2007 Gruppe

Mehr

1. Maße der zentralen Tendenz Beispiel: Variable Anzahl der Geschwister aus Jugend '92. Valid Cum Value Frequency Percent Percent Percent

1. Maße der zentralen Tendenz Beispiel: Variable Anzahl der Geschwister aus Jugend '92. Valid Cum Value Frequency Percent Percent Percent Deskriptive Statistik 1. Verteilungsformen symmetrisch/asymmetrisch unimodal(eingipflig) / bimodal (zweigipflig schmalgipflig / breitgipflig linkssteil / rechtssteil U-förmig / abfallend Statistische Kennwerte

Mehr

Statistik II Übung 4: Skalierung und asymptotische Eigenschaften

Statistik II Übung 4: Skalierung und asymptotische Eigenschaften Statistik II Übung 4: Skalierung und asymptotische Eigenschaften Diese Übung beschäftigt sich mit der Skalierung von Variablen in Regressionsanalysen und mit asymptotischen Eigenschaften von OLS. Verwenden

Mehr

2. Formulieren von Hypothesen. Nullhypothese: H 0 : µ = 0 Gerät exakt geeicht

2. Formulieren von Hypothesen. Nullhypothese: H 0 : µ = 0 Gerät exakt geeicht 43 Signifikanztests Beispiel zum Gauß-Test Bei einer Serienfertigung eines bestimmten Typs von Messgeräten werden vor der Auslieferung eines jeden Gerätes 10 Kontrollmessungen durchgeführt um festzustellen,

Mehr

Univariate Kennwerte mit SPSS

Univariate Kennwerte mit SPSS Univariate Kennwerte mit SPSS In diesem Paper wird beschrieben, wie eindimensionale Tabellen und Kennwerte mit SPSS erzeugt werden. Eine Herleitung der Kennwerte und eine inhaltliche Interpretation der

Mehr

Trim Size: 176mm x 240mm Lipow ftoc.tex V1 - March 9, :34 P.M. Page 11. Über die Übersetzerin 9. Einleitung 19

Trim Size: 176mm x 240mm Lipow ftoc.tex V1 - March 9, :34 P.M. Page 11. Über die Übersetzerin 9. Einleitung 19 Trim Size: 176mm x 240mm Lipow ftoc.tex V1 - March 9, 2016 6:34 P.M. Page 11 Inhaltsverzeichnis Über die Übersetzerin 9 Einleitung 19 Was Sie hier finden werden 19 Wie dieses Arbeitsbuch aufgebaut ist

Mehr

Hypothesentests mit SPSS

Hypothesentests mit SPSS Beispiel für eine einfache Regressionsanalyse (mit Überprüfung der Voraussetzungen) Daten: bedrohfb_v07.sav Hypothese: Die Skalenwerte auf der ATB-Skala (Skala zur Erfassung der Angst vor terroristischen

Mehr

RETESTRELIABILITÄT. Teststabilität. Korrelation wiederholter Testdurchführungen. Persönlichkeitstests. Stabilität des Zielmerkmals.

RETESTRELIABILITÄT. Teststabilität. Korrelation wiederholter Testdurchführungen. Persönlichkeitstests. Stabilität des Zielmerkmals. Basiert auf RETESTRELIABILITÄT Wird auch genannt Teststabilität Geeignet für Korrelation wiederholter Testdurchführungen Abhängig von beeinflusst Stabilität des Zielmerkmals Persönlichkeitstests Speedtests

Mehr

Methodenlehre. Vorlesung 12. Prof. Dr. Björn Rasch, Cognitive Biopsychology and Methods University of Fribourg

Methodenlehre. Vorlesung 12. Prof. Dr. Björn Rasch, Cognitive Biopsychology and Methods University of Fribourg Methodenlehre Vorlesung 12 Prof. Dr., Cognitive Biopsychology and Methods University of Fribourg 1 Methodenlehre I Woche Datum Thema 1 FQ Einführung, Verteilung der Termine 1 25.9.13 Psychologie als Wissenschaft

Mehr

1 x 1 y 1 2 x 2 y 2 3 x 3 y 3... n x n y n

1 x 1 y 1 2 x 2 y 2 3 x 3 y 3... n x n y n 3.2. Bivariate Verteilungen zwei Variablen X, Y werden gemeinsam betrachtet (an jedem Objekt werden gleichzeitig zwei Merkmale beobachtet) Beobachtungswerte sind Paare von Merkmalsausprägungen (x, y) Beispiele:

Mehr

Forschungsstatistik I

Forschungsstatistik I Prof. Dr. G. Meinhardt 6. Stock, Taubertsberg R. 06-06 (Persike) R. 06-31 (Meinhardt) Sprechstunde jederzeit nach Vereinbarung Forschungsstatistik I Dr. Malte Persike persike@uni-mainz.de http://psymet03.sowi.uni-mainz.de/

Mehr

Mathematische und statistische Methoden II

Mathematische und statistische Methoden II Methodenlehre e e Prof. Dr. G. Meinhardt 6. Stock, Wallstr. 3 (Raum 06-06) Sprechstunde jederzeit nach Vereinbarung und nach der Vorlesung. Mathematische und statistische Methoden II Dr. Malte Persike

Mehr

Psychologische Diagnostik

Psychologische Diagnostik Dr. Andreas Eickhorst Pädagogische Psychologie Psychologische Diagnostik Themen 1. Was ist Diagnostik? 2. Was ist psychologische Diagnostik? 3. Arten diagnostischer Verfahren 4. Diagnostik in der Schule

Mehr

BOXPLOT 1. Begründung. Boxplot A B C

BOXPLOT 1. Begründung. Boxplot A B C BOXPLOT 1 In nachstehender Tabelle sind drei sortierte Datenreihen gegeben. Zu welchem Boxplot gehört die jeweilige Datenreihe? Kreuze an und begründe Deine Entscheidung! Boxplot A B C Begründung 1 1 1

Mehr

Hypothesentests mit SPSS

Hypothesentests mit SPSS Beispiel für eine zweifaktorielle Varianzanalyse mit Messwiederholung auf einem Faktor (univariate Lösung) Daten: POKIII_AG4_V06.SAV Hypothese: Die physische Attraktivität der Bildperson und das Geschlecht

Mehr