4.2 Grundlagen der Testtheorie
|
|
- Bella Giese
- vor 7 Jahren
- Abrufe
Transkript
1 4.2 Grundlagen der Testtheorie Januar 2009 HS MD-SDL(FH) Prof. Dr. GH Franke Kapitel 5 Vertiefung: Reliabilität
2 Kapitel 5 Vertiefung: Reliabilität 5.1 Definition Die Reliabilität eines Tests beschreibt den Grad der Genauigkeit, mit dem er ein bestimmtes Persönlichkeitsmerkmal misst, gleichgültig, ob er dieses Merkmal auch zu messen beansprucht. (Kubinger, 2006, S. 45) Reliabilität ist die Zuverlässigkeit eines Tests, d.h. die Reliabilität beantwortet die Frage: Wie gut misst der Test das, was er messen soll?.
3 5.2.1 Vier Methoden zur Bestimmung der Reliabilität 4 Methoden zur Bestimmung der Reliabilität: Retest-Methode (Testwiederholung) Paralleltestmethode Split-Half-Methode (Testhalbierung) Homogenitätsmethode (interne Konsistenz)
4 5.2.1 Vier Methoden zur Bestimmung der Reliabilität Retest-Reliabilität Eine wiederholte Messung an der gleichen Personengruppe sollte im günstigsten Fall identische Ergebnisse bringen Die Berechnung der Retest-Reliabilität (z.b. nach einer Woche) eignet sich nur bei Merkmalen, die zeitlich stabil sind und bei denen somit erwartet werden kann, dass sie sich in einer Woche nicht deutlich verändern. Stabilität der Eigenschaft wird gemessen
5 5.2.1 Vier Methoden zur Bestimmung der Reliabilität Paralleltest-Reliabilität Es werden eine oder mehrere gleichschwere Parallelformen (Form A, Form B,...) entwickelt, beide Formen müssen hoch miteinander korrelieren. Die Entwicklung von Parallelformen ist sehr aufwendig, daher liegen für die meisten psychodiagnostischen Verfahren keine Parallelformen vor.
6 5.2.1 Vier Methoden zur Bestimmung der Reliabilität Split - Half-Reliabilität (Testhalbierungsreliabilität) Die Items des Tests werden - nach Durchführung - per Zufall in zwei Gruppen aufgeteilt. Die Ergebnisse dieser beiden Hälften sollten hoch korrelieren. Die Berechnung der Testhalbierungs-Reliabilität eignet sich für alle Verfahren, die genügend Items umfassen, unabhängig vom Zeitfenster (aktuelle Situation, eine Woche oder grundsätzlich) des Tests.
7 5.2.1 Vier Methoden zur Bestimmung der Reliabilität Konsistenzkoeffizient, interne Konsistenz, Cronbach s Alpha Jedes einzelne Item wird als Einzeltest gesehen und die Korrelation zwischen jedem Item und dem Gesamtwert wird berechnet. Der Konsistenzkoeffizient (= interne Konsistenz) ist das Reliabilitätsmaß, das am häufigsten berechnet wird. Homogenität
8 Je höher die Reliabilität desto unabhängiger ist der Test von Zufallsschwankungen und Umweltbedingungen Hohe Reliabilität ist damit auch abhängig von hoher Objektivität
9 Bewertungsrahmen Interne Konsistenz (rel) < 0,80 = niedrig 0,80 0,90 = hoch > 0,90 = sehr hoch
10 VORTEILE UND PROBLEME DER METHODEN ZUR RELIABILITÄTSSCHÄTZUNG Retest Parallel Split-Half Konsistenz Parallelform notwendig Nein Ja Nein Nein 2 Testdurchführungen notwendig Ja Ja Nein Nein 2 Messzeitpunkte notwendig Ja Nein Nein Nein Überschätzung bei Erinnerungseffekten Unterschätzung bei unsystematischer Merkmalsveränderung Unterschätzung bei heterogenen Items Ja Nein Nein Nein Ja Nein Nein Nein Nein Nein Ja Ja
11 5.2.2 Grenzen der Reliabilität Die Reliabilität ist gleich dem Anteil der "wahren Varianz" an der "Gesamtvarianz" des Tests. Ihr Zahlenwert kann zwischen 0 und 1 betragen. rel = s s 2 T 2 t Ursache hierfür sind u. a. Messfehler, d.h. Testwerte sind fehlerbehaftet! ti = Ti + ei Axiom 1: Das Testergebnis (ti) setzt sich additiv aus dem wahren Wert (Ti) und dem Messfehler (ei) zusammen! (e=error)
12 5.2.2 Grenzen der Reliabilität Standardmessfehler Standardmessfehler se = Standardabweichung der Messfehlerverteilung Die Messfehlerverteilung (= Fehlerverteilung) ist normal verteilt, weil Fehler zufällig sind und kleine häufiger als große Der Standardmessfehler se (standard error) lässt sich berechnen: s e = s 1 t r tt st = Standardabweichung rtt = Retest-Reliabilität je höher die Reliabilität (Test misst genau), umso geringer der Standardmessfehler!
13 5.2.2 Grenzen der Reliabilität Standardmessfehler Beispiel zur Berechnung des Standardmessfehlers: Ein in IQ-Werten normierter Intelligenztest hat eine Reliabilität von r tt = 0,90. s e = s 1 t r tt se = ,9 = 15 0,1 = 15 0,32 = 4,8
14 5.2.2 Grenzen der Reliabilität Vertrauensintervall (KONF), Confidential Limit (CL) KONF = ist derjenige Bereich um einen beobachteten Testpunktwert ti, innerhalb dessen mit einer gewissen Wahrscheinlichkeit der wahre Wert Ti erwartet wird. Das Vertrauensintervall KONF (oder CL) lässt sich berechnen: KONF= t ± K i s e 68% Vertrauensintervall: K = 1 95% Vertrauensintervall: K = 1,96 99% Vertrauensintervall: K = 2,58
15 5.2.2 Grenzen der Reliabilität Vertrauensintervall (KONF), Confidential Limit (CL) Beispiel zur Berechnung des Vertrauensintervalls: In obigem Beispiel (Intelligenztest mit st = 15 und rtt = 0,9) wurde der Standardfehler mit se = 4,80 berechnet. In welchem Bereich liegt mit einer Wahrscheinlichkeit von 95% der "wahre" Testpunktwert (Ti), wenn von einem Probanden ein beobachteter Testpunktwert ti = 105 erzielt wurde? KONF95% = ,96 * 4,80 = ,4 Der "wahre" Ti liegt also mit 95% Wahrscheinlichkeit zwischen IQ = 95,6 und IQ = 114,40. Das Vertrauensintervall ist, bei einer Reliabilität von rtt = 0,9, also deutlich größer als eine Standardabweichung des Tests.
16 5.2.2 Grenzen der Reliabilität Intraindividueller Vergleich, Kritische Differenz Als kritische Differenz (RCI = reliable change index) bezeichnen wir jene Differenz zwischen zwei Testpunktwerten, deren Überschreitung statistische Signifikanz anzeigt. Für das 5%-Signifikanzniveau lautet die Formel: d krit.5% = 1,65 s ed Kritische Differenz s ed = s 2 t r tt r uu Standardmessfehler der intraindividuellen Differenz unter Berücksichtigung der unterschiedlichen Reliabilitäten der Tests
17 5.2.1 Grenzen der Reliabilität Intraindividueller Vergleich, Kritische Differenz Beispiel zur Kritischen Differenz (intraindividueller Vergleich): Eine Person erzielte in einem Test für verbale Intelligenz (r tt = 0,90) einen Testpunktwert von IQ V = 110 und in einem Test für handlungsbezogene Intelligenz (r tt = 0,85) einen Testpunktwert von IQ H = 115. Frage: können wir mit hinlänglicher (95%) Wahrscheinlichkeit davon ausgehen, dass die Person "tatsächlich" eine höhere handlungsbezogene, im Vergleich zur verbalen, intellektuellen Leistungsfähigkeit besitzt? d krit.5% = 1,65 15 = 24,75 0,5 = 12,37 2 0,90 0,85 = 24,75 0,25 Die kritische Differenz beträgt 12,37 IQ-Punkte. Die beobachtete Differenz hingegen nur 5 IQ-Punkte. Wir akzeptieren die H o : Handlungs- und Verbal-IQ unterscheiden sich nicht signifikant von einander.
3.2 Grundlagen der Testtheorie Methoden der Reliabilitätsbestimmung
3.2 Grundlagen der Testtheorie 3.2.6 Methoden der Reliabilitätsbestimmung 6.1 Was ist Reliabilität? 6.2 Retest-Reliabilität 6.3 Paralleltest-Reliabilität 6.4 Splithalf-(Testhalbierungs-)Reliabilität 6.5
MehrTutorium Testtheorie. Termin 3. Inhalt: WH: Hauptgütekriterien- Reliabilität & Validität. Charlotte Gagern
Tutorium Testtheorie Termin 3 Charlotte Gagern charlotte.gagern@gmx.de Inhalt: WH: Hauptgütekriterien- Reliabilität & Validität 1 Hauptgütekriterien Objektivität Reliabilität Validität 2 Hauptgütekriterien-Reliabilität
MehrTESTTHEORIE UND TESTKONSTRUKTION - PRAKTISCHE ANWENDUNG - TEIL 3
TESTTHEORIE UND TESTKONSTRUKTION - PRAKTISCHE ANWENDUNG - TEIL 3 Prof. Dr. Franke SS2012 Hochschule Magdeburg-Stendal (FH) M.Sc. Rehabilitationspsychologie Gliederung Reliabilität 1. Überblick 2. Berechnung
MehrBeispielberechnung Vertrauensintervalle
Beispielberechnung Vertrauensintervalle Auszug Kursunterlagen MAS Berufs-, Studien- und Laufbahnberatung Juni 2015 Prof. Dr. Marc Schreiber Beispielberechnung Vertrauensintervalle Vorbereitung - Statistische
MehrTesttheorie und Gütekriterien von Messinstrumenten. Objektivität Reliabilität Validität
Testtheorie und Gütekriterien von Messinstrumenten Objektivität Reliabilität Validität Genauigkeit von Messungen Jede Messung zielt darauf ab, möglichst exakte und fehlerfreie Messwerte zu erheben. Dennoch
Mehrσ 2 (x) = σ 2 (τ) + σ 2 (ε) ( x) ( ) ( x) ( ) ( ) σ =σ τ +σ ε σ τ σ σ ε ( ) ( x) Varianzzerlegung Varianzzerlegung und Definition der Reliabilität
Varianzzerlegung Die Varianz der beobachteten Testwerte x v : setzt sich zusammen aus zerlegen wahrer Varianz und Fehlervarianz: σ (x) = σ (τ) + σ (ε) Varianzzerlegung und Definition der Reliabilität (
MehrBeispielberechnung Vertrauensintervall
Beispielberechnung Vertrauensintervall Auszug Kursunterlagen MAS ZFH in Berufs-, Studien- und Laufbahnberatung Prof. Dr. Marc Schreiber, Dezember 2016 Beispielberechnung Vertrauensintervall Statistische
MehrVerfahren zur Skalierung. A. Die "klassische" Vorgehensweise - nach der Logik der klassischen Testtheorie
Verfahren zur Skalierung A. Die "klassische" Vorgehensweise - nach der Logik der klassischen Testtheorie 1. Daten: z. Bsp. Rating-Skalen, sogenannte "Likert" - Skalen 2. Ziele 1. Eine Skalierung von Items
MehrForschungsmethoden VORLESUNG SS 2017
Forschungsmethoden VORLESUNG SS 2017 SOPHIE LUKES Überblick Letzte Woche: - Stichprobenziehung und Stichprobeneffekte Heute: -Gütekriterien I Rückblick Population und Stichprobe verschiedene Arten der
MehrForschungsmethoden VORLESUNG WS 2017/2018
Forschungsmethoden VORLESUNG WS 2017/2018 SOPHIE LUKES Überblick Letzte Woche: - Stichprobenziehung und Stichprobeneffekte Heute: -Gütekriterien I Rückblick Population und Stichprobe verschiedene Arten
MehrStatistik I. Methodologie der Psychologie
Statistik I Methodologie der Psychologie Thomas Schmidt & Lena Frank Wintersemester 2003/2004 Georg-Elias-Müller-Institut für Psychologie Uni Göttingen Literatur: Glantz, S.A. (2002). Primer of Biostatistics.
MehrReliabilitäts- und Itemanalyse
Reliabilitäts- und Itemanalyse In vielen Wissenschaftsdisziplinen stellt die möglichst exakte Messung von hypothetischen Prozessen oder Merkmalen sogenannter theoretischer Konstrukte ein wesentliches Problem
MehrWelche Gütekriterien sind bei der Bewertung von Lernleistungen
Welche Gütekriterien sind bei der Bewertung von Lernleistungen wichtig? Anne Spensberger; Ramona Dutschke; überarbeitet von Susanne Narciss Eine gerechte Bewertung von Lernleistungen setzt voraus, dass
MehrRETESTRELIABILITÄT. Teststabilität. Korrelation wiederholter Testdurchführungen. Persönlichkeitstests. Stabilität des Zielmerkmals.
Basiert auf RETESTRELIABILITÄT Wird auch genannt Teststabilität Geeignet für Korrelation wiederholter Testdurchführungen Abhängig von beeinflusst Stabilität des Zielmerkmals Persönlichkeitstests Speedtests
Mehr= = =0,2=20% 25 Plätze Zufallsübereinstimmung: 0.80 x x 0.20 = %
allgemein Klassifizierung nach Persönlichkeitseigenschaften Messung von Persönlichkeitseigenschaften Zuordnung von Objekten zu Zahlen, so dass die Beziehungen zwischen den Zahlen den Beziehungen zwischen
MehrMethodenlehre. Vorlesung 4. Prof. Dr. Björn Rasch, Cognitive Biopsychology and Methods University of Fribourg
Methodenlehre Vorlesung 4 Prof. Dr., Cognitive Biopsychology and Methods University of Fribourg 1 Methodenlehre II Woche Datum Thema 1 FQ Einführung, Verteilung der Termine 1 18.2.15 Psychologie als Wissenschaft
MehrMethodenlehre. Vorlesung 12. Prof. Dr. Björn Rasch, Cognitive Biopsychology and Methods University of Fribourg
Methodenlehre Vorlesung 12 Prof. Dr., Cognitive Biopsychology and Methods University of Fribourg 1 Methodenlehre II Woche Datum Thema 1 FQ Einführung, Verteilung der Termine 1 18.2.15 Psychologie als Wissenschaft
MehrT-Test für unabhängige Stichproben
T-Test für unabhängige Stichproben Wir gehen von folgendem Beispiel aus: Wir erheben zwei Zufallstichproben, wobei nur die Probanden der einen Stichprobe einer speziellen experimentellen Behandlung (etwa
MehrVorlesung Testtheorien. Dr. Tobias Constantin Haupt, MBA Sommersemester 2007
Vorlesung Testtheorien Dr. Tobias Constantin Haupt, MBA Sommersemester 2007 Inhaltsfolie # 2 KTT Axiome 4. Axiom Die Höhe des Messfehlers E ist unabhängig vom Ausprägungsgrad der wahren Werte T anderer
MehrEinführung in die Statistik Testgütekriterien
Professur Psychologie digitaler Lernmedien Institut für Medienforschung Philosophische Fakultät Einführung in die Statistik Testgütekriterien Überblick Einleitung Objektivität Reliabilität Validität Nebengütekriterien
MehrMethodenlehre. Vorlesung 11. Prof. Dr. Björn Rasch, Cognitive Biopsychology and Methods University of Fribourg
Methodenlehre Vorlesung 11 Prof. Dr., Cognitive Biopsychology and Methods University of Fribourg 1 03.12.13 Methodenlehre I Woche Datum Thema 1 FQ Einführung, Verteilung der Termine 1 25.9.13 Psychologie
MehrAuswertung und Lösung
Dieses Quiz soll Ihnen helfen, Kapitel 4.7 und 4.8 besser zu verstehen. Auswertung und Lösung Abgaben: 71 / 265 Maximal erreichte Punktzahl: 8 Minimal erreichte Punktzahl: 0 Durchschnitt: 5.65 Frage 1
MehrMethodenlehre. Vorlesung 10. Prof. Dr. Björn Rasch, Cognitive Biopsychology and Methods University of Fribourg
Methodenlehre Vorlesung 10 Prof. Dr., Cognitive Biopsychology and Methods University of Fribourg 1 Methodenlehre I Woche Datum Thema 1 FQ Einführung, Verteilung der Termine 1 25.9.13 Psychologie als Wissenschaft
MehrGütekriterien HS Sprachstandsdiagnose und Sprachförderung SS2011 Referentin: Meghann Munro
Gütekriterien HS Sprachstandsdiagnose und Sprachförderung SS2011 Referentin: Meghann Munro Vorüberlegungen Wie objektiv ist der Test in seiner Durchführung, Auswertung und Interpretation? Misst das Verfahren
MehrBEGLEITTEXT: METHODEN DER RELIABILITÄTSSCHÄTZUNG (P. SCHMOLCK)
Universität der Bundeswehr München Fakultät für Pädagogik ESF: Tarnai / Schmolck / Wöhling FT 007 BEGLEITTEXT: METHODEN DER RELIABILITÄTSSCHÄTZUNG (P. SCHMOLCK) Reliabilität bezeichnet die Genauigkeit
MehrVorlesung Testtheorien. Dr. Tobias Constantin Haupt, MBA Sommersemester 2007
Vorlesung Testtheorien Dr. Tobias Constantin Haupt, MBA Sommersemester 2007 Wie läßt sich die Reliabilität erhöhen? Testlänge erhöhen (Kann zu Durchführungseinschränkungen führen; Testökonomie und Zumutbarkeit
MehrBestimmung der Zuverlässigkeit / Reliabilität einer additiven Itemskala. Cronbach s. 1 (k 1)r
Dr. Wolfgang Langer - Methoden V: Explorative Faktorenanalyse SoSe 1999-1 Bestimmung der Zuverlässigkeit / Reliabilität einer additiven Itemskala Für die Schätzung der Zuverlässigkeit einer additiven Itemskala,
MehrEigene MC-Fragen Testgütekriterien (X aus 5) 2. Das Ausmaß der Auswertungsobjektivität lässt sich in welcher statistischen Kennzahl angeben?
Eigene MC-Fragen Testgütekriterien (X aus 5) 1. Wenn verschieden Testanwender bei Testpersonen mit demselben Testwert zu denselben Schlussfolgerungen kommen, entspricht dies dem Gütekriterium a) Durchführungsobjektivität
MehrWie intelligent ist mein Kind?
Dipl.-Psych. Psychologische Beratung KONTAKT Tobias Uhl Psychologische Tests Tel.: 07763 80 44252 Lauberstraße 27 Mobile psychologische Praxis coaching@silvanigra.de D-79730 Murg www.silvanigra.de Wie
MehrKlausur Testtheorie: Antworten und Lösungen
Name: Matrikelnummer: Klausur Testtheorie: Antworten und Lösungen Psychologisches Institut der JGU Mainz Freitag, 24. 07. 09 Bitte vergessen Sie nicht, Ihren Namen und Ihre Matrikelnummer anzugeben! 1.
Mehr6. Faktorenanalyse (FA) von Tests
6. Faktorenanalyse (FA) von Tests 1 6. Faktorenanalyse (FA) von Tests 1 6.1. Grundzüge der FA nach der Haupkomponentenmethode (PCA) mit anschliessender VARIMAX-Rotation:... 2 6.2. Die Matrizen der FA...
Mehr4.2 Grundlagen der Testtheorie. Wintersemester 2008 / 2009 Hochschule Magdeburg-Stendal (FH) Frau Prof. Dr. Gabriele Helga Franke
4.2 Grundlagen der Testtheorie Wintersemester 2008 / 2009 Hochschule Magdeburg-Stendal (FH) Frau Prof. Dr. Gabriele Helga Franke GHF im WiSe 2008 / 2009 an der HS MD-SDL(FH) im Studiengang Rehabilitationspsychologie,
MehrEinführung in die Test- und Fragebogenkonstruktion
Markus Bühner Einführung in die Test- und Fragebogenkonstruktion 3., aktualisierte und erweiterte Auflage ein Imprint von Pearson Education München Boston San Francisco Harlow, England Don Mills, Ontario
Mehr3.Wiederholung: Toleranzbereiche Für EX Geg:
3.Wiederholung: Toleranzbereiche Für EX Geg: Vl. 24.2.2017 Schätzfunktion für Güte: Ist X Problem: Feb 17 13:21 > Wir berechnen Bereiche (Toleranzbereiche) für sind untere und obere Grenzen, berechnet
MehrÜberblick über die ProbabilistischeTesttheorie
Überblick über die ProbabilistischeTesttheorie Schwächen der Klassischen Testtheorie Axiome Theoretische Festlegungen nicht überprüfbar! Einige sind kontraintuitiv und praktisch nicht haltbar Stichprobenabhängigkeit
MehrPsychologische Diagnostik
Dr. Andreas Eickhorst Pädagogische Psychologie Psychologische Diagnostik Themen 1. Was ist Diagnostik? 2. Was ist psychologische Diagnostik? 3. Arten diagnostischer Verfahren 4. Diagnostik in der Schule
MehrSkript zum Kurz-Referat:
Prof. Dr. Klaus-Jürgen Tillmann/ Michael Lenz WS 2001/02 Fakultät für Pädagogik (AG 4) der Universität Bielefeld Seminar: Anlage und : Der pädagogische Streit seit den 50er-Jahren 7. Sitzung: Die Erblichkeit
MehrKlassische Testtheorie (KTT) Klassische Testtheorie (KTT) Klassische Testtheorie (KTT)
Klassische Testtheorie (KTT) Die KTT stellt eine Sammlung von Methoden dar, die seit Beginn des vorigen Jahrhunderts zur exakten und ökonomischen Erfassung interindividueller Unterschiede entwickelt wurden.
MehrTesten von Unterschiedshypothesen mit parametrischen Verfahren Der t-test
Schäfer A & Schöttker-Königer T, Statistik und quantitative Methoden für (2015) Arbeitsblatt 1 SPSS Kapitel 5 Seite 1 Testen von Unterschiedshypothesen mit parametrischen Verfahren Der t-test Im Folgenden
MehrReliabilität. Kapitel 4. Einführung in die Test- und Fragebogenkonstruktion, Pearson Education 2003, Markus Bühner, 1
Reliabilität Kapitel 4 Einführung in die Test- und Fragebogenkonstruktion, Pearson Education 2003, Markus Bühner, 1 Reliabilität Reliabilität gibt den Anteil der Varianz der wahren Werte an der Varianz
MehrGRUNDLAGEN DER TESTTHEORIE
B.Sc. Rehabilitationspsychologie Modul 3.2 WiSe 2013-14 GRUNDLAGEN DER TESTTHEORIE Prof. Dr. habil. Gabriele Helga Franke E-Mail: gabriele.franke@hs-magdeburg.de Internet: www.franke-stendal.de Sprechstunde:
MehrGrundlagen sportwissenschaftlicher Forschung Test
Grundlagen sportwissenschaftlicher Forschung Test Dr. Jan-Peter Brückner jpbrueckner@email.uni-kiel.de R.216 Tel. 880 4717 Was ist Messen? Grundlagen des Messens Zuordnen von Objekten (oder Ereignissen)
Mehr7.2 Mittelwert einer Stichprobe
66 7.2 Mittelwert einer Stichprobe Gegeben ist eine normalverteilte Grundgesamtheit. Mit Hilfe einer Stichprobe möchten wir Aussagen über den unbekannten Mittelwert µ dieser Grundgesamtheit machen. Wenn
MehrMethodenlehre. Vorlesung 10. Prof. Dr. Björn Rasch, Cognitive Biopsychology and Methods University of Fribourg
Methodenlehre Vorlesung 10 Prof. Dr., Cognitive Biopsychology and Methods University of Fribourg 1 Methodenlehre II Woche Datum Thema 1 FQ Einführung, Verteilung der Termine 1 18.2.15 Psychologie als Wissenschaft
MehrSPSS-Beispiel zu Kapitel 6: Methoden der Reliabilitätsbestimmung 1
SPSS-Beispiel zu Kapitel 6: Methoden der Reliabilitätsbestimmung 1 Karin Schermelleh-Engel & Christina S. Werner Inhaltsverzeichnis 1 Empirischer Datensatz... 1 2 Interne Konsistenz... 2 3 Split-Half-Reliabilität...
MehrWinter 2017 David Kurbel. Evaluation & Forschungsstrategien. B.Sc.-Seminar. Sitzung II: t-tests
Evaluation & Forschungsstrategien B.Sc.-Seminar Sitzung : t-tests Seminarinhalte Sitzung : 25.10.2017 1-Stichproben-t-Test (gerichtet) 1-Stichproben-t-Test (ungerichtet) t-test für abhängige Stichproben
MehrObjektivität und Validität. Testgütekriterien. Objektivität. Validität. Reliabilität. Objektivität
Objektivität und Objektivität: Inwieweit ist das Testergebnis unabhängig von externen Einflüssen Effekte des Versuchsleiters, Auswertung, Situation, Itemauswahl : Inwieweit misst der Test das, was er messen
MehrStatistik für Naturwissenschaftler
Hans Walser Statistik für Naturwissenschaftler 9 t-verteilung Lernumgebung Hans Walser: 9 t-verteilung ii Inhalt 1 99%-Vertrauensintervall... 1 2 95%-Vertrauensintervall... 1 3 Akkus... 2 4 Wer ist der
MehrWahrscheinlichkeit und Statistik BSc D-INFK
Prof. Dr. P. Bühlmann ETH Zürich Sommer 2010 Wahrscheinlichkeit und Statistik BSc D-INFK 1. (10 Punkte) Bei den folgenden 10 Fragen ist jeweils genau eine Antwort richtig. Es gibt pro richtig beantwortete
Mehr3 Evaluation als Beschreibung von Zuständen
Evaluation als Beschreibung von Zuständen 1 Sind die folgenden Aussagen richtig oder falsch? 1.1 In einer Klumpenstichprobe werden systematisch anfallende Cluster von Personen vollständig untersucht. Die
MehrVorlesung Testtheorien. Dr. Tobias Constantin Haupt, MBA Sommersemester 2007
Vorlesung Testtheorien Dr. Tobias Constantin Haupt, MBA Sommersemester 2007 Konstruktvalidität: MTMM # 2 Konstruktvalidität: MTMM # 3 Konstruktvalidität: Probleme der MTMM Die Analysekriterien der MTMM
MehrKlassifikation von Signifikanztests
Klassifikation von Signifikanztests nach Verteilungsannahmen: verteilungsabhängige = parametrische Tests verteilungsunabhängige = nichtparametrische Tests Bei parametrischen Tests werden im Modell Voraussetzungen
MehrFallzahlplanung bei unabhängigen Stichproben
Fallzahlplanung bei unabhängigen Stichproben Seminar Aktuelle biometrische Probleme Benjamin Hofner benjamin.hofner@stat.uni-muenchen.de 12. Januar 2005 Übersicht 1. Einführung und Grundlagen der Fallzahlplanung
MehrTests. Eine Einführung
Eine Einführung Dr. Uwe Wiest, Delmenhorst 2005, 2018 Testaufgaben Wozu der ganze Umstand? Sauber konstruierte und normierte Tests erlauben es, über die Leistungsfähigkeit einer Person in einem definierten
MehrWie schreibe ich ein wissenschaftliches Experiment?
Methodenlehre Vorlesung 5 Prof. Dr., Cognitive Biopsychology and Methods University of Fribourg 1 Methodenlehre II Woche Datum Thema 1 FQ Einführung, Verteilung der Termine 1 18.2.15 Psychologie als Wissenschaft
MehrBeispielberechnung Normierung
1 Beispielberechnung Normierung Auszug Kursunterlagen MAS ZFH in Berufs-, Studien- und Laufbahnberatung Prof. Dr. Marc Schreiber, Dezember 2016 Verschiedene Formen der Normierung (interaktiv) Referenz:
MehrAuswertung und Lösung
Dieses Quiz soll Ihnen helfen, Kapitel 3.2.2 bis 3.3 besser zu verstehen. Auswertung und Lösung Abgaben: 81 / 265 Maximal erreichte Punktzahl: 7 Minimal erreichte Punktzahl: 0 Durchschnitt: 4.28 Frage
MehrE i n z e l f a l l s t u d i e n u n d K o m p a r a t i o n s f o r s c h u n g. Beispiele für i d i o g r a p h i s c h e Methoden
E i n z e l f a l l s t u d i e n u n d K o m p a r a t i o n s f o r s c h u n g Ausgangspunkt: Die M i t t e l w e r t s fa l l e Experiment nomothetische Zielsetzung Prüfung von Aggregathypothesen durchschnittliche
MehrMethodenlehre. Vorlesung 12. Prof. Dr. Björn Rasch, Cognitive Biopsychology and Methods University of Fribourg
Methodenlehre Vorlesung 12 Prof. Dr., Cognitive Biopsychology and Methods University of Fribourg 1 Methodenlehre I Woche Datum Thema 1 FQ Einführung, Verteilung der Termine 1 25.9.13 Psychologie als Wissenschaft
MehrAufgabenblock 4. Da Körpergröße normalverteilt ist, erhalten wir aus der Tabelle der t-verteilung bei df = 19 und α = 0.05 den Wert t 19,97.
Aufgabenblock 4 Aufgabe ) Da s = 8. cm nur eine Schätzung für die Streuung der Population ist, müssen wir den geschätzten Standardfehler verwenden. Dieser berechnet sich als n s s 8. ˆ = = =.88. ( n )
MehrBrückenkurs Statistik für Wirtschaftswissenschaften
Peter von der Lippe Brückenkurs Statistik für Wirtschaftswissenschaften Weitere Übungsfragen UVK Verlagsgesellschaft mbh Konstanz Mit UVK/Lucius München UVK Verlagsgesellschaft mbh Konstanz und München
Mehr5. Seminar Statistik
Sandra Schlick Seite 1 5. Seminar 5. Seminar Statistik 30 Kurztest 4 45 Testen von Hypothesen inkl. Übungen 45 Test- und Prüfverfahren inkl. Übungen 45 Repetitorium und Prüfungsvorbereitung 15 Kursevaluation
MehrStatistisches Testen
Statistisches Testen Grundlegendes Prinzip Erwartungswert Bekannte Varianz Unbekannte Varianz Differenzen Anteilswert Chi-Quadrat Tests Gleichheit von Varianzen Prinzip des Statistischen Tests Konfidenzintervall
MehrForschungsmethoden VORLESUNG SS 2017
Forschungsmethoden VORLESUNG SS 2017 SOPHIE LUKES Überblick Letzte Woche: - Gütekriterien I Heute: -Gütekriterien II Rückblick Gütekriterien der qualitativen Forschung Gütekriterien der quantitativen Forschung:
Mehr3 Konfidenzintervalle
3 Konfidenzintervalle Konfidenzintervalle sind das Ergebnis von Intervallschätzungen. Sicheres Wissen über Grundgesamtheiten kann man anhand von Stichproben nicht gewinnen. Aber mit Hilfe der Statistik
MehrParametrische vs. Non-Parametrische Testverfahren
Parametrische vs. Non-Parametrische Testverfahren Parametrische Verfahren haben die Besonderheit, dass sie auf Annahmen zur Verteilung der Messwerte in der Population beruhen: die Messwerte sollten einer
MehrGütekriterien von Messungen
Gütekriterien Messungen 1. Hauptgütekriterien 2. Nebengütekriterien Ökonomie Unter einer Messung (Prüfung) versteht man den Grad, in dem die Ergebnisse einer Messung (Prüfung) unab-hängig den Untersuchern
MehrForschungsmethoden VORLESUNG WS 2017/2018
Forschungsmethoden VORLESUNG WS 2017/2018 SOPHIE LUKES Überblick Letzte Sitzung: - Gütekriterien I Heute: -Gütekriterien II Rückblick Gütekriterien der qualitativen Forschung Gütekriterien der quantitativen
MehrMacht des statistischen Tests (power)
Macht des statistischen Tests (power) Realer Treatment ja Ergebnis der Studie H 0 verworfen statistisch signifikant O.K. Macht H 0 beibehalten statistisch nicht signifikant -Fehler Effekt nein -Fehler
MehrMethodenlehre. Vorlesung 13. Prof. Dr. Björn Rasch, Cognitive Biopsychology and Methods University of Fribourg
Methodenlehre Vorlesung 13 Prof. Dr., Cognitive Biopsychology and Methods University of Fribourg 1 19.05.15 Methodenlehre II Woche Datum Thema 1 FQ Einführung, Verteilung der Termine 1 18.2.15 Psychologie
MehrÜbung zur Vorlesung Statistik I WS Übungsblatt 12
Übung zur Vorlesung Statistik I WS 2013-2014 Übungsblatt 12 20. Januar 2014 Die folgenden ufgaben sind aus ehemaligen Klausuren! ufgabe 38.1 (1 Punkt: In einer Studie werden 10 Patienten therapiert. Die
MehrPrüfung aus Statistik 2 für SoziologInnen
Prüfung aus Statistik 2 für SoziologInnen 11. Oktober 2013 Gesamtpunktezahl =80 Name in Blockbuchstaben: Matrikelnummer: Wissenstest (maximal 16 Punkte) Kreuzen ( ) Sie die jeweils richtige Antwort an.
MehrWahrscheinlichkeit 1-α: richtige Entscheidung - wahrer Sachverhalt stimmt mit Testergebnis überein. Wahrscheinlichkeit α: falsche Entscheidung -
wahrer Sachverhalt: Palette ist gut Palette ist schlecht Entscheidung des Tests: T K; Annehmen von H0 ("gute Palette") positive T > K; Ablehnen von H0 ("schlechte Palette") negative Wahrscheinlichkeit
MehrStochastik (BSc D-MAVT / BSc D-MATH / BSc D-MATL)
Prof. Dr. P. Embrechts ETH Zürich Winter 2009 Stochastik (BSc D-MAVT / BSc D-MATH / BSc D-MATL) Schreiben Sie für Aufgabe 2-4 stets alle Zwischenschritte und -rechnungen sowie Begründungen auf. Aufgabe
MehrMesstherorie Definitionen
Messtherorie Definitionen Begriff Definition Beispiel Relationen Empirisches Relativ eine Menge von Objekten und ein oder mehreren beobachtbaren Relationen zwischen dieses Objekten Menge der Objekte =
MehrLiteratur: Glantz, S.A. (2002). Primer of Biostatistics. New York: McGraw-Hill.
Statistik Literatur: Glantz, S.A. (2002). Primer of Biostatistics. New York: McGraw-Hill. Maxwell, S.E. & Delaney, H.D. (2000). Designing Experiments and Analyzing Data. Mahwah, NJ: Erlbaum. Das Grundproblem
MehrKlassische Testtheorie (KTT) Klassische Testtheorie (KTT) Klassische Testtheorie (KTT)
Klassische Testtheorie (KTT) Die KTT stellt eine Sammlung von Methoden dar, die seit Beginn des vorigen Jahrhunderts zur exakten und ökonomischen Erfassung interindividueller Unterschiede entwickelt wurden.
MehrWebergänzung Kapitel 6.5.3: Tests
Webergänzung Kapitel 6.5.3: Tests Das Kapitel Tests wurde im Buch in den wichtigsten Zügen dargestellt, wobei der Blick vor allem auf die Anwendung von Sprachtests in einer experimentellen Untersuchung
MehrWahrscheinlichkeit und Statistik BSc D-INFK
Prof. Dr. P. Bühlmann ETH Zürich Winter 2010 Wahrscheinlichkeit und Statistik BSc D-INFK 1. (10 Punkte) Bei den folgenden 10 Fragen ist jeweils genau eine Antwort richtig. Es gibt pro richtig beantwortete
MehrPsychologische Diagnostik
Psychologische Diagnostik von Andre Beauducel und Anja Leue '> -HpGREFE GÖTTINCEN BERN WIEN PARIS OXFORD PRAG TORONTO BOSTON AMSTERDAM KOPENHAGEN STOCKHOLM FLORENZ - HELSINKI Inhaltsverzeichnis Vorwort
MehrAuswertung und Lösung
Dieses Quiz soll Ihnen helfen, Kapitel 4.6 und 4.7 besser zu verstehen. Auswertung und Lösung Abgaben: 59 / 265 Maximal erreichte Punktzahl: 8 Minimal erreichte Punktzahl: 0 Durchschnitt: 4.78 1 Frage
MehrWie liest man Konfidenzintervalle? Teil I. Premiu m
Wie liest man Konfidenzintervalle? Teil I Premiu m Was sind Konfidenzintervalle? Ein Konfidenzintervall (KI) ist ein Maß für die Unsicherheit bezüglich einer Schätzung eines Effekts. Es ist ein Intervall
MehrInsights Learning & Development. Reliabilität und Validität des Insights Discovery Präferenz-Evaluators in der deutschen Version
Insights Learning & Development Reliabilität und Validität des Insights Discovery Präferenz-Evaluators in der deutschen Version Analysiert von Qiong Yang Zusammengestellt vom Insights Research Team Mai
MehrSonderanhang: Manuelle Berechnungen der Statistikaufgaben
Albert/Marx 0: Empirisches Arbeiten Sonderanhang: Manuelle Berechnungen der Statistikaufgaben Kaum jemand führt heutzutage statistische Berechnungen noch von Hand durch, weil es sehr viele Computerprogramme
MehrTrim Size: 176mm x 240mm Lipow ftoc.tex V1 - March 9, :34 P.M. Page 11. Über die Übersetzerin 9. Einleitung 19
Trim Size: 176mm x 240mm Lipow ftoc.tex V1 - March 9, 2016 6:34 P.M. Page 11 Inhaltsverzeichnis Über die Übersetzerin 9 Einleitung 19 Was Sie hier finden werden 19 Wie dieses Arbeitsbuch aufgebaut ist
MehrStatistik II Übung 4: Skalierung und asymptotische Eigenschaften
Statistik II Übung 4: Skalierung und asymptotische Eigenschaften Diese Übung beschäftigt sich mit der Skalierung von Variablen in Regressionsanalysen und mit asymptotischen Eigenschaften von OLS. Verwenden
MehrVergleich von Parametern zweier Stichproben
Vergleich von Parametern zweier Stichproben Vergleich von Mittelwerten bei gebundenen Stichproben Vergleich von Mittelwerten bei unabhängigen Stichproben Vergleich von Varianzen bei unabhängigen Stichproben
MehrInhaltsverzeichnis. Vorwort zur 3. Auflage 11
Vorwort zur 3. Auflage 11 Kapitel 1 Einführung 13 1.1 Ziel des Buches 14 1.2 Testanwendungsbereiche 18 1.3 Arten von Tests 20 1.3.1 Raven Progressive Matrices 23 1.3.2 NEO-FFI und NEO-PI-R 24 1.3.3 Thematischer
MehrVorlesung Testtheorien (Fragestunde)
Vorlesung Testtheorien (Fragestunde) Dr. Tobias Constantin Haupt, MBA Sommersemester 007 Hinweis: sämtliche Klausuren auf die hier Bezug genommen wird finden Sie unter www.haupt-uni.de Klausurteil II:
MehrKontrolle und Aufbereitung der Daten. Peter Wilhelm Herbstsemester 2014
Kontrolle und Aufbereitung der Daten Peter Wilhelm Herbstsemester 2014 Übersicht 1.) Kontrolle und Aufbereitung der Daten Fehlerkontrolle Umgang mit Missing 2.) Berechnung von Skalen- und Summenscores
MehrEine Skala ist also Messinstrument, im einfachsten Fall besteht diese aus einem Item
KONSTRUKTION UND ANALYSE VON SKALEN Ziel Skalen und Tests Systematisierung von Tests Itemarten Skalenarten im Detail Die Likert Skala Skala: Eine Skala ist ein Instrument zur Messung von (theoretischen)
MehrTeil VIII. Zentraler Grenzwertsatz und Vertrauensintervalle. Woche 6: Zentraler Grenzwertsatz und Vertrauensintervalle. Lernziele. Typische Situation
Woche 6: Zentraler Grenzwertsatz und Vertrauensintervalle Patric Müller ETHZ Teil VIII Zentraler Grenzwertsatz und Vertrauensintervalle WBL 17/19, 29.05.2017 Wahrscheinlichkeit
Mehr8. Konfidenzintervalle und Hypothesentests
8. Konfidenzintervalle und Hypothesentests Dr. Antje Kiesel Institut für Angewandte Mathematik WS 2011/2012 Beispiel. Sie wollen den durchschnittlichen Fruchtsaftgehalt eines bestimmten Orangennektars
MehrForschungsstatistik I
Prof. Dr. G. Meinhardt. Stock, Taubertsberg R. 0-0 (Persike) R. 0-1 (Meinhardt) Sprechstunde jederzeit nach Vereinbarung Forschungsstatistik I Dr. Malte Persike persike@uni-mainz.de http://psymet0.sowi.uni-mainz.de/
MehrMSP Musterlösung. Name, Nummer: Datum: 12. Juli Energie eines Super-Kondensators 2Y6HUB
WST donat.adams@fhnw.ch IMN MSP Musterlösung Name, Nummer: Datum: 1. Juli 017 1. Energie eines Super-Kondensators Y6HUB An einer Sendung von Super-Kondensatoren mit Energie-Gehalt E = 1 C U wurden folgende
MehrStatistik III Regressionsanalyse, Varianzanalyse und Verfahren bei Messwiederholung mit SPSS
Statistik III Regressionsanalyse, Varianzanalyse und Verfahren bei Messwiederholung mit SPSS Verena Hofmann Dr. phil. des. Departement für Sonderpädagogik Universität Freiburg Petrus-Kanisius-Gasse 21
MehrStatistische Methoden in den Umweltwissenschaften
Statistische Methoden in den Umweltwissenschaften t-test Varianzanalyse (ANOVA) Übersicht Vergleich von Mittelwerten 2 Gruppen: t-test einfaktorielle ANOVA > 2 Gruppen: einfaktorielle ANOVA Seeigel und
MehrStatistik II für Betriebswirte Vorlesung 1
Statistik II für Betriebswirte Vorlesung 1 Dr. Andreas Wünsche TU Bergakademie Freiberg Institut für Stochastik 16. Oktober 2017 Dr. Andreas Wünsche Statistik II für Betriebswirte Vorlesung 1 Version:
Mehr