Gütekriterien. Gütekriterien. Gütekriterien. Reliabilität Validität. Spezifität. Sensitivität. Praktikabilität.
|
|
- Oldwig Biermann
- vor 7 Jahren
- Abrufe
Transkript
1 Reliabilität Validität Sensitivität Spezifität Objektivität Praktikabilität 1 bei quantitativen Studien: Objektivität Durchführung, Auswertung, Interpretation ist unabhängig vom Untersucher Reliabilität Maß für Messgenauigkeit ( Fehlereinflüsse) Validität (!) Maß für Genauigkeit wird tatsächlich gemessen, was gemessen werden soll? Praktikabilität einfache Durchführung, zeit- und kostensparend 2 Objektivität Durchführung, Auswertung, Interpretation ist unabhängig vom Untersucher es sollen dieselben Ergebnisse entstehen, egal wer die Studie durchführt Unabhängigkeit der Untersuchung von subjektiven Einflüssen (Untersucher darf keinen Einfluss auf Ergebnisse haben) möglichst weitreichende Kontrolle von Störeinflüssen Standardisierung des Studiendesigns! Beispiel: Mangelnde Objektivität wäre gegeben, wenn Untersuchungen zur Arbeitszufriedenheit in einem Pflegebereich z.b. (nicht anonymisiert) von der Pflegedienstleitung durchgeführt würden. 3 1
2 Reliabilität Maß für Messgenauigkeit ( Fehlereinflüsse) formale Genauigkeit wissenschaftlicher Studien Messfehler jeder Art sind (möglichst) auszuschließen, Ergebnisse sind reproduzierbar rechnerische Überprüfung durch Reliabilitätskoeffizienten kein Rückschluss von Reliabilität auf Validität! Beispiel: Mangelnde Reliabilität wäre gegeben, wenn Untersuchungen zum BMI von Patient(inn)en bei fünf direkt aufeinander folgenden Messungen ein unterschiedliches Gewicht ergeben (Messinstrument = Waage ist nicht reliabel) Test-Retest-Reliabilität (Stabilität) Ausmaß der Übereinstimmung bei mehrfacher Anwendung von Messinstrumenten oder Erhebungsmethoden zu unterschiedlichen Zeitpunkten und unter ansonsten gleichen Bedingungen wird durch Korrelationskoeffizienten bestimmt hohe/geringe Korrelation = hohe/geringe Reliabilität Achtung: Messwiederholung ist davon abhängig, dass - sich die zu messende Größe nicht kurzfristig verändert (Pflegeabhängigkeit + / Schmerzmessung - ) - keine Erinnerungs-/Lerneffekte auftreten (Assessments) 5 Split-Half-Reliabilität Ausmaß der Übereinstimmung von (vergleichbaren) Teilen/ Hälften eines Messinstrumentes zu demselben Zeitpunkten und unter ansonsten gleichen Bedingungen Hälften werden als zeitgleiche Messwiederholungen betrachtet Berechnung durch (korrigierte) Korrelationskoeffizienten Achtung: abhängig von der jeweiligen Aufteilung (Split)! 6 2
3 Paralleltest-Reliabilität Ausmaß der Übereinstimmung von vergleichbaren Messinstrumenten (Tests) zu demselben Zeitpunkten und unter ansonsten gleichen Bedingungen Berechnung durch Korrelationskoeffizienten Achtung: abhängig von tatsächlich vergleichbaren Tests! 7 Interrater-Reliabilität (Objektivität) Ausmaß der Übereinstimmung bei mehrfacher Anwendung von Messinstrumenten oder Erhebungsmethoden durch unterschiedliche Untersucher (Rater) wird durch Korrelationskoeffizienten bestimmt hohe/geringe Korrelation = hohe/geringe Reliabilität Hinweis: bei mehr als zwei Untersuchern: Intra-Class-Korrelationskoeffizient bei nominalen Daten: Kappa-Koeffizient Mayer, H. et. al (200). "Qualitätskriterien von Assessmentinstrumenten - Cohen's Kappa als Maß der Interrater- Reliabilität", in: Pflege (Zeitschrift), 17(1):36-6 Fleiss, J. L. & Cohen, J. (1973). The equivalence of weighted kappa and the intraclass correlation coefficient as measures of reliability. Educational and Psychological Measurement 33, Wirtz, M. & Caspar, F. (2002).Beurteilerübereinstimmung und Beurteilerreliabilität. Göttingen: Hogrefe. 8 Intrarater-Reliabilität Ausmaß der Übereinstimmung bei mehrfacher Anwendung von Messinstrumenten oder Erhebungsmethoden durch identischen Untersucher (Rater) wird durch Korrelationskoeffizienten bestimmt hohe/geringe Korrelation = hohe/geringe Reliabilität. Wirtz, M. & Caspar, F. (2002).Beurteilerübereinstimmung und Beurteilerreliabilität. Göttingen: Hogrefe. 9 3
4 Interne Konsistenz Ausmaß der Übereinstimmung zwischen den einzelnen Items eines Instrumentes und der Gesamtheit der übrigen Items (Mehrdimensionalität!) bei (einfacher) Anwendung durch einen Untersucher wird durch Cronbachs Alpha bestimmt hohe/geringe Werte = hohe/geringe Konsistenz (max. +1). nr α = ( 1+ r( n 1)) n = Anzahl Items, ř = Mittelwert aus allen bivariaten Korrelationen zwischen den Items 10 Validität (!) Maß für Genauigkeit wird tatsächlich gemessen, was gemessen werden soll? liegt vor, wenn die gewählten Items wirklich und präzise messen, was gemessen werden soll und keine verwandten oder andere Konstrukte abbilden es existieren verschiedene Konzepte/Zugänge Beispiel: Mangelnde Validität wäre gegeben, wenn Untersuchungen zur allgemeinen gesundheitlichen Situation z.b. nur auf der Messung des Blutdrucks basieren würden. 11 Validität: interne Validität (= Eindeutigkeit) studienbezogen Ergebnisse sind eindeutig interpretierbar, es gibt keine plausibleren, alternativen Erklärungen Ausmaß der Übereinstimmung bei mehrfacher Anwendung Schlussfolgerung auf einen Zusammenhang zwischen der abhängigen Variablen und der/den unabhängigen Variablen ist zulässig Mögliche Einflussfaktoren, die die interne V. gefährden können, sind: externe zeitliche Einflüsse (es wirken andere Einflussfaktoren zeitlich bedingt) Reifungsprozesse (Teilnehmer verändern sich und damit auch Ergebnisse) Testübung (Trainingseffekte) mangelnde instrumentelle Reliabilität (verwendetes Instrument ist nicht reliabel) statistische Regressionseffekte (keine Verwendung von Zufallsstichproben) Selektionseffekte (keine Randomisierung, Selbstselektion) vgl. Bortz & Döring: Forschungsmethoden und Evaluation 12
5 Validität: externe Validität studienbezogen Ergebnisse können auf andere vergleichbare Situationen / Bereiche / Gruppen übertragen / generalisiert werden ist abhängig von Repräsentativität der untersuchten Gruppe Mögliche Einflussfaktoren, die die externe V. gefährden können, sind: mangelnde instrumentelle Validität (Validität hängt immer auch vom Kontext ab!) Stichprobenfehler (mangelnde Repräsentativität) Pretest-Effekte (Teilnehmer verändern Einstellungen aufgrund von Pretest) Hawthorne-Effekte (Bewusstsein einer Studie verändert Verhalten) vgl. Bortz & Döring: Forschungsmethoden und Evaluation 13 Validität: Inhaltsvalidität (content validity - instrumentbezogen) wird auch als face validity oder Augenscheinvalidität bezeichnet manchmal auch als innere Validität misst, inwieweit das Test-Item das zu messende Konstrukt erfasst durch (einzelne) Messungen (Items) erfasste Inhalte erfassen das relevante Phänomen möglichst in allen Aspekten Gültigkeit der Messung geht aus den einzelnen Teilen des hervor beruht nur auf Einschätzungen, wird nicht numerisch bestimmt Experten bewerten, inwieweit bzw wie gut die einzelnen Items (Fragen) das zu untersuchende Konstrukt abdecken Konzept ist vor allem auf Tests und Fragebögen anwendbar hohe face-validity manchmal nicht erwünscht -> soziale Erwünschtheit (Fragen werden nicht ehrlich beantwortet sensible Themen) 1 Validität: Kriteriumsvalidität (criterion-related validity instrumentbezogen) Übereinstimmung eines Messinstruments mit anderen relevanten Merkmalen (Außenkriterien) spielt in der Praxis eine wichtige Rolle, ist aber von einem brauchbaren Außenkriterium abhängig gutes Außenkriterium oft schwierig / nicht vorhanden Unterscheidung zwischen der Übereinstimmungsvalidität (concurrent validity) das Außenkriterium wird gleichzeitig erhoben Goldstandard notwendig Korrelationsmessung (Religiosität -??? Gottesdienstbesuche, Lektüre,???) 15 5
6 Validität: Kriteriumsvalidität (criterion-related validity instrumentbezogen) und der Vorhersagevalidität (predictive validity) das Außenkriterium wird erst später gemessen es wird beurteilt, ob der Test eine gute Vorhersage für späteres Verhalten liefert (z.b. Studieneingangstest späterer Studienerfolg) 16 Validität: Konstruktvalidität (construct validity Instrumentbezogen Übereinstimmung zwischen Instrument und theoretischem Konstrukt es werden Hypothesen über das Konstrukt formuliert und deren Beziehungen untereinander und zum Konstrukt überprüft hohe Konstruktvalidität bedeutet gute empirische Bestätigung dieser Hypothesen z.b. Messung von Einsamkeit korrespondiert mit Selbstwertgefühl, sozialer Ängstlichkeit, Familienstatus oft von besonderer Wichtigkeit geringe Reliabilität geringe Validität hohe Reliabilität geringe Validität... hohe Reliabilität hohe Validität Aus Reliabilität kann nicht auf Validität geschlossen werden! 18 6
7 Praktikabilität gute Instrumente sind objektiv, reliabel, valide und einfach in der Handhabung verständlich zeitsparend kostengünstig 19 Sensitivität (sensitivity) Kriterium zur Güte von Testverfahren beschreibt die Fähigkeit Fälle (z.b. Kranke) auch als solche zu erkennen als erkannt (als krank diagnostiziert) nicht als erkannt (als gesund diagnostiziert) kein ( erkrankt ) ( nicht erkrankt ) richtig positiv falsch positiv falsch negativ richtig negativ 20 Spezifität (specificity) Kriterium zur Güte von Testverfahren beschreibt die Fähigkeit Nicht-Fälle (z.b. Gesunde) auch als solche zu erkennen als erkannt (als krank diagnostiziert) nicht als erkannt (als gesund diagnostiziert) kein ( erkrankt ) ( nicht erkrankt ) richtig positiv falsch positiv falsch negativ richtig negativ 21 7
8 Beispiel Sensitivität / Spezifität Studie zum Dekubitusrisiko Halek & Mayer 2002 kein Originale Norton-Skala Dekubitus kein Dekubitus vorhanden als erkannt richtig positiv falsch positiv 125 Dekubitusrisiko 0 85 nicht als erkannt falsch negativ richtig negativ 21 kein Dekubitusrisiko Sensitivität = 0/ = 0,909 = 90,9% Spezifität = 17/102 = 0,167 = 16,7% je höher diese Werte liegen, desto besser ist ein Instrument 22 Effizienz Anteil aller korrekt klassifizierten Fälle und Nicht-Fälle kein Originale Norton-Skala Dekubitus kein Dekubitus vorhanden als erkannt richtig positiv falsch kein positiv 125 Dekubitusrisiko ( erkrankt ) 0 ( nicht erkrankt ) 85 als nicht als erkannt erkannt richtig falsch positiv negativ richtig falsch positiv negativ 21 (als kein krank Dekubitusrisiko diagnostiziert) 17 nicht als erkannt falsch negativ richtig 102 negativ 16 (als gesund diagnostiziert) Anzahl richtig positiver + Anzahl richtig negativer Effizienz = Gesamtzahl 23 Beispiel Effizienz Studie zum Dekubitusrisiko Halek & Mayer 2002 kein Originale Norton-Skala Dekubitus kein Dekubitus vorhanden als erkannt richtig positiv falsch positiv 125 Dekubitusrisiko 0 85 nicht als erkannt falsch negativ richtig negativ 21 kein Dekubitusrisiko Effizienz = (0+17) / 16 = 0,390 = 39,0% 2 8
9 prädiktive Werte positiv prädiktiver Wert: Wahrscheinlichkeit, bei einem positiven, tatsächlich ein zu sein als erkannt (als krank diagnostiziert) nicht als erkannt (als gesund diagnostiziert) kein ( erkrankt ) ( nicht erkrankt ) richtig positiv falsch positiv falsch negativ richtig negativ Anzahl richtig positiver positiv prädiktiver Wert = ( Anzahl richtig positiver + Anzahl falsch positiver) 25 prädiktive Werte negativ prädiktiver Wert: Wahrscheinlichkeit, bei einem negativen, tatsächlich kein zu sein als erkannt (als krank diagnostiziert) nicht als erkannt (als gesund diagnostiziert) kein ( erkrankt ) ( nicht erkrankt ) richtig positiv falsch positiv falsch negativ richtig negativ Anzahl richtig negativer negativ prädiktiver Wert = ( Anzahl richtig negativer + Anzahl falsch negativer) 26 Beispiel prädiktive Werte Studie zum Dekubitusrisiko Halek & Mayer 2002 kein Originale Norton-Skala Dekubitus kein Dekubitus vorhanden als erkannt richtig positiv falsch positiv 125 Dekubitusrisiko 0 85 nicht als erkannt falsch negativ richtig negativ 21 kein Dekubitusrisiko positiv präd. Wert = 0/125 = 0,320 = 32,0% negativ präd. Wert = 17/21 = 0,810 = 81,0% 27 9
10 ROC-Kurve (ROC = receiver operating curve) Spezifität (Anteil der korrekt klassifizierten Nicht-Fälle (Gesunde)) und Sensitivität (Anteil der korrekt klassifizierten Fälle (Kranke)) sind (ebenso wie die prädiktiven Werte) abhängig davon, wie die Testentscheidung getroffen wird Schwellenwert (cut-off point) Berechnung einer empirische ROC-Kurve: der Schwellenwert durchläuft (fiktiv) den gesamten Bereich möglicher Testwerte, es werden jeweils Sensitivität und Spezifität berechnet Grafische Darstellung von Sensitivität (Anteil der korrekt positiv klassifizierten Fälle ) und 1 Spezifität (Anteil der falsch positiv klassifizierten Fälle ) in einem Koordinatensystem (x-achse = 1 - Spezifität, y-achse = Sensitivität) Kurve kann nur in der linken oberen Hälfte Werte annehmen 28 ROC-Kurve (ROC = receiver operating curve) Idealfall: Sensitivität = 100% 1-Spezifität = 0% (Spezifität = 100%) Worst Case : Sensitivität = 1- Spezifität Vergleich verschiedener Tests: AUC-Kriterium = Fläche unter der ROC-Kurve (0,5 < AUC < 1) Quelle: 29 Links zur Berechnung Diagnostische Tests (Sensitivität, Spezifität, prädiktive Werte) Quelle:
11 Literatur: Brandenburg H, Panfil E & Mayer H (Hrsg.) (2007): Pflegewissenschaft 2. Huber, Bern. Bortz J & Döring N (1995): Forschungsmethoden und Evaluation. 2. Aufl. Springer, Berlin
Gütekriterien HS Sprachstandsdiagnose und Sprachförderung SS2011 Referentin: Meghann Munro
Gütekriterien HS Sprachstandsdiagnose und Sprachförderung SS2011 Referentin: Meghann Munro Vorüberlegungen Wie objektiv ist der Test in seiner Durchführung, Auswertung und Interpretation? Misst das Verfahren
MehrTesttheorie und Gütekriterien von Messinstrumenten. Objektivität Reliabilität Validität
Testtheorie und Gütekriterien von Messinstrumenten Objektivität Reliabilität Validität Genauigkeit von Messungen Jede Messung zielt darauf ab, möglichst exakte und fehlerfreie Messwerte zu erheben. Dennoch
MehrMethodenlehre. Vorlesung 4. Prof. Dr. Björn Rasch, Cognitive Biopsychology and Methods University of Fribourg
Methodenlehre Vorlesung 4 Prof. Dr., Cognitive Biopsychology and Methods University of Fribourg 1 Methodenlehre II Woche Datum Thema 1 FQ Einführung, Verteilung der Termine 1 18.2.15 Psychologie als Wissenschaft
MehrTutorium Testtheorie. Termin 3. Inhalt: WH: Hauptgütekriterien- Reliabilität & Validität. Charlotte Gagern
Tutorium Testtheorie Termin 3 Charlotte Gagern charlotte.gagern@gmx.de Inhalt: WH: Hauptgütekriterien- Reliabilität & Validität 1 Hauptgütekriterien Objektivität Reliabilität Validität 2 Hauptgütekriterien-Reliabilität
MehrForschungsmethoden VORLESUNG WS 2017/2018
Forschungsmethoden VORLESUNG WS 2017/2018 SOPHIE LUKES Überblick Letzte Sitzung: - Gütekriterien I Heute: -Gütekriterien II Rückblick Gütekriterien der qualitativen Forschung Gütekriterien der quantitativen
MehrForschungsmethoden VORLESUNG SS 2017
Forschungsmethoden VORLESUNG SS 2017 SOPHIE LUKES Überblick Letzte Woche: - Gütekriterien I Heute: -Gütekriterien II Rückblick Gütekriterien der qualitativen Forschung Gütekriterien der quantitativen Forschung:
MehrReliabilitäts- und Itemanalyse
Reliabilitäts- und Itemanalyse In vielen Wissenschaftsdisziplinen stellt die möglichst exakte Messung von hypothetischen Prozessen oder Merkmalen sogenannter theoretischer Konstrukte ein wesentliches Problem
MehrEigene MC-Fragen Testgütekriterien (X aus 5) 2. Das Ausmaß der Auswertungsobjektivität lässt sich in welcher statistischen Kennzahl angeben?
Eigene MC-Fragen Testgütekriterien (X aus 5) 1. Wenn verschieden Testanwender bei Testpersonen mit demselben Testwert zu denselben Schlussfolgerungen kommen, entspricht dies dem Gütekriterium a) Durchführungsobjektivität
MehrEine Skala ist also Messinstrument, im einfachsten Fall besteht diese aus einem Item
KONSTRUKTION UND ANALYSE VON SKALEN Ziel Skalen und Tests Systematisierung von Tests Itemarten Skalenarten im Detail Die Likert Skala Skala: Eine Skala ist ein Instrument zur Messung von (theoretischen)
MehrObjektivität und Validität. Testgütekriterien. Objektivität. Validität. Reliabilität. Objektivität
Objektivität und Objektivität: Inwieweit ist das Testergebnis unabhängig von externen Einflüssen Effekte des Versuchsleiters, Auswertung, Situation, Itemauswahl : Inwieweit misst der Test das, was er messen
MehrEinführung in die Statistik Testgütekriterien
Professur Psychologie digitaler Lernmedien Institut für Medienforschung Philosophische Fakultät Einführung in die Statistik Testgütekriterien Überblick Einleitung Objektivität Reliabilität Validität Nebengütekriterien
MehrGLIEDERUNG Das Messen eine Umschreibung Skalenniveaus von Variablen Drei Gütekriterien von Messungen Konstruierte Skalen in den Sozialwissenschaften
TEIL 3: MESSEN UND SKALIEREN GLIEDERUNG Das Messen eine Umschreibung Skalenniveaus von Variablen Drei Gütekriterien von Messungen Objektivität Reliabilität Validität Konstruierte Skalen in den Sozialwissenschaften
MehrWelche Gütekriterien sind bei der Bewertung von Lernleistungen
Welche Gütekriterien sind bei der Bewertung von Lernleistungen wichtig? Anne Spensberger; Ramona Dutschke; überarbeitet von Susanne Narciss Eine gerechte Bewertung von Lernleistungen setzt voraus, dass
MehrForschungsmethoden VORLESUNG WS 2017/2018
Forschungsmethoden VORLESUNG WS 2017/2018 SOPHIE LUKES Überblick Letzte Woche: - Stichprobenziehung und Stichprobeneffekte Heute: -Gütekriterien I Rückblick Population und Stichprobe verschiedene Arten
Mehr= = =0,2=20% 25 Plätze Zufallsübereinstimmung: 0.80 x x 0.20 = %
allgemein Klassifizierung nach Persönlichkeitseigenschaften Messung von Persönlichkeitseigenschaften Zuordnung von Objekten zu Zahlen, so dass die Beziehungen zwischen den Zahlen den Beziehungen zwischen
MehrRETESTRELIABILITÄT. Teststabilität. Korrelation wiederholter Testdurchführungen. Persönlichkeitstests. Stabilität des Zielmerkmals.
Basiert auf RETESTRELIABILITÄT Wird auch genannt Teststabilität Geeignet für Korrelation wiederholter Testdurchführungen Abhängig von beeinflusst Stabilität des Zielmerkmals Persönlichkeitstests Speedtests
MehrGlossar. Cause of Effects Behandelt die Ursache von Auswirkungen. Debriefing Vorgang der Nachbesprechung der experimentellen Untersuchung.
Abhängige Variable Die zu untersuchende Variable, die von den unabhängigen Variablen in ihrer Ausprägung verändert und beeinflusst wird (siehe auch unabhängige Variable). Between-Subjects-Design Wenn die
MehrForschungsmethoden VORLESUNG SS 2017
Forschungsmethoden VORLESUNG SS 2017 SOPHIE LUKES Überblick Letzte Woche: - Stichprobenziehung und Stichprobeneffekte Heute: -Gütekriterien I Rückblick Population und Stichprobe verschiedene Arten der
MehrDr. Barbara Lindemann. Fragebogen. Kolloquium zur Externen Praxisphase. Dr. Barbara Lindemann 1
Dr. Barbara Lindemann Fragebogen Kolloquium zur Externen Praxisphase Dr. Barbara Lindemann 1 Überblick 1. Gütekriterien quantitativer Forschungen 2. Fragebogenkonstruktion 3. Statistische Datenanalyse
MehrT E S T G Ü T E K R I T E R I E N W O R K S H O P I N F R E I B U R G N O V E M B E R
Testen und Prüfen T E S T G Ü T E K R I T E R I E N W O R K S H O P I N F R E I B U R G N O V E M B E R 2 0 1 4 Testen und Prüfen Testgütekriterien Folgende Fragen sollten Sie am Ende des Vortrags beantworten
MehrDr. Heidemarie Keller
Reliabilität und Validität der deutschen Version der OPTION Scale Dr. Heidemarie Keller Abteilung für Allgemeinmedizin, Präventive und Rehabilitative Medizin Philipps-Universität Marburg EbM & Individualisierte
MehrKodierbogen zur Beurteilung von psychometrischen Eigenschaften (Reliabilität und Validität) diagnostischer Selbst- und Fremdbeurteilungsverfahren
Schriftenreihe des Instituts für Prävention und psychosoziale Gesundheitsforschung (Nr. 04/P) Kodierbogen zur Beurteilung von psychometrischen Eigenschaften (Reliabilität und Validität) diagnostischer
MehrStandardisierte Vorgehensweisen und Regeln zur Gewährleistung von: Eindeutigkeit Schlussfolgerungen aus empirischen Befunden sind nur dann zwingend
Standardisierte Vorgehensweisen und Regeln zur Gewährleistung von: Eindeutigkeit Schlussfolgerungen aus empirischen Befunden sind nur dann zwingend oder eindeutig, wenn keine alternativen Interpretationsmöglichkeiten
MehrEmpirische Forschung. Übung zur Vorlesung Kognitive Modellierung. Kognitive Modellierung Dorothea Knopp Angewandte Informatik/ Kognitve Systeme
Empirische Forschung Übung zur Vorlesung Kognitive Modellierung S. 1 Gliederung 1. Was ist empirische Forschung? 2. Empirie Theorie 3. Gütekriterien empirischer Forschung 4. Sammlung von Daten 5. Beschreibung
MehrEffektstärken Nachtrag
Effektstärken Nachtrag Benchmarks für Effektstärken gehen auf Cohen (1988) zurück, nimmt man statistische Hintergründe der Berechnung und Umrechnung ernst, sind Angaben jedoch teilweise inkonsistent (vgl.
MehrGütekriterien: Validität (15.5.)
Gütekriterien: Validität (15.5.) Besprechung der Hausaufgaben Validität: Arten und Schätzmethoden Inhaltsvalidität Empirische Validität Konstruktvalidität Testfairness Normierung Nebengütekriterien Zusammenfassung
MehrMethode der Naturwissenschaften
Methode der Naturwissenschaften Die Naturwissenschaften arbeiten auf der Basis der Empirie. Die empirische Methode bezieht sich auf Phänomene und Wirklichkeiten, die messbar (feststellen, zählen, wiegen,
MehrDozent: Dawid Bekalarczyk Universität Duisburg-Essen Fachbereich Gesellschaftswissenschaften Institut für Soziologie Lehrstuhl für empirische
TEIL 3: MESSEN UND SKALIEREN 1 Das Messen eine Umschreibung Feststellung der Merkmalsausprägungen von Untersuchungseinheiten (z.b. Feststellung, wie viel eine Person wiegt oder Feststellung, wie aggressiv
MehrWATCHING YOUR STEP - Clinical Trial Process
WATCHING YOUR STEP - Clinical Trial Process Kritische Bewertung wissenschaftlicher Literatur Bewertung einer quantitativen Querschnittstudie über die Anwendung von Forschungsergebnissen in der Pflegepraxis
Mehr3.2 Grundlagen der Testtheorie Methoden der Reliabilitätsbestimmung
3.2 Grundlagen der Testtheorie 3.2.6 Methoden der Reliabilitätsbestimmung 6.1 Was ist Reliabilität? 6.2 Retest-Reliabilität 6.3 Paralleltest-Reliabilität 6.4 Splithalf-(Testhalbierungs-)Reliabilität 6.5
MehrGrundlagen der Statistik
Grundlagen der Statistik Übung 6 2009 FernUniversität in Hagen Alle Rechte vorbehalten Fakultät für Wirtschaftswissenschaft Übersicht über die mit den insendeaufgaben geprüften Lehrzielgruppen Lehrzielgruppe:
MehrGütekriterien für evaluative Messinstrumente in der Rehabilitation
12. Rehabilitationswissenschaftliches Kolloquium Rehabilitation im Gesundheitssystem Bad Kreuznach, 10. bis 12. März 2003 Gütekriterien für evaluative Messinstrumente in der Rehabilitation Dipl.-Psych.
MehrDas Minimale Dokumentationssystem (MIDOS²) als deutsche Version der Edmonton Symptom Assessment Scale (ESAS): - Ein Instrument für die Pflege?
Das Minimale Dokumentationssystem (MIDOS²) als deutsche Version der Edmonton Symptom Assessment Scale (ESAS): - Ein Instrument für die Pflege? Dr. Stephanie Stiel Abteilung Palliativmedizin 25. August
Mehr4.2 Grundlagen der Testtheorie
4.2 Grundlagen der Testtheorie Januar 2009 HS MD-SDL(FH) Prof. Dr. GH Franke Kapitel 5 Vertiefung: Reliabilität Kapitel 5 Vertiefung: Reliabilität 5.1 Definition Die Reliabilität eines Tests beschreibt
MehrPsychologische Diagnostik
Psychologische Diagnostik von Andre Beauducel und Anja Leue '> -HpGREFE GÖTTINCEN BERN WIEN PARIS OXFORD PRAG TORONTO BOSTON AMSTERDAM KOPENHAGEN STOCKHOLM FLORENZ - HELSINKI Inhaltsverzeichnis Vorwort
MehrAufgaben und Ziele der Wissenschaften
Aufgaben und Ziele der Wissenschaften Beschreibung: Der Otto sitzt immer nur still da und sagt nichts. Erklärung:Weil er wegen der Kündigung so bedrückt ist. Vorhersage: Wenn das so weitergeht, zieht er
MehrMesstherorie Definitionen
Messtherorie Definitionen Begriff Definition Beispiel Relationen Empirisches Relativ eine Menge von Objekten und ein oder mehreren beobachtbaren Relationen zwischen dieses Objekten Menge der Objekte =
MehrÜberblick der heutigen Sitzung
Rückblick Überblick der heutigen Sitzung Exkursion: Blitzlicht-Methode Moral Session: Hausaufgabe Wissenschaftliches Arbeiten und Forschungsmethoden Arbeiten in den Projektgruppen Wissenschaftliches Arbeiten
MehrKontrolle und Aufbereitung der Daten. Peter Wilhelm Herbstsemester 2014
Kontrolle und Aufbereitung der Daten Peter Wilhelm Herbstsemester 2014 Übersicht 1.) Kontrolle und Aufbereitung der Daten Fehlerkontrolle Umgang mit Missing 2.) Berechnung von Skalen- und Summenscores
Mehr3.3.1 Referenzwerte für Fruchtwasser-Schätzvolumina ( SSW)
50 3.3 Das Fruchtwasser-Schätzvolumen in der 21.-24.SSW und seine Bedeutung für das fetale Schätzgewicht in der 21.-24.SSW und für das Geburtsgewicht bei Geburt in der 36.-43.SSW 3.3.1 Referenzwerte für
MehrÜbung Methodenlehre I, SeKo
Datenerhebung: Übung Methodenlehre I, SeKo Vivien Röder Professur für Forschungsmethodik & Evaluation Heute Wiederholung Messen & Testen Gütekriterien Befragung Beobachtung www.tu-chemnitz.de 2 Wiederholung
MehrDer Zusammenhang zwischen Verständlichkeit von Fragen und Interraterreliabilität bei Meßinstrumenten der Mitarbeiterzufriedenheit
Der Zusammenhang zwischen Verständlichkeit von Fragen und Interraterreliabilität bei Meßinstrumenten der Mitarbeiterzufriedenheit Peter Dreisigacker und Armin Trost Inhalt 1 Einleitende Bemerkung... 17
MehrEigene MC-Fragen "Lesen" 1. Zu den Komponenten eines effektiven Leseprozesses lt. Werder (1994) gehört nicht
Eigene MC-Fragen "Lesen" 1. Zu den Komponenten eines effektiven Leseprozesses lt. Werder (1994) gehört nicht Klärung des Leseziels geeignete Rahmenbedingungen Wiedergabe des Gelesenen Aufrechterhaltung
MehrGrundlagen der Labormedizin. Die analytische Phase
Grundlagen der Labormedizin Die analytische Phase Die analytische Phase im diagnostischen Prozess Begriffe analytischer Qualität - Richtigkeit - Präzision - Genauigkeit Definition der Richtigkeit Die Richtigkeit
MehrMessung, Skalen, Indices
VI Messung, Skalen, Indices 1 Der Big Mac - Index - Kaufkraft einer Währung û theoretisches Konstrukt direkt nicht meßbar û Messung durch beobachtbare Indikatorvariable üblich: Wechselkurse - Vorschlag
MehrMessung Emotionaler Intelligenz. Prof. Dr. Astrid Schütz - Universität Bamberg
Messung Emotionaler Intelligenz Prof. Dr. Astrid Schütz - Universität Bamberg Bedeutung Emotionaler Intelligenz beeinflusst die Qualität persönlicher Beziehungen (Brackett et al., 2006; Schröder-Abé &
MehrBeispielberechnung Vertrauensintervall
Beispielberechnung Vertrauensintervall Auszug Kursunterlagen MAS ZFH in Berufs-, Studien- und Laufbahnberatung Prof. Dr. Marc Schreiber, Dezember 2016 Beispielberechnung Vertrauensintervall Statistische
Mehrσ 2 (x) = σ 2 (τ) + σ 2 (ε) ( x) ( ) ( x) ( ) ( ) σ =σ τ +σ ε σ τ σ σ ε ( ) ( x) Varianzzerlegung Varianzzerlegung und Definition der Reliabilität
Varianzzerlegung Die Varianz der beobachteten Testwerte x v : setzt sich zusammen aus zerlegen wahrer Varianz und Fehlervarianz: σ (x) = σ (τ) + σ (ε) Varianzzerlegung und Definition der Reliabilität (
MehrDATENERHEBUNG: MESSEN-OPERATIONALISIEREN - SKALENARTEN
DATENERHEBUNG: MESSEN-OPERATIONALISIEREN - SKALENARTEN Was ist Messen? Messen - im weitesten Sinne - ist die Zuordnung von Zahlen zu Objekten und Ereignissen entsprechend einer Regel (Def. nach Stevensen
MehrSOZIALE INTEGRATION IN DIE SCHULKLASSE. EIN BEITRAG ZUR SYSTEMATISCHEN ANALYSE SOZIALER PROZESSE. Brigitte Anliker
SOZIALE INTEGRATION IN DIE SCHULKLASSE. EIN BEITRAG ZUR SYSTEMATISCHEN ANALYSE SOZIALER PROZESSE. Brigitte Anliker INHALT 1. Input: theoretische und empirische Hintergründe; Erhebungsmethoden 2. Einblick
MehrBeispielberechnung Vertrauensintervalle
Beispielberechnung Vertrauensintervalle Auszug Kursunterlagen MAS Berufs-, Studien- und Laufbahnberatung Juni 2015 Prof. Dr. Marc Schreiber Beispielberechnung Vertrauensintervalle Vorbereitung - Statistische
MehrRekodierung invertierter Items
16.Testkonstruktion Items analysieren (imrahmen der KTT) Pretest Aussortieren / Umschreiben von unverständlichen, uneindeutigen oder inakzeptablen Items empirische Prüfung Kennwerte: Itemschwierigkeit
MehrPsychologische Methodenlehre Statistik
RAINER LEONHART Psychologische Methodenlehre Statistik Mit 21 Abbildungen und 40 Tabellen Mit 64 Ubungsfragen Ernst Reinhardt Verlag Miinchen Basel Inhalt Vorwort 9 1 Einfuhrung in die Forschungsmethoden
MehrQUANTITATIVE VS QUALITATIVE STUDIEN
1 QUANTITATIVE VS QUALITATIVE STUDIEN Q UA N T I TAT I V E ST U D I E (lat. quantitas: Größe, Menge) Q UA L I TAT I V E ST U D I E (lat.: qualitas = Beschaffenheit, Merkmal, Eigenschaft, Zustand) 2 QUANTITATIVES
MehrStatistik III Regressionsanalyse, Varianzanalyse und Verfahren bei Messwiederholung mit SPSS
Statistik III Regressionsanalyse, Varianzanalyse und Verfahren bei Messwiederholung mit SPSS Verena Hofmann Dr. phil. des. Departement für Sonderpädagogik Universität Freiburg Petrus-Kanisius-Gasse 21
MehrWie valide sind AC im deutschsprachigen Raum?
Wie valide sind AC im deutschsprachigen Raum? Eine meta-analytische Untersuchung Der universitäre Betreuer Kontaktperson zum AkAC Marcus Holzenkamp, Frank Spinath & Stefan Höft Der eigentliche Macher der
MehrBivariate Analyseverfahren
Bivariate Analyseverfahren Bivariate Verfahren beschäftigen sich mit dem Zusammenhang zwischen zwei Variablen Beispiel: Konservatismus/Alter Zusammenhangsmaße beschreiben die Stärke eines Zusammenhangs
MehrWAS IST LEBENSQUALITÄT? DIPL. PGW R. BECKER
WAS IST LEBENSQUALITÄT? DIPL. PGW R. BECKER FÜR SIE PERSÖNLICH? DAS KONZEPT DER LEBENSQUALITÄT LEBENSQUALITÄT EIN MULTIDIMENSIONALES KONSTRUKT WHO KÖRPERLICHE, MENTALE, SOZIALE, SPIRITUELLE UND VERHALTENSBEZOGENE
MehrIBS-KJ Interviews zu Belastungsstörungen bei Kindern und Jugendlichen
IBS-KJ Interviews zu Belastungsstörungen bei Kindern und Jugendlichen - Diagnostik der Akuten und der Posttraumatischen Belastungsstörung - Seminar: Testen und Entscheiden Dozentin: Prof. Dr. G. H. Franke
MehrForschungsmethoden VORLESUNG WS 2017/2018
Forschungsmethoden VORLESUNG WS 2017/2018 SOPHIE LUKES Überblick Letzte Woche: Messen Heute: Hypothesen Warum Hypothesen? Menschliches Erleben und Verhalten? Alltag vs. Wissenschaft Alltagsvermutung Wissenschaftliche
MehrPsychological Ownership in Organisationen
Erko Martins Psychological Ownership in Organisationen Explorative Untersuchung der Antezedenzen und des Entstehungsprozesses Rainer Hampp Verlag München, Mering 2010 Inhaltsverzeichnis Inhaltsverzeichnis
MehrFragestellung Fragestellungen
Fragestellung 107 7 Fragestellungen Im Fokus dieser Studie steht die Frage, welche Auswirkungen individualisierte Rückmeldungen über den aktuellen Cholesterin- und Blutdruckwert auf die Bewertung der eigenen
MehrMethodenlehre. Vorlesung 4. Prof. Dr. Björn Rasch, Cognitive Biopsychology and Methods University of Fribourg
Methodenlehre Vorlesung 4 Prof. Dr., Cognitive Biopsychology and Methods University of Fribourg 1 Methodenlehre I Woche Datum Thema 1 FQ 20.2.13 Einführung, Verteilung der Termine 1 25.9.13 Psychologie
MehrFamiliäre Pflege: Welche Bedeutung haben Ressourcen für pflegende Angehörige? Assessment zur Erfassung Ressourcen pflegender Angehöriger (RPA)
Familiäre Pflege: Welche Bedeutung haben Ressourcen für pflegende Angehörige? Assessment zur Erfassung Ressourcen pflegender Angehöriger (RPA) Prof. Dr. rer. medic. Claudia Mischke, MPH Swiss Congress
MehrBindegewebszonen als Indikator für Lebererkrankungen
Bindegewebszonen als Indikator für Lebererkrankungen Untersuchung zur Reliabilität und Validität des Bindegewebsbefunds von Thomas Sprenkel Veröffentlicht in der Zeitschrift für Physiotherapeuten 04/2014
MehrMedizinische Biometrie (L5)
Medizinische Biometrie (L5) Vorlesung V Der diagnostische Test Prof. Dr. Ulrich Mansmann Institut für Medizinische Informationsverarbeitung, Biometrie und Epidemiologie mansmann@ibe.med.uni-muenchen.de
MehrForschungsmethoden VORLESUNG SS 2017
Forschungsmethoden VORLESUNG SS 2017 SOPHIE LUKES Überblick Letzte Woche: Messen Heute: Hypothesen Warum Hypothesen? Menschliches Erleben und Verhalten? Alltag vs. Wissenschaft Alltagsvermutung Wissenschaftliche
MehrNormung für die Praxis: Überblick über die Anforderungen an Verfahren
Normung für die Praxis: Überblick über die Anforderungen an Verfahren Friedhelm Nachreiner Carl von Ossietzky Universität Oldenburg Institut für Psychologie, Abteilung Arbeits- und Organisationspychologie
MehrDozent: Dawid Bekalarczyk Universität Duisburg-Essen Fachbereich Gesellschaftswissenschaften Institut für Soziologie Lehrstuhl für empirische
TEIL 3: MESSEN UND SKALIEREN 1 Das Messen eine Umschreibung Feststellung der Merkmalsausprägungen von Untersuchungseinheiten (z.b. Feststellung, wie viel eine Person wiegt oder Feststellung, wie aggressiv
MehrKendall s Tau. Betrachte Paare von Beobachtungen (x i, y i ) und (x j, y j ) Ein Paar heißt:
Kendall s Tau Betrachte Paare von Beobachtungen (x i, y i ) und (x j, y j ) Ein Paar heißt: konkordant, diskordant, falls x i < x j und y i < y j oder x i > x j und y i > y j falls x i < x j und y i >
MehrSF-36 Fragebogen zum Gesundheitszustand. Seminar: Testen und Entscheiden Dozentin: Susanne Jäger Referentin: Julia Plato Datum:
SF-36 Fragebogen zum Gesundheitszustand Seminar: Testen und Entscheiden Dozentin: Susanne Jäger Referentin: Julia Plato Datum: 03.02.2010 Gliederung 1. Überblicksartige Beschreibung 2. Testgrundlage 3.
MehrBerufserfahrung und beruflicher Erfolg
Berufserfahrung und beruflicher Erfolg AGBFN-Experten-Workshop Montag, 5. November 2007 Dipl.Sozw. Eva Geithner & Prof. Dr. Klaus Moser Lehrstuhl für Wirtschafts- und Sozialpsychologie Berufserfahrung
MehrWas ist ein Test? Grundlagen psychologisch- diagnostischer Verfahren. Rorschach-Test
Was ist ein Test? Ein Test ist ein wissenschaftliches Routineverfahren zur Untersuchung eines oder mehrerer empirisch abgrenzbarer Persönlichkeitsmerkmale mit dem Ziel einer möglichst quantitativen Aussage
MehrGrundlagen sportwissenschaftlicher Forschung Test
Grundlagen sportwissenschaftlicher Forschung Test Dr. Jan-Peter Brückner jpbrueckner@email.uni-kiel.de R.216 Tel. 880 4717 Was ist Messen? Grundlagen des Messens Zuordnen von Objekten (oder Ereignissen)
MehrUntersuchungsarten im quantitativen Paradigma
Untersuchungsarten im quantitativen Paradigma Erkundungsstudien / Explorationsstudien, z.b.: Erfassung der Geschlechterrollenvorstellungen von Jugendlichen Populationsbeschreibende Untersuchungen, z.b.:
MehrLeseuntersuchung mit dem Stolperwörtertest
PROJEKT LUST - Siegen Leseuntersuchung mit dem Stolperwörtertest Erste Ergebnisse aus einer Längsschnittuntersuchung im Satzlesen und Textverstehen - Vorstellung des Projekts LUST 1 PROJEKT LUST - Siegen
Mehr1 EINLEITUNG... 1 TEIL I: STAND DER FORSCHUNG PROFESSIONELLES WISSEN UND HANDELN VON LEHRKRÄFTEN Fachwissen...
Inhaltsverzeichnis 1 EINLEITUNG... 1 TEIL I: STAND DER FORSCHUNG... 5 2 PROFESSIONELLES WISSEN UND HANDELN VON LEHRKRÄFTEN... 7 2.1 PROFESSIONSWISSEN... 7 2.1.1 Fachwissen... 8 2.1.2 Fachdidaktisches Wissen...
MehrVorlesung Testtheorien. Dr. Tobias Constantin Haupt, MBA Sommersemester 2007
Vorlesung Testtheorien Dr. Tobias Constantin Haupt, MBA Sommersemester 2007 Kriteriumsvalidität Numerische(r) Kennwert(e), so viele wie es sinnvolle Kriterien gibt! mögliches Problem: diese Validitätsart
MehrMessen und Statistik
Messen und Statistik Statistische Grundkonzepte: Reliabilität, Validität, Skalen Bachelor Seminar SoSe 2009 Institut für Statistik LMU Monika Brüderl 12.05.2009 Gliederung Philosophische Grundlagen - Einige
MehrEvidenzbasiertes Sturzrisiko-Assessment Weiterentwicklung einer bestehenden Maßnahme des Qualitätsmanagements
Evidenzbasiertes Sturzrisiko-Assessment Weiterentwicklung einer bestehenden Maßnahme des Qualitätsmanagements Thomas Petzold, Prof. Dr. Jochen Schmitt Jahresveranstaltung GÖZ 13. März 2015 Hintergrund
MehrKipp/Opitz UdS 2007/08. Experimentalmethodik
Experimentalmethodik Alltagspsychologie & Wissenschaftliche Psychologie nicht systematisch trennend zw. Richtigem und Falschem nicht methodisch kontrolliert geeignete Werkzeuge nicht kritische Überprüfung
MehrForschungsmethoden VORLESUNG WS 2016/17
Forschungsmethoden VORLESUNG WS 2016/17 FLORIAN KOBYLKA, SOPHIE LUKES Organisatorisches Termine Raum 231 1 28.10.16 10:15 Sophie Lukes / Florian Einführung Kobylka 2 04.11.16 10:10 Florian Kobylka Psychologie
MehrIII. Methoden der empirischen Kommunikations forschung. Hans-Bernd Brosius Friederike Koschel. Eine Einführung. 3. Auflage - CKIZ
- CKIZ Hans-Bernd Brosius Friederike Koschel Methoden der empirischen Kommunikations forschung Eine Einführung 3. Auflage»11111111111111)111111 ii in i m III VS VERLAG FÜR SOZIALWISSENSCHAFTEN Vorwort
MehrThe ROC curve in screening with multiple markers: An application to the triple test in prenatal diagnostics
Statistische Methoden in Evidenz-basierter Medizin und Health Technology Assessment 20. bis 21. November 2003 Freiburg The ROC curve in screening with multiple markers: An application to the triple test
MehrStatistical Coaching. Thomas Forstner
Statistical Coaching Thomas Forstner Diagnoseverfahren Allgemein Vergleich: wahrer Befund mit Test (Diagnose) wahrer Befund muss bekannt sein (Goldstandard) 3 Analogie zur Testtheorie 4 Beurteilung von
MehrNeuere Konzepte von Intelligenz und deren Probleme. Thomas Hoch Martina Weber
Neuere Konzepte von Intelligenz und deren Probleme Thomas Hoch 0055281 Martina Weber 0105535 Kognitive Fähigkeiten F Persönlichkeit Performance Neuere Intelligenz-Konzepte (job performance): Tacit Knowledge
MehrEbM-Splitter 10 Sensitivität und Spezifität: Auswirkung der Wahl des Trennpunktes
Sensitivität und Spezifität: Auswirkung der Wahl des Trennpunktes Seite - 1 - EbM-Splitter 10 Sensitivität und Spezifität: Auswirkung der Wahl des Trennpunktes Im vorigen EbM-Splitter [4] wurde auf die
MehrBegriffe und Methoden (8.5.)
Wichtige Korrektur Leider war meine Auskunft in der letzten Sitzung über den Preis des Skripts für die Internetkurse nicht zutreffend. Das Skript kostet bedauerlicherweise 10,50 (vor ewigen Zeiten war
MehrEntwicklung eines testtheoretisch fundierten Instruments zur Erfassung des Selbstpflegeverhaltens von Menschen mit Diabetes mellitus Typ 2
Entwicklung eines testtheoretisch fundierten Instruments zur Erfassung des Selbstpflegeverhaltens von Menschen mit Diabetes mellitus Typ 2 Forschungstag Gesundheit CCG 15.5.2012 Uta Gaidys Thorsten Meyer
MehrVL Organisationspsychologie
Institut für Psychologie Organisations- und Wirtschaftspsychologie Prof. Dr. Bertolt Meyer VL Organisationspsychologie 3.: Methoden der Arbeits- und Organisationspsychologie Kernelemente des Forschungsprozesses
MehrVerfahren zur Skalierung. A. Die "klassische" Vorgehensweise - nach der Logik der klassischen Testtheorie
Verfahren zur Skalierung A. Die "klassische" Vorgehensweise - nach der Logik der klassischen Testtheorie 1. Daten: z. Bsp. Rating-Skalen, sogenannte "Likert" - Skalen 2. Ziele 1. Eine Skalierung von Items
MehrFunktion Das Skript erstellt ROC-Kurven mit Konfidenzbändern, berechnet (gewichtete) Cutoff-Punkte und (partial) Area under the Curve (AUC, pauc).
Skriptname: ROC_pAUC7.jsl JMP-Version: JMP 7 Datum: 10.09.2007 Download: ROC.zip Funktion Das Skript erstellt ROC-Kurven mit Konfidenzbändern, berechnet (gewichtete) Cutoff-Punkte und (partial) Area under
MehrAufbau des Testberichts. 1. Problemstellung / inhaltliche Einführung. 2. Methode
Aufbau des Testberichts Titelblatt (Beliebig) Zusammenfassung Inhaltsverzeichnis Einführung / theoretisch-inhaltlicher Hintergrund Methode: Konstruktion und Aufbau des Tests, Datenerhebung Ergebnisse Diskussion
MehrInhalt. 1 Ziel und Forschungsprozess Grundlage von Wissenschaft Wissenschaftstheoretische Grundbegriffe 27
Inhalt Vorwort 11 1 Ziel und Forschungsprozess 13 1.1 Ziel empirischer Sozialforschung 13 1.1.1 Exploration 13 1.1.2 Beschreibung sozialer Sachverhalte 13 1.1.3 Erklärung sozialer Sachverhalte 14 1.1.4
MehrKapitel 4: Merkmalszusammenhänge
Kapitel 4: Merkmalszusammenhänge Korrelationen 1 Lineare Regression 3 Literatur 5 Korrelationen Mit Hilfe von G*Power lässt sich analog zum Vorgehen beim t-test (Kapitel 3, Band I) vor einer Untersuchung
MehrSorbet. Testverfahren. Testverfahren. 1. Sinnvoll? 2. Objektiv? 3. Realistisch? 4. Bereich? 5. Entwicklung? 6. Testverfahren?
Sorbet Testverfahren 1 Testverfahren 1. Sinnvoll? 2. Objektiv? 3. Realistisch? 4. Bereich? 5. Entwicklung? 6. Testverfahren? 2 Sinnvoll? Miss alles, was sich messen lässt, und mach alles messbar, was sich
Mehr