Klinische versus statistische Urteilsbildung

Ähnliche Dokumente
Inhaltsverzeichnis. 1 Warum und für wen dieses Buch Ziele Überblick Benutzungshinweise... 4

Forschungsmethoden VORLESUNG SS 2017

Forschungsmethoden VORLESUNG WS 2017/2018

Literatur zu den Vorlesungen Allgemeine Psychologie I

Vorlesung Konsumentenverhalten 2016_1

Der Rückschaufehler Wie Entscheidungen in Unternehmen beeinflusst werden

KOLLEGIALES FEEDBACK B.SC. PSYCH. DÖRTHE DEHE SEMINARREIHE KOMMUNIKATION & KONFLIKT

Verbesserung des Selbstmanagements von Studierenden durch Coaching Zwei Untersuchungen mit randomisierten Wartekontrollgruppen

Consultant Profile. Telephone: (+49) / Fax: (+49) / Mobile: (+49) 1 73 / Klaus.Stulle@Profil-M.

Psychologische Begutachtung im Strafverfahren

Arbeitstitel Der Einfluss des räumlichen Vorstellungsvermögens beim Verstehen eines Sachtextes

Evidence Based Practice (Teil 1) Urs Albisser Andrea Weise (Februar 2006)

Psychologie im Umweltschutz

Mitarbeiter auswählen Personaldiagnostik in der Praxis

Auswahlgespräche: Prognosekraft und Strategien zu ihrer Steigerung

Ausgangssituation und Zielsetzung

Methoden der Personalauswahl: Was nützt? Prof. Dr. Torsten Biemann 39. BFLK-Jahrestagung - Gemeinsam in Führung gehen!,

Das Testbeurteilungssystem des Testkuratoriums der Föderation Deutscher Psychologenvereinigungen (TBS-TK)

Evidenzbasierte Eignungsdiagnostik im globalen und digitalen Zeitalter

Pragmatische Studien in Settings der Routineversorgung

Aufgaben zu Kapitel 4

Diagnose und Feedback durch die Lehrperson im Rahmen «formativen Assessments» f am Beispiel von schriftlicher Beurteilung

Viel Lärm um Nichts? Impression Management im Assessment Center

Untersuchung zur Brauchbarkeit des Interviews

Einstellungen deutscher Psychologinnen und Psychologen zu Tests in der EFPA-Befragung Tests in Europe

Psychologische Begutachtung im Strafverfahren

Evaluation (10.7.) Definition Beschreibungsmerkmale von Evaluation Zu den Hausaufgaben Methodische Aspekte der (summativen) Evaluation

Die manuelle, äußerlich-abdominale. Schwangeren-Untersuchung - eine Hebammendiagnose. beurteilt. 24 Mutter-Kind-Charakteristika

Leuphana Universität Lüneburg Department Wirtschaftspsychologie Mündliche Prüfungen Psychodiagnostik (FH Diplom, B. Sc.

Grenzen des Homo Oeconomicus: Grundprinzipien menschlicher Entscheidungen

Fakultät Wirtschaftsund Sozialwissenschaften

Empirisches Software Engineering Methoden und Relevanz

Zielsetzung des Projektes

Die EOD-Technologie für die Praxis

Gütekriterien für evaluative Messinstrumente in der Rehabilitation

Horse Assisted Assessment Führungspositionen passend besetzen und ausbauen

Chestpain in primary care: a systematic research programme to support guideline development

Wie liest man Konfidenzintervalle? Teil I. Premiu m

Subjektive Einschätzung und Umgang mit Risiken und Gefahren. Gerd Gigerenzer

Abgerufen am von anonymous. Management Handbuch für die Psychotherapeutische Praxis

Situationsbewusstsein bei Monitoringaufgaben. Untersuchung der Arbeit von Fahrdienstleitern Birte Thomas

Forschungsmethoden VORLESUNG SS 2017

Zwischen Schutz und Autonomie: das Aushandeln von Massnahmen

Christof Obermann. Assessment Center. Entwicklung, Durchführung, Trends. Mit originalen AC-Übungen. 3. Auflage GABLER

Sherry Daniel-Wichern, RN, BN, MScN Holger Dudel, RN, BN, MScN. Berlin, März 2009

Heuristiken. Vorlesung Entscheiden, Konflikt und Handeln Termin 4. Andreas Ernst. A. Ernst, CESR, Universität Kassel. Überblick

Prof. Dr. Dr. Martin HärterH

Rückblick. Übersicht. Einleitung. Activity Engagement Theory (AET) Studie Zusammenfassung und zukünftige Forschung Literatur. Annahmen Vorhersagen

Kausalanalyse Überblick (I)

RISIKOMANAGEMENT & RISIKOKOMMUNIKATION MIT FOTRES. PD Dr. phil. Jérôme Endrass Psychiatrisch-Psychologischer Dienst, Amt für Justizvollzug Zürich

Clinical Reasoning: Mit oder ohne Patient?

Planung von Humanstudien Fallzahlberechnung

Vorlesung Konsumentenverhalten 2015_1 Dr. Hansjörg Gaus

WATCHING YOUR STEP - Clinical Trial Process

Instrumente der Personalauswahl

Psychologie für die Praxis

Der HL7 basierte Standard für einen elektronischen Pflegebericht. Ursula Hübner Daniel Flemming Carsten Giehoff

Institut für Psychologie Pädagogische Psychologie. Assessment von Studierenden

ORGANISIERTE KREATIVITÄT: EIN WIDERSPRUCH?

Advanced Nursing Practice: Erfolg mit einem geriatrischen Konsilteam

Sitzung 12: Konzeption: Inhalt und Form

Unfälle älterer Radfahrender Dunkelziffer, Unfallumstände und Risikoverhalten

Forschungsmethoden VORLESUNG SS 2018

Die Repetory Grid Technik nach Kelly Standardisierte Fragebogen-Verfahren Unternehmenspezifischer Fragebogen

Prävention posttraumatischer Belastung bei jungen brandverletzten Kindern: Erste Ergebnisse einer randomisiert-kontrollierten Studie

Consultant Profile. Yvonne Faerber Profil M Beratung für Human Resources Management GmbH & Co. KG Berliner Straße Wermelskirchen

Die Bedeutung von interprofessioneller Teamarbeit für die Patientenzufriedenheit in der Behandlung chronischer Erkrankungen

Vorlesung. Einführung in die Sportpsychologie

Wie valide sind AC im deutschsprachigen Raum?

Theorien der Versorgungsforschung aus Sicht der (Medizin-)Psychologie

Methoden der Versorgungsforschung: Ein Überblick

Karl-Heinz Renner. Testkonstruktion, Testen und Entscheiden. kultur- und sozialwissenschaften

Effiziente Anreizsysteme in der Wissenschaft Eine experimentelle Analyse

Validierung von Sprachprüfungen

Wissen über psychologische Variablen. im diagnostischen Prozess

Assessment-Center für die Auswahl

aus Sicht der Psychologie Prof. Dr. Mark Vollrath, TU Braunschweig

PROJEKTMACHER WERDEN

Allgemeine Selbstwirksamkeitserwartung

Forschende Kinder entdecken!

Erfassung von fachlichen Literaturrecherchefähigkeiten durch standardisierte Leistungstests und Selbsteinschätzungen

Handbuch- und Lehrbuchbeiträge/ Chapters in Handbooks

Unfälle bei (älteren) Radfahrerinnen und Radfahrern

Forschungsmethoden VORLESUNG WS 2017/2018

Entscheidungen im Praxisalltag: Wo bekomme ich verlässliche Informationen

Labellingeffekte bei Frühförderungsprogrammen

Consultant Profile. Alexander Fritz Profil M Beratung für Human Resources Management GmbH & Co. KG Berliner Straße Wermelskirchen

Bildung im Vergleich. -was uns PISA & Co (nicht) sagen. 16. März 2015

Qualität von Publikationen randomisierter Nicht-Unterlegenheitsund Äquivalenzstudien

Erleben und Bedeutung von Intuition bei Pflegefachmännern. K. Peter, K. Ritschard Ugi, A. Ryser, A. Fringer & C. Mischke Masterstudiengang Pflege

Bewältigung einer gynäkologischen Krebserkrankung in der Partnerschaft

Kipptisch und Task Force Monitor. Tilt Table Test or Head Up Tilt (HUT) Synkopen Klassifikation. Strukturelle kardioplumonale Erkrankungen

Informationsüberflutung Messen Verstehen Verändern

Einstellungstests: Bedeutung und Trends

Statistische Überlegungen: Eine kleine Einführung in das 1 x 1

Einstellung von Mitarbeitern

Klinische Forschung. Klinische Forschung. Effectiveness Gap. Versorgungsforschung und evidenzbasierte Medizin. Conclusion

Transkript:

Klinische versus e Urteilsbildung Probevorlesung 10.11.2005 Dr. Carmen Hagemeister Fakultät Mathematik und Naturwissenschaften Fachrichtung Psychologie Diagnostik und Intervention 1

Überblick Was heißt "", was "klinisch"? Was ist besser und warum? Wird das Bessere auch gemacht? Warum wird nicht immer das Bessere gemacht? Fazit 2

Was heißt "", was "klinisch"? Urteilsbildung Informationen kombinieren Ziel: Diagnose, oft auch Prognose psychologisch: auf menschliches Verhalten bezogen 3

Was heißt "", was "klinisch"? "" = nach festen, expliziten Regeln "mechanisch" "buchhalterisch" Die klinische Psychologin, die ein standardisiertes Verfahren zur Diagnose nutzt, geht in diesem Sinne "" vor. 4

Was heißt "", was "klinisch"? "klinisch" = nicht nach festen, expliziten Regeln kann "intuitiv" sein, muss aber nicht kann auch gut begründet sein Der Personalchef, der ohne eine feste Regel entscheidet, wen er einstellt, geht in diesem Sinne "klinisch" vor. 5

Datenkombination Meehl (1954): e Datenkombination im Mittel besser als klinische Datenkombination Problem der Untersuchung von Meehl: nur Vergleich von Datenkombinationen: bestimmte Informationen ausgeschlossen, z. B. Daten klinischer Interviews Kliniker kann Daten erheben, die anders nicht zugänglich sind 6

Sawyer (1966): Untersuchung von Datensammlung Datenkombination 7

Meta-Analyse: 47 Studien Vergleich von mindestens zwei Vorhersagemethoden "Kliniker" waren Psychologen oder Psychiater (über 50% der Studien) Ärzte Offiziere oder andere Soldaten Studierende teilweise Personen ohne Training in Diagnostik 8

- Klassifikation von Vorhersagemethoden Datensammlung Datenkombination klinisch klinisch rein klinisch Eigenschaftsurteile Profilinterpretation rein klinisch und Synthese klinische Zusammensetzung klinische Synthese mechanische Zusammensetzung mechanische Synthese 9

- Klassifikation von Vorhersagemethoden Datensammlung Datenkombination klinisch klinisch rein klinisch Eigenschaftsurteile Profilinterpretation rein klinisch und Synthese klinische Zusammensetzung klinische Synthese mechanische Zusammensetzung mechanische Synthese 10

- Klassifikation von Vorhersagemethoden Datensammlung Datenkombination klinisch klinisch rein klinisch Eigenschaftsurteile Profilinterpretation rein klinisch und Synthese klinische Zusammensetzung klinische Synthese mechanische Zusammensetzung mechanische Synthese 11

- relative Güte Datensammlung klinisch Datenkombination klinisch 20% 43% 38% 63% klinisch und 26% 75% Synthese 50% 75% 12

- Datenkombination Datensammlung klinisch Datenkombination klinisch 20% 43% 38% 63% klinisch und 26% 75% Synthese 50% 75% 13

- Datenkombination Datensammlung klinisch Datenkombination klinisch 20% 43% 38% 63% klinisch und 26% 75% Synthese 50% 75% e Datenkombination ist der klinischen überlegen 14

- Datensammlung Datensammlung klinisch Datenkombination klinisch 20% 43% 38% 63% 15

- Datensammlung Datensammlung klinisch Datenkombination klinisch 20% 43% 38% 63% nur e Daten liefern bessere Vorhersagen als nur klinische 16

- Datensammlung Datensammlung klinisch Datenkombination klinisch 20% 43% 38% 63% klinisch und 26% 75% 17

- Datensammlung Datensammlung klinisch Datenkombination klinisch 20% 43% 38% 63% klinisch und 26% 75% klinische und e Daten Gewinn bei er Kombination kein Gewinn bei klinischer Kombination 18

-Synthese Datensammlung klinisch Datenkombination klinisch 43% 63% klinisch und 75% Synthese 50% 19

-Synthese Datensammlung klinisch Datenkombination klinisch 43% 63% klinisch und 75% Synthese 50% klinische Synthese besser als e Kombination klinischer Daten schlechter als e Kombination er oder klinischer und er Daten 20

-Synthese Datensammlung klinisch Datenkombination klinisch 20% 38% klinisch und 26% Synthese 75% 21

-Synthese Datensammlung klinisch Datenkombination klinisch 20% 38% klinisch und 26% Synthese 75% e Synthese besser als klinische Datenkombination der verschiedenen Datengrundlagen 22

- Datenkombination Das Modell eines Experten ist besser als der Experte, weil es reliabler ist die Urteilsstrategie konsistenter verwendet als der Experte Basisraten berücksichtigt Bootstrapping z.b. HYPAG (Wottawa, 1987): isomorphe Abbildung der Urteilsstrategie eines Experten Konsequenz: Implementation auf dem Computer 23

-mehr Daten klinische Kombination von klinischen und en Daten ist schlechter als klinische Kombination von nur en Daten mehr Information schlechteres Urteil falsche Gewichtung hohe Gewichtung der klinischen Daten falls keine Gewichte berechnet Einheitsgewichtung (= alles gleich gewichtet) am günstigsten schlechter als optimale Gewichtung besser als Gewichtung in der falschen Richtung 24

- Schlussfolgerungen Statistische Datenkombination hat bessere Ergebnisse als klinische Datenkombination. Wenn man Daten kombiniert, lohnt es sich, sowohl klinische als auch e Daten zu verwenden; nicht jedoch, wenn man sie klinisch kombiniert. Wenn man Daten, die entweder nur oder und klinisch sind, kombiniert hat, sollte man die Entscheidung nicht noch einmal klinisch revidieren. 25

- neuere Meta-Analyse Grove, Zald, Lebow, Snitz und Nelson (2000): Was ist besser, klinisches oder es Vorgehen? Meta-Analyse: 136 Studien Medizin und Psychologie Klinische und mechanische Vorhersage 26

- neuere Meta-Analyse Grove et al. (2000) bessere Datenkombination Zahl der Untersuchungen klinisch 8 gleich 65 63 27

- neuere Meta-Analyse Grove et al. (2000) bessere Datenkombination Zahl der Untersuchungen klinisch 8 gleich 65 63 feste Regel im Mittel um 9-10% besser als Kliniker 28

- Gibt es Ausnahmen? Vorteil der mechanischen Kombination wird nicht beeinflusst von: Publikationsjahr Stichprobengröße Zeitschrift vs. anders publiziert Feld der Vorhersage: Bildung, Finanzen, Forensik, Medizin, Klinisch/Persönlichkeit, andere Urteiler: medizinische vs. psychologische Ausbildung Training oder Erfahrung des Urteilers mehr Daten beim Kliniker als in der mechanischen Vorhersage 29

- Gibt es Ausnahmen? Vorteil der mechanischen Vorhersage wird beeinflusst von Einbezug von Interviewdaten Vorteil der mechanischen Vorhersage größer, als wenn keine Interviewdaten einbezogen werden!!! 30

- Gibt es Ausnahmen? Vorteil der mechanischen Vorhersage wird beeinflusst von Einbezug von Interviewdaten Vorteil der mechanischen Vorhersage größer, als wenn keine Interviewdaten einbezogen werden!!! Interviews meist klinische Daten führen zu schlechter Vorhersage, wenn keine feste Regel benutzt wird wie bei Sawyer: klinische Kombination schlechter bei klinischen und en Daten als bei nur en Daten 31

- wo weniger Daten besser sind Datensammlung klinisch Datenkombination klinisch 20% 38% klinisch und 26% kein Gewinn zusätzlicher klinischer Daten bei klinischer Kombination 32

Wird das Bessere auch gemacht? - Klinisch-klassifikatorische Diagnostik Diagnostiksysteme bei Praktikern nicht hinreichend bekannt (Wynn, Myklebust & Stensland, 2005) Akzeptanz abhängig von der theoretischen Ausrichtung des Praktikers (Wynn et al., 2005) Dominanz der weißen europäisch-nordamerikanischen Kultur erlebt (Mezzich, 2002) Training wird als unzureichend erlebt (Mezzich, 2002) 33

Wird das Bessere auch gemacht? - Eignungsdiagnostik regelgeleitetes Vorgehen eher bei häufigen Entscheidungen als bei seltenen nicht regelgeleitetes Vorgehen oft, wenn wenige Personen eine derartige Stelle haben Leistung schwierig zu definieren keine Erfolgskriterien verfügbar "Trick": 50% Regel, 50% Intuition des Managers bei Vorhersagen (Blattberg & Hoch, 1990). bessere Entscheidungen als rein klinisch höhere Akzeptanz als nur DIN 33430: Anforderungsprofil 34

Warum nicht immer das Bessere? -Gefühl Menschen, die eine Entscheidung mit einer Regel statt mit ihrem Wissen fällen sollen, haben oft ein schlechtes Gefühl dabei. Argument: Entscheidungen, die explizit und systematisch sind, sind entmenschlichende Entscheidungen. Für wen? Sie sind "entmenschlichende" Entscheidungen, aber nur für den Entscheider. Für die Personen, über die entschieden wird, sind schlechte Entscheidungen entmenschlichend. (Dawes, 1988) 35

Warum nicht immer das Bessere? - Ethik Es erscheint den Entscheidern unethisch, die Entscheidung an eine Regel zu delegieren. auch hier: Für die Personen, über die entschieden wird, sind schlechte Entscheidungen unethisch. 36

Warum nicht immer das Bessere? - Wie gut ist besser? 20 Häufigkeit 15 10 5 0 0 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 Höhe der Korrelation von Test und Kriterium Meyer et al. (2001): Kriteriumsvalidität psychologischer und medizinischer Tests für unterschiedliche Kriterien Mittelwert r = 0,32 (SD r = 0,19) 37

Warum nicht immer das Bessere? - Wie gut ist besser? realistisch geringe Validität viele Fehlentscheidungen Eindruck, man selbst könnte besser sein als die a-priori-strategie / feste Regel 38

Warum nicht immer das Bessere? - Ich kann es besser! Experiment mit 4 Instruktionen (Arkes, Dawes & Christensen, 1986) "Mit der Regel schafft man 70%...... So gut können Menschen werden." (Kontrollgruppe)... Vermutlich kann man besser werden. Versuchen Sie es." (Innovation)... Nicht einmal ein Experte ist besser. Personen, die versucht haben, es besser zu machen, waren in Wirklichkeit schlechter." (Warnung) Gruppe ohne Feedback mit Kontrollgruppeninstruktion 39

Warum nicht immer das Bessere? - Ich kann es besser! Belohnung pro richtiger Entscheidung für den besten Entscheider keine Belohnung 40

Warum nicht immer das Bessere? - Ich kann es besser! beste Leistung (70%): Gruppe ohne Feedback ohne Belohnung Instruktion: gute Leistung Gruppe ohne Feedback Gruppe mit Warnung Leistung gleich schlecht bei Innovationsgruppe Kontrollgruppe 41

Warum nicht immer das Bessere? - Ich kann es besser! Belohnung: Gruppe ohne Belohnung besser als Gruppen mit Belohnung 42

Warum nicht immer das Bessere? - Ich kann es besser! Feedback plus Belohnung: schneller Strategiewechsel nach Misserfolg hohe Motivation: schädlich für Leistung ebenfalls ungünstig Expertise Personen, die wenig Wissen in einem Gebiet haben und sich auch so einschätzen, sind eher bereit, eine Regel anzuwenden 43

Warum nicht immer das Bessere? -Situationen Nicht immer feste Regeln verfügbar seltene Entscheidungen bei sehr seltenen Fällen keine Evaluation der Entscheidungsregel möglich 44

Warum nicht immer das Bessere? - Empfehlungen (Kleinmuntz, 1990) herausfinden, was Menschen schlecht können: Gewichte von Hinweisreizen bestimmen, Formeln durchrechnen Computer nutzen Strategie dokumentieren und ihre Ergebnisse Entscheidung nachher evaluieren Information suchen, die der eigenen Hypothese widerspricht Anwendungsfelder, Validität, Nutzen und Grenzen von festen Regeln erforschen 45

Fazit Wenn man Entscheidungen zu treffen hat, die vielfach vorkommen, werden diese besser, wenn man sie nach einer festen Regel trifft. Wer eine vorliegende feste Regel nicht nutzt, riskiert, dass sie oder er schlechter ist als die Regel. (Das ist die Warnung, die im Experiment geholfen hat. Möge sie auch hier helfen!) Man kann eine Entscheidungsstrategie nur verbessern, wenn man sie kennt. Das bedeutet im ersten Schritt Dokumentation. Der nächste Schritt ist die Evaluation. 46

Fazit Was bleibt den Psychologinnen und Psychologen? Theoriebildung: Was könnten gute Prädiktoren sein? Entscheiden, was noch erhoben und geprüft werden soll. Erklärungen: gute Prädiktoren sagen etwas vorher, erklären es aber nicht Therapie statt Diskussionen über Therapiewahl und -prognose (Meehl, 1954) 47

Fazit Auch mit der besten Regel kann man nicht nur richtige Entscheidungen treffen. Wir leben in einer probabilistischen Welt. Das heißt, dass wir akzeptieren müssen, dass nicht alles vorhersagbar ist. Auch andere konnten sich das nicht vorstellen, zum Beispiel Einstein, der sagte "Gott würfelt nicht". 48

Falls Sie auf dieser Seite ein Bild vermissen, finden Sie es in Hawking, S. (1998). Raum und Zeit. Reinbek: Rowohlt. 49

Literaturempfehlungen für die Diagnostik-Diplomprüfung: Sawyer, J. (1966). Measurement and prediction, clinical and statistical. Psychological Bulletin, 66, 178-200. darüber hinaus: Arkes, H. R., Dawes, R. M. & Christensen, C. (1986). Factors Influencing the Use of a Decision Rule in a Probabilistic Task. Organizational Behavior and Human Decision Processes, 37, 93-110. Grove, W. M., Zald, D. H., Lebow, B. S., Snitz, B. E. & Nelson, C. (2000). Clinical versus Mechanical Prediction: A Meta- Analysis. Psychological Assessment, 12, 19-30. Kleinmuntz, B. (1990). Why we still use our heads instead of formulas: Toward an integrative Approach. Psychological Bulletin, 107, 296-310. 50

Literaturempfehlungen weitere zitierte Literatur: Blattberg, R. C. & Hoch, S. J. (1990). Database models and managerial intuition: 50% model + 50% manager. Management Science, 36, 887-899. Dawes, R. M. (1988). You can t systematize human judgement: Dyslexia. In J. Dowie & A. S. Elstein (Eds.), Professional judgement: A reader in clinical decision making (pp. 150-162). New York: Cambridge University Press. Meyer, G. J., Finn, S. E., Eide, L. D., Kay, G. G., Moreland, K. L., Dies, R. R., Eismann, E. J., Kubiszyn, T. W. & Reed, G. M. (2001). Psychological testing and psychological assessment. A review of evidence and issues. American Psychologist, 56, 128-165. Mezzich, J. E. (2002). International surveys on the use of ICD-10 and related diagnostic systems. Psychopathology, 35, 72-75. Wottawa, H. (1987). Hypotheses Agglutination (HYPAG). A method for configuration-based analysis of multivariate data. Methodika, 1, 68-92. Wynn, R., Myklebust, L.-H. & Stensland, G. O. (2005). Attitudes to the use of diagnostic instruments among clinicians in northern Norway. Australian and New Zealand Journal of Psychiatry, 39, 313. 51