Aus dem Institut für Community Medicine. Abteilung Methoden der Community Medicine. (Leiter Univ. - Prof. Dr. phil.

Größe: px
Ab Seite anzeigen:

Download "Aus dem Institut für Community Medicine. Abteilung Methoden der Community Medicine. (Leiter Univ. - Prof. Dr. phil."

Transkript

1 Aus dem Institut für Community Medicine Abteilung Methoden der Community Medicine (Leiter Univ. - Prof. Dr. phil. Thomas Kohlmann) der Medizinischen Fakultät der Ernst-Moritz-Arndt-Universität Greifswald Die präferenzbasierte Messung der gesundheitsbezogenen Lebensqualität: Vergleichende Analysen von sechs Instrumenten in drei Indikationen von Reha- Patienten und eine empirische Untersuchung zum Konzept qualitäts-adjustierter Lebensjahre Inaugural - Dissertation zur Erlangung des akademischen Grades Doktor der Naturwissenschaften in der Medizin (Dr. rer. med.) der Medizinischen Fakultät der Ernst-Moritz-Arndt-Universität Greifswald 2008 vorgelegt von: Jörn Moock geboren am: 21. Juli 1972 in: Eckernförde

2 Dekan: Prof. Dr. Heyo K. Kroemer 1. Gutachter: Prof. Dr. Thomas Kohlmann (Greifswald) 2. Gutachter: Prof. Dr. Steffen Fleßa (Greifswald) 3. Gutachter: PD Dr. Christian Krauth (Hannover) Ort, Raum: Greifswald, Hörsaal der Klinik für Hautkrankheiten Tag der Disputation: 19. Januar 2009 Ausgabe: Elektronische Version Januar 2009 Copyright: Das Copyright der abgedruckten Artikel liegt bei den Verlagen. Der Abdruck in dieser Fassung wurde von diesen freundlicherweise genehmigt

3 Inhalt Seite Zusammenfassung Einleitung Die präferenzbasierte Messung der gesundheitsbezogenen Lebensqualität Gesundheitsökonomische Evaluation, das Konzept qualitäts-adjustierter Lebensjahre und die Prospect Theory Fragestellung und Ziele dieser Arbeit Material und Methoden Datenerhebung und Stichproben Erhebungsinstrumente Analysen und statistische Methoden Ergebnisse Patientennahe Assessmentinstrumente in der deutschsprachigen Rehabilitationsforschung Aktuelle Entwicklungen aus dem Förderschwerpunkt Rehabilitationswissenschaften (Moock et al. 2006) Ein anwendungsbezogener Vergleich präferenzbasierter Lebensqualitätsinstrumente in der medizinischen Rehabilitation (Moock & Kohlmann 2008) Die Dimensionen im EQ-5D, HUI 2 und SF-6D: Eine empirische Analyse der Zusammenhänge (Konerding et al., im Begutachtungsprozess) Direkte Messverfahren und Referenzpunkte zur Bestimmung von Nutzwerten am Beispiel von Tinnitus (Happich et al., 2008) Diskussion Zusammenfassung und Bewertung der Ergebnisse Fazit und Ausblick Literatur

4 Seite 6. Zur Dissertation gehörige Zeitschriftenartikel Moock J, Kohlmann T, Besch D, Drüner K. Nutzentheoretische Lebensqualitätsmessinstrumente in der medizinischen Rehabilitation: Ein anwendungsbezogener Vergleich. Zeitschrift für Medizinische Psychologie 2005; 14: Moock J, Kohlmann T, Zwingmann C. Patient-reported outcomes in rehabilitation research: instruments and current developments in Germany. J Public Health 2006; 14: Moock J, Kohlmann T. Comparing preference-based quality of life measures: Results from rehabilitation inpatients with musculoskeletal, cardiovascular or psychosomatic disorders. Qual Life Res 2008; 17(3): online first: DOI /s Konerding U, Moock J, Kohlmann T. The classification systems of the EQ-5D, the HUI II and the SF-6D: What do they have in common? Med Care; im Begutachtungsprozess Happich M, Moock J, von Lengerke T. Health Valuation Methods and Reference Points: the Case of Tinnitus. Value in Health 2008; im Druck Anhang Eidesstattliche Erklärung Lebenslauf Wissenschaftliche Leistungen Danksagung Das Copyright der abgedruckten Artikel liegt bei den Verlagen. Der Abdruck in dieser Fassung wurde von diesen freundlicherweise genehmigt

5 Tabellenverzeichnis Seite Tabelle 1: Tabelle 2: Übersicht über standardisierte, in deutscher Sprache verfügbare Fragebögen zur indirekten Nutzwertmessung Soziodemographische Merkmale der Tinnitus-Betroffenen und Nicht-Betroffenen Tabelle 3: Übersicht der Eigenanteile an den wissenschaftlichen Arbeiten Abbildungsverzeichnis Seite Abbildung 1: Übersicht über die Methoden der gesundheitsökonomischen Evaluation Abbildung 2: Unterschiedliche Nutzwerte in Abhängigkeit vom Referenzpunkt Abbildung 3: Time-Trade-Off Frage Abbildung 4: Standard-Gamble Frage Abbildung 5: Bezugspunkt Frage Abbildung 6: Deskriptive Statistiken der sechs Indexinstrumente in den drei untersuchten Indikationsgruppen (1. Messzeitpunkt) Abbildung 7: Durchschnittliche Nutzwerte der Betroffenen und Nicht-Betroffenen für das Rating-Scale- (VAS), Time-Trade-Off- (TTO) und Standard-Gamble-Verfahren (SG) Abbildung 8: Durchschnittliche Nutzwertdifferenzen in Abhängigkeit von der individuellen Risikoeinstellung, adjustiert für den gegenwärtigen Gesundheitszustand (Betroffene vs. Nicht-Betroffene)

6 Zusammenfassung Hintergrund: In jüngster Zeit werden zunehmend präferenzbasierte Verfahren zur Messung der gesundheitsbezogenen Lebensqualität ( health-related quality of life, HRQoL) entwickelt, validiert und in gesundheitsökonomische Analysen einbezogen. Gegenwärtig stehen in deutscher Übersetzung sechs präferenzbasierte Instrumente zur Verfügung: der EuroQol- Fragebogen (EQ-5D), der 15D-Fragebogen (15D), der Health Utilities Index 2 und 3 (HUI 2, HUI 3), die Short-Form-6-Dimensions (SF-6D) und die Quality of Well-being Scale - selfadministered (QWB-SA). In diesen Verfahren werden die verschiedenen Einzelaspekte der gesundheitsbezogenen Lebensqualität zu einer eindimensionalen Maßzahl, einem Indexwert, zusammengefasst. Dieser Indexwert kann mit Angaben zur Lebenszeit verknüpft werden und im Rahmen gesundheitsökonomischer Kosten-Nutzwert-Analysen ( cost-utility analysis, CUA), in Form von qualitäts-adjustierten Lebensjahren ( quality adjusted life years, QALYs) den Kosten einer medizinischen Technologie gegenübergestellt werden. Der Gebrauch von QALYs ist international weit verbreitet und wird von einer Vielzahl von Bewertungsinstitutionen, u.a. vom National Institute for Health and Clinical Excellence (NICE) in England und Wales, explizit gefordert. Aktuelle Studien zeigen jedoch, dass die Gültigkeit des QALY- Konzeptes hinterfragt werden sollte. Ziel: Das primäre Ziel dieser Arbeit ist die detaillierte Beschreibung, Anwendung und vergleichende empirische Untersuchung der psychometrischen Güte der oben genannten präferenzbasierten Messinstrumente in drei Reha-Kollektiven der Indikationsgebiete muskuloskelettale Krankheiten, Herz-Kreislaufkrankheiten und Psychosomatik. Darüber hinaus werden unter Rückgriff auf die Prospect Theory drei direkte Verfahren zur Messung der gesundheitsbezogenen Lebensqualität, das Standard-Gamble-, das Time-Trade-Off- und das Rating- Scale-Verfahren, am Beispiel Tinnitus empirisch untersucht. Methoden: Die Daten, die dieser Arbeit zugrunde liegen, stammen aus zwei Projekten. Das Projekt Methodische Aspekte der nutzentheoretischen Lebensqualitätsmessung wurde in der zweiten Förderphase des Norddeutschen Verbunds für Rehabilitationsforschung (NVRF) von 2001 bis 2005 durchgeführt (Förderkennzeichen: 01GD0106). Im Rahmen dieses Projektes erfolgte die Erhebung der präferenzbasierten Messinstrumente in den drei Indikationsgruppen zu Beginn und am Ende der Rehabilitation. Das Projekt Die Bewertung von Gesundheit am Beispiel Tinnitus wurde im Rahmen des Graduiertenkollegs Bedarfsgerechte - 6 -

7 und kostengünstige Gesundheitsversorgung, gefördert durch die Deutsche Forschungsgemeinschaft (DFG), durchgeführt. In zwei gleichgroßen Gruppen (Personen mit einer Tinnitus- Erkrankung und Person aus der Allgemeinbevölkerung), parallelisiert nach Alter und Geschlecht, wurden mit den genannten direkten nutzentheoretischen Erhebungsmethoden Nutzwerte für die Erkrankung Tinnitus ermittelt. Zur Datenexploration wurden Methoden der deskriptiven Statistik verwendet. Vergleichende Analysen erfolgten anhand der deskriptiven Kennwerte, Anzahl fehlender Werte, Häufigkeitsverteilungen und Korrelationskoeffizienten. Multivariate statistische Verfahren, wie z.b. die Varianzanalyse und Faktorenanalyse wurden durchgeführt. Ergebnisse: Beim Vergleich der deskriptiven Kennwerte zeigten sich Unterschiede zwischen den analysierten Instrumenten. In den drei untersuchten Indikationsgruppen wies der 15D die durchschnittlich höchsten Indexwerte aus und der QWB-SA die niedrigsten. In den drei untersuchten Gruppen erreichte kein Patient den niedrigsten möglichen Indexwert (Bodeneffekt). Deckeneffekte wurden insbesondere für den EQ-5D in allen drei beobachtet. Der 15D und der SF-6D wiesen höhere Kennwerte der Änderungssensitivität als der EQ-5D, HUI 2, HUI 3 und QWB-SA aus. Die Ergebnisse zur Bewertung von Gesundheit am Beispiel des Tinnitus zeigten, dass die Bewertung von Gesundheitszuständen vom eigenen aktuellen Gesundheitszustand und von der individuellen Risikoeinstellung abhängig ist. Tinnitus-Patienten wiesen dem Krankheitsbild Tinnitus höhere Nutzwerte zu als Nicht-Betroffene. Darüber hinaus zeigten sich Tinnitus-Betroffene als risikoavers im Vergleich zu Nicht-Betroffenen, die einer risikobehafteten medizinischen Behandlungsmaßnahme eher zustimmten. Ein Zusammenhang zwischen der Risikoeinstellung einer Person und der Nutzwertbewertung konnte statistisch nachgewiesen werden. Diskussion: Die Ergebnisse weisen darauf hin, dass die Indexwerte der sechs präferenzbasierten Messinstrumente nur bedingt vergleichbar sind, was bei der Planung einer Studie berücksichtigt werden muss. Aus den vorliegenden Ergebnissen zur nutzentheoretischen Bewertung des Tinnitus kann geschlossen werden, dass zukünftige Studien die individuelle Risikoeinstellung berücksichtigen sollten, um die ermittelten Nutzwerte entsprechend adjustieren zu können

8 1. Einleitung Die Messung der gesundheitsbezogenen Lebensqualität ( health-related quality of life, HRQoL) ist ein dynamisches, interdisziplinäres Forschungsfeld, an dem sich Medizin, Psychologie, Soziologie und Gesundheitsökonomie aktiv beteiligen und dazu beitragen, dass die subjektive Bewertung von Gesundheit und Krankheit Eingang in die Bewertung medizinischer Interventionen findet. Dabei ist die gesundheitsbezogene Lebensqualität nur einer von vielen patientennahen Ergebnisparametern ( patient-reported outcomes, PROs), aber sie ist unzweifelhaft der prominenteste Vertreter aus diesem Bereich und aus der medizinischevaluativen Forschung nicht mehr wegzudenken. Grundsätzlich ist die Erhaltung bzw. Verbesserung der gesundheitsbezogenen Lebensqualität von Patienten nichts Neues. Bereits die Frage Wie geht es Ihnen?, die häufig am Anfang eines Arzt-Patienten-Gespräches steht, enthält viel von dem, was heute mit dem Begriff gesundheitsbezogene Lebensqualität verbunden wird. Ein zentraler Baustein des Konzeptes ist die Definition von Gesundheit der Weltgesundheitsorganisation (WHO). Danach ist der Zustand vollständiger Gesundheit nicht nur mit physischen, sondern auch mit psychischen und sozialen Aspekten des Wohlbefindens eng verknüpft (WHO 1948). Mit der Implementierung dieses Verständnisses von Gesundheit und Krankheit ging ein Perspektivenwandel innerhalb der Medizin einher. Es setzte sich zunehmend die Erkenntnis durch, dass zur Bewertung des Erfolgs einer Behandlung neben den klassischen biomedizinischen Ergebnisparametern noch andere Bereiche von Bedeutung sind (Patrick & Erickson 1992). Besondere Aufmerksamkeit erfuhr diese neue Erkenntnis in denjenigen Indikationsgruppen (z.b. Onkologie), in denen eine Lebensverlängerung (Quantität des Lebens) um einige wenige Monate mit erheblichen Therapienebenwirkungen assoziiert ist und mit einem deutlichen Verlust an Lebensqualität einhergeht (Aaronson 1992). Ein weiterer wichtiger Aspekt ist der stetig wachsende Anteil der älteren Bevölkerung und die Tatsache, dass immer mehr Menschen immer länger mit chronischen, behandlungsbedürftigen Krankheiten leben. Diese Entwicklungen führten in der Medizin zu einem veränderten Blick auf die Zielkriterien. Neben den klinischen Parametern fand die erlebte Gesundheit, d.h. die subjektive Bewertung der Gesundheit aus Betroffenensicht, unter dem Begriff gesundheitsbezogene Lebensqualität Eingang in die Gesundheitsforschung (Bullinger 1996). Damit dient gesundheitsbe

9 zogene Lebensqualität sowohl in der Therapiebewertung im Rahmen klinischer Studien als auch in der gesundheitsökonomischen Evaluation des Nutzens von Interventionen im gesamtgesellschaftlichen Kontext als wichtiges Outcome-Maß. Zur Erhebung der gesundheitsbezogenen Lebensqualität wurden in den vergangenen drei Jahrzehnten eine Vielzahl von Instrumenten entwickelt, erprobt und validiert. Parallel, jedoch mit etwas weniger Dynamik, beschäftigten sich verschiedene Arbeitsgruppen mit der theoretisch-konzeptionellen Fundierung des Konzeptes gesundheitsbezogener Lebensqualität (Mosteller 1989, Rosenberg 1995). Eine umfassende Definition wurde von der WHOQOL-Arbeitsgruppe vorgestellt. Sie definiert Lebensqualität als die subjektive Wahrnehmung einer Person hinsichtlich ihrer Stellung im Leben in Relation zur Kultur und dem Wertesystem, in dem sie lebt und in Bezug auf ihre Ziele, Erwartungen und Anliegen. Das Konzept wird im hohen Maße durch die körperliche Gesundheit, den psychologischen Zustand, den Grad der Unabhängigkeit, die sozialen Beziehungen und den einwirkenden Eigenschaften aus der Umwelt beeinflusst (WHOQOL Group 1994). In Anlehnung daran schreibt Monika Bullinger: Lebensqualität bedeutet hier [in der Medizin] die vom Befragten ausgehende Beurteilung von Befinden und Funktionsfähigkeit in psychischen, physischen, sozialen und emotionalen Lebensbereichen (Bullinger 1996). Bei den angeführten Definitionen sind somit zwei Aspekte von besonderer Bedeutung. Zum einen die Multidimensionalität des Konzeptes und zum anderen die Perspektive, die von der betroffenen Person ausgeht. Besonders diese subjektive, patientenzentrierte Sichtweise leistet einen erheblichen Beitrag zur Stärkung der Position des Betroffenen bei der Bewertung von medizinischen Behandlungsmaßnahmen. In Form von krankheitsübergreifenden oder krankheitsspezifischen Messverfahren haben, wie bereits erwähnt, subjektive Aspekte des körperlichen und seelischen Befindens verstärkt Eingang in die evaluative und die versorgungsepidemiologische Forschung gefunden. Dass Aspekte der gesundheitsbezogenen Lebensqualität auch aus regulatorischer Sicht von hoher Bedeutung sind, lässt sich z.b. durch die Veröffentlichung des Diskussionspapiers der European Medicines Agency (EMEA) über die Verwendung von Messverfahren der gesundheitsbezogenen Lebensqualität (EMEA 2005) oder der von der US-amerikanischen Food and Drug Administration (FDA) herausgegebenen Anleitung zur Verwendung von PRO-Instrumenten zur Bewertung medizinischer Technologien (FDA 2006) belegen. Auch in Deutschland wird - 9 -

10 die gesundheitsbezogene Lebensqualität vom Institut für Qualität und Wirtschaftlichkeit im Gesundheitswesen (IQWiG) bei der Bewertung medizinischer Interventionen als ein wichtiger Ergebnisparameter berücksichtigt (IQWiG 2007). Darüber hinaus ist mit dem Inkrafttreten des GKV-Wettbewerbsstärkungsgesetzes der Gemeinsame Bundesausschuss (G-BA) ermächtigt, das IQWiG nach 139 b Abs. 1 SGB V auch mit der gesundheitsökonomischen Kosten-Nutzen-Bewertung von Arzneimitteln zu beauftragen. In diesem Zusammenhang spielen patientennahe Ergebnisparameter im Allgemeinen und die präferenzbasierte Messung der gesundheitsbezogenen Lebensqualität im Besonderen eine wichtige Rolle. 1.1 Die präferenzbasierte Lebensqualitätsmessung Für den Einsatz in gesundheitsökonomischen Studien wurden im Sinne einer gemeinsamen Währung spezielle Verfahren zur Erhebung der gesundheitsbezogenen Lebensqualität entwickelt. In diesen werden die verschiedenen Einzelaspekte der gesundheitsbezogenen Lebensqualität zu einer eindimensionalen Maßzahl, einem Indexwert, zusammengefasst und können dann den Kosten einer medizinischen Maßnahme gegenübergestellt werden. Bei den aggregierten Maßzahlen handelt es sich um so genannte Nutzwerte ( utilities ), die Präferenzen zwischen verschiedenen Gesundheitszuständen auf einer kardinalen Skala, die in der Regel von 0 (Tod) bis 1 (vollständige Gesundheit) reicht, abbilden. Zur direkten Bestimmung der Nutzwerte werden in der Gesundheitsökonomie vor allem drei Verfahren eingesetzt: - das Standard-Gamble-Verfahren (Torrance 1986, Froberg & Kane 1989), - das Time-Trade-Off-Verfahren (Torrance et al. 1972), - das Rating-Scale-Verfahren (Patrick & Erickson 1993). In diesen Verfahren geben die Befragten in systematischer Weise Präferenzurteile ab, aus denen durch geeignete Berechnungsvorschriften die gesuchten Nutzwerte ermittelt werden. Ein Hauptproblem dieser Methoden ist, dass zur Ermittlung der Nutzwerte bei allen in einer Studie eingeschlossenen Personen zeitaufwändige Interviews durchgeführt werden müssen. Aus diesem Grund sind vereinfachte Erhebungsverfahren in Form selbstauszufüllender Fragebögen entwickelt worden, mit deren Hilfe verschiedene Gesundheitszustände in deskriptiver Form ermittelt werden können. Die Nutzwerte der unterschiedlichen Gesundheitszustände

11 werden dabei einmalig an einem geeigneten Referenzkollektiv und mit Hilfe einer der drei oben genannten Methoden normiert. Die ermittelten Präferenzwerte können dann mit geeigneten statistischen Methoden, wie z.b. regressionsanalytischen Verfahren, in eine Wertetabelle überführt werden. Diese Tabelle enthält für jeden möglichen Gesundheitszustand einen entsprechenden Nutzwert. Zur präferenzbasierten Erhebung des aktuellen Gesundheitszustandes stehen in deutscher Ü- bersetzung der EuroQol-Fragebogen (EQ-5D; EuroQol Group 1990), der 15D-Fragebogen (15D; Sintonen 1994, Sintonen 1995, Sintonen 2001), die Versionen des Health Utilities Index (HUI; Feeny et al. 1995, Horsman et al. 2003), die Short-Form-6-Dimensions (SF-6D; Brazier et al. 2002) und die Quality of Well-being Scale - self-administered (QWB-SA; Kaplan et al. 1997, Sieber et al. 2004) zur Verfügung. Eine ausführliche Darstellung der genannten direkten Messmethoden zur Nutzwertbestimmung und der verfügbaren deskriptiven Instrumente zur präferenzbasierten Lebensqualitätsmessung findet sich bei Moock et al. (2005, Kap. 6.1). Dabei ist den Fragebögen gemeinsam, dass sie immer aus einem multidimensionalem Klassifikationssystem zur Unterscheidung von Gesundheitszuständen und einer Bewertungsfunktion bestehen, die jedem Krankheitszustand, der innerhalb dieses Systems unterschieden werden kann, einen Nutzwert zuordnet. Brazier et al. (2007) weisen jedoch darauf hin, dass die verfügbaren Instrumente zur präferenzbasierten Lebensqualitätsmessung auch erhebliche Unterschiede aufweisen. Tabelle 1 gibt einen Überblick über zentrale Merkmale der genannten Instrumente. Unterschiede zeigen sich sowohl in der verwendeten Methode zur Normierung der Nutzwerte, als auch in der Anzahl der erfassten Dimensionen. Interessant ist, dass der EQ-5D und der HUI 3 auch negative Nutzwerte aufweisen können. Diese Nutzwerte, die Gesundheitszustände schlechter als der Tod repräsentieren, werden zum Teil kontrovers diskutiert und deren Existenz angezweifelt

12 Tabelle 1: Übersicht über standardisierte, in deutscher Sprache verfügbare Fragebögen zur indirekten Nutzwerterhebung EQ-5D 15D HUI 2 HUI 3 SF-6D QWB-SA Methode* TTO RS, ME RS RS SG RS Anzahl der Dimensionen Antwortstufen Gesundheitszustände 243 > Wertebereich der Indexwerte -0,6-1,0 0,1-1,0 0-1,00-0,4-1,00 0,2-1,00 0-1,00 * Time-Trade-Off (TTO); Rating-Scale (RS); Magnitude Estimation (ME); Standard Gamble (SG) Einige der genannten Instrumente wurden international in verschiedenen Indikationsgruppen hinsichtlich ihrer psychometrischen Eigenschaften vergleichend untersucht. Einen Überblick der publizierten direkten Vergleiche geben Kopec und Willison (2003) sowie Brazier et al. (2007). Für Deutschland lagen solche Vergleiche bis vor kurzem nicht vor. In Moock und Kohlmann (2008, Kap. 6.3) wurden erstmalig alle sechs in deutscher Sprache verfügbaren präferenzbasierten Messverfahren in drei Indikationsgruppen von Reha-Patienten vergleichend untersucht. 1.2 Gesundheitsökonomische Evaluation, das Konzept qualitäts-adjustierter Lebensjahre und die Prospect Theory Der Begriff gesundheitsökonomische Evaluation steht synonym für verschiedene Konzepte der vergleichenden Bewertung von Kosten und Nutzen medizinischer Interventionsalternativen (Abbildung 1). Gemeinsam ist den Konzepten, dass sie die alternativen Behandlungsmöglichkeiten hinsichtlich verschiedener Qualitätskriterien bewerten und die Kosten- und Nutzendifferenz ermitteln, um so eine Aussage über das Kosten-Nutzen-Verhältnis treffen zu

13 können. Hierbei können Ergebnisse zu patientennahen Outcome-Parametern als Indikatoren des Nutzens prinzipiell in der gleichen Weise wie klinische Zielgrößen verwendet werden. Abbildung 1: Übersicht über die Methoden der gesundheitsökonomischen Evaluation Ein besonderer Stellenwert in der gesundheitsökonomischen Evaluation kommt unter Einbeziehung patientennaher Outcome-Kriterien der Kosten-Nutzwert-Analyse ( cost-utility analysis, CUA) zu. Bei diesem Studientyp erfolgt die Nutzenbewertung durch die Gegenüberstellung von Kosten (in monetären Einheiten) und einem Nutzwert, z.b. in Form qualitätsadjustierter Lebensjahre ( quality adjusted life years, QALYs) (Drummond et al. 2005, Schöffski 2007). Die Kosten-Nutzwert-Analyse hat gegenüber den anderen ökonomischen Analyseverfahren, wie der Kosten-Wirksamkeits- ( cost-effectiveness analysis, CEA) oder der Kosten-Nutzen-Analyse ( cost-benefit analysis, CBA), den Vorteil, dass den Kosten der subjektive Gesundheitszustand und nicht objektive Sachverhalte, wie z.b. eine therapiebedingte Veränderung des Blutdrucks in einer Kosten-Wirksamkeits-Analyse bzw. in Geldeinheiten bewertete Effekte in einer Kosten-Nutzen-Analyse, gegenübergestellt werden. Wenigstens im Prinzip werden dadurch weitreichende Vergleiche verschiedener medizinischer Therapie- und Interventionsformen ermöglicht. Zur Generierung von QALYs werden Nutzwerte, die mit einem der in Abschnitt 1.1 vorgestellten präferenzbasierten Verfahren erhoben wurden, mit Angaben zur Lebenszeit verknüpft (Schöffski & Greiner 2007, vgl. auch Moock et al. 2005). Erst die Berechnung von QALYs

14 bzw. der Differenz von QALYs verschiedener Behandlungsszenarien ermöglicht in gesundheitsökonomischen Kosten-Nutzwert-Analysen eine Betrachtung des Verhältnisses von Kosten und Nutzen einer medizinischen Technologie. Aus einer Übersicht von Zentner und Busse (2006) geht hervor, dass international der Gebrauch von QALYs im Rahmen von gesundheitsökonomischen Evaluationen weit verbreitet ist und von einer Vielzahl von Bewertungsinstitutionen, u.a. vom National Institute for Health and Clinical Excellence (NICE) in England und Wales, explizit gefordert wird. Auch in Deutschland sprechen sich führende Gesundheitsökonomen und Lebensqualitätsforscher für eine Anwendung des QALY-Konzeptes zur Bewertung medizinischer Technologien aus. Jüngst hat die Arbeitsgemeinschaft Methoden der gesundheitsökonomischen Evaluation (AG MEG) zu dem Methodenpapier Methodik für die Bewertung von Verhältnissen zwischen Nutzen und Kosten im System der deutschen gesetzlichen Krankenversicherung des IQWiG (2008) eine Stellungnahme verfasst, die die Vor- und Nachteile des QALY- Konzeptes zur Kosten-Nutzen-Bewertung nachzeichnet (Krauth et al. 2008). Für die Erhebung von Nutzwerten wird die Standard-Gamble-Methode als das theoretisch fundierteste Verfahren empfohlen (Russell et al. 1996). Wie bereits in Abschnitt 1.1 ausgeführt wurde, ermöglicht das Standard-Gamble-Verfahren die direkte kardinale Erhebung von Nutzwerten. Sie gründet auf der Erwartungsnutzentheorie ( expected utility theory, EUT) nach von Neumann und Morgenstern (1953). Die vergleichende Bewertung von medizinischen Interventionen anhand der Betrachtung von QALYs und die Erhebung von Nutzwerten mit dem Standard-Gamble-Verfahren ist jedoch nicht unumstritten und wird kontrovers diskutiert. Begründet wird dies vor allem damit, dass das QALY-Konzept vom Zutreffen verschiedener Voraussetzungen ausgeht. Hierzu gehören einige technische Axiome, die sich direkt aus der Erwartungsnutzentheorie ableiten. Unter anderem wird vorausgesetzt, dass (1) der Entscheidende risikoneutral in Bezug auf die Lebensjahre ist, (2) die Trade-Offs konstant proportional sind und (3) eine wechselseitige Unabhängigkeit (additive Separabilität) von Lebensqualität und Restlebenserwartung vorhanden ist. Der aktuelle Forschungsstand zeigt, dass es durchaus Zweifel bezüglich der Gültigkeit des QALY-Konzeptes gibt (Bleichrodt & Johannesson 1997, Duru et al. 2002). Tsuchiya & Dolan (2005) konnten in ihrer systematischen Literaturübersicht zum QALY-Konzept Verletzungen der oben genannten Voraussetzungen beobachten

15 Ebenfalls unklar ist, wessen Nutzwerte über Prioritäten entscheiden sollen und ob das Standard-Gamble-Verfahren tatsächlich als Goldstandard betrachtet werden kann. Verschiedene Perspektiven, z.b. Patientenperspektive, gesamtgesellschaftliche Perspektive, sind denkbar. Experten plädieren dafür, die Präferenzen der Allgemeinheit zu nutzen (Gold et al. 1996, Graf von der Schulenburg et al. 2007). Allerdings haben Patienten häufig ein anderes Verständnis über die Dringlichkeit einzelner medizinischer Maßnahmen als z.b. normalgesunde Personen aus der Allgemeinbevölkerung. Um die skizzierten Fragestellungen und empirischen Herausforderungen zu lösen, werden seit einiger Zeit Theorien diskutiert, die die Kritik und empirischen Schwierigkeiten der normativen Annahmen der Erwartungsnutzentheorie und damit des QALY-Konzeptes und des Standard-Gamble-Verfahrens aufgreifen und empirisch untersuchen. Ein sehr prominenter Vertreter ist die Neue Erwartungsnutzentheorie ( Prospect Theory, PT) nach Kahneman und Tversky (1979, 2000). Zentrale Bestandteile dieser Theorie sind die Gewichtung von Wahrscheinlichkeiten, die subjektiv in ein Entscheidungskalkül eingehen, und die Existenz eines individuellen Referenzpunktes, der die Entscheidung beeinflusst. Zum Beispiel kann ein solcher Referenzpunkt der gegenwärtige Gesundheitszustand eines Befragten oder Patienten sein. Die Prospect Theory unterscheidet zwischen einer Entscheidungs- und einer Editing-Phase (Kahnemann & Tversky 1979). In der Editing-Phase werden die zur Verfügung stehenden Daten aufbereitet, um die Entscheidungsphase zu vereinfachen. Die Editing-Phase umfasst dabei verschiedene Prozeduren, u.a. die Kodierung ( coding ). Bei der Kodierung wird ein Referenzpunkt gesetzt, von dem aus die Beurteilung der vorhandenen Alternativen erfolgt. Ein weiterer zentraler Bestandteil der Theorie ist die gewichtete Wahrscheinlichkeitsfunktion (vgl. Abbildung 2). Der Referenzpunkt teilt dabei den Bewertungsraum in einen Gewinn- und einen Verlustbereich. Im Gewinnbereich hat die Wertfunktion einen konkaven, im Verlustbereich einen konvexen Verlauf. Die Verlustfunktion ist steiler als die Gewinnfunktion, d.h. Individuen neigen dazu, Wahrscheinlichkeiten für Gewinne zu unterschätzen und Wahrscheinlichkeiten für Verluste zu überschätzen

16 Abbildung 2: Unterschiedliche Nutzwerte in Abhängigkeit vom Referenzpunkt Utility of health Value of health Loss domain Loss domain Reference point Reference Point Gain domain Gain domain Health Health Wie bereits diese sehr gestraffte Darstellung der Grundsätze der Kosten-Nutzwert-Analyse zeigt, begründet sich der hohe Aggregationsgrad bei der Berechnung von Lebensqualitätsindizes in der gesundheitsökonomischen Analyse weniger durch konzeptuelle Überlegungen darüber, ob die subjektive Gesundheit tatsächlich als eindimensionales Konstrukt zu fassen ist. Vielmehr ist die Berechnung eines einzigen Skalenwerts durch die Notwendigkeit seines Bezugs auf eine (ebenfalls eindimensionale) Menge an Kosten motiviert. Nur wenn Lebensqualität als singuläre Größe bestimmt wird, ist es möglich, sie als Nenner in einem Kosten- Nutzwert- oder Kosten-QALY-Quotienten zu verwenden

17 1.3 Fragestellung und Ziele dieser Arbeit Das primäre Ziel dieser Arbeit ist die detaillierte Beschreibung, Anwendung und empirische Untersuchung der psychometrischen Güte der generischen indirekten Verfahren zur präferenzbasierten Lebensqualitätsmessung. Darüber hinaus werden unter Rückgriff auf die Prospect Theory (Kahneman & Tversky 1979, Tversky & Kahneman 2000) die drei direkten Verfahren zur Messung der gesundheitsbezogenen Lebensqualität empirisch untersucht. Die Beschreibung der dieser Arbeit zugrundeliegenden Studien sowie die Bearbeitung der Fragestellungen erfolgte im Rahmen einzelner Publikation. Die Einzelarbeiten haben folgenden Inhalt: A. Moock J, Kohlmann T, Besch D, Drüner K. Nutzentheoretische Lebensqualitätsmessinstrumente in der medizinischen Rehabilitation: Ein anwendungsbezogener Vergleich. Zeitschrift für Medizinische Psychologie 2005; 14: Ziel dieser Publikation war es, die Grundzüge der gesundheitsökonomischen Evaluation zu beschreiben sowie die direkten Verfahren zur Bestimmung von Nutzwerten und die in deutscher Sprache verfügbaren präferenzbasierten Instrumente vorzustellen und zu diskutieren. Darüber hinaus erfolgt ein erster anwendungsbezogener Vergleich von fünf präferenzbasierten Instrumenten (EQ-5D, 15D, HUI 2, SF-6D und QWB-SA) in einer Stichprobe von Rehabilitationspatienten. B. Moock J, Kohlmann T, Zwingmann C. Patient-reported outcomes in rehabilitation research: instruments and current developments in Germany. J Public Health 2006; 14: Qualitäts- und Effizienzsteigerung sind Begriffe, die aus dem gesundheitspolitischen Sprachgebrauch kaum noch wegzudenken sind. Auch der Bereich der Rehabilitation unterliegt diesem wachsenden finanziellen Druck. Überlegungen zur Qualitätssicherung und effizienzsteigernden Ressourcenallokation werden daher zunehmend angestrengt. Mit der Förderung von insgesamt acht Reha-Forschungsverbünden über einen zweiphasigen Zeitraum von insgesamt acht Jahren ( , ), ergaben sich auf dem Gebiet der Messung der gesundheitsbezogenen Lebensqualität von Rehabilitati

18 onsmaßnahmen hinsichtlich konzeptioneller und methodischer Fragestellungen neue Erkenntnisse (Hessel et al. 1999, Burchert et al. 1999, Seitz et al. 1999, 2001). Ziel dieser Arbeit war es, die Forschungsaktivitäten zur Entwicklung und Validierung von Assessmentverfahren in der Rehabilitation in Form einer systematischen Literaturübersicht zusammenzufassen. Der Schwerpunkt wurde dabei auf die Verfahren zur Messung der gesundheitsbezogenen Lebensqualität, insbesondere der präferenzbasierten Lebensqualitätsmessung gelegt. C. Moock J, Kohlmann T. Comparing preference-based quality of life measures: Results from rehabilitation inpatients with musculoskeletal, cardiovascular or psychosomatic disorders. Qual Life Res 2008; 17(3): online first: DOI /s In Deutschland sind nutzentheoretische Messungen der Lebensqualität sowohl in Form genuiner Nutzwertbestimmungen als auch durch Anwendung vereinfachter Fragebogenmethoden bisher nur sporadisch eingesetzt worden. In der Literatur existieren keine vergleichenden Studien, in denen die Anwendbarkeit, Angemessenheit und methodische Qualität dieser Messmethoden in Deutschland systematisch untersucht wurden. Vor diesem Hintergrund verfolgte diese Arbeit das Ziel, in vergleichenden Analysen der in verschiedenen Gruppen von Rehabilitationspatienten erhobenen Daten zu zeigen, welche der Selbstbeurteilungsmethoden zur präferenzbasierten Messung der Lebensqualität unter methodischen Gesichtspunkten im Bereich der Rehabilitation am besten einsetzbar sind. Dieses Ziel umfasst sowohl eine grundlagenorientierte als auch eine anwendungsbezogene Perspektive. Die Ergebnisse geben Hinweise auf die adäquate Verwendung und Interpretation der präferenzbasierten Lebensqualitätsmessung im Rahmen der rehabilitationswissenschaftlichen Outcome-Forschung. D. Konerding U, Moock J, Kohlmann T. The classification systems of the EQ-5D, the HUI II and the SF-6D: What do they have in common? Med Care; im Begutachtungsprozess. Drei (EQ-5D, HUI 2, SF-6D) der in Abschnitt 1.1 genannten sechs Messinstrumente sind international weit verbreitet und werden insbesondere in Kanada, England und Wales sowie in den USA in gesundheitsökonomischen Kosten-Nutzwert-Bewertungen

19 medizinischer Interventionen eingesetzt (Räsänen et al. 2006). Gemeinsam ist diesen Verfahren das zugrundeliegende Konstrukt, die Messung der gesundheitsbezogenen Lebensqualität und die Generierung von Nutzwerten für bestimmte definierte Gesundheitszustände. Für die Vergleichbarkeit unterschiedlicher gesundheitsökonomischer Evaluationen wäre es ideal, wenn die Verfahren immer demselben Krankheitszustand denselben Nutzenwert zuweisen. Inwieweit dies gegeben sein kann, hängt wesentlich davon ab, ob die in den Verfahren verwendeten Klassifikationssysteme ineinander überführt werden können. Vor diesem Hintergrund war es das Ziel dieser Arbeit, die Klassifikationssysteme des EQ-5D, des HUI 2 und des SF-6D vergleichend zu analysieren. E. Happich M, Moock J, von Lengerke T. Health Valuation Methods and Reference Points: the Case of Tinnitus. Value in Health 2008; im Druck. Die Kostenentwicklung im Gesundheitswesen führt gegenwärtig dazu, dass über die Bewertung und möglicherweise Priorisierung von medizinischen Behandlungsmaßnahmen diskutiert wird. Die gesundheitsökonomische Evaluation bietet hierzu Verfahren, wie die in Abschnitt 1.2 vorgestellte Kosten-Nutzwert-Analyse, an. Dabei ist die Ermittlung von QALYs das international dominierende Verfahren zur Beurteilung des Nutzens einer medizinischen Intervention. Das QALY-Konzept ist jedoch nicht unumstritten und insbesondere die Ermittlung von Nutzwerten mit direkten Messmethoden wie dem Standard-Gamble- oder Time-Trade-Off-Verfahren werden dabei kritisch betrachtet (Drummond 1991). Insbesondere die Standard-Gamble-Methode basiert auf den axiomatischen Annahmen der Erwartungsnutzentheorie nach von Neumann und Morgenstern (1953). Eingangs (Kapitel 1.2) wurden drei Grundannahmen der Erwartungsnutzentheorie angeführt, deren Gültigkeit nach wie vor kontrovers diskutiert wird (Tsuchiya & Dolan 2005). Vor diesem Hintergrund werden in der Arbeit von Happich et al. (2008) das Rating- Scale-, das Time-Trade-Off- und das Standard-Gamble-Verfahren unter Berücksichtigung der Annahmen der Prospect Theory empirisch am Beispiel des Tinnitus untersucht

20 2. Material und Methoden Die Daten, die dieser Arbeit zugrunde liegen, stammen aus zwei Studien. Das Projekt Methodische Aspekte der nutzentheoretischen Lebensqualitätsmessung (Z2.2) wurde in der zweiten Förderphase des Norddeutschen Verbunds für Rehabilitationsforschung (NVRF) von 2001 bis 2005 durchgeführt (Förderkennzeichen: 01GD0106). Im Rahmen dieses Projektes wurden die bereits genannten Selbstbeurteilungsinstrumente (EQ-5D, 15D, HUI 2, HUI 3, SF-6D und QWB-SA) zusammen mit relevanten generischen und indikationsspezifischen Vergleichsinstrumenten (u.a. Short-Form-36-Items (SF-36), Nottingham Health Profile (NHP)) bei Patienten, die in den Indikationsgruppen a) muskulo-skelettale Krankheiten, b) Herz-Kreislaufkrankheiten und c) Psychosomatik an einer stationären Rehabilitationsmaßnahme teilnahmen, eingesetzt. Die Manuskripte Moock et al. (2005, Kap. 6.1), Moock und Kohlmann (2008, Kap. 6.3) und Konerding et al. (im Begutachtungsprozess, Kap. 6.4) sind aus diesem Projekt hervorgegangen. Die Studie Die Bewertung von Gesundheit am Beispiel Tinnitus wurde im Rahmen des Graduiertenkollegs Bedarfsgerechte und kostengünstige Gesundheitsversorgung durchgeführt. Die Förderung des Graduiertenkollegs erfolgte durch die Deutsche Forschungsgemeinschaft (DFG). In zwei gleichgroßen Gruppen (Personen mit einer Tinnitus-Erkrankung und Person aus der Allgemeinbevölkerung), parallelisiert nach Alter und Geschlecht, wurden mit den nutzentheoretischen Erhebungsmethoden Standard-Gamble, Time-Trade-Off und Rating- Scale Nutzwerte für den Tinnitus ermittelt. Das Manuskript Happich et al. (2008, Kap. 6.5) basiert auf dieser Studie. 2.1 Datenerhebung und Stichproben Studie: Methodische Aspekte der nutzentheoretischen Lebensqualitätsmessung Die Erhebung in den drei Indikationsgruppen erfolgte in Kooperation mit zwei Rehabilitationseinrichtungen: Rehabilitationsklinik der LVA Sachsen-Anhalt (Göhren/Rügen) Dünenwald Klinik Insel Usedom (Trassenheide/Usedom)

21 Die Befragung fand zu Beginn und am Ende der dreiwöchigen (muskulo-skelettale Erkrankung und Herz-Kreislauf-Erkrankung) bzw. sechswöchigen (Psychosomatik) Rehabilitationsmaßnahme, im Zeitraum von März 2004 bis Januar 2005, statt. In dieser Zeit wurden alle Patienten in den genannten Indikationen initial vom aufnehmenden Arzt angesprochen, über die Studie informiert und um die Teilnahme gebeten. Patienten wurden in die Studie eingeschlossen, wenn sie 18 Jahre oder älter waren und über ausreichende Deutschkenntnisse verfügten. Ausgeschlossen wurden psychosomatische Patienten, die aufgrund einer Essstörung (z.b. Anorexie, Bulimie) behandelt wurden. Die Ausgabe des Fragebogens zusammen mit einem vorbereiteten Rückumschlag und einem Informationsblatt erfolgte durch die Studienmitarbeiter. Die ausgefüllten Fragebögen konnten dann im Schwesternzimmer oder an der Rezeption abgegeben werden. Eine Erinnerung bei Nichtabgabe des Fragebogens erfolgte nicht. Gegen Ende der Rehabilitationsmaßnahme erfolgte die Ausgabe des zweiten Fragebogens durch die Mitarbeiter der jeweiligen Einrichtung. Die Ethikkommission der Medizinischen Fakultät der Ernst-Moritz-Arndt-Universität Greifswald und die Datenschutzbeauftragte der Bundesversicherungsanstalt für Angestellte (BfA) wurden in die Studienplanung einbezogen und äußerten keine Bedenken gegen die Befragung. Alle Maßnahmen des Datenschutzes (Anonymisieren der Fragebögen, getrenntes Aufbewahren von personenbezogenen Daten und Erhebungsergebnissen) wurden sichergestellt. Zur Qualitätssicherung erfolgte eine vollständige Doppeleingabe der Daten. Studie: Die Bewertung von Gesundheit am Beispiel Tinnitus Die Erhebung erfolgte in zwei gleichgroßen Stichproben im Zeitraum von September 2000 bis Januar Die Rekrutierung von Patienten mit einem Tinnitus fand an Einrichtungen bzw. Krankenhäusern in Berlin und Umgebung statt: Deutsche Tinnitus-Liga e.v. (Berlin) Heinrich-Heine-Klinik (Potsdam) Hals-, Nasen-, Ohren-Abteilung der Charité (Berlin) Personen aus der Allgemeinbevölkerung wurden an vier verschiedenen öffentlichen Plätzen in Berlin angesprochen und um die Teilnahme an der Studie gebeten. Die Teilnahme an der Studie war freiwillig ( informed consent ) und die Anonymität gewährleistet. Die geltenden Rahmenbedingungen zur Sicherstellung des Datenschutzes wurden berücksichtigt. Einge

22 schlossen wurden Patienten mit einem Tinnitus und einem ausreichenden Verständnis der deutschen Sprache. Personen aus der Allgemeinbevölkerung wurden in die Befragung eingeschlossen, wenn sie als Erstwohnsitz Berlin angaben und aktuell nicht an einem Tinnitus erkrankt waren. 2.2 Erhebungsinstrumente Studie: Methodische Aspekte der nutzentheoretischen Lebensqualitätsmessung Eine ausführliche Beschreibung der verwendeten Instrumente findet sich in Moock et al. (2005) und Moock und Kohlmann (2008). Zu beiden Messzeitpunkten erfolgte die Erhebung der gesundheitsbezogenen Lebensqualität mit den Selbstbeurteilungsinstrumenten EQ-5D, 15D, HUI, SF-36 Version 2 (zur Generierung von SF-6D Indexwerten) und QWB-SA, die zu einem Fragebogen zusammengefasst wurden. Soziodemographische Angaben wurden zum ersten Messzeitpunkt erhoben. Zum zweiten Messzeitpunkt erfolgte zusätzlich die Erhebung der gesundheitlichen Veränderung in der Zeit der Rehabilitation in den Bereichen: allgemeine Gesundheit, körperliches Befinden, Stimmung/seelische Verfassung und Vitalität/Energie mit einer fünfstufigen Antwortskala. Studie: Die Bewertung von Gesundheit am Beispiel Tinnitus Eine ausführliche Beschreibung der verwendeten Methoden findet sich in Happich et al. (2008). Die Studienteilnehmer wurden mit den direkten Messverfahren zur Nutzwertbestimmung (Standard-Gamble, Time-Trade-Off, Rating-Scale) interviewt und um ihre Bewertung für den Gesundheitszustand Tinnitus-Erkrankung gebeten. Personen, denen diese Erkrankung unbekannt war, wurde ein Hörbeispiel vorgespielt. Darüber hinaus erfolgte eine detaillierte Beschreibung des Tinnitus und seiner Begleiterscheinungen, die in Zusammenarbeit mit Medizinern und Patienten erstellt wurde. Zur Erhebung der Präferenzwerte wurde, erstens, das Alter der Befragten erfragt. Danach wurden die Studienteilnehmer gebeten, eine Prognose über ihre Lebenserwartung zu geben. Die Differenz aus Alter und Prognose ergibt die Anzahl an subjektiv geschätzter Restlebenserwartung. Auf eine vom Interviewer vorgegebene feste Zahl verbleibender Lebensjahre wurde in Anlehnung an die Prospect Theory bewusst verzichtet, da empirische Untersuchungen gezeigt haben, dass je nach individueller Erwartungshaltung eine Restlebenszeit von z.b

23 Jahren als zu kurz bzw. zu großzügig im Verhältnis zu den eigenen Vorstellungen gewertet wird und dies einen direkten Einfluss auf die Bereitschaft hat, bei der Time-Trade-Off- Methode Lebensjahre abzugeben (Verhoeff et al. 1994). Die Frage zur Ermittlung der verbleibenden Lebenserwartung, die den Zähler des Time-Trade-Off-Verhältniswertes bestimmt, ist in Abbildung 3 dargestellt. Abbildung 3: Time-Trade-Off Frage Ein Gedankenspiel: Angenommen, Sie könnten sich auf einen Tausch einlassen: Sie würden diese Geräusche los, dafür verringert sich Ihre Lebenserwartung. Wie hoch müsste Ihre Lebenserwartung dennoch mindestens sein, damit Sie sich auf den Tausch einlassen? Jahre Der Begriff Geräusche bezieht sich dabei auf den untersuchten Gesundheitszustand Tinnitus. Als Beispiel, wurde ein Medikament beschrieben, welches von den Symptomen befreit, aber gleichzeitig die Lebenserwartung beeinflusst. Diese Frage wurde solange wiederholt, bis sich der Befragte nicht mehr zwischen Tausch und Nicht-Tausch entscheiden konnte und somit zwischen den Alternativen indifferent war. Die Frage zur Erhebung der Präferenzen mit dem Standard-Gamble-Verfahren, ist in Abbildung 4 illustriert. Abbildung 4: Standard-Gamble Frage Ein zweites Gedankenspiel: Sie stellen sich bitte vor, Tinnitus ließe sich erfolgreich operieren. Diese Operation ist allerdings mit Risiken verbunden. Wie hoch müsste die Überlebenswahrscheinlichkeit auf jeden Fall sein, so dass Sie sich auf eine Operation einlassen würden? Prozent Als Beispiel wurden Anästhesierisiken genannt, welche die Überlebenswahrscheinlichkeit herabsenken können. Diese Frage wurde solange wiederholt, bis sich der Befragte nicht mehr zwischen Operation und Nicht-Behandlung entscheiden konnte. Die Messung der individuellen Risikoeinstellung als Indikator des Referenzpunktes wurde mit einer fünfstufigen Skala am Beispiel einer Operation erfragt (Abbildung 5)

24 Abbildung 5: Bezugspunkt Frage Würden Sie sich einer Operation unterziehen, die Ihren Zustand deutlich verbessern, aber auch genauso deutlich verschlechtern könnte? Auf keinen Fall Unwahrscheinlich Vielleicht Wahrscheinlich Auf jeden Fall Die Befragung erfolgte interviewgestützt und wurde von einem Interviewer (Dr. Michael Happich) durchgeführt. Die Interviews dauerten durchschnittlich 10 bis 20 Minuten. 2.3 Analysen und statistische Methoden Das Datenmanagement erfolgte in beiden Studien mit dem Programm Microsoft Access. Die Datenanalysen wurden jeweils mit der Statistik-Software SPSS für Windows (Versionen 12.0, 15.0 oder 16.0) durchgeführt. Studie: Methodische Aspekte der nutzentheoretischen Lebensqualitätsmessung Die Auswertung in Moock und Kohlmann (2008) erfolgte getrennt für die drei Indikationsgruppen. Zur Datenexploration wurden Methoden der deskriptiven Statistik verwendet. Vergleichende Analysen erfolgten anhand der deskriptiven Kennwerte, Anzahl fehlender Werte und Häufigkeitsverteilungen. Zur Untersuchung der Übereinstimmung der Indexwerte wurden Intra-Klassenkorrelations-Koeffizienten (ICCs) berechnet (Shrout & Fleiss 1979, Deyo et al. 1991). Für die Interpretation der Korrelationskennwerte wurde die folgende Konvention nach Rosner (2005) angewandt: Ein ICC < 0,40 beschreibt eine schwache Übereinstimmung, 0,40 ICC < 0,75 eine moderate Übereinstimmung und ein ICC 0,75 eine starke Übereinstimmung. Ein wichtiges Kriterium für den Einsatz eines Ergebnisparameters in evaluativen Studien ist die Änderungssensitivität ( responsiveness ), d.h. die Fähigkeit eines Messverfahrens, Veränderungen im Zeitverlauf abbilden zu können. Vergleiche zur Änderungssensitivität wurden anhand von t-tests für verbundene Stichproben und standardisierten Mittelwertdifferenzen ( standardized response mean, SRM) unternommen. Bei der Berechnung von SRM wird die Mittelwertdifferenz in Bezug zur Standardabweichung der Differenz gesetzt. Zur Analyse der Klassifikationssysteme des EQ-5D, HUI 2 und SF-6D in Konerding et al. (im Begutachtungsprozess) wurden die Daten der drei Indikationsgruppen gepoolt. Die Schätzung

25 der Intervalle zwischen den einzelnen Kategorien erfolgte mit Verfahren aus der Gruppe der nicht-linearen Faktorenanalyse (Gifi 1990) aus dem SPSS Modul zur optimalen Skalierung ( optimal scaling module ). Die optimale Skalierung kann dazu dienen, den Kategorien einer Variable numerische Quantifizierungen zuzuweisen. Sie bietet damit die Möglichkeit weitere statistische Standardprozeduren anzuwenden, um so eine Lösung für die quantifizierten Variablen zu erhalten. Die optimalen Skalenwerte werden den Kategorien der einzelnen Variablen anhand des Optimierungskriteriums für die verwendete Prozedur zugewiesen. Anders als die ursprünglichen Werte der ordinalen Variablen erreichen die Skalenwerte nun metrische Eigenschaften. Im Rahmen von multivariaten, linearen Regressionsmodellen erfolgte anschließend die vergleichende Analyse der Dimensionen des EQ-5D, HUI 2 und SF-6D. Für jede der fünf EQ- 5D-, der sechs HUI-2- und der sechs SF-6D-Dimensionen wurde eine lineare Regression mit den Dimensionen der zwei anderen Instrumente als Prädiktoren berechnet. Insgesamt wurden 34 lineare Regressionen berechnet. Berichtet wurden standardisierte und unstandardisierte Korrelationskoeffizienten und der adjustierte, multiple Korrelationskoeffizient R 2, zur Beschreibung des Anteils erklärter Varianz im Verhältnis zur Gesamtvarianz. Studie: Die Bewertung von Gesundheit am Beispiel Tinnitus In Happich et al. (2008) erfolgten vergleichende Analysen der deskriptiven Kennwerte für Variablen mit metrischen Skalenniveau anhand von t-tests für unverbundene Stichproben und für Variablen mit kategorialen Skalenniveau mit dem Chi 2 -Test. Multivariate Analysen wurden mit Methoden aus der Gruppe der Allgemeinen Linearen Modelle ( generalized linear models, GLM) durchgeführt

26 3. Ergebnisse 3.1 Patientennahe Assessmentinstrumente in der deutschsprachigen Rehabilitationsforschung Aktuelle Entwicklungen aus dem Förderschwerpunkt Rehabilitationswissenschaften (Moock et al. 2006) Generische Profilinstrumente zur Erfassung der gesundheitsbezogenen Lebensqualität in der Rehabilitation Krankheitsübergreifende (generische) Verfahren zur Erfassung der gesundheitsbezogenen Lebensqualität sind so allgemein konzipiert, dass Vergleiche zwischen verschiedenen Krankheiten, Personengruppen bzw. Interventionen ermöglicht werden. In der Regel werden dabei mehrere Dimensionen insbesondere physische, psychische, soziale und funktionale Aspekte berücksichtigt, so dass daraus eine Profildarstellung des subjektiven Gesundheitszustands resultiert. Im Bereich der deutschsprachigen Rehabilitationsforschung werden derzeit vor allem zwei generische Lebensqualitätsinstrumente eingesetzt: der originär deutschsprachige, in seiner Langversion sehr umfassende Patientenfragebogen Indikatoren des Reha-Status (IRES, Bührlen et al. 2005, Gerdes & Jäckel 1995) und der aus den USA adaptierte, vergleichsweise komprimierte Short Form-36 Health Survey (Ware & Sherbourne 1992, Bullinger & Kirchberger 1998). Für beide Verfahren sind Kurzversionen verfügbar (IRES-MIN/IRES-24, SF-12, SF-8). Angesichts der Häufigkeit ihres Einsatzes in verschiedenen Forschungskontexten und der damit zur Verfügung stehenden Vergleichsdaten hat die verbundübergreifende Arbeitsgruppe Generische Methoden zu Beginn des Förderschwerpunkts Rehabilitationswissenschaften empfohlen, in den einzelnen Projekten als krankheitsübergreifende Instrumente den IRES-Fragebogen und den SF-36 einzusetzen, und zwar in Form einer Kombination der Langform des einen mit der jeweiligen Kurzform (IRES-MIN, SF-12) des anderen Instruments (Muthny et al. 1999). Hingewiesen werden soll auf zwei weitere generische Messverfahren, die wie der SF-36/SF- 12 interkulturell entwickelt bzw. adaptiert wurden: der World Health Organization Quality of Life Questionnaire (WHOQOL, The WHOQOL Group 1998, Angermeyer et al. 2000) und das Nottingham Health Profile (NHP, Hunt et al. 1981, Kohlmann et al. 1997). Diese beiden Verfahren werden zwar in der deutschsprachigen rehabilitationswissenschaftlichen

27 Forschung deutlich seltener verwendet, wurden aber bereits von der Arbeitsgruppe Generische Methoden positiv erwähnt (Muthny et al. 1999) und können insbesondere bei multinationalen Vergleichen mit Gewinn eingesetzt werden. Nutzentheoretische Erfassung der gesundheitsbezogenen Lebensqualität in der Rehabilitation Zu Beginn des Förderschwerpunkts Rehabilitationswissenschaften war der EQ-5D (Euro- QoL Group 1990, Greiner et al. 2005) der einzige in deutscher Sprache zur Verfügung stehende generische Gesundheitsfragebogen, der eine eindimensionale Maßzahl zur nutzentheoretischen Erfassung der Lebensqualität bereitstellte. Angesichts günstiger psychometrischer Kennwerte auch im Bereich der Rehabilitation (Seitz et al. 1999) wurde der EQ-5D zur Anwendung im Förderschwerpunkt empfohlen (Hessel et al. 1999) und von mehreren Projekten mit gesundheitsökonomischem Studienteil auch eingesetzt (Krauth et al. 2003). Seit kurzem liegen in deutscher Sprache neben dem EQ-5D fünf weitere Index-Instrumente zur nutzentheoretischen Lebensqualitätsmessung vor, die bereits in Abschnitt 1.1 vorgestellt wurden (zusammenfassend vgl. Moock et al. 2005). Ein Projekt der zweiten Phase des Förderschwerpunkts (Kohlmann, Greifswald) geht deshalb auf der Grundlage einer vergleichenden psychometrischen Untersuchung an orthopädischen, kardiologischen und psychosomatischen Patienten der Frage nach, welche der verfügbaren Verfahren im Bereich der Rehabilitation am Besten einsetzbar sind (Moock & Kohlmann 2008). Die bisherigen Ergebnisse zeigen, dass die mit den verschiedenen Instrumenten ermittelten Indexwerte nur bedingt vergleichbar sind, weil sie teilweise lediglich moderat korrelieren und zu unterschiedlichen Verteilungen führen (Moock et al. 2005)

28 3.2 Ein anwendungsbezogener Vergleich präferenzbasierter Lebensqualitätsinstrumente in der medizinischen Rehabilitation (Moock & Kohlmann 2008) In zwei Rehabilitationskliniken wurden initial 378 Reha-Patienten eingeschlossen. Zum ersten Messzeitpunkt lagen für 329 Personen (87,0%) komplette Daten vor. 292 Personen (71,1%) nahmen nach Abschluss ihrer Rehabilitationsmaßnahme ein zweites Mal an der Befragung teil. Vollständige Datensätze zu beiden Messzeitpunkten liegen von 264 Rehabilitationspatienten (69,8%) vor. Beim Vergleich der deskriptiven Kennwerte zeigten sich Unterschiede zwischen den analysierten Instrumenten. In den drei untersuchten Indikationsgruppen wies der 15D die durchschnittlich höchsten Indexwerte aus und der QWB-SA die niedrigsten (Abbildung 6). Alle Instrumente zeigten für die Gruppe der psychosomatischen Patienten die kleinsten Indexwerte an. In den drei untersuchten Gruppen erreichte kein Patient den niedrigsten möglichen Indexwert (Bodeneffekt). Deckeneffekte wurden insbesondere für den EQ-5D in allen drei Patientengruppen und für den 15D und den HUI 3 bei Personen mit einer Herz-Kreislauf- Erkrankung zum zweiten Messzeitpunkt beobachtet. Die Indexwerte des 15D, SF-6D und QWB-SA waren in allen Patientengruppen, die des HUI 3 für Patienten mit einer Herz- Kreislauf-Erkrankung oder psychosomatischen Erkrankung und die des HUI 2 für psychosomatische Patienten annähernd normalverteilt. Die EQ-5D-Indexwerte waren in den drei Patientengruppen linksschief verteilt. Die Intra-Klassenkorrelations-Koeffizienten (ICCs) zwischen den Instrumenten wiesen auf schwache bis starke Übereinstimmungen hin. Für die beiden HUI Versionen zeigten sich mit einem ICC von 0,80 (muskulo-skeletale Erkrankung) und 0,77 (Herz-Kreislauf-Erkrankung) starke Zusammenhänge. Mit einem ICC von 0,68 (muskulo-skeletale Erkrankung) und 0,65 (psychosomatische Erkrankung) konnten moderate Übereinstimmungen zwischen dem 15D und dem SF-6D beobachtet werden. Schwache Zusammenhänge zeigten sich zwischen dem EQ-5D und dem QWB-SA mit einem ICC von 0,26 (muskulo-skeletale Erkrankung) und 0,30 (psychosomatische Erkrankung). Für Patienten, die zum zweiten Messzeitpunkt angaben, dass sich ihr allgemeiner Gesundheitszustand im Vergleich zum ersten Messzeitpunkt verbessert hat, zeigten der 15D und der SF-6D höhere Kennwerte der Änderungssensitivität als der EQ-5D, HUI 2, HUI 3 und QWB- SA in den drei untersuchten Patientengruppen

29 Abbildung 6: Deskriptive Statistiken der sechs Indexinstrumente in den drei untersuchten Indikationsgruppen (1. Messzeitpunkt) Reha-Patienten mit einer muskulo-skelettalen Erkrankung (N=106) Reha-Patienten mit einer Herz-Kreislauf-Erkrankung (N=88) Reha-Patienten mit einer psychosomatischen Erkrankung (N=70)

30 3.3 Die Dimensionen im EQ-5D, HUI 2 und SF-6D: Eine empirische Analyse der Zusammenhänge (Konerding et al., im Begutachtungsprozess) Zur Auswertung wurden die Angaben aus den drei Indikationsgruppen des Projektes Methodische Aspekte der nutzentheoretischen Lebensqualitätsmessung gepoolt. Insgesamt wurden 34 lineare Regressionsmodelle zur Vorhersage der einzelnen Subskalen des EQ-5D, HUI 2 und SF-6D berechnet. Der Anteil erklärter Varianz (adjustiertes R 2 ) variierte in den multiplen linearen Gleichungen in einem Wertebereich von 1% bis 57%. Das niedrigste R 2 zeigte sich bei der Vorhersage der HUI-2-Dimension sensorische Fähigkeit ( sensation ) durch die EQ-5D-Dimensionen. Der höchste Anteil erklärter Varianz konnte bei der Vorhersage der HUI-2-Dimension psychisches Wohlbefinden ( emotion ) durch die SF-6D-Dimensionen beobachtet werden. Für den EQ-5D und den SF-6D gab es zwei Dimensionen, die unabhängig vom gewählten Klassifikationssystem, welches als unabhängige Variable in das Modell einging, den höchsten Anteil erklärter Varianz auswies. Dies waren für den EQ-5D die Dimensionen Schmerzen/Beschwerden ( pain/discomfort ) und Angst/Niedergeschlagenheit ( anxiety/depression ) und für den SF-6D körperliche Schmerzen ( bodily pain ) und psychisches Wohlbefinden ( mental health ). Für den HUI 2 konnte ein solches Muster nicht beobachtet werden. In der Faktorenanalyse zeigte sich, dass den drei untersuchten Instrumenten zwei gemeinsame Faktoren zugrunde liegen. Dies sind zum einen der Faktor psychische Probleme und zum anderen der Faktor körperliche Schmerzen. Der erste Faktor wird im EQ-5D durch die Subskala Angst/Niedergeschlagenheit, im HUI 2 durch psychisches Wohlbefinden und im SF-6D durch psychisches Wohlbefinden abgebildet. Der zweite Faktor wird beschrieben durch die EQ-5D-Dimension Schmerzen/Beschwerden, die HUI-2-Dimension Schmerzen und die SF- 6D-Dimension körperliche Schmerzen

31 3.4 Direkte Messverfahren und Referenzpunkte zur Bestimmung von Nutzwerten am Beispiel von Tinnitus (Happich et al., 2008) Insgesamt wurden 420 Personen (210 Tinnitus-Betroffene, 210 Personen aus der Allgemeinbevölkerung) in die Studie eingeschlossen. Von den Befragungsteilnehmern konnten 21 Personen (10 Tinnitus-Betroffene, 11 Personen aus der Allgemeinbevölkerung) nicht auf das Standard-Gamble-Verfahren antworten oder lehnten die Teilnahme ab. 29 Personen haben die Time-Trade-Off-Frage nicht beantwortet (16 Tinnitus-Betroffene, 13 Personen aus der Allgemeinbevölkerung). Acht Personen (4 Tinnitus-Betroffene, 4 Personen aus der Allgemeinbevölkerung) beantworteten nicht die Frage nach dem Bezugspunkt einer möglichen lebensqualitätsverändernden Operation. Die soziodemographischen Merkmale der beiden Stichproben finden sich in Tabelle 2. Tabelle 2: Soziodemographische Merkmale der Tinnitus-Betroffenen und Nicht-Betroffenen Betroffene (N=210) Nicht-Betroffene (N=210) N (in %) N (in %) Geschlecht Mann 100 (47,6) 102 (48,6) Familienstand verheiratet /fester Partner 146 (69,5) 142 (67,6) ledig 24 (11,4) 24 (11,4) verwitwet 14 (6,7) 15 (7,1) geschieden/getrennt 26 (12,4) 29 (13,8) Schuljahre 10 Jahre 109 (54,3) 119 (56,7) > 10 Jahre 101 (45,7) 91 (43,3) Beruf erwerbstätig 97 (46,2) 84 (40,0) selbstständig 9 (4,3) 14 (6,7) Rente 79 (37,6) 83 (39,5) erwerbslos 14 (6,7) 15 (7,1) sonstiges 11 (5,2) 14 (6,7)

32 In allen drei untersuchten Methoden konnten höhere Nutzwerte für die Betroffenen beobachtet werden (Abbildung 7). Diese Ergebnisse bestätigten sich auch in der multivariaten Varianzanalyse. Abbildung 7: Durchschnittliche Nutzwerte der Betroffenen und Nicht-Betroffenen für das Rating-Scale- (VAS), Time-Trade-Off- (TTO) und Standard-Gamble- Verfahren (SG) Unterschiede zwischen den untersuchten Gruppen zeigten sich bei der Wahl einer medizinischen Behandlungsmaßnahme unter der Annahme, dass die Wahrscheinlichkeiten einer Verbesserung bzw. einer Verschlechterung des Gesundheitszustandes gleich waren. Betroffene zeigten sich im Vergleich zu den Nicht-Betroffenen als risikoavers. Die Mehrheit der Tinnitus-Betroffenen (42,2%) war nicht bereit, die medizinische Behandlung in Anspruch zu nehmen, während die Nicht-Betroffenen (25,7%) eher dazu bereit waren (Chi 2 (4,412) = 48,1, p < 0,001). Die deskriptiven Kennwerte weisen darauf hin, dass es in allen drei Messmethoden Unterschiede in der Bewertung des Krankheitsbildes Tinnitus in Abhängigkeit von der individuellen Risikoeinstellung gibt (Abbildung 8), was sich auch in der durchgeführten multivariaten Varianzanalyse widerspiegelt

33 Abbildung 8: Durchschnittliche Nutzwertdifferenzen in Abhängigkeit von der individuellen Risikoeinstellung, adjustiert für den gegenwärtigen Gesundheitszustand (Be troffene vs. Nicht-Betroffene

34 4. Diskussion 4.1 Zusammenfassung und Bewertung der Ergebnisse Die gesundheitsbezogene Lebensqualitätsforschung hat in den vergangenen drei Jahrzehnten einen deutlichen Aufschwung erhalten und ist mit großem Interesse, zum Teil aber auch mit Skepsis von Seiten der medizinischen Forschung aufgenommen worden. In jüngster Zeit werden zunehmend präferenzbasierte Verfahren zur Messung der Lebensqualität in gesundheitsökonomische Analysen einbezogen, z.b. in den Rehabilitationswissenschaften zur Quantifizierung der Kosten-Nutzen-Relation. Gesundheitsökonomische Evaluationen spielen bei der Verteilung der begrenzten finanziellen Mittel eine immer größere Rolle. Auf Basis dieser Evaluationen werden Entscheidungen getroffen, ob diagnostische oder therapeutische Maßnahmen hinsichtlich ihres Kosten-Nutzwertverhältnisses den gesundheitsökonomischen Effizienz- und Effektivitätskriterien entsprechen. Die Nutzwerte werden mit Hilfe von präferenzbasierten Messinstrumenten ermittelt. Dabei ist zumindest theoretisch eine Vergleichbarkeit der einheitlichen Währung Nutzwert über unterschiedliche Behandlungsmaßnahmen und verschiedene Indexinstrumente hinweg möglich. Mit der vorliegenden Studie Methodische Aspekte der nutzentheoretischen Lebensqualitätsmessung stehen erstmals umfassende, vergleichende Ergebnisse, aller in deutscher Sprache verfügbaren präferenzbasierten Messinstrumente in drei Indikationsgruppen von Reha-Patienten, zur Verfügung. Die deskriptiven Kennwerte und Vergleiche der Häufigkeitsverteilungen zeigen substantielle Unterschiede zwischen den Instrumenten auf. Während die Indexwerte des EQ-5D, HUI 2 und HUI 3 über den gesamten Skalenbereich streuen, finden sich die Indexwerte des 15D und SF-6D ausschließlich im oberen Bereich der theoretischen Skalenspanne. Die Intra- Klassenkorrelations-Koeffizienten zwischen den Instrumenten variierten in einem Bereich von 0,29 bis 0,80 und wiesen in den meisten Fällen auf eine moderate Übereinstimmung der Verfahren hin. Bei denjenigen Patienten, die eine gesundheitliche Verbesserung während der Reha-Behandlung angaben, zeigten sich der 15D und der SF-6D änderungssensitiver im Vergleich zu den anderen Instrumenten. In einer weiteren Studie, die dieser Arbeit zugrunde liegt, erfolgte die empirische Untersuchung von drei direkten Verfahren zur nutzentheoretischen Bewertung des Krankheitsbildes Tinnitus (Happich et al. 2008). Hintergrund dieser Studie war, dass die strenge Axiomatik der Erwartungsnutzentheorie empirisch nicht haltbar ist. Um einen Beitrag zur Modifizierung der

35 Axiomatik leisten zu können wurden zentrale Annahmen aus der Prospect Theory berücksichtigt. Die Prospect Theory geht von einem individuell unterschiedlichen Referenzpunkt zur Nutzwertbeurteilung aus, in Abhängigkeit von der individuellen Risikoeinstellung. Die Ergebnisse stützen diese Annahmen. Es konnte gezeigt werden, dass die Bewertung von Gesundheitszuständen vom eigenen aktuellen Gesundheitszustand und von der individuellen Risikoeinstellung abhängig ist. Betroffene wiesen dem Krankheitsbild Tinnitus höhere Nutzwerte zu als Nicht-Betroffene. Darüber hinaus zeigten sich Tinnitus-Betroffene als risikoavers im Vergleich zu Nicht-Betroffenen, die einer risikobehafteten medizinischen Behandlungsmaßnahme eher zustimmten. Ein Zusammenhang zwischen der Risikoeinstellung einer Person und der Nutzwertbewertung konnte statistisch nachgewiesen werden. 4.2 Fazit und Ausblick Aus den vorliegenden Studienergebnisse können wichtige Hinweise für zukünftige Studien auf dem Gebiet der präferenzbasierten Messung der gesundheitsbezogenen Lebensqualität abgeleitet werden. Soll das Indexinstrument zusammen mit anderen Messinstrumenten eingesetzt werden, ist ein kurzer Fragebogen mit wenigen Items notwendig. In unserer Studieerwies sich der EQ-5D-Fragebogen als praktikabel und gut anwendbar. Darüber hinaus ermöglicht er aufgrund seiner weiten Verbreitung umfassende Vergleiche sowohl mit internationalen als auch mit nationalen Studien. Ist die Beschreibung von Veränderungen im Zeitverlauf ein zentrales Zielkriterium, sind insbesondere der 15D-Fragebogen und der SF-6D empfehlenswert. Die empirische Untersuchung der direkten Messverfahren gibt wichtige Erkenntnisse zu Kritikpunkten am QALY-Konzept. Es steht jedoch nicht in Konkurrenz zum QALY-Konzept, sondern dient eher dessen Weiterentwicklung. Aus den vorliegenden Ergebnissen kann geschlossen werden, dass zukünftige Studien die individuelle Risikoeinstellung berücksichtigen sollten, um die ermittelten Nutzwerte entsprechend adjustieren zu können. Eine klare Empfehlung zum Einsatz des Time-Trade-Off- oder des Standard-Gamble-Verfahrens kann nicht gegeben werden. Die Entscheidung für die eine oder andere Methode ist sehr stark kontextabhängig und sollte immer im Einklang mit der zu untersuchenden Fragestellung erfolgen. Darüber hinaus zeigt der Zusammenhang von individueller Risikoeinstellung und Bewertung von Gesundheitszuständen weiteren Forschungsbedarf auf dem Gebiet der präferenzbasierten Messung der Lebensqualität an

36 5. Literatur Aaronson NK. Assessing the Quality of Life of Patients in Cancer Clinical Trials: Common Problems and Common Sense Solutions. Eur J Cancer 1992; 28A: Angermeyer MC, Kilian R, Matschinger H. WHOQOL-100 und WHOQOL-BREF. Handbuch für die deutschsprachige Version der WHO-Instrumente zur Erfassung von Lebensqualität. Göttingen: Hogrefe, Bleichrodt H, Johannesson M. The validity of QALYs: an experimental test of constant proportional tradeoff and utility independence. Med Decis Making 1997; 17(1): Brazier J, Roberts J, Deverill M. The estimation of a preference-based measure of health from the SF-36. J Health Econ 2002; 21(2): Brazier J, Ratcliffe J, Tsuchiya A, Salomon J. Measuring and Valuing Health Benefits for Economic Evaluation. 1 st ed. Oxford, UK: Oxford University Press, Bührlen B, Gerdes N, Jäckel WH. Entwicklung und psychometrische Testung eines Patientenfragebogens für die medizinische Rehabilitation (IRES-3). Rehabilitation 2005; 44: Bullinger M. Trends in der internationalen Lebensqualitätsforschung. In: Petermann F (Hg.). Lebensqualität und chronische Krankheit. München: Dustri-Verlag, 1996, Bullinger M, Kirchberger I. SF-36 Fragebogen zum Gesundheitszustand (SF-36). Handbuch für die deutschsprachige Fragebogenversion. Göttingen: Hogrefe, Burchert H, Hansmeier T, Hessel F, Krauth C, Nowy R, Seitz R, Wasem J. Gesundheitsökonomische Evaluation in der Rehabilitation. Teil II: Bewertung der Ressourcenverbräuche. DRV-Schriften Band 16. Frankfurt: VDR, Deyo RA, Diehr P, Patrick DL. Reproducibility and responsiveness of health status measures: Statistics and strategies for evaluation. Controlled Clin Trials 1991; 12(4): Drummond MF. Output Measurement for Resource-Allocation Decisions in Health Care. In: McGuire A, Fenn P, Mayhew K (Hg.). Providing Health Care: The Economics of Alternative Systems of Finance and Delivery. Oxford University Press: Oxford,

37 Drummond MF, O Brien BJ, Stoddart GL, Torrance GW. Cost-utility analysis. In: Methods for the economic evaluation of health care programmes. 3rd edition. Oxford University Press, Duru G, Auray JP, Béresniak A, Lamure M, Paine A, Nicoloyannis N. Limitations of the methods used for calculating quality-adjusted life-year values. Pharmacoeconomics 2002; 20(7): European Medicines Agency. Reflection paper on the regulatory guidance for the use of health-related quality of life (HRQL) measures in the evaluation of medicinal products. London, 27 July EuroQol Group. EuroQol - a new facility for the measurement of health-related quality of life. Health Policy 1990; 16: Feeny DH, Torrance G, Furlong WJ. Chapter 26: Health Utilities Index. In: Spilker B (ed.), Quality of Life and Pharmacoeconomics in Clinical Trials, 2 nd ed. Philadelphia: Lippincott-Raven Publishers, 1996: Food and Drug Administration. Guidance for Industry. Patient-reported Outcome Measures: Use in Medical Product Development to Support Labeling Claims. Rockville, MD: Food and Drug Administration, Froberg DG, Kane RL. Methodology for measuring health-state preferences I: Measurement strategies. J Clin Epidemiol 1989; 42: Gerdes N, Jäckel WH. Der IRES-Fragebogen für Klinik und Forschung. Rehabilitation 1995; 34: XIII XXIV. Gifi A. Nonlinear Multivariate Analysis. New York: John Wiley, Gold MR, Siegel JE, Russell LB, Weinstein MC. Cost-effectiveness in health and medicine. New York, Oxford: Oxford University Press, Graf von der Schulenburg JM, Greiner W, Jost F, Klusen N, Kubin M, Leidl R, Mittendorf T, Rebscher H, Schöffski O, Krauth C, Volmer T, Wahler S, Wasem J, Weber C. Deutsche Empfehlungen zur gesundheitsökonomischen Evaluation - dritte und aktualisierte Fassung des Hannoveraner Konsens. Gesundh Ökon Qual Manag 2007, 12: Greiner W, Claes C, Busschbach JJV, Graf von der Schulenburg JM. Validating the EQ-5D with time trade off for the German population. Eur J Health Econom 2005; 6:

38 Happich M, Moock J, von Lengerke T. Health Valuation Methods and Reference Points: the Case of Tinnitus. Value in Health 2008; im Druck. Hessel F, Kohlmann T, Krauth C, Nowy R, Seitz R, Siebert U, Wasem J. Gesundheitsökonomische Evaluation in der Rehabilitation. Teil I: Prinzipien und Empfehlungen zur Leistungserfassung. DRV-Schriften Band 16. Frankfurt: VDR, Horsman J, Furlong W, Feeny D, Torrance G. The Health Utilities Index (HUI ): concepts, measurement, properties and applications. Health and Quality of Life Outcomes 2003; 1(54). Hunt SM, McKenna SP, McEwen J, Williams J, Papp E. The Nottingham Health Profile: Subjective health status and medical consultations. Social Science and Medicine 1981; 15: Institut für Qualität und Wirtschaftlichkeit im Gesundheitswesen. Allgemeine Methoden. Entwurf für Version 3.0 vom Köln: IQWiG (http.//iqwig.de/download). Institut für Qualität und Wirtschaftlichkeit im Gesundheitswesen: Methodik für die Bewertung von Verhältnissen zwischen Nutzen und Kosten im System der deutschen gesetzlichen Krankenversicherung. Zur Stellungnahme. Version 1.0 vom 24. Januar Köln: IQWiG. ( sion_1_0_pdf). Kahneman D, Tversky A. Prospect theory: An analysis of decision under risk. Econometrica 1979; 47: Kaplan RM, Sieber WJ, Ganiats TG. The Quality of Well-Being Scale: comparison of the interviewer-administered version with a self-administered questionnaire. Psychol Health 1997; 12: Kohlmann T, Bullinger M, Kirchberger-Blumstein I. Die deutsche Version des Nottingham Health Profile (NHP): Übersetzungsmethodik und psychometrische Validierung. Sozialund Präventivmedizin 1997; 42: Konerding U, Moock J, Kohlmann T. The classification systems of the EQ-5D, the HUI II and the SF-6D: What do they have in common? Med Care; im Begutachtungsprozess. Kopec JA, Willison KD. A comparative review of four preference-weighted measures of health-related quality of life. J Clin Epidemiol 2003; 56(4):

39 Krauth C, Rieger J, Mellert C, Schwartz FW. Das gesundheitsökonomische Querprojekt Q3: Überblick über die Konzeption der reha-ökonomischen Evaluation. In: Petermann F (Hrsg): Prädiktion, Verfahrensoptimierung und Kosten in der medizinischen Rehabilitation. Regensburg: Roderer, 2003, Krauth C, John J, Aidelsburger P, Brüggenjürgen B, Hansmeier T, Hessel F, Kohlmann T, Moock J, Rothgang H, Schweikert B, Seitz R, Wasem J. Stellungnahme der AG Methoden der gesundheitsökonomischen Evaluation (AG MEG) zu dem Methodenpapier Methodik für die Bewertung von Verhältnissen zwischen Nutzen und Kosten im System der deutschen gesetzlichen Krankenversicherung des Instituts für Qualitätssicherung und Wirtschaftlichkeit im Gesundheitswesen (IQWiG). Das Gesundheitswesen 2008; in print. Moock J, Kohlmann T, Besch D, Drüner K. Nutzentheoretische Lebensqualitätsmessinstrumente in der medizinischen Rehabilitation: Ein anwendungsbezogener Vergleich. Zeitschrift für Medizinische Psychologie 2005; 14: Moock J, Kohlmann T, Zwingmann C. Patient-reported outcomes in rehabilitation research: instruments and current developments in Germany. J Public Health 2006; 14: Moock J, Kohlmann T. Comparing preference-based quality of life measures: Results from rehabilitation inpatients with musculoskeletal, cardiovascular or psychosomatic disorders. Qual Life Res 2008; 17(3): online first: DOI /s Mosteller F. Final panel: Comments on the conferenz on advances in health status assessment. Med Care 1989; 27: Muthny FA, Bullinger M, Kohlmann T. Variablen und Erhebungsinstrumente in der rehabilitationswissenschaftlichen Forschung. Würdigung und Empfehlungen. In Verband Deutscher Rentenversicherungsträger (Hrsg): Förderschwerpunkt Rehabilitationswissenschaften. Empfehlungen der Arbeitsgruppen Generische Methoden, Routinedaten und Reha-Ökonomie. DRV-Schriften, Bd. 16. Frankfurt/Main: VDR, 1999: Patrick DL, Erickson P. Assigning values to health states. In: Health status and health policy - Quality of life in health care evaluation and resource allocation. New York: Oxford University Press, 1993, S. 176ff

40 Räsänen P, Roine E, Sintonen H, Semberg-Konttinen V, Ryynänen OP, Roine R. Use of quality-adjusted life years for the estimation of effectiveness of health care: A systematic literature review. Int J Technol Assess Health Care 2006; 22(2): Rosenberg R. Health-related quality of life between naturalism and hermeneutics. Soc Sci Med 1995; 41(10): Rosner B. Fundamentals of Biostatistics. 6 th ed. Boston: Duxbury Press, Russell L, Gold M, Siegel J, Daniels N, Weinstein MC. The role of cost-effectiveness analysis in health and medicine. Panel Cost-Effectiveness in Health and Medicine. JAMA 1996; 276: Schöffski O. Grundformen gesundheitsökonomischer Evaluationen. In: Schöffski O, Graf von der Schulenburg JM (Hg.). Gesundheitsökonomische Evaluationen. 3. Auflage. Berlin, Heidelberg: Springer, 2007, S Schöffski O, Greiner W. Das QALY-Konzept als prominentester Vertreter der Kosten- Nutzwert-Analyse. In: Schöffski O, Graf von der Schulenburg JM (Hg.). Gesundheitsökonomische Evaluationen. 3. Auflage. Berlin, Heidelberg: Springer, 2007, S Seitz R, Leidl R, Jacobi E. Die psychometrischen Eigenschaften des Euro-Qol bei Rehabilitanden mit Erkrankungen des Stütz- und Bewegungsapparates. Zeitschrift für Gesundheitswissenschaften 1999; 7: Seitz R, Schweikert B, Jacobi E, Tschirdewahn B, Leidl R. Ökonomische Rehabilitationsmanagement bei chronischen Rückenschmerzen. Schmerz 2001; 15: Shrout PE, Fleiss JL. Intraclass correlations: Uses in assessing rater reliability. Psychol Bull 1979; 86(2): Sieber WJ, Groessl EJ, David KD, Ganiats TG, Kaplan RM. Quality of Well-Being Self- Administered (QWB-SA) Scale. User's Manual; Retrieved March 5, 2007, from University of California, San Diego: Sintonen H. The 15D-measure of Health-related Quality of Life. I. Reliability, Validity and Sensitivity of its Health State Descriptive System. Working paper 41. Melbourne: National Centre for Health Program Evaluation;

41 Sintonen H. The 15D measure of health related quality of life: feasibility, reliability and validity of its valuation system. Working paper 42. Melbourne: National Centre for Health Program Evaluation; Sintonen H. The 15D instrument of health-related quality of life: properties and applications. Ann Med 2001; 33(5): Torrance GW, Thomas WH, Sackett DL. A utility maximization model for evaluation of health care programs. Health Serv Res 1972; 7(2): Torrance G. Measurement of Health State Utilities for Economic Appraisal. a Review. J Health Econ 1986; 5: Tsuchiya A, Dolan P. The QALY model and individual preferences for health states and health profiles over time: a systematic review of the literature. Med Decis Making 2005; 25(4): Tversky A, Kahneman D (1992): Advances in prospect theory: cumulative representation of uncertainty. In: Kahneman D, Tversky A (Hg.): Choices, values and frames, Cambridge University Press, Cambridge, 2000, S Verhoef LC, de Haan AF, van Daal WA. Risk attitude in gambles with years of life: empirical support for prospect theory. Med Decis Making 1994; 14: von Neumann J, Morgenstern O. Theory of Games and economic behavior, New York, Ware JE, Sherbourne CD. The MOS 36-item Short-Form Health Survey (SF-36): I. Conceptual framework and item selection. Med Care 1992; 30: WHOQOL Group. The Development of the World Health Organization Quality of Life Assessment Instrument (WHOQOL). In: Orley J, Kuyken W (Eds.). Quality of Life Assessment: International Perspectives. Berlin: Springer, The WHOQOL Group. The World Health Organization Quality of Life Assessment (WHO- QOL): Development and general psychometric properties. Social Science and Medicine 1998; 28: World Health Organisation (1946). Preamble to the Constitution of the World Health Organization as adopted by the International Health Conference, New York, June, 1946; signed on 22 July 1946 by the representatives of 61 States (Official Records of the World Health Organization, no.2, p. 100) and entered into force on 7 April

42 Zentner A, Busse R. Internationale Standards der Kosten-Nutzen-Bewertung. Gesundheitsökonomie & Qualitätsmanagement 2006; 11:

43 6. Zur Dissertation gehörige Zeitschriftenartikel Die dieser kumulativen Arbeit zugrundeliegenden wissenschaftlichen Arbeiten sind nachfolgend aufgelistet. Die Artikel sind auf den nachfolgenden Seiten reproduziert. Die Sortierung entspricht der inhaltlichen Reihenfolge der Einleitung. Moock J, Kohlmann T, Besch D, Drüner K. Nutzentheoretische Lebensqualitätsmessinstrumente in der medizinischen Rehabilitation: Ein anwendungsbezogener Vergleich. Zeitschrift für Medizinische Psychologie 2005; 14: (IF 0,200) Moock J, Kohlmann T, Zwingmann C. Patient-reported outcomes in rehabilitation research: instruments and current developments in Germany. J Public Health 2006; 14: (IF 1,031) Moock J, Kohlmann T. Comparing preference-based quality of life measures: Results from rehabilitation inpatients with musculoskeletal, cardiovascular or psychosomatic disorders. Qual Life Res 2008; 17(3): online first: DOI /s (IF 2,037) Konerding U, Moock J, Kohlmann T. The classification systems of the EQ-5D, the HUI II and the SF-6D: What do they have in common? Med Care; im Begutachtungsprozess. (IF 3,745) Happich M, Moock J, von Lengerke T. Health Valuation Methods and Reference Points: the Case of Tinnitus. Value in Health 2008; im Druck. (IF 3,433)

44 Tabelle 3: Übersicht der Eigenanteile an den wissenschaftlichen Arbeiten Manuskript Konzeption und Design Datenerhebung 1 Datenanalyse Eigenanteile* Interpretation der Daten Moock et al. (2005, Kap. 6.1) XXX XXX XXX XXX Moock et al. (2006, Kap. 6.2) XXX - - XXX Moock et al. (2008, Kap. 6.3) XXX XXX XXX XXX Konerding et al. (im Begutachtungsprozess, Kap. 6.4) XX XXX XX XX Happich et al. (2008, Kap. 6.5) XX X XX XX * Umfang der Eigenanteile: XXX hauptverantwortlich und selbständig durchgeführt XX gemeinsam mit dem Erstautor bzw. den Koautoren durchgeführt X Mitarbeit - nicht zutreffend 1 Meine Aufgaben bei der Datenerhebung im Rahmen der Studie Methodische Aspekte der nutzentheoretischen Lebensqualitätsmessung umfassten: - Zusammenstellung des Fragebogens - Rekrutierung der Patienten - Datenmanagement und Qualitätssicherung - Bereitstellung der Daten für andere Forschungsgruppen a) Entwurf des Artikels b) kritische Revision a) XXX b) XXX a) XXX b) XXX a) XXX b) XXX a) X b) XX a) XX b) XX Billigung der Endversion ja ja ja ja ja

45 6.1 Moock J, Kohlmann T, Besch D, Drüner K. Nutzentheoretische Lebensqualitäts- messinstrumente in der medizinischen Rehabilitation: Ein anwendungsbezogener Vergleich. Zeitschrift für Medizinische Psychologie 2005; 14:

46 =0HG3V\FKRO Nutzentheoretische Lebensqualitätsmessinstrumente in der medizinischen Rehabilitation: Ein anwendungsbezogener Vergleich* Jörn Moock, Thomas Kohlmann, Detlef Besch & Klaus Drüner Zusammenfassung Zur nutzentheoretischen Lebensqualitätsmessung im Rahmen gesundheitsökonomischer Analysen stehen verschiedene Messinstrumente in deutscher Übersetzung zur Verfügung. Über die methodischen Eigenschaften dieser Instrumente in der Rehabilitationsforschung liegen bislang nur wenige Erkenntnisse vor. In der hier vorgestellten Studie werden die psychometrischen Eigenschaften der wichtigsten in deutscher Sprache verfügbaren schriftlichen Fragebögen untersucht. Dabei handelt es sich um den EuroQol-Fragebogen (EQ- 5D), den Short Form-6D (SF-6D), den Health Utility Index (HUI), die Quality of Well Being Scale (QWB-SA) und den 15D-Fragebogen. Die Ergebnisse zeigen, dass die Messinstrumente in den untersuchten Patientengruppen praktikabel und gut anwendbar sind. Hinsichtlich der Darstellung von Veränderungen über die Zeit, ist insbesondere der Einsatz des SF-6D und des 15D-Fragebogens zu empfehlen. Die Indexwertverteilungen und die ermittelten Korrelationswerte weisen darauf hin, das Indexwerte die mit unterschiedlichen präferenzbasierten Messinstrumente ermittelt wurden nicht oder nur bedingt vergleichbar sind. Schlagworte Präferenzbasierte Lebensqualität, vergleichende Studie, qualitätsberichtigte Lebensjahre, Kosten-Nutzwert-Analyse Abstract Preference-based Quality of Life measurements in medical rehabilitation: A comparison There are different instruments available in German language to measure health-related quality of life for use in health-economic studies. Yet, virtually no information is available regarding the applicability and the methodological quality of preference-based instruments in rehabilitation research. In our study we evaluate the applicability and methodological properties of preference-based quality of life measures as applied in rehabilitation research. The set of questionnaires included validated German language versions of the SF-36, QWB- SA, EQ-5D, Health Utilities Index (HUI) and 15D. The results show that all instruments appear to be highly acceptable for rehabilitation patients. If small changes are expected in evaluative studies, application of SF-6D or 15D should be recommended. Comparisons of distributions and mean index scores in this sample demonstrate that results obtained with different preference-based measures are not equivalent. Key-Words Preference-based Quality of Life, comparative study, Quality-Adjusted Life Years, Cost- Utility-Analysis * Ein Projekt finanziert vom Bundesministerium für Bildung und Forschung (BMBF), im Rahmen der Förderung des Norddeutschen Verbunds für Rehabilitationsforschung (NVRF). FKZ.: 01GD0106. Korrespondenz-Adresse: Jörn Moock / Thomas Kohlmann, Ernst-Moritz-Arndt-Universität Greifswald, Institut für Community Medicine, Abt. Methoden der Community Medicine, Walther-Rathenau- Straße 48, Greifswald. Tel.: ; Fax: ; joern.moock@unigreifswald.de; thomas.kohlmann@uni-greifswald.de. 1 Einleitung Der immer enger werdende wirtschaftliche Spielraum im Gesundheitswesen hat zur Folge, dass eine umfassende Gesundheitsversorgung mit den gegebenen finanziellen Mitteln erbracht werden muss. Im Zuge dieses wachsenden finanziellen und politischen Drucks sind in den vergangenen Jahren auch in Deutschland zunehmend gesundheitsökonomische Evaluationsstudien für medizinische Leistungen durchgeführt worden. Das Ziel dabei ist, die Kosten zu senken, bei gleichzeitiger Verbesserung der Effizienz und Effektivität des Gesundheitssystems. Die gesundheitsökonomische Bewertung einer medizinischen Intervention lässt sich in der Form durchführen, dass den entsprechenden Kosten einer Maßnahme patientennahe Ergebnisindikatoren gegenübergestellt werden, die durch die Intervention beeinflusst werden. Ein solcher patientennaher Ergebnisindikator, der in einer Vielzahl von Interventionen angestrebt wird, ist die subjektiv bewertete Verbesserung der gesundheitsbezogenen Lebensqualität. 2 Gesundheitsökonomische Evaluationen: Die Kosten-Nutzwert-Analyse Im Rahmen der gesundheitsökonomischen Kosten-Nutzwert-Analyse (englisch: cost-utility analysis, CUA) wird die Wirtschaftlichkeit von medizinischen Intervention, unter Berücksichtigung von Daten zur gesundheitsbezogenen Lebensqualität, untersucht (vergleiche Drummond et al., 1997; Greiner, 1999). Die Kosten-Nutzwert-Analyse hat gegenüber den anderen ökonomischen Analyseverfahren, wie der Kosten-Wirksamkeits-Analyse (cost-effectiveness analysis, CEA) oder der Kosten-Nutzen- Analyse (cost-benefit analysis, CBA), den Vorteil, dass den Kosten die subjektiv bewertete gesundheitsbezogene Lebensqualität und nicht objektive Sachverhalte wie zum Beispiel eine therapiebedingte =HLWVFKULIWI U0HGL]LQLVFKH3V\FKRORJLH2005

47 -0RRFNHWDO1XW]HQWKHRUHWLVFKH/HEHQVTXDOLWlWVPHVVLQVWUXPHQWHLQGHUPHGL]LQLVFKHQ5HKDELOLWDWLRQ Veränderung des Blutdrucks beziehungsweise in Geldeinheiten bewertete Effekte, gegenübergestellt wird. Kosten-Nutzwert-Analysen werden speziell dort angewandt, wo die subjektiv bewertete gesundheitsbezogene Lebensqualität eine primäre Zielgröße ist und objektive Kriterien nur schwer oder gar nicht messbar sind. Zudem ermöglicht die Kosten- Nutzwert-Analyse die Messung von Veränderungen der gesundheitsbezogenen Lebensqualität in einer einheitlichen Währung. Weitreichende Vergleiche verschiedener medizinischer Therapieund Interventionsformen sind so prinzipiell möglich (Schöffski & Uber, 2002). Die gesundheitsbezogene Lebensqualität wird im allgemeinen als mehrdimensionales Konstrukt verstanden, das physische, psychische und soziale Aspekte einschließt. Zur Nutzung dieses patientennahen Ergebnisindikators in einer gesundheitsökonomischen Kosten-Nutzwert-Analyse ist es notwendig, diese Dimensionen zu einem einzigen Indexwert beziehungsweise Nutzwert zu aggregieren. Neben diesem Indexwert fließt in die Nutzwertanalyse die zeitliche Dauer ein, die in dem ermittelten Gesundheitszustand verbracht wird. Dabei werden Nutzwert und Zeitdauer durch Bildung einer mit dem Nutzwert gewichteten Summe der Zeiteinheiten (zum Beispiel Jahre) verrechnet. Über der Zeitachse aufgetragen ergibt sich so eine Fläche unter der Nutzwertkurve, die als Maß für die qualitätsberichtigten Lebensjahre (quality-adjusted life years, QALYs) interpretiert werden kann (vergleiche Abbildung 1). Dieses Verfahren ermöglicht die Berücksichtigung bestehender Unterschiede in den Überlebenszeiten und der gesundheitsbezogenen Lebensqualität einzelner Maßnahmen in einer Analyse. Nach Berechnung der durch verschiedene Maßnahmen erreichbaren QALYs können diese zueinander, insbesondere aber zu den Kosten in Beziehung gesetzt werden. So lassen sich in gesundheitsökonomischen Analysen zum Beispiel Aussagen darüber treffen, was bei den jeweils untersuchten Behandlungen ein QALY kostet. 3 Verfahren zur Bestimmung von Nutzwerten 1 Tod = 0 keine Behandlung optimale Lebensqualität Behandlung gewonnene QALYs Zeit Abbildung 1: Ermittlung der QALYs bei einem stufenförmigen Verlauf der Lebensqualität. In Anlehnung an Schöffski et al Was ist nun aber eigentlich ein Nutzwert? Häufig verwendet man die Begriffe Nutzwert und Präferenzwert synonym. Nutzwerte sind in Zahlen ausgedrückte Präferenzen zwischen verschiedenen Gesundheitszuständen, die auf einer kardinalen Skala abgebildet werden (vergleiche Greiner, 1999). Die Skala reicht dabei von 0 bis 1, wobei 0 für den Tod und 1 für vollständige Gesundheit steht. Zur direkten Bestimmung der Präferenzwerte werden in der Gesundheitsökonomie vor allem drei Verfahren eingesetzt (Patrick & Erickson, 1993): die Standard-Gamble-Verfahren das Time-Trade-Off-Verfahren das Rating-Scale-Verfahren Das Standard-Gamble-Verfahren ist die klassische Methode zur Präferenzerfassung (Torrance, 1986; Froberg, 1989). Die Methode basiert auf den Axiomen der Nutzwerttheorie nach J. von Neumann und O. Morgenstern (1953) und wird nicht zuletzt aus diesem Grund als Goldstandard bezeichnet. Bei diesem Verfahren wird der Proband in einem Interview gebeten, in einer konkreten Entscheidungssituation zwischen zwei Alternativen zu wählen (vergleiche Abbildung 2). Die erste Alternative ist das Verbleiben im eigenen oder einem detailliert beschriebenen fiktiven Krankheitszustand (zum Beispiel lebenslanges Herzleiden). Für die zweite Alternative gibt es zwei Ergebnisse mit entsprechenden Eintrittswahrscheinlichkeiten (p beziehungsweise 1 p). Das erste mögliche Ergebnis ist die vollständige Genesung mit einer Wahrscheinlichkeit von p und das Zweite der sofortige Tod (zum Beispiel nach einer missglückten Operation) mit einer Wahrscheinlichkeit von 1 p. Der Proband wird gebeten, sich für eine Alternative zu entscheiden. Die Wahrscheinlichkeiten für die beiden Ergebnisse der zweiten Alternative werden solange variiert, bis der Proband sich nicht mehr sicher zwischen den beiden Alternativen entscheiden kann und somit zwischen den Alternativen indifferent ist. Dieser Wert p kann dann direkt auf einer Skala zwischen 0 und 1 abgetragen werden und stellt den Nutzwert der ersten Alternative dar. Sehr anschaulich und praxisnah wird das Standard-Gamble Verfahren bei Schöffski (2002) dargestellt. Alternative 1 Krankheitszustand beibehalten Vgl. Torrance 1986 Abbildung 2: Standard Gamble Verfahren Als Alternative zum Standard-Gamble Verfahren wurde von Torrance et al. (1972) die Time Trade-Off Methode entwickelt. Bei diesem Verfahren wählt der Proband zwischen zwei Alternativen (vergleiche Abbildung 3). Die Alternative 1 beschreibt einen bestimmten Krankheitszustand, der einen gewissen Zeitraum (t) anhält. Alternative 2 charakterisiert einen Zustand in völliger Gesundheit, welcher erstrebenswerter ist als die erste Alternative, dessen Zeitraum (x) jedoch kürzer ist. Die Zeitdauer wird nun solange variiert, bis der Proband beide Alternativen als gleichwertig empfindet. Der Präferenzwert (h i ) ergibt sich aus dem Quotienten der beiden Zeiträume (x/t). Bei der Time Trade-Off Methode muss sich der Befragte somit entscheiden, wie viel Lebenszeitdauer er bereit ist zu opfern, um die verbleibende Zeit in vollständiger Gesundheit verbringen zu können. Wert Gesund 1,0 Zustand i h i Tod 0 Entscheidung gesund mit Wahrscheinlichkeit p Alternative 2 Alternative 1 Alternative 2 Behandlung sofortiger Tod mit Wahrscheinlichkeit 1 p Abbildung 3: Time Trade-Off Verfahren x Beim Rating-Scale-Verfahren werden die Probanden gebeten, vorgegebene Ge- t Zeit =HLWVFKULIWI U0HGL]LQLVFKH3V\FKRORJLH

48 -0RRFNHWDO1XW]HQWKHRUHWLVFKH/HEHQVTXDOLWlWVPHVVLQVWUXPHQWHLQGHUPHGL]LQLVFKHQ5HKDELOLWDWLRQ sundheitszustände auf einer Skala mit zwei festen Endpunkten einzuordnen. Dabei wird entweder der eigene Gesundheitszustand bewertet oder ein fiktiver Gesundheitszustand. Die Skala umfasst einen Wertebereich von 0 bis 1 oder 100, wobei 0 den schlechtest möglichen und 1 den bestmöglichen Gesundheitszustand repräsentiert. Wegen seiner einfachen Handhabbarkeit und für Probanden leicht verständlichen Aufbaus, bietet das Rating- Scale-Verfahren große Vorteile bei der Praktikabilität und Anwendbarkeit. Demgegenüber steht jedoch die nur schwache theoretische Fundierung und die mit Hilfe der Rating-Skala erzielten Präferenzwerte eignen sich nur begrenzt für eine Kosten- Nutzwert-Analyse (Green, 2000). 4 Standardisierte Fragebögen zur nutzentheoretischen Lebensqualitätsmessung Die drei vorgestellten Methoden können dazu benutzt werden, in einem Interview, Präferenzwerte für bestimmte Gesundheitszustände zu ermitteln. Das Problem dabei ist, dass diese Methoden zur Ermittlung der Nutzwerte bei allen in einer Studie eingeschlossenen Personen durchgeführt werden müssen. Unter Berücksichtigung von forschungsökonomischen Aspekten ist dies nur schwer umsetzbar. Aus diesem Grund sind vereinfachte Erhebungsverfahren in Form selbstauszufüllender Fragebögen entwickelt worden, mit deren Hilfe verschiedene Gesundheitszustände in deskriptiver Form ermittelt werden können. Die Nutzwerte der unterschiedlichen Gesundheitszustände werden dabei einmalig an einem geeigneten Referenzkollektiv und mit Hilfe einer der drei oben genannten Methoden normiert. Die ermittelten Präferenzwerte können dann mit geeigneten statistischen Methoden, wie zum Beispiel regressionsanalytischen Verfahren, in eine Wertetabelle überführt werden. Diese Tabelle enthält für jeden möglichen Gesundheitszustand einen entsprechenden Nutzwert (Tabelle 1). In deutscher Übersetzung stehen folgende Erhebungsinstrumente zur Verfügung: EuroQol-Fragebogen (EQ-5D; Graf von der Schulenburg et al., 1998) SF-6D (Brazier et al., 1998, 2002) Health Utilities Index (HUI; Torrance et al., 1996) Tabelle 1: Gesundheitszustände und der entsprechende Wert aus der Nutzwerttabelle des EQ-5D. Gesundheitszustand keine Probleme oder Beeinträchtigungen Mäßige Schmerzen oder Beschwerden Extreme Schmerzen oder Beschwerden und mäßig ängstlich oder deprimiert EQ-5D Zahlencode Wert , , ,41 Selbstausfüll-Version der Quality of Well-Being Scale (QWB-SA; Kaplan et al., 1997) 15D-Fragebogen (Sintonen 1995) Im folgenden Abschnitt werden die genannten Instrumente kurz vorgestellt (Tabelle 2). EQ-5D Der EQ-5D ist ein generisches Indexinstrument, das für den Einsatz zusammen mit krankheitsspezifischen Instrumenten zur Ermittlung der gesundheitsbezogenen Lebensqualität entwickelt wurde (EuroQol Group, 1990). Der Fragebogen erfasst insgesamt fünf psychische und physische Dimensionen (Tabelle 2). Diese werden jeweils mit einem Item und unter Vorgabe von drei Antwortstufen: keine Probleme (1), einige Probleme (2) und extreme Probleme (3) ermittelt. Der EQ- 5D ist in der Lage, insgesamt zwischen 243 (= 3 5 ) Gesundheitszuständen zu unterscheiden. Die Gesundheitszustände können, anhand der drei Antwortstufen, als fünfstelliger Zahlencode dargestellt werden. Zum Beispiel steht der Zahlencode für keine Probleme oder Beeinträchtigungen in den fünf Dimensionen (Tabelle 1). Zusätzlich zum deskriptiven Klassifizierungssystem beinhaltet der EQ-5D eine numerische Skala (EQ- 5D VAS) in Form einer vertikalen Linie mit dem Wertebereich 0 bis 100 und einer Länge von 20 cm. Die Probanden werden hier gebeten, ihren aktuellen Gesundheitszustand zu markieren. Derzeit liegt der EQ-5D in nahezu 40 Sprachen vor. Die deutschsprachige Version wurde von der Arbeitsgruppe um Graf von der Schulenburg et al. (1998) hinsichtlich ihrer Praktikabilität, Validität und Reliabilität in einer nationalen Bevölkerungsstichprobe überprüft. SF-6D Ziel bei der Entwicklung des SF-6D (Brazier, 1998) war es, aus dem Profilinstrument Short Form 36 (SF-36; Ware & Sherbourne, 1992; Bullinger & Kirchberger, 1998) einen nutzwerttheoretischen Index zur gesundheitsbezogenen Lebensqualität zu extrahieren. Dabei sollte der Algorithmus sowohl auf vorhandene, mit dem SF-36 erhobene Datensätze anwendbar sein, als auch auf einen eigenständigen SF-6D Fragebogen. Diese Prämisse machte es notwendig, dass SF-36 Items wortlautgetreu übernommen wurden. Die Endversion des SF-6D erfasst die Lebensqualität anhand von sechs Dimensionen, wobei die vorgegebenen Antwortkategorien von 2 bis 6 variieren. Somit kann der SF-6D zwischen 9000 Gesundheitszuständen (6*2*5*6*5*5) unterscheiden. Die Extraktion des SF-6D aus vorhandenen Daten des SF-36 erfolgt auf Basis von 20 der insgesamt 36 Items. Health Utilities Index (HUI) Der aus Kanada stammende Health Utilities Index liegt mittlerweile in drei Versionen vor, dem HUI Mark 1 (Feeny et al., 1995), dem HUI Mark 2 (Torrance et al., 1996) und dem HUI Mark 3 (Horsman et al., 2003). Die erste Version basiert auf der Quality of Well-being Scale (QWB) und ist ausschließlich für pädiatrische Studien konzipiert. Auch der HUI Mark 2 wurde anfangs für den Bereich der pädiatrischen Onkologie entwickelt, ist dann aber für den Einsatz bei Erwachsenen und Jugendlichen modifiziert worden. Der HUI Mark 3 kann ebenfalls bei Erwachsenen und Jugendlichen eingesetzt werden. Neben den verschiedenen Anwendungsfeldern unterscheiden sich die drei Versionen in der Anzahl der gemessenen Dimensionen von gesundheitsbezogener Lebensqualität. Der HUI Mark 1 erfasst vier Dimensionen, der HUI Mark 2 sieben und der HUI Mark 3 acht Dimensionen zur Beschreibung der gesundheitsbezogenen Lebensqualität. Stellvertretend für die drei Versionen ist der HUI Mark 2 in der Tabelle 2 dargestellt. Insgesamt besteht dieses Messinstrument aus 15 Items. Die Antwortabstufungen variieren zwischen drei bis fünf und ermöglichen eine Unterscheidung zwischen Gesundheitszuständen. Die Methodik zur einmaligen Nutzwertbestimmung an einem Referenzkollektiv für den HUI Mark 2 wird bei Torrance et al. (1996) ausführlich dargestellt. Die =HLWVFKULIWI U0HGL]LQLVFKH3V\FKRORJLH2005

49 -0RRFNHWDO1XW]HQWKHRUHWLVFKH/HEHQVTXDOLWlWVPHVVLQVWUXPHQWHLQGHUPHGL]LQLVFKHQ5HKDELOLWDWLRQ Tabelle 2: Dimensionen nutzentheoretischer Lebensqualitätsmessinstrumente Autor(en) Anzahl der Dimensionen Dimensionen Beweglichkeit / Mobilität allgemeine Tätigkeiten Selbstfürsorge EQ-5D SF-6D HUI Mark 2 QWB-SA 15D The EuroQol Group Brazier et al. (1998) Torrance et al. (1996) Kaplan et al. (1997) Sintonen (1995) (1990; dt.: 1998) Schmerzen / körperliche Beschwerden Ängstlichkeit / Niedergeschlagenheit Vgl. Böhmer & Kohlmann (2000) körperliche Funktionsfähigkeit Rollenfunktion soziale Funktionsfähigkeit Schmerz psychisches Wohlbefinden Vitalität körperliche Funktionsfähigkeit Selbstfürsorge sensorische und Kommunikations- Fähigkeiten Lern- und Schulfähigkeit Schmerz und Beschwerden Emotion Fruchtbarkeit Mobilität physische Aktivität soziale Aktivität Symptom- und Problem-Komplex akute körperliche und psychische Beeinträchtigungen Mobilität alltägliche Tätigkeiten Sehvermögen Gehör, Sprache, Atmung, Schlaf, Essen, Verdauung Denken und Gedächtnis Beschwerden und Symptome Depressivität Anspannung Vitalität Sexualität deutschsprachige Übersetzung wurde von der Arbeitsgruppe um Felder-Puig et al. (2000) vorgenommen. 15D-Fragebogen Mitte der neunziger Jahre wurde in Finnland ein weiteres generisches nutzentheoretisches Messinstrument entwickelt (Sintonen, 1995). Der 15D-Fragebogen besteht aus 15 Items. Jedes Item repräsentiert dabei eine Dimension (Tabelle 2) und fünf Antwortmöglichkeiten werden vorgegeben. Die Normierung der Nutzwerte erfolgte anhand einer Stichprobe aus der finnischen Erwachsenenbevölkerung mit Hilfe des Rating-Scale Verfahrens (Sintonen, 1995). Die deutschsprachige Übersetzung wurde von A. Brandt, Riehen (Sintonen, persönliche Mitteilung) durchgeführt. Quality of Well-being Scale Self-administered Version (QWB-SA) Die Selbstausfüllversion der Quality of Well-being Scale basiert auf der Interviewerversion (vergleiche Kaplan, 1976, 1997). Die deutsche Übersetzung wurde von der Arbeitsgruppe um Porszolt (Frosch et al., 2001) durchgeführt. Der Fragebogen ist mit 78 Items sehr umfassend. Der Indexwert zur Lebensqualität wird anhand der fünf Dimensionen chronische Symptome, akute physische und psychische Beeinträchtigungen, Mobilität, soziale Aktivitäten und körperliche Aktivitäten ermittelt. Die chronischen Symptome werden im Ja / Nein Format abgefragt. Weitere Beeinträchtigungen und Aktivitäten werden jeweils für die drei letzten Tage, gestern, vor 2 Tagen und vor 3 Tagen, erfasst (Abbildung 4). Für die fünf Dimensionen wird für jeden Tag ein Score gebildet, wobei nur das für diesen Tag schwerwiegendste Gesundheitsproblem in die Berechnung einfließt. Durch Mittelung der Tageswerte ergibt sich der Indexwert. In der Dimension Mobilität gibt es ein Problem, wenn der QWB-SA bei Probanden eingesetzt wird, die sich in einer stationären Behandlungsmaßnahme befinden. Die Mobilität wird anhand von zwei Items erfasst. Zum einen wird nach dem Aufenthalt in einem Krankenhaus, Pflegeheim oder Rehabilitationszentrum gefragt und zum anderen ob in den vergangenen drei Tagen ein motorisiertes Fahrzeug benutzt wurde (Abbildung 4). In der hier vorgestellten Studie befanden sich insbesondere zum zweiten Messzeitpunkt, am Ende des Rehabilitationsaufenthaltes, alle Probanden in den letzten drei Tagen in einer Rehabilitationsklinik. Für die Berechnung des QWB-SA Indexwertes bedeutet dies, dass die Lebensqualität in Bezug auf die Mobilität stark eingeschränkt ist und der Abschlagswert dieser Dimension, insbesondere zum zweiten Messzeitpunkt, die ermittelten Indexwerte erheblich beeinflusst. Um dieses Problem zu lösen, ist die Auswertungssyntax dahingehend modifiziert worden, dass alle Probanden einen einheitlichen Abschlagswert für die Dimension Mobilität erhalten haben. =HLWVFKULIWI U0HGL]LQLVFKH3V\FKRORJLH

50 -0RRFNHWDO1XW]HQWKHRUHWLVFKH/HEHQVTXDOLWlWVPHVVLQVWUXPHQWHLQGHUPHGL]LQLVFKHQ5HKDELOLWDWLRQ Hatten Sie Kopfschmerzen? An keinem Tag Gestern Vor 2 Tagen Vor 3 Tagen Momente/Zeiten von Aufgewühltheit, Niedergeschlagenheit oder Melancholie? An keinem Tag Gestern Vor 2 Tagen Vor 3 Tagen Waren Sie zu irgendeiner Zeit, tagsüber oder während der Nacht, als Patient in einem Krankenhaus, Pflegeheim oder Rehabilitationszentrum? An keinem Tag Gestern Vor 2 Tagen Vor 3 Tagen An welchen Tagen konnten Sie aus gesundheitlichen Gründen kein motorisiertes Fahrzeug fahren oder öffentliche Verkehrsmittel benutzen oder brauchten dafür die Hilfe anderer? An keinem Tag Gestern Vor 2 Tagen Vor 3 Tagen Abbildung 4: Beispielitems des QWB-SA 5 Ein anwendungsbezogener Vergleich für die medizinische Rehabilitation Die fünf Instrumente werden international und mittlerweile auch national in gesundheitsökonomischen Evaluationsstudien eingesetzt. Eine Vielzahl von Studien hat sich mit dem Vergleich dieser Messverfahren in Bezug auf ihre Anwendbarkeit und Praktikabilität in der kurativen Medizin befasst (Conner-Spady & Suarez-Almazor, 2003; Longworth & Stirling, 2003). Ein systematischer Überblick über diese Studien bietet Kopec & Wilson, (2003). Im Bereich der rehabilitationswissenschaftlichen Forschung hingegen sind nutzentheoretische Messungen der Lebensqualität sowohl in Tabelle 3: Soziodemographische Merkmale der Form genuiner Nutzwertbestimmungen als auch durch Anwendung vereinfachter Fragebogenmethoden bisher nur sporadisch durchgeführt worden (vergleiche Seitz et al., 1999). Entsprechend klein ist die Zahl vergleichender Studien in diesem Bereich. Aus diesem Grund wird derzeit eine Studie durchgeführt, die die Anwendbarkeit in der Rehabilitation und die psychometrischen Eigenschaften, der fünf in deutscher Sprache verfügbaren standardisierten Messverfahren vergleichend untersucht. 5.1 Studiendesign Die Selbstbeurteilungsinstrumente EQ- 5D, SF-6D, HUI, QWB-SA und 15D Muskulo-skelettale Erkrankungen Psychosomatische Erkrankungen N Alter (Mittelwert, Standardabweichung, Min Max) 45 10, , Frauen (in %) Erwerbstätigkeit (in %) Vollzeit 57,0 29,0 Teilzeit 10,5 7,0 Arbeitslos 27,0 48,0 Andere 5,5 16,0 Schulabschluss (in %) Hauptschule 26,0 28,0 Realschule 21,5 15,5 Polytechnische Oberschule 44,0 53,0 Abitur 2,0 3,0 Andere 6,5 0,5 wurden zu einem Fragebogen zusammengefasst. Dieser wurde bei Patienten eingesetzt, die sich mit einer muskuloskelettalen oder psychosomatischen Erkrankung in einer stationären Rehabilitationsmaßnahme befanden. Die Befragung wurde zu Beginn (T1) und am Ende (T2) der Rehabilitationsmaßnahme durchgeführt, so dass Änderungen im Zeitverlauf beobachtet werden konnten. Die psychometrischen Analysen erfolgten anhand der Häufigkeitsverteilungen auf Skalenebene, der Anteile fehlender Werte, der Korrelation der Skalenwerte untereinander (Pearson-r) und der Änderungssensitivität. Insgesamt werden 240 Patienten aus den Indikationsgruppen muskulo-skelettale, psychosomatische und Herz-Kreislauf-Erkrankungen (jeweils 80 Patienten) befragt, die an einer stationären Rehabilitationsmaßnahme teilnehmen. Die Rekrutierung der beiden erstgenannten Indikationsgruppen ist abgeschlossen, und die im folgenden dargestellten Ergebnisse basieren auf diesen beiden Patientengruppen. 5.2 Soziodemographie 195 Patienten haben zu Beginn ihrer Rehabilitationsmaßnahme den Fragebogen ausgefüllt. Am Ende ihres Aufenthalts haben noch 139 (71 %) Patienten den Fragebogen ein zweites Mal beantwortet. Zum ersten/zweiten Messzeitpunkt stammen 99/59 Patienten aus der Indikationsgruppe psychosomatische Erkrankungen und 96/80 Patienten aus der Indikationsgruppe muskulo-skelettale Erkrankungen. In den folgenden Ausführungen sind die Ergebnisse nicht weiter nach Indikationsgruppen differenziert worden, da zwischen den beiden Gruppen hinsichtlich fehlender Werte, der Häufigkeitsverteilungen, der Korrelationen und der Änderungssensitivität keine Unterschiede beobachtet werden konnten. Die soziodemographischen Merkmale der beiden Indikationsgruppen können der Tabelle 3 entnommen werden. Typisch für die Regionen Mecklenburg-Vorpommern und Sachsen-Anhalt, aus denen die Mehrzahl der Probanden stammt, ist die hohe Anzahl an polytechnischen Oberschulabschlüssen unter den Patienten. Ebenfalls typisch für diese Regionen ist die hohe Arbeitslosenquote. Statistisch signifikante Unterschiede in den soziodemographischen Eigenschaf- =HLWVFKULIWI U0HGL]LQLVFKH3V\FKRORJLH2005

51 -0RRFNHWDO1XW]HQWKHRUHWLVFKH/HEHQVTXDOLWlWVPHVVLQVWUXPHQWHLQGHUPHGL]LQLVFKHQ5HKDELOLWDWLRQ ten zwischen den Patienten, die den Fragebogen zum ersten und zweiten Messzeitpunkt komplett beantwortet haben und den Patienten, die nur zu Beginn ihres Rehabilitationsaufenthalt an der Befragung teilgenommen haben, konnten nicht festgestellt werden. 5.3 Fehlende Werte und Häufigkeitsverteilungen Alle Messinstrumente weisen sowohl zum ersten als auch zum zweiten Messzeitpunkt nur eine geringe Anzahl fehlender Werte auf Itemebene auf (vergleiche Tabelle 4), was auf eine hohe Akzeptanz für die Beantwortung der Fragen schließen lässt. Tabelle 4: Fehlende Werte auf Itemebene (Maximalwerte in %) Gesundheitsökonomische Evaluationen spielen bei der Verteilung der begrenzten finanziellen Mittel eine immer größere Rolle. Auf Basis dieser Evaluationen werden Entscheidungen getroffen, ob diagnostische oder therapeutische Maßnahmen hinsichtlich ihres Kosten-Nutzwertverhältnisses den gesundheitsökonomischen Effizienz- und Effektivitätskriterien entsprechen. Die Nutzwerte werden mit Hilfe von präferenzbasierten Messinstrumenten ermittelt. Dabei ist zu- Rehabilitationsbeginn (T1) Rehabilitationsende (T2) EQ-5D 1,6 0,4 SF-6D 2,6 1,6 HUI Mark 2 1,3 1,3 QWB-SA 0,4 0,4 15D-Fragebogen 3,1 1,6 Tabelle 5: Deskriptive Statistiken Die Berechnung der Indexwerte erfolgte für die 139 kompletten Datensätze auf Basis der Originalanweisungen für das jeweilige Instrument beziehungsweise der publizierten Algorithmen. Beim QWB-SA ist wegen der oben geschilderten Probleme eine modifizierte Syntax benutzt worden. Die Mittelwerte variieren zum ersten und zweiten Messzeitpunkt in einem Bereich von 0,52 bis 0,84 auf der Skala von 0 bis 1 (Tabelle 5). Bei keinem der untersuchten Messinstrumente konnten Bodeneffekte gefunden werden. Deckeneffekte auf Skalenebene wurden insbesondere beim EQ-5D zu beiden Messzeitpunkten und beim HUI Mark 2 zum zweiten Messzeitpunkt festgestellt. Die Verteilung der Indexwerte zeigt deutliche Unterschiede, wobei drei verschiedene Muster auftreten (Abbildung 5). Das erste Muster wird vom QWB-SA und SF-6D repräsentiert, deren Indexwerte sich auf die Mitte der theoretischen Skalenspanne von 0 bis 1 konzentrieren. Das zweite Muster wird vom 15D-Fragebogen gebildet, dessen Indexwerte ausschließlich in der oberen Hälfte der Skala zu finden sind, und das dritte Muster beinhaltet den EQ-5D-Fragebogen und den HUI Mark 2 Index. Die Indexwerte streuen hier über den gesamten Skalenbereich, wobei der EQ-5D in der Scoregruppe 0,4 bis 0,5 keine Werte ausweist und der HUI Mark 2 in den oberen Kategoriegruppen stärker vertreten ist als der EQ-5D. 5.4 Korrelationen (Pearsons r) Ähnlich wie die Verteilung der Indexwerte weisen auch die Korrelationen auf Unterschiede zwischen den Messwerten der einzelnen Indexinstrumente hin. Die Korrelationen zu T1 (beziehungsweise T2) liegen zwischen dem QWB-SA und dem EQ-5D mit 0,37 (0,45) auf moderatem Niveau und zwischen dem 15D-Fragebogen und dem SF-6D mit 0,72 und zu T2 zwischen dem 15D und dem HUI Mark 2 mit 0,78 auf hohem Niveau. Dazwischen gruppieren sich die Korrelationswerte der anderen Instrumente (Tabelle 6). 5.5 Änderungssensitivität Ein wichtiges Kriterium für den Einsatz eines Ergebnisparameters in evaluativen Studien ist die Änderungssensitivität (englisch responsiveness), d.h. die Fähigkeit, Veränderungen im Zeitverlauf abbilden zu können. Um die in die Studie eingeschlossenen Instrumente auf ihre Änderungssensitivität hin beurteilen zu können, wurden die Patienten zu T1 und T2 befragt. Die Änderungssensitivität wurde mit zwei Effektstärkevarianten ermittelt (Schuck, 2000). Zum einen wurde die Effektgröße (ES) und zum anderen die standardisierte Mittelwertdifferenz (englisch standardized response mean, SRM) berechnet. Bei der Effektgröße wird der Quotient aus der Mittelwertdifferenz (Mt2 Mt1) und der Standardabweichung zum ersten Messzeitpunkt gebildet. Bei der SRM wird die Mittelwertdifferenz in Bezug zur Standardabweichung der Mittelwertdifferenz gesetzt. Zwischen den berechneten Indexwerten gibt es bei der Änderungssensitivität große Unterschiede. Sowohl bei der ES mit 0,51 als auch bei der SRM mit 0,56 zeigt der SF-6D die höchste relative Änderungssensitivität. Bei Anwendung der Originalauswertungsanweisung für den QWB-SA weist dieser einen Wert von 0,07 in beiden Effektstärkevarianten aus. Nach Veränderung des Auswertungsalgorithmus liegt die Änderungssensitivität auf eher niedrigem Niveau mit 0,23 (Tabelle 7). N = 139 Min Max Mittelwert Standardabweichung Deckeneffekte in % EQ-5D (T1) 0,09 1,00 0,65 0,23 4,3 EQ-5D (T2) 0,12 1,00 0,69 0,22 4,3 SF-6D (T1) 0,31 0,89 0,59 0,10 0,0 SF-6D (T2) 0,34 1,00 0,65 0,14 0,7 HUI II (T1) 0,09 0,97 0,73 0,19 0,0 HUI II (T2) 0,1 1,00 0,77 0,19 5,8 QWB-SA (T1) 0,20 0,77 0,48 0,12 0,0 QWB-SA (T2) 0,09 0,85 0,50 0,13 0,0 15D (T1) 0,52 1,00 0,81 0,10 0,7 15D (T2) 0,46 1,00 0,84 0,12 2,2 6 Schlussfolgerung =HLWVFKULIWI U0HGL]LQLVFKH3V\FKRORJLH

52 -0RRFNHWDO1XW]HQWKHRUHWLVFKH/HEHQVTXDOLWlWVPHVVLQVWUXPHQWHLQGHUPHGL]LQLVFKHQ5HKDELOLWDWLRQ QWB-SA (T1) QWB-SA (T2) 40 SF-6D (T1) SF-6D (T2) in Prozent in Prozent ,1 0,1-0,2 0,2-0,3 0,3-0,4 0,4-0,5 0,5-0,6 0,6-0,7 0,7-0,8 0,8-0,9 0,9-1 0 Scoregruppen 0-0,1 0,1-0,2 0,2-0,3 0,3-0,4 0,4-0,5 0,5-0,6 0,6-0,7 0,7-0,8 0,8-0,9 0,9-1 Scoregruppen 5a: Indexwertverteilung des QWB-SA 5b: Indexwertverteilung des SF-6D E Q -5D (T 1) HUI 2 (T1) E Q -5D (T 2) HUI 2 (T2) in Prozent in Prozent ,1 0,1-0,2 0,2-0,3 0,3-0,4 0,4-0,5 0,5-0,6 0,6-0,7 0,7-0,8 0,8-0,9 0, ,1 0,1-0,2 0,2-0,3 0,3-0,4 0,4-0,5 0,5-0,6 0,6-0,7 0,7-0,8 0,8-0,9 0,9-1 Scoregruppen Scoregruppen 5c: Indexwertverteilung des EQ-5D 5d: Indexwertverteilung des HUI Mark D (T1) 15D (T2) in Prozent ,1 0,1-0,2 0,2-0,3 0,3-0,4 0,4-0,5 0,5-0,6 0,6-0,7 0,7-0,8 0,8-0,9 0,9-1 Scoregruppen 5e: Indexwertverteilung des 15D-Fragebogen Abbildung 5: Indexwertverteilungen der untersuchten Messinstrumente zum ersten und zweiten Messzeitpunkt mindest theoretisch eine Vergleichbarkeit der einheitlichen Währung Nutzwert über unterschiedliche Behandlungsmaßnahmen und verschiedene Indexinstrumente hinweg möglich. Um dies für den Bereich der Rehabilitation zu überprüfen, Tabelle 6: Korrelationen zwischen den Instrumenten zum 1. und 2. Messzeitpunkt T1 / T2 SF-6D HUI II QWB-SA 15D EQ-5D 0,63 / 0,68 0,66 / 0,67 0,37 / 0,45 0,65 / 0,68 SF-6D 0,69 / 0,69 0,44 / 0,59 0,72 / 0,76 HUI II 0,44 / 0,58 0,72 / 0,78 QWB-SA 0,58 / 0,62 Alle Korrelation sind signifikant < 0,01 sind die fünf in deutscher Sprache verfügbaren präferenzbasierten Messinstrumente zu einem Fragebogen zusammengefasst und vergleichend untersucht worden. Die Studienergebnisse zeigen, dass die berechneten Nutzwerte nicht oder nur bedingt vergleichbar sind. Die Indexwertverteilung und die Korrelationen machen deutlich, dass die Instrumente weit von einer 1:1 Beziehung entfernt sind und kein einheitliches Bild der gesundheitsbezogenen Lebensqualität zeichnen. Die Ergebnisse weisen ebenfalls darauf hin, =HLWVFKULIWI U0HGL]LQLVFKH3V\FKRORJLH2005

53 -0RRFNHWDO1XW]HQWKHRUHWLVFKH/HEHQVTXDOLWlWVPHVVLQVWUXPHQWHLQGHUPHGL]LQLVFKHQ5HKDELOLWDWLRQ Tabelle 7: Änderungssensitivität N = 139 dass vier der fünf Indexinstrumente in rehabilitationswissenschaftlichen Studien praktikabel und gut anwendbar sind. Bei stationären Patienten ist der QWB-SA nur mit einem modifizierten Algorithmus einsetzbar. Bei der Planung einer Studie und der Frage, welches Messinstrument eingesetzt werden soll, ist auf einige zentrale Punkte hinzuweisen. Soll das Indexinstrument zusammen mit anderen Messinstrumenten eingesetzt werden, ist ein kurzer Fragebogen mit wenigen Items notwendig. Hier bietet sich besonders der EQ-5D Fragebogen an. Aufgrund seiner weiten Verbreitung ermöglicht der EQ- 5D zudem umfassende Vergleiche sowohl mit internationalen als auch mit nationalen Studien. Für die Beschreibung von Veränderungen im Zeitverlauf sind insbesondere der SF-6D und der 15D- Fragebogen empfehlenswert. Mit der vorliegenden Studie wird erstmals ein direkter Vergleich aller in deutscher Sprache verfügbaren Indexinstrumente vorgestellt. Die Ergebnisse beinhalten wichtige Informationen über die Anwendbarkeit und die psychometrischen Eigenschaften dieser Instrumente, die wesentlich für deren Einsatz in evaluativen Rehabilitationsstudien sind. Da sich unsere Ergebnisse nur auf zwei stationäre Indikationsgruppen beziehen, müssen weitere Ergebnisse zeigen ob sich ähnliche Ergebnisse im Bereich der ambulanten Rehabilitation und bei anderen Indikationsgruppen ergeben. Literatur Effektgröße (ES) Standardisierte Mittelwertdifferenz (SRM) EQ-5D 0,21 0,24 SF-6D 0,51 0,56 HUI II 0,25 0,30 QWB-SA 0,22 0,23 15D 0,33 0,45 Böhmer, S. & Kohlmann, T. (2000). Verfahren zur Bewertung von Gesundheitszuständen und Lebensqualität. In: U. Ravens-Sieberer & A. Cieza (Hg.). Lebensqualität und Gesundheitsökonomie in der Medizin: Konzepte, Methoden, Anwendung (53 72). Landsberg: ecomed. Brazier, J.E., Roberts, J.R. & Deverill M. (2002). The estimation of a preference-based measure of health from the SF-36. Journal of Health Economics, 21, Brazier, J., Usherwood, T., Harper, R. & Thomas, K. (1998). Deriving a preference-based single index from the UK SF-36 Health Survey. J Clin Epidemiol, 51 (11), Bullinger, M. & Kirchberger, I. (1998). SF-36 Fragebogen zum Gesundheitszustand. Göttingen: Hogrefe. Conner-Spady, B. & Suarez-Almazor, M.E. (2003). Variation in the Estimation of Qualityadjusted Life-years by Different Preferencebased Instruments. Medical Care, 41 (7), Drummond, M.F., O Brien, B.J., Stoddart, G.L. & Torrance, G.W. (1997). Cost-utility analysis. In: Methods fort he economic evaluation of health care programmes ( ). Second edition. Oxford University Press. EuroQol Group (1990). EuroQol a new facility fort he measurement of health-related quality of life. Health Policy, 16, Feeny, D., Furlong, W., Boyle, M. & Torrance, G.W. (1995). Multi-attribute health status classifications systems Health Utilities Index. Pharmacoeconomics, 7, Felder-Puig, R., Frey E., Sonnleithner, G., Feeny, D., Gadner, H., Barr, R.D., Furlong, W. & Topf, R. (2000). German cross-cultural adaptation of the Health Utilities Index and its application to a sample of childhood cancer survivors. Eur J Pediatr, 159 (4), Froberg, D.G. & Kane, R.L. (1989). Methodology for Measuring Health-State Preferences- II: Scaling Methods. J Clin Epidemiol, 42 (5), Frosch, D., Porzsolt, F., Heicappell, R., Kleinschmidt, K., Schatz, M., Weinknecht, S. & Kaplan, R.M. (2001). Comparison of German language versions of the QWB-SA and SF-36 evaluating outcomes for patients with prostate disease. Quality of Life Research, 10, Graf von der Schulenburg, J.-M., Claes, C., Greiner, W. & Uber, A. (1998). Die deutsche Version des EuroQol-Fragebogens. Zeitschrift für Gesundheitswissenschaften, 6 (1), Green, C., Brazier, J. & Deverill, M. (2000). Valuing Health-Related Quality of Life. A Review of Health State Valuation Techniques. Pharmacoeconomics, 17 (2), Greiner, W. (1999). Ökonomische Evaluationen von Gesundheitsleistungen: Fragestellungen, Methoden und Grenzen dargestellt am Beispiel der Transplantationsmedizin. Baden-Baden: Nomos. Horsman, J., Furlong, W., Feeny, D. & Torrance, G. (2003). The Health Utilities Index (HUI): concepts, measurement properties and applications. Health and Quality of Life Outcomes, 1, 54. Kaplan, R.M., Bush, J.W. & Berry, C.C. (1976). Health status: types of validity and the Index of Well-Being. Health Serv Res, 11, Kaplan, R.M., Sieber, W.J. & Ganiats, T.G. (1997). The Quality of Well-Being Scale: Comparison of the interviewer-administered version with a self-administered questionaire. Psychology and Health, 12, Kopec, J.A. & Willison, K.D. (2003). A comparative review of four preference-weighted measures of health-related quality of life. Journal of Clinical Epidemiology, 56, Longworth, L. & Stirling, B. (2003). An empirical comparison of EQ-5D and SF-6D in liver transplant patients. Health Economic, 12 (12), Patrick, D.L. & Erickson, P. (1993). Assigning values to health states. In: Health status and health policy Quality of life in health care evaluation and resource allocation (176ff.). New York: Oxford University Press. Schöffski, O. (2002). Nutzentheoretische Lebensqualitätsmessung. In: O. Schöffski, J.M. Graf von der Schulenburg (Hg.). Gesundheitsökonomische Evaluationen ( ). Studienausgabe. Berlin, Heidelberg: Springer. Schöffski, O. & Uber, A., (2002). Grundformen gesundheitsökonomischer Evaluationen. In: O. Schöffski, J.M. Graf von der Schulenburg, (Hg.). Gesundheitsökonomische Evaluationen (201). Studienausgabe. Berlin, Heidelberg: Springer. Seitz, R., Leidl, R. & Jacobi, E. (1999) Die psychometrischen Eigenschaften des EuroQol bei Rehabilitanden mit Erkrankungen des Stützund Bewegungsapparats. Zeitschrift für Gesundheitswissenschaften, 3 (7), Sintonen, H. (1995). The 15D-Measure of health-related quality of life. II Feasibility, reliability and validity of its valuation system. National Health and Medical Research Council, Working Paper 42, National Centre for Health Program Evaluation. Torrance, G. (1986). Measurement of Health State Utilities for Economic Appraisal. a Review. J Health Econ, 5, Torrance, G.W., Feeny, D.H., Furlong, W.J., Barr, R.D., Zhang, Y. & Wang, Q. (1996). Multiattribute utility function for a comprehensive health status classification system Health Utilities Index Mark 2. Medical Care, 34 (7), Torrance, G.W., Thomas, W. & Sacket, D. (1972). A utility maximation model for evaluation of health care programs. Health Services Research, 7 (2), von Neumann, J. & Morgenstern, O. (1953). Theory of Games and economic behavior, New York. Ware, J. & Sherbourne, C. (1992). The MOS 36-item Short-Form Health Survey (SF-36): I. Conceptual framework and item selection. Medical Care, 30, Schuck, P. (2000). Designs und Kennziffern zur Ermittlung der Änderungssensitivität von Fragebogen in der gesundheitsbezogenen Lebensqualitätsforschung. Zeitschrift für Medizinische Psychologie, 9, =HLWVFKULIWI U0HGL]LQLVFKH3V\FKRORJLH

54 6.2 Moock J, Kohlmann T, Zwingmann C. Patient-reported outcomes in rehabilitation research: instruments and current developments in Germany. J Public Health 2006; 14:

55 J Public Health (2006) 14: DOI /s REVIEW ARTICLE Patient-reported outcomes in rehabilitation research: instruments and current developments in Germany Joern Moock & Thomas Kohlmann & Christian Zwingmann Received: 26 May 2006 /Accepted: 23 June 2006 / Published online: 3 October 2006 # Springer-Verlag 2006 Abstract Monitoring the health status of patients has become a major activity in rehabilitation research in recent years. As a result, various self-assessment instruments have been developed, adapted or improved with the aim of measuring patient-reported outcomes and predictors. Among these are international instruments, such as the NHP or the SF-36, as well as those developed in Germany, such as the IRES, the FREM-17 or the SPE-scale. Some of the widely used international instruments, such as the NHP and SF-36, have been translated into German for application in Germany. All of these instruments have been thoroughly tested and validated in several studies. Current trends in statistical methods (e.g. responsiveness, Rasch scaling) as well as classical test-theoretical standards were taken into consideration in the development of these instruments. In this article, we provide a comprehensive review of five important assessment fields of rehabilitation research in Germany: health-related quality of life (generic, disease-specific, children and adolescents, preferencebased), evaluation of specific therapy and education programs, motivation, screening for vocational problems and screening for comorbid disorders. The questionnaires are critically discussed, and perspectives for further research are specified. Although assessment instruments as the IRES or the SF-36 are well-established in rehabilitation research studies, there is still a need for further research to determine the best choice of instruments for a J. Moock (*) : T. Kohlmann Institute of Community Medicine, University of Greifswald, Walther-Rathenau-Strasse 48, Greifswald, Germany joern.moock@uni-greifswald.de C. Zwingmann Department for Healthcare and Social Policy, Prognos AG, Düsseldorf, Germany given purpose. The limitations of the questionnaires with respect to health care studies are also discussed. Keywords Assessment. Patient-reported outcomes. Questionnaire. Rehabilitation research. Review Introduction Assessing patient-reported outcomes is an essential element of health care evaluation in rehabilitation research. In 1998, the German Federal Ministry of Education and Research (BMBF) and the German pension insurance scheme established a funding program for rehabilitation research projects. The German Research Funding Program BRehabilitation Sciences^ contains eight research networks and maintains working groups across all of these research networks (URL: Various selfadministered instruments were developed in order to measure patient-reported outcomes and predictors, all adapted or improved within the framework of this funding program. These instruments assist in the inclusion of the patients_ perspective in the area of rehabilitation research, diagnostics and therapy. A personal perception of overall health status as well as a feeling of well-being in physical, mental and social domains are substantial factors in coping and health-related behavior. Therefore, patient-reported outcomes are a matter of particular interest. Methods In this paper, a comprehensive review is given in five important assessment fields of rehabilitation research in

56 334 J Public Health (2006) 14: Germany: health-related quality of life (HRQoL), evaluation of specific therapy and education programs, motivation, screening for vocational problems and screening for comorbid mental disorders. The purpose of this review is to provide researchers and clinicians with current developments and practical information regarding the instruments reviewed. Results Health-related HRQoL Current questionnaires measuring HRQoL can be classified into psychometric measures, which are rooted in classical measurement theory, and preference-based measures, which are derived from decision and utility theories. In the traditions of both types of instruments, health is considered to be a multidimensional concept, but the two approaches differ in several aspects. The development of psychometric measures is based on the specific scale_s objectivity, validity, reliability, and responsiveness to each health domain. This is achieved by developing multi-item scales to measure each domain. In contrast, the goal of instruments measuring HRQoL for use in economic evaluations is to obtain a single summary index expressing peoples_ preferences for different health states. Such measures determine various aspects of health on a single summary scale from zero (dead) to unity (healthy). In addition, HRQoL questionnaires can be further subclassified into generic and disease-specific instruments. Generic instruments are able to compare outcomes across different populations and interventions, while diseasespecific measures assess the specific health status and concerns of certain diagnostic groups. Unlike generic instruments, the latter seem to be especially sensitive for detecting changes over time, which is an important feature for clinicians and patients. Generic HRQoL questionnaires At the present time, two generic HRQoL instruments are commonly used in German rehabilitation research: the questionnaire BIndicators of Rehabilitation Status^ (IRES; Bührlen et al. 2005) and the BShort Form-36 Health Survey^ (SF-36; Bullinger and Kirchberger 1998; Ware and Sherbourne 1992). Short versions of the IRES (IRES- 24) and the SF-36 (SF-12) are also available. Both instruments are often used in combination of one long version and one short version in German rehabilitation research projects. Measurement instruments which are much less frequently used are the BSickness Impact Profile^ (SIP; Bergner et al. 1981) and the BNottingham Health Profile^ (NHP; Hunt et al. 1981). Table 1 provides the content areas covered by these four HRQoL instruments. Indicators of Rehabilitation Status (IRES) questionnaire The IRES was developed and validated in Germany as a generic instrument assessing HRQoL in rehabilitation research studies (Gerdes and Jäckel 1995). Theoretical considerations as well as re-analyses of extensive datasets have recently provided the necessary support for a major revision of the items and scales (e.g. Zwingmann 2004). The revised version IRES-3 (Bührlen et al. 2005) is based on a theoretical model of rehabilitation following the guidelines of the ICF (International Classification of Functioning, Disability, and Health). In addition, the results of expert panels on the definition of treatment goals in Table 1 Content areas of the generic HRQoL instruments a reviewed IRES-3 SF-36 SIP NHP Physical health Physical functioning Mobility Energy level Pain Role limitations due to physical problems Ambulation Emotional reaction Health-related behavior Bodily pain Body care and movement Physical mobility Physical functioning Occupational functioning General health perceptions Communication Pain Mental health Vitality Alertness behavior Social Isolation Coping Social functioning Emotional behavior Sleep Social integration Role limitations due to emotional problems Social interaction Mental health Sleep and rest Eating Work Home management Recreation and pastimes a IRES-3, Indicators of Rehabilitation Status; SF-36, Short Form-36 Health Survey; SIP, Sickness Impact Profile; NHP, Nottingham Health Profile

57 J Public Health (2006) 14: medical rehabilitation are implemented. The IRES-3 questionnaire consists of eight dimensions with a varying number of items. Response levels range from five to seven. The scale classification is based on theoretical considerations with regard to exploratory and confirmatory factor analyses (Bührlen et al. 2005). The IRES-3 questionnaire is available in three different versions. The baseline version includes 144 items, thereby assessing additional information about treatment strategy, normal daily activities and vocational life. The end of treatment version comprises 75 items, the follow-up version 123 items. The IRES-3 was thoroughly tested in a sample of rehabilitation patients of seven diagnostic groups (n=453). Comparisons of the IRES-3 with the SF-36 and a German version of the BHospital Anxiety and Depression Scale^ (HADS-D) revealed convergent validity. The analyses also showed satisfactory results with respect to item difficulties, missing values, ceiling and floor effects, internal consistencies and test-retest-reliability. Pearson correlations between IRES-3 and SF-36 scales of the same domain were moderate to strong, thus demonstrating good practicability in comparison with another generic measurement. All dimensions of the IRES-3 showed higher responsiveness than the SF-36. The German version of the IRES-3 is available online (URL: A short version of the IRES-3 (IRES-24) was derived which is based on Mixture Distribution Rasch Models (Wirtz et al. 2005). The IRES-24 describes four dimensions: subjective health, functionality in everyday life, physical health and pain, and is a short, economic, and practicable tool for assessing indicators relevant for treatment strategy and the evaluation of clinical rehabilitation. Short Form-36 Health Survey (SF-36/SF-12) At the international level, the SF-36 is currently one of the most widely used HRQoL instruments. In its early stages, the SF-36 was developed to assess the HRQoL in clinical practice and research, health policy evaluations and general population surveys (Ware and Sherbourne 1992). Since its development it has also been established in rehabilitation outcome research studies. The SF-36 consists of 36 items measuring health across eight domains. Responses are transformed into a score ranging from 0 (bad health) to 100 (good health). Additionally, the eight dimensions can be summarized to two broad scales: physical health and mental health. In recent years, several rehabilitation research studies have shown that the SF-36 is a feasible instrument by which to measure HRQoL in samples of rehabilitation patients (Bullinger et al. 2003; Maurischat and Krüger-Bödecker 2004). A short version (SF-12) is also available which contains 12 items that describe HRQoL on the same two broad domains as the original: physical health and mental health. Disease-specific instruments In contrast to generic measurements, disease-specific instruments assess HRQoL for certain interventions or in certain subpopulations. In general, disease-specific instruments seem to be more sensitive to changes in patients_ health status than generic HRQoL measures. Several diseasespecific instruments have developed or adapted to measure HRQoL in rehabilitation. In this review we describe two instruments in more detail: the BQuality of Life Questionnaire Asthma and Chronic Obstructive Pulmonary Disease^ (FLAC; Mühlig et al. 2000) and the German version of the BShort Musculoskeletal Function Assessment Questionnaire^ (SMFA; Swiontkowski et al. 1999). FLAC The aim of FLAC was to facilitate the evaluation of HRQoL in samples of patients with chronic respiratory diseases. FLAC consists of 14 Likert-scaled items, each belonging to one of four subscales: physical well-being and functioning (four items), social well-being and functioning (four items), mental well-being and functioning (four items) and treatment satisfaction and disease management (two items). The questionnaire was tested and validated in a sample of patients with asthma and chronic obstructive pulmonary disease, respectively (n=143). Results have shown that the FLAC is highly accepted and feasible in samples of patients with chronic respiratory diseases. SMFA The SMFA was originally developed in the United States as a disease-specific HRQoL measure for use in communitybased outcome studies and in clinical studies of patients with musculo-skeletal disorders (Swiontkowski et al. 1999). The questionnaire consists of two parts with a total of 46 items. Part one the function index (34 items) assesses patient function, and part two the bother index (12 items) describes whether patients are bothered by functional problems. Disease-specific instruments, such as the SMFA, cover a broad range of musculo-skeletal diseases of the extremities (i.e. degenerative, inflammatory or traumatic diseases). The German adaptation (SMFA-D) has been tested in several patient samples treated operatively for osteoarthritis of the knee and hip, rotator cuff tears and rheumatoid arthritis with regard to practicability, psychometric properties and distributional characteristics (e.g. König et al. 2000, Kirschner et al. 2003, Glatzel et al. 2004, Wollmerstedt et al. 2004). It seems to be a valid, reliable and responsive

58 336 J Public Health (2006) 14: instrument by which to assess changes in functional status concerning patients with musculo-skeletal diseases of the extremities. In addition, a short version (XSMFA-D) containing 16 items has been developed (Wollmerstedt et al. 2003). The XSMFA-D was evaluated in a sample of patients with primary osteoarthritis of the knee and hip undergoing a total joint replacement. Analyses with respect to internal consistency, test-retest-reliability as well as construct and criterion validity yielded moderate to high coefficients. However, further studies evaluating the feasibility of the XSMFA-D in samples of patients with moderate musculo-skeletal disorders are needed. Currently, a population-based study with the SMFA-D and XSMFA-D, respectively, is planned for assessing norms of the general population. Children and adolescents Concomitant with the growing number of structured treatment programs for children and adolescents in rehabilitation is the growing interest in indicators of subjective health and quality of life in this research field. While there is evidence that HRQoL measures are valuable instruments in adult samples, the assessment of HRQoL in children and adolescents has remained a scientific challenge. In German rehabilitation research studies on children and adolescents with chronic health conditions, the revised version of the KINDL, the KINDL-R (URL: is often used (Ravens-Sieberer et al. 2005). KINDL-R The KINDL-R represents a German-language instrument, which is also available in English and a number of other languages. Three self-report versions exist, each applicable for a different age group: Kiddy-KINDL-R, for children aged 4 7 years; Kid-KINDL-R, for children aged 8 12 years, Kiddo-KINDL-R, for children aged years. Additionally, two proxy versions for parents are available: for parents with children aged 4 7 years and for those with children aged 8 16 years. The KINDL-R core set consists of 24 Likert-scaled items assessing six dimensions based on four items each: physical well-being, emotional well-being, self-esteem, family, friends and everyday functioning (school or nursery school). The subscales can be combined to a total score. All versions of the KINDL-R contain an additional module entitled BDisease^. This module consists of a filter question and six items measuring the HRQoL addressing the children_s illness. Existing disease-specific modules are obesity, bronchial asthma, atopic dermatitis and diabetes. The practicability and psychometric properties of the KINDL-R have been evaluated in a sample of children and adolescents (n=1020; 8 17 years) with diagnoses of obesity, asthma or atopic dermatitis. Participants filled in the KINDL-R core set plus the relevant disease-specific module at the beginning and the end of an inpatient rehabilitation treatment as well as at 3 and 12 months after treatment. The results demonstrated good psychometric properties. Additionally, gender-, age- and diagnosis-specific impairments were found, particularly for children with obesity and for those with the highest degree of obesity, respectively. In sum, the results suggest that the KINDL-R is a feasible and valid instrument for assessing HRQoL in children and adolescents with chronic disorders in inpatient rehabilitation settings. Furthermore, the KIDSCREEN project (Ravens-Sieberer et al. 2001; URL: funded by the European Union should be mentioned. The aim of the KIDSCREEN project is the cross-national development of a questionnaire measuring HRQoL in children aged from 8 to 18 years. Three versions are currently available: the KIDSCREEN-52 (long version), the KIDSCREEN-27 (short version) and the KIDSCREEN-10 index, all of which offer a global HRQoL score. The three questionnaires assess HRQoL from a child_s perspective in terms of physical, mental and social well-being. However, further research is needed to evaluate the benefit of these HRQoL instruments in pediatric rehabilitation. Preference-based HRQoL measurements The generic instruments described above measure quality of life as a health profile, focusing on the evaluation of several domains. In contrast, the aim of instruments for use in economic evaluations is to obtain a single index score that reflects peoples_ preferences of different health states (Froberg and Kane 1989). Increasing numbers of health economic evaluation studies on medical treatments have been carried out in recent years. Currently, several preference-based instruments are available in the German language: EQ-5D, Short Form-6 Dimensions (SF-6D), Health Utilities Index Mark 2 (HUI Mark 2), 15Dquestionnaire and the Quality of Well-Being-Self-Administered (QWB-SA). These instruments are described here and in Table 2. EQ-5D The EQ-5D consists of five dimensions, each with three items. The descriptive system allows for 243 discrete health states. In addition, a visual analogue scale (EQ-VAS) measures participants_ current health on a scale, anchored by worst (0) and best (100) imaginable health state. As the only preference-based measure which has been thoroughly tested and validated in Germany (Schulenburg et al. 1998), the EQ-5D is to date the most frequently used and the one

59 J Public Health (2006) 14: Table 2 Dimensions of the preference-based HRQoL instruments a reviewed EQ-5D SF-6D HUI Mark 2 QWB-SA 15D Number of dimensions Dimensions Mobility Physical functioning Mobility Mobility Mobility Physical activities Usual activities Role limitation Usual activities Self-care Self-Care Social functioning Social activities Sensation Chronic symptoms or problems acute physical symptoms, mental health symptoms and behaviors Vision Hearing, Speech, Breathing, Sleeping, Eating, Elimination Cognition Mental function Pain/Discomfort Pain Pain Discomfort and symptoms Anxiety/ Depression Mental health Emotion Depression Distress Vitality Vitality Sexual function Fertility a SF-6D, Short Form-6 Dimensions; HUI Mark 2, Health Utilities Index Mark 2; QWB-SA, Quality of Well-Being-Self-Administered recommended for the utility-oriented assessment of patient outcomes (Hessel et al. 1999; Krauth et al. 2003). In a study on rehabilitation inpatients with chronic low back pain, the EQ-5D was demonstrated to be a useful instrument in rehabilitation research (Seitz et al. 2001). SF-6D The aim of the SF-6D was to extract utility values from the profile instrument SF-36 (Brazier et al. 2002). The SF-6D consists of six dimensions derived from 11 items of the SF- 36. The number of levels per item ranges between four and six. The SF-6D utility score is based on a representative sample of the general population from the United Kingdom. The SF-6D can also be used as an independent instrument. Health Utilities Index Mark 2 (HUI Mark 2) The HUI Mark 2 is the second version of the Canadian HUI questionnaire family (Torrance et al. 1996) and describes six Fplus one_ dimensions of sensory and communication abilities. The questionnaire comprises 15 items with three to five response categories. The HUI Mark 2 preference scores were estimated in a sample of parents in Hamilton, Ontario. The translation into German and the validation was carried out in a sample of childhood cancer survivors by Felder-Puig et al. (2000). Quality of well-being scale-self-administered (QWB-SA) The QWB-SA is based on the interviewer version of a questionnaire (Kaplan et al. 1976, 1997) and includes five sections of HRQoL (Sieber et al. 2004). Chronic symptoms or problems are assessed as present or absent, while all other symptoms and problems are evaluated only for the last 3 days preceding the interview. The German version was analyzed with respect to psychometric properties, validity, and reliability in clinical samples with current diagnosis of prostate cancer, benign prostatic hyperplasia, colon cancer and rectal cancer (Frosch et al. 2001). 15D The 15D questionnaire was developed in Finland and consists of 15 items, each with five response levels (Sintonen 1994). Values for the 15D were derived from a sample of the Finnish population. The German translation was carried out by Arno Brandt (H. Sintonen, personal communication). The psychometric properties and feasibility of the German versions from the EQ-5D, SF-6D, HUI Mark 2, 15D and QWB-SA were recently compared in a longitudinal study in rehabilitation inpatients with musculo-skeletal, cardiovascular or psychosomatic disorders (Moock et al. 2005). In terms of missing values, all instruments appeared

60 338 J Public Health (2006) 14: to be highly acceptable. Ceiling effects were acceptable as well. However, comparisons of distributions and mean index scores demonstrated that results obtained with different preference-based measures were not equivalent. If small changes are expected in evaluative studies, the 15D or the SF-6D should be used. Evaluation of specific therapy and education programs The development of assessments to evaluate specific therapy and education programs of rehabilitation settings was a main focus in the German Research Funding Program BRehabilitation Sciences^ (Zwingmann et al. 2004). In the following, an instrument assessing the fear of illness progression in samples of patients with chronic disorders is presented, and a brief report on two other measurements evaluating educational programs in rehabilitation is given. Fear of Progression Questionnaire (FoP-Q) One of the most important aspects of psychological distress in patients with confirmed diseases (e.g. cancer, diabetes mellitus, and arthritis) is the fear of illness progression. As the fear of progression (FoP) may have a substantial impact on quality of life, specific treatment is appropriate. To develop treatments reducing FoP, questionnaires assessing patients_ distress related to FoP are necessary. The BFear of Progression Questionnaire^ (FOP-Q) is a psychological questionnaire measuring FoP in patients with chronic diseases (Herschbach et al. 2005). The development of this questionnaire was undertaken in three stages. The initial questionnaire with 87 items was psychometrically tested in a sample of rehabilitation inpatients (n=411). On the basis of these results, 43 items were selected to describe five subscales: affective reaction (13 items), partnership/family (seven items), occupation (seven items), loss of autonomy (seven items) and coping with anxiety (nine items). The FoP-Q was subsequently adopted in a new sample of rehabilitation inpatients with chronic diseases (n=439) to evaluate convergent and discriminative validity. The correlation coefficients of the FoP-Q total score and other psychiatric measurements (HADS depression, HADS anxiety, SCL-90-R anxiety, SCL-90-R phobic anxiety and SF-12 physical and mental sub-scales) were moderate and ranged between 0.51 and Within defined subgroups of patients with varying disease duration the discriminative power of the FoP-Q was found to be suitable. In sum, the results demonstrated that the FoP-Q is a questionnaire which is independent from other anxiety and depression scales and which is suited to discriminate within patient groups. As a well-accepted, short and economic instrument it can be used to assess FoP in samples of rehabilitation patients with chronic diseases. The FoP-Q is also available in English language. However, only the German version has been tested at the present time for its psychometrical properties. Two additional instruments were developed for evaluating educational programs. The first is the BBath Ankylosing Spondylitis Disease Activity Index^ (BASDAI; Garrett et al. 1994), which defines the disease status in rehabilitation patients with ankylosing spondylitis (AS) and related diseases. It was translated into German and validated in a sample of rehabilitation inpatients with AS and other spondarthropathies at the beginning and the end of treatment (n=318; Bönisch and Ehlebrecht-König 2003). The BASDAI consists of six 10-cm horizontal visual analogue scales measuring severity of fatigue, spinal and peripheral joint pain, tenderness and morning stiffness. In conclusion, the BASDAI-D is a valid and reliable instruments for patients with AS. As a result of its good feasibility and practicability, the BASDAI-D is suggested for use in medical rehabilitation research. The second is the BSelf-efficacy Scale for Parents of Preschoolers with Atopic Dermatitis^ (SEND), which is a disease-specific instrument. This questionnaire consists of nine items with six levels each (Buchholz et al. 2003). Psychometric analyses in a sample of parents (primarily mothers) of pre-schoolers with atopic dermatitis n=163), which obtained an intensive medical examination program, demonstrated that the SEND is an applicable and usable assessment for the evaluation of atopic dermatitis-specific interventions. Motivation The achievement of rehabilitation treatment depends on a patient_s individual motivation and compliance. However, the assessment of motivation with regard to methodological and content-specific aspects is complex. Nevertheless, several instruments assessing the motivation to participate in rehabilitation treatment have been developed in the last years. Two instruments are of particular interest in rehabilitation research and will be discussed here in some detail. An overview of various measurements evaluating motivation in psychotherapy is given by Zwerenz et al. (2005). Questionnaire for Assessing Rehabilitational Motivation (FREM-17) The BQuestionnaire for Assessing Rehabilitational Motivation^ (FREM-17; Deck et al. 1998) is a generic instrument based on the Bexpectancy-value theory^ (Weiner 1992). The FREM-17 was developed to measure the

61 J Public Health (2006) 14: expectation and motivation of inpatients within the framework of rehabilitation treatment. Further research revealed that it is sufficient to confine the questionnaire to the expectancy component (Deck 1999). The current version of the FREM-17 consists of 17 items representing four domains: regeneration (five items), health (four items), coping (four items) and retirement (four items). Practicability and psychometric properties were tested in a sample of rehabilitation inpatients with non-specific low back pain. The results suggest that the FREM-17 is a practicable, reliable and valid instrument by which to assess rehabilitation motivation. In addition, an economic short version, the FREM-8, is available. Patient Questionnaire of Rehabilitation Motivation (PAREMO) Yet another instrument assessing motivation is the BPatient Questionnaire of Rehabilitation Motivation^ (PAREMO; Hafen et al. 2001). The PAREMO contains 46 items relating to six domains: need for assistance and psychological burden of suffering (eight items), restrictions in everyday life because of the physical burden of suffering (six items), reactions of significant others to the illness (six items), readiness to change in terms of preventive behavior (eight items), hopelessness and skepticism (four items) and initiative and knowledge (six items). The PAREMO was tested in five samples of rehabilitation inpatients with musculo-skeletal, cardiovascular, pulmonary, oncological or psychosomatic disorders and was found to be a practical, reliable and valid instrument. A short version, the PAREMO-20, is also available (Kriz et al. 2006). A manual of the PAREMO-20 in German is available online at ( Rehabilitationspsychologie/forschung1/downloads/ PAREMO_20_Kurzmanual%201%20.pdf/). With the FREM-17 and the PAREMO researchers have two highly accepted generic instruments for assessing rehabilitation motivations. In addition, a number of other instruments have been developed with the objective of measuring specific aspects of motivation. For example, the RELEIMO questionnaire was developed to measure rehabilitation-related activity motivation (Muthny et al. 2005), and the first results from a sample of rehabilitation inpatients with musculo-skeletal disorders showed that it has satisfactory psychometric properties. The HAMORE scale, which is based on the BHealth Action Process Approach (HAPA)^ (Schwarzer 1992), was developed to predict the degree of inpatients_ cooperation and willingness during rehabilitation treatment (Kühn et al. 2001). Finally, the FBTM (Fragebogen zur berufsbezogenen Therapiemotivation) assesses the motivation of rehabilitation patients with psychosomatic disorders for vocational reintegration (Zwerenz et al. 2005). It consists of 24 items describing four subscales: intention to change, wish for pension, negative treatment expectations and active coping. The FBTM was validated in a sample of rehabilitation inpatients with psychosomatic disorders (n=282). The results showed moderate to strong reliability coefficients and only small correlations between the four subscales. Ongoing studies address the sensitivity and predictive validity of the FBTM. The motivation-related instruments mentioned above are based on the assumption that the motivation to participate actively in a rehabilitation treatment is a multidimensional construct. However, the questionnaires differ greatly in the domains that they cover and were designed as either generic or disease-specific tools. Further research projects comparing the questionnaires with respect to psychometric properties, feasibility and practicability are required. Screening for vocational problems The return to work and avoidance of early retirement are essential outcome parameters of rehabilitation. Accordingly, the development of instruments assessing the subjective likelihood for return to work is a fundamental challenge within the scientific community of rehabilitation research. Several instruments have been developed and validated during the past few years, and a comprehensive overview of these is given by Fiedler et al. (2005). The ISI questionnaire (Isnyer Rückkehr Inventar) measures the duration between the rehabilitation treatment and return to work (Dern and Rass 2002). It consists of ten gender-specific items. The AVEM (Arbeitsbezogenes Verhaltens- und Erlebensmuster) is a 66-item questionnaire with five response-levels each, and it assesses the return to work motivation (Schaarschmidt and Fischer 1997, 1998). The questionnaire was standardized and psychometrically tested in a sample of German schoolteachers (n=1589). The results addressing reliability, and convergent validity were substantial. The AVEM seems to be a highly accepted and economic instrument by which to assess the motivation to work. The SPE-scale is a short instrument (three items) assessing the subjective prognosis of the return to work (Mittag and Raspe 2003, Mittag et al. 2003a). Feasibility and psychometric properties were tested in a cohort of bluecollar workers (n=4279), and the results suggest that the SPE-scale can be recommended for use in rehabilitation research to assist the medical appraisal. All of these instruments can assist in the adjustment and modification of interventions and treatment programs addressing individual requirements. However, further research is needed that compares the psychometric properties of questionnaires screening for vocational problems.

62 340 J Public Health (2006) 14: Screening for comorbid mental disorders Comorbid mental disorders can affect the motivation and compliance of rehabilitation patients to participate in treatment programs. When comorbid mental disorders occur, patients are likely to require specific treatments. The identification and classification of comorbid mental disorders have major implications for rehabilitation. Therefore, valid screening instruments at the beginning of rehabilitation treatment are needed. In rehabilitation research studies, German adaptations of the General Health Questionnaire (GHQ-12, 12 items), the Hospital Anxiety and Depression Scale (HADS-D, 14 items) and a short version of the Patient Health Questionnaire (PHQ-D, Löwe et al. 2002) have been adopted for screening comorbid mental disorders in rehabilitation patients. The GHQ questionnaire was originally developed as a 60-item questionnaire (Goldberg and Blackwell 1970), and the shorter GHQ-12 was subsequently derived from longer versions. The GHQ-12 measures whether the respondent has experienced a particular symptom or behavior recently (Schmitz et al. 1999). The instrument has been thoroughly psychometrically tested and validated in several languages and compared to the longer versions of the GHQ (GHQ-30, GHQ-28 and GHQ-20). The results showed that the short version is a feasible instrument to screen for comorbid mental disorders. The HADS is a widely used screening instrument assessing psychological distress. Several studies have demonstrated that the HADS is a valid instrument which provides clinicians with information on relevant comorbid mental disorders (Mykletun et al. 2001). The questionnaire is based on 14 items that describe two subscales: anxiety (seven items) and depression (seven items). In a German sample of rehabilitation inpatients with cardiovascular (n=213) or musculo-skeletal (n=206) disorders, the GHQ- 12 and the HADS-D were compared with respect to discriminate validity (Wunsch et al. 2002). In both patient groups the HADS-D showed a better screening performance than the GHQ-12. However, the limitation in performance is the result of the different methodological approaches intrinsic to the instruments and the difficulties in screening for mental disorders in patients with physical disease. Thus, the authors recommend both questionnaires be used for the identification of comorbid mental disorders in samples of rehabilitation patients with cardiovascular or musculo-skeletal disorders. The decision as to which screening instrument should be applied depends on several considerations (e.g. study design, and diagnostic group). Accordingly, a set of different assessment instruments aimed at assessing rehabilitation could be useful. Comprehensive proposals for rehabilitation patients with cardiovascular disorders are given by Mittag et al. (2004), and those for patients with chronic low back pain are given by Schreiber et al. (2004). Discussion Monitoring the health status of patients has become a major activity in rehabilitation research in recent years. Intensive research and controversial discussions within the scientific community have resulted in a paradigm shift in monitoring and evaluating health. In addition to conventional clinical endpoints and medical appraisals, patient-reported outcomes have gained importance as an outcome criterion. During the past decades an increasing number of questionnaires have been developed in Germany, including, for example, the IRES, the FREM-17 and the SPE-scale. Additionally, widely used international instruments, such as the NHP or the SF-36, have been translated into the German language and adapted for use in Germany. These instruments have been thoroughly tested and validated in several studies. Current trends in statistical methods (e.g. responsiveness, Rasch scaling) as well as classical testtheoretical standards were considered. Thus, instruments assessing patient-reported outcomes in rehabilitation research achieve current psychometrical standards. The ability to provide patient-reported assessments applicable in rehabilitation research projects has been one of the major aims of rehabilitation research during recent years. However, current projects attempt to contribute to the transfer of existing scientific knowledge on assessment instruments into practical rehabilitation applications. To alleviate the implementation of the datasets into existing questionnaire sets, several assessment instruments are available as short versions. In summary, the contribution of questionnaires available in the field of rehabilitation research to other health care sectors exists at several levels: (1) to allocate various standardized instruments to routinely monitor subjective health, well-being and specific parameters of diseases; (2) to screen for and identify relevant impairments of physical and mental health; (3) to assess vocational impacts influencing health behavior; (4) to identify social and behavioral determinants of health which are relevant to patient participation in specific therapies or educational programs; (5) to screen for and observe comorbid disorders. However, there is still a need for further research to determine the best choice of instruments for a given purpose and the limitations of these tools in health care studies. In conclusion, this review article provides an overview on patient-reported instruments in rehabilitation research. The Institute for Quality in Prevention and Rehabilitation (IPQR) provides an online database with descriptions of several assessments measuring patient-reported outcome

63 J Public Health (2006) 14: (URL: An introduction to scoring methods for generic instruments in rehabilitation research is presented by Reusch (2002). Corresponding SPSS Syntax-files are provided on an enclosed CD-Rom. An extensive collection of SPSS Syntax-files that can be used to calculate scores of the instruments is available online (URL: de/methodenberatung/assessment.html). References Bergner M, Bobitt RA, Carter WB (1981) The Sickness Impact Profile: development and final revision of a health status measure. Med Care 19: Bönisch A, Ehlebrecht-König I (2003) Der BASDAI-D-ein Fragebogen zur Erfassung der Krankheitsaktivität bei Spondylitis ankylosans und verwandten Erkrankungen. Z Rheumatol 62: Brazier J, Roberts J, Deverill M (2002) The estimation of a preference-based measure of health from the SF-36. J Health Econ 21: Buchholz HT, Warschburger P, von Schwerin AD, Petermann F (2003) SEND: Eine Skala zur Erhebung der spezifischen Selbstwirksamkeit für Eltern neurodermitiskranker Kinder. ZMP 12:63 68 Bührlen B, Gerdes N, Jäckel WH (2005) Entwicklung und psychometrische Testung eines Patientenfragebogens für die medizinische Rehabilitation (IRES-3). Rehabilitation 44:63 74 Bullinger M, Kirchberger I (1998) SF-36 Fragebogen zum Gesundheitszustand (SF-36). Handbuch für die deutschsprachige Fragebogenversion. Hogrefe, Göttingen Bullinger M, Morfeld M, Kohlmann T, Nantke J, van den Bussche H, Dodt B, Dunkelberg S, Kirchberger I, Krüger-Bödecker A, Lachmann A, Lang K, Mathis C, Mittag O, Peters A, Raspe H, Schulz H (2003) Der SF-36 in der rehabilitationswissenschaftlichen Forschung-Ergebnisse aus dem Norddeutschen Verbund für Rehabilitationsforschung (NVRF) im Förderschwerpunkt Rehabilitationswissenschaften. Rehabilitation 42: Deck R (1999) Erwartungen und Motivationen in der medizinischen Rehabilitation. Ihre sozialmedizinische und gesundheitspolitische Bedeutung für den Rehabilitationserfolg. Jacobs, Lage Deck R, Zimmermann M, Kohlmann T, Raspe H (1998) Rehabilitationsbezogene Erwartungen und Motivationen bei Patienten mit unspezifischen Rückenschmerzen. Rehabilitation 37: Dern W, Rass G (2002) Geschlechts-und statusspezifische Prädiktoren beeinflussen den Weg zurück zur Arbeit. DRV-Schriften 33: Felder-Puig R, Frey E, Sonnleithner G, Feeny D, Gadner H, Barr RD, Furlong W, Topf R (2000) German cross-cultural adaptation of the Health Utilities Index and its application to a sample of childhood cancer survivors. Eur J Pediatr 159: Fiedler RG, Ranft A, Greitemann B, Heuft G (2005) Arbeitmotivation - Diagnostikinstrumente und ihre Relevanz in der Patientenversorgung. Zum Stand arbeitsbezogener Motivationsdiagnostik. Psychother Psych Med 55: Froberg DG, Kane RL (1989) Methodology for measuring health-state preferences I: measurement strategies. J Clin Epidemiol 42: Frosch D, Porzsolt F, Heicappell R, Kleinschmidt K, Schatz M, Weinknecht S, Kaplan RM (2001) Comparison of German language versions of the QWB-SA and SF-36 evaluating outcomes for patients with prostate disease. Qual Life Res 10: Garrett S, Jenkinson T, Kennedy GL, Whitelock H, Gaisford P, Calin A (1994) A new approach to defining disease status in ankylosing spondylitis: the bath ankylosing spondylitis disease activity index. J Rheum 21: Gerdes N, Jäckel WH (1995) Der IRES-Fragebogen für Klinik und Forschung. Rehabilitation 34:13 24 Glatzel M, Wollmerstedt N, Doesch M, Kirschner S, Matzer M, Faller H, König A (2004) Reliabilitäts-, Validitäts und änderungssensitivitätsprüfung des Funktionsfragebogen Bewegungsapparat (SMFA-D) bei operierten Patienten mit rheumatoider Arthritis. Aktuel Rheumatol 29:17 23 Goldberg DP, Blackwell B (1970) Psychiatric illness in general practice. A detailed study using a new method of case identification. Br Med J 1: Hafen K, Jastrebow J, Nübling R, Bengel J (2001) Entwicklung eines Patientenfragebogens zur Erfassung der Reha-Motivation (PAREMO). Rehabilitation 40:3 11 Herschbach P, Berg P, Dankert A, Duran G, Engst-Hastreiter U, Waadt S, Keller M, Ukat R, Henrich G (2005) Psychometric properties of the Fear of Progression Questionnaire. J Psychosom Res 58: Hessel F, Kohlmann T, Krauth C, Nowy R, Seitz R, Siebert U, Wasem J (1999) Gesundheitsökonomische Evaluation in der Rehabilitation. Teil 1: Prinzipien und Empfehlungen für die Leistungserfassung. In: Verband Deutscher Rentenversicherungsträger (ed) Förderschwerpunkt BRehabilitationswissenschaften. BEmpfehlungen der Arbeitsgruppen Generische Methoden, BRoutinedaten und BReha-ökonomie. DRV-Schriften 16: Hunt SM, McKenna SP, McEwen J, Williams J, Papp E (1981) The Nottingham Health Profile: Subjective health status and medical consultations. Social Sci Med 15: Kaplan RM, Bush JW, Berry CC (1976) Health status: types of validity and the index of well-being. Health Serv Res 11: Kaplan RM, Sieber WJ, Ganiats TG (1997) The Quality of Well-Being Scale: Comparison of the interviewer-administered version with a self-administered questionnaire. Psychol Health 12: Kirschner S, Walther M, Boehm D, Matzer M, Heesen T, Faller H, König A (2003) German short musculoskeletal function assessment questionnaire (SMFA-D): comparison with the SF-36 and WOMAC in a prospective evaluation in patients with primary osteoarthrits undergoing total knee arthroplasty. Rheumatol Int 23:15 20 König A, Kirschner S, Walther M, Böhm D, Faller H (2000) I. Kulturelle Adaptation, Praktikabilitäts- und Reliabilitätsprüfung des Funktionsfragebogen Bewegungsapparat (SMFA-D). Z Orthop 138: Krauth C, Rieger J, Mellert C, Schwartz FW (2003) Das Gesundheitsheitökonomische Querprojekt Q3: überblick über die Konzeption der reha-ökonomischen Evaluation. In: Petermann F (ed) Prädiktion, Verfahrensoptimierung und Kosten in der medizinischen Rehabilitation. Roderer, Regensburg, pp Kriz D, Nübling R, Herwig JE, Fuchs S, Bengel J (2006) Normierung des PAREMO-20-Patientenfragebogen zur Erfassung der Rehabilitationsmotivation. DRV-Schriften 64: Kühn A, Pannicke L, Mohs A, Schneider H (2001) Entwicklung eines Fragebogens zur Erfassung motivationaler Bedingungen zur Vorhersage der Therapiemitarbeit von LVA-Versicherten während stationärer medizinischer Rehabilitation - Erste Ergebnisse der Skalenentwicklung. Rehabilitation 40: Löwe B, Spitzer RL, Zipfel S, Herzog W (2002) PHQ-D. Gesundheitsfragebogen für Patienten. Pfizer, Karlsruhe Maurischat C, Krüger-Bödecker A (2004) Analysen zum Strukturmodell des SF-36/SF-12-eine übersicht. In: Maurischat C, Morfeld M, Kohlmann T, Bullinger M (ed) Lebensqualität. Nützlichkeit

64 342 J Public Health (2006) 14: und Psychometrie des Health Survey SF-36/SF-12 in der medizinischen Rehabilitation. Pabst, Lengerich, pp Mittag O, Raspe H (2003) Eine kurze Skala zur Messung der subjektiven Prognose der Erwerbstätigkeit: Ergebnisse einer Untersuchung an 4279 Mitgliedern der gesetzlichen Rentenversicherung zu Reliabilität (Guttman-Skalierung) und Validität der Skala. Rehabilitation 42: Mittag O, Glaser-Möller N, Ekkernkamp M, Matthis C, Hèon-Klein V, Raspe A, Raspe H (2003a) Prädiktive Validität einer kurzen Skala zur subjektiven Prognose der Erwerbstätigkeit (SPE-Skala) in einer Kohorte von LVA-Versicherten mit schweren Rückenschmerzen oder funktionellen Beschwerden der Inneren Medizin. Soz Praventivmed 48: Mittag O, Budde HG, Eisenriegler E, Engel S, Herrmann-Lingen C, Jokiel R, Langosch W, Lueger S, Mai B, Niehues U, Schoel M, Maurischat C (2004) Ein Fragebogenset zur Erfassung (Screening) psychischer Störungen und sozialer Probleme von Patienten in der kardiologischen Rehabilitation. Rehabilitation 43: Moock J, Kohlmann T, Besch D, Drüner K (2005) Nutzentheoretische Lebensqualitätsmessinstrumente in der medizinischen Rehabilitation: Ein anwendungsbezogener Vergleich. ZMP 14:25 32 Mühlig S, Teeling H, Petermann F (2000) FLAC-Der Fragebogen zur Lebensqualität bei Asthma und Chronisch-obstruktiver Bronchitis. In: Schumacher J, Klaiberg A, Brähler E (ed) Diagnostische Verfahren zu Lebensqualität und Wohlbefinden. Hogrefe, Göttingen pp Muthny FA, Fiedler R, Wiedebusch S (2005) Leistungsmotivation als Teilaspekt der Reha-Motivation und EinflussgröÞe auf den Reha- Erfolg-neue Skalen und empirische Ergebnisse. DRV-Schriften 59: Mykletun A, Stordal E, Dahl AA (2001) Hospital Anxiety and Depression (HAD) scale: factor structure, item analyses and internal consistency in a large population. Br J Psychiatr 179: Ravens-Sieberer U, Gosch A, Abel T, Auquier P, Bellach B-M, Bruil J, Dür W, Power M, Rajmil L, KIDSCREEN Group (2001) Quality of life in children and adolescents: A European public health perspective. Soz Praventivmed 46: Ravens-Sieberer U, Redegeld M, Bauer CP, Mayer H, Stachow R, Kiosz D, van Egmond-Fröhlich B, Rempis R, Kraft D, Bullinger M (2005) Lebensqualität chronisch kranker Kinder und Jugendlicher in der Rehabilitation. ZMP 14:5 12 Reusch A (2002) Skalenberechnung ausgewählter Instrumente. In: Reusch A, Zwingmann C, Faller H (ed) Empfehlungen zum Umgang mit Daten in der rehabilitationsforschung. Roderer, Regensburg pp Seitz R, Schweikert B, Jacobi E, Tschirdewahn B, Leidl R (2001) ökonomisches Rehabilitations-management bei chronischen Rückenschmerzen. Der Schmerz 15: Schaarschmidt U, Fischer AW (1997) AVEM - ein diagnostisches Instrument zur Differenzierung von Typen gesundheitsrelevanten Verhaltens und Erlebens gegenüber der Arbeit. Zeitschrift für Differentielle und Diagnostische Psychologie 18: Schaarschmidt U, Fischer A (1998) Diagnostik interindividueller Unterschiede in der psychischen Gesundheit von Lehrerinnen und Lehrern zum Zwecke einer differentiellen Gesundheitsförderung. In: Bamberg E, Ducki A, Metz AM (ed) Handbuch Betriebliche Gesundheitsförderung. Verlag für Angewandte Psychologie, Göttingen Schmitz N, Kruse J, Tress W (1999) Psychometric properties of the General Health Questionnaire (GHQ-12) in a German primary care. Acta Psychiatr Scand 100: Schreiber B, Bandemer-Greulich U, Uhlemann K, Müller K, Müller- Pfeil J, Kreutzfeldt A, Fikentscher E, Bahrke U (2004) Behandlungsspezifik beim chronischen Rückenschmerz: Ist die optimierte Rehabilitationszuweisung ausreichend? Rehabilitation 43: Schulenburg J-M, Graf von der, Claes C, Greiner W, Uber A (1998) Die deutsche Version des EuroQol-Fragebogens. Z Gesundheitswissenschaft 6:3 20 Schwarzer R (1992) Self-efficacy in the adoption and maintenance of health behaviors: Theoretical approaches and a new model. In: Schwarzer (ed) Self-efficacy: Thought control of action. Hemiphere, Washington D.C., pp Sieber WJ, Groessl EJ, David KD, Ganiats TG, Kaplan RM (2004) Quality of Well-Being Self-Administered (QWB-SA) Scale. User_s Manual. Online Available: hoap/qwb_sa.pdf Sintonen H (1994) The 15D-Measure of health-related quality of life. II Feasibility, reliability and validity of valuation system. National Health and Medical Research Council (National Centre for Health Program Evaluation) Working Paper 42, Melbourne, Australia Swiontkowski MF, Engelberg R, Martin DP, Agel J (1999) Short Musculoskeletal Function Assessment Questionnaire: Reliability, validity and responsiveness. J Bone Joint Surg 81: Torrance GW, Feeny DH, Furlong WJ, Barr RD, Zhang Y, Wang Q (1996) Multiattribute utility function for a comprehensive health status classification system Health Utilities Index Mark 2. Medical Care 34: Ware JE, Sherbourne CD (1992) The MOS 36-item Short-Form Health Survey (SF-36): I. Conceptual framework and item selection. Medical Care 30: Weiner B (1992) Expectancy-value theories. In: Weiner B (ed) Human motivation. Metaphors, theories, and research. Sage, Newsbury Park, pp Wirtz M, Farin E, Bengel J, Jäckel WH, Hämmerer D, Gerdes N (2005) IRES-24 Patientenfragebogen Entwicklung der Kurzform eines Assessmentinstrumentes in der Rehabilitation mittels Mixed-Rasch-Analyse. Diagnostica 51:75 87 Wollmerstedt N, Kirschner S, Böhm D, Faller H, König A (2003) Entwicklung und Evaluierung der Kurzversion des Funktionsfragebogens Bewegungsapparat XSMFA-D. Z Orthop 141: Wollmerstedt N, Kirschner S, Wolz Th, EllÞel J, Beyer W, Faller H, König A (2004) Validitäts- und änderungssensitivitätsprüfung des Funktionsfragebogens Bewegungsapparat (SMFA-D) in der stationären Rehabilitation von Patienten mit konservativ behandelter Coxarthrose. Rehabilitation 43: Wunsch A, Rundel M, Härter M, Bengel J (2002) Screening psychischer Störungen in der kardiologischen und orthopädischen Rehabilitation. Rehabilitation 41: Zwerenz R, Knickenberg RJ, Schattenburg L, Beutel ME (2005) Motivation zur psychosomatisch-psychotherapeutischen Bearbeitung von beruflichen Belastungen-Entwicklung und Validierung eines Fragebogens. Rehabilitation 44:14 23 Zwingmann C, Buschmann-Steinhage R, Gerwinn H, Klosterhuis H (2004) Förderschwerpunkt Rehabilitationswissenschaften : Ergebnisse - Umsetzung - Erfolge und Perspektiven. Rehabilitation 43:

65 6.3 Moock J, Kohlmann T. Comparing preference-based quality of life measures: Results from rehabilitation inpatients with musculoskeletal, cardiovascular or psychosomatic disorders. Qual Life Res 2008; 17(3): online first: DOI /s

66 Qual Life Res DOI /s Comparing preference-based quality-of-life measures: results from rehabilitation patients with musculoskeletal, cardiovascular, or psychosomatic disorders Joern Moock Æ Thomas Kohlmann Accepted: 6 February 2008 Ó Springer Science+Business Media B.V Abstract Objectives To compare the EQ-5D, 15D, HUI 2, HUI 3, SF-6D, and QWB-SA in terms of their descriptive statistics, score distribution, agreement and responsiveness in a sample of German rehabilitation inpatients. Methods Patients with musculoskeletal (N = 106), cardiovascular (N = 88), and psychosomatic (N = 70) disorders completed questionnaires at the beginning (baseline) and end (follow-up) of their inpatient treatment. Comparisons addressed the proportion of missing data, distributional properties, agreement, and responsiveness. Intraclass correlation coefficients (ICC), paired t-tests, and standardized response means (SRM) were computed. Results Mean index scores at baseline ranged from 0.48 (HUI 3; psychosomatic) to 0.86 (15D; cardiovascular). At baseline, ceiling effects across all patient groups ranged from zero (SF-6D; cardiovascular and psychosomatic) to 21.6% (EQ-5D; cardiovascular). ICCs ranged from 0.26 (EQ-5D QWB-SA; cardiovascular) to 0.80 (HUI 2 HUI 3; musculoskeletal). Substantial differences in responsiveness were observed between measures. Conclusions Results obtained with different preferencebased quality-of-life measures in a sample of patients with mild to moderate disease severity are not equivalent. As differences between measures may have considerable effects in health economic evaluation studies, careful selection of instruments for a given study is essential. Keywords Preference-based HRQoL Head-to-head comparison EQ-5D HUI 2 HUI 3 SF-6D 15D QWB-SA J. Moock (&) T. Kohlmann University of Greifswald, Institute for Community Medicine, Walther-Rathenau-Straße 48, Greifswald 17475, Germany joern.moock@uni-greifswald.de Introduction Generic multi-attribute utility instruments are used to describe and measure health-related quality of life (HRQoL). Respondents values are aggregated to form a single utility score ranging from unity (full health) through zero (death) to negative utility values which indicate health states worse than death. These instruments are pertinent within clinical research and indispensable in calculating quality-adjusted life years (QALYs). QALYs are widely employed in cost-utility-analysis to contrast the incremental costs with the incremental benefits of any kind of medical treatment or clinical intervention [1, 2]. The six preference-based measures included in this study have been tested and validated in a number of clinical studies. Extensive information about these instruments and an overview of published head-to-head comparisons of preference-based measurements are provided in published reviews [3 5]. Brazier et al. [5] specifically noted that despite apparent superficial similarities, the instruments differ in important aspects of content and format: their descriptive systems do not cover the same dimensions of physical health, emotional well-being, and social function. The questionnaires differ in length, the number of response categories used, and, consequently, the number of health states they describe. In addition, different methods were used to elicit preferences (in some cases even for the same instrument) and different statistical models were applied to generate the utility scores [6 8]. This paper comprises a methodological comparison of the EQ-5D, the 15D, the HUI 2, the HUI 3, the SF-6D, and the QWB-SA in a sample of rehabilitation inpatients with musculoskeletal, cardiovascular, or psychosomatic disorders. The aim of the study is to gain insights into the relationships and differences between the tools and to explore their potential interchangeability. 123

67 Qual Life Res Study design and methods Subjects The study design was longitudinal. Multi-attribute utility instruments were administered at the beginning (baseline) and end of inpatient treatment (follow-up), between March 2004 and January Successive patients visiting rehabilitation clinics in Pomerania, Germany, were invited to participate provided they satisfied the inclusion criteria. The psychosomatic sample included patients treated for depression, anxiety, and other mental disorders. Patients with eating disorders (e.g. bulimia, anorexia) were excluded. We aimed to include all patients C18 years of age, who were able to comprehend a German-language questionnaire and were commencing rehabilitative treatment. Patients were considered non-eligible if linguistic and cognitive abilities proved inadequate for responding to questionnaires without assistance, as judged by their physician. After providing informed consent and agreeing to participate, the patients were given a self-administered questionnaire and a return envelope by the researcher. Toward the end of their clinical stay, patients received the same questionnaire for a second time. In order to avoid bias toward some responses, the order of the measures within the questionnaire was systematically rotated. The study protocol was reviewed and approved by the University of Greifswald Ethics Commission. Preference-based measures For the purpose of this study, a questionnaire was compiled on the basis of a battery of preference-based measures. EQ-5D The EQ-5D consists of five dimensions (mobility, selfcare, usual activities, pain/discomfort, and anxiety/ depression), each of which comprises three levels [9]. The descriptive system of the EQ-5D allows for 243 unique health states. A preference-based scoring function is used to convert the descriptive information to a summary index score. More than 15 value sets are available for scoring the EQ-5D, based on rating scale and time trade-off (TTO) valuation [10]. We used the TTO value set derived from a survey of the general population of the UK [11]. When this value set is used, EQ-5D utility scores range from to 1.00, with values below zero indicating health conditions worse than death and 1.00 representing perfect health. The standard version of the EQ-5D administered comprised the five-domain health self-classification system and a visual analogue scale. 15D The 15D was developed in Finland. The 15 dimensions mobility, vision, hearing, breathing, sleep, eating, speech, bladder/bowel function, usual activities, mental function, discomfort/pain, depression, distress, vitality, and sexual activity [12 14] each consist of five levels. The 15D health classification system defines billions of unique health states. The scoring function was derived from a representative Finnish sample based on a cross between a visual analogue scale and magnitude estimation [15]. The 15D is a preference-based measure with scores ranging from 0.11 to 1.00, with 1.00 representing perfect health. A standard version of the 15D was administered and utility scores were computed as recommended by the developer [14]. HUI 2 and HUI 3 The HUI 2 consists of seven health attributes sensation (vision, hearing, and speech), mobility, emotion, cognition, self-care, pain, and fertility. Fertility, the seventh attribute in the classification system, was not included in the study. With three to five levels within each attribute, the HUI 2 health state classification system describes a total of 24,000 unique health states [16, 17]. The scoring function used to determine HUI 2 preference values was based on a visual analogue scale and standard gamble [18]. HUI 2 utility scores range from to 1.00, with the lowest possible score indicating the worst HUI 2 health state, 0.00 dead, and 1.00 perfect health. The HUI 3 consists of eight health attributes (vision, hearing, speech, ambulation, dexterity, emotion, cognition, self-care, and pain), each comprising five or six levels. A total of 972,000 unique health states are defined [19]. The scoring function for HUI 3 utility scores was obtained from a visual analogue scale and standard gamble. Utility scores range from to The score represents the worst possible HUI 3 health state, 0.00 dead, and 1.00 perfect health. Standard one-week recall versions of the HUI 2 and HUI 3 questionnaires (15 items) were administered for selfcompletion. Overall utility scores were scored as recommended by the developers [16, 19]. SF-6D The SF-6D was developed to extract utility scores from the SF-36 health survey. SF-36 survey responses can be assigned to the SF-6D provided that the 11 items contributing to the six two-to-six-level SF-6D dimensions (physical functioning, role limitations, social functioning, pain, mental health, and vitality) are complete. The scoring 123

68 Qual Life Res function for SF-6D weights is based on a representative sample of the UK population using standard gamble [20]. Utility scores range between 0.29 and 1.00, with 0.29 representing the worst possible SF-6D health state and 1.00 indicating perfect health. SF-6D utility scores were derived from the acute version (one-week recall) of the SF-36 Health Survey (version 2). Utility scores were computed using the scoring function provided by the developers of the SF-6D [20]. An SPSS syntax to derive SF-6D utility scores was kindly provided by John Brazier (personal communication). QWB-SA The QWB-SA is based on the interview version of the QWB, the oldest preference-based instrument for estimation of QALYs [21]. The QWB-SA is a comprehensive measure including several HRQoL components. The questionnaire covers three areas. In the first section the presence or absence of 19 chronic symptoms or problems (e.g. blindness, hearing problems) is assessed. This section is followed by 25 acute physical symptoms (e.g. headache, coughing), and 14 mental symptoms and behaviours (e.g. sadness, anxiety). The remaining section contains three separate scales of self-reported levels of functioning (mobility, physical activity, and social activity). With the exception of the list of chronic symptoms or problems in the first section, respondents identify symptoms, problems, or behaviours that have affected them over the past three days. The scoring function of the QWB-SA was derived from a US community sample in San Diego using the rating scale method [22]. Utility scores range from 0.00 (death) to 1.00 (perfect health). A standard version of the QWB-SA was administered for self-completion. Utility scores were scored as recommended by the developers [22]. Demographic data and a marker of overall health change Patient demographic characteristics, including age, gender, marital status, educational level, and employment status, were collected at baseline. In addition, after the end of treatment a five-point rating scale of overall health change was used to assess patients subjective evaluation of change. The wording of the change item was: Compared to treatment entry, how would you currently rate your health in general?. Patient responses were classified into one of three health change categories as improved ( much better or better ), stable ( about the same ), or deteriorated ( worse or much worse ). Statistical analysis Data were analyzed separately for the three patient groups (musculoskeletal, cardiovascular, psychosomatic). Descriptive statistics included proportions for demographic properties (baseline), and means, standard deviations, and medians for preference-based measures (baseline, follow-up). Comparisons between measures addressed the proportion of missing values, distributional properties, agreement, and responsiveness. Ceiling and floor effects are reported in terms of sample proportions with the highest and lowest possible scores. For analysis of agreement, adjusted intraclass correlation coefficients (ICC) were calculated at baseline and follow-up [23, 24]. An ICC \ 0.40 indicates poor agreement, 0.40 B ICC \ 0.75 indicates fair to good agreement, and ICC C 0.75 indicates excellent agreement [25]. Responsiveness was examined using paired t-statistics and standardized response means (SRM, change score divided by standard deviation of the change score). Analysis was performed using SPSS statistical software version 14.0 (SPSS, Chicago, IL, USA). Results Of a total 378 patients approached, 329 (87.0%) agreed to participate in the study at the beginning (baseline) of their three week inpatient rehabilitative treatment in the case of musculoskeletal and cardiovascular disorders and six week inpatient rehabilitative treatment in the case of psychosomatic disorders. At baseline, all participants provided complete data enabling the calculation of utilities for the six preference-based instruments. At the end of the respective treatment (follow-up), 292 patients (71.1%) responded to the questionnaire for a second time. Sufficient baseline and follow-up data for calculation of all indices were available for a total of 264 (69.8%) patients. Non-response at follow-up was higher in the cardiovascular group (17.5%) than in the psychosomatic group (10.7%) and the musculoskeletal group (5.6%) (Pearsons s chi-square test (df = 2): 8.72, p = 0.013). However, nonresponders did not differ from responders with respect to gender, marital status, age, and employment status. Overall, missing data rates of indices at follow-up were 1.3% (EQ-5D, 15D), 1.9% (HUI 2, HUI 3), 6.1% (SF-6D). Missing data rates of QWB-SA index scores were not observed. Demographic characteristics of participants at baseline are provided in Table 1. Patients with musculoskeletal or psychosomatic disorders were predominantly female. Differences were observed between groups regarding gender, age, school education, and employment status. 123

69 Qual Life Res Table 1 Demographic characteristics of patients at baseline a One-way ANOVA b Pearson chi-squared tests for gender, marital status, educational level, employment status Musculoskeletal Cardiovascular Psychosomatic p N Age (mean; s; min max) 47; 11.4; ; 11.0; ; 7.7; \0.001 a Gender (% female) \0.001 b Marital status (%) Married Divorced Single Widowed Educational level (%) Primary (8 years) Secondary (10 years) Tertiary (13 years) Other graduation \0.001 Employment status (%) Employed Unemployed Retired \0.001 Mean utility scores at baseline and follow-up were highest for the 15D and lowest for the QWB-SA in patients with musculoskeletal, cardiovascular, and psychosomatic disorders, with the exception of lowest means for patients with psychosomatic disorders at baseline, which were observed for the HUI 3 (Table 2). All instruments generated the lowest means for psychosomatic disorders. Score ranges differed between instruments at both baseline and follow-up. A wide range was observed across all three groups for the EQ-5D and the HUI 3, with the largest range being found at baseline for the psychosomatic group (-0.25 to 1.00; HUI 3). 15D scores were concentrated in the upper half of the theoretical scale span, ranging at baseline from 0.60 to 1.00 (musculoskeletal), 0.56 to 1.00 (cardiovascular), and 0.52 to 0.94 (psychosomatic). HUI 2 scores ranged from 0.17 to 0.97 (musculoskeletal), 0.23 to 1.00 (cardiovascular), and 0.09 to 0.93 (psychosomatic). SF-6D scores ranged from 0.38 to 1.00 (musculoskeletal), 0.37 to 0.94 (cardiovascular), and 0.31 to 0.83 (psychosomatic). QWB-SA indices ranged from 0.26 to 0.83 (musculoskeletal), 0.24 to 1.00 (cardiovascular), and 0.23 to 0.74 (psychosomatic). No patient achieved the lowest possible score (floor effect) at baseline and follow-up on any instrument. At baseline, 5.7% of patients with musculoskeletal disorders obtained the maximum EQ-5D score (ceiling effect), while two patients (1.9%) with musculoskeletal disorders achieved the maximum possible score on the 15D and one patient (0.9%) on the SF-6D. Within the cardiovascular group, 21.6% scored the maximum value on the EQ-5D, while 5.7% had the maximum possible score on the 15D, 3.4% on the HUI 2, 2.3% on the HUI 3 and 1.8% on the QWB-SA. Ceiling effects within the psychosomatic group were observed for the EQ-5D (4.2%) and the HUI 3 (1.4%). Score-level distribution properties at baseline are depicted in Fig. 1. Diagrams indicate varying frequency distributions for the six instruments. 15D, SF-6D, and QWB-SA scores were approximately normally distributed, HUI 3 scores were normally distributed for patients with cardiovascular or psychosomatic disorders, and HUI 2 scores were normally distributed for patients with psychosomatic disorders. EQ-5D scores were skewed across all observed condition groups. Distributions at follow-up were similar to those at baseline. Across all condition groups, the EQ-5D detected nine patients with health states worse than death (0). For these cases, mean utility scores were 0.67 (15D), 0.44 (HUI 2), 0.23 (HUI 3), 0.43 (SF-6D), and 0.44 (QWB-SA). Twelve patients obtained HUI 3 scores lower than death (0). For these patients, mean scores on the other measures were 0.23 (EQ-5D), 0.62 (15D), 0.39 (HUI 2), 0.48 (SF-6D), and 0.38 (QWB-SA). Box-plots are provided for respondents with perfect health scores on the EQ-5D (n = 28) across all condition groups, in order to examine corresponding utility scores on the other five instruments (Fig. 2). When EQ-5D scores indicated perfect health, utility scores for 15D, HUI 2, and HUI 3 were spread moderately within the upper quintile (0.8 to 1.0) and SF-6D and QWB-SA scores were widely spread. For these patients, mean HUI 3, SF-6D, and QWB- SA scores differed significantly from EQ-5D scores (p \ 0.05). At baseline, paired comparisons of agreement between instruments were poor to excellent (Table 3). Nine out of 123

70 Qual Life Res Table 2 Descriptive statistics of utility scores at baseline and follow-up Mean (SD) Range Median Ceiling (in %) Musculoskeletal (n = 106) Baseline EQ-5D 0.63 (0.25) D 0.84 (0.10) HUI (0.18) HUI (0.25) SF-6D 0.62 (0.11) QWB-SA 0.52 (0.12) Follow-up EQ-5D 0.67 (0.26) D 0.87 (0.10) HUI (0.15) HUI (0.23) SF-6D 0.67 (0.13) QWB-SA 0.54 (0.13) Cardiovascular (n = 88) Baseline EQ-5D 0.73 (0.24) D 0.86 (0.08) HUI (0.14) HUI (0.21) SF-6D 0.64 (0.13) QWB-SA 0.55 (0.14) Follow-up EQ-5D 0.76 (0.22) D 0.88 (0.09) HUI (0.13) HUI (0.18) SF-6D 0.70 (0.13) QWB-SA 0.56 (0.14) Psychosomatic (n = 70) Baseline EQ-5D 0.57 (0.28) D 0.76 (0.11) HUI (0.20) HUI (0.36) SF-6D 0.54 (0.10) QWB-SA 0.49 (0.12) Follow-up EQ-5D 0.57 (0.30) D 0.79 (0.13) HUI (0.22) HUI (0.35) SF-6D 0.62 (0.14) QWB-SA 0.48 (0.16) ICCs indicated poor agreement between instruments. Excellent agreement was observed between HUI versions with ICCs of 0.80 (musculoskeletal) and 0.77 (cardiovascular), and good agreement between 15D and SF-6D with correlation values of 0.68 (musculoskeletal) and 0.65 (psychosomatic). Associations between EQ-5D 123

71 Qual Life Res Fig. 1 Distribution of utility scores at baseline according to condition group and 15D were poor (0.37 musculoskeletal, 0.39 cardiovascular) to fair (0.41 psychosomatic). ICCs at follow-up were similar to baseline results. At the end of rehabilitation treatment, 60.6% of musculoskeletal, 76.7% of cardiovascular, and 47.1% of psychosomatic patients reported their health to be improved; 33.6% of musculoskeletal, 21.0% of cardiovascular, and 37.2% of psychosomatic patients reported their health to be stable; and 5.8% of musculoskeletal, 2.3% of cardiovascular, and 15.7% of psychosomatic patients reported their health to have deteriorated, compared with treatment entry. For each of the three groups defined by the perceived change item, estimates of the absolute utility change for the five utility scores, t-test values associated with the change, and SRMs are given in Table 4. For patients reporting improvements in overall health, 15D and SF-6D showed higher indices of responsiveness than EQ- 5D, HUI 2, HUI 3, and QWB-SA. For patients with musculoskeletal disorders, the magnitude of change indicated by the QWB-SA (0.03) is smaller than the change indicated by the 15D (0.05), EQ-5D (0.07), SF-6D (0.08), HUI 2 (0.09), and HUI 3 (0.10). For cardiovascular disorders, the QWB-SA (0.02) indicates a smaller change score than the 15D (0.03), HUI 2 (0.03), EQ-5D (0.05), HUI 2 (0.07), and SF-6D (0.07). For patients with psychosomatic disorders, the magnitude of change indicated by the EQ-5D (0.03) is smaller than the change indicated by the QWB-SA (0.04), HUI 2 (0.06), 15D (0.07), HUI 3 (0.11), and SF-6D (0.14). For patients reporting unchanged overall health status, there was no clear pattern of change across condition groups. For patients with musculoskeletal disorders, SRMs were smallest for the EQ-5D, larger for the HUI versions and the QWB-SA, and larger still for the 15D and SF-6D. Within the cardiovascular group, small SRMs were observed for the EQ-5D, the 15D, and the QWB-SA, somewhat larger for the HUI 2, and larger still for the HUI 3 and SF-6D, while SRMs for patients with psychosomatic disorders were smallest for the 15D and HUI 2 and larger 123

72 Qual Life Res Fig. 1 continued for the EQ-5D, HUI 3, SF-6D, and QWB-SA. Interestingly, in some instances SRMs identified improvement in the stable group that was even larger than the improvement in the group with perceived positive change. Few patients reported deterioration during the rehabilitation treatment period, in particular in the musculoskeletal and cardiovascular groups. In the musculoskeletal group, the changes assessed by the measures were not in the expected direction, although observed SRMs were small. In the cardiovascular group, mean differences were in the expected direction, with the exception of the 15D, while in the psychosomatic group, EQ-5D and SF-6D utility scores increased between baseline and follow-up. There was no clear SRM pattern in patients reporting deterioration of overall health during the treatment period. Discussion Fig. 2 Box-plots of the five measures for patients (n = 28) with maximum scores (1.00) on the EQ-5D at baseline. Circles indicate outliers; asterisks indicate mean difference is significant at the 0.05 level (one-way ANOVA) This study compared six preference-based measures and the implications of their use in evaluative studies of rehabilitation inpatients with musculoskeletal, cardiovascular, 123

73 Qual Life Res Table 3 Intraclass correlation coefficients (ICC) between utility scores at baseline 15D HUI 2 HUI 3 SF-6D QWB-SA Musculoskeletal EQ-5D 0.37*** 0.55*** 0.54*** 0.40*** 0.26** 15D 0.55*** 0.46*** 0.68*** 0.48*** HUI *** 0.54*** 0.39*** HUI *** 0.36*** SF-6D 0.42*** Cardiovascular EQ-5D 0.39*** 0.50*** 0.61*** 0.46*** 0.44*** 15D 0.52*** 0.44*** 0.51*** 0.53*** HUI *** 0.44*** 0.47*** HUI *** 0.47*** SF-6D 0.43*** Psychosomatic EQ-5D 0.41*** 0.63*** 0.55*** 0.29* 0.30* 15D 0.60*** 0.41*** 0.65*** 0.61*** HUI *** 0.54*** 0.42*** HUI ** 0.29* SF-6D 0.46*** *p \ 0.05; **p \ 0.01; ***p \ or psychosomatic disorders. Descriptive statistics and the comparison of their score distributions (including ceiling effects) revealed substantial differences between measures: the EQ-5D, HUI 2, and HUI 3 utility scores were dispersed across the theoretical scale span, whereas 15D and SF-6D scores were mainly located in the upper half of the theoretical scale from 0 to The minimum utility scores for the 15D and SF-6D differed from those generated by the EQ-5D, HUI 2, HUI 3, and QWB-SA. More patients obtained ceiling scores on the EQ-5D than on the other five measures. Intraclass correlations between measures were in the range from 0.29 to 0.80 and in most cases indicated fair to good agreement. In patients whose condition improved during the treatment period, paired t-test values and standardized response means showed higher responsiveness for the 15D and SF-6D than for the other measures. HUI 2 and HUI 3 achieved responsiveness statistics similar to those for the 15D and SF-6D only in the musculoskeletal group. In all three patient groups, the responsiveness of the EQ-5D and QWB-SA was smaller than the responsiveness of the 15D and SF-6D. Our results confirm previously reported characteristics of the instruments under comparison [26 31]. In their extensive review of comparative studies of generic Table 4 Mean change in utilities versus self-reported change in overall health Improved Stable Deteriorated N Absolute utility change t-statistic SRM N Absolute utility change t-statistic SRM N Absolute utility change t-statistic SRM Musculoskeletal EQ-5D D HUI HUI SF-6D QWB-SA Cardiovascular EQ-5D D HUI HUI SF-6D QWB-SA Psychosomatic EQ-5D D HUI HUI SF-6D QWB-SA

74 Qual Life Res preference-based measures, Brazier et al. [5] noted that in some instances similarities of simple descriptive statistics (mean scores, for example) mask major differences in score distributions, especially in the lower range of utility scores. Score distributions comparable with those observed in our study have been reported for the EQ-5D and SF-6D in a sample of liver-transplant patients [28], for the HUI 2, HUI 3, and SF-6D in a sample of total hip arthroplasty patients [30], and for the EQ-5D, 15D, and SF-6D in patients with HIV/AIDS [26]. Differences in the bounds of the scales might have caused some of the variation among instruments; the EQ-5D and HUI 3, for example, allow for values worse than death, while the 15D and SF-6D are characterized by a much narrower range. In line with the results of a study conducted by Feeny et al. [30], lower standard deviations were detected for SF-6D scores in comparison with the EQ-5D, HUI 2, and HUI 3. Agreement between index scores derived from the EQ- 5D, 15D, HUI 2, HUI 3, SF-6D, and QWB-SA questionnaires was comparable with corresponding results reported in other studies. Brazier and colleagues [32] reported fair agreement (ICC 0.51) between EQ-5D and SF-6D scores in a comprehensive sample of patients across seven health conditions; Feeny and colleagues [33] observed fair agreement (ICC 0.47) between HUI 2 and SF-6D, poor agreement (ICC 0.28) between HUI 3 and SF-6D, and good agreement (ICC 0.63) between HUI versions. Most of our results on responsiveness replicated published findings. In their direct comparison of the SF-6D and the EQ-5D in a sample of liver-transplant patients, Longworth and Bryan [28] found the SF-6D better able to detect improvement in patients in the upper range of the utility scale. Other patient groups in which lower responsiveness of the EQ-5D compared with the 15D, SF-6D, HUI 2 or HUI 3 was demonstrated include chronic obstructive pulmonary disease (COPD) [34], HIV/AIDS [26] and rheumatoid arthritis [35]. As in our musculoskeletal group, responsiveness statistics for the SF-6D, HUI 2 and/or HUI 3 were of the same order of magnitude in studies of patients undergoing total hip arthroplasty [30] or percutaneous coronary intervention (PTCA) [36]. Furthermore, responsiveness statistics of the SF-6D and HUI 3 were similar in the study of Pickard et al. [31] comparing responsiveness of the EQ-5D, SF-6D, HUI 2, and HUI 3 in a sample of stroke patients. Interestingly, responsiveness of the EQ-5D was close to or even exceeded the responsiveness of the SF-6D and the HUI 3 in this particular sample. Another result in favour of the EQ-5D was reported by Conner-Spady and Suarez-Almazor [27] who found a significantly greater mean improvement of the EQ-5D than of the HUI 3 and SF-6D in a sample of patients with musculoskeletal disorders. Hence, even though the majority of published findings (including our own results) suggest increased responsiveness of preference-based measures comprising a higher number of possible health states, less complex measures like the EQ-5D may perform well in specific patient groups. Some limitations of our study warrant discussion. Our sample consisted of three groups of rehabilitation patients, each with relatively mild conditions at baseline and moderate improvements during the observation period. Generalization of our results to patient groups in other treatment settings may be difficult, because score distributions, ceiling effects, and the responsiveness of measures can be expected to be substantially different in samples with more severe conditions and more pronounced improvement over time. Given the characteristics of our sample, it was not surprising that measures based on a finer descriptive system (i.e. 15D, HUI 2, HUI 3, SF-6D) were more likely to identify small changes than the EQ-5D with its only five dimensions and three response levels. To calculate utility scores we used weights derived from UK (EQ-5D, SF-6D), Finnish (15D), Canadian (HUI 2, HUI 3), or US (QWB-SA) populations. It remains to be seen whether scoring functions developed in one country are valid in other countries. In our analyses of responsiveness we used a five-point rating scale of overall health change during the treatment period as a proxy for health change. Other studies have relied on a similar anchor-based approach [26, 27]. Yet, the patients rating of perceived change may be an imperfect indicator of the change that took place between the pre-test and the post-test. Some contra-intuitive findings, like the improvement in terms of SRMs seen for some measures in the stable group (cf. Table 4), may be partially caused by the use of this fallible criterion. Other indicators of health status and change, such as physician ratings, may have yielded different and perhaps more consistent results. Information about the clinical status and the specific diagnosis of patients was limited. Consequently, we were unable to distinguish between groups of patients defined by disease subtypes or disease severity. Against the background of these potential limitations, the results presented in this study provide extensive information on widely used instruments and their appropriateness in patient groups characterized by relatively mildly impaired health. They add to the growing body of knowledge about the methodological properties of preference-based quality-of-life measures. With the EQ-5D, 15D, HUI 2, HUI 3, SF-6D, and QWB-SA we included in our head-to-head comparison all generic utility measures for which a validated German translation is currently available. While all these instruments purport to measure the same quantity on a cardinal scale, the manifest differences in observed distributions and responsiveness show that they are not fully equivalent. When a preference-based instrument is selected for use in a planned study, the specific 123

75 Qual Life Res measurement properties of the different instruments should be carefully considered. This also applies to comparisons of results from studies involving different preference-based measures. Hence, our results may be of relevance for researchers seeking an instrument for use in their studies as well as for researchers doing a comparative analysis and synthesis of results obtained with different preferencebased instruments. Acknowledgements Our thanks go to HUI Inc. and John Horsman for permitting this project and to John Brazier for providing the SF- 6D weights and Harri Sintonen for providing the 15D weights. We would also like to thank our cooperation partners Dr Klaus Drüner and Dr Detlev Besch and their colleagues at the rehabilitation clinic Göhren/Germany, and Dr Martin Grunze and Dr Helmhold Seidlein of the rehabilitation clinic Trassenheide/Germany. Further thanks go to Kathrin Bezold for her assistance with data collection. We gratefully acknowledge the constructive comments and suggestions received from John Brazier and the anonymous referees. This project was funded by a grant (no. 01GD0106) from the German Federal Ministry of Education and Research within the North German Network for Rehabilitation Research (NVRF). References 1. Drummond, M. F., O Brien, B., Stoddart, G. L., & Torrance, G. W. (1997). Methods for economic evaluation of health care programmes (2nd ed.). Oxford, UK: Oxford University Press. 2. Gold, M. R., Siegel, J. E., Russell, L. B., & Weinstein, M. C. (1996). Cost-effectiveness in health and medicine. Oxford, UK: Oxford University Press. 3. Coons, S. J., Rao, S., Keininger, D. L., & Hays, R. D. (2000). A comparative review of generic quality-of-life instruments. Pharmacoeconomics, 17(1), Kopec, J. A., & Willison, K. D. (2003). A comparative review of four preference-weighted measures of health-related quality of life. Journal of Clinical Epidemiology, 56(4), Brazier, J., Ratcliffe, J., Tsuchiya, A., & Salomon, J. (2007). Measuring and valuing health benefits for economic evaluation (1st ed.). Oxford, UK: Oxford University Press. 6. Green, C., Brazier, J., & Deverill, M. (2000). Valuing healthrelated quality of life. A review of health state valuation techniques. Pharmacoeconomics, 17(2), Torrance, G. W., Thomas, W. H., & Sackett, D. L. (1972). A utility maximization model for evaluation of health care programs. Health Services Research, 7(2), Froberg, D. G., & Kane, R. L. (1989). Methodology for measuring health-state preferences I: Measurement strategies. Journal of Clinical Epidemiology, 42, The EuroQol Group (1990). EuroQol a new facility for the measurement of health-related quality of life. The EuroQol Group. Health Policy, 16(3), Szende, A., Oppe, M., & Devlin, N. (2007). EQ-5d value sets: Inventory, comparative review and user guide. Kluwer Academic Publishers. 11. Dolan, P. (1997). Modeling valuations for EuroQol health states. Medical Care, 35(11), Sintonen, H. (1994). The 15D-measure of health-related quality of life. I. Reliability, validity and sensitivity of its health state descriptive system. Working paper 41. Melbourne: National Centre for Health Program Evaluation. 13. Sintonen, H. (1995). The 15D measure of health related quality of life: Feasibility, reliability and validity of its valuation system. Working paper 42. Melbourne: National Centre for Health Program Evaluation. 14. Sintonen, H. (2001). The 15D instrument of health-related quality of life: properties and applications. Annals of Medicines, 33(5), Brazier, J., Deverill, M., Green, C., Harper, R., & Booth, A. (1999). A review of the use of health status measures in economic evaluation. Health Technology Assessment, 3, Feeny, D. H., Torrance, G., & Furlong, W. J. (1996). Chapter 26: Health Utilities Index. In B. Spilker (Ed.), Quality of life and pharmacoeconomics in clinical trials (2nd ed., pp ). Philadelphia: Lippincott-Raven Publishers. 17. Horsman, J., Furlong, W., Feeny, D., & Torrance, G. (2003). The Health Utilities Index (HUIÒ): Concepts, measurement, properties and applications. Health and Quality of Life Outcomes, 1(54). 18. Torrance, G. W., Feeny, D. H., Furlong, W. J., Barr, R. D., Zhang, Y., & Wang, Q. (1996). Multi-attribute preference functions for a comprehensive health status classification system: Health Utilities Index Mark 2. Medical Care, 34(7), Feeny, D., Furlong, W., Torrance, G. W., Goldsmith, C. H., Zhu, Z., DePauw, S., Denton, M., & Boyle, M. (2002). Multiattribute and single-attribute utility functions for the health utilities index mark 3 system. Medical Care, 40(2), Brazier, J., Roberts, J., & Deverill, M. (2002). The estimation of a preference-based measure of health from the SF-36. Journal of Health Economics, 21(2), Kaplan, R. M., Sieber, W. J., & Ganiats, T. G. (1997). The Quality of Well-Being Scale: comparison of the intervieweradministered version with a self-administered questionnaire. Psychology & Health, 12, Sieber, W. J., Groessl, E. J., David, K. D., Ganiats, T. G., & Kaplan, R. M. (2007). Quality of Well-Being Self-Administered (QWB-SA) scale. User s manual; San Diego: University of California. Retrieved March , from Shrout, P. E., & Fleiss, J. L. (1979). Intraclass correlations: Uses in assessing rater reliability. Psychology Bulletin, 86(2), Deyo, R. A., Diehr, P., & Patrick, D. L. (1991). Reproducibility and responsiveness of health status measures: Statistics and strategies for evaluation. Controlled Clinical Trials, 12(4), Rosner, B. (2005). Fundamentals of biostatistics (6th ed.). Boston: Duxbury Press. 26. Stavem, K., Froland, S. S., & Hellum, K. B. (2005). Comparison of preference-based utilities of the 15D, EQ-5D and SF-6D in patients with HIV/AIDS. Quality of Life Research, 14, Conner-Spady, B., & Suarez-Almazor, M. E. (2003). Variation in the estimation of quality-adjusted life-years by different preference-based instruments. Medical Care, 41(7), Longworth, L., Bryan, S. (2003). An empirical comparison of the EQ-5D and the SF-6D in liver transplant patients. Health Economics, 12, Hahl, J., Hamalainen, H., Sintonen, H., Simell, T., Arinen, S., & Simell, O. (2002). Health-related quality of life in type 1 diabetes without or with symptoms of long-term complications. Quality of Life Research, 11(5), Feeny, D. H., Wu, L., & Eng, K. (2004). Comparing short form 6D, standard gamble, and Health Utilities Index Mark 2 and Mark 3 utility scores: Results from total hip arthroplasty patients. Quality of Life Research, 13(10), Pickard, A. S., Johnson, J. A, & Feeny, D. H. (2005). Responsiveness of generic health-related quality-of-life measures in stroke. Quality of Life Research, 14,

76 Qual Life Res 32. Brazier, J., Roberts, J., Tsuchiya, A., & Busschbach, J. (2004). Comparison of the EQ-5D and SF-6D across seven patient groups. Health Economics, 13, Grootendorst, P., Feeny, D., & Furlong, W. (2000). Health Utilities Index Mark 3: Evidence of construct validity for stroke and arthritis in a population health survey. Medical Care, 38(3), Stavem, K. (1999). Reliability, validity and responsiveness of two multiattribute utility measures in patients with chronic obstructive pulmonary disease. Quality of Life Research, 8(1 2), Marra, C. A., Rashidi, A. A., Guh, D., Kopec, J. A., Abrahamowicz, M., Esdaile, J. M., Brazier, J. E., Fortin, P. R., & Anis, A. H. (2005). Are indirect utility measures reliable and responsive in rheumatoid arthritis patients? Quality of Life Research, 14(5), Hatoum, H. T., Brazier, J. E., & Akhras, K. S. (2004). Comparison of the HUI 3 with the SF-36 preference based SF-6D in a clinical trial setting. Value Health, 7(5),

77 6.3 Konerding U, Moock J, Kohlmann T. The classification systems of the EQ-5D, the HUI II and the SF-6D: What do they have in common? Med Care; im Begutachtungsprozess

78 1 The classification systems of the EQ-5D, the HUI II and the SF-6D: What do they have in common? Authors: PD Dr. Uwe Konerding, Dipl. Soz. Jörn Moock, Prof. Dr.Thomas Kohlmann Affiliation of all authors: Institute for Community Medicine, University of Greifswald, Walther-Rathenau-Straße 48, Greifswald, Germany Address of Correspondence: PD Dr. Uwe Konerding, Institute for Community Medicine, University of Greifswald, Walther-Rathenau-Straße 48, Greifswald, Germany, Tel.: +49 (0)3834/ , E- Mail: Fax: +49 (0)3834/ Telephone numbers and addresses of co-authors Jörn Moock: +49 (0)3834/ , Thomas Kohlman: +49 (0)3834/ , Acknowledgements: This project was funded by a grant (no. 01GD0106) from the German Federal Ministry of Education and Research within the North German Network for Rehabilitation Research (NVRF). We would like to thank Kathrin Bezold for her support in performing the study and Peter Bereza for correcting our English. Brief title: Classification systems Word count (exclusive of abstract, acknowledgements, figures, tables, and references): 3295

79 2 The classification systems of the EQ-5D, the HUI II and the SF-6D: What do they have in common? Brief title: Classification systems Word count (exclusive of abstract, acknowledgements, figures, tables, and references): 3295

80 3 Abstract Background and objectives: EQ-5D, HUI II and SF-6D are preference-based index instruments for health-related quality of life. Each of these instruments consists of 1) a multidimensional classification system, and 2) a function assigning a valuation to each health state distinguished within the classification system. All 3 instruments produce different valuations. This paper aims at clarifying to what extent these disparities might be caused by the classification systems. Methods: Subjects are 264 patients of rehabilitation clinics in *** (given after the review) (106 musculoskeletal, 70 psychosomatic, 88 cardiovascular disorders; 44.3% female; mean age 49.1) who completed the EQ-5D, the HUI II and the SF-36, which is the basis for the SF- 6D. After scaling with non-linear factor analysis, each dimension of each classification system was regressed on the classification systems of the other two instruments. A factor analysis with varimax rotation was performed for all dimensions together. Results: Adjusted multiple R 2 for regression analyses ranged from 0.01 to Factor analysis with varimax rotation produced 4 factors (in brackets percentages of explained variance): 1) mental problems (EQ-5D: 16.01%, HUI II: 21.07%, SF-6D, 25.36%); 2) physical functioning (EQ-5D: 22.92%, HUI II: 19.41%, SF-6D, 5.87%); 3) physical pain (EQ-5D: 18.10%, HUI II: 12.37%, SF-6D, 13.17%); and 4) further limitations (EQ-5D: 2.96%, HUI II: 5.06%, SF-6D, 19,96%). Discussion: All 3 classification systems contain a common core consisting of mental problems and physical pain. Apart from this, there are essential conceptual differences which might be responsible for differences in the resulting health-state valuations.

81 4 Keywords Health-related quality of life Preference-based index measurement Dimensions Methodology Health state utilities

82 5 Introduction In medical care more can be done than can be paid for. Decisions must be made. Which treatment is worth its price and which is not? Rational answers to this question require the worth of very different treatments to be represented on one common scale. For this purpose, the scale of quality-adjusted life years (QALYs) has been conceived. QALYs are life years weighted with the health-related quality of life (HRQoL) experienced during these years. Thereby, HRQoL is understood as the health state valuation given by the average user of the health care system. Moreover, for computing QALYs, the valuation of full health is coded with 1 and the valuation of death with 0. As far as HRQoL in this sense can be measured validly, the worth of each medical treatment can be assessed by the number of QALYs gained. In doing this, QALYs permit rational comparisons between new medical treatments addressing very different targets. Of course, the validity of decisions based on QALYs depends essentially upon the validity of measurements of HRQoL. There is one approach which has been especially conceived for producing such measurements: the preference-based index measurement approach. Each instrument constructed according to this approach consists of 2 components: 1) a multidimensional classification system for distinguishing health states, and 2) a scoring function which assigns a value of HRQoL to each health state distinguished within the classification system. Usually, the multi-dimensional classification system is operationally defined via questions presented in a questionnaire whereas the scoring function is given as part of the instructions for evaluating the answers to these questions. The questions are devised by the researchers. In contrast, the scoring functions are determined on the basis of preference judgments obtained from possible health care users. The mostly applied preference-based index instruments are the EQ-5D 1,2 and the HUI with its 2 newer versions HUI II 3 and

83 6 HUI III 4. Recently, the SF-6D 5,6, which is based upon the SF-36 7,8, is also being increasingly utilised. All 3 aforementioned instruments aim at measuring the same construct. Hence, after standardization with respect to death and full health, they should produce the same values for the same health states. This, however, is not the case. With a few exceptions 9-11, in most relevant empirical studies essential differences are found Moreover, Kopec and Willison 32 computed the utilities for 4 different health states by applying, among other things, the classification systems and the scoring functions of the EQ-5D and the SF-6D and found essential differences. All these findings imply that the choice of the instrument may severely influence the evaluation of medical treatments and thereby the decision-making process 33. To provide a rational basis for handling the differences just mentioned the reasons for these discrepancies should be investigated. Principally, 2 reasons are possible: 1) The basic multi-dimensional classification systems refer to different aspects of health, and 2) the scoring functions assigning values of HRQoL are different 34. Of course, both reasons may hold at the same time. The relationships between different scoring functions can only be investigated reasonably with reference to the same classification system. Hence, the relationships between the different classification systems should be examined first. To be specific, the extent to which the classification systems address different aspects of health should be determined. If different aspects are addressed and if these differing aspects are sufficiently considered in assigning values of HRQoL, then differences in the resulting values are very probable. At first sight, revealing conceptual differences between the classification systems might seem to be a merely analytical problem. It might seem that this problem can be solved by laying the questionnaires side by side on a table and by deciding which of the questions formulated in these questionnaires address the same aspect of health and which do not. On closer inspection the problem is not that simple. First of all, difficulties arise because natural

84 7 language is fuzzy. Words which mean the same for one person may mean something quite different for a second person. Moreover, even if 2 different questions seem to refer quite definitely to 2 different aspects of health, these 2 aspects might be connected by various causal relations that are not obvious on inspection of the questionnaires. These doubts concerning the reliability and validity of expert judgments are supported by empirical findings presented by Bryan and Longworth 34. These authors asked health economists to map 10 health states described by the SF-6D onto the corresponding EQ-5D health states. Except for 1 health state, the answers were very different. Presumably the best approach for clarifying the conceptual interrelations between the classification systems is an empirical study with the answers given in the corresponding questionnaires by ordinary subjects. The interrelations between these answers directly reveal the conceptual interrelations. Therefore, in the following, the classification systems of the EQ-5D, the HUI II and the SF-6D are compared by means of such an empirical investigation. Methods The data analyzed here are taken from a more comprehensive study performed in rehabilitation clinics in *** (exact location given after the review) 35. This study was longitudinal with 2 points of measurement. Persons were judged as eligible for the study when they were at least 18 years old and when their physician confirmed that they were able to fill in questionnaires without assistance. At both points of measurement, subjects were asked to complete, among other things, the EQ-5D, the HUI II and the newest version of the SF The order of the instruments was systematically rotated. Originally, 457 persons were asked to participate, 378 (82.7%) agreed, and 325 (71.1%) actually took part at both points of measurement. Of the 325 persons, 264 (81.2% of 325) completed the questionnaires without omitting any data. The latter persons are the subjects considered here. Of these, 106 had musculoskeletal, 70 psychosomatic and 88 cardiovascular disorders. The percentage of female

85 8 patients was 44.3 (musculoskeletal: 42.9, psychosomatic: 65.7, cardiovascular: 29.5). Mean age was 49.1 (musculoskeletal: 47.2, psychosomatic: 45.9, cardiovascular: 53.9) with a standard deviation of 10.9 (min: 19, max: 76). Educational level operationalised by years at school was less than 10 years for 68.5% and at least 10 years for 31.5% of the subjects. Three classification systems were considered: 1) the 5 dimensions of the EQ-5D, 2) the 6 dimensions of the HUI II and 3) the 6 dimensions of the SF-6D. Each EQ-5D dimension corresponds to exactly 1 question in the questionnaire. Therefore, the answers to these questions were directly applied in the analyses. For the HUI II and the SF-6D, the dimensions are, at least partly, formed by aggregating the answers to more than one question into one single category. In the investigation presented here, the HUI II answers were aggregated according to the principles described in the HUI manual 37, whereas the SF-6D answers were aggregated according to the principles realised in the SPSS-Syntax-File of Brazier and Walters 36. To get a first impression of data, the distributions of the dimension categories were determined. As a prerequisite for all further analyses, several additional operations with the categories constituting the dimensions were performed. These operations were necessary because the relations between the different dimensions can be investigated best when all dimensions are interval scales. For the original dimensions this is certainly not the case. The categories of the SF-6D dimension role limitation violate the interval scale assumption most obviously. Brazier et al. 5 describe the 2 middle categories of this dimension with You are limited in the kind of work or other activities as a result of your physical health and You accomplish less than you would like as a result of emotional problems. Between these 2 categories there is not even a clear rank order. Therefore, these 2 categories were merged into 1 single middle category. The resulting scale can be assumed to be at least an ordinal scale. For all other dimensions the original category descriptions directly suggest an ordinal scale.

86 9 To estimate the intervals between the categories which constitute the dimensions, nonlinear factor analyses 38 were performed with the optimal scaling module of SPSS 15.0 for all dimensions of the 3 instruments together. In non-linear factor analysis, the category quantifications of the manifest variables are estimated to maximise the variance explained by an a-priori given number of latent factors. In the analyses performed here, at first 2 factors were applied and then the number of factors was successively increased by 1 until the last latent factor had an eigenvalue of less than 1. For each dimension, the category quantifications resulting from the different factor analyses with only eigenvalues greater than 1 were compared with each other by means of correlations. Additionally, the different quantifications were compared with an equal interval scale. When all optimally scaled category quantifications correlated higher with each other than any of them did with an equal interval scale, then the category quantifications of the last factor analysis with only eigenvalues greater than 1 were used for scaling the dimension. Otherwise an equal interval scale was applied. As a further preparation for the following analyses, all resulting scales were standardised so that 0 represented the category with no limitations and 1 the category with the most limitations. With the scales just described, 34 multiple linear regression analyses were performed. These analyses resulted from regressing the 12 dimensions of the HUI II and the SF-6D on the EQ-5D, the 11 dimensions of the EQ-5D and the SF-6D on the HUI II and the 11 dimensions of the EQ-5D and the HUI II on the SF-6D. Subsequently, a linear factor analysis was performed for all 17 dimensions scaled in the way just described. All factors with an eigenvalue greater than 1 were extracted and rotated according to the varimax criterion. If the number of factors with an eigenvalue greater than 1 differed from the corresponding number for the non-linear factor analysis performed at the start of the analyses, then a rotation with the latter number of factors was also performed. To check the stability of the orthogonal

87 10 varimax rotation, an oblique promax rotation was also performed. To provide an interpretation of the resulting factors, an item was assigned to a factor if the item loading was at least 0.5. The proportion of variance explained by the resulting factors was determined for all 3 instruments together as well as for each of the 3 instruments separately. Results Of the 74 categories belonging to the 17 dimensions of the three instruments, 67 were realised in data. There were empty categories for the EQ-5D and the HUI II dimensions. For the EQ-5D these were the categories describing the most severe states of the dimensions mobility and self care. For the HUI II these were the 2 categories describing the 2 most severe states of the dimensions mobility and self care and the category for the most severe state of the dimension cognition. For the SF-6D, all dimension categories were realised in data (see Table 1). ******************** Insert Table 1 about here ******************** For up to 5 latent factors, the non-linear factor analysis yielded factors with exclusively eigenvalues greater than 1. For 3 of the 17 dimensions, only 2 categories were realised (see Table 1). Therefore, for these 3 dimensions no deviations from an equal interval scale were possible. For 5 of the remaining 12 dimensions, all correlations between the optimally scaled quantifications resulting from the different factor analyses were higher than the highest correlation with one of the quantifications with an equal interval scale. This suggests a stable deviation from an equal interval scale for these dimensions. Consequently, for these dimensions the standardised quantifications from the factor analyses with 5 factors were applied for all further analyses. These dimensions were the EQ-5D dimension usual activities, the HUI II dimension emotion and the SF-6D dimension social functioning,

88 11 mental health and vitality (see Table 1). For the remaining dimensions equal interval scales were applied for all further analyses. For the multiple linear equations the adjusted multiple R 2 ranged from 0.01 to 0.57 (see Tables 2, 3 & 4). The lowest R 2 resulted when the HUI II dimension sensation was regressed on the EQ-5D; the highest resulted when the HUI II dimension emotion was regressed on the SF-6D. Both the EQ-5D and the SF-6D contained 2 dimensions for which the R 2 were highest independently of the classification systems applied for prediction. For the EQ-5D these were the dimensions pain / discomfort and anxiety / depression and for the SF-6D the dimensions bodily pain and mental health. For the HUI II the R 2 belonging to the dimensions pain and emotion were highest for the regression on the EQ-5D and they were among the 3 highest for the regression on the SF-6D. In the latter case, bodily pain and vitality together had the second highest R 2. Moreover, the EQ-5D dimension anxiety / depression, the HUI II dimension emotion, and the SF-6D dimension mental health were the best predictors for each other. The EQ-5D dimension pain / discomfort, the HUI II dimension pain and the SF-6D dimension bodily pain were interrelated in an analogous manner (see Tables 2, 3 & 4). **************************** Insert Tables 2, 3 and 4 about here **************************** Comparing the unstandardised with the standardised weights yielded further insights. For example, with the SF-6D dimension as predictor, the unstandardised weights were always lower than the standardised weights. The opposite holds when the HUI II dimension was the predictor. With the EQ-5D dimension as predictor the results are mixed. The unstandardised weight was higher with the SF-6D dimension as criterion and lower with the HUI II dimension as criterion. These results suggest that the HUI II dimension covers the widest

89 12 range of the mental problems continuum and the SF-6D the smallest range. A similar pattern, although with a different rank order, showed for the 3 dimensions referring to physical pain. With the EQ-5D dimension as predictor, the unstandardised weights were always lower than the standardised weights. The opposite holds when the HUI II dimension was the predictor. With the SF-6D dimension as predictor the results were mixed. The unstandardised weight was higher with the EQ-5D dimension as criterion and lower with the HUI II dimension as criterion. These results suggest that the HUI II dimension covers the widest range of the pain continuum and the EQ-5D the smallest range. With the standardised as well as the unstandardised weights as criteria, there was only one further pair of dimensions for which both members of the pair best predict each other: HUI II self-care and SF-6D physical functioning (See Tables 2, 3 & 4). For all other dimensions there was not such a clear one-to-one mapping. Many dimensions were best predicted by a dimension for which they, in turn, were not the best predictors. For example, according to the standardised weights, not only the SF-6D dimension mental health but also the SF-6D dimensions role limitation, social functioning, and vitality were best predicted by the EQ-5D dimension anxiety / depression or, respectively, the HUI II dimension emotion. Two dimensions were rather unconnected with all other dimensions: the HUI II dimension sensation and the SF-6D dimension role limitation. In both cases, the adjusted multiple R 2 which result when these dimensions were predicted were distinctly lower than all other adjusted multiple R 2. Moreover, each of these 2 dimensions contributed significantly to the prediction of the other dimensions in only 1 of 11 regression equations and, in these 2 cases, the standardised regression weights were both close to 0. In contrast to the original non-linear factor analysis, the linear factor analysis with the dimensions in the finally applied scaling (see Table 1 for the scaling) yielded only 4 factors with eigenvalues greater than 1. The percentage of total variance explained by the 4 first

90 13 factors was 60.8%. For the first 5 factors this value was 66.4%. For both solutions, varimax and promax rotations were performed. When a dimension was assigned to a factor if the factor loading was at least 0.5 then it was only for the varimax rotation with 4 factors that each dimension could be assigned to exactly 1 factor. Therefore, this is the result presented here (see Table 5). The first factor refers to mental problems, the second to all kinds of physical functioning and the third factor to physical pain. The fourth and last factor is a kind of residual factor. The dimensions assigned to this factor are the HUI II dimension sensation and the SF-6D dimension role limitation. These are exactly those 2 dimensions which, in the linear regression analyses, were largely unrelated to the remainder. ******************** Insert Table 5 about here ******************** The promax rotation with 4 factors and both rotations with 5 factors yielded quite similar results to those of the varimax rotation with 4 factors. For the promax rotation with 4 factors, the EQ-5D dimension mobility could additionally be assigned to the third factor and the SF-6D dimensions physical functioning, social functioning and vitality additionally to the last factor. In both 5 factor rotations the last factor was split up into 2 new factors. For the first of these 2 factors, the SF-6D dimension role limitation always had the highest loading and the second of these factors was nearly identical with the HUI II dimension sensation. The 3 instruments were differently related to the factors of the varimax rotation with 4 factors. The greatest differences existed for the factor Physical functioning and General functioning. The EQ-5D was very strongly related to physical functioning; the SF-6D only marginally. In contrast, the SF-6D was very strongly related to general functioning; the EQ-5D only marginally. Except for physical pain, the percentages of explained variance of the HUI II were always in the middle (see Table 5).

91 14 Discussion The classification systems of the EQ-5D, the HUI II, and the SF-6D have a common core. It consists of the 2 factors mental problems and physical pain. The first factor is referred to as anxiety / depression in the EQ-5D, emotion in the HUI II and mental health in the SF-6D. Additionally, this factor is strongly related to the HUI II dimension cognition and the SF-6D dimensions vitality and social functioning. The second factor of the common core is referred to as pain / discomfort in the EQ-5D, pain in the HUI II and bodily pain in the SF-6D. The HUI II covers the widest range for both common core factors. Each of the 3 instruments contains some more or less specific dimensions in addition to the common core. The greatest disparity is between the EQ-5D and the SF-6D. The HUI II lies between the 2 other instruments. It is slightly more similar to the EQ-5D than to the SF-6D. If HRQoL values are assigned according to the same principles, then values produced by the EQ-5D, the HUI II and the SF-6D can be expected to be similar but not identical. The largest differences will arise between the EQ-5D and the SF-6D. This holds especially when physical functioning or more general functioning is concerned. Moreover, if extreme mental problems and/or extreme physical pain are an issue then the HUI II may yield more differentiated results than the other 2 instruments. The empirical results presented here provide information which may help to select the most appropriate of the three instruments considered here. However, this information does not completely determine the appropriateness of these instruments. For this purpose, in addition some normative decisions are required. To be specific, it must be decided whether importance is placed more on physical functioning or more on further limitations. There are some good arguments for leaving this decision to those who pay and use the health care system. In this case further empirical studies are required: studies in which average users of the health care system give information concerning the relative importance of the dimensions in question.

92 15 References 1. Brooks R., the EuroQol Group. EuroQol: the current state of play. Health Policy. 1996;37: Dolan P. Modeling valuations for EuroQol health states. Med Care. 1997;35: Feeny D, Furlong W, Boyle M, et al. Multi-attribute health status classification systems. Pharmacoeconomics. 1995; Furlong, WJ, Feeny, DH, Torrance, GW, et al. The Health Utilities Index (HUI) system for assessing health-related quality of life in clinical studies. Ann Med. 2001;33(5): Brazier J, Roberts J, Deverill M. The estimation of a preference-based measure of health from the SF-36. J Health Econ. 2002;21: Brazier J, Usherwood T, Harper R, et al. Deriving a Preference-Based Single Index from the UK SF-36 Health Survey. J Clin Epidemiol. 1998;51(11): Ware J.E., Kosinski M., Dewey J.E. How to Score Version Two of the SF-36 Health Survey. Lincoln, RI: QualityMetric, Incorporated, Ware JE, Sherbourne CD. The MOS 36-Item Short-Form Health Survey (SF-36). Med Care. 1992;30(6): Michaels JA, Brazier JE, Campbell WB, et al. Randomized clinical trial comparing surgery with conservative treatment for uncomplicated varicose veins. Br J Surg. 2006;93(2): Teng YK, Verburg RJ, Sont JK, et al. Long-term followup of health status in patients with severe rheumatoid arthritis after high-dose chemotherapy followed by autologous hematopoietic stem cell transplantation. Arthritis Rheum. 2005;52(8):

93 van den Hout WB, de Jong Z, Munneke M, et al. Cost-utility and cost-effectiveness analyses of a long-term, high-intensity exercise program compared with conventional physical therapy in patients with rheumatoid arthritis. Arthritis Rheum. 2005;53(1): Barton GR, Bankart J, Davis AC. A comparison of the quality of life of hearingimpaired people as estimated by three different utility measures. Int J Audiol. 2005;44(3): Barton GR, Bankart J, Davis AC, et al. Comparing Utility Scores Before and After Hearing-Aid Provision : Results According to the EQ-5D, HUI3 and SF-6D. Appl Health Econ Health Policy. 2004;3(2): Brazier J, Roberts J, Tsuchiya A, et al. A comparison of the EQ-5D and SF-6D across seven patient groups. Health Econ. 2004;13(9): Conner-Spady B, Suarez-Almazor ME. Variation in the estimation of quality-adjusted life-years by different preference-based instruments. Med Care. 2003;41(7): Espallargues M, Czoski-Murray CJ, Bansback NJ, et al. The impact of age-related macular degeneration on health status utility values. Invest Ophthalmol Vis Sci. 2005;46(11): Feeny D, Wu L, Eng K. Comparing short form 6D, standard gamble, and Health Utilities Index Mark 2 and Mark 3 utility scores: results from total hip arthroplasty patients. Qual Life Res. 2004;13(10): Franks P, Hanmer J, Fryback DG. Relative disutilities of 47 risk factors and conditions assessed with seven preference-based health status measures in a national U.S. sample: toward consistency in cost-effectiveness analyses. Med Care. 2006; 44(5):

94 Hawthorne G, Richardson J, Day NA. A comparison of the Assessment of Quality of Life (AQoL) with four other generic utility instruments. Ann Med. 2001;33(5): Lamers LM, Bouwmans CA, van Straten A, et al. Comparison of EQ-5D and SF-6D utilities in mental health patients. Health Econ. 2006;15(11): Luo N, Johnson JA, Shaw JW, Feeny D, et al. Self-reported health status of the general adult U.S. population as assessed by the EQ-5D and Health Utilities Index. Med Care. 2005;43(11): Marra CA, Esdaile JM, Guh D, et al. A comparison of four indirect methods of assessing utility values in rheumatoid arthritis. Med Care. 2004;42(11): McDonough CM, Grove MR, Tosteson TD, et al. Comparison of EQ-5D, HUI, and SF-36-derived societal health state values among spine patient outcomes research trial (SPORT) participants. Qual Life Res. 2005;14(5): O'Brien BJ, Spath M, Blackhouse G, et al. A view from the bridge: agreement between the SF-6D utility algorithm and the Health Utilities Index. Health Econ. 2003;12(11): Petrou S, Hockley C. An investigation into the empirical validity of the EQ-5D and SF-6D based on hypothetical preferences in a general population. Health Econ. 2005;14(11): Pickard AS, Johnson JA, Feeny DH. Responsiveness of generic health-related quality of life measures in stroke. Qual Life Res. 2005;14(1): Siderowf A, Ravina B, Glick HA. Preference-based quality-of-life in patients with Parkinson's disease. Neurology. 2002;59(1):

95 Stavem K, Froland SS, Hellum KB. Comparison of preference-based utilities of the 15D, EQ-5D and SF-6D in patients with HIV/AIDS. Qual Life Res. 2005;14(4): Szende A, Svensson K, Stahl E, et al. Psychometric and utility-based measures of health status of asthmatic patients with different disease control level. Pharmacoeconomics. 2004;22(8): Thomas KJ, MacPherson H, Ratcliffe J, et al. Longer term clinical and economic benefits of offering acupuncture care to patients with chronic low back pain. Health Technol Assess. 2005;9(32):iii-iv, ix-x, van Stel HF, Buskens E. Comparison of the SF-6D and the EQ-5D in patients with coronary heart disease. Health Qual Life Outcomes. 2006;25;4: Kopec A, Willison KD. A comparative review of four preference-weighted measures of health-related quality of life. J Clin Epidemiol. 2003;56: McDonough CM, Tosteson AN. Measuring preferences for cost-utility analysis: how choice of method may influence decision-making. Pharmacoeconomics. 2007;25(2): Bryan S, Longworth L. Measuring health-related utility: why the disparity between EQ-5D and SF-6D? Eur J Health Econ. 2005;6(3): exact reference is given after the review 36. Brazier J, Walters S. SF-6D UK Programme. SPSS-Syntax. 24 October Furlong WJ, Feeny DH, Torrance GW. Health utilities index (HUI) procedures manual. Dundas Ontario Canada: Health Utilities Inc.; Gifi, A. Nonlinear Multivariate Analysis. New York: John Wiley; 1990.

96 19 Table 1: Categories within the dimensions: distributions and quantifications a Dimension Category b EQ-5D Mobility 166 (62.9) (37.1) (0.0) 1.00 Self care 251 (95.1) (4.9) (0.0) 1.00 Usual activities 125 (47.3) (43.9) (8.7) 1.00 Pain/discomfort 46 (17.4) (70.8) (11.7) 1.00 Anxiety/depression 145 (54.9) (39.8) (5.3) 1.00 HUI II Sensation 77 (29.2) 152 (57.6) 30 (11.4) 5 (1.9) X c Mobility 184 (69.7) (26.9) ( 3.4) (0.0) (0.0) 1.00 Emotion 104 (39.4) (42.2) (14.4) (3.8) (0.4) 1.00 Cognition 174 (65.9) 77 (29.2) 13 ( 4.9) 0 (0.0) X c Self care 217 (82.2) 47 (17.8) 0 ( 0.0) 0 (0.0) X c Pain 34 (12.9) (51.5) (26.9) (4.9) (3.8) 1.00 SF-6D Physical functioning 6 (2.3) (19.7) (33.3) (11.4) (30.3) (3.0) 1.00 Role 19 (7.2) 51 (19.3) 20 (7.6) 174 (65.9) X c X c limitation d Social 68 (25.8) 63 (23.9) 72 (27.3) 45 (17.0) 16 (6.1) X c functioning Bodily pain 41 (15.5) (2.7) (20.8) (27.7) (21.2) (12.1) 1.00 Mental health 29 (11.0) 55 (20.8) 97 (36.7) 73 (27.7) 10 (3.8) X c Vitality 9 (3.4) (22.0) (24.6) (33.0) (17.0) 1.00 X c a Entries in cell: first number = absolute frequency, number in brackets = percentage, last number = category quantification; quantifications resulting from optimal scaling in bold. b Category 1 = no limitation; highest category = most limitations. c This category does not exist. d Category 2 = limitations due to physical problems; 3 = limitations due to emotional problems.

97 20 Table 2: EQ-5D as predicting instrument a Weights for EQ-5D dimensions b Criterion variable Con c R 2 adj. HUI II Sensation * 0.24** 0.01 (0.09) (-0.04) (0.01) (-0.00) (0.15) Mobility 0.24** 0.28** ** (0.43) (0.23) (0.10) (-0.00) (-0.07) Emotion * ** 0.41** 0.04* 0.49** (-0.00) (-0.11) (0.01) (0.16) (0.65) Cognition ** ** (0.06) (-0.09) (0.07) (0.11) (0.44) Self care ** 0.07** ** (0.10) Pain 0.17** (0.18) SF-6D Physical functioning 0.10 (0.10) (0.31) 0.11 (0.05) (0.19) 0.01 (0.02) (0.09) 0.49** (0.59) (0.02) 0.03 (0.04) 0.06** 0.49** 0.44** 0.23** 0.11* ** 0.26** (0.19) (0.33) (0.12) (-0.09) Role limitation 0.18* ** 0.61** 0.12** (0.14) (-0.08) (0.11) (0.12) (0.21) Social functioning ** ** 0.28** 0.21** (0.12) (-0.02) (0.17) (0.01) (0.38) Bodily pain * 0.59** ** 0.39** (0.10) (-0.03) (0.14) (0.52) (0.03) Mental health ** 0.59** 0.15** 0.48** (-0.06) (-0.06) (-0.01) (0.17) (0.65) Vitality 0.02 (0.01) (-0.09) 0.12* (0.14) 0.22** (0.19) 0.41** (0.39) 0.30** 0.27** a All criterion and predictor variables are coded with 0 = no limitation and 1 = most limitations (see Table 1 for complete category quantifications). Standardized coefficients are in brackets. Statistically significant deviation from zero is marked with * for p<0.05 and ** for p<0.01. Two-sided tests for coefficients, one-sided test for R 2 adj.. 1= Mobility; 2 = Self care; 3 = Usual activities; 4 = Pain/discomfort; 5 = Anxiety/depression. c Additive parameter.

98 21 Table 3: HUI II as predicting instrument a Criterion Weights for HUI II dimensions b variable Con c R 2 adj. EQ-5D Mobility ** ** ** (0.03) (0.43) (-0.07) (0.04) (0.04) (0.28) Self care ** ** ** (-0.01) (0.23) (-0.11) (-0.02) (0.29) (0.08) Usual ** ** 0.24* 0.16** 0.19** activities (0.01) (0.17) (0.06) (0.11) (0.21) (0.15) Pain/ ** 0.20** 0.45** discomfort (-0.04) (0.00) (0.07) (0.01) (0.04) (0.64) Anxiety/ ** 0.29** * ** depression (0.03) (-0.16) (0.61) (0.19) (0.06) (-0.11) SF-6D Physical 0.15* 0.32** -0.17* ** 0.15* 0.38** 0.25** functioning (0.14) (0.17) (-0.13) (0.05) (0.33) (0.13) Role ** ** 0.10** limitation (0.08) (0.06) (0.22) (0.06) (-0.05) (0.12) Social ** ** 0.25** functioning (0.07) (0.07) (0.46) (0.06) (0.02) (-0.02) Bodily pain ** 0.25** 0.35** (0.04) (0.01) (0.02) (0.02) (0.03) (0.57) Mental ** ** 0.53** health (0.04) (-0.08) (0.65) (0.10) (-0.01) (0.06) Vitality 0.04 (0.03) (-0.02) 0.83** (0.51) 0.09 (0.06) (-0.07) 0.19* (0.14) 0.32** 0.35** a All criterion and predictor variables are coded with 0 = no limitation and 1 = most limitations (see Table 1 for complete category quantifications). Standardized coefficients are in brackets. Statistically significant deviation from zero is marked with * for p<0.05 and ** for p<0.01. Two-sided tests for coefficients, one-sided test for R 2 adj.. 1= Sensation; 2 = Mobility; 3 = Emotion; 4 = Cognition; 5 = Self care; 6 = Pain. c Additive parameter.

99 22 Table 4: SF-6D as predicting instrument a Criterion Weights for SF-6D dimensions b variable Con c R 2 adj. EQ-5D Mobility 0.18** * 0.19** -0.16* ** (0.18) (0.08) (0.16) (0.24) (-0.18) (-0.01) Self care 0.14** ** (0.33) (-0.09) (0.10) (0.02) (-0.02) (-0.10) Usual 0.48** * 0.21** ** activities (0.33) (-0.00) (0.15) (0.17) (-0.02) (0.12) Pain/ ** ** discomfort (0.07) (-0.01) (-0.06) (0.53) (0.07) (0.14) Anxiety/ ** ** depression (-0.01) (0.01) (0.07) (-0.03) (0.60) (0.09) HUI II Sensation ** 0.04* (0.13) (0.04) (0.07) (0.01) (0.12) (-0.00) Mobility 0.18** ** (0.32) (-0.02) (0.09) (0.12) (-0.10) (-0.10) Emotion * ** 0.13** ** (-0.08) (0.00) (0.11) (0.02) (0.54) (0.21) Cognition ** ** (0.01) (0.02) (0.05) (0.06) (0.35) (0.11) Self care 0.23** -0.05* ** (0.45) (-0.13) (0.07) (0.09) (0.10) (-0.14) Pain 0.07 (0.08) (-0.03) (-0.06) 0.39** (0.54) 0.11* (0.13) 0.07 (0.09) ** a All criterion and predictor variables are coded with 0 = no limitation and 1 = most limitations (see Table 1 for complete category quantifications). Standardized coefficients are in brackets. Statistically significant deviation from zero is marked with * for p<0.05 and ** for p<0.01. Two-sided tests for coefficients, one-sided test for R 2 adj.. 1= Physical functioning; 2 = Role limitation; 3 = Social functioning; 4 = Bodily pain; 5 = Mental health; 6 = Vitality. c Additive parameter.

100 23 Table 5: Linear factor analysis with varimax rotation a Item b Factor loadings Mental problems Physical functioning Factors Physical pain Further limitations 1) Psychological well-being HUI II, emotion EQ-5D, anxiety / depression SF-6D, mental health HUI II, cognition SF-6D, vitality SF-6D, social functioning ) Physical functioning HUI II, self care EQ-5D, self care HUI II, mobility SF-6D, physical functioning EQ-5D, mobility EQ-5D, usual activities ) Physical pain EQ-5D, pain / discomfort HUI II, pain SF-6D, bodily pain ) General functioning SF-6D, role limitation HUI II, sensation Type of Statistic General statistics Mental problems Physical functioning Factors Physical pain General functioning a) All dimensions Eigenvalue % explained variance Cum. % explained variance b) EQ-5D % explained variance Cum. % explained variance c) HUI II % explained variance Cum. % explained variance d) SF-6D % explained variance Cum. % explained variance a For category quantifications of the dimensions (i.e. the manifest variables) see Table 1. b Ordered according to the loadings on the assigned factor.

101 6.3 Happich M, Moock J, von Lengerke T. Health Valuation Methods and Reference Points: the Case of Tinnitus. Value in Health 2008; im Druck

102 Von: im Auftrag von Gesendet: Samstag, 19. Januar :47 An: Cc: Betreff: Value in Health - Decision on Manuscript ID ViH OM.R1 Health Valuation Methods and Reference Points: the Case of Tinnitus 19-Jan-2008 (Person not available) (Person not available) Dear Mr. Moock: We are happy to accept your revised manuscript entitled "Health Valuation Methods and Reference Points: the Case of Tinnitus" for publication in Value in Health. Stephen Priori, VH Managing Editor, may be in contact with you concerning issues relating to final editing of the manuscript. He may also contact you regarding any additional comments or queries on your paper prior to publication. Please direct any questions concerning the publication schedule to him at spriori@ispor.org. Thank you for your fine contribution. On behalf of the Editors of Value in Health, we look forward to your continued contributions to the Journal. Sincerely, Dr. John Hornberger Co-Editor, Value in Health Reviewer(s)' Comments to Author: Reviewer: 1 Comments to the Author Well done - this is a great improvement. The graphs are very interesting. One comment: Page 1: Nowadays NICE stands for the National Institute for Health & Clinical Excellence Reviewer: 2 Comments to the Author I enjoyed this revision. It answers my previous comments well. A small point: In the discussion line 55: "lessens" should be lessened

103 Running head: Health state valuation methods and reference points Health state valuation methods and reference points: the case of tinnitus Michael Happich 1, Joern Moock 2, Thomas von Lengerke 1,3 1 Helmholtz Center Munich German Research Center for Environmental Health, Institute of Health Economics and Health Care Management (IGM), Munich, Germany 2 University of Greifswald, Institute of Community Medicine, Greifswald, Germany 3 Hannover Medical School (MHH), Medical Psychology Unit (OE 5430), Hannover, Germany Address for correspondence Joern Moock Institute of Community Medicine University of Greifswald Walther-Rathenau-Straße Greifswald Germany Telephone: +49 (0) joern.moock@uni-greifswald.de Acknowledgements Many thanks go to the German Tinnitus League in Berlin, the Heinrich-Heine-Hospital in Potsdam, and the otolaryngology department of the Charité University Hospital in Berlin for their support of the survey. We are grateful to David Feeny for helpful comments. Financial support for this study was provided by DFG Deutsche Forschungsgemeinschaft Kennedyallee Bonn, Germany

104 Running head: Health valuation methods and reference points Abstract Introduction. Many studies support the finding that patients, compared to the general public, valuate a given health condition differently. Based on Prospect Theory, this difference can be explained by adaptation processes resulting in differences in individual reference points. Using tinnitus as a case in point, our objective is to analyse empirically to what extent differences in risk attitudes (as a proxy to reference points) mediate differences in health valuations. Methods. N = 210 tinnitus patients and a similar number of unaffected persons indicated their willingness to undergo, hypothetically, an intervention (surgery or treatment) that would either improve or worsen the condition, thus revealing their risk attitudes. Utilities were elicited using three different methods: Visual Analogue Scale (VAS), Time Trade-off (TTO), and Standard Gamble (SG). Repeated measure analysis of variance was used to test for mediation of utility differences by reference points. Results. Health status (affected unaffected) has a significant effect on tinnitus utilities and risk attitude; at the same time, the latter is significantly associated with utilities. Adjusting for risk attitude, differences by health status disappear for SG and TTO, and are alleviated for VAS. Discussion. Reference points in terms of risk attitudes are a potential confounder in the valuation of health states. Taking into account theoretical predictions and issues in measuring SG, TTO, and risk attitudes, these results cast doubt on the construct validity of SG and TTO, and point to the need to recognize and further clarify the role of reference points in health valuation research. Key words: health valuation methods, Prospect Theory, reference point, risk attitude 1

105 Running head: Health valuation methods and reference points Introduction Rising financial pressure on health care systems requires prioritisation of resources in health care financing [1]. Usually, different medical interventions are compared with respect to both their costs and effectiveness in order to allow a ranking of health interventions [2]. However, most authors agree that such rankings of interventions depend on who is asked, and whose utilities are used [3-7]. Recently, pharmacoeconomic guidelines have been published by independent institutions or administrations of several countries (for example USA, Canada, Australia, New Zealand and the UK) for the purpose of health economic evaluations [8]. One issue in these guidelines are recommendations on which method should be used to assess benefits of health care and whose utilities should be implemented into evaluation of benefits. For example, the guideline provided by the National Institute for Clinical Excellence (NICE) recommends that values should be based on public preferences. This public or societal perspective can be supported by the argument that the general public as tax payers provides the monetary frame for the health system [9]. With some exceptions [6,10], studies usually find that patients provide higher utilities to their own health condition than does the general public for whom the condition is hypothetical [3,7,11-14]. Expressed in a modelling framework, this implies that health status as an independent variable influences health-state valuations ( basic impact model ). Attempts to explain these findings may draw on different lines of argument [15] relating to the different stages of interpretation, judgment, and response which follow exposition to the stimulus of one s own health state or respective scenario [16]. First, discrepancies might occur due to different interpretations of health state descriptions if, for example, co-morbidities are neglected (or, alternatively, are missing in the scenario due to a lack of scope). Second, in the judgment phase a variety of effects can occur. A focussing illusion [17] can affect valuations if people forget obvious aspects of the health state under consideration. A contrast effect takes place if people are influenced by extremely negative life events that level the understanding of the valued health condition [18]. Furthermore, adaptation processes may explain differences in perception [19] : Patients become accustomed to a chronic health condition that appears, from the outside, highly undesirable. Finally, in the response phase, recalibration response shift may happen in patients in that they change their internal standards. 2

106 Running head: Health valuation methods and reference points Potentially, these aspects place obstacles to consistent decision making and assessments given people with different health states are involved. Until now, rational and thus normatively consistent decision making (under risk) has been predominantly based on a normative theory by von Neumann and Morgenstern [20], i.e. Expected Utility Theory. For some decades, however, this has been increasingly challenged by less rigorous approaches that allow and incorporate inconsistent aspects in a more descriptive manner. Among these, the most influential descriptive theory of decision making under risk is the so-called Prospect Theory by Kahneman and Tversky [21]. Prospect Theory distinguishes an editing and an evaluation phase. In the editing phase, outcomes are coded as gains or losses rather than as final asset positions. This coding is certainly influenced if, for instance, possible focussing illusions or adaptation processes have taken place beforehand. Gains and losses, however, are coded relative to some neutral reference point, which splits the evaluation space into a gain and a loss domain. Kahneman und Tversky assume that the shape and position of individual utility functions significantly depend on the position of the reference point. Specifically, the gain function is concave while the loss function is convex (see Figure 1). Taking into account the observation that losses loom larger than gains, labelled loss aversion, the utility function is asymmetrical: the function for losses is steeper than the corresponding function for gains. In terms of utilities, equal deviations from the reference point are perceived more intensely in the loss than the gain domain, as shown in Figure 1 [Figure 1 about here] If the status quo, that is the present individual health condition, serves as the reference point, observed differences in utility of the same health condition between patients and the general public are explicable. Assume a participant has to rate a health condition worse than his present unaffected one. If he codes his present condition as the reference point, the worse condition will be coded as a loss, thus being on the steep loss function to the left of the reference point. The associated utility difference between both health conditions is quite substantial (situation (a) in Figure 1). Assume on the other hand, the rated worse health condition is perceived as the reference point. In that case, the compared unaffected condition lies in the gain domain, thus on the less steep concave gain part of the utility function. Utility differences in the gain domain are less pronounced (situation (b)) than in the loss 3

107 Running head: Health valuation methods and reference points domain. It is hypothesized that the situation (a) in Figure 1 corresponds to the situation of unaffected people while situation (b) corresponds to the situation of patients. However, following Kahneman and Tversky, the location of the reference point can be affected by expectations, experience or adaptation; thus gains or losses can be coded relative to a point that differs from the status quo. Though plausible, a strict classification of patients and the general public with respect to different reference points does not seem justified. Possibly, patients have not yet adapted to their condition, or unaffected people can comprehend more or less how it is to suffer a particular impairment. In principle, the entire range of reference points may then be observed across and within both groups. At any rate, the reference point is a potential explanatory variable for the impact of health status on health state valuations. In other words, we propose that reference points mediate the association of health status and health state valuation, and hence account for differences between people with a disorder and those without. As visualized in Figure 2, this implies the following four hypotheses, which relate to the four standard steps of mediational analysis first delineated by Baron and Kenny [22] : [Figure 2 about here] Hypothesis 1: Health status (here: tinnitus vs. no tinnitus) has an effect on the respective health state valuations if the reference point is not considered (see Arrow 1 in Figure 2); specifically, patients are predicted to assign higher utilities to their condition than unaffected people asked about the same condition. This represents the basic impact model described in the introductory paragraph of this paper. Technically, this implies to show that the independent variable is correlated with the dependent variable (i.e., synonymously, the outcome) via modelling the latter by prediction through the independent variable. If significant, this establishes the very effect which may be mediated. Hypothesis 2: Health status influences the reference point, i.e. on average patients are predicted to refer to other points than unaffected people (Arrow 2). This implies to show that the independent variable is correlated with the potentially mediating variable via modelling the latter by prediction through the independent variable. 4

108 Running head: Health valuation methods and reference points Hypothesis 3: Reference points influence health state valuations, i.e. people with different reference points are predicted to value the same health condition differently (Arrow 3). This implies to show that the potential mediator is associated with the dependent variable via modelling the latter by prediction through the independent variable. However, it is not sufficient just to link the mediator to the outcome since they may be correlated because they are both caused by the independent variable. Thus, the independent variable must be adjusted for in establishing the effect of the mediator on the outcome. Hypothesis 4: The association of health status and health state valuations is lessened or even offset if the reference point (here: risk attitude) is adjusted for (Arrow 4). That is, risk attitude should explain a substantial part of the mean difference in utilities between patients and unaffected people. Complete mediation implies to show that the effect of the independent variable on the outcome adjusting for the mediator is zero. Technically, Hypothesis 3 and 4 are estimated in the same model. Unfortunately, testing these hypotheses is not entirely straightforward since reference points are not consistently defined. In some cases, they have been used to explain results ex-post but it is hard to define them ex-ante. However, Kahneman and Tversky [21] observed that most people find symmetric bets [ ] distinctly unattractive [p. 280] if deciding something from the reference point while a person who has not made peace with his losses is likely to accept gambles that would be unacceptable to him otherwise [p. 288]. People will be risk seeking if the health state under consideration is perceived as a loss; people will be risk averse if the health state coincides with their reference point. Thus, the relationship between risk attitude and reference point that is addressed in Prospect Theory suggests that the risk attitude with respect to health implies the position of the reference point in our context. Against this background, we analyse the hypotheses stated above for the case of tinnitus (i.e., health status in figure 2). The main symptom of this condition is described by Graham [23] as a sensation of sound for which there is no source of vibration outside the individual [p. 5]. This impairment is quite common in industrial societies with about 40% of all adults having experienced temporary or permanent ear trouble, and 10% have to cope with it daily [24]. No personal characteristics can be linked to the appearance of tinnitus. Secondary symptoms are the main problem of tinnitus. 58% of affected Germans suffer from sleeping disorders, 38% have difficulty understanding conversations 5

109 Running head: Health valuation methods and reference points properly, and 36% are depressive or desperate [25]. The resulting stress can aggravate the situation leading to a vicious circle. Methodically, we apply three well established direct valuation techniques to assign utilities to tinnitusrelated quality of life (health state valuation in figure 2). Standard Gamble (SG) is the theoretically most profound technique [26] and based on the axioms of von Neumann and Morgenstern [20]. Time Trade-off (TTO) has been developed as an alternative measure to value health related quality of life because many people have difficulties to understand the probability concept of SG [27]. Visual Analogue Scale (VAS) is a psychometric measure that is easily understood, and extensively used [28]. Methods Sample and procedure Two equally sized samples of tinnitus patients and respondents from the general public (N = 210 each) were recruited and matched for sex and age. Patients were contacted at different places in Berlin, Germany: the German Tinnitus League (a self-help association), the Heinrich-Heine-Hospital (an institution focussing on psychosomatic conditions), an otolaryngology department (at Charité University Hospital), and a private clinic for the treatment of tinnitus; they were interviewed between September and December The control group from the general population were interviewed at different public places in Berlin as well (predominantly randomly chosen pedestrian and shopping malls, and public transport localities) between October 2000 and January 2001 until matching to the patients sample was ensured. To be eligible for the study, respondents had to be Berlin residents (determined by their reported zip code). They were considered non-eligible if they reported current tinnitus. After providing informed consent and agreeing to participate, the interview was accomplished. All interviews were conducted by the same interviewer and took between 10 and 20 minutes. Of those N = 210 who did participate from the general public, one person terminated the interview. Women and men are approximately equally represented in the patients (110 women and 100 men) and general public group (108 women and 102 men); also, age distributions are equivalent (for more 6

110 Running head: Health valuation methods and reference points information, see [29] ). Regarding non-response to the different elicitation methods, overall N = 21 respondents were unable to answer SG or refused to do so (10 patients and 11 public respondents), while N = 29 did not reply to TTO (16 and 14, respectively), and N = 5 to VAS (2 and 3, respectively). For the valuation tasks, participants unfamiliar with tinnitus listened to an example of tinnitus sounds which had been assembled by the German Tinnitus League in accordance with reports of patients. Also, a scenario description for tinnitus, developed jointly with experienced physicians and patients on the basis of the literature, was provided. Information about secondary symptoms and their prevalence among patients was supplied (see appendix). SG and TTO were placed at the end of the interview to allow participants to warm up ; VAS and assessments of age and sex, among general public participants preceded them. Elicitation methods Visual Analogue Scale (VAS). Following the procedure described by Gold et al. [1], participants were asked to place a mark for the condition tinnitus on a horizontal 100-mm-line on or between the two anchor states worst imaginable health state and best imaginable health state. They were not divided in millimetre or verbal clues to avoid memory effects and clustering [25]. The distance in millimetre (expressed in percent) between the lower anchor state and the mark was assumed to reflect the perceived severity of tinnitus on a scale between 0 and 1. Standard Gamble (SG). With SG, respondents repeatedly face changing decision pairs until indifference is reached [26]. Specifically, participants were asked to envisage two sets of health-related circumstances that involve risky choices considering length of life: subjects chose either life with tinnitus or, as the second choice, a hypothetical treatment that either cured tinnitus with probability (p) or otherwise resulted in immediate death with probability (1-p). The individual utility score of tinnitus was determined by varying the level of p in a ping-pong mode until the participant remained indifferent. Participants were offered coloured probability wheels, i.e. colour-coded pie chart segments, to facilitate the understanding of probabilities [30]. 7

111 Running head: Health valuation methods and reference points Time Trade-off (TTO). In TTO, respondents balance life years for better health. Two alternatives were offered, either an entire life (y) with tinnitus or a shorter period without. The individual utility score of tinnitus was determined by varying the number of life years spent disease-free (x) in a ping-pong mode until the participant remained indifferent. The maximum number of years the interview partner was willing to give up in relation to the original life expectancy determined the utility ratio (x/y). As Verhoef et al. remark, the aspiration level of survival seems to change with age [31]. To correct for individual aspiration levels considering life years, individual life expectancy was operationally defined with the question of how old each participant guessed to become. The difference between individual life expectancy and actual age determined original life time. Reference points As a proxy for the context-specific reference point we used risk attitude with respect to tinnitus-related quality of life (variable RISK hereafter). The operationalisation of the risk attitude in the interviewbased questionnaire was based on a corollary by Keeney and Raiffa [32] : A decision maker who prefers the expected consequence of any lottery [...] to the lottery itself is risk averse [p. 150]. The opposite holds in case of risk seeking behaviour. In our questionnaire, respondents were asked whether they were willing to accept a surgery or treatment for tinnitus that could either improve or worsen the condition, with an equal likelihood and to an equal extent. Literally, the item read as follows: Would you undergo surgery or treatment that could improve or worsen your present health condition with Tinnitus, both with an equal probability and to an equal extent? (English translation; German original available from the authors). Five possible answers, 1) in no case, 2) unlikely, 3) maybe, 4) likely, and 5) in any case were supposed to reflect five different risk attitude levels. Conceptually, the answers in no case and unlikely reflect risk aversion, while likely and in any case reflect risk seeking, and maybe is risk neutral. However, in order not to miss any potentially important variability in risk attitudes, the original five-point-scale rated by the study participants was used throughout the analyses reported hereafter. 8

112 Running head: Health valuation methods and reference points Statistical analysis To test Hypothesis 1, i.e. for differences between the groups tinnitus patients and controls without tinnitus (variable HEALTH STATUS ) in tinnitus valuations based on the three different elicitation techniques (VAS, TTO, SG), a repeated measure analysis of variance was performed using the general linear model (GLM) function (SPSS for Windows, version , for this and all following analyses). In addition to the between-subject factor HEALTH STATUS, elicitation methods were entered as a within-subject factor ( METHOD ) in order to account for this source of variance and to test the interaction, i.e. whether HEALTH STATUS has differential effects on valuations depending on METHOD. Finally, contrast analysis in terms of simple effects [33] of HEALTH STATUS within each elicitation method was conducted using MANOVA design command options, thus testing Hypothesis 1 for each method. Table I and Figure 3 relate these analyses (see below, Results-section). Hypothesis 2, i.e. differences in risk attitudes between participants affected vs. unaffected by tinnitus, was explored by cross-tabulating HEALTH STATUS and RISK. As measures of association, a Chi²statistic was calculated and a test of mean differences in RISK reported in the text. Table II relates to the results of this analysis (see below, Results-section). Finally, Hypotheses 3 and 4 were tested in a repeated measure analysis of covariance, again using a general linear model. In addition to the between-subject factor HEALTH STATUS and the withinsubject factor METHOD, risk attitude ( RISK ) was entered in the equation as a covariate, thus being adjusted for. Again, contrast analyses in terms of simple effects within each elicitation method were conducted as described before (see above, Hypothesis 1). Table III, Figure 4 and Figure 5 relate to these analyses (see below, Results section). Results Hypothesis 1 predicted that patients assign higher utilities to their condition than unaffected people asked about the same condition ( basic impact model ; see Figure 2, Arrow 1). Table I and Figure 3 show the results of the respective repeated measure analysis of variance and contrast analyses. As 9

113 Running head: Health valuation methods and reference points predicted, tinnitus patients differ significantly from controls both overall (HEALTH STATUS) and within each elicitation method (HEALTH STATUS within VAS, TTO and SG, respectively; see Table I). As Figure 3 shows, within every method tinnitus patients assign higher utilities to tinnitus as a health state than controls. This difference is most pronounced for VAS (0.53 vs. 0.34), followed by SG (0.88 vs. 0.80) and TTO (0.83 vs. 0.78). Furthermore, Table I indicates that both level of valuation (withinsubject effect METHOD) and the differences between patients and controls (METHOD * HEALTH STATUS) vary significantly across methods. This latter finding indicates that the degree of discrepancy between health state valuations of patients and the general public depends on which specific elicitation method is utilized. [Table I about here] [Figure 3 about here] Table II shows the test of Hypothesis 2, stating that on average patients refer to other points than unaffected people (see also Figure 2, Arrow 2). The majority of patients would in no case (42.2%) or unlikely (14.6%) accept an intervention that may improve or with the same probability and to the same extent worsen their situation, while the majority of tinnitus-unaffected controls from the general public would more often do so likely (17.5%) or in any case (25.7%). Both the results of the crosstabulation (Chi²) and an additional analysis of variance not shown in the table (F (1,375) = 51.3, p <.001) underline that this difference is most probably not due to chance variations. [Table II about here] Finally, Table III, Figure 4 and Figure 5 present the results of the repeated measure analysis of covariance for the mediated model, i.e. for Hypotheses 3 and 4 (see also Arrow 3 and 4 in Figure 2). As regards Hypothesis 3, the risk attitude introduced as a covariate (RISK) significantly predicts valuations both overall and within methods (RISK within VAS, TTO and SG, respectively; see Table III). As shown in Figure 4, the largest range can be observed for SG, with a utility score of 0.98 if the risky intervention would be accepted in no case, and 0.65 if the answer was in any case. For TTO, utilities range from 0.86 to 0.72 and follow a linear pattern similar to SG. Regarding VAS, results are not so pronounced and linearly patterned, but it can be seen that risk averse groups generally elicited 10

114 Running head: Health valuation methods and reference points higher values (0.46 and 0.48) than the risk seeking respondents (0.43 and 0.38). Finally coming to Hypothesis 4 (see Arrow 4 in Figure 2), i.e. that the impact of health status and health state valuations is lessened or even offset if risk attitude is adjusted for, results show that indeed this is the case. Most prominently, compared to Table I the simple effect analyses show that significant differences between patients and the general public sample disappear for TTO and SG, and are lessened for VAS. Numerically, it can be seen in Figure 5 that this is most striking for SG, with regard to which the estimated means for patients and controls virtually converge at Likewise, the mean difference is now diminutive for TTO as well (0.81 vs. 0.79), while for VAS, this difference is scaled down only marginally, even thought the F-value has been reduced from (see Table I) to 79.2 in the present analysis (see Table III). [Table III about here] [Figure 4 about here] [Figure 5 about here] Taken together, in line with the mediated model in Figure 2 the effect of being affected vs. unaffected by tinnitus (i.e., HEALTH STATUS) on tinnitus valuations is fully mediated by risk attitude (RISK) as a proxy for reference points) for the elicitation methods TTO and SG, and to a minor extent for VAS. Discussion The present results suggest that health state-specific reference points defined as risk attitudes play an important role for health state valuations. Utility differences between tinnitus patients and control respondents without tinnitus are considerable for all three elicitation methods VAS, TTO and SG, in that patients assign higher values to tinnitus, indicating better health (see also [29] ). However, significance is statistically lessens for VAS, and disappears for TTO and SG, if risk attitude is adjusted for. Since simultaneously, both health status significantly predicted risk attitudes (patients more risk averse than controls) and risk attitude predicted valuations (higher utilities in the risk averse groups), utility differences between patients and the general public can be attributed to different reference 11

115 Running head: Health valuation methods and reference points points given, of course, that it is correct to assume risk attitudes as indicative of, or surrogate to, reference points. As such, risk attitude could be explored as an adjusting variable for raw utility scores. We concede, however, that the risk attitude approach has some difficulties. First, responses may in part reflect understandings of the intervention s effectiveness, disutility associated with the condition if untreated, and any disutility attached to undergoing the procedure itself. Second, and conceptually probably even more important, risk attitude is usually defined when outcomes are numerical data. The approach applied here attempts to measure risk intensity without being able to specify the deviation from the status quo (only equal extent ). However, we think this is the closest one can get to Keeney and Raiffa s [32] definition of risk in the health field if quasi-intervals (e.g., days of illness, as in Stalmeier et al. [34] ) are to be avoided. Third, we assessed reference points with a risk scale that explicitly mentioned the investigated health state, tinnitus. On one hand, it should be stated that persons may be risk seeking in one context and risk averse in another, and that risk attitudes elicited by our item were comparable across subjects because the context was fixed (i.e., tinnitus). On the other hand, as this measurement of risk attitudes is fairly similar to SG, it may be of little surprise to find a strong correlation, even though SG considers risk with respect to length of life, while the risk question used as a proxy to the reference point considers quality of life. However, this kind of measurement does in fact comply with the framework and assumptions of Prospect Theory. Plus, and more importantly, results for TTO resemble those for SG and strike us as much less straight forward. In all, this points to the original interpretation of risk attitude as reference point rather than undue conceptual overlap with health valuations. Finally, TTO and SG are quite similar considering the tradeoff aspect, as reflected in their correlation among each other and with risk attitude. Some limitations of our study warrant discussion. First, the results of the general population were based upon data gathered from a street sample and one has to question the extent to which this might have affected the data. Careful checks were employed to ensure that the patients and the street sample were matched for sex and age to minimize bias. Second, widely used measures of health utilities as SG and TTO were performed in our study. These are direct instruments, involving gambling on a hypothetical medication that may cause perfect health or death (SG), or trading off part of future life reduced time in perfect health (TTO). Indirect methods of obtaining health utilities involve reports of 12

116 Running head: Health valuation methods and reference points current health on a standardized questionnaire such as the parsimonious EQ-5D, the Short Form 6 dimensions, or the Health Utility Index Mark 2 or 3. However, such indirect measures of health utilities are not included in our study. Further research may address comparisons on both direct and indirect measures of health utilities. Also, the limitations of the present study advise that further research is needed. Starting with the investigated health condition, results need to be replicated for other diseases in order to be able to generalize the findings. Also, tinnitus severity as an essentially subjective experience depends crucially on descriptions of patients, which makes it difficult to find a valid description of tinnitus that can be adequately understood and appreciated by the general public. In our study, the general public valued the tinnitus simulation via a recording, and there was no representative sample of sounds and loudness of tinnitus beyond this recording available. In other words, an average description was applied which does not necessarily reflect the entire range of potential tinnitus impairments. Hence, differences in these simulations to the tinnitus suffered by participating patients may also partly explain our findings. Results underpin the importance of Prospect Theory as a descriptive framework for decision analysis (though not all tests of Prospect Theory have shown results that it works as predicted [35] ). Furthermore, the study is a first attempt to measure the reference point that is crucial to eliminate utility differences. Of course, several aspects can influence valuations. To name only one in the context of Prospect Theory, Kahneman and Tversky find that low probabilities are overstated while higher probabilities are understated. Especially in the range close to 1, utilities elicited with SG are biased upwards since people need to overstate the associated probability to express their true preferences [36]. Though loss aversion is said to be mainly responsible for deviating results, this probability weighting could be equally applied as an explanation. It will be necessary for future research to distil each impact variable accurately. However, if further investigations confirm that the explanatory model proposed here bears further conceptual and empirical validity, the question remains whether these results have any consequences 13

117 Running head: Health valuation methods and reference points for medical decision making. Setting priorities for recommendations which medical interventions should be supported is a normative exercise, vaguely related to utility maximization [37]. It is of less value to know how people do act but how they should act to allow a maximization of health in priority setting. Otherwise, priorities are based on cost-effectiveness ratios that apply descriptively determined preferences. An understanding of descriptive decision making is therefore essential an endeavour which Prospect Theory allows for. Utilities should be based on descriptive techniques which state how people do act. Against this background, present prioritization in the health domain should be reconsidered. Ordinal rankings change if measures of effectiveness depend on different reference points. At least some interventions near defined decision thresholds could depending on the misperception of the general public very much be subject to the adjustment procedure. As a result, the necessity of different medical interventions may be misinterpreted. The nature of the reference point is a crucial issue for future analysis if evaluations are supposed to properly reflect effectiveness. Also, this should be elucidated using different elicitation methods. 14

118 Running head: Health valuation methods and reference points Appendix Explanation of tinnitus (as presented* to unaffected study participants): Permanent ear trouble is an increasingly bothering problem for many people. About one in ten in Germany already experienced permanent ear trouble in their life. Please imagine listening to permanent whistling or whooshing, hissing or pounding all day long. Interviews of patients revealed that more than half the participants have had sleeping disorders, and about a third communication, and concentration problems, depressions, and times of desperation, or despondence. Take your time to imagine such a situation. * English translation of original German version 15

119 Running head: Health valuation methods and reference points References 1. Gold MR, Siegel JE, Russell LR, et al., eds. Cost-effectiveness in Health and Medicine. New York: Oxford University Press, Drummond M, Torrance G, Mason J. Cost-effectiveness league tables: more harm than good? Soc Sci Med 1993;37: Boyd N, Sutherland H, Heasman K, et al. Whose utilities for decision analysis? Med Decis Making 1990;10: Dolan P. The effect of experience of illness on health state valuations. J Clin Epidemiol 1996;49: Dolan P. Whose preferences count? Med Decis Making 1999;19: Llewellyn-Thomas H, Sutherland H, et al. Do patients' evaluations of a future health state change when they actually enter that state? Med Care 1993;31: Sackett D, Torrance G. The utility of different health states as perceived by the general public. J Chronic Dis 1978;31: Tarn T, Dix Smith M. Pharmacoeconomic guidelines around the world. ISPOR Connections 2006;10: Torrance G. Measurement of health state utilities for economic appraisal: a review. Journal of Health Economics 1986;5: Llewellyn-Thomas H, Sutherland H, et al. Describing health states: methodologic issues in obtaining values for health states. Med Care 1984;22: Jansen S, Stiggelbout A, Wakker P, et al. Unstable preferences: a shift in valuation or an effect of the elicitation procedure? Med Decis Making 2000;20: Kind P, Dolan P. The effect of past and present illness experience on the valuations of health states. Med Care 1995;33:AS Llewellyn-Thomas HA, Thiel EC, McGreal MJ. Cancer patients' evaluations of their current health states: the influences of expectations, comparisons, actual health status, and mood. Med Decis Making 1992;12: Lenert L, Treadwell J, Schwartz C. Associations between health status and utilities: implications for policy. Med Care 1999;37:

120 Running head: Health valuation methods and reference points 15. Ubel PA, Loewenstein G, Jepson C. Whose quality of life? A commentary exploring discrepancies between health state evaluations of patients and the general public. Qual Life Res 2003;12: Stiggelbout AM, de Vogel-Voogt E. Health state utilities: a framework for studying the gap between the imagined and the real. Value Health 2007;OnlineEarly Article:doi: /j x 17. Legrenzi P, Girotto V, Johnson-Laird PN. Focussing in reasoning and decision making. Cognition 1993;49: Tversky A, Griffin D. Endowment and contrast in jugdments of well-being. In: Argyle M, Schwarz N, Strack F, eds. Subjective Well-Being: An Interdisciplinary Perspective. Oxford: Pergamon, Adang E. A comment on response shift and adaptation in chronically ill patients by Postulart and Adang. Med Decis Making 2001;21: von Neuman J, Morgenstern O. Theory of games and economic behaviour. 3 rd ed. Princeton, N.J.: Princeton University Press, Kahneman D, Tversky A. Prospect theory: an analysis of decision under risk. Econometrica 1979;47: Baron RM, Kenny, DA. The moderator-mediator variable distinction in social psychological research: Conceptual, strategic and statistical considerations. J Pers Soc Psychol 1986;51: Graham J. Tinnitus aurium. Uppsala: Almquist & Wiksells; Feldmann H. Tinnitus: Grundlagen einer rationalen Diagnostik und Therapie. Stuttgart: Georg Thieme Verlag; Goebel G. Fortschritte bei der verhaltensmedizinischen Diagnostik und Behandlung quälender chronischer Ohrgeräusche. Otorhinolaryngol Nova 1995;5: Torrance G. Measurement of health state utilities for economic appraisal. J Health Econ 1986;5: Torrance G, Thomas W, Sackett D. A utility maximization model for evaluation of health care programs. Health Serv Res 1972;7: Torrance GW, Feeny D, Furlong W. Visual analog scales: do they have a role in the measurement of preferences for health states? Med Decis Making 2001;21:

121 Running head: Health valuation methods and reference points 29. Happich M, von Lengerke T. Valuing the health state tinnitus : differences between patients and the general public. Hearing Res 2005;207: Drummond M, O'Brien B, Stoddart G, et al. Methods for the evaluation of health care programmes. New York: Oxford University Press, Verhoef LC, de Haan AF, van Daal WA. Risk attitude in gambles with years of life: empirical support for prospect theory. Med Decis Making 1994;14: Keeney R, Raiffa H. Decisions with multiple objectives: preferences and value tradeoffs. New York: Wiley & Sons, Levine G. A guide to SPSS for analysis of variance. Hillsdale: Erlbaum, Stalmeier PF, Bezembinder TG. The discrepancy between risky and riskless utilities: a matter of framing? Med Decis Making 1999;19: Feeny D, Eng K. A test of prospect theory. Int J Technol Assess Health Care 2005;21: Bleichrodt H. Probability weighting in choice under risk: an empirical test. J Risk Uncertainty 2001;23: Garber A, Phelps C. Economic foundations of cost-effectiveness analysis. J Health Econ 1997;16:

122 Running head: Health valuation methods and reference points Table I: Valuations of tinnitus by between-subject factor HEALTH STATUS (tinnitus patients vs. controls without tinnitus) and within-subject factor METHOD (elicitation methods)* Source of variation** SS DF MS F p Tests of Between-Subjects Effects HEALTH STATUS <.001 Error Tests involving Within-Subject Effect METHOD <.001 METHOD * HEALTH STATUS <.001 Error Simple Effects of HEALTH STATUS within values of METHOD HEALTH STATUS within VAS <.001 Error HEALTH STATUS within TTO Error HEALTH STATUS within SG <.001 Error * Repeated measure analysis of variance ** SS: sum of squares; DF: degrees of freedom; MS: mean squares 19

123 Running head: Health valuation methods and reference points Table II: Association of health status (tinnitus patients vs. controls without tinnitus) and risk attitude* RISK risk attitude HEALTH in no case unlikely maybe likely in any case total STATUS patients N row % 42.2% 14.6% 26.7% 8.7% 7.8% 100% controls N row % 17.0% 14.1% 25.7% 17.5% 25.7% 100% total N row % 29.6% 14.3% 26.2% 13.1% 16.7% 100% * Chi² (4,412) = 48.1, p <

124 Running head: Health valuation methods and reference points Table III: Valuations of tinnitus by between-subject factor HEALTH STATUS (tinnitus patients vs. controls without tinnitus), within-subject factor METHOD (elicitation methods), and RISK (risk attitude as a proxy for reference point) as covariate* Source of variation** SS DF MS F p Tests of Between-Subjects Effects RISK (covariate) <.001 HEALTH STATUS <.001 Error Tests involving Within-Subject Effect METHOD <.001 METHOD * HEALTH STATUS <.001 Error Simple Effects of HEALTH STATUS within values of METHOD RISK (covariate) within VAS <.001 HEALTH STATUS within VAS <.001 Error RISK (covariate) within TTO <.001 HEALTH STATUS within TTO Error RISK (covariate) within SG <.001 HEALTH STATUS within SG Error * Repeated measure analysis of covariance ** SS: sum of squares; DF: degrees of freedom; MS: mean squares 21

125 Running head: Health valuation methods and reference points Figure 1: Utility differences depending on reference point Situation (a) (dotted arrow): Utility differences (a) between health with and without disorder are substantial due to loss aversion if the reference point reflects health without disorder. Situation (b) (solid arrow): Utility differences (b) between health with and without disorder are small if the individual reference point reflects health with disorder. Utility of health Value of health Gain domain (b) Gain domain Reference Point Reference point Health Health Loss domain (a) Loss domain 22

126 Running head: Health valuation methods and reference points Figure 2: Mediated model of health status and health state valuation Reference point 2 (Risk attitude) 3 Health status Independent Variable 1 4 Mediating Variable Health state valuation Dependent Variable 23

127 Running head: Health valuation methods and reference points Figure 3: Utility differences depending on health status (tinnitus patients vs. controls without tinnitus), unadjusted for risk attitude 24

128 Running head: Health valuation methods and reference points Figure 4: Utility differences depending on risk attitude, adjusted for health status (tinnitus patients vs. controls without tinnitus) 25

129 Running head: Health valuation methods and reference points Figure 5: Utility differences depending on health status (tinnitus patients vs. controls without tinnitus), adjusted for risk attitude 26

Gesundheitsökonomische Evaluation mit Kosten-Nutzenwert-Betrachtung an klinischen Beispielen

Gesundheitsökonomische Evaluation mit Kosten-Nutzenwert-Betrachtung an klinischen Beispielen Querschnittbereich Gesundheitsökonomie, Gesundheitssystem, öffentliche Gesundheitspflege WS 2013/2014 Gesundheitsökonomische Evaluation mit Kosten-Nutzenwert-Betrachtung an klinischen Beispielen Thomas

Mehr

Patient Reported Outcomes in der Qualitätssicherung

Patient Reported Outcomes in der Qualitätssicherung 7. Qualitätssicherungskonferenz des Gemeinsamen Bundesausschuss Patient Reported Outcomes in der Qualitätssicherung Dr. Konstanze Blatt Institut für Qualitätssicherung und Transparenz im Gesundheitswesen

Mehr

Gütekriterien für evaluative Messinstrumente in der Rehabilitation

Gütekriterien für evaluative Messinstrumente in der Rehabilitation 12. Rehabilitationswissenschaftliches Kolloquium Rehabilitation im Gesundheitssystem Bad Kreuznach, 10. bis 12. März 2003 Gütekriterien für evaluative Messinstrumente in der Rehabilitation Dipl.-Psych.

Mehr

Messung von Lebensqualität: So einfach wie möglich, so differenziert wie nötig

Messung von Lebensqualität: So einfach wie möglich, so differenziert wie nötig IQWiG-Herbst-Symposium Köln, 29.-30. November 2013 Messung von Lebensqualität: So einfach wie möglich, so differenziert wie nötig Thomas Kohlmann Institut für Community Medicine Universität Greifswald

Mehr

Klinische Forschung. Klinische Forschung. Effectiveness Gap. Versorgungsforschung und evidenzbasierte Medizin. Conclusion

Klinische Forschung. Klinische Forschung. Effectiveness Gap. Versorgungsforschung und evidenzbasierte Medizin. Conclusion Versorgungsforschung und evidenzbasierte Medizin Klinische Forschung 00qm\univkli\klifo2a.cdr DFG Denkschrift 1999 Aktuelles Konzept 2006 Workshop der PaulMartiniStiftung Methoden der Versorgungsforschung

Mehr

Gesundheitsökonomische Evaluationen in der Versorgungsforschung. Dr. Klaus Kaier 8. März 2013

Gesundheitsökonomische Evaluationen in der Versorgungsforschung. Dr. Klaus Kaier 8. März 2013 Gesundheitsökonomische Evaluationen in der Versorgungsforschung Dr. Klaus Kaier 8. März 2013 Das Leben ist das höchste Gut und lässt sich nicht in Geld aufwiegen 2 8. März 2013 Gesundheitsökonomische Evaluationen

Mehr

Lebensqualität: Stellenwert für gesundheitsökonomische Betrachtungen CURAVIVA-Impulstagung, Bern, 27.10.2010

Lebensqualität: Stellenwert für gesundheitsökonomische Betrachtungen CURAVIVA-Impulstagung, Bern, 27.10.2010 Lebensqualität: Stellenwert für gesundheitsökonomische Betrachtungen CURAVIVA-Impulstagung, Bern, 27.10.2010 Dr. med. Klaus Eichler, MPH eich@zhaw.ch Building Competence. Crossing Borders. Inhalte des

Mehr

Dr. Heidemarie Keller

Dr. Heidemarie Keller Reliabilität und Validität der deutschen Version der OPTION Scale Dr. Heidemarie Keller Abteilung für Allgemeinmedizin, Präventive und Rehabilitative Medizin Philipps-Universität Marburg EbM & Individualisierte

Mehr

Pflegebezogene Kompetenzen und Gesundheitsbezogene Lebensqualität von Dualstudierenden eines grundständigen Pflegestudienganges

Pflegebezogene Kompetenzen und Gesundheitsbezogene Lebensqualität von Dualstudierenden eines grundständigen Pflegestudienganges Pflegebezogene Kompetenzen und Gesundheitsbezogene Lebensqualität von Dualstudierenden eines grundständigen Pflegestudienganges 3-Länderkonferenz Pflege und Pflegewissenschaft 21.9.2015 Dipl.-Psych. Christoph

Mehr

Zufriedenheitsforschung

Zufriedenheitsforschung Zufriedenheitsforschung Seminarvortrag im Rahmen des Seminars: Statistische Herausforderungen sozialwissenschaftlicher Studien (Vorbereitungsmaterial) Joachim Copony Betreuerin: Andrea Wiencierz Institut

Mehr

Patient-reported outcomes welche Indikatoren machen Sinn. Versorgung psychischer Erkrankungen? Dr. Ulrich Reininghaus

Patient-reported outcomes welche Indikatoren machen Sinn. Versorgung psychischer Erkrankungen? Dr. Ulrich Reininghaus Patient-reported outcomes welche Indikatoren machen Sinn in der Qualitätssicherung der Versorgung psychischer Erkrankungen? Dr. Ulrich Reininghaus Patient-Reported Outcomes (PROs) PROs: vom Patienten berichtete

Mehr

Reha-Leistungen zur Förderung der Erwerbsfähigkeit - Prädiktoren einer erfolgreichen medizinischen Rehabilitation

Reha-Leistungen zur Förderung der Erwerbsfähigkeit - Prädiktoren einer erfolgreichen medizinischen Rehabilitation Reha-Leistungen zur Förderung der Erwerbsfähigkeit - Prädiktoren einer erfolgreichen medizinischen Rehabilitation Mag. Dr. Karin Meng Institut für Psychotherapie und Medizinische Psychologie, AB Rehabilitationswissenschaften,

Mehr

Gesundheitsökonomische Forschung auf dem Gebiet der Depression: Status Quo und Perspektiven

Gesundheitsökonomische Forschung auf dem Gebiet der Depression: Status Quo und Perspektiven Gesundheitsökonomische Forschung auf dem Gebiet der Depression: Status Quo und Perspektiven Symposium 10 Jahre Depressionsforschung im Kompetenznetz Depression Suizidalität München, 5. November 2009 Prof.

Mehr

Personalisierte Medizin Ende der Solidarität? Heiner Raspe Seniorprofessur für Bevölkerungsmedizin

Personalisierte Medizin Ende der Solidarität? Heiner Raspe Seniorprofessur für Bevölkerungsmedizin Personalisierte Medizin Ende der Solidarität? Heiner Raspe Seniorprofessur für Bevölkerungsmedizin Berlin - Deutscher Ethikrat 24.Mai 2012 Kritische Anmerkungen zur PersoMed Unter falscher Flagge Kritische

Mehr

Regionale Unterschiede in der Lebensqualität von DMP-Teilnehmern am Beispiel von 4 Bundesländern

Regionale Unterschiede in der Lebensqualität von DMP-Teilnehmern am Beispiel von 4 Bundesländern Regionale Unterschiede in der Lebensqualität von DMP-Teilnehmern am Beispiel von 4 Bundesländern Kathleen Köhn, Referat VI 3 Bundesversicherungsamt (BVA) Übersicht 1. Einleitung 2. Methodik 3. Ergebnisse

Mehr

Effektivität einer Intervention zur bedarfsgerechten Patienteninformation bei Patienten mit Depression - wer profitiert?

Effektivität einer Intervention zur bedarfsgerechten Patienteninformation bei Patienten mit Depression - wer profitiert? Effektivität einer Intervention zur bedarfsgerechten Patienteninformation bei Patienten mit Depression - wer profitiert? Manuela Glattacker, Katja Heyduck & Cornelia Meffert Institut für Qualitätsmanagement

Mehr

Universität Ulm. Fakultät für Mathematik und Wirtschaftswissenschaften. ulm university Universität I

Universität Ulm. Fakultät für Mathematik und Wirtschaftswissenschaften. ulm university Universität I Universität Ulm Fakultät für Mathematik und Wirtschaftswissenschaften ulm university Universität I uulm Berichterstattung zur Audit Firm Governance in Deutschland - Eine empirische Analyse - Dissertation

Mehr

Internetausgabe des Tagungsbandes. 12. Rehabilitationswissenschaftlichen Kolloquium

Internetausgabe des Tagungsbandes. 12. Rehabilitationswissenschaftlichen Kolloquium Internetausgabe des Tagungsbandes zum 12. Rehabilitationswissenschaftlichen Kolloquium erschienen im März 2003 innerhalb der DRV-Schriften als Band 40 Herausgeber Verband Deutscher Rentenversicherungsträger,

Mehr

Lebenserwartung und Lebensqualität als gemeinsamer Nenner?

Lebenserwartung und Lebensqualität als gemeinsamer Nenner? Lebenserwartung und Lebensqualität als gemeinsamer Nenner? QALYs als Ansatz zur Bestimmung des Nutzens einer medizinischen Leistung Florian Gutzwiller Tagung QALYs und Schwellenwerte: nützliche Konzepte

Mehr

1.3 Zusammenfassung und Ausblick 26. 2 Medizinische Grundlagen des Diabetes mellitus 27

1.3 Zusammenfassung und Ausblick 26. 2 Medizinische Grundlagen des Diabetes mellitus 27 Inhaltsverzeichnis Inhaltsverzeichnis I Abbildungsverzeichnis VIII Tabellenverzeichnis IX Abkürzungsverzeichnis XI Zusammenfassung 1 Abstract 3 Einleitung 5 I. Stand der Forschung 9 1 Depressive Störungen

Mehr

Auswertung mit dem Statistikprogramm SPSS: 30.11.05

Auswertung mit dem Statistikprogramm SPSS: 30.11.05 Auswertung mit dem Statistikprogramm SPSS: 30.11.05 Seite 1 Einführung SPSS Was ist eine Fragestellung? Beispiel Welche statistische Prozedur gehört zu welcher Hypothese? Statistische Berechnungen mit

Mehr

Modul G.1 WS 07/08: Statistik 17.01.2008 1. Die Korrelation ist ein standardisiertes Maß für den linearen Zusammenhangzwischen zwei Variablen.

Modul G.1 WS 07/08: Statistik 17.01.2008 1. Die Korrelation ist ein standardisiertes Maß für den linearen Zusammenhangzwischen zwei Variablen. Modul G.1 WS 07/08: Statistik 17.01.2008 1 Wiederholung Kovarianz und Korrelation Kovarianz = Maß für den linearen Zusammenhang zwischen zwei Variablen x und y Korrelation Die Korrelation ist ein standardisiertes

Mehr

1. Einleitung. 1.1. Ausgangssituation

1. Einleitung. 1.1. Ausgangssituation 1. Einleitung In der vorliegenden Arbeit wird untersucht, welche Faktoren den erfolgreichen Ausgang eines Supply-Chain-Projektes zwischen zwei Projektpartnern beeinflussen. Dazu werden zum einen mögliche

Mehr

1.1 Studientitel: XY 1.2 Studienleiter: XY 1.3 Medizinischer Hintergrund

1.1 Studientitel: XY 1.2 Studienleiter: XY 1.3 Medizinischer Hintergrund 1.1 Studientitel: XY 1.2 Studienleiter: XY 1.3 Medizinischer Hintergrund Patienten, welche unter chronischer Herzinsuffizienz leiden erleben häufig Rückfälle nach einem klinischen Aufenthalt. Die Ursache

Mehr

Was kostet MS? Ergebnisse einer COI-Studie. MS chronische Erkrankung Behinderung und Verlust der Selbständigkeit

Was kostet MS? Ergebnisse einer COI-Studie. MS chronische Erkrankung Behinderung und Verlust der Selbständigkeit Institut für Pharmaökonomische IPF Forschung Volkswirtschaftliche Bedeutung der multiplen Sklerose Kosten und Nutzen eines innovativen Arzneimittels Mag. Christine Brennig 25. Mai 2005 Agenda Was kostet

Mehr

Rauchen bis kurz vor Bekanntwerden einer Schwangerschaft: Physiologische Beeinträchtigung im Kindergartenalter?

Rauchen bis kurz vor Bekanntwerden einer Schwangerschaft: Physiologische Beeinträchtigung im Kindergartenalter? Rauchen bis kurz vor Bekanntwerden einer Schwangerschaft: Physiologische Beeinträchtigung im Kindergartenalter? Marc Jarczok, Sven Schneider, Joachim E. Fischer, Freia De Bock 1 Mannheimer Institut für

Mehr

Intrinsisch motivierte Mitarbeiter als Erfolgsfaktor für das Ideenmanagement: Eine empirische Untersuchung

Intrinsisch motivierte Mitarbeiter als Erfolgsfaktor für das Ideenmanagement: Eine empirische Untersuchung Intrinsisch motivierte Mitarbeiter als Erfolgsfaktor für das Ideenmanagement: Eine empirische Untersuchung Bearbeitet von Martina Sümnig Erstauflage 2015. Taschenbuch. 176 S. Paperback ISBN 978 3 95485

Mehr

Alle WGKT-Empfehlungen können unter www.wgkt.de eingesehen und heruntergeladen werden.

Alle WGKT-Empfehlungen können unter www.wgkt.de eingesehen und heruntergeladen werden. WGKT-Empfehlung Betriebswirtschaftliche Kennzahlen von Krankenhäusern Stand: 05.11.2009 Arbeitskreismitglieder: Prof. Dr. K. Lennerts (Leitung), Karlsruhe; Prof. Dr. C. Hartung, Hannover; Dr. T. Förstemann,

Mehr

Zur Wirksamkeit von Beratungsangeboten bei Studierenden

Zur Wirksamkeit von Beratungsangeboten bei Studierenden Katrin Lohmann und Burkhard Gusy Zur Wirksamkeit von Beratungsangeboten bei Studierenden Hintergrund Studierende sind im Verlauf ihres Studiums einer Vielzahl von Anforderungen ausgesetzt. Diese ergeben

Mehr

Risikomanagement für IT-Projekte: Vergleich von Risiken und Methoden

Risikomanagement für IT-Projekte: Vergleich von Risiken und Methoden Sperrvermerk Risikomanagement für IT-Projekte: Vergleich von Risiken und Methoden Bachelorarbeit Zur Erlangung des akademischen Grades Bachelor of Science (B.Sc.) im Studiengang Wirtschaftswissenschaft

Mehr

Rehabilitationspflege findet überall statt

Rehabilitationspflege findet überall statt Rehabilitationspflege findet überall statt Rehabilitationspflege mehr als Wiederherstellung 25. März 2015, KKL Luzern Susanne Suter-Riederer MScN, RN, Cilly Valär, RN, Prof. Dr. Lorenz Imhof, RN, PhD 2

Mehr

"Plastische Chirurgie - eine reine Erfahrungsdisziplin?"

Plastische Chirurgie - eine reine Erfahrungsdisziplin? "Plastische Chirurgie - eine reine Erfahrungsdisziplin?" RE Horch, MG Jeschke, J Kopp, AD Bach Abteilung für Plastische und Handchirurgie Leiter Prof. Dr. R.E. Horch Universitätsklinik Erlangen Einleitung

Mehr

Das Überleitungsmanagement der postoperativen Akutschmerztherapie von Fraktur-Patienten in die ambulante Weiterbehandlung

Das Überleitungsmanagement der postoperativen Akutschmerztherapie von Fraktur-Patienten in die ambulante Weiterbehandlung Das Überleitungsmanagement der postoperativen Akutschmerztherapie von Fraktur-Patienten in die ambulante Weiterbehandlung Christian J. P. Simanski 1, Carolin Bruns 2, Rolf Lefering 2, Edmund A.M. Neugebauer

Mehr

Messen im medizinischen Kontext II: Expositionsmessung

Messen im medizinischen Kontext II: Expositionsmessung Messen im medizinischen Kontext II: Expositionsmessung Bachelor-Seminar Messen und Statistik Institut für Statistik LMU Daniel Krklec Daniel.Krklec@campus.lmu.de 16. Juni 2009 Inhaltsverzeichnis 1 Begriffsklärung

Mehr

Eine Studie was ist das? Grundlagen klinischer Studien

Eine Studie was ist das? Grundlagen klinischer Studien Eine Studie was ist das? Grundlagen klinischer Studien Grundlagen klinischer Studien Eine Studie ist eine systematische Sammlung von Daten, die dazu dient, eine oder mehrere Fragen zu beantworten. Eine

Mehr

Krank zur Uni Präsentismus bei Studierenden

Krank zur Uni Präsentismus bei Studierenden Katharina Töpritz, Burkhard Gusy, Katrin Lohmann, Franziska Wörfel & Hannah Abt Krank zur Uni Präsentismus bei Studierenden Hintergrund Präsentismus ist ein Konstrukt aus der Arbeitswelt und beschreibt

Mehr

Die Sicht der EMEA. für Zulassungs-, Therapie- und. Berlin-Brandenburgische Akademie der

Die Sicht der EMEA. für Zulassungs-, Therapie- und. Berlin-Brandenburgische Akademie der Lebensqualität und Patientennutzen Die Sicht der EMEA PMS-Workshop: Lebensqualität als Kriterium für Zulassungs-, Therapie- und Erstattungsentscheidungen. Berlin-Brandenburgische Akademie der Wissenschaften

Mehr

IT-basierte Erstellung von Nachhaltigkeitsberichten. Diplomarbeit

IT-basierte Erstellung von Nachhaltigkeitsberichten. Diplomarbeit IT-basierte Erstellung von Nachhaltigkeitsberichten Diplomarbeit zur Erlangung des Grades eines Diplom-Ökonomen der Wirtschaftswissenschaftlichen Fakultät der Leibniz Universität Hannover vorgelegt von

Mehr

Kostenreduktion durch Prävention?

Kostenreduktion durch Prävention? Gesundheitsökonomische Aspekte der Prävention: Kostenreduktion durch Prävention? Nadja Chernyak, Andrea Icks Jahrestagung DGSMP September 2012 Agenda Spart Prävention Kosten? Ist Prävention ökonomisch

Mehr

Ergebnisqualität in der Versorgungsforschung: Von der individuellen Bewertung einer Therapie bis zum fairen Einrichtungsvergleich

Ergebnisqualität in der Versorgungsforschung: Von der individuellen Bewertung einer Therapie bis zum fairen Einrichtungsvergleich Mitglied der Ergebnisqualität in der Versorgungsforschung: Von der individuellen Bewertung einer Therapie bis zum fairen Einrichtungsvergleich Deutscher Kongress für Versorgungsforschung 24.10.2013 Röhrig

Mehr

Offenlegung potentieller Interessenkonflikte

Offenlegung potentieller Interessenkonflikte Offenlegung potentieller Interessenkonflikte Anneke Ullrich 1. Anstellungsverhältnis oder Führungsposition Wissenschaftliche Mitarbeiterin im Universitätsklinikum Hamburg-Eppendorf (Institut und Poliklinik

Mehr

Analyse von Querschnittsdaten. Regression mit Dummy-Variablen

Analyse von Querschnittsdaten. Regression mit Dummy-Variablen Analyse von Querschnittsdaten Regression mit Dummy-Variablen Warum geht es in den folgenden Sitzungen? Datum Vorlesung 9.0.05 Einführung 26.0.05 Beispiele 02..05 Forschungsdesigns & Datenstrukturen 09..05

Mehr

Versorgungsforschung in Deutschland: Entwicklung und Erwartungen

Versorgungsforschung in Deutschland: Entwicklung und Erwartungen Versorgungsforschung in Deutschland: Entwicklung und Erwartungen Univ.-Prof. Dr. Holger Pfaff Auftaktveranstaltung BMBF Förderschwerpunkt Studien in der Versorgungsforschung, Kaiserin-Friedrich Haus Berlin

Mehr

Die Quantitative und Qualitative Sozialforschung unterscheiden sich bei signifikanten Punkten wie das Forschungsverständnis, der Ausgangspunkt oder

Die Quantitative und Qualitative Sozialforschung unterscheiden sich bei signifikanten Punkten wie das Forschungsverständnis, der Ausgangspunkt oder 1 2 3 Die Quantitative und Qualitative Sozialforschung unterscheiden sich bei signifikanten Punkten wie das Forschungsverständnis, der Ausgangspunkt oder die Forschungsziele. Ein erstes Unterscheidungsmerkmal

Mehr

Reputation von Fußball-Clubs Entwicklung und empirische Überprüfung eines Messkonzepts auf Basis der Reputation Quotient (RQ)

Reputation von Fußball-Clubs Entwicklung und empirische Überprüfung eines Messkonzepts auf Basis der Reputation Quotient (RQ) Klaus-Peter Wiedmann Frank Bachmann Kai Lafrenz Reputation von Fußball-Clubs Entwicklung und empirische Überprüfung eines Messkonzepts auf Basis der Reputation Quotient (RQ) Prof. Dr. Klaus-Peter Wiedmann

Mehr

Compliance bei der Therapie chronischer Krankheiten am Beispiel der Heimbeatmungstherapie

Compliance bei der Therapie chronischer Krankheiten am Beispiel der Heimbeatmungstherapie Diplomarbeit von Dipl.-Ökonom Dan Litvan, vorgelegt am 27. August 2008, XOPA Compliance bei der Therapie chronischer Krankheiten am Beispiel der Heimbeatmungstherapie A U S Z U G 6. Zusammenfassung und

Mehr

Holger Jegust. 07. März 2009 Fachhochschule Osnabrück

Holger Jegust. 07. März 2009 Fachhochschule Osnabrück Welchen Einfluss nimmt das Vergütungssystem auf die Entwicklung in einem Krankenhaus, medizinische Innovationen einzuführen? 07. März 2009 Fachhochschule Osnabrück Gliederung 1. Einführung 1.1 Vorstellung

Mehr

E. Farin-Glattacker. Lebensqualität, Patientenzufriedenheit und andere patient reported outcomes : Der Weg zum richtigen Instrument

E. Farin-Glattacker. Lebensqualität, Patientenzufriedenheit und andere patient reported outcomes : Der Weg zum richtigen Instrument E. Farin-Glattacker Lebensqualität, Patientenzufriedenheit und andere patient reported outcomes : Der Weg zum richtigen Instrument Drei Fragen 1. Was sind patient-reported outcomes (PROs)? Und warum sind

Mehr

Interdiziplinäre Fortschritte der Gesundheitsforschung

Interdiziplinäre Fortschritte der Gesundheitsforschung Interdiziplinäre Fortschritte der Gesundheitsforschung Interdiziplinäre Fortschritte der Gesundheitsforschung Herausgegeben von PD Dr. Anja Hilbert & PD Dr. Tanja Krones Band 1 Diskriminierung von übergewichtigen

Mehr

Rehabilitationsbezogene Behandlungskonzepte von Patienten mit chronischem Rückenschmerz und Depression

Rehabilitationsbezogene Behandlungskonzepte von Patienten mit chronischem Rückenschmerz und Depression Rehabilitationsbezogene Behandlungskonzepte von Patienten mit chronischem und Depression Heyduck, K., Glattacker, M. & Meffert, C. Einleitung Die Relevanz subjektiver Krankheits- und medikamentöser Behandlungskonzepte

Mehr

Herzensbildung. Gesundheitsförderung zur Stärkung von Gesundheitskompetenzen für kardiologische Patientinnen und Patienten

Herzensbildung. Gesundheitsförderung zur Stärkung von Gesundheitskompetenzen für kardiologische Patientinnen und Patienten GESFÖ Herzensbildung Gesundheitsförderung zur Stärkung von Gesundheitskompetenzen für kardiologische Patientinnen und Patienten Seite 1 GESFÖ Der gesellschaftliche Wandel der letzten Jahre bzw. Jahrzehnte

Mehr

0 Einführung: Was ist Statistik

0 Einführung: Was ist Statistik 0 Einführung: Was ist Statistik 1 Datenerhebung und Messung Die Messung Skalenniveaus 2 Univariate deskriptive Statistik 3 Multivariate Statistik 4 Regression 5 Ergänzungen Grundbegriffe Statistische Einheit,

Mehr

Marktliquidität von Aktien

Marktliquidität von Aktien Marktliquidität von Aktien Inauguraldissertation zur Erlangung der Würde eines Doctor rerum oeconomicarum der Wirtschafts- und Sozialwissenschaftlichen Fakultät der Universität Bern Lukas Roth Die Fakultät

Mehr

Aufgaben psychologischer Diagnostik aus Sicht der Rentenversicherung

Aufgaben psychologischer Diagnostik aus Sicht der Rentenversicherung 24. Jahrestagung des AK Klinische Psychologie in der Rehabilitation Aufgaben psychologischer Diagnostik aus Sicht der Rentenversicherung Dr. Ulrike Worringen Deutsche Rentenversicherung Bund Abteilung

Mehr

1. Einleitung. 1.1. Hintergrund und Fragestellung

1. Einleitung. 1.1. Hintergrund und Fragestellung 1. Einleitung 1.1. Hintergrund und Fragestellung Das Ziel dieser Arbeit ist die Ermittlung der Behandlungskosten und der Lebensqualität von Patienten mit peripherer arterieller Verschlusskrankheit (PAVK)

Mehr

Fragebogen- und Testkonstruktion in der Online-Forschung

Fragebogen- und Testkonstruktion in der Online-Forschung Fragebogen- und Testkonstruktion in der Online-Forschung Dr. Meinald T. Thielsch 13. Juni 2008 Globalpark Innovations 2008 Diagnostisches Problem der (Online-)Forschung Es werden in vielen Arbeiten der

Mehr

Disease Management Programme und Rehabilitation eine ökonomische Perspektive

Disease Management Programme und Rehabilitation eine ökonomische Perspektive Ausschuss Rehabilitation der GVG Disease Management Programme und Rehabilitation eine ökonomische Perspektive Prof. Dr. rer.pol. Jürgen Wasem Sprecher der AG Reha-Ökonomie im Förderschwerpunkt Rehabilitationswissenschaften

Mehr

Gesundheitsmonitor Feld- und Methodenbericht - Welle 21 - Bevölkerungsbefragung. GfK Health Care Im Auftrag der Bertelsmann Stiftung

Gesundheitsmonitor Feld- und Methodenbericht - Welle 21 - Bevölkerungsbefragung. GfK Health Care Im Auftrag der Bertelsmann Stiftung Gesundheitsmonitor Feld- und Methodenbericht - Welle 21 - Bevölkerungsbefragung GfK Health Care Im Auftrag der Bertelsmann Stiftung Projektleitung: Holger Paulsen Telefon: +49 (0)911 395 4540 Telefax:

Mehr

Analyse von Tabellen und kategorialen Daten

Analyse von Tabellen und kategorialen Daten Hans-Jürgen Andreß Jacques A. Hagenaars Steffen Kühnel Analyse von Tabellen und kategorialen Daten Log-lineare Modelle, latente Klassenanalyse, logistische Regression und GSK-Ansatz Mit 32 Abbildungen

Mehr

Korrelation - Regression. Berghold, IMI

Korrelation - Regression. Berghold, IMI Korrelation - Regression Zusammenhang zwischen Variablen Bivariate Datenanalyse - Zusammenhang zwischen 2 stetigen Variablen Korrelation Einfaches lineares Regressionsmodell 1. Schritt: Erstellung eines

Mehr

Lexikon Gesundheitsmanagement

Lexikon Gesundheitsmanagement NWB Studium Betriebswirtschaft Lexikon Gesundheitsmanagement Bearbeitet von Prof. Dr. Heiko Burchert 1. Auflage 2011 2011. Buch. XVII, 290 S. ISBN 978 3 482 63371 3 Gewicht: 520 g Weitere Fachgebiete >

Mehr

Deskriptive Statistik

Deskriptive Statistik Deskriptive Statistik [descriptive statistics] Ziel der deskriptiven (beschreibenden) Statistik einschließlich der explorativen Datenanalyse [exploratory data analysis] ist zunächst die übersichtliche

Mehr

Kurortmedizin: eine Public Health Strategie? Prof. Dr. Alarcos Cieza

Kurortmedizin: eine Public Health Strategie? Prof. Dr. Alarcos Cieza Kurortmedizin: eine Public Health Strategie? Prof. Dr. Alarcos Cieza Wie würden Sie in einem Wort den Grundgedanken der Kurortmedizin beschreiben? Gesundheit Ziele Welche sind die Berührungspunkte zwischen

Mehr

Patientenzufriedenheit

Patientenzufriedenheit Patientenzufriedenheit Ergebnisse einer repräsentativen Studie in der ambulanten ärztlichen Versorgung Berlin, den 16. 06. 2010 Dr. Frank Verheyen Ausgangslage g g Einblicke in die Bedürfnisse und Einstellungen

Mehr

Prof. Dr. H. Rommelfanger: Entscheidungstheorie, Kapitel 3 38

Prof. Dr. H. Rommelfanger: Entscheidungstheorie, Kapitel 3 38 Prof. Dr. H. Rommelfanger: Entscheidungstheorie, Kapitel 3 38 Offene Fragen Warum ist ein ET bereit, für eine Feuerversicherung mit einer Versicherungshöhe von 1 Million und einer Jahreseintrittswahrscheinlichkeit

Mehr

1,11 1,12 1,13 1,14 1,15 1,16 1,17 1,17 1,17 1,18

1,11 1,12 1,13 1,14 1,15 1,16 1,17 1,17 1,17 1,18 3. Deskriptive Statistik Ziel der deskriptiven (beschreibenden) Statistik (explorativen Datenanalyse) ist die übersichtliche Darstellung der wesentlichen in den erhobenen Daten enthaltene Informationen

Mehr

Messung von Veränderungen. Dr. Julia Kneer Universität des Saarlandes

Messung von Veränderungen. Dr. Julia Kneer Universität des Saarlandes von Veränderungen Dr. Julia Kneer Universität des Saarlandes Veränderungsmessung Veränderungsmessung kennzeichnet ein Teilgebiet der Methodenlehre, das direkt mit grundlegenden Fragestellungen der Psychologie

Mehr

Der Weg zurück in den ersten Arbeitsmarkt

Der Weg zurück in den ersten Arbeitsmarkt Forschungsbereich Klinische und Soziale Psychiatrie Prof. Dr. med. Dipl.-Psych. Wulf Rössler www.puk-west.unizh.ch/de/aktuell/index.shtml Supported Employment Das Modell Supported Employment Die Studie

Mehr

Einstellungen zu Gesundheitssystemen und Ungleichheiten in der Inanspruchnahme von Gesundheitsleistungen im internationalen Vergleich

Einstellungen zu Gesundheitssystemen und Ungleichheiten in der Inanspruchnahme von Gesundheitsleistungen im internationalen Vergleich Monika Mischke, Claus Wendt Einstellungen zu Gesundheitssystemen und Ungleichheiten in der Inanspruchnahme von Gesundheitsleistungen im internationalen Vergleich Literatur / Quellen: Reibling, Nadine und

Mehr

Analyse kritischer Erfolgsfaktoren für Enterprise Social Networking Anwendungen. Bachelorarbeit

Analyse kritischer Erfolgsfaktoren für Enterprise Social Networking Anwendungen. Bachelorarbeit Analyse kritischer Erfolgsfaktoren für Enterprise Social Networking Anwendungen Bachelorarbeit zur Erlangung des akademischen Grades Bachelor of Science (B.Sc.) im Studiengang Wirtschaftswissenschaften

Mehr

Hat der Patient eine Depression? Dr. Med (UK) Hans-Eric Usher MBBS (Lond.) MRCGP

Hat der Patient eine Depression? Dr. Med (UK) Hans-Eric Usher MBBS (Lond.) MRCGP Hat der Patient eine Depression? { Dr. Med (UK) Hans-Eric Usher MBBS (Lond.) MRCGP Hintergrund und Auswirkung von Depression Screening Diagnostische Instrumente Bewertung der diagnostischen Instrumente

Mehr

Grundlagen der evidenzbasierten neurologischen Rehabilitation

Grundlagen der evidenzbasierten neurologischen Rehabilitation Grundlagen der evidenzbasierten neurologischen Rehabilitation Prof. Dr. phil. Helmut Hildebrandt Klinikum Bremen-Ost, Neurologie Universität Oldenburg, Psychologie email: helmut.hildebrandt@uni-oldenburg.de

Mehr

Data Mining als Arbeitsprozess

Data Mining als Arbeitsprozess Data Mining als Arbeitsprozess Hagen Knaf Studiengang Angewandte Mathematik Hochschule RheinMain 31. Dezember 2015 In Unternehmen werden umfangreichere Aktivitäten oder Projekte im Bereich des Data Mining

Mehr

Begutachtungsleitfaden für psychosomatische Erkrankungen in der privaten BU Versicherung

Begutachtungsleitfaden für psychosomatische Erkrankungen in der privaten BU Versicherung Begutachtungsleitfaden für psychosomatische Erkrankungen in der privaten BU Versicherung Dr. Michael Svitak Zentrum für verhaltenstherapeutische Medizin Klinikum Staffelstein Handbuch zum Leitfaden 2005

Mehr

http://www.mig.tu-berlin.de

http://www.mig.tu-berlin.de Management im Gesundheitswesen IV (Evaluation) Messung von direkten und indirekten Kosten, Studientypen der Kostenanalyse Dipl.-Vw. Tom Stargardt Messung von Kosten Kosten = Preisvektor X Mengenvektor

Mehr

Multiple Regression. Ziel: Vorhersage der Werte einer Variable (Kriterium) bei Kenntnis der Werte von zwei oder mehr anderen Variablen (Prädiktoren)

Multiple Regression. Ziel: Vorhersage der Werte einer Variable (Kriterium) bei Kenntnis der Werte von zwei oder mehr anderen Variablen (Prädiktoren) Multiple Regression 1 Was ist multiple lineare Regression? Ziel: Vorhersage der Werte einer Variable (Kriterium) bei Kenntnis der Werte von zwei oder mehr anderen Variablen (Prädiktoren) Annahme: Der Zusammenhang

Mehr

vom 15. März 2012 Der Gemeinsame Bundesausschuss hat in seiner Sitzung am 15. März 2012 beschlossen:

vom 15. März 2012 Der Gemeinsame Bundesausschuss hat in seiner Sitzung am 15. März 2012 beschlossen: Beschluss des Gemeinsamen Bundesausschusses über eine Beauftragung der Institution nach 137a SGB V: Entwicklung eines sektorenübergreifenden Qualitätssicherungsverfahrens zur Versorgung bei psychischen

Mehr

Methoden Quantitative Datenanalyse

Methoden Quantitative Datenanalyse Leitfaden Universität Zürich ISEK - Andreasstrasse 15 CH-8050 Zürich Telefon +41 44 635 22 11 Telefax +41 44 635 22 19 www.isek.uzh.ch 11. September 2014 Methoden Quantitative Datenanalyse Vorbereitung

Mehr

Arbeitskreis Versorgungsforschung beim Wissenschaftlichen Beirat. Definition und Abgrenzung der Versorgungsforschung

Arbeitskreis Versorgungsforschung beim Wissenschaftlichen Beirat. Definition und Abgrenzung der Versorgungsforschung beim Wissenschaftlichen Beirat Dieses Papier wurde am 08.09.2004 unter dem Vorsitz von Prof. Dr. Schwartz vom Arbeitskreis Versorgungsforschung beim Wissenschaftlichen Beirat der Bundesärztekammer verabschiedet.

Mehr

Medizinische Rehabilitation ein lohnendes Investment

Medizinische Rehabilitation ein lohnendes Investment Auflage: 4624 Gewicht: Artikel auf regionalen Seiten, gross 31. Januar 2012 LOKAL, SEITE 9 Medizinische Rehabilitation ein lohnendes Investment Zwischenergebnisse der Davoser Outcome-Studie belegen: Medizinische

Mehr

Katholische Universität Eichstätt-Ingolstadt. Wirtschaftswissenschaftliche Fakultät

Katholische Universität Eichstätt-Ingolstadt. Wirtschaftswissenschaftliche Fakultät Katholische Universität Eichstätt-Ingolstadt Wirtschaftswissenschaftliche Fakultät Der Nutzen betrieblicher Weiterbildung für Großunternehmen. Eine empirische Analyse unter bildungsökonomischen Aspekten

Mehr

NEUE STUDIE UNTERMAUERT KLINISCHEN UND WIRTSCHAFTICHEN WERT DER ERWEITERTEN INDIKATION FÜR CRT-D GERÄTE

NEUE STUDIE UNTERMAUERT KLINISCHEN UND WIRTSCHAFTICHEN WERT DER ERWEITERTEN INDIKATION FÜR CRT-D GERÄTE Auskünfte Deutschland: Sabine Günther, Jennifer Disper Presse und Öffentlichkeitsarbeit Tel: ++49 (0) 2159 8149 277 Fax: ++49 (0) 2159 8149 252 email: sabine.guenther@medtronic.com email: jennifer.disper@medtronic.com

Mehr

Gibt es eine Palliative Geriatrie?

Gibt es eine Palliative Geriatrie? Gibt es eine Palliative Geriatrie? Oder geht es um Palliative Care in der Geriatrie? Wenn ja, wann beginnt dann Palliative Care? Oder ist Geriatrie gleich Palliative Care? Dr. med. Roland Kunz Chefarzt

Mehr

IBES in der Raucherberatung Instrumente zur Bestimmung der Entzugssymptome und der Selbstwirksamkeit

IBES in der Raucherberatung Instrumente zur Bestimmung der Entzugssymptome und der Selbstwirksamkeit IBES in der Raucherberatung Instrumente zur Bestimmung der Entzugssymptome und der Selbstwirksamkeit Elisabeth Zehnder, NDS Gesundheitsschwester Raucherberaterin elisabeth.zehnder@insel.ch Fachstelle Rauchen

Mehr

Fachbereich Erziehungswissenschaft und Psychologie der Freie Universität Berlin. Transformationale Führung Implikationen für die lernende Verwaltung

Fachbereich Erziehungswissenschaft und Psychologie der Freie Universität Berlin. Transformationale Führung Implikationen für die lernende Verwaltung Fachbereich Erziehungswissenschaft und Psychologie der Freie Universität Berlin Transformationale Führung Implikationen für die lernende Verwaltung Dissertation zur Erlangung des akademischen Grades Doktor

Mehr

Ist es illusorisch, in der ambulanten Medizin von Qualität zu sprechen?

Ist es illusorisch, in der ambulanten Medizin von Qualität zu sprechen? Nationale Qualitätsprinzipien: Ist es illusorisch, in der ambulanten Medizin von Qualität zu sprechen? von Urs Stoffel, Zentralvorstand FMH Dienstag, 29. Januar 2013, Hotel Bellevue, Bern FMH_U.Stoffel

Mehr

Qualitative Sozialforschung: Ein Überblick. Autor: Thomas Brüsemeister Überarbeitung: Patrick Heiser und Judith Bündgens-Kosten

Qualitative Sozialforschung: Ein Überblick. Autor: Thomas Brüsemeister Überarbeitung: Patrick Heiser und Judith Bündgens-Kosten Qualitative Sozialforschung: Ein Überblick Autor: Thomas Brüsemeister Überarbeitung: Patrick Heiser und Judith Bündgens-Kosten 2011 FernUniversität in Hagen. Fakultät für Kultur- und Sozialwissenschaften.

Mehr

Analyse und Modellierung des Carry Trade Handels. Bachelorarbeit

Analyse und Modellierung des Carry Trade Handels. Bachelorarbeit Analyse und Modellierung des Carry Trade Handels Bachelorarbeit zur Erlangung des akademischen Grades Bachelor of Science (B.Sc.) im StudiengangWirtschaftswissenschaft der Wirtschaftswissenschaftlichen

Mehr

Schätzung des Lifetime Values von Spendern mit Hilfe der Überlebensanalyse

Schätzung des Lifetime Values von Spendern mit Hilfe der Überlebensanalyse Schätzung Lifetime Values von Spenn mit Hilfe Überlebensanalyse Einführung in das Verfahren am Beispiel Einzugsgenehmigung Überlebensanalysen o Ereignisdatenanalysen behandeln das Problem, mit welcher

Mehr

DOE am Beispiel Laserpointer

DOE am Beispiel Laserpointer DOE am Beispiel Laserpointer Swen Günther Ein wesentliches Ziel im Rahmen der Neuproduktentwicklung ist die aus Kundesicht bestmögliche, d.h. nutzenmaximale Konzeption des Produktes zu bestimmen (vgl.

Mehr

Inhaltsverzeichnis... II. 1. Einführung... 1

Inhaltsverzeichnis... II. 1. Einführung... 1 Inhaltsverzeichnis Inhaltsverzeichnis... II 1. Einführung... 1 2. Kreativitätstechniken im Prozess der Ideenfindung... 2 2.1. Brainstorming... 2 2.2. Brainwriting (Methode 6-3-5)... 3 2.3. Bewertung der

Mehr

Patientenbefragungen

Patientenbefragungen Patientenbefragungen vergleichende Ergebnisdarstellung Claus Fahlenbrach, AOK Bundesverband G-BA Qualitätskonferenz, 28.11.2011, Berlin Agenda 1. Warum Patientenbefragungen? 2. PEQ-Fragebogen 3. Qualitätsdimensionen

Mehr

Wie schreibt man eine Ausarbeitung?

Wie schreibt man eine Ausarbeitung? Wie schreibt man eine Ausarbeitung? Holger Karl Holger.karl@upb.de Computer Networks Group Universität Paderborn Übersicht Ziel einer Ausarbeitung Struktur Sprache Korrektes Zitieren Weitere Informationen

Mehr