Screening auf Thromboserisiko in der Pflege Rahel Geffert, Katja Rabe Studierende der Fachwissenschaft Gesundheit, Universität Hamburg 1. Zusammenfassung Die Thromboembolie ist eine gefürchtete Komplikation eines Krankenhausaufenthaltes. Im vorliegenden Beitrag gilt es zu prüfen, wie genau und nützlich pflegerische Screeninginstrumente zur Einschätzung des Thromboserisikos von Patienten im Krankenhaus sind. Mittels einer systematischen Literraturrecherche in der Datenbank PubMed wurde nach Validierungsstudien zum Pflegescreening auf Thromboserisiko gesucht. Zur Beurteilung der methodischen Angemessenheit und inhaltlichen Gültigkeit der Studien wurde ein international konsentiertes Instrument herangezogen. Es wurden zwei Validierungsstudien zu zwei Instrumenten identifiziert und kritisch beurteilt. Beide Publikationen weisen erhebliche methodische Mängel auf. Die Frage nach der Genauigkeit und Nützlichkeit von pflegerischen Screeninginstrumenten zur Einschätzung des Thromboserisikos kann anhand der identifizierten Studien nicht beantwortet werden und bedarf weiterer, qualitativ hochwertigerer Genauigkeitsstudien. 1
2. Einleitung Ohne antithrombotische Prophylaxe entwickeln etwa 25% der Patienten in der Allgemeinoder Abdominalchirurgie, 50% in der orthopädischen Chirurgie und 20% in der Neurochirurgie eine tiefe Beinvenenthrombose [1]. Für Patienten mit Myokardinfarkt ist eine Inzidenz von etwa 20% dokumentiert, für Patienten mit Schlaganfall sogar eine von mehr als 50% [2]. Je nach Schweregrad der Thrombose manifestiert sich innerhalb von 3 Jahren in 35%-70% und nach 5-10 Jahren in 75%-100% der Fälle eine postthrombotisch venöse Insuffizienz [1]. Pflegerische Instrumente zur Einschätzung des Thromboserisikos werden in der Literatur diskutiert und in Pflegestandards empfohlen [3][4]. Für die Instrumente wird behauptet, dass sie einfach und schnell durchzuführen seien. Sie könnten eine wertvolle Entscheidungshilfe für das Angebot prophylaktischer Maßnahmen darstellen [5]. 3. Fragestellung Im vorliegenden Beitrag gilt es die Frage zu untersuchen, wie genau und nützlich pflegerische Instrumente zur Einschätzung des Thromboserisikos sind. 4. Methoden Es wurde eine Suche in der Datenbank Pub Med (http://www.pubmed.gov) durchgeführt mit den MeSH (Medical Subject Heading)-Begriffen thrombosis, nursing, diagnosis und risk assessment sowie mit und ohne german *. Gesucht wurde sowohl per Freitextsuche als auch mit den clinical queries. Es konnten drei Instrumente identifiziert werden [4][5][6]. Da die letztgenannte Skala bisher nicht validiert ist, werden hier die Studien zu den Skalen nach Autar [6] und Feuchtinger [7] analysiert. Zur Beurteilung der methodischen Angemessenheit und inhaltlichen Gültigkeit der Studien wurde die so genannte STARD Checkliste [8] herangezogen. Die Checkliste fragt nach der transparenten Berichterstattung von definierten Indikatoren, die die Qualität diagnostischer Genauigkeitsstudien bedingen. 5. Ergebnisse Die Ergebnisse der Beurteilung der beiden Studien [6][7] anhand der STARD Checkliste [8] sind in der Tabelle 1 angeführt. Den Studien mangelt es insbesondere an transparenter Darstellung der Teilnehmerrekrutierung, möglicher unerwünschter Effekte und der Darstellung von Effektschätzungen, einschließlich der 95% Konfidenzintervalle. Speziell diese Angaben sind für den Anwender von Bedeutung. Die Studie von Autar [6] erfüllt nicht einmal die Hälfte der in der Checkliste abgefragten Items. 2
Tabelle 1: Kritische Beurteilung der eingeschlossenen Studien anhand der STARD Checkliste Abschnitt und Thema Item Feuchtinger [7] Autar [6] TITEL/ZUSAMMEN- FASSUNG/SCHLAG- 1 Artikel als eine Studie zur diagnostischen Genauigkeit ausgewiesen? WÖRTER EINLEITUNG 2 Fragestellung oder Studienziele benannt? METHODEN Beschreibung... Teilnehmer 3 Studienpopulation: Ein- und Ausschlusskriterien, Setting, Ort 4 Teilnehmerrekrutierung: Basiert auf Symptomen, Eingangstests oder der Teilnahme am Index- oder Referenztest? 5 Teilnehmer: Studienteilnehmer in konsekutiver Reihenfolge nach Item 3 und 4 ausgewählt? Wenn nein, nähere Beschreibung vorhanden? 6 Datensammlung: prospektiv oder retrospektiv? Testmethoden 7 Referenzstandard und dessen Begründung. 8 Technische Spezifizierung der verwendeten Materialien und Methoden. 9 Definition und Begründung der Schwellenwerte und/oder -kategorien der Ergebnisse des Index- und Referenztests. 10 Anzahl, Training und Expertise der Personen, die den Index- und Referenztest durchführen und auswerten. - + 11 Verblindung der Untersucher und ob diesen andere klinische Informationen zugänglich waren. Statistische Methoden 12 Methoden zur Berechnung oder zum Vergleich der diagnostischen Genauigkeit und benutzte statistische Methoden zur Quantifizierung der Unsicherheit (z.b. 95% Konfidenzintervalle). 13 Methoden zur Berechnung der Testreproduzierbarkeit. ERGEBNISSE Darstellung Teilnehmer 14 Zeitpunkt der Durchführung, einschließlich Beginn und Ende der Rekrutierung. 15 Klinische und demographische Angaben zur Studienpopulation. 16 Anzahl der Teilnehmer, die die Einschlusskriterien für den Indexund/oder den Referenztests erfüllen; Beschreibung, warum Teilnehmer heraus fielen. Testergebnisse 17 Zeitabstand zwischen Index- und Referenztest und Beschreibung von ggf. währenddessen durchgeführten Behandlungen. 18 Verteilung des Schweregrades der Erkrankung in der Population mit der Zielerkrankung; andere Diagnosen bei Teilnehmern ohne die Zielerkrankung. 19 Vierfeldertafel der Ergebnisse des Indextests bzw. Referenzstandardtests (inkl. nicht ermittelbarer und verlorener Ergebnisse). 20 Unerwünschte Wirkungen durch den Index- und/oder Referenztest. Schätzwerte 21 Einschätzung der diagnostischen Genauigkeit und der statistischen Unsicherheit (z.b. 95% Konfidenzintervalle). 22 Umgang mit unbestimmten Ergebnissen, fehlenden Antworten und Sonderfällen des Indextests. 23 Schätzwerte zur Varianz der diagnostischen Genauigkeit bei Untergruppen der Teilnehmer, der Auswerter oder der Zentren. 24 Schätzwerte zur Testreproduzierbarkeit. DISKUSSION 25 Diskussion der klinischen Anwendbarkeit der Studienergebnisse. Im Folgenden werden wichtigste Ergebnisse der beiden Studien zusammenfassend dargestellt. 5.1. Feuchtinger [7] Da in einem Untersuchungszeitraum von einem Monat keiner der 281 mit der Kümpel-Skala eingeschätzten Patienten aus der Neurochirurgie, Neurologie sowie der Geburtshilfe eine Thrombose bekam, wurden in dieser Studie hypothetisch eine Sensitivität von 50% und eine Spezifität von 45,3% errechnet. Die genaue Definition des Referenzstandards fehlt. 3
Alle Patienten, die als Thrombose gefährdet eingeschätzt wurden, erhielten prophylaktische Maßnahmen. Der Cronbachs Alpha (eine Maßeinheit für die interne Konsistenz eines Instrumentes) beträgt 0,5. Die Interrater-Reliabilität wurde innerhalb einer Population von 107 Patienten bestimmt. Der Cohens Kappa 1 zwischen der Einschätzung der Kümpel-Skala im Vergleich zur klinischen Einschätzung Pflegender betrug 0,49, zwischen der Kümpel-Skala und der klinischen Einschätzung des Arztes 0,32 und zwischen der klinischen Einschätzung Pflegender und der klinischen Einschätzung des Arztes 0,47. Die Übereinstimmung von zwei unabhängigen Einschätzungen anhand der Kümpel-Skala wurde in der Neurologie und der Geburtshilfe an den Daten von insgesamt 67 Patienten errechnet und ergab einen Cohens Kappa von 0,81. Die Einschätzungen wurden verblindet durchgeführt und dokumentiert. Ob den erhebenden Personen der Zugriff auf andere Daten der Patienten zugänglich war, ist nicht beschrieben. 5.2. Autar [6] Die Studie wurde auf 2 orthopädischen Stationen durchgeführt, also in einer Hochrisikogruppe. Der Referenzstandard wird nicht definiert. Ein Behandlungsparadox wird nicht diskutiert. Jeweils fünf examinierte Krankenschwestern führten die Einschätzungen anhand der Autar DVT-Skala unabhängig voneinander durch. Ob die Untersucher verblindet waren, wird nicht beschrieben. Der Beobachtungszeitraum lag zwischen 4 und 7 Tagen. Der Korrelationskoeffizient 2 beträgt 0,98. Die totale prozentuale Übereinstimmung der Begutachter liegt bei 87,9% und bei 69,2%. Die Sensitivität, die Eigenschaft des Tests Gefährdete als gefährdet zu erkennen, wird mit 100% angegeben. Die Spezifität, die Möglichkeit des Tests Nicht-Gefährdete als nicht gefährdet zu erkennen, beträgt 81,2%. 6. Diskussion Die beurteilten Studien weisen methodische Mängel auf. In beiden Studien ist ein Behandlungsparadox wahrscheinlich. Dieses meint, dass Patienten erst auf ihr Thromboserisiko eingeschätzt werden und konsekutiv behandelt werden, während gleichzeitig die Genauigkeit des Instruments am Endpunkt untersucht wird. Somit wird gegen das Auftreten des Endpunktes, der gleichzeitig der Referenzstandard ist, gearbeitet. Da eine Einschätzung des Thromboserisikos ohne anschließende präventive Maßnahmen allerdings 1 Bei dem Cohens Kappa können die Werte zwischen 1,0 = hohe Übereinstimmung, 0 = statistische Übereinstimmung und -1,0 = Übereinstimmung schlechter als der Zufall, variieren. 2 Der Korrelationskoeffizient entspricht dem Grad der Übereinstimmung der Begutachter. Ein Wert von 1 bedeutet die optimale Übereinstimmung. 4
nicht vertretbar wäre, ist daran nichts zu verändern. Allerdings wäre es notwendig, dass das Behandlungsparadox in der Arbeit diskutiert wird. Dies ist in der Arbeit von Autar [6] nicht der Fall. Ein bedeutsamer Mangel der Studien ist die unzureichende Stichprobengröße. In der Arbeit von Autar wurden nur Patienten einer Hochrisikogruppe untersucht (Orthopädie). Dieser Umstand erschwert die Übertragbarkeit der Ergebnisse auf andere Patientenpopulationen. Insbesondere bei der Publikation von Autar [6] fallen bedeutsame methodische Limitierungen auf. Eine detaillierte Beschreibung der untersuchten Patienten inklusive Ein- und Ausschlusskriterien ist zu fordern, um Schlüsse auf die Übertragbarkeit der Ergebnisse zu ermöglichen. Die Reproduzierbarkeit und Machbarkeit eines Tests sind Aspekte, die in Vorbereitung der klinischen Anwendung geprüft werden müssen [9]. Die Verblindung ist eine bedeutsame methodische Voraussetzung. Besonders bei der Bestimmung der Interraterreliabilität ist es wichtig auszuschließen, dass die Untersucher sich untereinander verständigen können. Fazit Aufgrund der methodischen Limitierungen den beurteilten Studien, ist die Frage nach der Genauigkeit und Nützlichkeit des pflegerischen Screenings auf Thromboserisiko nicht zu beantworten. Validierungsstudien höherer Qualität sind zu fordern. Der klinische Nutzen eines pflegerischen Screenings auf Thromboserisiko kann darüber hinaus nur im Rahmen einer randomisiert-kontrollierten Studie evaluiert werden. Eine solche hätte die komplexe Intervention aus Screening und konsekutiver Behandlung versus Standardversorgung zu untersuchen. 7. Literatur 1. Meyer G, Gellert R, Schlömer G, Mühlhauser I: Thromboseprophylaxestrümpfe in der Chirurgie- optional oder obligat? Chirurg 75 (2004): 45-58 2. Geerts WH, Heit JA, Clagett GP, Pineo GF, Colwell CW, Anderson FA Jr, Wheeler HB: Prevention of venous thromboembolism. Chest 119 (2001): 132S-175S 3. LBK Hamburg: Pflegestandards im LBK Hamburg, http://www.lbkhh.de/data/pflegeplus/lbk_pflegestandard_26okt04.pdf, (2006), Zugriff am 10.03.06 4. Kümpel P: Thrombosegefährdung im Krankenhaus. Pflege Z 48 (1995): 274-278 5. Frowein M: Ein Score kann bei der Pflegeanamnese eingesetzt werden. Pflege Z 50 (1997): 673-677 6. Autar R: Nursing assessment of clients at risk of deep vein thrombosis (DVT): the Autar DVT scale. J Adv Nurs 23 (1996): 763-770 7. Feuchtinger J: Wissenschaftliche Überprüfung der Messskala zur Einschätzung der Thrombosegefährdung. Pflege 14 (2001): 47-57 5
8. Bossuyt PM, Reitsma JB, Bruns DE et al.: Towards Complete an Accurate Reporting of Diagnostic Accuracy: The STARD Initiative. Ann Int Med 138 (2003): 40-44 9. Bucher HC: Kritische Bewertung von Screening und Diagnostik. In: Kunz R, Ollenschläger G, Raspe H et al. (Hrsg.): Lehrbuch evidenzbasierter Medizin in Klinik und Praxis (2000). Köln: Deutscher Ärzte-Verlag 6