Das : mehr als 20.000 medizinische Formulare mit semantischen Annotationen Sarah Riepenhausen
https://medical-data-models.org Seit 2011 Europas größte Sammlung medizinischer Datenmodelle DFG gefördert, anerkannte Forschungsinfrastruktur Ziele: Freier Zugang zu medizinischen Formularen Transparenz Harmonisierung/Standardisierung medizinischer Datenerhebung Interoperabilität: Dokumentationssysteme und Sprachen
Hintergründe Electronic Health Records (EHR): Dokumentation: > 25% ärztlicher Arbeitszeit (Clynch et al. 2015) Formularredundanz innerhalb eines Krankenhauses Keine Interoperabilität zwischen Systemen, dadaoft oft proprietär proprietär Forschungsdokumentation (Electronic Data Capture): Vergleichbarkeit zwischen Studien/Registern wichtig Case Report Form: median 180 Seiten/klinischer Studie (Getz et al. 2012) Redundanz mit EHR Sekundärnutzung sinnvoll
Hintergründe nichtöffentlich öffentlich Großteil von Studiendokumentationen nicht Medizinische Sprache sehr vielfältig UMLS: > 5 Mio. Konzeptnamen Unabhängiges Erstellen kompatibler Formulare? => Vergleichbarkeit von Studien eingeschränkt
Hintergrund Stellungnahme AG Klinische Studien der DFG, 10.2018 Studienprotokolle, der Analyseplan sowie CRFs [sollen] vor Studienbeginn in einem öffentlich zugänglichen Register oder im Rahmen einer Publikation veröffentlicht werden DLR-Förderrichtlinien bei BMBF-geförderten Studien: verpflichtet zur Veröffentlichung vom Studienprotokoll inkl. aller Dokumentationsformulare (CRF) in einschlägiger Fachzeitschrift oder an anderer geeigneter Stelle
Hintergrund Voraussetzung für Interoperabilität und Sekundärnutzung Eindeutige und einheitliche Bezeichnung/Kennzeichnung von Datenelementen Bsp.: Größe Semantische Annotation Informationsgehalt sprachunabhängig, maschinenlesbar Datenelement Größe + Code C0005890 (UMLS, Body Height)
Methoden ODMEdit (Dugas et al. 2016) Interoperabilität ODM-Format (CDISC) (www.cdisc.org/standards/data-exchange/odm), weitere Download-Formate Annotation: UMLS-Codes (Unified Medical Language System, uts.nlm.nih.gov/home.html) Mehrsprachigkeit Standardisierung: Wiederverwendung: Datenelemente/-gruppen aus MetaData Registry Wiederverwendung: schon verwendete UMLS-Codes Kodierrichtlinien
Methoden Transparenz Unterstützung der Suche nach Formularen Formularerstellung: Originale aus Routinedokumentation, Registern, klinischen Studien, Patientenfragebögen, Vergabe von MeSH-Terms (erweitert) (https://www.ncbi.nlm.nih.gov/mesh/) Datenbankabfragen für Analysen
Ergebnisse Nutzer Ca. 1.240 registriert am 18.02.2019 Fokus: Mitteleuropa, USA
Ergebnisse Datenmodelle am 18.02.2019: > 20.100 Um die DVMD-Tagung 2017: > 10.000 Zunahme auch der neuen Versionen
Ergebnisse Häufigste Schlagwörter Klinische Studie ca. 15.000 Ein-/Ausschlusskriterien > 8.000 Brustneoplasien ca. 1.500 Neurologie ca. 1.300 Routinedokumentation ca. 1.300
Verteilung von krankheitsbezogenen Schlagwörtern, Stand 18.02.2019 Onkologische Erkrankungen ca. 7.500 Neurologische Erkrankungen ca. 5.500 Gastroenterologische Erkrankungen ca. 4.200 Geringe Abdeckung (< 100) Parasitäre Erkrankungen Berufskrankheiten Erkrankungen aus dem Bereich der Umweltmedizin
Ergebnisse Datenelemente gesamt: ca. 480.000 UMLS-Annotiert: Englisch: Deutsch: ca. 88% ca. 87% ca. 21% Datenelementgruppen: ca. 68.000 Codelistelemente: Stand: 18.02.2019 ca. 521.000
Ergebnisse An das Portal angegliederte Tools ODMSummary (odmtoolbox.uni-muenster.de/odmsummary/, Storck et al. 2016) tabellarische Zusammenfassung des ODM-Dokuments Datenelementvergleich auf Annotationsbasis, Äquivalenzklasseneinteilung CDEGenerator (cdegenerator.uni-muenster.de, Varghese et al. 2018) Datenelementvergleich auf Annotationsbasis zur Erstellung von Gemeinsamen Datenelementen (Common Data Elements, CDE) Direkter Export ausgewählter Datenelemente u.a. im ODM-Format
Ergebnisse Neue/erweiterte/verbesserte Funktionen Exporte: 18 Downloadformate Zip-Archiv-Download mehrerer ODM-Dateien Neuer PDF-Converter Zitierbarkeit: DOI Kooperation mit ZB MED, Köln MetaData Registry: neue Funktion related Items
Diskussion Bedarf an Interoperabilität und Harmonisierung hoch Zunehmende Zahlen an Benutzern und Besuchern Zunehmende Anzahl an Datenmodellen Breite Abdeckung v.a. Onkologie einer der Schwerpunkte der klinischen Forschung v.a. Eligibility Criteria Aber: Weiterhin zu füllende Lücken
Diskussion Transparenz muss weiter steigen Ressourcen sparen Vergleichbarkeit erhöhen Portal: Möglichkeit der (zitierbaren) Veröffentlichung von ecrfs Mögliche Infrastruktur für Umsetzung der Forderungen von DFG und BMBF Akademische Anerkennung der Formularersteller
Diskussion Gemeinsame Weiterentwicklung von Formularen Diskussion über Formulare zu deren Optimierung Portal: Grundlagen für Interoperabilität und Sekundärnutzung Ziel einer flächendeckenden Interoperabilität und Sekundärnutzung von Daten noch nicht erreicht
Ausblick Erweiterung der Kodierungsmöglichkeiten z.b. mit SDTM, SNOMED (falls deutsche Lizenz),... Erweiterung der Qualitätssicherung z.b. Code-Cleaning weitere Standardisierung der Kodierung
Vielen Dank für die Aufmerksamkeit Sarah Riepenhausen sarah.riepenhausen@uni-muenster.de Bitte nehmen Sie an unserer Umfrage zum MDMPortal teil: https://bit.ly/2vtmv8d