ID-Management im Projekt GANI_MED Strukturbereich Medizininformatik C. Schack, D. Langner, L. Geidel, T. Bahls, W. Hoffmann Universitätsmedizin Greifswald Institut für Community Medicine
Inhalt Überblick GANI_MED Master Person Index (MPI) Pseudonymisierungsdienst (PSN) Status Quo und Ausblick Diskussion ICM EMAU 2012 2
Überblick GANI_MED Einordnung Leitbild der Universitätsmedizin Greifswald: Individualisierte Medizin GANI_MED Verbundprojekt BMBF Förderung 2009 2014 Kooperation von nationalen und internationalen Partnern aus Wissenschaft und Industrie Unterteilung in 6 Struktur- und 3 Projektbereiche, u.a. Medizininformatik Ziel Erforschung und Weiterentwicklung von Behandlungsmethoden und Prozessen für individualisierte Diagnostik und Therapie Untersuchung von ethischen, datenschutzrechtlichen und gesundheitsökonomischen Fragestellungen Durchführung Kohortenstudie im klinischen Umfeld (zur Zeit 8 Kohorten) Beteiligung mehrerer Kliniken und ambulanter Praxen Followup-Methodik und Inhalte in Planung, inkl. Längsschnitt ICM EMAU 2012 3
Überblick GANI_MED - Strukturbereich Medizininformatik Medizininformatik: 2 Teilprojekte Kohortenmanagement Forschungsplattform Forschungsplattform Integration heterogener medizinischer Datenquellen (SwissLab, ) Konzeption und Umsetzung aller notwendigen datenschutzrechtlichen Anforderungen sowie dem ID-Management Anbindung verschiedener KISe über Standort- und Systemgrenzen hinweg Entwicklung von Schnittstellen zur Bereitstellung von Daten für forschungs- und versorgungsrelevante Fragestellungen Kohortenmanagement standardisierte und qualitätsgesicherte Erfassung von Basis- sowie kohortenspezifischen Anamnesedaten Client-Server System mit Offline-Modus
Überblick GANI_MED Master Person Index (MPI) Pseudonymisierungsdienst (PSN) Status Quo und Ausblick Diskussion ICM EMAU 2012 5
MPI - Einordnung innerhalb GANI_MED Forschungsplattform
MPI Motivation und Anforderungen Motivation unterschiedliche Quellsysteme mit von einander unabhängigen lokalen Personen-IDs, teilweise fehlende bzw. fehlerhafte demografische Daten Personendaten mit unterschiedlichen Rollen Anforderungen Erstellung und Verwaltung des Master Person Index Zusammenführung der Daten aus unterschiedlichen Quellsystemen auch im Falle fehlender bzw. fehlerhafter demografischer Daten Erzeugung eines systemweit eindeutigen Identifikators für alle Teilsysteme der GANI_MED-Forschungsplattform Unterstützung der standardisierten IHE Profile PIX, PDQ, ATNA Gewährleistung von Datenschutz und Datensicherheit ICM EMAU 2012 7
MPI Ansatz Systemverteilung im Rahmen des GANI_MED Projektes Klinische Netzwerke Local Identifier Domain Universitätsmedizin Greifswald Identifier: UMG-ID Netzwerk der Treuhandstelle Patient Identifier Crossreferencing Domain E-PIX - System Netzwerk der GANI_MED- Forschungsplattform Local Identifier Domain Kohortenmanagement-System Identifier: KS-ID Master Patient Index (MPI) UMG-ID KS-ID KWH-ID MPI-ID Local Identifier Domain GANI_MED Forschungsplattform Identifier: Pseudonym der MPI-ID Local Identifier Domain KH-Wolgast Identifier: KHW-ID Einordnung der Systeme gemäß IHE Patient Identification Crossreferencing (PIX) Profil ICM EMAU 2012 8
MPI Architektur komponentenbasierte Architektur JEE konform standardisierte WS-Schnittstelle WSDL, SOAP, WS-Security Authentifizierung, Authorisierung Rollen u. Rechtekonzept Zugriffsreglementierung auch für (über OIDs registrierte) Quellsysteme Deduplication-Engine Matching-Framework (Record Linkage) MPI ID-Generator Audit Trail Komponente Protokollierung von Zugriffen und kritischen Systementscheidungen Historisierung ICM EMAU 2012 9
MPI Workflow (Validierung) NoMatch Deduplication Validation Preprocessing Blocking Matching NotMatchable Critical Match Validierung der Eingabedaten Sicherstellung der Mindestanforderungen konfigurierbar rollenspezifisch Abbruch bei Nichterfüllung derzeitige Implementierung für die Rolle Patient Name, Vorname, zweiter Vorname, Geburtsdatum, Straße, Stadt, PLZ MPI-ID-Generator ICM EMAU 2012 10
MPI Workflow (Preprocessing) NoMatch Deduplication Validation Preprocessing Blocking Matching NotMatchable Critical Match Preprocessing der Eingabedaten Normalisierung Plugin-Architektur simple und komplexe Transformationen einfache Textersetzungen Aufspaltung von Namen in Vorund Nachnamen derzeitige Implementierung Umlautersetzung, Str., Großschreibung, Sonderzeichen MPI-ID-Generator ICM EMAU 2012 11
MPI Workflow (Blocking) Deduplication Validation Preprocessing Blocking Matching NotMatchable Blocking Ziel: Reduktion der Anzahl späterer Matching-Operationen Vorauswahl der Kandidatenliste Konfigurationsmöglichkeiten Blockingkriterien Blockingalgorithmen, inkl. deren Verknüpfung derzeitige Implementierung Kölner Phonetikalgorithmus NoMatch Critical Match MPI-ID-Generator ICM EMAU 2012 12
MPI Workflow (Matching) Deduplication Validation Preprocessing Blocking Matching NoMatch Critical Match MPI-ID-Generator NotMatchable Matching Plugin-Architektur für Matching- Verfahren und Algorithmen Matching-Konfigurierbarkeit Verfahren, z.b. deterministisch Algorithmus, z.b. Jaro-Winkler Algorithmus per Kriterium Kriterien, z.b. zweiter Vorname Schwellwerte und Gewichte derzeitige Implementierung Matching-Verfahren: Fellegi & Sunter (probabilistisch) Matching-Algorithmus: Levensthein-Distanz ICM EMAU 2012 13
MPI Workflow (MPI-ID-Generator) Deduplication Validation Preprocessing Blocking NotMatchable Generator für MPI-IDs konfigurierbare ID-Generatoren derzeitige Implementierung EAN13 Code-Generator Prüfziffer: EAN13-Standard (in Kürze: Verhoeff) Matching NoMatch Critical Match MPI-ID-Generator ICM EMAU 2012 14
MPI Beispiel für Fellegi & Sunter Verfahren Kriterium Eingabe Kandidat Wichtung P Schwellwerte Entscheidung Vorname Hans Hans 6 1,0 P > 0,95 Match 2. Vorname Joachim Joachim 5 1,0 P < 0,95 Match Nachname Schmidt Schmitt 4 0,86 P < 0,92 No Match Geb.-Datum 11.08.1976 11.08.1976 6 1,0 P > 0,98 Match Geschlecht M M 2 1,0 P < 0,95 Match Straße Musterstr. 12 Musterstr. 21 2 0,92 P < 0,93 No Match PLZ 17489 17489 5 1,0 P > 0,98 Match Wohnort Musterstadt Musterstadt 3 1,0 P > 0,90 Match Berechnung des Gesamtverhältnisses R > 10 Match Match R = P(M) / P(U) = Σ (p(m)) / Σ (p(u)) R = 27/0,72 = 37,5 1,5<R<10 Critical R <= 1,5 No Match ICM EMAU 2012 15
Überblick GANI_MED Master Person Index (MPI) Pseudonymisierungsdienst (PSN) Status Quo und Ausblick Diskussion ICM EMAU 2012 16
PSN Einordnung innerhalb GANI_MED Forschungsplattform
PSN Motivation und Anforderungen Motivation Pseudonymisierung der (medizinischen) Forschungsdaten Rückführbarkeit von Pseudonym zu ID erschweren Treuhandstelle darf ausschließlich IDAT und Pseudonyme kennen Verhinderung von Datenkorrelation zwischen unabhängigen Studien Anforderungen Möglichkeit der Re-Identifikation z.b. bei Zufallsbefunden unterstützt Trennung von IDAT und MDAT unterstützt mehrfache Pseudonyme ID: MPI-ID, Fall-Nummer, zufällige Zuordnung von (Zweit-) Pseudonym zu ID domainabhängige Zweit-Pseudonymisierung für Daten-Transfer ICM EMAU 2012 18
PSN Workflow
Überblick GANI_MED Master Person Index (MPI) Pseudonymisierungsdienst (PSN) Status Quo und Ausblick Diskussion ICM EMAU 2012 20
Status Quo und Ausblick Master Person Index Referenzimplementierung E-PIX basierend auf Java EE Technologien im Produktivbetrieb Basisfunktionalität mit einem registrierten Quellsystem Web-Frontend für E-PIX Administration, Auflösung von kritischen Matches Umsetzung von Adaptern für IHE-Profile PIX, PDQ u. ATNA Schwellwerte und Gewichte (Matching) Evaluierung von Optimierungsmöglichkeiten Pseudonymisierungsdienst Umsetzung erfolgt, Test ausstehend ICM EMAU 2012 21
Institut für Community Medicine Abt. Versorgungsepidemiolgie und Community Health Ellernholzstr. 1/2 17487 Greifswald Leiter Prof. Dr. Wolfgang Hoffmann Tel.: 03834 867751 E-Mail.: wolfgang.hoffmann@uni-greifswald.de Projektkoordinator Thomas Bahls Tel.: 03834 867524 E-Mail.: thomas.bahls@uni-greifswald.de Konzeption und Entwicklung Christian Schack Tel.: 03834 867753 E-Mail.: christian.schack@uni-greifswald.de Dirk Langner Tel.: 03834 867546 E-Mail.: dirk.langner@uni-greifswald.de Lars Geidel Tel.: 03834 867755 E-Mail.: lars.geidel@uni-greifswald.de ICM EMAU 2012 22