Big Data in der Medizin heute und morgen Thomas D. Szucs Juli 2016
Paul Gauguin (1897) Woher kommen wir? Wer sind wir? Wohin gehen wir?
Drei Fragen Woher kommen wir? Evolution des Datenkonzeptes Wer sind wir? Heutige Bedeutung von Big Data in der Medizin Wohin gehen wir? Herausforderungen für die Zukunft 3
Drei Fragen Woher kommen wir? Evolution des Datenkonzeptes Wer sind wir? Heutige Bedeutung von Big Data in der Medizin Wohin gehen wir? Herausforderungen für die Zukunft 4
Was sind Daten? Daten sind zum Zweck der Verarbeitung zusammengefasste Zeichen, die aufgrund bekannter oder unterstellter Abmachungen Informationen (d. h. Angaben über Sachverhalte und Vorgänge) darstellen (Gabler). 5
Prognose: jährlich generierte digitale Datenmenge weltweit Datenvolumen in Exabyte 2005 2010 2012 2015 2020 6
Wie gross sind die heutigen Datenmengen? Stufe Binär/ dezimal Beispiel GB 10 9 0.8 GB menschliches Genom TB 10 12 1 TB bedrucktes Papier von 50 000 Bäumen PB 10 15 1 PB Arbeitsspeicher für den Film Avatar für das Spiel World of Warcraft EB 10 18 5 EB alle je gesprochener Worte (Text) ZB 10 21? YB 10 24 Noch nicht in der IT Praxis angekommen (vermutlich 2025) 7
Wie gross ist 1 Zettabyte? Stapel von 295 Mrd. USB Sticks mit je 5 GB Aneinandergereiht 1.157 x um die Erde 8
Daten Kreation Alle 10 Minuten kreieren wir soviel Informationen wie die ersten 10 000 Generationen der Menschheit generierten 9
Daten-Abfall als künftiger Daten- Schatz 650 Terabytes 10
Programmcode Programmsystem Space shuttle 3 Google Android 11 Windows Vista 50 Mac OS X 86 Oberklassenauto 100 Airbus 380 1 000 Summe aller I-phone Anwendungen Zeilen Code MLOC 35 000 10 MLOC = Papierstapel 15 m Höhe MLOC = Million lines of code (Million Kodierzeilen) 11
Aufteilung des digitalen Universums 12
Verständlichkeit grosser Daten No human mind is capable of grasping in its entirety the meaning of any considerable quantity of data. Sir Ronald A Fisher 13
Wie nutzt man Big Data? Multiple Datenquellen Prädiktions- und Performance Modelle Transformation in der Organisation 14
Einfluss quantitativer Analysen auf Entscheidungen in der realen Welt 15
Auch Hollywood bedient sich der gehobenen Analytik Skript to $ 16
Die Weisheit der Vielen James Surowiecki (Buch 2004) Francis Galton (Test 1906) 17
Syntheseansatz: www.kaggle.com Gamification Kaggle Big data Crowdsourcing 18
Das Dunnhumby Shopper Challenge auf Kaggle 19
Dunnhumby Shopper Challenge: Aufgabenstellung 20
Digitale und soziale Medien dominieren in 3 Bereichen Digitaler Gesundheitskanal Beispiele - Email Konsultationen - Online Zugang zu Labordaten - Zugang zur Bildgebung Digitale Kundeninnovation Digitale Initiativen für sozialen Wandel - PatientsLikeMe - Let s Move Kampagne 21
Drei Fragen Woher kommen wir? Evolution des Datenkonzeptes Wer sind wir? Heutige Bedeutung von Big Data in der Medizin Wohin gehen wir? Herausforderungen für die Zukunft 22
Menschlicher Körper als Datenquelle Human Genom 3 GB 3-D MRI 150 MB Röntgenbild 30 MB Mammographie 120 MB Durchschnittliches Krankenhaus 665 TB 3-D CT 1 GB Jährl. Zunahme Bedarf an Speicherung Für Bildgebung 20-40% 80% aller Daten sind unstrukturiert (Bilder, Videos, Email) 23
Gesundheitsdaten Overload (pro Lebenszeit) 60% Exogene Daten (Umwelt, Sozioökonomie, Verhalten) 1100 TB 30% genomische Daten 6 TB 10% klinische Daten 0.4 TB IBM Watson 24
Ziele der Big Data Analyse im Gesundheitswesen Elektronische Krankenakte Verhalten Genomik Evidenz + Erkenntnisse Bessere Outcomes Bessere Wirtschaftlichkeit Public Health 25
Vier grosse Datenpools im Gesundheitswesen Pharmazeutische Forschungsdaten Abrechnungs- und Kostendaten Klinische Daten Patienten- Verhalten 26
Daten@Helsana Versicherte: 1.9 Mio. Bezahlte Leistungen: ca. CHF 5.2 Mrd. pro Jahr, ca. CHF 2.5 Mio. pro Arbeitsstunde Kundenanrufe: ca. 2 Mio. pro Jahr Datenverkehr Internet: ca. 2 TB pro Monat Verarbeitete Belege: ca. 13.2 Mio. pro Jahr Digitalisierte Rechnungen: ca. 6 Mio. pro Jahr, ca. 27'000 pro Tag Online-Transaktionen: 1.7 Mio. pro Tag Druck: 6.2 Tonnen Papier/Woche Arbeitsplätze: 4600 PCs / Laptops Gespeicherte Daten: 320 TB; auf CD's gespeichert wäre das ein 4.6 km hoher Turm Grösse des DWH: ca. 30 TB Grösste Tabelle im DWH: 14 Mrd. Zeilen 2016 27
Beispiel: PatientsLikeMe 150 000 zufriedene Kunden 75% verstehen ihre Probleme besser 18% der Epileptiker hatten weniger Notfallaufnahmen 22% der Patienten mit affektiven Störungen waren weniger oft hospitalisiert HIV Patienten: 41% reduzierten ihr Risikoverhalten 28
Beispiel Proteus Digital Health Adherence 29
Selbstmessung quantified self 30
Sensoren und Versorgungsforschung 31
Mustererkennung im 19. Jahrhundert: Cholera in London 32
Mustererkennung heute: Vorhersage zahlungsunfähiger Kunden N. Henke, McKinsey & Company (2015) 33
Krankenversicherer können geographische Informationssysteme (GIS) nutzen Vorher Nachher 34
Identifikation unerwünschter Wirkungen im Web: Tamoxifen Benton A, 2011 35
Grippe-Häufigkeit Schweiz Blau: Google Orange: BAG 36
Digitale Epidemiologie mit Social Media und Nachrichten (2010 Cholera Ausbruch in Haiti) Chunara R 2012 37
Diversifikation in das Gesundheitswesen 38
Auch in Grossbritannien bewerten die Kunden das Gesundheitswesen 39
Crowd funding 40
Drei Fragen Woher kommen wir? Evolution des Datenkonzeptes Wer sind wir? Heutige Bedeutung von Big Data in der Medizin Wohin gehen wir? Herausforderungen für die Zukunft 41
Technologiekonvergenz Medizin Biologie Informatik 42
Dimensionen Mond BPM 37093 (Diamantenstern) Burj Khalifa Dubai ca. 400'000 km ca. 200'000 km ca. 1.8 km ca. 50 Lichtjahre Pluto 0.75 LJ 1 m 1 m 1 m Genomgrösse des Menschen (3.27*10 9 bp) Gengrösse eines Menschen (30'000 bp) 1 cm 3 Transkriptom eines Tumors 43
Physische Biobanken 44
Digitale Biobanken National Super Computer Center Guangzhou, China (Oak Ridge Laboratory, Titan Supercomputer: 17 PFLOPS/s, 20-30 PBytes) 33.8 Petaflops/s Rechenleistung 12.4 Petabytes Speicher 45
Grenzen der Informatik: Taktfrequenz und Kühlung Waldrop MM 2016 46
DNA - das Wundermolekül 47
1 g DNA kann mindestens 5.5 Petabytes speichern (= 700 TByte)* George Church speicherte: Martin Luther King Jr.'s "I Have a Dream" Rede Ein Photo Kopie des Papers von Francis Crick und James Watson Double Helix von 1953 Alle 154 Shakespeare Sonetten Alle Daten konnten mit 99.99% Genauigkeit zurückgelesen werden! *3.7 Mio. DVDs 48
Wichtiges Ziel Big Data Smart Data 49
It requires avery unusual mind to undertake the analysis of the obvious. Alfred North Whitehead Brit. Mathematiker und Philosoph 1861-1947 50
Daten Wissenschaftler (Data scientist) HBR 2012 51
Führt Big Data zu höherer Performance? Ja Firmen im oberen Drittel der Charakterisierung data driven 5% höhere Produktivität 6 % höhere Profitabilität 52
Die Kehrseite Digitale Demenz (Spitzer) Ermüdung social media Sucht und Abhängigkeit Validierung der Daten Aufsicht: Drang nach Generierung von Daten Datenmanipulation z.t. unerkannt (e.g. LIBOR) 53
Digitale Demenz 54
Digitale (R)-EVOLUTION 55
Manfred Spitzer 56
Sind Gamer bessere Operateure? Review 142 Studien Ja! Videospiele mit psychomotorischer Komponente = Fähigkeiten relevant für laparoskopische Chirurgie 57
Datenschutz 58
YOU RE NOT THE CUSTOMER, YOU ARE THE PRODUCT 59
Privacy policy Das Kleingedruckte We take the information patients like you share about your experience with the disease and sell it to our partners (i.e. companies that are developing or selling products to patients). These products may include drugs, devices, equipment, insurance and medical services... You should expect that every piece of information you submit (even if it is not commonly displayed) may be shared. 60
Sie denken, die Hacker seien böse: Treffen Sie die Broker Data Surveillance Industrie Axciom, Epsilon, Datalogix, Reed Elesevie, BlueKai, Sopeo, Flurry Umsatz jährlich: $156 Mrd. p.a (= 2 x NSA Budget) Data Broker beziehen Informationen von: ISPs, Kreditkartenfirmen, Mobiltelephongesellschaften, Banken, Apotheken, Motorfahrzeuge, Detailhandel, Online Aktivitäten Acxiom: 23 000 Server; 50 Trillionen Transkationen Goals of Axciom: predictive targeting, behavioural targeting, premium proprietary behavioural insights 61
Privatsphäre im Spital? Hospital caregivers made 18 comments deemed to compromise a patient s confidentiality on 13 out of 113 lift journeys. Vigod SN 2001; Ubel PA 1995; Hasman A 1997 62
Goodman s Law Je mehr Daten produziert und gespeichert werden, desto eher ist die organisierte Kriminalität willens zu konsumieren. 63
Facebook Attacken 600 000 Accounts pro Tag 1 Account alle 14 msec Verwendungszweck: Identitäts-Diebstahl, kriminelle Inpersonifizierung, Steuerbetrug, Versicherungsbetrug u.v.m. 64
IN SCREEN WE TRUST! 65
Datenmarkt Einige Preise 4 000 Follower Twitter: $5 100 Fans Facebook: $1 500 1 Mio. Freunde Instagram: $3 700 66
Hacking the Robot Cave: Internet of Things 67
Gedankenexperiment 68
Ein Wirkstoff muss nicht zwingend nur eine somatische Zelle treffen Personalisierte (targeted) Therapie Personalisierte Biowaffe 69
Datenaustausch im Gesundheitssystem: Blockchain Traditionell Blockchain 70
Datenaustausch im Gesundheitssystem Estland = Goldstandard 71
Unsere Riesenchance Elite controllers Super heroes Exceptional responders 72
Nature Reviews Cancer 2014 73
Analyse von 589,306 Genomen: identifizierte Individuen sind widerstandsfähig gegenüber schweren pädiatrischen Mendel'schen Erkrankungen Chen R 2016 74
Websuche und Pankreas Ca 75
Die Phantasie ist unendlich! "Es gibt mehr Ding' im Himmel und auf Erden, als Eure Weisheit sich träumt." - William Shakespeare, Hamlet 76
Zukunftsprognosen There is no reason anyone would want a computer in their home. (Ken Olsen, President of DEC, 1977) A rocket will never be able to leave the earth s atmosphere. (New Yorks Times, 1936) 77
The train has left the station 78
Als Download erhältlich unter: www.helsana.ch/vrp-corner 79