Workshop: Datenbank genomischer Varianten für die klinische Anwendung und die medizinische Forschung Essen 19. März 2014 Humane Genotyp-Phänotyp-Datenbanken: Ein Statusbericht Thomas Bettecken Max-Planck-Institut für Psychiatrie München Interessenkonflikte (coi): Keine
Klinische Bedeutung genomischer Varianten Sequenz-Varianten im menschlichen Genom 62.676.337 (44.278.189) 22.508.883 Varianten mit rs-nr. (validierte) davon in Genen (exemplarisch - dbsnp build 138 April 2013) Es gibt noch viel mehr Varianten im Genom! Hat eine Variante eine Bedeutung im Hinblick auf Gesundheit und Krankheit? Welche Bedeutung? Workshop 19. März 2014 Essen Seite 2
17,580 SNPs in einer 1 MBasen-Region (16p) 3,449 SNPs (~20%) kommen in 1092 Individuen nur einmal vor Workshop 19. März 2014 Essen Seite 3
Genetische Datenbanken Zytogenetik Erstes Karyogramm des Menschen (Tao C Hsu 1952) / Homo sapiens 46 Chromosomen (Joe Hin Tjio 1956) Down-Syndrom (Jerome Lejeune et al. 1959) Catalogue of Unbalanced Chromosome Aberrations in Man (Albert Schinzel 1984) Molekulargenetik DNA-Sequenzierung (Frederick Sanger, Allan Maxam und Walter Gilbert 1977) Erste Mutation auf DNA-Ebene: Im Insulin-Gen eines Diabetes- Patienten (Simon CM Kwok et al. 1983) Human Gene Mutation Database HGMD (David N Cooper und Michael Krawczak 1993) Workshop 19. März 2014 Essen Seite 4
Unbekannte Variante / Mutation - Was tun? z.b. Stop-Codon- oder Frameshift-Mutation in einem neuen Gen. Vor Ort kein zweiter Fall bekannt (derselbe Phänotyp - dieselbe Mutation / ähnlicher Phänotyp gleich gelagerte Mutation). Welche Vergleichsmöglichkeiten (Datenbanken, ) gibt es? There is no One-Stop-Shop! Workshop 19. März 2014 Essen Seite 5
Genotyp-Phänotyp-Datenbanken I Locus-übergreifende Datenbanken mit Phänotyp-Info Human Gene Mutation Database HGMD (professionell Version) 136,000+ SNV plus CNV, 5300+ Gene (???), sehr sorgfältig annotiert (alles aus der Literatur) ClinVar 75,299 SNV+CNV, 18,701 Gene, limitierte Phänotyp-Information OMIM 17,694 SNV + CNV (die meisten davon kausal), 3,174 Gene mit ausgewählten kausalen Mutationen, 4,000+ Phänotyp-Beschreibungen mit bekannter molekularer Ursache, insgesamt 14,000+ Gene Exome Variant Server EVS / Exome Sequencing Project ESP Alle Exom-Varianten von 6503 Individuen, Phänotyp-Focus: Blut-, Herz und Lungenerkrankungen, aber auch CF und wenige andere seltene Erkrankungen SNV Single Nucleotide Variants CNV Copy Number Variants Workshop 19. März 2014 Essen Seite 6
Genotyp-Phänotyp-Datenbanken II Locus-übergreifende Datenbanken mit Phänotyp-Info Database of Genotypes and Phenotypes - dbgap Ergebnisse aus GWAS (Schwerpunkt) und Diagnostischer Sequenzierung, z.zt. 25,121 SNV+CNV GeneReviews Sehr sorgfältige, über Jahre hinweg, erstellte und ausführliche Beschreibungen von 600+ erblichen Erkrankungen, mit Phänotyp-Info. Mutationen sind nur selektiv verzeichnet. Im Stil ähnlich einem Lehrbuch. Orphanet / Orphadata Genzentrierte Datenbank, mit Phänotyp-Beschreibungen, Links zu Locusspezifischen Datenbanken und zu Einsendern ( Broker-Funktion ). Gen2Phen Projekt zur Erstellung/Bereitstellung der Infrastruktur für eine Genotyp-/Phänotyp-Datenbank, mit dezentraler Eintragung (Cafe Variome). Workshop 19. März 2014 Essen Seite 7
Genotyp-Phänotyp-Datenbanken III Locus-Spezifische Datenbanken (LSDB) 1. LOVD Leiden Open Variation Database (Univ. Leiden, NL) Quelloffenes Datenbanksystem, z.zt. 2,124,696 Varianten in >22,000 Genen aus 180,656 Individuen, verzeichnet in ~90 dezentralen LOVD Installationen. 2. PhenCode (Penn State Univ. & Univ. of California SC, USA) Links zu krankheitsspezifischen Gen- und Mutationsdatenbanken einschließlich Swissprot, z.zt. 34,213 Varianten in 1,386 Genen, plus Swissprot: 56,396 Varianten in 11,343 Genen. Workshop 19. März 2014 Essen Seite 8
Genotyp-Phänotyp-Datenbanken IV Varianten-Datenbanken ohne Phänotyp-Eintrag 1000 Genomes Project Genomweite Sequenzdaten von z. Zt. 1,092 Individuen (Phase 1, geplant sind 2,577 Individuen) dbsnp (z.zt. 62,676,337 Einträge für genomische Varianten) Sammlung von Sequenz-Varianten, Locus-abhängige Anzahl an Individuen Workshop 19. März 2014 Essen Seite 9
Genotyp-Phänotyp-Datenbanken V Weitere (u.a. DmuDB, DECIPHER) Diverse kommerzielle Datenbanken / Lösungen Und die Schubladen der Kollegen (Varianten in Auswertung, nichtpublizierte / ungelöste Fälle,.) Workshop 19. März 2014 Essen Seite 10
Zusammenfassung 1. Es existieren eine ganze Reihe großer Genotyp-Phänotyp- Datenbanken. 2. Diese Datenbanken sind leider weitgehend unvernetzt (kein One-Stop-Shopping ). 3. Sehr viele Varianten/Mutationen befinden sich noch in Auswertung, i.e. sie sind zwar erkannt, aber noch nicht abschließend interpretiert und nicht in Datenbanken verzeichnet. 4. Die Zahl der Varianten in Auswertung wächst stark mit zunehmender Anwendung der NGS. Workshop 19. März 2014 Essen Seite 11
Vielen Dank für Ihre Aufmerksamkeit! Diese Präsentation ist demnächst verfügbar: www.tmf-ev.de bettecken@mpipsykl.mpg.de