BMBF-Projekt Qualitätsmanagement für Hochdurchsatz-Genotypisierung



Ähnliche Dokumente
Würfelt man dabei je genau 10 - mal eine 1, 2, 3, 4, 5 und 6, so beträgt die Anzahl. der verschiedenen Reihenfolgen, in denen man dies tun kann, 60!.

Versuchsplanung SoSe 2015 R - Lösung zu Übung 1 am Autor: Ludwig Bothmann

Informationsveranstaltung Qualitätsmanagement für Hochdurchsatz-Genotypisierung

Lineare Modelle in R: Einweg-Varianzanalyse

Wiederholung und Vertiefung. Programmieren in C. Pointer und so... thoto. /dev/tal e.v. 6. April 2013 (Version vom 11. April 2013) Programmieren in C

Die Genetische Diversität Schweizer Ziegenrassen

Einfluss der genetischen Architektur auf die empirische Genauigkeit der genomischen Zuchtwertschätzung

Softwareentwicklung aus Sicht des Gehirns

Objektorientierte Programmierung

Grundlagen der Künstlichen Intelligenz

Large Scale SNP Daten beim Pferd: Erste Erfahrungen und Anwendungen

Zusammenfassung der Vorlesung vom

Besser Lernen mit digitalen Spielen? Ergebnisse eines Nationalfondsprojektes

13. Lineare DGL höherer Ordnung. Eine DGL heißt von n-ter Ordnung, wenn Ableitungen y, y, y,... bis zur n-ten Ableitung y (n) darin vorkommen.

Motivation. Wilcoxon-Rangsummentest oder Mann-Whitney U-Test. Wilcoxon Rangsummen-Test Voraussetzungen. Bemerkungen

Hämoglobinopathien - Wann soll was abgeklärt werden? Dr. phil. nat. et sc. med. S. Brunner-Agten SwissMed Lab Bern, Juni 2012

Der Einsatz von Alcohol Interlock aus eignungsdiagnostischer Sicht

Erfahrungen mit Hartz IV- Empfängern

Tipps für die praktische Durchführung von Referaten Prof. Dr. Ellen Aschermann

Einführung in LINUX Der Editor vi

Mitarbeiter der Zukunft

Primzahlen und RSA-Verschlüsselung

Neues aus der DFN-PKI. Jürgen Brauckmann

Trainingsplan 16-wöchiger Trainingsplan für einen Triathlon (Volkstriathlon), Einsteiger

8 Zugriffstypen ( Zeiger )

Enterprise Feedback Suite

Wissenschaftliche Highlights der GSF 2007

A Lösungen zu Einführungsaufgaben zu QueueTraffic

Alzheimer Demenz. Demenz - Definition. - Neueste Forschungsergebnisse - Neuropathologie der Demenz n=1050. Alzheimer Krankheit: Neuropathologie

(Repeated-measures ANOVA) path = "Verzeichnis wo Sie anova1 gespeichert haben" attach(paste(path, "anova1", sep="/"))

Architecture of Open Embedded Systems

Vorstellung des BMBF-Projektes FluSs aus Sicht eines Endanwenders. Düsseldorf Maritim-Hotel, 09. Juli 2013 Mark Zwirner

Einfache Varianzanalyse für abhängige

Stigmatisierung von Adipositas in Deutschland Ergebnisse einer repräsentativen Befragung im September 2012

Repetitionsaufgaben Wurzelgleichungen

In konstanten Modellen wird davon ausgegangen, dass die zu prognostizierende Größe sich über die Zeit hinweg nicht verändert.

Beispiel 19. December 4, 2009

Vom Vorteil der Winzigkeit

Liebe Interessierte an technischen Lösungen für die Sicherheit zu Hause,

Verwendung von LS-OPT zur Generierung von Materialkarten am Beispiel von Schaumwerkstoffen

Risiko-adaptierte Prävention am Beispiel des Mammakarzinoms

Kanton Zürich Amt für Raumentwicklung Geoinformation Gebäudeadressen in der AV

1. Was ihr in dieser Anleitung

Einige Tipps zur Präsentation von Referaten mit PowerPoint sowie zur Anfertigung schriftlicher Arbeiten


Flow Session zum Entdecken Deines idealen Lebensstils

Telefon-CPR. Telefon-CPR. Warum? Warum? Warum? Warum? Telefonreanimation Warum? Wie? Wann? Die neuen Guidelines 2010

Sportbezogene direkte Einnahmen

AUFBAUPROGRAMME YOU ONLY LIVE ONCE, BUT IF YOU DO IT RIGHT, ONCE IS ENOUGH.

Hauptprüfung Abiturprüfung 2015 (ohne CAS) Baden-Württemberg

Warum. Natural AnalyticsTM. wichtig ist

Probleme und Möglichkeiten aus Sicht der Forschung

The AuditFactory. Copyright by The AuditFactory

Thema zur PLV 2003: Korrektur- und Vorbeugemaßnahmen als unverzichtbarer Bestandteil des HACCP-Konzeptes!

1 Anregung von Oberflächenwellen (30 Punkte)

Wiederholung: Beginn

sondern alle Werte gleich behandelt. Wir dürfen aber nicht vergessen, dass Ergebnisse, je länger sie in der Vergangenheit

Theoretische und praktische Auswirkungen altersabhängiger medizinischer Reihenuntersuchungen

Ausgewählte Themen der Betriebswirtschaftslehre

Lernziele. Begriff des Kunstfehlers. Vorlesung Patientensicherheit und Risikomanagement. Patientensicherheit und Risikomanagement

Systeme 1. Kapitel 6. Nebenläufigkeit und wechselseitiger Ausschluss

Geschäftsgebäude Neustraße Dinslaken

15.3 Bedingte Wahrscheinlichkeit und Unabhängigkeit

Die Varianzanalyse ohne Messwiederholung. Jonathan Harrington. Bi8e noch einmal datasets.zip laden

Ein reales Testumfeld bereitstellen - basierend auf einer Produktionsdatenbank (ohne eine neue Kopie zu erstellen)

Richtig schalten - Strom sparen in Netzwerken Strom sparen in Netzwerken

Agile Programmierung: Case Studies

Energiemanagementsysteme

PO Doppelbrechung und elliptisch polarisiertes Licht

Cover.indd :06:56

Neue DNA Sequenzierungstechnologien im Überblick

Fachtagung, Donnerstag, 26. April 2012, Au Premier, Zürich. Bereichs- und Amtsstrategien Aufwand und Nutzen

Die Gesetzesdienstleistungen von Neosys

Lineargleichungssysteme: Additions-/ Subtraktionsverfahren

Geringfügige Beschäftigung Mini-Jobs

Das Recht auf gesundheitliche Versorgung ein Menschenrecht!

Betriebliche Gestaltungsfelder

Public-Key-Algorithmen WS2015/2016

Was ist eine gute Klinische Studie - die Sicht der Statistik. Peter Martus Institut für Biometrie und Klinische Epidemiologie

Mathematischer Vorbereitungskurs für Ökonomen

Bewertung des Blattes

Komplexe Netzwerke Robustheit

Gezielt über Folien hinweg springen

2.8 Grenzflächeneffekte

50. Mathematik-Olympiade 2. Stufe (Regionalrunde) Klasse Lösung 10 Punkte

Clustering Seminar für Statistik

Technisches Handbuch. 3. Werkstoffe. 3. Werkstoffe Schraubenwerkstoffe allgemein Festigkeitskennwerte von Schraubenwerkstoffen

Abschlussprüfung Realschule Bayern II / III: 2009 Haupttermin B 1.0 B 1.1

Summer Workshop Mehr Innovationskraft mit Change Management

Einführung ins Experimentieren. Methodenpropädeutikum II Allgemeine Psychologie. Überlegungen zum exp. Design. Adrian Schwaninger & Stefan Michel

Bündelkarteien bis zur 111mit Selbstkontrolle

Nutzung und Akzeptanz von QR-Codes

Folie 1: Fehlerbaumanalyse (FTA) Kurzbeschreibung und Ziel Die Fehlerbaumanalyse im Englischen als Fault Tree Analysis bezeichnet und mit FTA

Repräsentative Umfrage zur Beratungsqualität im deutschen Einzelhandel (Auszug)

Gibt es einen Mickey Mantle Effekt?

Hochwasser und Starkregen. Risikovorsorge Gut versichert!

Meinungen der Bürgerinnen und Bürger in Hamburg und Berlin zu einer Bewerbung um die Austragung der Olympischen Spiele

7. Europäische Druckgerätetage. Fittings-Standardbauteile. im Rohrleitungsbau

Online Intelligence Solutions TESTABLAUF. 7 Schritte für ein erfolgreiches Testing.

Transkript:

BMBF-Projekt Statusbericht TP 2 (Stats) "Informationsveranstaltung "Qualitätsmanagement für Hochdurchsatz- Genotypisierung", 21. Juni 2010, Berlin Bertram Müller-Myhsok, MPI Psychiatrie, München

Grundlegende Idee Qualitätskontrollparameter werden oftmals nach Bauchgefühl beurteilt und gesetzt Daher: Untersuchung eines bestimmten Endpunkts (zb genomic inflation factor lambda) unter verschiedenen Parameterwerten für typische Qualitätskontrollparameter (MAF, HWE [p], CR[SNP], CR[ID]) Folie 2

Datensätze Illumina (~810 cases, ~840 controls, Illumina 550, Illumina 610) Echter Phänotyp Permutierter Phänotyp Affymetrix (400 Fälle, 1644 controls, Affy 500k, RLS, Winkelmann et al. Nat Genet 2007) Echter Phänotyp Permutierter Phänotyp Folie 3

Vorgehen #!/bin/bash # script for TMF MAF='0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09 0.10 0.11 0.12 0.13 0.14 0.15' HWE='0.05 0.01 0.001 0.0001 0.00001' CR='0.50 0.52 0.54 0.56 0.58 0.60 0.62 0.64 0.66 0.68 0.70 0.72 0.74 0.76 0.78 0.80 0.82 0.84 0.86 0.88 0.90 0.92 0.94 0.96 0.98 1.00' for mind in `echo $CR`; do for geno in `echo $CR`; do for hardy in `echo $HWE`; do for minor in `echo $MAF`; do #echo $geno; #echo $mind; #echo $hardy; #echo $minor; plink pheno name CC bfile rls pheno rls.phen adjust out rls_$minor\_$hardy\_$mind\_$geno assoc geno $geno mind $mind maf $minor hwe $hardy rm *assoc; rm *adjusted; done; done; done; done; Folie 4

Procedure (2) 60840 Analysen pro Experiment Rechenzeit PLINK: 3 mins pro Analyse 126 days pro Experiment GenABEL: Rechenzeit um Faktor 30 reduziert. Folie 5

Aus beiden Illumina (~810 Fälle, ~840 Kontrollen, Illumina 550, Illumina 610) Echter Phänotyp Permutierter Phänotyp Affymetrix (400 cases, 1644 Kontrollen, Affy 500k, RLS, Winkelmann et al. Nat Genet 2007) True phenotype Permuted phenotype Generell: Permutierte Phänotypen ohne große Hinweise auf geeignete Parameterwerte (kein relevanter gerichteter Fehler) Anders: echter Phänotyp Folie 6

Genomewide Association Study Chr. MEIS1 BTBD9 MAP2K5/ LBXCOR1 3.0 log10(p) 2.0 1.0 Genomic position Winkelmann et al., Nat Genet 2007

Well known things Folie 9

Deutliche Abhängigkeiten Folie 10

Deutliche Abhängigkeiten Folie 11

Deutliche Abhängigkeiten Folie 12

Effekte sind nicht nur additiv. anova(step(lm(rls.raw$cc_0.03~(rls.raw$all_miss+rls.raw$diff_miss+rls.raw$maf+rls.raw$hwe)^2)),test="f") Response: rls.raw$cc_0.03 Df Sum Sq Mean Sq F value Pr(>F) rls.raw$all_miss 1 15720150 15720150 104108.442 < 2.2e-16 *** rls.raw$diff_miss 1 8454214 8454214 55988.971 < 2.2e-16 *** rls.raw$maf 1 97528 97528 645.888 < 2.2e-16 *** rls.raw$hwe 1 4007 4007 26.535 2.588e-07 *** rls.raw$all_miss:rls.raw$diff_miss 1 12082754 12082754 80019.380 < 2.2e-16 *** rls.raw$all_miss:rls.raw$maf 1 2037105 2037105 13490.957 < 2.2e-16 *** rls.raw$all_miss:rls.raw$hwe 1 778955 778955 5158.715 < 2.2e-16 *** rls.raw$diff_miss:rls.raw$maf 1 2501504 2501504 16566.488 < 2.2e-16 *** rls.raw$diff_miss:rls.raw$hwe 1 71036 71036 470.441 < 2.2e-16 *** Folie 13

Was kann man lernen? Folie 14

Aus den Daten selbst? SNP CR 0.97 Change point analysis (R package bcp V 2.1.3), Parameter varying here Call rate per SNP, other parameters: Ind CR 0.96, HWE 1e 5, MAF 0.02 Folie 15

Die Daten selbst gehen gelegentlich eine deutliche Antwort Change point analysis (R package bcp V 2.1.3), Parameter varying here MAF (from 0.01 to 0.49, other parameters: Ind CR 0.95, HWE 1e 5, SNP CR 0.90 Folie 16

Zusammenfassung Permutierte Phänotypen: keine systematischen Fehler Echte Phänotypen Möglichkeit systematischer Fehler: Alle Parameter können eine Rolle spielen Evtl Information aus den Daten selbst (changepoint Analysis) Rechenintensiv GPGPU? Folie 17