QTL-Mapping und Genomweite Assoziationsstudien Birgit Gredler-Grandl Qualitas AG Birgit Gredler-Grandl Folien ZL I+II LFW C 27. Nov. 205
Prüfung 8.2.205 90 min, 09:5 0:45 Keine Hilfsmittel Nicht programmierbarer Taschenrechner erlaubt Legitimationskarte mitbringen Eine gemeinsame Prüfung für Züchtungslehre I und II Qualitas AG Birgit Gredler-Grandl Folien ZL I+II LFW C 27. Nov. 205 2
Heutige Vorlesung Frage von der letzten Einheit: Wie funktioniert die SNP-Genotypisierung? QTL-Mapping Genomweite Assoziationsstudien Qualitas AG Birgit Gredler-Grandl Folien ZL I+II LFW C 27. Nov. 205 3
SNP Punktuelle Veränderungen einer Base in der DNA- Sequenz (Punktmutation) Base Cytosin wurde durch Base Thymin ersetzt wikipedia.org SNP sind diallel treten nur in 2 Allel-Varianten auf 3 Genotypen: AA AT TT Seefried, 205 Qualitas AG Birgit Gredler-Grandl Folien ZL I+II LFW C 27. Nov. 205 4
SNP-Genotypisierung Einzelstrang DNA von der Probe (z.b. Stier) SNP-Position Methode stützt sich auf dem Prinzip, dass DNA-Basen komplementär sind (A-T, C-G) Glaskügelchen Bead Am Bead hängt probe (Oligonucleotid = synthetisches einzelsträngiges DNA-Molekül, Probe hört genau Base vor SNP- Position auf ) LaFramboise T Nucl. Acids Res. 2009;37:48-493 Qualitas AG Birgit Gredler-Grandl Folien ZL I+II LFW C 27. Nov. 205 5
SNP-Genotypisierung Ausgangspunkt bildet biologisches Material Haarprobe entnehmen 50-00 Haarwurzeln Haare auf Haarkarte kleben Tier-ID aufkleben Versand der Probe zu Geneseek (USA) zur DNA-Extraktion und Genotypisierung http://homepage.braunvieh.ch/documents/ Probenahme_Haarprobe.pdf http://www.neogen.com/genomics/ Qualitas AG Birgit Gredler-Grandl Folien ZL I+II LFW C 27. Nov. 205 6
Illumina Typisierung Workflow http://www.illumina.com/documents/products/workflows/workflow_infinium_ii.pdf Qualitas AG Birgit Gredler-Grandl Folien ZL I+II LFW C 27. Nov. 205 7
SNP-Genotypisierung 750 ng DNA werden benötigt Nanogramm (ng) = Milliardstel Gramm DNA wird amplifiziert DNA-Amplifikation: DNA wird vervielfältigt (kopiert) z.b. Polymerasekettenreaktion (PCR) wikipedia.org Qualitas AG Birgit Gredler-Grandl Folien ZL I+II LFW C 27. Nov. 205 8
SNP-Genotypisierung DNA wird fragmentiert (3) Alkoholfällung und Resuspension (4) Vorbereitung Bead-Chip (5) (6) Beadchip wird mit Proben-DNA versetzt und es kommt zur Hybridisierung (komplementärer Einzelstrang lagert sich an); Es befinden sich sehr, sehr viele Oligonucleotide auf dem Bead Für jeden SNP je ein spezifischer Bead mit Oligonucleotide Qualitas AG Birgit Gredler-Grandl Folien ZL I+II LFW C 27. Nov. 205 9
SNP-Genotypisierung Zugabe von DNA-Einzelbasen Einfärben mit Fluoreszenzmittel Unterschiedliche Farbe je nach Base Farbintensitäten werden ausgwertet Qualitas AG Birgit Gredler-Grandl Folien ZL I+II LFW C 27. Nov. 205 0
QTL-mapping Grundprinzip: Vergleich von Mittelwerten Qualitas AG Birgit Gredler-Grandl Folien ZL I+II LFW C 27. Nov. 205
Versuchsdesigns QTL-mapping Mapping von QTLs welche ZWISCHEN Populationen segregieren QTLs, welche Unterschiede zwischen Populationen erklären Populationen mit extrem unterschiedlichen Phänotypen z.b. Kreuzungen von Inzuchtlinien Mapping von QTLs welche INNERHALB von Populationen segregieren QTLs, welche genetische Variation innerhalb Population erklären Zuchtpopulationen (Rind,...) z.b. Töchterdesign (daughter design), Enkelinnendesign (granddaughter design) Qualitas AG Birgit Gredler-Grandl Folien ZL I+II LFW C 27. Nov. 205 2
Kreuzungen von Inzuchtlinien Pflanzen Modellorganismen (z.b. Mäuse, Drosophila) Ziel: QTL finden, welche in den Linien unterschiedlich sind Sehr oft wird ein F backcross Design angewandt Qualitas AG Birgit Gredler-Grandl Folien ZL I+II LFW C 27. Nov. 205 3
Kreuzungen von Inzuchtlinien Inzuchtlinien... sind genetisch uniform sind fixiert für das alternative QTL-Allel (d.h. QTLs unterscheiden sich zwischen den Inzuchtlinien) Zeigen extrem unterschiedlichen Phänotyp Alle F-Individuen sind heterozygot am Marker Kopplungsphase zw. Marker und QTL ist identisch bei allen F-Individuen à vollständiges Linkage disequilibrium Qualitas AG Birgit Gredler-Grandl Folien ZL I+II LFW C 27. Nov. 205 4
F backcross Design Linie Linie 2 Eltern M Q X M Q Qualitas AG Birgit Gredler-Grandl Folien ZL I+II LFW C 27. Nov. 205 5
F backcross Design Linie Linie 2 Eltern M Q X M Q F M Q F alle heterozygot am Marker und QTL Qualitas AG Birgit Gredler-Grandl Folien ZL I+II LFW C 27. Nov. 205 6
F backcross Design Linie Linie 2 Eltern M M Q Q X F Linie 2 M Q X Backcross Qualitas AG Birgit Gredler-Grandl Folien ZL I+II LFW C 27. Nov. 205 7
F backcross Design Linie Linie 2 Eltern M M Q Q X F Linie 2 M Q X Backcross F2 M Q M Q Qualitas AG Birgit Gredler-Grandl Folien ZL I+II LFW C 27. Nov. 205 8
F backcross Design Linie Linie 2 Eltern M M Q Q X F Linie 2 M Q X Backcross F2 M Q M Q Vergleichen der Mittelwerte der am Marker Heterozygoten und Homozygoten Qualitas AG Birgit Gredler-Grandl Folien ZL I+II LFW C 27. Nov. 205 9
Wiederholung... Qualitas AG Birgit Gredler-Grandl Folien ZL I+II LFW C 27. Nov. 205 20
Qualitas AG Birgit Gredler-Grandl 27. Nov. 205 2 Folien ZL I+II LFW C
Qualitas AG Birgit Gredler-Grandl 27. Nov. 205 22 Folien ZL I+II LFW C
F backcross Design Eltern Linie M M Q Q F X Linie 2 Linie 2 Q = +500 = 500 M Q X -500 0 +500 -a d +a F2 M Q M Q x = m + 0 x = m 000 Qualitas AG Birgit Gredler-Grandl Folien ZL I+II LFW C 27. Nov. 205 23
F backcross Design Linie Linie 2 Eltern M M Q Q F X Linie 2 Rekombinante Haplotypen M Q X F2 M Q M Q x m + 0 x m 000 Qualitas AG Birgit Gredler-Grandl Folien ZL I+II LFW C 27. Nov. 205 24
Rekombination M Q X M Q Nicht-Rekombinate Häufigkeit = -r M Rekombinate Häufigkeit = r Q r = Anzahl an rekombinanten Haplotypen Anzahl an rekombinanten und nicht-rekombinanten Haplotypen Qualitas AG Birgit Gredler-Grandl Folien ZL I+II LFW C 27. Nov. 205 25
F backcross Design Folgende Hypothese wird getestet: H0: Mittelwerte beider Gruppen (M und ) sind gleich (à kein QTL) H0: Differenz zwischen M und = 0 Qualitas AG Birgit Gredler-Grandl Folien ZL I+II LFW C 27. Nov. 205 26
Pr(Q M ) = Pr(Q M ) Pr(M ) Geno- Probabilities Effect Expected marker type Marker Marker + QTL QTL marker mean M 0.5 (-r)/2 (-r) = m+d m + (-r)d - ra Q M r/2 r m-a 0.5 r/2 r = m+d m + rd - (- r)a Q (-r)/2 (-r) m-a Sum.0.0 2.0 Qualitas AG Birgit Gredler-Grandl Folien ZL I+II LFW C 27. Nov. 205 27
Töchterdesign (daughter design) Markergenotypen eines Stieres und seiner Töchter werden analysiert, um den Zusammenhang zwischen Marker und QTL zu untersuchen Töchter werden an Markern genotypisiert und auf Basis der Allele gruppiert und ihre Leistungen gemessen. Stier muss am Markerlocus (M ) heterozygot sein Zum Auffinden QTL-bedingter Leistungsunterschiede muss auch am QTL-Locus (Q ) heterozygot sein Qualitas AG Birgit Gredler-Grandl Folien ZL I+II LFW C 27. Nov. 205 28
Töchterdesign (daughter design) M?? M x x? x? x Folie: M. Dolezal Qualitas AG Birgit Gredler-Grandl Folien ZL I+II LFW C 27. Nov. 205 29
Töchterdesign (daughter design) M Q M x Q x x x Folie: M. Dolezal Qualitas AG Birgit Gredler-Grandl Folien ZL I+II LFW C 27. Nov. 205 30
Töchterdesign (daughter design) Sehr grosse Anzahl an genotypisierten Töchtern nötig Zuordnung der Töchter in Gruppen problematisch: Rekombination Töchter haben gleichen Markergenotyp wie der Vater (M ) à es kann nicht entschieden werden, welches Allel vom Vater kommt und Töchter sind nicht informativ Stier ist nicht heterozygot am QTL (M Q / Q oder M / ) à Töchter unterscheiden sich nicht hinsichtlich QTL Qualitas AG Birgit Gredler-Grandl Folien ZL I+II LFW C 27. Nov. 205 3
Markergestützte Selektion P = G +QTL +U BLUP Zuchtwertschätzung: es wird neben dem additivgenetischen Effekt (polygene Effekt) des Tieres auch der Effekt des QTL-Genotyps (bzw. Marker) berücksichtigt à marker-unterstützter BLUP-Zuchtwertschätzung (MA- BLUP) Geschätzter Zuchtwert = polygene + QTL-spezifische Zuchtwertkomponente Qualitas AG Birgit Gredler-Grandl Folien ZL I+II LFW C 27. Nov. 205 32
Populationsweite genomweite Assoziationsstudien Whole genome-wide association studies (GWAS) Qualitas AG Birgit Gredler-Grandl Folien ZL I+II LFW C 27. Nov. 205 33
Genomweite Assoziationsstudien Bis jetzt oft nur einige wenige Marker getestet Innerhalb Familien Durch die Entwicklung von SNP Chips stehen tausende von SNP Marker für das Testen des Zusammenhanges zwischen Marker (QTL) und Phänotyp zur Verfügung Assoziationen: Direkte Assoziation: Polymorphismus (SNP) ist selbst die ursächliche Variante (d.h. Marker = QTL) Indirekte Assoziation: Polymorphismus (SNP) ist teilweise oder in vollständigem LD mit QTLs Qualitas AG Birgit Gredler-Grandl Folien ZL I+II LFW C 27. Nov. 205 34
Genomweite Assoziationsstudien Voraussetzung für GWAS ist LD zwischen Marker und QTL QTL-Mapping basierend auf LD zeigt Assoziationen zwischen Marker und QTL auf Populationsebene: Assoziationen treten auf, weil kurze Chromosomenstücke in der gesamten Population vorhanden sind, welche vom gleichen gemeinsamen Ahnen stammen Qualitas AG Birgit Gredler-Grandl Folien ZL I+II LFW C 27. Nov. 205 35
Genomweite Assoziationsstudien Voraussetzung für GWAS ist LD QTL-Mapping basierend auf LD zeigt Assoziationen zwischen Marker und QTL auf Populationsebene: Assoziationen treten auf, weil kurze Chromosomenstücke in der gesamten Population vorhanden sind, welche vom gleichen gemeinsamen Ahnen stammen Diese Chromosomenstücke tragen die gleichen Marker Allele (ohne Rekombination) Qualitas AG Birgit Gredler-Grandl Folien ZL I+II LFW C 27. Nov. 205 36
Genomweite Assoziationsstudien Voraussetzung für GWAS ist LD QTL-Mapping basierend auf LD zeigt Assoziationen zwischen Marker und QTL auf Populationsebene: Assoziationen treten auf, weil kurze Chromosomenstücke in der gesamten Population vorhanden sind, welche vom gleichen gemeinsamen Ahnen stammen Diese Chromosomenstücke tragen die gleichen Marker Allele (ohne Rekombination) Wenn ein QTL innerhalb Chromosomenstück vorkommt, sind auch die QTL-Allele gleich Qualitas AG Birgit Gredler-Grandl Folien ZL I+II LFW C 27. Nov. 205 37
GWAS mit Single-SNP Regression y = n µ + Xg + e y = Vektor mit Phänotyp (Merkmalswerte) n = Vektor von, teilt die Phänotypwerte y dem Mittelwert zu X = Designmatrix, teil Phänotypwerte den Genotypen (SNP Marker) zu g = fixer Effekt des SNP (Markers) e = zufälliger Fehler Qualitas AG Birgit Gredler-Grandl Folien ZL I+II LFW C 27. Nov. 205 38
GWAS mit Single-SNP Regression y = n µ + Xg + e y = Vektor mit Phänotyp (Merkmalswerte) n = Vektor von, teilt die Phänotypwerte y dem Mittelwert zu X = Designmatrix, teil Phänotypwerte den Genotypen (SNP Marker) zu g = fixer Effekt des SNP (Markers) e = zufälliger Fehler Annahme: Marker beeinflusst den Phänotyp nur, wenn er im LD mit einem nicht beobachteten QTL ist. Qualitas AG Birgit Gredler-Grandl Folien ZL I+II LFW C 27. Nov. 205 39
Ein Beispiel Tier Phänotyp SNP Allel SNP Allel 2 2.030502 2 3.542274 2 3 3.83424 2 4 4.8737 2 2 5 3.40728 2 6 2.335734 7 2.64692 8 3.762855 2 9 3.689349 2 0 3.685757 2 Qualitas AG Birgit Gredler-Grandl Folien ZL I+II LFW C 27. Nov. 205 40
Ein Beispiel Tier Phänotyp SNP Allel SNP Allel 2 2.030502 2 3.542274 2 3 3.83424 2 4 4.8737 2 2 5 3.40728 2 6 2.335734 7 2.64692 Schätzen des Mittelwerts und des SNP Effektes 8 3.762855 2 9 3.689349 2 0 3.685757 2 Qualitas AG Birgit Gredler-Grandl Folien ZL I+II LFW C 27. Nov. 205 4
Ein Beispiel Tier Phänotyp SNP Allel SNP Allel 2 2.030502 2 3.542274 2 3 3.83424 2 4 4.8737 2 2 5 3.40728 2 6 2.335734 7 2.64692 8 3.762855 2 9 3.689349 2 0 3.685757 2 Schätzen des Mittelwerts und des SNP Effektes Hypothesentestung: H0: Der SNP Marker hat keinen Einfluss auf das Merkmal H: Der SNP Marker hat einen Einfluss auf das Merkmal (weil er in LD mit QTL ist) Qualitas AG Birgit Gredler-Grandl Folien ZL I+II LFW C 27. Nov. 205 42
GWAS mit Single-SNP Regression y = n µ + Xg + e Lösen des Gleichungssystems ˆµ ĝ = ' n n X ' n n ' X X ' X n ' y X ' y Qualitas AG Birgit Gredler-Grandl Folien ZL I+II LFW C 27. Nov. 205 43
Single-SNP Regression - ein Beispiel ˆµ ĝ = ' ' n n n X X ' n X ' X Tier Phänotyp SNP Allel SNP Allel 2 2.030502 2 3.542274 2 3 3.83424 2 4 4.8737 2 2 5 3.40728 2 6 2.335734 7 2.64692 8 3.762855 2 9 3.689349 2 0 3.685757 2 n = Qualitas AG Birgit Gredler-Grandl Folien ZL I+II LFW C 27. Nov. 205 44 n ' y X ' y
Single-SNP Regression - ein Beispiel ˆµ ĝ = ' ' n n n X X ' n X ' X n ' y X ' y Tier Phänotyp SNP Allel SNP Allel 2 2.030502 2 3.542274 2 3 3.83424 2 4 4.8737 2 2 5 3.40728 2 6 2.335734 7 2.64692 8 3.762855 2 9 3.689349 2 0 3.685757 2 y = 2.030502 3.542274 3.83424 4.8737 3.40728 2.335734 2.64692 3.762855 3.689349 3.685757 Qualitas AG Birgit Gredler-Grandl Folien ZL I+II LFW C 27. Nov. 205 45
Ein Single-SNP Regression - ein Beispiel ˆµ ĝ = ' ' n n n X X ' n X ' X X ordnet Phänotypen den Genotypen zu Tier Phänotyp SNP Allel SNP Allel 2 2.030502 2 3.542274 2 3 3.83424 2 4 4.8737 2 2 5 3.40728 2 6 2.335734 7 2.64692 8 3.762855 2 9 3.689349 2 0 3.685757 2 SNP = biallelisch Allele werden als und 2 kodiert X zählt die Anzahl an Kopien von Allel 2 0 = homozygot für Allel = heterozygot 2 = homozygot für Allel 2 Qualitas AG Birgit Gredler-Grandl Folien ZL I+II LFW C 27. Nov. 205 46 n ' y X ' y X = 0 2 0 0
Qualitas AG Birgit Gredler-Grandl 27. Nov. 205 47 Single-SNP Regression - ein Beispiel Folien ZL I+II LFW C ˆµ ĝ = n ' n n ' X X ' n X ' X n ' y X ' y =0
Single-SNP Regression - ein Beispiel ˆµ ĝ = ' ' n n n X ' n y X ' n X ' X X ' y Qualitas AG Birgit Gredler-Grandl Folien ZL I+II LFW C 27. Nov. 205 48
Qualitas AG Birgit Gredler-Grandl 27. Nov. 205 49 Single-SNP Regression - ein Beispiel Folien ZL I+II LFW C ˆµ ĝ = n ' n n ' X X ' n X ' X n ' y X ' y 0 2 0 0 0 2 0 0 =0
Single-SNP Regression - ein Beispiel ˆµ ĝ = ' n n X ' n n ' X X ' X n ' y X ' y ˆµ ĝ = 0 8 8 0 33.8 3.7 Qualitas AG Birgit Gredler-Grandl Folien ZL I+II LFW C 27. Nov. 205 50
Single-SNP Regression - ein Beispiel ˆµ ĝ ˆµ ĝ ˆµ ĝ = ' n n X ' n n ' X X ' X = 0 8 8 0 = 0.28 0.22 0.22 0.28 n ' y X ' y 33.8 3.7 33.8 3.7 Qualitas AG Birgit Gredler-Grandl Folien ZL I+II LFW C 27. Nov. 205 5
Single-SNP Regression - ein Beispiel ˆµ ĝ = ' n n X ' n n ' X X ' X n ' y X ' y ˆµ ĝ = 0.28 0.22 0.22 0.28 33.8 3.7 ˆµ ĝ = 2.35.28 Qualitas AG Birgit Gredler-Grandl Folien ZL I+II LFW C 27. Nov. 205 52
Ist der Effekt des SNP Markers signifikant? Hypothesentestung - Signifikanztest Das Grundprinzip der Hypothesentestung liegt in der Ermittlung des Übereinstimmungsgrades zwischen einer über einen Sachverhalt aufgestellten Hypothese und einem hierzu beobachtbaren Stichprobenereignis Qualitas AG Birgit Gredler-Grandl Folien ZL I+II LFW C 27. Nov. 205 53
Hypothesentestung - Signifikanztest Frage: Hat der SNP Genotyp einen Einfluss auf den Phänotyp? Nullhypothese H0: Genotyp hat keinen Einfluss auf den Phänotyp Alternativhypothese H: Genotyp hat einen Einfluss auf den Phänotyp Qualitas AG Birgit Gredler-Grandl Folien ZL I+II LFW C 27. Nov. 205 54
Hypothesentestung - Signifikanztest Zwei Arten von Fehlern: Fehler. Art ( falsch positive ) Wir schliessen, dass der SNP Genotyp einen Einfluss hat, aber in Wirklichkeit hat er keinen Einfluss (H0 wird abgelehnt) Fehler 2. Art ( falsch negative ) SNP Genotyp hat tatsächlich einen Effekt, wird aber nicht entdeckt (H0 wird angenommen) Qualitas AG Birgit Gredler-Grandl Folien ZL I+II LFW C 27. Nov. 205 55
Hypothesentestung - Signifikanztest Zwei Arten von Fehlern H0: Es gibt keinen Effekt Wirklichkeit Testergebnis Kein Effekt Effekt H0 abgelehnt Fehler. Art Korrekt J H0 angenommen Korrekt J Fehler 2. Art Qualitas AG Birgit Gredler-Grandl Folien ZL I+II LFW C 27. Nov. 205 56
Hypothesentestung - Signifikanztest P-Wert Gibt die Wahrscheinlichkeit an, dass die beobachteten Effekte aus dem Testergebnis rein durch Zufall zustande kommen in Wirklichkeit existiert kein Effekt (H0 ist wahr) Signifikanzniveau/Irrtumswahrscheinlichkeit α: Die Wahrscheinlichkeit, dass wir einen Fehler. Art begehen (H0 verworfen obwohl tatsächlich kein Effekt) darf maximal 5,, 0.... sein Wenn der P-Wert kleiner ist als die festgelegte Irrtumswahrscheinlichkeit (Fehler. Art) α, dann lehnen wir die Nullhypothese ab und glauben an einen Effekt Qualitas AG Birgit Gredler-Grandl Folien ZL I+II LFW C 27. Nov. 205 57