QTL-Mapping und Genomweite Assoziationsstudien

Ähnliche Dokumente
Foto: Kate Whitley,

Pharmazeutische Biologie WS2011/2012. Das neue Paradigma: Personalisierte Medizin

Übung 8 vom Linkage Disequilibrium GWAS Single-SNP-Regression

Aktuelle Arbeiten zur genomischen Selektion bei Qualitas

Genetische Analyse des Freiberger-Pferdes mit genomweiten SNP-Daten. Berner Fachhochschule, Schweizerische Hochschule für Landwirtschaft, Zollikofen 2

molekularen Rinderzucht

Voraussetzungen für die Genomische Selektion beim Pferd

Zuchtwertschätzung mit Best Linear Unbiased Prediction Verfahren

Assoziationsstudien. Prof. DI Dr. Andrea Berghold Institut für Med. Informatik, Statistik und Dokumentation

Zukunftsperspektiven in der Zuchtwertschätzung

Genetische Epidemiologie. Prof. DI Dr. Andrea Berghold Institut für Med. Informatik, Statistik und Dokumentation

Statistische Tests (Signifikanztests)

Analytische Statistik II

Statistische Analyse von hochdimensionalen Daten in der Bioinformatik

Vorlesung 2 GRUNDLAGEN

Statistik II für Betriebswirte Vorlesung 1

Algorithms for Regression and Classification

GRUNDPRINZIPIEN statistischen Testens

Typ I und Typ II Fehler

Methodenlehre. Vorlesung 12. Prof. Dr. Björn Rasch, Cognitive Biopsychology and Methods University of Fribourg

4. Kopplung. Konzepte: Gekoppelte Vererbung. Genkarten. Doppel-Crossover. Interferenz. Statistik

Inferenzstatistik und Hypothesentests. Hierbei geht es um die Absicherung eines Untersuchungsergebnisses gegen ein Zufallsereignis.

Themenblock Moderne Methoden in der. Vortrag: Markergestützte Selektion (MAS)

Züchtungslehre - Genomische Selektion Peter von Rohr

Zuchtwertschätzung Erläuterungen zu den Zuchtwerten bei swissherdbook

Statistische Überlegungen: Eine kleine Einführung in das 1 x 1

Ausgewählte Kapitel der Populationsgenetik

Methodenlehre. Vorlesung 11. Prof. Dr. Björn Rasch, Cognitive Biopsychology and Methods University of Fribourg

2. Formulieren von Hypothesen. Nullhypothese: H 0 : µ = 0 Gerät exakt geeicht

Gentestentwicklung zur Eradikation der Caroli-Leberfibrose (CLF) beim Freiberger Pferd

Swiss Low Input Genetics (SLIG):

Beurteilende Statistik

Methodenlehre. Vorlesung 10. Prof. Dr. Björn Rasch, Cognitive Biopsychology and Methods University of Fribourg

Mögliche Fehler beim Testen

Genetik. Biologie. Zusammenfassungen. Prüfung 31. Mai Begriffserklärung. Dominant-Rezessiver Erbgang. Intermediärer Erbgang. Dihybrider Erbgang

Statistiktutorium (Kurs Frau Jacobsen)

Statistik II. IV. Hypothesentests. Martin Huber

Genetische Individualisierung - Möglichkeiten und Grenzen aus technischer und ethischer Sicht

3. Das Prüfen von Hypothesen. Hypothese?! Stichprobe Signifikanztests in der Wirtschaft

Gekoppelte Vererbung. Genkarten. Doppel Crossover. Interferenz

Statistik II: Signifikanztests /1

Genombasierte Selektion: neue Perspektiven für Zuchtwertschätzung und Zuchtprogramme

Züchtungslehre - Eigenschaften von BLUP-Zuchtwerten Peter von Rohr

Diskrete dynamische Systeme in der Populationsgenetik Hofbauer J., und Sigmund K.: Evolutionary Games and Population Dynamics, Cambridge

2) Können Sie allein aus den gegebenen Zahlen ablesen welches der beiden Allele einen Selektionsvorteil besitzt?

Statistik und Wahrscheinlichkeitsrechnung

Primer: Inferenzstatistik 1.0

R. Brinkmann Seite

Methodenlehre. Vorlesung 12. Prof. Dr. Björn Rasch, Cognitive Biopsychology and Methods University of Fribourg

Entscheidung zwischen zwei Möglichkeiten auf der Basis unsicherer (zufälliger) Daten

Statistisches Testen

4. Kopplung. Konzepte: Gekoppelte Vererbung. Doppel-Crossover. Genkarten. Interferenz Statistik

Testen von Hypothesen, Beurteilende Statistik

Schließende Statistik: Hypothesentests (Forts.)

Entscheidungsstatistische Verfahren

Mathematische und statistische Methoden II

Vergleich zweier Stichproben

Gregor Mendel. Gregor Mendel

Pflichtlektüre: Kapitel 12 - Signifikanztest Wie funktioniert ein Signifikanztest? Vorgehensweise nach R. A. Fisher.

Statistik-Klausur I E SS 2010

R. Brinkmann Seite

Inhalt des Vortrags. o genetische Grundlagen. o Wie findet man Erbfehler? o Zusammenfassung. Was ist ein Haplotyp?

Genotypwahrscheinlichkeiten. für Linsenluxation beim Deutschen Jagdterrier

Prüfung aus Wahrscheinlichkeitstheorie und Statistik MASCHINENBAU 2003

Grundlagen der Vererbungslehre

10 Der statistische Test

4.1. Nullhypothese, Gegenhypothese und Entscheidung

Auswertung und Lösung

Labortechniken (2) Amplifikationskurve (linear linear) Realtime-PCR

Zuchtziele und Zuchtmethoden der Zukunft

Güteanalyse. Nochmal zur Erinnerung: Hypothesentest. Binominalverteilung für n=20 und p=0,5. Münzwurf-Beispiel genauer

73 Hypothesentests Motivation Parametertest am Beispiel eines Münzexperiments

Die Grundlagen der genomischen Selektion. Jörn Bennewitz. Institut für Tierhaltung und Tierzüchtung Universität Hohenheim

Pinschertage der OG Bonn Grundlagen der Zucht

Genombasierte Selektion: neue Ansätze in der Rinderzüchtung - ein aktueller Überblick -

Unterschiedshypothesen Vergleiche von Häufigkeiten bzw. Mittelwerten zwischen (mindestens) zwei Gruppen Zusammenhangshypothesen Korrelationsanalysen

Möglichkeiten und Grenzen der Anwendung molekularer Marker in der Zierpflanzenzüchtung

Biologie I/B: Klassische und molekulare Genetik, molekulare Grundlagen der Entwicklung Tutorium SS 2016

SNPs, Indels, VNTRs. Gründe für ein Interesse an der genetischen Diversität

das Kleingedruckte...

WB 11 Aufgabe: Hypothesentest 1

Molekulare Genetik und Zellbiologie. Versuch 5 Präparation und Amplifikation menschlicher DNA. DNA Fingerprint VNTR-Analyse

5. Seminar Statistik

Welche(s) Paar(e) ist(sind) denn nun signifikant verschieden?

Mendel Gregor Mendel (*1822, 1884)

2. Lösung weitere Übungsaufgaben Statistik II WiSe 2016/2017

Kapitel 7. Regression und Korrelation. 7.1 Das Regressionsproblem

Gepaarter und ungepaarter t-test. Statistik (Biol./Pharm.) Herbst 2012

Statistische Tests. Kapitel Grundbegriffe. Wir betrachten wieder ein parametrisches Modell {P θ : θ Θ} und eine zugehörige Zufallsstichprobe

Histokompatibilität: tibilität die Verträglichkeit i zwischen Spenderu. Empfängergeweben bei Organtransplantation. Beruht auf

Einführung in Quantitative Methoden

Die Genetische Diversität Schweizer Ziegenrassen

3 Grundlagen statistischer Tests (Kap. 8 IS)

Zuchtwertschätzung für Milchleistungsmerkmale für die drei Hauptrassen des Schweizerischen Ziegenzuchtverbandes (SZZV)

Die Erbinformation ist in Form von Chromosomen = Kopplungsgruppen organisiert

Hypothesentests mit SPSS. Beispiel für einen t-test

Die genomische Selektion in Deutschland und Österreich

Fallzahlplanung bei unabhängigen Stichproben

Statistik III Regressionsanalyse, Varianzanalyse und Verfahren bei Messwiederholung mit SPSS

Grundlagen der genomische Selektion - Was sagt ein genomischer Zuchtwert aus?

Transkript:

QTL-Mapping und Genomweite Assoziationsstudien Birgit Gredler-Grandl Qualitas AG Birgit Gredler-Grandl Folien ZL I+II LFW C 27. Nov. 205

Prüfung 8.2.205 90 min, 09:5 0:45 Keine Hilfsmittel Nicht programmierbarer Taschenrechner erlaubt Legitimationskarte mitbringen Eine gemeinsame Prüfung für Züchtungslehre I und II Qualitas AG Birgit Gredler-Grandl Folien ZL I+II LFW C 27. Nov. 205 2

Heutige Vorlesung Frage von der letzten Einheit: Wie funktioniert die SNP-Genotypisierung? QTL-Mapping Genomweite Assoziationsstudien Qualitas AG Birgit Gredler-Grandl Folien ZL I+II LFW C 27. Nov. 205 3

SNP Punktuelle Veränderungen einer Base in der DNA- Sequenz (Punktmutation) Base Cytosin wurde durch Base Thymin ersetzt wikipedia.org SNP sind diallel treten nur in 2 Allel-Varianten auf 3 Genotypen: AA AT TT Seefried, 205 Qualitas AG Birgit Gredler-Grandl Folien ZL I+II LFW C 27. Nov. 205 4

SNP-Genotypisierung Einzelstrang DNA von der Probe (z.b. Stier) SNP-Position Methode stützt sich auf dem Prinzip, dass DNA-Basen komplementär sind (A-T, C-G) Glaskügelchen Bead Am Bead hängt probe (Oligonucleotid = synthetisches einzelsträngiges DNA-Molekül, Probe hört genau Base vor SNP- Position auf ) LaFramboise T Nucl. Acids Res. 2009;37:48-493 Qualitas AG Birgit Gredler-Grandl Folien ZL I+II LFW C 27. Nov. 205 5

SNP-Genotypisierung Ausgangspunkt bildet biologisches Material Haarprobe entnehmen 50-00 Haarwurzeln Haare auf Haarkarte kleben Tier-ID aufkleben Versand der Probe zu Geneseek (USA) zur DNA-Extraktion und Genotypisierung http://homepage.braunvieh.ch/documents/ Probenahme_Haarprobe.pdf http://www.neogen.com/genomics/ Qualitas AG Birgit Gredler-Grandl Folien ZL I+II LFW C 27. Nov. 205 6

Illumina Typisierung Workflow http://www.illumina.com/documents/products/workflows/workflow_infinium_ii.pdf Qualitas AG Birgit Gredler-Grandl Folien ZL I+II LFW C 27. Nov. 205 7

SNP-Genotypisierung 750 ng DNA werden benötigt Nanogramm (ng) = Milliardstel Gramm DNA wird amplifiziert DNA-Amplifikation: DNA wird vervielfältigt (kopiert) z.b. Polymerasekettenreaktion (PCR) wikipedia.org Qualitas AG Birgit Gredler-Grandl Folien ZL I+II LFW C 27. Nov. 205 8

SNP-Genotypisierung DNA wird fragmentiert (3) Alkoholfällung und Resuspension (4) Vorbereitung Bead-Chip (5) (6) Beadchip wird mit Proben-DNA versetzt und es kommt zur Hybridisierung (komplementärer Einzelstrang lagert sich an); Es befinden sich sehr, sehr viele Oligonucleotide auf dem Bead Für jeden SNP je ein spezifischer Bead mit Oligonucleotide Qualitas AG Birgit Gredler-Grandl Folien ZL I+II LFW C 27. Nov. 205 9

SNP-Genotypisierung Zugabe von DNA-Einzelbasen Einfärben mit Fluoreszenzmittel Unterschiedliche Farbe je nach Base Farbintensitäten werden ausgwertet Qualitas AG Birgit Gredler-Grandl Folien ZL I+II LFW C 27. Nov. 205 0

QTL-mapping Grundprinzip: Vergleich von Mittelwerten Qualitas AG Birgit Gredler-Grandl Folien ZL I+II LFW C 27. Nov. 205

Versuchsdesigns QTL-mapping Mapping von QTLs welche ZWISCHEN Populationen segregieren QTLs, welche Unterschiede zwischen Populationen erklären Populationen mit extrem unterschiedlichen Phänotypen z.b. Kreuzungen von Inzuchtlinien Mapping von QTLs welche INNERHALB von Populationen segregieren QTLs, welche genetische Variation innerhalb Population erklären Zuchtpopulationen (Rind,...) z.b. Töchterdesign (daughter design), Enkelinnendesign (granddaughter design) Qualitas AG Birgit Gredler-Grandl Folien ZL I+II LFW C 27. Nov. 205 2

Kreuzungen von Inzuchtlinien Pflanzen Modellorganismen (z.b. Mäuse, Drosophila) Ziel: QTL finden, welche in den Linien unterschiedlich sind Sehr oft wird ein F backcross Design angewandt Qualitas AG Birgit Gredler-Grandl Folien ZL I+II LFW C 27. Nov. 205 3

Kreuzungen von Inzuchtlinien Inzuchtlinien... sind genetisch uniform sind fixiert für das alternative QTL-Allel (d.h. QTLs unterscheiden sich zwischen den Inzuchtlinien) Zeigen extrem unterschiedlichen Phänotyp Alle F-Individuen sind heterozygot am Marker Kopplungsphase zw. Marker und QTL ist identisch bei allen F-Individuen à vollständiges Linkage disequilibrium Qualitas AG Birgit Gredler-Grandl Folien ZL I+II LFW C 27. Nov. 205 4

F backcross Design Linie Linie 2 Eltern M Q X M Q Qualitas AG Birgit Gredler-Grandl Folien ZL I+II LFW C 27. Nov. 205 5

F backcross Design Linie Linie 2 Eltern M Q X M Q F M Q F alle heterozygot am Marker und QTL Qualitas AG Birgit Gredler-Grandl Folien ZL I+II LFW C 27. Nov. 205 6

F backcross Design Linie Linie 2 Eltern M M Q Q X F Linie 2 M Q X Backcross Qualitas AG Birgit Gredler-Grandl Folien ZL I+II LFW C 27. Nov. 205 7

F backcross Design Linie Linie 2 Eltern M M Q Q X F Linie 2 M Q X Backcross F2 M Q M Q Qualitas AG Birgit Gredler-Grandl Folien ZL I+II LFW C 27. Nov. 205 8

F backcross Design Linie Linie 2 Eltern M M Q Q X F Linie 2 M Q X Backcross F2 M Q M Q Vergleichen der Mittelwerte der am Marker Heterozygoten und Homozygoten Qualitas AG Birgit Gredler-Grandl Folien ZL I+II LFW C 27. Nov. 205 9

Wiederholung... Qualitas AG Birgit Gredler-Grandl Folien ZL I+II LFW C 27. Nov. 205 20

Qualitas AG Birgit Gredler-Grandl 27. Nov. 205 2 Folien ZL I+II LFW C

Qualitas AG Birgit Gredler-Grandl 27. Nov. 205 22 Folien ZL I+II LFW C

F backcross Design Eltern Linie M M Q Q F X Linie 2 Linie 2 Q = +500 = 500 M Q X -500 0 +500 -a d +a F2 M Q M Q x = m + 0 x = m 000 Qualitas AG Birgit Gredler-Grandl Folien ZL I+II LFW C 27. Nov. 205 23

F backcross Design Linie Linie 2 Eltern M M Q Q F X Linie 2 Rekombinante Haplotypen M Q X F2 M Q M Q x m + 0 x m 000 Qualitas AG Birgit Gredler-Grandl Folien ZL I+II LFW C 27. Nov. 205 24

Rekombination M Q X M Q Nicht-Rekombinate Häufigkeit = -r M Rekombinate Häufigkeit = r Q r = Anzahl an rekombinanten Haplotypen Anzahl an rekombinanten und nicht-rekombinanten Haplotypen Qualitas AG Birgit Gredler-Grandl Folien ZL I+II LFW C 27. Nov. 205 25

F backcross Design Folgende Hypothese wird getestet: H0: Mittelwerte beider Gruppen (M und ) sind gleich (à kein QTL) H0: Differenz zwischen M und = 0 Qualitas AG Birgit Gredler-Grandl Folien ZL I+II LFW C 27. Nov. 205 26

Pr(Q M ) = Pr(Q M ) Pr(M ) Geno- Probabilities Effect Expected marker type Marker Marker + QTL QTL marker mean M 0.5 (-r)/2 (-r) = m+d m + (-r)d - ra Q M r/2 r m-a 0.5 r/2 r = m+d m + rd - (- r)a Q (-r)/2 (-r) m-a Sum.0.0 2.0 Qualitas AG Birgit Gredler-Grandl Folien ZL I+II LFW C 27. Nov. 205 27

Töchterdesign (daughter design) Markergenotypen eines Stieres und seiner Töchter werden analysiert, um den Zusammenhang zwischen Marker und QTL zu untersuchen Töchter werden an Markern genotypisiert und auf Basis der Allele gruppiert und ihre Leistungen gemessen. Stier muss am Markerlocus (M ) heterozygot sein Zum Auffinden QTL-bedingter Leistungsunterschiede muss auch am QTL-Locus (Q ) heterozygot sein Qualitas AG Birgit Gredler-Grandl Folien ZL I+II LFW C 27. Nov. 205 28

Töchterdesign (daughter design) M?? M x x? x? x Folie: M. Dolezal Qualitas AG Birgit Gredler-Grandl Folien ZL I+II LFW C 27. Nov. 205 29

Töchterdesign (daughter design) M Q M x Q x x x Folie: M. Dolezal Qualitas AG Birgit Gredler-Grandl Folien ZL I+II LFW C 27. Nov. 205 30

Töchterdesign (daughter design) Sehr grosse Anzahl an genotypisierten Töchtern nötig Zuordnung der Töchter in Gruppen problematisch: Rekombination Töchter haben gleichen Markergenotyp wie der Vater (M ) à es kann nicht entschieden werden, welches Allel vom Vater kommt und Töchter sind nicht informativ Stier ist nicht heterozygot am QTL (M Q / Q oder M / ) à Töchter unterscheiden sich nicht hinsichtlich QTL Qualitas AG Birgit Gredler-Grandl Folien ZL I+II LFW C 27. Nov. 205 3

Markergestützte Selektion P = G +QTL +U BLUP Zuchtwertschätzung: es wird neben dem additivgenetischen Effekt (polygene Effekt) des Tieres auch der Effekt des QTL-Genotyps (bzw. Marker) berücksichtigt à marker-unterstützter BLUP-Zuchtwertschätzung (MA- BLUP) Geschätzter Zuchtwert = polygene + QTL-spezifische Zuchtwertkomponente Qualitas AG Birgit Gredler-Grandl Folien ZL I+II LFW C 27. Nov. 205 32

Populationsweite genomweite Assoziationsstudien Whole genome-wide association studies (GWAS) Qualitas AG Birgit Gredler-Grandl Folien ZL I+II LFW C 27. Nov. 205 33

Genomweite Assoziationsstudien Bis jetzt oft nur einige wenige Marker getestet Innerhalb Familien Durch die Entwicklung von SNP Chips stehen tausende von SNP Marker für das Testen des Zusammenhanges zwischen Marker (QTL) und Phänotyp zur Verfügung Assoziationen: Direkte Assoziation: Polymorphismus (SNP) ist selbst die ursächliche Variante (d.h. Marker = QTL) Indirekte Assoziation: Polymorphismus (SNP) ist teilweise oder in vollständigem LD mit QTLs Qualitas AG Birgit Gredler-Grandl Folien ZL I+II LFW C 27. Nov. 205 34

Genomweite Assoziationsstudien Voraussetzung für GWAS ist LD zwischen Marker und QTL QTL-Mapping basierend auf LD zeigt Assoziationen zwischen Marker und QTL auf Populationsebene: Assoziationen treten auf, weil kurze Chromosomenstücke in der gesamten Population vorhanden sind, welche vom gleichen gemeinsamen Ahnen stammen Qualitas AG Birgit Gredler-Grandl Folien ZL I+II LFW C 27. Nov. 205 35

Genomweite Assoziationsstudien Voraussetzung für GWAS ist LD QTL-Mapping basierend auf LD zeigt Assoziationen zwischen Marker und QTL auf Populationsebene: Assoziationen treten auf, weil kurze Chromosomenstücke in der gesamten Population vorhanden sind, welche vom gleichen gemeinsamen Ahnen stammen Diese Chromosomenstücke tragen die gleichen Marker Allele (ohne Rekombination) Qualitas AG Birgit Gredler-Grandl Folien ZL I+II LFW C 27. Nov. 205 36

Genomweite Assoziationsstudien Voraussetzung für GWAS ist LD QTL-Mapping basierend auf LD zeigt Assoziationen zwischen Marker und QTL auf Populationsebene: Assoziationen treten auf, weil kurze Chromosomenstücke in der gesamten Population vorhanden sind, welche vom gleichen gemeinsamen Ahnen stammen Diese Chromosomenstücke tragen die gleichen Marker Allele (ohne Rekombination) Wenn ein QTL innerhalb Chromosomenstück vorkommt, sind auch die QTL-Allele gleich Qualitas AG Birgit Gredler-Grandl Folien ZL I+II LFW C 27. Nov. 205 37

GWAS mit Single-SNP Regression y = n µ + Xg + e y = Vektor mit Phänotyp (Merkmalswerte) n = Vektor von, teilt die Phänotypwerte y dem Mittelwert zu X = Designmatrix, teil Phänotypwerte den Genotypen (SNP Marker) zu g = fixer Effekt des SNP (Markers) e = zufälliger Fehler Qualitas AG Birgit Gredler-Grandl Folien ZL I+II LFW C 27. Nov. 205 38

GWAS mit Single-SNP Regression y = n µ + Xg + e y = Vektor mit Phänotyp (Merkmalswerte) n = Vektor von, teilt die Phänotypwerte y dem Mittelwert zu X = Designmatrix, teil Phänotypwerte den Genotypen (SNP Marker) zu g = fixer Effekt des SNP (Markers) e = zufälliger Fehler Annahme: Marker beeinflusst den Phänotyp nur, wenn er im LD mit einem nicht beobachteten QTL ist. Qualitas AG Birgit Gredler-Grandl Folien ZL I+II LFW C 27. Nov. 205 39

Ein Beispiel Tier Phänotyp SNP Allel SNP Allel 2 2.030502 2 3.542274 2 3 3.83424 2 4 4.8737 2 2 5 3.40728 2 6 2.335734 7 2.64692 8 3.762855 2 9 3.689349 2 0 3.685757 2 Qualitas AG Birgit Gredler-Grandl Folien ZL I+II LFW C 27. Nov. 205 40

Ein Beispiel Tier Phänotyp SNP Allel SNP Allel 2 2.030502 2 3.542274 2 3 3.83424 2 4 4.8737 2 2 5 3.40728 2 6 2.335734 7 2.64692 Schätzen des Mittelwerts und des SNP Effektes 8 3.762855 2 9 3.689349 2 0 3.685757 2 Qualitas AG Birgit Gredler-Grandl Folien ZL I+II LFW C 27. Nov. 205 4

Ein Beispiel Tier Phänotyp SNP Allel SNP Allel 2 2.030502 2 3.542274 2 3 3.83424 2 4 4.8737 2 2 5 3.40728 2 6 2.335734 7 2.64692 8 3.762855 2 9 3.689349 2 0 3.685757 2 Schätzen des Mittelwerts und des SNP Effektes Hypothesentestung: H0: Der SNP Marker hat keinen Einfluss auf das Merkmal H: Der SNP Marker hat einen Einfluss auf das Merkmal (weil er in LD mit QTL ist) Qualitas AG Birgit Gredler-Grandl Folien ZL I+II LFW C 27. Nov. 205 42

GWAS mit Single-SNP Regression y = n µ + Xg + e Lösen des Gleichungssystems ˆµ ĝ = ' n n X ' n n ' X X ' X n ' y X ' y Qualitas AG Birgit Gredler-Grandl Folien ZL I+II LFW C 27. Nov. 205 43

Single-SNP Regression - ein Beispiel ˆµ ĝ = ' ' n n n X X ' n X ' X Tier Phänotyp SNP Allel SNP Allel 2 2.030502 2 3.542274 2 3 3.83424 2 4 4.8737 2 2 5 3.40728 2 6 2.335734 7 2.64692 8 3.762855 2 9 3.689349 2 0 3.685757 2 n = Qualitas AG Birgit Gredler-Grandl Folien ZL I+II LFW C 27. Nov. 205 44 n ' y X ' y

Single-SNP Regression - ein Beispiel ˆµ ĝ = ' ' n n n X X ' n X ' X n ' y X ' y Tier Phänotyp SNP Allel SNP Allel 2 2.030502 2 3.542274 2 3 3.83424 2 4 4.8737 2 2 5 3.40728 2 6 2.335734 7 2.64692 8 3.762855 2 9 3.689349 2 0 3.685757 2 y = 2.030502 3.542274 3.83424 4.8737 3.40728 2.335734 2.64692 3.762855 3.689349 3.685757 Qualitas AG Birgit Gredler-Grandl Folien ZL I+II LFW C 27. Nov. 205 45

Ein Single-SNP Regression - ein Beispiel ˆµ ĝ = ' ' n n n X X ' n X ' X X ordnet Phänotypen den Genotypen zu Tier Phänotyp SNP Allel SNP Allel 2 2.030502 2 3.542274 2 3 3.83424 2 4 4.8737 2 2 5 3.40728 2 6 2.335734 7 2.64692 8 3.762855 2 9 3.689349 2 0 3.685757 2 SNP = biallelisch Allele werden als und 2 kodiert X zählt die Anzahl an Kopien von Allel 2 0 = homozygot für Allel = heterozygot 2 = homozygot für Allel 2 Qualitas AG Birgit Gredler-Grandl Folien ZL I+II LFW C 27. Nov. 205 46 n ' y X ' y X = 0 2 0 0

Qualitas AG Birgit Gredler-Grandl 27. Nov. 205 47 Single-SNP Regression - ein Beispiel Folien ZL I+II LFW C ˆµ ĝ = n ' n n ' X X ' n X ' X n ' y X ' y =0

Single-SNP Regression - ein Beispiel ˆµ ĝ = ' ' n n n X ' n y X ' n X ' X X ' y Qualitas AG Birgit Gredler-Grandl Folien ZL I+II LFW C 27. Nov. 205 48

Qualitas AG Birgit Gredler-Grandl 27. Nov. 205 49 Single-SNP Regression - ein Beispiel Folien ZL I+II LFW C ˆµ ĝ = n ' n n ' X X ' n X ' X n ' y X ' y 0 2 0 0 0 2 0 0 =0

Single-SNP Regression - ein Beispiel ˆµ ĝ = ' n n X ' n n ' X X ' X n ' y X ' y ˆµ ĝ = 0 8 8 0 33.8 3.7 Qualitas AG Birgit Gredler-Grandl Folien ZL I+II LFW C 27. Nov. 205 50

Single-SNP Regression - ein Beispiel ˆµ ĝ ˆµ ĝ ˆµ ĝ = ' n n X ' n n ' X X ' X = 0 8 8 0 = 0.28 0.22 0.22 0.28 n ' y X ' y 33.8 3.7 33.8 3.7 Qualitas AG Birgit Gredler-Grandl Folien ZL I+II LFW C 27. Nov. 205 5

Single-SNP Regression - ein Beispiel ˆµ ĝ = ' n n X ' n n ' X X ' X n ' y X ' y ˆµ ĝ = 0.28 0.22 0.22 0.28 33.8 3.7 ˆµ ĝ = 2.35.28 Qualitas AG Birgit Gredler-Grandl Folien ZL I+II LFW C 27. Nov. 205 52

Ist der Effekt des SNP Markers signifikant? Hypothesentestung - Signifikanztest Das Grundprinzip der Hypothesentestung liegt in der Ermittlung des Übereinstimmungsgrades zwischen einer über einen Sachverhalt aufgestellten Hypothese und einem hierzu beobachtbaren Stichprobenereignis Qualitas AG Birgit Gredler-Grandl Folien ZL I+II LFW C 27. Nov. 205 53

Hypothesentestung - Signifikanztest Frage: Hat der SNP Genotyp einen Einfluss auf den Phänotyp? Nullhypothese H0: Genotyp hat keinen Einfluss auf den Phänotyp Alternativhypothese H: Genotyp hat einen Einfluss auf den Phänotyp Qualitas AG Birgit Gredler-Grandl Folien ZL I+II LFW C 27. Nov. 205 54

Hypothesentestung - Signifikanztest Zwei Arten von Fehlern: Fehler. Art ( falsch positive ) Wir schliessen, dass der SNP Genotyp einen Einfluss hat, aber in Wirklichkeit hat er keinen Einfluss (H0 wird abgelehnt) Fehler 2. Art ( falsch negative ) SNP Genotyp hat tatsächlich einen Effekt, wird aber nicht entdeckt (H0 wird angenommen) Qualitas AG Birgit Gredler-Grandl Folien ZL I+II LFW C 27. Nov. 205 55

Hypothesentestung - Signifikanztest Zwei Arten von Fehlern H0: Es gibt keinen Effekt Wirklichkeit Testergebnis Kein Effekt Effekt H0 abgelehnt Fehler. Art Korrekt J H0 angenommen Korrekt J Fehler 2. Art Qualitas AG Birgit Gredler-Grandl Folien ZL I+II LFW C 27. Nov. 205 56

Hypothesentestung - Signifikanztest P-Wert Gibt die Wahrscheinlichkeit an, dass die beobachteten Effekte aus dem Testergebnis rein durch Zufall zustande kommen in Wirklichkeit existiert kein Effekt (H0 ist wahr) Signifikanzniveau/Irrtumswahrscheinlichkeit α: Die Wahrscheinlichkeit, dass wir einen Fehler. Art begehen (H0 verworfen obwohl tatsächlich kein Effekt) darf maximal 5,, 0.... sein Wenn der P-Wert kleiner ist als die festgelegte Irrtumswahrscheinlichkeit (Fehler. Art) α, dann lehnen wir die Nullhypothese ab und glauben an einen Effekt Qualitas AG Birgit Gredler-Grandl Folien ZL I+II LFW C 27. Nov. 205 57