Realisierte Verwandtschaftsmatrizen und Zuchtwertschätzung für die genomische Selektion eine Übersicht



Ähnliche Dokumente
Lineargleichungssysteme: Additions-/ Subtraktionsverfahren

Lineare Gleichungssysteme

Primzahlen und RSA-Verschlüsselung

Kapitel 15. Lösung linearer Gleichungssysteme

Behörde für Bildung und Sport Abitur 2008 Lehrermaterialien zum Leistungskurs Mathematik

Die Gleichung A x = a hat für A 0 die eindeutig bestimmte Lösung. Für A=0 und a 0 existiert keine Lösung.

Austausch- bzw. Übergangsprozesse und Gleichgewichtsverteilungen

50. Mathematik-Olympiade 2. Stufe (Regionalrunde) Klasse Lösung 10 Punkte

Musterlösungen zur Linearen Algebra II Blatt 5

4. Versicherungsangebot

LU-Zerlegung. Zusätze zum Gelben Rechenbuch. Peter Furlan. Verlag Martina Furlan. Inhaltsverzeichnis. 1 Definitionen.

Eigenwerte und Eigenvektoren von Matrizen

Güte von Tests. die Wahrscheinlichkeit für den Fehler 2. Art bei der Testentscheidung, nämlich. falsch ist. Darauf haben wir bereits im Kapitel über

Lineare Gleichungssysteme I (Matrixgleichungen)

Gleichungen Lösen. Ein graphischer Blick auf Gleichungen

1 Mathematische Grundlagen

Matrizennorm. Definition 1. Sei A M r,s (R). Dann heißt A := sup die Matrixnorm. Wir wissen zunächst nicht, ob A eine reelle Zahl ist.

Lineare Gleichungssysteme

7 Rechnen mit Polynomen

Informationsblatt Induktionsbeweis

AUTOMATISIERTE HANDELSSYSTEME

L10N-Manager 3. Netzwerktreffen der Hochschulübersetzer/i nnen Mannheim 10. Mai 2016

4 Vorlesung: Matrix und Determinante

5 Eigenwerte und die Jordansche Normalform

Lineare Gleichungssysteme

8.2 Thermodynamische Gleichgewichte, insbesondere Gleichgewichte in Mehrkomponentensystemen Mechanisches und thermisches Gleichgewicht

sondern alle Werte gleich behandelt. Wir dürfen aber nicht vergessen, dass Ergebnisse, je länger sie in der Vergangenheit

Würfelt man dabei je genau 10 - mal eine 1, 2, 3, 4, 5 und 6, so beträgt die Anzahl. der verschiedenen Reihenfolgen, in denen man dies tun kann, 60!.

Beweisbar sichere Verschlüsselung

Professionelle Seminare im Bereich MS-Office

Welche Lagen können zwei Geraden (im Raum) zueinander haben? Welche Lagen kann eine Gerade bezüglich einer Ebene im Raum einnehmen?

Vorlesung Diskrete Strukturen Graphen: Wieviele Bäume?

Einführung in die Vektor- und Matrizenrechnung. Matrizen

Das große ElterngeldPlus 1x1. Alles über das ElterngeldPlus. Wer kann ElterngeldPlus beantragen? ElterngeldPlus verstehen ein paar einleitende Fakten

Einführung in die Algebra

OECD Programme for International Student Assessment PISA Lösungen der Beispielaufgaben aus dem Mathematiktest. Deutschland

Bestimmung einer ersten

1. Man schreibe die folgenden Aussagen jeweils in einen normalen Satz um. Zum Beispiel kann man die Aussage:

Aufgabe 1. Zunächst wird die allgemeine Tangentengleichung in Abhängigkeit von a aufgestellt:

Einfache Varianzanalyse für abhängige

3.3 Eigenwerte und Eigenräume, Diagonalisierung

Statistische Auswertung:

Lineare Gleichungssysteme

Berechnung der Erhöhung der Durchschnittsprämien

13. Lineare DGL höherer Ordnung. Eine DGL heißt von n-ter Ordnung, wenn Ableitungen y, y, y,... bis zur n-ten Ableitung y (n) darin vorkommen.

Korrigenda Handbuch der Bewertung

6.2 Scan-Konvertierung (Scan Conversion)

Korrelation (II) Korrelation und Kausalität

Zahlen auf einen Blick

Physik 4, Übung 11, Prof. Förster

Grundlagen der Theoretischen Informatik, SoSe 2008

Bundesverband Flachglas Großhandel Isolierglasherstellung Veredlung e.v. U g -Werte-Tabellen nach DIN EN 673. Flachglasbranche.

Lösungsvorschlag für die Probeklausuren und Klausuren zu Algebra für Informations- und Kommunikationstechniker bei Prof. Dr.

Mobile Intranet in Unternehmen

Zwischenablage (Bilder, Texte,...)

R ist freie Software und kann von der Website.

Änderung des IFRS 2 Anteilsbasierte Vergütung

Nicht kopieren. Der neue Report von: Stefan Ploberger. 1. Ausgabe 2003

TESTEN SIE IHR KÖNNEN UND GEWINNEN SIE!

Anleitung über den Umgang mit Schildern

Viele Bilder auf der FA-Homepage

8. Quadratische Reste. Reziprozitätsgesetz

Tipp III: Leiten Sie eine immer direkt anwendbare Formel her zur Berechnung der sogenannten "bedingten Wahrscheinlichkeit".

Leseprobe. Wilhelm Kleppmann. Versuchsplanung. Produkte und Prozesse optimieren ISBN: Weitere Informationen oder Bestellungen unter

Grundlagen der höheren Mathematik Einige Hinweise zum Lösen von Gleichungen

Meinungen der Bürgerinnen und Bürger in Hamburg und Berlin zu einer Bewerbung um die Austragung der Olympischen Spiele

geben. Die Wahrscheinlichkeit von 100% ist hier demnach nur der Gehen wir einmal davon aus, dass die von uns angenommenen

Stellen Sie bitte den Cursor in die Spalte B2 und rufen die Funktion Sverweis auf. Es öffnet sich folgendes Dialogfenster

Outlook. sysplus.ch outlook - mail-grundlagen Seite 1/8. Mail-Grundlagen. Posteingang

Wie man Registrationen und Styles von Style/Registration Floppy Disketten auf die TYROS-Festplatte kopieren kann.

Kulturelle Evolution 12

4. BEZIEHUNGEN ZWISCHEN TABELLEN

1 C H R I S T O P H D R Ö S S E R D E R M A T H E M A T I K V E R F Ü H R E R

Aufgabenset 1 (abzugeben an LK@wacc.de)

Ist Fernsehen schädlich für die eigene Meinung oder fördert es unabhängig zu denken?

Algorithmen II Vorlesung am

Beispiel Zusammengesetzte Zufallsvariablen

BONUS MALUS SYSTEME UND MARKOV KETTEN

Die reellen Lösungen der kubischen Gleichung

1 topologisches Sortieren

Bin Packing oder Wie bekomme ich die Klamotten in die Kisten?

Lineare Algebra und Lösung linearer zeitinvarianter Differentialgleichungssysteme

Wachstum 2. Michael Dröttboom 1 LernWerkstatt-Selm.de

Info zum Zusammenhang von Auflösung und Genauigkeit

Erstellen von x-y-diagrammen in OpenOffice.calc

Persönliche Zukunftsplanung mit Menschen, denen nicht zugetraut wird, dass sie für sich selbst sprechen können Von Susanne Göbel und Josef Ströbl

Anmerkungen zur Übergangsprüfung

Division Für diesen Abschnitt setzen wir voraus, dass der Koeffizientenring ein Körper ist. Betrachte das Schema

Mathematischer Vorbereitungskurs für Ökonomen

Lösungen zum 3. Aufgabenblatt

Geld Verdienen im Internet leicht gemacht

Motivation. Formale Grundlagen der Informatik 1 Kapitel 5 Kontextfreie Sprachen. Informales Beispiel. Informales Beispiel.

!(0) + o 1("). Es ist damit möglich, dass mehrere Familien geschlossener Orbits gleichzeitig abzweigen.

1. Einführung Erstellung einer Teillieferung Erstellung einer Teilrechnung 6

Verband der TÜV e. V. STUDIE ZUM IMAGE DER MPU

Die Pareto Verteilung wird benutzt, um Einkommensverteilungen zu modellieren. Die Verteilungsfunktion ist

ONLINE-AKADEMIE. "Diplomierter NLP Anwender für Schule und Unterricht" Ziele

Approximation durch Taylorpolynome

Voraussetzungen für die Genomische Selektion beim Pferd

Transkript:

Züchtungskunde, 83, (3) S 67 8, 20, ISSN 0044-540 Verlag Eugen Ulmer, Stuttgart Realisierte Verwandtschaftsmatrizen und Zuchtwertschätzung für die genomische Selektion eine Übersicht N Poschadel und M Mayer Zusammenfassung Verwandtschaftsmatrizen spielen unter anderem bei der Schätzung von Zuchtwerten eine große Rolle Mit zunehmend kostengünstigeren Verfahren zur Gewinnung von Markerinformationen aus dem Genom von Nutztieren ist die Möglichkeit entstanden, die früher verwendeten rein pedigreebasierten Verwandtschaftsmatrizen durch tatsächlich realisierte Verwandtschaftsmatrizen zu ersetzen In der Literatur werden verschiedene Varianten von realisierten Verwandtschaftsmatrizen betrachtet, welche in dieser Arbeit vorgestellt werden Der Schwerpunkt liegt dabei auf Verwandtschaftsmatrizen, die im Rahmen der genomischen Selektion vorgeschlagen wurden Ferner wird auf Lösungsansätze für rechentechnische Probleme eingegangen, die sich mit der Verwendung von realisierten Verwandtschaftsmatrizen ergeben Am Schluss werden in der Literatur beschriebene Verfahren einer einheitlichen Zuchtwertschätzung für die genomische Selektion basierend auf einer Verwandtschaftsmatrix aus Pedigree- und genomischen Informationen vorgestellt und diskutiert Schlüsselwörter: Verwandtschaftsmatrizen, genomische Zuchtwertschätzung, genomische Selektion Summary Realized relationship matrices and breeding value estimation for genomic selection an overview Relationship matrices play, among other things, a major role for the estimation of breeding values Along with increasingly cheaper procedures for the extraction of marker information out of the genome of farm animals the opportunity arises to replace the previously used merely pedigree-based relationship matrices with actually realized ones In the literature various kinds of realized relationship matrices were considered, which are presented in this paper Here we put the emphasis on relationship matrices that are suggested within the framework of genomic selection Moreover, some approaches for the solution of technical problems in connection with calculations using such matrices will be addressed Finally, we want to present and discuss some approaches described in the literature for a unified estimation of breeding values for genomic selection, which are based on a relationship matrix incorporating pedigree information and genomic information as well Keywords: Relationship matrices, genomic breeding value estimation, genomic selection Leibniz-Institut für Nutztierbiologie (FBN), Forschungsbereich Genetik und Biometrie, Wilhelm-Stahl-Allee 2, 896 Dummerstorf, E-Mail: mmayer@fbn-dummerstorfde

68 N Poschadel und M Mayer Einleitung Die konventionelle Zuchtwertschätzung basiert neben den Leistungsinformationen auf pedigreebasierten Verwandtschaftsbeziehungen zwischen den Tieren Diese Verwandtschaftskoeffizienten zwischen zwei Tieren stellen jedoch nur einen Erwartungswert dafür dar, welchen Anteil ihres Genoms diese beiden Individuen gemeinsam haben In der Realität gibt es Abweichungen von diesem Erwartungswert Eine Analyse der Variabilität des Anteils am Genom, den zwei verwandte Individuen miteinander teilen, ist zb bei Visscher (2009) zu finden Somit ist klar, dass die Einbeziehung genomischer Informationen die Zuverlässigkeit der Zuchtwertschätzung erhöhen kann Für die Deutsche Holstein-Population wurden Ende August 2009 vom VIT erstmals genomische Zuchtwerte berechnet und den Zuchtorganisationen zur Verfügung gestellt Wie erwähnt, sollte die Zuchtwertschätzung möglichst alle verfügbaren Informationen kombinieren, um zu einer möglichst genauen Schätzung zu gelangen Damit stellt sich die Frage nach einer möglichst optimalen Kombination von pedigreebasierten Informationen und den geschätzten direkten genomischen Zuchtwerten In der Milchrinderzucht sind speziell zwei Varianten anzutreffen Bei der ersten Variante werden zum einen traditionell Zuchtwerte mittels eines Tiermodells und zum anderen genomische Zuchtwerte für typisierte Tiere geschätzt und dann zu einem Gesamtzuchtwert zusammengefasst (zb VanRaden, 2008; VanRaden et al, 2009; Hayes et al, 2009a; Su et al, 200) Ein Vorschlag zu einer kombinierten Zuchtwertschätzung bei den Deutschen Holsteins ist in Seefried et al (200) zu finden Als zweite Variante wurde zb von Misztal et al (2009), Legarra et al (2009) sowie Christensen and Lund (200) eine einheitliche Zuchtwertschätzung basierend auf einer Verwandtschaftsmatrix aus Pedigree- und genomischer Information vorgeschlagen Ein Vergleich der beiden Varianten wurde aktuell von Aguilar et al (200) durchgeführt Ferner können natürlich zb genomische bzw realisierte Verwandtschaftskoeffizienten zur Überprüfung von Verwandtschaftsbeziehungen, dh zur Identifizierung von Fehlabstammungen, verwendet werden Ziel des vorliegenden Beitrages ist es, einen systematisierten Überblick über die in der Literatur diskutierten Möglichkeiten zur Aufstellung genomischer Verwandtschaftsmatrizen sowie der zusätzlichen Einbeziehung genomischer Information bzw genomischer Verwandtschaftsmatrizen in die Zuchtwertschätzung zu geben 2 Realisierte Verwandtschaftsmatrizen Wir wollen uns zunächst mit der Frage beschäftigen, wie man mit den Markerinformationen für typisierte Tiere eine zugehörige realisierte genomische Verwandtschaftsmatrix schätzen kann Es gibt verschiedene Ansätze hierzu, welche wir im Folgenden vorstellen Später gehen wir der Frage nach, wie man diese Informationen verwenden kann, wenn ein Pedigree einer Population gegeben ist, in welcher nur ein Teil der Tiere typisiert ist Zu Beginn sei kurz an Grundbegriffe und Bezeichnungen erinnert, die im Zusammenhang mit Verwandtschaftsmatrizen relevant sind Für Tiere mit den Nummern i und j sei s ij die Wahrscheinlichkeit dafür, dass zwei bei i und bei j (an einem gegebenen Genort) zufällig herausgegriffene Allele herkunftsgleich (IBD identical by descent) sind Man nennt s ij den Sippenkoeffizienten (auch: Abstammungskoeffizient, engl coefficient of coancestry oder coefficient of kinship (Pirchner, 979) der Tiere i und j und dementsprechend S (s ij ) ij die Sippenmatrix Der Inzuchtkoeffizient F k eines Tieres k ist die Wahrscheinlichkeit dafür, dass die beiden Allele von k (am betrachteten Genort) herkunftsgleich sind Dementsprechend gilt also F k s vk ( ), mk ( ),

Realisierte Verwandtschaftsmatrizen und Zuchtwertschätzung für die genomische Selektion 69 wobei v(k) der Vater und m(k) die Mutter von k ist Entsprechend ist auch s ij der Inzuchtkoeffizient F l eines potentiellen (möglicherweise nicht realisierten oder sogar nicht realisierbaren) Nachkommens l von i und j Das Doppelte der Matrix S, also ( a ij ), ij A: 2S nennt man die (additiv-genetische) Verwandtschaftsmatrix (engl numerator-relationship matrix) und der Koeffizient a ij 2s ij wird im Englischen mit additive genetic relationship coefficient bezeichnet Neben der Herkunftsgleichheit (IBD) wird auch die Zustandsgleichheit (AIS alike in state oder IBS identical by state) betrachtet Diese ist gegeben, wenn die zu vergleichenden (Marker-)Allele identisch sind, und zwar unabhängig davon, ob sie von einem gemeinsamen Vorfahren stammen oder nicht Aus IBD folgt natürlich IBS (wenn keine Mutation bei der Weitergabe der Allele aufgetreten ist) 2 Ähnlichkeitsindex Eine Möglichkeit, eine realisierte Verwandtschaftsmatrix aufzustellen, besteht darin, die Wahrscheinlichkeiten für die Herkunftsgleichheit zweier zufällig herausgegriffener Allele der beiden betrachteten Tiere durch die Wahrscheinlichkeiten für deren Zustandsgleichheit zu ersetzen Dies lässt sich für jeden Genort durchführen, dessen Genotyp bekannt ist, und dies führt natürlich bei verschiedenen Loci ia zu unterschiedlichen Werten (während es sich bei dem Sippenkoeffizienten um eine für alle Loci gleichermaßen gültige Wahrscheinlichkeit handelt) Man nennt diese Wahrscheinlichkeit (für den entsprechenden Genort) den Ähnlichkeitsindex (engl similarity index) Diese Werte kann man über die betrachteten Loci mitteln und erhält so einen entsprechenden Ähnlichkeitsindex, der alle diese Loci berücksichtigt In Hayes and Goddard (2008) und in Nejati-Javaremi et al (997) wird mit dem Ähnlichkeitsindex oder mit Varianten davon gearbeitet Bei Hayes and Goddard (2008) ist der Ähnlichkeitsindex S xy an einem Locus wie folgt definiert: Genotyp von x Genotyp von y S xy kk kk kk kl /2 kl kk /2 kl kl /2 kl km /4 kl mn 0 Hierbei bezeichnen k, l, m und n voneinander verschiedene Markerallele Die angegebenen Werte für S xy sind also gerade die Wahrscheinlichkeiten dafür, dass zwei zufällig bei x und y herausgegriffene Marker identisch (zustandsgleich) sind In allen weiteren Fällen, in denen x und y keine gemeinsamen Allele enthalten das sind (kk, ll), (kk, lm) und (lm, kk) ist ebenfalls S xy 0 zu setzen Das pedigree- (anstatt marker-)basierte Analogon zum Ähnlichkeitsindex wäre also ein Sippenkoeffizient, bei dem die Gleichheit zweier Allele nicht als Herkunftsgleichheit (IBD), sondern als Zustandsgleichheit (IBS) aufgefasst wird Im Gegensatz zu dem rein pedigree-basierten Sippenkoeffizienten beschreibt der Ähnlichkeitsindex jedoch die tatsächlich realisierte Ähnlichkeit (am betrachteten Genort) von zwei Individuen und nicht nur Mittelwerte Aufgrund der Tatsache, dass nur endlich viele bei SNP-Markern zwei verschiedene Markerallele existieren, wird man häufig auch dann mit positiver Wahrscheinlichkeit zu-

70 N Poschadel und M Mayer standsgleiche Allele bei zwei Tieren x und y am betrachteten Genort vorfinden, wenn x und y überhaupt nichts miteinander zu tun haben Dies führt dazu, dass die erhaltenen Werte gegenüber den Sippenkoeffizienten nach oben verzerrt sind und korrigiert werden sollten Für genauere Untersuchungen über den Zusammenhang von Ähnlichkeitsindex und Sippenkoeffizient (unter Berücksichtigung des Umstandes, dass zustandsgleiche Markerallele bei unverwandten Gründertieren auftreten) siehe Eding and Meuwissen (200) Wir betrachten den wichtigen Fall von SNP-Markern mit den beiden Allelvarianten und 2 und somit den möglichen Genotypen, 2 und 22 Anstatt die Matrix der Ähnlichkeitsindizes für eine gegebene Population aufzustellen, betrachten wir zunächst nur eine entsprechende reduzierte Matrix S r Diese ordnet je zwei Genotypen dem sich gemäß der Tabelle ergebenden Indexwert zu Ihre Zeilen und Spalten entsprechen also nicht den Individuen einer Population, sondern den möglichen Genotypen Wenn man die Genotypen (und damit die entsprechenden Zeilen und Spalten) in der Reihenfolge, 2, 22 anordnet, erhält man also S r 2 22 2 ½ ½ ½ ½ 0 22 0 ½ Diese Matrix ist positiv semidefinit, aber nicht positiv definit Hat man nun eine Population aus n Tieren vorliegen, so sei L eine n 3-Matrix, die in jeder Zeile genau eine Eins und ansonsten nur Nullen enthält; und zwar soll in der i-ten Zeile die an derjenigen Stelle stehen, welche dem Genotyp des i-ten Tieres zugeordnet ist (beispielsweise soll die 5 Zeile von L gleich (0,0,) sein, wenn das 5 Tier den Genotyp 22 hat) Man überlegt sich leicht, dass dann S pop LS r L die Matrix der Ähnlichkeitsindizes der Population ist, vgl Xie et al (998) Aus dieser Darstellung ergibt sich, dass auch S pop positiv semidefinit (und für n > 2 singulär) ist Bildet man das Mittel über derartige Matrizen für verschiedene Markerloci, so entsteht wieder eine positiv semidefinite Matrix (welche sogar positiv definit sein kann, wenn man hinreichend viele Loci berücksichtigt) Wie bereits erwähnt, wird der Ähnlichkeitsindex über die Loci mit den Markerinformationen gemittelt; dieser Mittelwert werde mit S xy bezeichnet Die oben erwähnte Korrektur der Verzerrung wird in Hayes and Goddard (2008) durch die Transformation S xy S min S xy ------------------------------------ S min bewerkstelligt, wobei S min der minimale aufgetretene Ähnlichkeitsindex ist Durch Abziehen von S min im Zähler werden die genetisch am wenigsten ähnlichen Tiere der Population künstlich unverwandt gemacht Die anschließende Division durch -S min normiert die Koeffizienten so, dass der maximal erreichbare Wert S xy (der bei zwei ingezüchteten und genetisch identischen Tieren x und y auftritt siehe die erste Zeile in obiger Tabelle) auch nach dieser Transformation wieder zu wird Die dargestellte Transformation ist plausibel, aber keineswegs zwingend und auch nicht in jedem konkreten Fall angemessen: Betrachten wir beispielsweise eine Population, welche nur aus eng miteinander verwandten Tieren besteht, so wird jeder Sippen-

Realisierte Verwandtschaftsmatrizen und Zuchtwertschätzung für die genomische Selektion 7 koeffizient S xy, der den Wert S min annimmt (es muss schließlich mindestens einen solchen geben!), auf 0 transformiert Dies spiegelt aber keineswegs unser Wissen wider, dass alle Tiere der Population (also auch x und y) eng miteinander verwandt waren Für weitere Hinweise darauf, dass die behandelte Form der Normierung zu einer erheblichen Verzerrung führen kann, siehe Wang (2002) Es mag auf den ersten Blick verwundern, dass man gemäß obiger Tabelle für zwei heterozygote Tiere x und y mit gleichem Genotyp kl denselben Wert S xy ½ erhält wie für zwei Tiere mit den Genotypen kk und kl Dies bedeutet ja, dass dann auch die Kovarianzen der Zuchtwerte der beiden betrachteten Tiere für beide Fälle übereinstimmen, obwohl doch zweifelsohne zwei Tiere mit identischem Genotyp kl immer dieselben Zuchtwerte haben (wenn die Genotypen an allen Loci identisch sind), was bei Tieren mit unterschiedlichen Genotypen kk und kl jedoch nicht der Fall zu sein braucht Da jedoch die Stärke des linearen Zusammenhangs zwischen zwei Zufallsgrößen (hier den Zuchtwerten) nicht durch deren Kovarianz, sondern durch ihre Korrelation bestimmt ist (und diese ist bei den Zuchtwerten genetisch identischer Tiere eben immer ), stellt die Gleichheit der Kovarianzen kein Problem dar Ferner könnte man sich evtl auch darüber wundern, dass homozygote genetisch identische Tiere (für einen Genort) den Ähnlichkeitsindex haben, heterozygote identische aber nur ½ Wenn man bedenkt, dass der Ähnlichkeitsindex (ebenso wie der Sippenkoeffizient) kein reines Maß für die Ähnlichkeit oder Verwandtschaft zweier Tiere darstellt (bzw darstellen soll), sondern im Endeffekt eine kombinierte Größe aus dem Grad der Verwandtschaft zweier Tiere und ihrer Inzucht ist so sagt beispielsweise S xx nur etwas über den Grad der Inzucht eines Tieres x aus dann ist es keineswegs verwunderlich, dass sich für ein Paar identischer Homozygoten und für ein Paar identischer Heterozygoten unterschiedliche Ähnlichkeitsindizes ergeben Wir haben hier den Ähnlichkeitsindex exemplarisch herausgegriffen und etwas gründlicher diskutiert, möchten aber auch darauf hinweisen, dass noch eine ganze Reihe ähnlicher Maßzahlen existiert Für eine Darstellung und den Vergleich derartiger Größen müssen wir auf die Literatur verweisen, siehe etwa Bink et al (2008), Li et al (993) sowie Lynch and Ritland (999) Es sei hier noch angemerkt, dass in die Berechnung einiger dieser Größen die Allelfrequenzen für eine Basispopulation der betrachteten Population einfließen, siehe etwa Lynch and Ritland (999) 22 Weitere Varianten realisierter Verwandtschaftsmatrizen Im Folgenden sollen weitere Varianten von realisierten Verwandtschaftsmatrizen dargestellt werden, welche in VanRaden (2008) beschrieben werden Es handelt sich hierbei eher um ad hoc-ansätze, vgl hierzu auch die einleitenden Bemerkungen in Gianola et al (2009) Sei n die Anzahl der Tiere, zu denen SNP-Markerinformationen vorliegen und m die Anzahl der Markerloci Die beiden SNP-Markervarianten seien mit bzw 2 bezeichnet Die Markerinformationen seien in einer n m-matrix M wie folgt codiert: In der i-ten Zeile und j-ten Spalte steht eine bzw 0 bzw -, falls der Genotyp des i-ten Tiers am j-ten Markerlocus bzw 2 bzw 22 ist Das heißt: Dort steht die Anzahl der Markerallelvariante an dem entsprechenden Locus (engl: gene content) vermindert um Beispiel: Wir betrachten folgende Matrix der Genotypen von n 2 Tieren (Zeilen) an m 3 Markerloci (Spalten): 2 22

72 N Poschadel und M Mayer Daraus ergibt sich die Matrix M 0 Die Diagonalelemente von M M und von M M haben eine einfache Interpretation: Das i-te Diagonalelement von M M ist die Anzahl der Loci, an denen das i-te Tier homozygot ist Das j-te Diagonalelement von M M ist die Anzahl der Tiere, die am Marker j homozygot sind In unserem Beispiel ist M M 20 und M M 03 20 02 Sei nun p j die Häufigkeit des Allels am j-ten Locus, und zwar ist hier die Allelhäufigkeit in der unselektierten Basispopulation gemeint Eine Methode zum Schätzen dieser Allelhäufigkeiten mit Hilfe der Allelhäufigkeiten bei typisierten Tieren wird in Gengler et al (2007) vorgestellt wir gehen darauf nicht näher ein Setzt man die Population als im Hardy-Weinberg-Gleichgewicht befindlich voraus, so ergibt sich folgender Erwartungswert für die Codierungen (, 2 0, 22 -) am j-ten Locus: p 2 j + 0 2p j ( p j ) + ( ) ( p j ) 2 p 2 j ( p j ) 2 2p j Sei P diejenige n m-matrix, die in der j-ten Spalte an jeder Stelle ein 2p j - stehen hat, also P 2p 2p 2 2p m 2p 2p 2 2p m 2p 2p 2 2p m Wir zentrieren die Matrix M mit Hilfe dieser Mittelwerte für die Codierungen und erhalten Z : M P In VanRaden (2008) sind nun die folgenden drei Varianten für genomische (realisierte) Verwandtschaftsmatrizen zu finden (i) Man setzt m G : ZZ --------------, wobei k 2 p j ( p j ) k Es kann gezeigt werden, dass unter bestimmten Bedingungen ein genomisches BLUP- Modell mit der Annahme normalverteilter unkorrelierter QTL-Effekte äquivalent zu einem Modell unter Verwendung der hier beschriebenen Verwandtschaftsmatrix ist Genaueres hierzu ist zb in Habier et al (2007), Gianola et al (2009) und Hayes et al (2009b) zu finden In Gianola et al (2009) wird auch noch eine modifizierte Form von k vorgeschlagen, welche die zufällige Auswahl der SNP berücksichtigt j

Realisierte Verwandtschaftsmatrizen und Zuchtwertschätzung für die genomische Selektion 73 (ii) Man setzt G : ZDZ, wobei D die Diagonalmatrix mit den Diagonalelementen D jj ------------------------------------------------------ m[ 2p j ( )] ist Die Variante beruht auf Amin et al (2007) (iii) Die dritte Methode kommt ganz ohne Allelfrequenzen aus Man passt Parameter g 0 und g so an, dass der Fehler ( ) ij Δ : MM g 0 g A Δ ij p j minimal wird, wobei A die pedigreebasierte Verwandtschaftsmatrix ist, und setzt dann MM g ( ) G : 0 ----------------------------------------------------- 2 Dabei soll Δ minimal heißen, dass Δ ij minimal ist i, j Den Matrizen G gemäß (i) und (ii) ist aufgrund ihrer Form anzusehen, dass sie positiv semidefinit, aber im Allgemeinen nicht positiv definit sind Dem letzten Ansatz liegt die Idee zugrunde, dass die Matrix MM rein qualitativ schon so etwas wie eine (realisierte) Verwandtschaftsmatrix ist, nur müssen ihre Elemente noch durch eine (der Einfachheit halber als linear angenommene) Transformation in den richtigen Bereich gebracht werden Die umgekehrte Transformation, welche aus den Matrixelementen a von Verwandtschaftsmatrizen Matrixelemente μ von MM macht, ist dann ebenfalls linear und werde durch a g 0 + g a bewerkstelligt Die unbekannten Koeffizienten g 0 und g sind dabei so zu wählen, dass die g 0 + g a möglichst nah an den richtigen μ 's liegen, und dies geschieht dadurch, dass man den obigen quadratischen Gesamtfehler 2 Δ ij i, j minimiert Der derartig (näherungsweise) aufgestellte lineare Zusammenhang MM g 0 + g A wird dann dazu benutzt, um aus dem realisierten MM, sozusagen als Kandidat für ein besseres A, die Matrix G gemäß () zu schätzen Wir legen jetzt kurz dar, wie man g 0 und g bestimmen kann Dabei folgen wir dem in VanRaden (2008) skizzierten Weg, stellen aber die Details der Argumentation etwas deutlicher heraus Hierzu betrachten wir für N IN einen Vektor y IR N und k( IN) linear unabhängige Vektoren b 0,, b k- IR N und fragen, wie man Koeffizienten g i so bestimmen kann, dass k y g i b i i 0 minimal wird, wobei x 2 : x,x mit dem euklidischen (üblichen) Skalarprodukt, für Vektoren x IR N gesetzt wurde (In unserer Situation ist k 2, und die n n-matrizen MM, und A werden einfach als Vektoren des IR N für N n 2 aufgefasst, also y MM, b 0 und b A g 2

74 N Poschadel und M Mayer k 2 Hierbei ist A die pedigreebasierte Verwandtschaftsmatrix für die betrachtete Population und α ein geeignetes Varianzverhältnis Eine im Hinblick auf die Lösungsmenge äquivay g i b i y g i b i i 0 wird genau dann minimal, wenn der Vektor i 0 orthogonal auf dem von b 0,, b k- aufgespannten Unterraum steht (Satz des Pythagoras), und dies gilt genau dann, wenn k y g i b i,b j 0 i 0 ist für j 0,, k- Dies ist offenbar äquivalent zu k k y,b g b i i,b j für j 0,,k i 0 Die Koeffizientenmatrix ( b i,b j ) i,j ist als Gramsche Matrix der linear unabhängigen Vektoren b 0,, b k- regulär, also ist das lineare Gleichungssystem (LGS) eindeutig nach den g i auflösbar Für k 2 ist dieses LGS gerade b 0,b 0 b,b 0 y,b 0 b 0,b b,b g y,b Für unsere Vektoren y MM, b 0 und b A ist dabei b 0,b 0 n 2, i j i j i j b,b 0 a ij, b,b a 2 ij, y,b 0 ( MM ) ij und y,b ( MM ) ij a ij (i und j laufen dabei jeweils von bis n) g 0 i j 3 Zusammenfügen von Pedigree- und Markerinformationen Wir fragen uns jetzt, wie man Markerinformationen einiger typisierter Tiere in eine aus einem Pedigree bestimmte Verwandtschaftsmatrix einbauen könnte Wenn man bei der Lösung von Mischmodellgleichungen die Verwandtschaftsmatrix durch diese neue Matrix ersetzt, ergeben sich auch rechentechnische Fragestellungen, welche im Folgenden angeschnitten werden sollen 3 Mischmodellgleichungen mit modifizierter Verwandtschaftsmatrix Die nun folgende Darstellung basiert auf Misztal et al (2009) und Legarra et al (2009) Im linearen Modell y Xb + Za + e mit fixen Effekten b und zufälligen Effekten a (und zugehörigen Designmatrizen X bzw Z) für den Vektor y der phänotypischen Werte erhält man Schätzungen bˆ und â für b bzw a aus den Mischmodellgleichungen X X X Z Z X Z Z + αa bˆ â X y Z y

Realisierte Verwandtschaftsmatrizen und Zuchtwertschätzung für die genomische Selektion 75 lente Darstellung ohne A - erhält man durch Linksmultiplikation der unteren Gleichung mit A: X X X Z AZ X AZ Z + αi bˆ â X y AZ y A - kann (nach Henderson (976)) leicht mit Hilfe des Pedigree berechnet werden Daher ist es vorteilhaft, die erste der beiden Formen zu verwenden, denn dann ist die Koeffizientenmatrix des gesamten Gleichungssystems symmetrisch und dafür existieren effiziente Lösungsverfahren Es wird nun angestrebt, A durch eine geeignetere Matrix H zu ersetzen, etwa eine Matrix, die sowohl Pedigree- als auch Markerinformationen berücksichtigt Wenn sich H (schnell) invertieren lässt, ist die erste Variante der Mischmodellgleichungen (mit H - statt A - ) vorteilhaft Anderenfalls kann man noch die zweite Variante verwenden, sie lautet: X X X Z HZ X HZ Z + αi Die Koeffizientenmatrix ist dann aber ia nicht mehr symmetrisch Bei großen Pedigrees ist die Matrix A bzw H zu groß, um vollständig im Speicher eines Computers gehalten werden zu können Es gibt jedoch Algorithmen, die zum Lösen eines Gleichungssystems LS w nicht die Matrix LS als Ganzes, sondern nur (gewisse) Vektoren LS q benötigen Diese können unter Umständen direkt berechnet werden, ohne dass man zuvor LS aufstellen muss Dies ist beispielsweise dann der Fall, wenn LS die pedigreebasierte Koeffizientenmatrix der Mischmodellgleichungen ist, dann lassen sich die Vektoren LS q mit Hilfe des Pedigree bestimmen, und zwar mit einem Algorithmus von (Colleau, 2002) Wie soll nun H aussehen? Wir beginnen mit einem ganz einfachen Beispiel: Einige der Tiere wurden typisiert, und für diese hat man eine genomische Verwandtschaftsmatrix G erhalten Diese soll in A integriert werden Man stellt A dar als bˆ â X y HZ y RS ( LS Linke Seite, RS Rechte Seite) ( 2) A A A 2 A 2, wobei die (pedigreebasierte) Verwandtschaftsmatrix der typisierten Tiere ist Diese wird einfach durch G ersetzt, also: H: A A 2 G A 2 H ist aber keine Matrix aus einem Guss, sondern aus G und Teilen von A zusammengestückelt Dies kann zu Inkonsistenzen führen: Die neu erhaltenen Informationen über die typisierten Tiere könnten auch Änderungen von anderen Matrixelementen nötig werden lassen! Beispielsweise könnte die genomische Ähnlichkeit zweier (typisierter) Vollgeschwister i und j unverwandter Eltern (zufällig) größer oder kleiner sein, als sie durch den entsprechenden Koeffizienten ½ der Verwandtschaftsmatrix beschrieben wird Diese Korrektur müsste sich auch auf den Verwandtschaftskoeffizienten etwaiger (nicht

76 N Poschadel und M Mayer typisierter) Nachkommen von i und j auswirken Eine große genomische Ähnlichkeit von i und j könnte auch darauf hindeuten, dass ihre Eltern doch verwandt waren Des Weiteren braucht eine wie oben zusammengesetzte Matrix H auch nicht positiv definit zu sein Mit Δ A : H-A ist H A+Δ A, kann also als ein um Δ A gestörtes A aufgefasst werden Im obigen Beispiel H A A 2 gilt also ΔA G A 2 0 0 0 G Ist H A + ΔA mit einem hinreichend einfachen ΔA (ohne dass wir uns auf ein konkretes ΔA festlegen müssen) und haben die Mischmodellgleichungen die Form LS H w RS H, so lassen sich, wie Misztal et al (2009) dargelegt haben, die benötigten Vektoren (LS H ) q (siehe oben) kostengünstig bestimmen Fazit: Auch nach hinreichend kleinen Modifikationen von A durch Markerinformationen für einzelne Tiere lassen sich die entsprechend modifizierten Mischmodellgleichungen noch effektiv lösen Hierzu kann es aber notwendig sein, Lösungsverfahren für lineare Gleichungssysteme zu verwenden, die keine symmetrische Koeffizientenmatrix voraussetzen 32 Eine einheitliche Verwandtschaftsmatrix aus Pedigree- und genomischer Information Im vorigen Abschnitt haben wir generell dargelegt, was man in rechentechnischer Hinsicht machen kann, wenn die pedigreebasierte Verwandtschaftsmatrix A durch eine geeignetere Matrix H ersetzt wird Ferner haben wir eine ad hoc-möglichkeit zur Konstruktion von H beschrieben Wir möchten nun eine Variante zur Konstruktion von H vorstellen, die in Legarra et al (2009) behandelt wird Mit den Bezeichnungen aus dem letzten Abschnitt ist die Verwandtschaftsmatrix A durch (2) gegeben Da A symmetrisch ist, sind auch A und symmetrisch, und es gilt A 2 A 2 Wie oben beziehe sich der Index 2 auf die typisierten und auf die untypisierten Tiere Nun wird (wie oben) davon ausgegangen, dass durch G ersetzt werden kann, dh dass alle relevanten Informationen über die typisierten Tiere bereits in G eingearbeitet sind Es kann sein, dass G allein auf den genomischen Daten basiert und daher die dem Pedigree entnommenen und in codierten Verwandtschaftsverhältnisse der typisierten Tiere keine Rolle mehr spielen Ebenso ist aber auch denkbar, dass in G sowohl Marker- als auch Pedigreeinformationen einfließen Ein heuristischer Ansatz hierfür ist, G als Mischung G λg b + ( λ) zu definieren, wobei jetzt G b eine nur aus Markerinformationen gewonnene Matrix und λ [0,] ein geeigneter Gewichtungsfaktor ist Dieser Ansatz bietet sich insbesondere dann an, wenn G b nicht invertierbar ist und man erst durch die Zugabe eines gewissen -Anteils zu einer invertierbaren Matrix G gelangt In Aguilar et al (200) ist der Wert λ 095 angegeben, und es wird darauf hingewiesen, dass keine empfindliche Abhängigkeit der Ergebnisse von λ besteht Beispielsweise wurden bei einer alternativen Wahl von λ 098 in den Rechnungen nur unbedeutende Abweichungen festgestellt

Realisierte Verwandtschaftsmatrizen und Zuchtwertschätzung für die genomische Selektion 77 Anders als oben modelliert, zieht diese neue Information über die typisierten Tiere nunmehr aber auch eine Korrektur der übrigen Teile von A nach sich Gemäß Legarra et al (2009) entsteht dann die Matrix ( 3) H A + A 2 ( G ) A2 A A 2 22 GA 22 A2 G G A 2 ( G ) A2 A A 2 ( G ) + ( G ) A2 G A 22 Diese Matrix wird auch in Christensen and Lund (200) betrachtet, aber im Detail etwas anders als in Legarra et al (2009) abgeleitet Wir möchten hier kurz skizzieren, wie (3) in Legarra et al (2009) begründet wird weitere Details sind dort nachzulesen Auch hier wird beabsichtigt, durch G zu ersetzen Sind die Zuchtwerte (a,a 2 ) (multivariat) N(0,σ 2 A) normalverteilt, so ist die bedingte Verteilung von a bei gegebenem a 2 bekanntlich ebenfalls normalverteilt, und zwar mit dem Verteilungsgesetz NA 2 a2 σ 2 (, ( A A 2 A2 )) Demnach ist a die Summe aus dem bedingten Erwartungswert A 2 - a 2 und einer N(0,σ 2 (A -A 2 -A 2 ))-verteilten Zufallsvariablen ε Schreibt man nun gemäß der intendierten Ersetzung von durch G dem Vektor a 2 der Zuchtwerte der typisierten Tiere die Kovarianzmatrix σ 2 G zu und postuliert mit einer wie angegeben verteilten und zu a 2 unkorrelierten Zufallsvariablen ε, so ergibt sich die Kovarianzmatrix von a zu Analog erhält man a A 2 var( a ) A 2 var( a 2 ) A 2 ( ) a2 + ε var( ε) σ 2 ( A 2 GA22 A2 + A A 2 A2 ) cov( a, a 2 ) cov A 2 A 22 a2 ε a ( +, ) cov( A 2 2 a2, a 2 ) A 2 cov ( a2, a 2 ) σ 2 A 2 Diese Beziehungen liefern die obige Form von H Die Inverse von H lässt sich leicht auf die Inverse von A zurückführen Es gilt nämlich H A + 0 0 + 0 G A 22 G Im Folgenden soll an einem einfachen Beispiel dargestellt werden, welche Matrizen H sich für konkrete genomische Matrizen G ergeben Hierzu werden zwei als unverwandt angenommene Eltern und 2 mit zwei Nachkommen (also Vollgeschwistern) 3 und 4 betrachtet Man erhält (bei der natürlichen Reihenfolge -2-3-4 der Tiere) die Pedigree-Verwandtschaftsmatrix

78 N Poschadel und M Mayer A 0 ½ ½ 0 ½ ½ ½½ ½ ½½½ Gemäß unseren Bezeichnungen sind dann also A 0 0, A 2 ---- und A 2 22 ½ ½ Es möge nun durch Untersuchung der Genome der Nachkommen 3 und 4 deren realisierte Verwandtschaftsmatrix G aufgestellt worden sein Wir untersuchen nun für verschiedene G, welche Matrix H sich damit ergibt Zunächst geben wir H als Blockmatrix für allgemeines G an Dazu benötigen wir die Matrix Also gilt A 2 A 22 ---- 4 ---- -½ 2 3 -½ ---- 3 H 0 ---------------- 0 3 3 G A + 22 ---- 3 G --------------------------------------------------------------------------------------------------------------------------------------------------------------------- G 3 ---- G Wir betrachten folgende Beispiele für G Es sei G g 2 g 2 Die Einser in der Diagonale tragen der Annahme Rechnung, dass die Elterntiere unverwandt sind und demnach die Nachkommen keinerlei Inzucht aufweisen Das Nichtdiagonalelement g 2 spiegelt die genomische Ähnlichkeit der beiden Nachkommen 3 und 4 wider Es kann Werte zwischen 0 und annehmen, ist aber im Mittel gleich dem pedigreebasierten Wert ½ Man erhält also ( ) ij H h ij 2g 2 2g 2 + ------------------------------- ------------------------------- 9 9 ( + g 2 ) 3 ( + g 2 ) 3 2g 2 ------------------------------- 2g 2 + ------------------------------- 9 9 ( + g 2 ) 3 ( + g 2 ) 3 ( + g 2 ) 3 ( + g 2 ) 3 g 2 ( + g 2 ) 3 ( + g 2 ) 3 g 2 Hat g 2 den Wert ½ (dann ist ja auch G ), so stimmt H mit der pedigreebasierten Verwandtschaftsmatrix A überein Ist g 2 >½, so ist h 2 >0 und h >, was bedeutet,

Realisierte Verwandtschaftsmatrizen und Zuchtwertschätzung für die genomische Selektion 79 dass man den Elterntieren und 2 im Gegensatz zur ursprünglichen Annahme nun doch noch eine gewisse Verwandtschaft und eine Inzucht zuschreiben würde Im Extremfall g 2 erhält man H 0 9 9 2 3 2 3 9 0 9 2 3 2 3 2 3 2 3 2 3 2 3 Dieser Fall tritt dann ein, wenn die Nachkommen 3 und 4 genetisch identisch sind Dies ist bei eineiigen Zwillingen der Fall, kann aber theoretisch (mit sehr geringer Wahrscheinlichkeit) auch zufällig bei unverwandten Eltern ohne Inzucht zustande gekommen sein Problematischer ist dagegen der Fall g 2 < ½, denn dann ist h 2 <0 und h < Die so entstehende Matrix H ist zumindest aus wahrscheinlichkeitstheoretischer Sicht schwerlich als Verwandtschaftsmatrix interpretierbar Im Extremfall g 2 0 erhält man H 8 9 9 3 3 9 8 9 3 3 3 3 0 3 3 0 Auch der Fall g 2 0 kann theoretisch eintreten, nämlich dann, wenn 4 an jedem Genort sowohl von als auch von 2 gerade dasjenige Allel bekommt, das 3 nicht bekommt 33 Diskussion Aguilar et al (200) sehen den Hauptvorteil der kombinierten Zuchtwertschätzung im Rahmen der genomischen Selektion in ihrer strukturellen Einfachheit und der automatischen Gewichtung der verschiedenen Informationsquellen In Bezug auf Genauigkeit und Verzerrung der geschätzten Zuchtwerte ergaben sich in ihrer Untersuchung keine größeren Unterschiede zwischen der kombinierten und der einheitlichen Zuchtwertschätzung Die Autoren erwarten aber, dass die einheitliche Zuchtwertschätzung in der Zukunft, wenn Tiere aufgrund ihres Genotyps vorselektiert sind, Vorteile bringen sollte (vgl hierzu Patry and Ducrocq, 2009) Wir möchten jedoch auch darauf hinweisen, dass es auf dem Gebiet der genomischen Zuchtwertschätzung noch eine ganze Reihe offener Fragen gibt So ist es beispielsweise nicht ganz einfach, die für einige Varianten von genomischen Verwandtschaftsmatrizen benötigten Allelfrequenzen zu schätzen Wir hatten bereits erwähnt, dass diese Fragestellung in Gengler et al (2007) behandelt wird Ferner ist nicht unmittelbar einzusehen, warum alle Marker in gleicher Weise bei der Aufstellung genomischer Verwandtschaftsmatrizen berücksichtigt werden sollten Unterschiedlich stark an die Merkmals-QTL gekoppelte Marker und Unterschiede in den QTL-Effekten führen dazu, dass Marker auch unterschiedlich bei der Berechnung der genomischen Verwandtschaftsmatrizen gewichtet werden sollten, vgl hierzu Christensen and Lund (200) Daraus ergibt sich auch, dass für unterschiedliche Merkmale ia verschiedene genomische Verwandtschaftsmatrizen relevant sind Auf der anderen Seite vertreten Misztal et al (200) die Meinung, dass genomische Selektion eher durch das Erfassen von Verwandtschaften als durch das Schätzen von Effekten von Hauptgenen funktioniert

80 N Poschadel und M Mayer Danksagung Wir möchten einem uns unbekannten Gutachter unseren Dank für wertvolle Hinweise und Kommentare zu der ursprünglichen Version unseres Manuskripts aussprechen Literatur Aguilar, I, I Misztal, DL Johnson, A Legarra, S Tsuruta and TJ Lawlor, (200): Hot topic: A unified approach to utilize phenotypic, full pedigree, and genomic information for genetic evaluation of Holstein final score J Dairy Sci 93, 743 752 Amin, N, van CM Duijn and Y Aulchenko, (2007): A Genomic Background Based Method for Association Analysis in Related Individuals PLoS One 2, e274 Bink, MCAM, AD Anderson, WE van de Weg and EA Thompson, (2008): Comparison of marker-based pairwise relatedness estimators on a pedigreed plant population Theor Appl Genet 7, 843 855 Christensen, OF and MS Lund, (200): Genomic prediction when some animals are not genotyped Genet Sel Evol 42, 2 Colleau, J-J, (2002): An indirect approach to the extensive calculation of relationship coefficients Genet Sel Evol 34, 409 42 Eding, H and T Meuwissen, (200): Marker-based estimates of between and within population kinships for the conservation of genetic diversity J Anim Breed Genet 8, 4 59 Gengler, N, P Mayeres and M Szydlowski, (2007): A simple method to approximate gene content in large pedigree populations: application to the myostatin gene in dual-purpose Belgian Blue cattle Animal, 2 28 Gianola, D, G de los Campos, WG Hill, E Manfredi and R Fernando, (2009): Additive Genetic Variability and the Bayesian alphabet Genetics 83, 347 363 Habier, D, RL Fernando and JCM Dekkers, (2007): The impact of genetic relationship information on genome-assisted breeding values Genetics 77, 2389 2397 Hayes, BJ, PJ Bowman, AJ Chamberlain and ME Goddard, (2009a): Invited review: Genomic selection in dairy cattle: progress and challenges J Dairy Sci 92, 433 443 Hayes, BJ and ME Goddard, (2008): Technical note: Prediction of breeding values using marker-derived relationship matrices J Anim Sci 86, 2089 2092 Hayes, BJ, PM Visscher and ME Goddard, (2009b): Increases accuracy of artificial selection by using the realized relationship matrix Genet Res, 9, 47 60 Henderson, CR, (976): A simple way for calculating the inverse of a numerator relationship matrix used in prediction of breeding values Biometrics 32, 69 83 Legarra, A, I Aguilar and I Misztal, (2009): A relationship matrix including full pedigree and genomic information J Dairy Sci 92, 4656 4663 Li, CC, DE Weeks and A Chakravarti, (993): Similarity of DNA fingerprints due to chance and relatedness Hum Hered 43, 45 52 Lynch, M and K Ritland, (999): Estimation of pairwise relatedness with molecular markers Genetics 52, 753 766 Misztal, I, A Legarra and I Aguilar, (2009): Computing procedures for genetic evaluation including phenotypic, full pedigree, and genomic information J Dairy Sci 92, 4648 4655 Misztal, I, I Aguilar, A Legarra, S Tsuruta, D Johnson and T Lawlor, (200): A Unified Approach To Utilize Phenotypic, Full Pedigree, And Genomic Information For Genetic Evaluation Proc 9th World Congr Genet Appl Livest Prod, ID 0050, 8

Realisierte Verwandtschaftsmatrizen und Zuchtwertschätzung für die genomische Selektion 8 Nejati-Javaremi, A, C Smith and JP Gibson, (997): Effect of total allelic relationship on accuracy of evaluation and response to selection J Anim Sci 75, 738 745 Patry, C and V Ducrocq, (2009): Bias due to Genomic Selection In: Proc Interbull Workshop, January 26 29, Bulletin 39, Uppsala, Sweden Pirchner, F, (979): Populationsgenetik in der Tierzucht Verlag Paul Parey, Hamburg und Berlin Seefried, F, Z Liu, G Thaller and F Reinhardt, (200): Die Genomische Zuchtwertschätzung bei der Rasse Deutsche Holstein Züchtungskunde 82, 4 2 Su, G, B Guldbrandtsen, VR Gregersen and MS Lund, (200): Preliminary investigation on reliability of genomic estimated breeding values in the Danish Holstein population J Dairy Sci 93, 75 83 VanRaden, P, (2008): Efficient methods to compute genomic predictions J Dairy Sci 9, 444 4423 VanRaden, PM, CPV Tassell, GR Wiggans, TS Sonstegard, RD Schnabel, JF Taylor and FS Schenkel, (2009): Invited review: Reliability of genomic predictions for North American Holstein bulls J Dairy Sci 92, 6 24 Visscher, PM, (2009): Whole genome approaches to quantitative genetics Genetica 36, 35 358 Wang, J, (2002): An estimator for pairwise relatedness using molecular markers Genetics 60, 203 25 Xie, C, DD Gessler and S Xu, (998): Combining different line crosses for mapping quantitative trait loci using the identical by descent-based variance component method Genetics 49, 39 46