Einführung in die Genexpressionsplattform des IVM 1. Prinzip und wichtige Termini 2. RNA Präparation und Qualitätskontrolle 3. Datenauswertung 4. Kosten 5. Protokolle 6. Informationen für Kooperationspartner 7. Downloads
1.Prinzip und wichtige Termini 1. Prinzip und wichtige Termini Die humanen, murinen u.a. Genomprojekte und die Verfügbarkeit robuster Hardware- und Software-Plattformen zur Herstellung und Auswertung von Microarrays ermöglichen genomweite Genexpressionanalysen, d.h. die Quantifizierung aller mrnas (> 30 000) eines RNA Extrakts relativ zu einem zweiten RNA Extrakt, in 48 Stunden. Die Plattform des IVM (Firma Affymetrix) ist mit einem Hybridisierungsofen, einer Waschstation, einem Scanner und Software ausgerüstet. Letztere erlaubt die mathematischen, statistischen und informationstechnologischen Auswertungen der Arrays.
1. Prinzip und wichtige Termini Verschiedene Spezies können untersucht werden Affymetrix bietet für mehrere Organismen Expressionsarrays an. Diese werden in verschiedenen Formaten angeboten. Je nach Format und Protokoll werden 0,5-5 µg RNA für einen Array benötigt.
Die Herstellung der Arrays 1. Prinzip und wichtige Termini Grundlage der Arraytechnologie sind die Sequenzinformationen der verschiedenen Genomprojekte. Mittels Photolithographie werden auf einer Glasoberfläche 25mer - sogenannte Perfect Match Oligonukleotide (ON) synthetisiert. Neben jedem Perfect Match ON wird ein sogenanntes Miss Match ON, das gegenüber dem Perfect Match ON einen Nukleotidaustausch in Position 13 enthält, synthetisiert. Daraus ergeben sich Perfect Match - Miss Match ON Paare, die sogenannten Probe Pairs. Die Signale des Miss Match ONs werden vom Perfect Match ON abgezogen. Hierdurch werden Sensitivität und Spezifität erhöht. Jede RNA Sequenz ist durch ein Probe Set, bestehend aus 11 solcher Probe Pairs, repräsentiert. Dies ermöglicht eine statistische Aussage über die Qualität des Messwertes.
1. Prinzip und wichtige Termini Das Prinzip Probe Set Miss Match (MM) Perfect Match (PM) Nucleotidaustausch an Pos. 13 Probe Pair Probe Set Feature
Synthese der Sonden oder Proben 1. Prinzip und wichtige Termini
1. Das Prinzip und wichtige Termini Der Waschvorgang und das Scannen Fluidics Station
1. Das Prinzip und wichtige Termini Interne Kontrollen der Arrays Percent present Probenqualität und Reproduzierbarkeit Background und Noise Scanner Elektrik und Hybridisierung 3-5 Verhältnis verschiedener Housekeeping Gene Spiked oligo controls Qualität der crna insgesamt Hybridisierung, Färbung (Effizienz und Linearität) poly(a)-rna spikes Qualität der crna Synthese
2. RNA Präparation und Qualitätskontrolle Wichtigste Voraussetzung für einen Array hoher Qualität ist eine hochwertige RNA. Degradation und Verunreinigungen müssen vermieden werden. Wir empfehlen den Qiagen RNeasy Lipid Tissue Mini Kit. Zusätzlich kommt bei Geweben der Probengewinnung, Lagerung und Homogenisation eine besondere Bedeutung zu. Dies muß für jedes Gewebe gesondert evaluiert werden.
Schema der RNA Präparation 2. RNA Präparation und Qualitätskontrolle
2. RNA Präparation und Qualitätskontrolle RNA Integrität mit dem Agilent System Es sollten keine kurzen RNA Fragmente sichtbar werden Fluorescence 22.5 20.0 17.5 15.0 12.5 10.0 7.5 5.0 28s - 18s ratio >1.8 2.5 0.0 18S 28S 19 24 29 34 39 44 49 54 59 Time (seconds) Die Stadien der RNA Degradation 30 17.5 12.5 4.0 3.5 25 15.0 10.0 3.0 Agilent Lab on a Chip Fluorescence 20 15 10 Fluorescence 12.5 10.0 7.5 5.0 Fluorescence 7.5 5.0 Fluorescence 2.5 2.0 1.5 1.0 5 2.5 2.5 0.5 0 18S 28S 0.0 18S 28S 0.0 18S 28S 0.0 GAPDH Transcripts / ng RNA 19 24 29 34 39 44 49 54 59 19 24 29 34 39 44 49 54 59 19 24 29 34 39 44 49 54 59 19 24 29 34 39 44 49 54 59 Time (seconds) Time (seconds) Time (seconds) Time (seconds) 9180 2474 971 145
3. Datenauswertung Es gibt eine unüberschaubare Anzahl an Ansätzen. Welche man wählt, hängt von der experimentellen Fragestellung ab. Grundsätzlich unterteilt sich die Auswertung in 3 Stufen: Rohdatenauswertung mit Report zur Qualitätskontrolle Die statistische Auswertung und Filterung Die Annotation und funktionelle Auswertung.
Qualitätskontrolle GCOS (Report) 3. Datenauswertung Datenauswertung und verfügbare Tools Rohdatenanalyse GCOS Datenbank GCOS Manager Funktionelle Bewertung GeneSpring, NetAffx, Gene Ontology, GenMapp, RefSeq, Unigene Bezugzuden Rohdaten herstellen Access, GeneSpring, Excel Statistik Excel, GeneSpring Clustering GeneSpring, Ergebnisdarstellung GeneSpring, Excel, Fatigo
Die Rohdatenanalyse mit der GCOS 3. Datenauswertung DAT-File 7 x 7 Pixel pro Feature CEL-File Eine Zahl pro Feature CHP-File Ein Signal Wert mit Detection p-wert pro Probeset Zusätzlich wird ein Report erstellt, der alle relevanten Qualitätsparameter enthält
3. Datenauswertung Der Call Die Analyse der Probe Pairs eines Probe Sets, d.h. eines Gens oder mrna, führt durch die GCOS Software zum Call. Absent Call (nicht exprimiert): Detection p-wert > 0,065 Marginal Call (eventuell exprimiert): Detection p-wert 0,065-0,05 Present Call (exprimiert): Detection p-wert < 0,05. Absent, present und marginal Calls ergeben sich aus Signalintensitäten von Hybridisierungssignalen, die mit Fehlern behaftet sein können. Calls sind deshalb nur vorläufige Beurteilungen, insbesondere müssen die marginal und absent Calls mit Vorsicht interpretiert werden und, bei Bedarf, durch RT-PCR überprüft werden.
3. Datenauswertung Die Normalisierung Um die Daten verschiedener Arrays vergleichbar zu machen, müssen die Daten normalisiert werden. Hierzu gibt es viele verschiedene Möglichkeiten. Wir benutzen: Standard: Skalierung auf einen Zielwert von 500 am Mittelwert Bei Sättigung: Skalierung auf einen Zielwert 500 am Median Für Tests allgemein: Logarithmierung und Skalierung per Gen an der 50ten Perzentile
Der Scatter Plot 3. Datenauswertung Die einfachste Auswertung eines 2 Array Experiments (Kontrolle gegen Probe) ist der Scatter Plot, bei dem die Ergebnisse der beiden Arrays logarithmisch gegeneinander aufgetragen werden. Rot: Present - Present; Gelb: Absent - Absent; Blau: Absent - Present Mehr als 30 fach differentiell exprimiertes Gen FoldChange Linien, 2x, 3x, 10x und 30x
Statistische Auswertung und Filterung 3. Datenauswertung Eine statistische Auswertung setzt wenigstens 3, besser 5, Wiederholungsmessungen voraus. Sie liefert ein zusätzliches Filterkriterium in Form des p-wertes. Die Filterung reduziert die Datenflut. Die Schwellenwerte sind willkürlich.. Filter: 1. Signalwert 2. Detection p-wert 3. Fold Change 4. p-wert des Tests. Das Ergebnis ist eine Liste von Kandidatengenen, die mit erhöhter Wahrscheinlichkeit tatsächlich differentiell exprimiert sind. Durch die Stringenz der Schwellenwerte kann die Qualität der Kandidatenliste erhöht werden.
Reduzierte Streuung durch Mittelwertbildung 3. Datenauswertung
Filter 3. Datenauswertung
Kombination der Filter: Ergebnisliste 3. Datenauswertung
Die Annotation 3. Datenauswertung Problem: Der Experimentator erhält eine Genliste, die unbekannte Gene enthält und ungeordnet ist: Ein schnelles Verfahren zur Informationsbeschaffung wird nötig. Datenbanken können weitere Informationen bereitstellen: Liste mit Affymetrix Nummern via Access, GeneSpring, NetAffx Bezug zu Datenbank Termini - Pubmed - UniGene - LocusLink / Entrez Gene - OMIM - Ensembl -...
4. Die Kosten Die Kosten pro Array betragen 800.- bis 1250.-. Die exakten Kosten hängen vom Leistungsumfang und dem Arraytyp ab.
5. Die verschiedenen Protokolle Es kommen 6 verschiedene Protokolle zum Einsatz. Standard (S), Midi (M) und Small Scale (X), jeweils für die Arrayformate Standard (1) und Midi (2). Nachfolgende Übersicht zeigt, worin sich die Protokolle im wesentlichen unterscheiden: Protokoll: MA-S1 MA-S2 MA-M1 MA-M2 MA-X1 MA-X2 Eingesetzte RNA Menge 5 µg 3 µg 2 µg 1 µg 0,7 µg 0,5 µg IVT-Zeit 4 h 4 h 16 h 16 h 16+8 h 16+8 h Benötigte Menge an crna 14 µg 8,5 µg 12 µg 8 µg 12 µg 8 µg Hybridisierungsvolumen 200 µl 130 µl 200 µl 130 µl 200 µl 130 µl
6. Information für Kooperationspartner Vorgehen: Kontaktaufnahme per Mail: andreas.habenicht@mti.uni-jena.de Besprechung und Beratung Übergabe der Proben mit Projektblatt (Vordruck aus IVM) Durchführung der Microarrays Übergabe der Daten als Rohdatenfiles und als Excelfiles (Eine Excel Vorlage zur Auswertung wird bereitgestellt)
7. Downloads Vertrag Excelvorlage zur Auswertung Manual zur Excelvorlage Vordruck Projektblatt