Vorhersage von mirna targets in Säugetieren mirna target prediction am Beispiel von TargetScan

Ähnliche Dokumente

Lineargleichungssysteme: Additions-/ Subtraktionsverfahren

Zeichen bei Zahlen entschlüsseln

Ist Fernsehen schädlich für die eigene Meinung oder fördert es unabhängig zu denken?

Eine der Aktien hat immer einen höheren Gewinn als die andere Aktie. Ihre Aufgabe ist es diese auszuwählen.

Mobile Intranet in Unternehmen

Erfahrungen mit Hartz IV- Empfängern

Professionelle Seminare im Bereich MS-Office

Grundlagen der Theoretischen Informatik, SoSe 2008

Ugra Proof Certification Tool

Informationsblatt Induktionsbeweis

Würfelt man dabei je genau 10 - mal eine 1, 2, 3, 4, 5 und 6, so beträgt die Anzahl. der verschiedenen Reihenfolgen, in denen man dies tun kann, 60!.

Die Post hat eine Umfrage gemacht

Erstellen von x-y-diagrammen in OpenOffice.calc

V 2 B, C, D Drinks. Möglicher Lösungsweg a) Gleichungssystem: 300x y = x + 500y = 597,5 2x3 Matrix: Energydrink 0,7 Mineralwasser 0,775,

Welche Lagen können zwei Geraden (im Raum) zueinander haben? Welche Lagen kann eine Gerade bezüglich einer Ebene im Raum einnehmen?

Professionelle Seminare im Bereich MS-Office

Welche Unterschiede gibt es zwischen einem CAPAund einem Audiometrie- Test?

QM: Prüfen -1- KN

Homologie und Sequenzähnlichkeit. Prof. Dr. Antje Krause FH Bingen / akrause@fh-bingen.de

Festigkeit von FDM-3D-Druckteilen

VORANGEGANGENE MODELLE

Erweiterung der Aufgabe. Die Notenberechnung soll nicht nur für einen Schüler, sondern für bis zu 35 Schüler gehen:

Ein neues System für die Allokation von Spenderlungen. LAS Information für Patienten in Deutschland

1 topologisches Sortieren

Übungen Programmieren 1 Felix Rohrer. Übungen

Weiterbildungen 2014/15

Biologie I/B: Klassische und molekulare Genetik, molekulare Grundlagen der Entwicklung Theoretische Übungen SS 2014

Primzahlen und RSA-Verschlüsselung

ONLINE-AKADEMIE. "Diplomierter NLP Anwender für Schule und Unterricht" Ziele

Anleitung über den Umgang mit Schildern

Handbuch. NAFI Online-Spezial. Kunden- / Datenverwaltung. 1. Auflage. (Stand: )

geben. Die Wahrscheinlichkeit von 100% ist hier demnach nur der Gehen wir einmal davon aus, dass die von uns angenommenen

Lehrer: Einschreibemethoden

Die neue Aufgabe von der Monitoring-Stelle. Das ist die Monitoring-Stelle:

Lineare Gleichungssysteme

Unterrichtsmaterialien in digitaler und in gedruckter Form. Auszug aus: Übungsbuch für den Grundkurs mit Tipps und Lösungen: Analysis

Existenzgründer Rating

Nachkalkulation. Hat sich das Objekt CVO Auxilium hilden im Juni rentiert?

Berechnung der Erhöhung der Durchschnittsprämien

Kulturelle Evolution 12

Wie Sie mit Mastern arbeiten

Programme im Griff Was bringt Ihnen dieses Kapitel?

Bioinformatische Suche nach pre-mirnas

PTV VISWALK TIPPS UND TRICKS PTV VISWALK TIPPS UND TRICKS: VERWENDUNG DICHTEBASIERTER TEILROUTEN

Übungsblatt: Protein interaction networks. Ulf Leser and Samira Jaeger

Binäre Bäume. 1. Allgemeines. 2. Funktionsweise. 2.1 Eintragen

Technical Note Nr. 101

Plotten von Linien ( nach Jack Bresenham, 1962 )

6 Schulungsmodul: Probenahme im Betrieb

AGROPLUS Buchhaltung. Daten-Server und Sicherheitskopie. Version vom b

Studie über die Bewertung von Wissen in kleinen und mittleren Unternehmen in Schleswig-Holstein

Wie Sie beliebig viele PINs, die nur aus Ziffern bestehen dürfen, mit einem beliebigen Kennwort verschlüsseln: Schritt 1

Klausur zum Modul Molekularbiologie ILS, SS 2010 Freitag 6. August 10:00 Uhr

Lernaufgabe Industriekauffrau/Industriekaufmann Angebot und Auftrag: Arbeitsblatt I Auftragsbeschreibung

Dow Jones am im 1-min Chat

Pflegende Angehörige Online Ihre Plattform im Internet

WIR MACHEN SIE ZUM BEKANNTEN VERSENDER

Gezielt über Folien hinweg springen

Fehler und Probleme bei Auswahl und Installation eines Dokumentenmanagement Systems

Gefährlich hohe Blutzuckerwerte

Tangentengleichung. Wie lautet die Geradengleichung für die Tangente, y T =? Antwort:

Studieren- Erklärungen und Tipps

Herzlich Willkommen beim Webinar: Was verkaufen wir eigentlich?

Was ist Sozial-Raum-Orientierung?

Präsentation vom im Rahmen der Fachberatertagung der Unfallkasse NRW in Haltern.

Stellen Sie bitte den Cursor in die Spalte B2 und rufen die Funktion Sverweis auf. Es öffnet sich folgendes Dialogfenster

Um Ihre Ziele durchzusetzen! Um Beziehungen zu knüpfen und zu pflegen! Um in Begegnungen mit anderen Ihre Selbstachtung zu wahren!

Bundesverband Flachglas Großhandel Isolierglasherstellung Veredlung e.v. U g -Werte-Tabellen nach DIN EN 673. Flachglasbranche.

Repetitionsaufgaben Wurzelgleichungen

Lichtbrechung an Linsen

Verband der TÜV e. V. STUDIE ZUM IMAGE DER MPU

Manager. von Peter Pfeifer, Waltraud Pfeifer, Burkhard Münchhagen. Spielanleitung

Abituraufgabe zur Stochastik, Hessen 2009, Grundkurs (TR)

Online Schulung Anmerkungen zur Durchführung

9 Auto. Rund um das Auto. Welche Wörter zum Thema Auto kennst du? Welches Wort passt? Lies die Definitionen und ordne zu.

Deutliche Mehrheit der Bevölkerung für aktive Sterbehilfe

Statuten in leichter Sprache

Orderarten im Wertpapierhandel

Online Intelligence Solutions TESTABLAUF. 7 Schritte für ein erfolgreiches Testing.

Alle gehören dazu. Vorwort

DAS NEUE GESETZ ÜBER FACTORING ( Amtsblatt der RS, Nr.62/2013)

Grundideen der Gentechnik

Kapitalerhöhung - Verbuchung

Zahlenoptimierung Herr Clever spielt optimierte Zahlen

ratgeber Urlaub - Dein gutes Recht

Nicht über uns ohne uns

Anmerkungen zur Übergangsprüfung

1 Mathematische Grundlagen

Studienplatzbeschaffung

Info zum Zusammenhang von Auflösung und Genauigkeit

Konzentration auf das. Wesentliche.

Bericht über die Untersuchung zur Erblichkeit von Herzerkrankungen beim PON

Was sind Jahres- und Zielvereinbarungsgespräche?

infach Geld FBV Ihr Weg zum finanzellen Erfolg Florian Mock

DAS PARETO PRINZIP DER SCHLÜSSEL ZUM ERFOLG

15 Optimales Kodieren

Lieber SPAMRobin -Kunde!

Häufig wiederkehrende Fragen zur mündlichen Ergänzungsprüfung im Einzelnen:

Transkript:

VorhersagevonmiRNAtargetsinSäugetieren mirnatargetprediction ambeispielvontargetscan Christoph Theunert 8. Fachsemester Bioinformatik christoph.theunert@web.de

Gliederung I mirna Eigenschaften II mirna Funktionen III Algorithmus Vorinformationen IV Schritte V Ergebnisse VI Nachteile VII Beobachtungen VIII Neuerungen / Verbesserungen

mirna - Eigenschaften mirnas ~22nt lang, Pflanzen- und Tierzellen von Dicer (Proteinkomplex)aus dem hairpin einer endogenen RNA prozessiert mirnas liegen in der Zelle als RNP assoziiert mit Proteinen vor wichtige Genregulatorische Eigenschaften binden an mrnas Proteinkodierender

mirna Funktionen Markierung von Genen für posttranskriptionelle Repression ( keine Translation ) mirna targets sind sehr häufig in Genen für Transkriptionsfaktoren eingebettet Zellproliferation Zelltod, Fett Metabolismus in Fliegen Blatt - und Blütenentwicklung in Pflanzen ca. 0.5-1 % aller Gene in Menschen, Fliegen und Würmern sind scheinbar mirna Gene Annahme: wesentlich mehr regulatorische Funktionen, die noch nicht

mirna - Funktionen Vermutung, dass viele Säugetier mirnas wichtige Rollen bei der Entwicklung und anderen Prozessen spielen wird unterstützt durch ihre gewebsspezifischen und entwicklungsstufenspezifischen Expressionsmuster außerdem durch evolutionär konservierte Bereiche (oftmals in Säugetieren, und Invertebraten Homologen ) Aufgaben in RNAi specifity complex (RISC) für Vertebraten Funktionen bis dato nur teilweise erforscht aber Vermutungen besagen, daß sie einen großen Teil des Transkriptoms regulieren (Gesamtheit

mirna - Funktionen in Pflanzen wesentlich leichter mirna targets zu identifizieren, sie binden fast perfekt an ihre targets 'relativ simples' Suchen nach Komplementarität von mirna und mrna (signal noise ratio von z.t. 10:1) tierische mirnas binden weniger stark, z.t. mit einigen ungebundenen Nukleotiden somit ergeben sich dabei wesentlich kompliziertere sek. Strukturen es konnte gezeigt werden, daß bei Drosophila und c.elegans durch diese Methode nicht mehr targets identifiziert werden als durch puren Zufall gefunden werden

Algorithmus Vorinformationen Ziel Vorhersage von Zielgenen für konservierte mirnas in Wirbeltieren (Vertebraten) Prinzip Identifizierung der mrna, die eine konservierte Bindung mit "mirna seed" eingeht kombiniert thermod. basierte Modelle von RNA:RNA Duplexen mit vergleichenden Sequenzanalysen, um mirna targets vorherzusagen, die über mehrere Genome hinweg konserviert sind dabei scheint die Bindung der mrna an die Nt 2..8 der 5' mirna von hoher Bedeutung zu sein

Algorithmus Vorinformationen Input 1 mirna, in mehrern Organsimen konserviert Menge an orthologen1 3'UTR2 Sequenzen dieser Organismen Homologe3 gefunden mittels BLASTN und MiRscan 1 ortholog=gene in unterschiedlichen Spezies, die funktionell verwandt sind und von einem gemeinsamen Vorläufer abstammen 2 UTR =untranslated region (werden transkribiert, aber nicht translatiert, in ihnen sind wichtige Informationen für die OpenReadingFrames enthalten) 3 homologe Gene=Gene, die in der Sequenz ihrer Basenpaare eine hohe Übereinstimmung aufweisen und mutmaßlich aus einer Ursequenz (oder Ur-

Algorithmus Vorinformationen orthologe 3' UTR Sequenz der target mrna "seed matches"(wckomplementarität) "mirna seed" (5' konservierte Region, nt 2..8 )

Algorithmus - Schritte I Durchsuchen der 3'UTR Sequenzen der Organsimen nach Segmenten perfekter Watson Crick Basenkomplementarität zu den Basen 2-8 der 5' mirna

Algorithmus - Schritte II erweitern jedes seed matches mit zusätzlichen Basenpaaren zur mirna soweit wie möglich in jede Richtung erlaubt sind G:U Paare Abbruch bei Mismatches bzw. Gaps somit normalisiert man die Sequenzen

Algorithmus - Schritte III "RNAfold" liefert optimierte Basenpaarung für das 3' Ende der mirna zu den Basen der UTR, die direkt 5' jedes seed matches lokalisiert ist damit verlängert man jeden seed match zu einer längeren target Sequenz

Algorithmus - Schritte seed extension seed match Heptamer mrna mirna optimiertes Basepairing durch 'RNAfold'

Algorithmus - Schritte IV jedem mirna:target Duplex wird eine freie Energie G zugewiesen mittels 'RNAeval' (Hofacker, Stadler ) RNAeval berechnet die freie Energie eines RNA Moleküls mit gegebener Sekundärstruktur

Algorithmus - Schritte G V n Zi = e T jede UTR erhält einen Z Score K k =1 n =Anzahl der seed matches pro UTR Gk =freie Energie der mirna:target Interaktion [Kcal/mol] k =kte target site, die im vorigen Schritt bewertet wurde T = Gewichtungsfaktor, verbindet Z-Score und vorhergesagte freie Energie gewichtet Affinität der Basenpaarung Wert beeinflusst die relative Gewichtung der UTRs UTR's ohne seed match bekommen Z=1.0

Algorithmus - Schritte VI sortieren der UTRs eines Organismus nach Z Score und Zuweisung eines Ranges Ri Z und R dienen dann unter anderem dazu, daß eine Anzahl falsch Positiver targets optimal geschätzt werden kann

Algorithmus - Schritte VII wiederholt den beschriebenen Prozess für die Menge an UTRs in jedem Organismus

Algorithmus Schritte VIII wählt als targets diejenigen Gene aus, für die Zi Zc und Ri Rc Zc = vorausgewählter Maximalwert für Z score Rc = vorausgewählter Maximalwert für Rang Rc, Zc und T sind frei bestimmbar T und Z kommt keine thermodynamische Bedeutung zu sondern sie sind ein Mittel

Algorithmus - Ergebnisse Parameter Rc=200, Zc=4.5, T=20 Signal Noise - Anzahl der vorhergesagten targets pro mirna in veschiedenen Genomen - Signal sind von targetscan vorhergesagte mirna targets - noise sind Anzahl der targets, welche für shuffled mirnas vorhergesagt wurden( falsch positiv ) - zufällig vertauschte mirna Sequenzen, die sich nicht mehr als 15% von der ursprünglichen mirna unterscheiden - d.h. zur Kontrolle werden signal und noise miteinander verglichen - im Endeffekt : - 3.9 wahre targets pro mirna in Säugern - signal:noise ratio von 3.5 - je mehr Genome man in die Berechnungen integriert, umso besser wird die Signal : noise ratio - Wichtigkeit der evolutionären Konservierung bei diesem Ansatz -allerdings nimmt dabei auch die Anzahl der vorhergesagten targets pro mirna ab - z.b. kann es sein, daß orthologe Gene in den Annotationen fehlen, je mehr Genome in Betracht gezogen werden - oder einige mirna : mrna Interaktionen sind nicht

Algorithmus - Ergebnisse Signal wird verglichen mit Anzahl von targets die für Kohorten von randomisierten mirnas vorhergesagt wurden (Ermittlung der false positive) die mutierten mirna Kohorten wurden durch 'MiRshuffle' erzeugt es entsteht dabei für eine gegebene mirna eine Reihe von zuf. permutierten mirnas mit gleicher Länge und Basenkompositionen sie wird in Betracht gezogen, wenn bestimmte vorher festgelegte Kriterien erfüllt werden

Algorithmus - Ergebnisse Identifizierung von targets konserviert in Säugern (A) und in Säugern und Fischen (B) angegeben ist die Anzahl der Gene jedes Organsimus' mit identifizierten Orthologen in jedem anderen Organismus

Algorithmus - Ergebnisse Positionen zweier target sites für die mir-26a (blau) in orthologen SMAD-1 3' UTR Sequenzen von Menschen(Hs), Maus(Mm), Ratte(Rn), und Fugu(Fr, Kugelfisch) mit Z score und Rang jedes mirna:utr Paares

Algorithmus - Nachteile unvollständige Annotationen für orthologe UTRs reale Targets fallen durch Z score und Rang Kriterien Bindestellen außerhalb 3 UTR unbeachtet oft bei Pflanzen beobachtet nur konservierte Gene in Betracht gezogen gleichzeitige Interaktionen verschiedener mirnas an einer UTR ausgeschlossen Vermutung:

Beobachtungen 5' und 3' Ende der mirnas werden von targetscan unterschiedlich behandelt Forderung: perfekte BP am 5' seed, aber keine solche Forderung am 3' Ende die Wichtigkeit der 5' BP wurden in früheren Beobachtungen bestätigt (lin-14 mrna mit lin-4 mirna) 5' Enden von verwandten mirnas scheinen besser konserviert zu sein als die 3' Enden die höchsten signal:noise ratios wurden beobachtet wenn der seed die nt 2..8 abdeckt stützt die These der Wichtigkeit der 5' BP

Beobachtungen die Anzahl an vorhergesagten targets ist am größten bei hoch konservierten mirnas je stärker konserviert eine mirna ist, umso höher auch das targetscan signal

Beobachtungen B die größte Anzahl an predicted targets ist im Bereich der Nukleotide 2 8 des 5' Endes C -die mirna seeds im Bereich der der Nukleotide 1 7 bzw. 2 8 des 5' Endes sind am stärksten konserviert die Beobachtung der in vitro Paarung an Nt 2..8 scheint auch die Wichtigkeit für die in vivo targetprediction anzugeben

Neuerungen / Verbesserungen mit besser angepassten Genomen kann man die Notwendigkeit der score und rank Schwellwerte abschwächen und zt eliminieren außerdem konnte man die Größe des Matches mit der seed Region der mirna von 7 auf 6 nt reduzieren es konnte gezeigt werden, dass mit gut aufbereiteten Daten ein target nur mittels des 6 nt langen seed matches zur mirna in orthologen UTRs aller Testgenome

Neuerungen / Verbesserungen mrna "seed-matches" mirna "seed" -Alignment von orthologen Segmenten der HIC UTR -rot markiert sind konservierte, den "seed-match" flankierende Adenosine -da man heraus fand, daß oftmals der 3' Terminus des seed match ein Adenosin ist, bzw. mehrere A s, stellte man fest, daß eine nur 6 statt 7 lange nt Sequenz, gefolgt von diesem A, die target Spezifität erhöht -auch die Upstream ( zum 5' Ende hin ) Regionen des seed matches sind oftmals hoch konserviert - die Suche nach dieser 6 nt + A langen Sequenz erhöht die

Neuerungen / Verbesserungen es wird spekuliert, daß dieses A am 3' Ende der mrna vom Silencing Complex erkannt wird, was zu Interaktionen zwischen mirna und target führt fasst man diese neuen Erkenntnisse zusammen, kann man die s:n ratio auf 5.6:1 verbessern neue Erkenntnisse werden in "targetscans" angewendet ( Unterschied u.a. 6 nt seed Paarung) d.h. targetscans sagt targets vorher, die

Neuerungen / Verbesserungen seed - für jede Position, die den konservierten seed match(blau) flankiert, ist prozentual angegeben, in wie vielen seed matches der untersuchten Spezies diese Positionen auch konserviert sind match - schwarze Balken: Konservierung einer der 4 Möglichkeiten flankierende Regionen - roter Balken: Konservierung eines

Neuerungen / Verbesserungen - Sequenzidentität der direkt die seed matches flankierdenen Nukleotide -6nt langer seed match - m8 match - t9, t1 anchor - gemessen relative Entropie relativ zur Hintergrund

Neuerungen Verbesserungen man kann beobachten, dass mirna targets manchmal nicht über die 8nt lange center Sequenz des seed match hinaus konserviert sind daher stellte man eine weitere Bedingung auf: - seed matches müssen in kleine konservierte 'Inseln' fallen erhöht die signal : noise ratio

Neuerungen / Verbesserungen targetscan / targetscans beachten keine targets in denen wobbles oder mismatches auftreten wird geduldet, da erfahrungsgemäß somit die signal:noise ratio gegen 1:1 gehen würde

Neuerungen / Verbesserungen wendet man targetscans auf 5' UTR Sequenzen an, erhält man nur schwach mehr signal als noise insgesamt kann man davon ausgehen, dass mirna:target Interaktionen hauptsächlich in den 3'UTR Bereichen der mrna von Vertebraten vorkommen - biologische Prozess Klassifikation der Vertebraten mirna targets, vorhergesagt in der seed + t1a + m8 Analyse - gezeigt sind Kategorien, deren targets eine signal:noise ratio von

Quellen 1) Prediction of Mammalian MicroRNA Targets Benjamin P Lewis, I-hung Shih, Matthew W Jones-Rhoades, David P Bartel, Christopher B Burge1. Cell, Vol. 115 (7), December 26, 2003. 2) Conserved Seed Pairing, Often Flanked by Adenosines, Indicates that Thousands of Human Genes are MicroRNA Targets Benjamin P Lewis, Christopher B Burge, David P Bartel,2. Cell, Vol. 120 (1), January 14, 2005. Vortrag und Handout auf stinfwww.informatik.uni-leipzig.de/~mai03hfd