Informationsgehalt von DNA

Ähnliche Dokumente
Nachlese zu den Referaten

Eukaryotische messenger-rna

Genannotation bei Prokaryoten

MOL.504 Analyse von DNA- und Proteinsequenzen

DNA mrna Protein. Initiation Elongation Termination. RNA Prozessierung. Unterschiede Pro /Eukaryoten

Posttranskriptionale RNA-Prozessierung

Aminosäurenanalytik. Probenvorbereitung Eiweißfällung, Oxidation und Hydrolyse Karl-Heinz Jansen SYKAM CHROMATOGRAPHIE

DNA mrna Protein. Initiation Elongation Termination. RNA Prozessierung. Unterschiede Pro /Eukaryoten

mrna S/D UTR: untranslated region orf: open reading frame S/D: Shine-Dalgarno Sequenz

DNS-Modell Best.-Nr

Das zentrale Dogma der Molekularbiologie:

Datenspeicherung und Datenfluß in der Zelle - Grundlagen der Biochemie

Einleitung. Replikation

Proteinbiosynthese. Prof. Dr. Albert Duschl

...-Arg-Met-Phe-Ala-Asn-His-Lys-Ser-Val-Gly-...

Expressionskontrolle in Eukaryonten

Modul 8: Bioinformatik A. Von der DNA zum Protein Proteinsynthese in silicio

KV: Translation Michael Altmann

1. Skizzieren Sie schematisch ein Gen mit flankierender Region. Bezeichnen und beschriften Sie:

Local Structures (Examples)

Die DNA Replikation. Exakte Verdopplung des genetischen Materials. Musterstrang. Neuer Strang. Neuer Strang. Eltern-DNA-Doppelstrang.

1. Beschriften Sie in der Abbildung die verschiedenen Bereiche auf der DNA und beschreiben Sie ihre Funktion! nicht-codogener Strang.

8. Translation. Konzepte: Translation benötigt trnas und Ribosomen. Genetischer Code. Initiation - Elongation - Termination

Chemie für Biologen. Vorlesung im. WS 2004/05 V2, Mi 10-12, S04 T01 A02. Paul Rademacher Institut für Organische Chemie der Universität Duisburg-Essen

Der Träger aller genetischen Informationen ist die D N A - Desoxyribonucleic acid (Desoxyribonucleinsäure, DNS)

Thema: Eukaryotische Genregulation und RNA- Prozessierung. Spleißen, Capping, Polyadenylierung, RNA-Editieren Erwin R. Schmidt

IV. Übungsaufgaben für die Jahrgangstufe 9 & 10

Aufgabe 2: (Aminosäuren)

Vorlesung Biophysik I - Molekulare Biophysik Kalbitzer/Kremer/Ziegler

Vom Gen zum Protein. Zusammenfassung Kapitel 17. Die Verbindung zwischen Gen und Protein. Gene spezifizieren Proteine

RNA und Expression RNA

Molekularbiologische Grundlagen

Biologie I/B: Klassische und molekulare Genetik, molekulare Grundlagen der Entwicklung Theoretische Übungen SS 2014

Welche Themen werden behandelt?

DNA Replikation ist semikonservativ. Abb. aus Stryer (5th Ed.)

Gen Protein Aufgaben: Edel LK-Bio BI-3

Vorlesung Evolutionäre Algorithmen

Biochemie Tutorium 9. RNA, Transkription

Organisation und Evolution des Genoms

Biologie I/B: Klassische und molekulare Genetik, molekulare Grundlagen der Entwicklung Theoretische Übungen SS 2016

Eine neue RNA-Welt. Uralte RNA-Welt Am Anfang der Entstehung des Lebens. Bekannte RNA-Welt Protein-Synthese. Neue RNA-Welt Regulatorische RNA-Moleküle

Gene, Umwelt & Verhalten II: Molekulare Genetik

Grundlagen Genetik. Dipl.- Psych. Silja Bellingrath

Vorlesung Allgemeine und Molekulare Genetik Transkription und Genregulation Erwin R. Schmidt

Antwort: 2.Uracil. Antwort: 2. durch Wasserstoffverbindungen. Adenin, Cystein und Guanin kommen alle in der RNA und DNA vor.

Seminar Biomedical Informatics

Wiederholunng. Klassische Genetik

Center for Biotechnology, Bielefeld

Versuch von Beadle und Tatum Verändertes Gen -> veränderter Phänotyp

Molekulargenetik DNA-Struktur Nukleotide

Vorlesungsthemen Mikrobiologie

DATENQUALITÄT IN GENOMDATENBANKEN

Vorlesung Molekulare Humangenetik

Expression der genetischen Information Skript: Kapitel 5

Überblick von DNA zu Protein. Biochemie-Seminar WS 04/05

Von der DNA zum Eiweißmolekül Die Proteinbiosynthese. Ribosom

Transkription und Regulation der Genexpression

Transkription 3. Teil. Posttranskriptionale Modifikationen

5. Endoplasmatisches Reticulum und Golgi-Apparat

KV: Genexpression und Transkription Michael Altmann

Genetische Marker in der Entomologie

1. Nachschreibeklausur zur Vorlesung "Genetik" im WS 09/10 A. Matrikel-Nr.: Versuch: 1 2 3

Bio-Datenbanken. Einführung in die Bioinformatik

Aminosäuren. Seitenkette. -Kohlenstoffatom. Karboxilgruppe. Aminogruppe

Aminosäuren - Proteine

BIOWISSENSCHAFTEN. Die Biowissenschaften. Biochemie. Molekularbiologie. Mikrobiologie. Botanik, Zoologie. Genetik. Biotechnologie.

Peptide Proteine. 1. Aminosäuren. Alle optisch aktiven proteinogenen Aminosäuren gehören der L-Reihe an: 1.1 Struktur der Aminosäuren

Dr. Jens Kurreck. Otto-Hahn-Bau, Thielallee 63, Raum 029 Tel.:

Ausbildung zum Bienenwirtschaftsmeister Mai 2012 Christian Boigenzahn

Grundlagen der Molekulargenetik

Genexpression. Introns, T7-Typ DNA Polymerase, RNA Editing, Transsplicing

t-rna Ribosom (adapted from the handouts of Prof. Beck-Sickinger, Universität Leipzig)

Biochemie Tutorium 10. Genetischer Code, Translation & Regulation der Proteinbiosynthese

Informationsvisualisierung

Genstruktur der Eukaryoten

Algorithmische Bioinformatik

Aminosäurebestimmung im Kochschinken

AlgoBio WS 16/17 Protein-DNA Interaktionen ChiP-Seq Datenanalyse. Annalisa Marsico

Hämophilie Symposium, März , Reitter Sylvia

Vererbung. Die durch Fortpflanzung entstandene Nachkommenschaft gleicht den Elternorganismen weitgehend

Spleissen Dezember 2009 Elmar Schiebel, ZMBH

Musterlösung - Übung 5 Vorlesung Bio-Engineering Sommersemester 2008

Entwicklungs /gewebespezifische Genexpression. Coexpression funktional überlappender Gene

Klausur zum Modul Molekularbiologie ILS, SS 2010 Freitag 6. August 10:00 Uhr

15. Aminosäuren, Peptide und Proteine

3. Ergebnisse Ergebnisse. 3.1 MDR1-Polymorphismen

Modul Biologische Grundlagen Kapitel I.2 Grundbegriffe der Genetik

Aufbau und Funktion des Genoms: Von der Genstruktur zur Funktion

MM Biopolymere. Michael Meyer. Vorlesung XV

Mathematik und Naturwissenschaften, Biologie, Biochemie. Biochemie II - Tutorium

Mathematik und Naturwissenschaften, Biologie, Biochemie. Biochemie II - Tutorium

Translation. Auflesung- Proteinsynthese

Bei der Translation wird die Aminosäuresequenz eines Polypeptids durch die Sequenz der Nukleotide in einem mrna- Molekül festgelegt

Bioinformatik. Lokale Alignierung Gapkosten. Silke Trißl / Ulf Leser Wissensmanagement in der. Bioinformatik

Genexpressionsregulation

Transkript:

Informationsgehalt von DNA

Welche Themen werden behandelt? Gene Code, Genorganisation Signale in DNA Detektion von Genen Genome Genomorganisation Nukleotidmuster Junk DNA 2

DNA als Informationsträger 3 3

DNA Bausteine Desoxyribose Phosphate Base 4

DNA Konformationen Neben der Normalform (B) gibt es noch weitere Konformationen A B Z A und Z Formen könnten möglicherweise regulatorische Funktionen besitzen 5

DNA-Spielereien Mische M13 mit den richtigen Oligos! (aus Nature 440, 297-302, 2006) 6

DNA ist das genetische Material 1920-er Jahre harmlose Bakterien tote infektiöse Bakterien lebende infektiöse Bakterien 1944 (Avery/MacLeod/McCarthy): + harmlose Bakterien + tote infektiöse Bakterien + DNAse harmlose Bakterien harmlose Bakterien tote infektiöse Bakterien + Proteinase lebende infektiöse Bakterien + 7

DNA als Informationsquelle Information liegt in linearer Form vor Information ist veschlüsselt Information muss übersetzt werden Information kann kopiert werden Information kann verändert werden 8

Codierung Vier Merkmale Triplett-Code kommafrei degeneriert (wobble code) universell 9

Wobble Code Redundanz auf DNA-Ebene Gly Phe Leu Glu CAG UC A Ser Asp AG U G U C C A U G Tyr Ala G U A A G U C C C A Stop U G G C A U Cys Val A C C U G U G A Stop U G Trp G U Arg A G U C C A A C A Leu Ser U C G G U A Lys C A C C U G A U G Pro Asn G U A C AC UG G AC G ACU His Thr U Gln Met Ile Arg 1 Startcodon 3 Stopcodons Bis zu 6 Codons/Aminosäure Bakterien: nicht alle Anticodons sind im Genom vertreten 10

Zusätzliche Aminosäuren Redundanz auf Protein-Ebene UGA kann für Selenocystein kodieren anstatt S trna UCA - Serin nur in 20 % (Bacteria) und 14 % (Archaea) aller vollständig bekannten Genome Selenocystein trnasynthase Selenocystein zum Ribosom über selb translation elongation factor UAG kann für Pyrrolysin kodieren von Lysin abgeleitet, benutzt im Methan Metabolismus (Archaea) 11

Strukturelle Voraussetzungen Zusätzliche Erkennungsmerkmale sind nötig! From: EMBO Reports 5 (5):538-543 (2004) SECIS Elemente direkt am Stop Codon (Bacteria) oder in der 3' untranslatierten Region (Eukarya und Archaea) 12

Gen - Definition Ein Gen ist: Eine lokalisierbare Region einer genomischen Sequenz, die einer vererbbaren Einheit entspricht. Es besteht aus mehreren Teilen: regulatorische Regionen transkribierte Regionen Protein-codierende Gene sind eine Untergruppe! 13

Was ist ein Protein-codierendes Gen? Die transkribierte Region besteht aus: codierender Leserahmen vom Start zum Stop-Codon 5' untranslatierte Region (5' UTR) von Transkriptionsstart bis ATG 3' untranslatierte Region (3' UTR) vom Stop zum Terminations/polyA Signal Introns vom Donor zum Akzeptor Beachte: Trans-Splicing führt dazu, dass verschiedene, weit von einander entfernte Regionen ein Gen bilden können! 14

Organisation von Protein-kodierenden Genen Prokaryonten Genlokus Promotor ATG TAA TAG TGA Terminator mrna Protein Eukaryonten Promotor ATG TAA TAG TGA polya-signal Genlokus hnrna mrna Protein = Intron 15

Signale in DNA 16

Die Sinnsuche in DNA Signal-Detektion Probleme: schwache Signale konservierte Motive sind sehr kurz (z.b. Splice-Donoren und Akzeptoren) Konservierung ist nicht zu 100 % gegeben spezies-spezifische Signale Strukturkomponenten der Signale sind schwer zu berechnen 17

Gen- Signale in DNA CpG Inseln Methylierungsmuster Promotoren Transkriptionsstart Introns Polyadenylierungssignal Terminationssignal Polymerasebindungsstelle Kofaktorbindestelle Enhancer Silencer Donoren Akzeptoren Branch point Splice Ênhancers/Silencers 18

Unterschied Sequenz Signal - Motiv Sequenz Eine eindeutige Anzahl von Basen. Position und Reihenfolge stehen fest. Signal Z.B. positionsabhängige Häufigkeitsverteilungen von Basen, wenn mehrere Sequenzen betrachtet werden. Motiv (kann auch aus mehreren Signalen bestehen ) Regional begrenzte Basenabfolge unbestimmter Länge, aber mit erkennbarem Muster. 19

Wie können Signale beschrieben werden? Das Motiv: ATN 1-3 G 2 CGTN x TGA 4,5 kann in viele mögliche Sequenzen übersetzt werden: ATGGGCGTAGAGGAGACTTTATGAAAAA ATCGGCGTTGAAAA ATAAGGCGTGAGTGAAAAA etc. = stabile Motivanteile 20

IUPAC Beschreibung von Signalen a c g t m r w s y k v h d b n a; adenine c; cytosine g; guanine t; thymine in DNA; uracil in RNA a or c a or g a or t c or g c or t g or t a or c or g; not t a or c or t; not g a or g or t; not c c or g or t; not a a or c or g or t IUPAC=International Union of Pure and Applied Chemistry 21

Beispiel eines Motivs in IUPAC Code Beispielmotiv mit IUPAC wobble NNGTAWBTSRWM AA CC GG C AG CAAA TTGTATTTGGTC 22

Detektion eines Motivs NNGTAWBTSRWM 23

Positional Weight Matrix Berechnung Erstellung einer position frequency matrix PFM Normalisierung ergibt Wahrscheinlichkeiten für eine Base an einer Position normalisierte PFM Berechnung der Wahrscheinlichkeit einer Sequenz, ein Profil widerzuspiegeln Das Produkt der Wahrscheinlichkeit jeder Base an der entsprechenden Position Für die Computeranalyse: Umrechnung in Log Werte mit Korrekturfaktor (Korrekturfaktor sehr unterschiedlich, z.b. Quadratwurzel der Anzahl an Positionen) +Korrektur für die Nukleotidfrequenzen =PWM Score values : Summierung aller PWM Werte über die Länge des Profils 24

Positional Weight Matrix (PWM) # scale = ln (frequency) # frequency counts are based on N(seq) = 21 # A C G T 1.50 1.25 2.25 1.50 1.70 0.92 2.01 1.87 2.01 0.92 1.50 2.01-0.69-0.69-0.69 2.80 2.35-0.69 1.87-0.69 0.41 0.41 2.67-0.69-0.69 2.44-0.69 1.70 0.41 0.41 1.50 2.35 0.41 2.25 0.41 1.70 2.80-0.69-0.69-0.69 0.41-0.69 2.67 0.41 0.92 0.41-0.69 2.60 0.41 2.01-0.69 2.14-0.69-0.69 2.80-0.69-0.69-0.69 2.80-0.69 0.92 0.92-0.69 2.53 2.53 0.92 0.41 1.70 1.87 0.92 2.25 1.25 2.35 0.92 1.25 1.70 Je kleiner die Differenz bei den Werten desto kleiner der Informationsgehalt Je größer die Differenz bei den Werten desto größer der Informationsgehalt Hergestellt aus einem Alignment von 21 Sequenzcen des A-Box Motivs in D. discoideum 25

PWM Graphics A-Box Motif from trnas in D. discoideum 26

Wie suche ich Sequenz-Motive?...CACGGTAAATTATTTA... Bewertungsmaßstab ist die Häufigkeit eines Nukleotides an einer bestimmten Stelle 28

Sliding Windows Sequenz Fenster window size step 55 58 59 54 56 Ergebnis (GC%) 29

Signale in DNA: Introns 30

Introns Selbstsplicende Introns in Prokaryonten bzw. Organellen Zwei verschiedene Klassen in Eukaryonten kurze Introns lange Introns ~50 bis ~500 bp in allen Eukaryonten vorhanden (Ausnahmen: sehr kompakte Genome) durchschnittlich ~100 bp, klare' Signale bis zu mehrere 100 kb nicht in Eukaryonten mit kleinen Genomen Es besteht eine direkte Korrelation von Intron-Größe mit Genomgröße! 31

Intronarten 32

Introns II Zwei verschiedene Spliceosomvarianten in Eukaryonten U2 - abhängig die meisten Introns viele kurze Introns short intron peak U12 - abhängig nur wenige Introns gleichmäßige Längenverteilung 100 Basen Verschiedene Spliceosomen (Benennung nach dem small nuclear Ribonucleoprotein, snrnp) U5 ist die einzige gemeinsame snrna, aber es gibt einige gemeinsame Proteinfaktoren 33

Splicingmechanismus 34

Splicing-Maschinerie Rekrutierung der Splicefaktoren Namen der Komplexe mit Protein 35

Splice Signale Donor Branch Point Acceptor Minimalsignal Exon Exon GT AG A konserviert CAG Pyrimidine C G A schwach konserviert TNCTNAN A Consensus CAGGT TNCTNAN Pyrimidine CAGG A U12 A splice sites GATATCCT Pyrimidine CAGG G TCCTTAAC A 36

Intronlogo U12 donor branch point 37

Gewichtetes Splice Motif in D. discoideum 177 bases 38

Splice-Motive in A/T reichen Organismen 39

Erkennung fehlerhafter Transkripte Nonsense mediated mrna decay (NMD) Splicing Anlagerung von Exon junction complexes (EJC) ~24 Basen 5 von Exon-Exon Grenzen Translation Falls Stopcodon vor 1 oder mehreren EJCs Anlagerung von UPF1-3 Aktivierung von NMD und Abbau von mrna hnrna mrna 40

Splice Signale Donor Branch Point Acceptor Minimalsignal Exon Exon GT AG A konserviert CAG Pyrimidine C G A schwach konserviert TNCTNAN A Consensus CAGGT TNCTNAN Pyrimidine CAGG A U12 A splice sites GATATCCT Pyrimidine CAGG G TCCTTAAC A 41

Alternatives Splicing Cartegni et al. Nat Rev Genet 3, 285 42

Zusammenfassung I DNA als genetisches Material Verschlüsselung Genorganisation Gensignale, Detektion Introns Splicing 43

Fragen zum ersten Teil Was ist der IUPAC Code der DNA, welche Vor- und Nachteile besitzt er? Woraus wird eine Positional Weight Matrix (PWM) abgeleitet? Wie kann eine Sequenz auf Anwesenheit eines Motivs/Signals untersucht werden? Was sind die Mindestanforderungen für eine Splicestelle? Wie erfolgt Splicing? Welche Intronarten gibt es? 44

END 45