Kapitel 1: Einführung und biologische Grundlagen

Ähnliche Dokumente
Aufgabe 2: (Aminosäuren)

Modul 8: Bioinformatik A. Von der DNA zum Protein Proteinsynthese in silicio

Aminosäuren - Proteine

MOL.504 Analyse von DNA- und Proteinsequenzen

Foliensatz; Arbeitsblatt; Internet. Je nach chemischem Wissen können die Proteine noch detaillierter besprochen werden.

DNS-Modell Best.-Nr

Aliphatische Aminosäuren. Aromatische Aminosäuren

Das zentrale Dogma der Molekularbiologie:

Nanotechnologie der Biomoleküle. Aminosäuren und Proteine: Bausteine der Biologie und der Bionanotechnologie. Aufbau Struktur Funktion

Antwort: 2.Uracil. Antwort: 2. durch Wasserstoffverbindungen. Adenin, Cystein und Guanin kommen alle in der RNA und DNA vor.

Aminosäurenanalytik. Probenvorbereitung Eiweißfällung, Oxidation und Hydrolyse Karl-Heinz Jansen SYKAM CHROMATOGRAPHIE

IV. Übungsaufgaben für die Jahrgangstufe 9 & 10

1. Beschriften Sie in der Abbildung die verschiedenen Bereiche auf der DNA und beschreiben Sie ihre Funktion! nicht-codogener Strang.

Bioinformatik auch ein Thema für Informationsfachleute?

Chemie für Biologen. Vorlesung im. WS 2004/05 V2, Mi 10-12, S04 T01 A02. Paul Rademacher Institut für Organische Chemie der Universität Duisburg-Essen

8. Aminosäuren - (Proteine) Eiweiß

Aufbau, Struktur, Funktion von DNA, RNA und Proteinen

Expression der genetischen Information Skript: Kapitel 5

05_10_Genes_info.jpg

Naturstoffe. Theoretische Grundlagen und Einführung in das Naturstoffisolationspräparat in den Laborübungen Organische Chemie.

2. Prinzipien der Pflanzenstärkung durch Blattanwendung von L Aminosäuren

Genetik - The Human Genome Project. Überblick über die Genetik. Die gesamte Erbinformation eines Menschen befindet sich in jedem Zellkern

ORGANISCHE CHEMIE. Aminosäuren und Proteine

Molekulargenetik DNA-Struktur Nukleotide

Die DNA Replikation. Exakte Verdopplung des genetischen Materials. Musterstrang. Neuer Strang. Neuer Strang. Eltern-DNA-Doppelstrang.

Grundlagen der Molekulargenetik

Von der DNA zum Eiweißmolekül Die Proteinbiosynthese. Ribosom

Überblick von DNA zu Protein. Biochemie-Seminar WS 04/05

Expressionskontrolle in Eukaryonten

Einführung in die Bioinformatik

8. Translation. Konzepte: Translation benötigt trnas und Ribosomen. Genetischer Code. Initiation - Elongation - Termination

Biochemie Tutorium 9. RNA, Transkription

Aminosäuren nennt man die Carbonsäuren, in denen ein oder mehrere Wasserstoffatome des Alkylrests durch eine Aminogruppe ersetzt sind.

Inhaltsverzeichnis. Das Warnecke-Konzept Mein Weg zum Ziel Ausgeglichene Energiezufuhr Sport als Ergänzung

Regulation der Genexpression: regulierbare Promotoren, Proteine und sirna

Klausur zum Modul Molekularbiologie ILS, SS 2010 Freitag 6. August 10:00 Uhr

Einführung Nukleinsäuren

Biochemische Methoden. Teil 2: Reinigung und Analyse von Proteinen

Datenspeicherung und Datenfluß in der Zelle - Grundlagen der Biochemie

Exkurs 4: Oligonucleotide als Antisense Wirkstoffe

DNA Replikation ist semikonservativ. Abb. aus Stryer (5th Ed.)

Lösungsblatt zu Aufbau von Aminosäuren

Algorithmen auf Sequenzen

Biologie I/B: Klassische und molekulare Genetik, molekulare Grundlagen der Entwicklung Theoretische Übungen SS 2014

DATENQUALITÄT IN GENOMDATENBANKEN

Aufbau und Funktion des Genoms: Von der Genstruktur zur Funktion

Referat : Aufbau v. Proteinen u. ihre Raumstruktur

Bioinformatik Statistik und Analyse mit R

4. Genetische Mechanismen bei Bakterien

DIE BEDEUTUNG DER AMINOSÄUREN IM SPITZENSPORT

COOH. Die Aminosäuren tragen laborübliche Abkürzungen, so stehen z. B. Gly für Glycin oder Phe für Phenylalanin.

Resistenz gegen HIV (Computer- und Internet-basierte Aufgabe)

Dr. Jens Kurreck. Otto-Hahn-Bau, Thielallee 63, Raum 029 Tel.:

Q1 B1 KW 49. Genregulation

6. DNA -Bakteriengenetik

7.1 Einleitung Proteine Der chemische Aufbau der Proteine Peptide Aminosäuren... 5

Chemische Evolution. Biologie-GLF von Christian Neukirchen Februar 2007

Eine neue RNA-Welt. Uralte RNA-Welt Am Anfang der Entstehung des Lebens. Bekannte RNA-Welt Protein-Synthese. Neue RNA-Welt Regulatorische RNA-Moleküle

Klausur zur Vorlesung Biochemie III im WS 2000/01

Evolution & Genetik (Beispiel Hämoglobin) Prof. Dr. Antje Krause FH Bingen / akrause@fh-bingen.de

Fortbildungskurs Klinische Diabetologie der DDG 8. Oktober2012 Insulin: Biosynthese und Sekretion

Die molekularbiologische Untersuchung von Morbus Wilson Durchmusterung des ATP7B Gens auf Mutationen

Anabole Prozesse in der Zelle

Rekonstruktion biologischer Netzwerke (mit probabilistischen Methoden) Einführung

Aus der Reihe Daniels Genetik-Kompendium

Europäisches Patentamt European Patent Office Veröffentlichungsnummer: Office europeen des brevets EUROPAISCHE PATENTANMELDUNG

Grundlagen Genetik. Dipl.- Psych. Silja Bellingrath

Spleissen Dezember 2009 Elmar Schiebel, ZMBH

Pure Whey Protein Natural

Klonierung von S2P Rolle der M19-Zellen. POL-Seminar der Biochemie II Sebastian Gabriel

Wiederholunng. Klassische Genetik

Bio-Datenbanken. Einführung in die Bioinformatik

Kompression von DNA Sequenzen. Diplomarbeit

Proteinbiosynthese. Prof. Dr. Albert Duschl

Aminosäurebestimmung im Kochschinken

Frage 1 A: Wieviele Codone des "Universellen genetisches Codes" kodieren:

Arten der Intronen. Spliceosome Struktur des snrnp U1. Spliceosome. Vorlesung 3: Evolution des eukaryotischen Genoms 4/20/11

Was ist ein genetischer Fingerabdruck?

Transcriptomics: Analysis of Microarrays

Grundideen der Gentechnik

PATENTANMELDUNG. int.ci.6:c12n 9/86, C12N 15/55, C12N 1/21, C12N 1/19, C12P 21/02, C12P 13/04

Applied Bioinformatics.

1. Struktur biologisch relevanter Moleküle

Konzeption und Realisierung eines Algorithmus für die de novo-proteinidentifikation. Wolfgang Paul. Algorithm Engineering Report TR Juli 2006

Metabolisierung des Aminosäure-Kohlestoffgerüstes

H.Schwab Genetik. Überblick

TECHNISCHE HERSTELLUNG VON AMINOSÄUREN

Übung 11 Genregulation bei Prokaryoten

SPEKTROSKOPISCHE STRUKTURANALYTIK SYNTHETISCHER POLYPEPTIDE

Die Suche nach Genen in Bakteriengenomen. BWInf-Workshop März Prof. Dr. Sven Rahmann AG Bioinformatik Informatik XI, TU Dortmund

RNA und Expression RNA

Übungsblatt: Protein interaction networks. Ulf Leser and Samira Jaeger

Bioinformatik I (Einführung)

Autotrophe und heterotrophe Organismen

Unterschiede zwischen Prokaryoten und. Eukaryont. Unterschiede prokaryotische eukaryotische Zelle. Zellaufbau Prokaryoten. Zellaufbau Eukaryoten

DNA, RNA und der Fluss der genetischen Information

Bioinformatik: Hype oder Hoffnung?

Quantifizierung von Proteinen mittels Aminosäureanalytik

Einführung in die Biochemie, Aminosäuren. Prof. Dr. Albert Duschl

Kapitel 8 Ò Chromosomen und Genregulation

Transkript:

Kapitel 1: Einführung und biologische Grundlagen Ziele der Vorlesung n Grundverständnis wichtiger Verfahren zur Datengewinnung Sequenzierung, Microarrayanalyse,... Literatur und verwendete Materialien Literatur Autoren Titel Verlag Jahr St. I. Letovsky Bioinformatics - Database and Systems Kluwer 2001 Z. Lacroix, T. Critchlow Bioinformatics: Managing Scientific Data Morgan Kaufmann 2003 David W. Mount Bioinformatics: Sequence and Genome Analysis Cold Spring Harbor Labatory Press Pavel A. Pevzner Computational Molecular Biology: An Algorithmic Approach MIT Press 2000 2001 n Klassifizierung von Bio-Datenbanken, Kenntnis typischer Bio-Datenbanken Mapping-, Sequenz-, Protein-, Stoffwechsel-, Publikations-Datenbanken Semantik und Qualität der Daten, Modelle, Zugriffsmethoden, Verwendung n Kenntnis wichtiger Datenbank-Technologien und ihrer Anwendung auf Bio-Datenbanken Datenmodellierung, Datenbankintegration in der Bioinformatik Datenretrieval, Datenverarbeitung, Data Mining Michael S. Waterman Autoren Prof. Ulf Leser (HU Berlin) Prof. Johann Chr. Freytag (HU Berlin) Introduction to Computational Biology: Maps, Sequences and Genomes Verwendete Vorlesungsmaterialien u.a. Titel / Webadresse Molekularbiologische Datenbanken (http://www.informatik.hu-berlin.de/wbi/teaching/sose03/mdb/index.html) CRC Press 1995 Bioinformatik (http://www.dbis.informatik.hu-berlin.de/%7edbis/lehre/ws0203/bioinformatik/index.html) (C) Prof. R. Müller, Prof. E. Rahm 1-1 (C) Prof. R. Müller, Prof. E. Rahm 1-2 Zellaufbau (Eukaryonten) Genom n Prokaryonten (z.b. Bakterien): Kein Zellkern ATGC TACG G T C A (C) Prof. R. Müller, Prof. E. Rahm 1-3 (C) Prof. R. Müller, Prof. E. Rahm 1-4

n 46 menschliche Chromosomen n Zusammen circa 3 Milliarden Basenpaare Genom: Chromosomen Genom: Nukleinsäuren (DNA, RNA) n DNA (DNS): Desoxyribonucleinacid (... säure) n RNA (RNS): Ribonucleinacid (... säure) n Endgültige Strukturaufschlüsselung der DNA durch Watson & Crick 1953 (nach Vorarbeiten von Chargaff und Wilkins & Franklin), 1962 Nobelpreis n Feste Basenpaare: DNA: A-T, G-C RNA: A-U (U= Uracil), G-C n Universaler Codierungs-Mechanismus in allen Spezies A T C G U Nucleobasen (Purine, Pyrimidine) Zucker (Desoxyribose) Phosphat Zucker (Ribose) (C) Prof. R. Müller, Prof. E. Rahm 1-5 (C) Prof. R. Müller, Prof. E. Rahm 1-6 Gen n Gene sind die Funktionseinheiten in der DNA n Gen: Ein Abschnitt der DNA, der für ein Protein kodiert ca. 2.000-100.000 Basenpaare lang ca. 50.000 Gene im humanen Genom nur ca. 28% des Genoms beinhalten Gene (also sogenannte Coding Sequence(s) - CDS) n Sequenzierung: Bestimmung der Reihenfolge der Basen in den Doppelsträngen der DNA-Moleküle n Wegen Basenkomplementarität genügt es einen der beiden komplementären Stränge (Texte) zu bestimmen n 2 Sequenzierungsprojekte Human Genom Projekt (HGP, Hugo; öffentlich gefördert; multinational), Abschluss 2003 (www.genome.gov) Celera Genomics (kommerziell), http:// www.celera.com Genom: Sequenzierung AACCTTACTACTGGGGTTTTATGCATGCATGCCCCGGGA TTGGAATGATGACCCCAAAATACGTACGTACGGGGCCCT HGP: Beteiligte Staaten (C) Prof. R. Müller, Prof. E. Rahm 1-7 (C) Prof. R. Müller, Prof. E. Rahm 1-8

Nutzen und Problematik der Genomsequenzierung n Verbesserung der Krankheits-Diagnostik n Frühere Erkennung von Prädispositionen für Krankheiten n Medikamenten-Design n Gentherapie Sequenzierungsverfahren DNA Zielmolekül (1) Kopieren (2) Zerkleinern (3) Auswählen n Organersatz (Eignung des Spenders, in vitro Herstellung) n Ethische und rechtliche Problematik Gentests zur Krankheitsdiagnose, z.b.: Soll/darf ein Gentest durchgeführt werden, wenn noch keine Therapie verfügbar ist? Wer hat Zugang zu den Testergebnissen? Wie verlässlich sind die Gentests? Kommerzialisierung: Darf ein Gen patentiert werden? (Derzeitige Rechtslage: Nein). Wer hat Zugang zu den Datenbanken? (4) Sequenzieren (5) Assemblieren AACCTTACTACTGGGGTTTTATGCATGCATGCCCCGGGA TTGGAATGATGACCCCAAAATACGTACGTACGGGGCCCT C e le r a h a tte 3 0 0 A B I 3 7 0 0 D N A S e q u e n z i e r e r i m E i n s a t z (C) Prof. R. Müller, Prof. E. Rahm 1-9 (C) Prof. R. Müller, Prof. E. Rahm 1-10 n Kartierungsproblematik Sequenzfragestellungen Auf welchem Chromosom befindet sich welches Gen (welche Sequenz) an welcher Stelle n Codierung Welche Teilsequenzen codieren (d.h. sind CDS), welche nicht? n Datenbanksuche nach ähnlichen Sequenzen (Texten) (z.b. für Verwandschaftsbeziehungen) Gegeben ein Pattern P und eine Menge von Texten (Sequenzen) T = {t 1, t 2,..., t s }: Suche alle Sequenzen t i, die P lokal oder global ähneln Gegeben ein Pattern P und ein großer Text T: Suche alle Teilsequenzen von T, die dem Pattern P oder Teilsequenzen des Pattern ähneln n Berechnung von Sequenzalignments n Sequenz-Assemblierungs-Problem (Sequence Assembly Problem): Gegeben die Überlappungsinformationen und Alignments von Fragmenten einer "unbekannten" Sequenz. Man bestimme die Reihenfolge der Buchstaben (Basen) der "unbekannten" Sequenz Editierdistanz in der Bioinformatik * n Bestimmung eines Alignments zweier Sequenzen s1 und s2: Übereinanderstellen von s1 und s2 und durch Einfügen von Gap-Zeichen Sequenzen auf dieselbe Länge bringen: Jedes Zeichenpaar repräsentiert zugehörige Editier-Operation Kosten des Alignment: Summe der Kosten der Editier-Operationen optimales Alignment: Alignment mit minimalen Kosten (= Editierdistanz) Komplexität: O (n*m) mit n, m Länge der beiden Sequenzen n Details zu Alignments in Kap 4. der Vorlesung Algorithmen und Datenstrukturen 2 (Prof. Rahm) http://dbs.uni-leipzig.de/de/lehre/db-lernmaterial-vorl.html * www.techfak.uni-bielefeld.de/bcd/curric/prwali/node2.html (C) Prof. R. Müller, Prof. E. Rahm 1-11 (C) Prof. R. Müller, Prof. E. Rahm 1-12

Alignment: Beispiel Genome verschiedener Spezies Anzahl der Gene ~ 6.000 ~ 25.000 ~ 20.000 > 95% ~ 25.000 ~ 50.000 ~ 50.000 > 80% (C) Prof. R. Müller, Prof. E. Rahm 1-13 (C) Prof. R. Müller, Prof. E. Rahm 1-14 Transkription und Translation n Gene kodieren die Baupläne für den Aufbau der Proteine, die wiederum (als Enzyme) alle weiteren biomolekularen Vorgänge steuern Gen Transkription Translation Bei der Translation wird die in der mrnagespeicherte Information übersetzt und der entsprechende Baustein (Protein) synthetisiert. Bei der mrna-reifung und Splicing werden die Introns aus der mrnaherausgeschnitten. Bei der Transkription wird eine mrna-kopie (messenger RNA) des Gens erstellt. Transkriptionsfaktoren Tyr Ala Arg Tyr Val Arg Thr Translation in Protein UACGCACGUUACGUGCGUACU mrna-reifung plus Splicing UACGCACGUUA...CGUGCGUACU Transkription mrna-molekül Splicing n Splicing: Entfernen (Spleißen) von Stücken, die keine Erbinformation tragen (Introns), aus der Boten-RNS (mrns) n Zusammensetzung der codierenden Teile (Exons) zu sogenannter reifer Boten-RNS (mature messenger RNA) ATGCGTGCAAT...GCACGCATGA TGACGCA CACGTG GGGCGG CCAAT TATA ATG Exon Intron Exon TGA Promoter nur ca. 28% des Genoms werden transkribiert nur ca. 2% der DNA kodiert für Proteine (C) Prof. R. Müller, Prof. E. Rahm 1-15 (C) Prof. R. Müller, Prof. E. Rahm 1-16

Genetischer Code Alanin Arginin Asparagin Asparaginsäure Cystein Glutamin Glutaminsäure Glycin Histidin Isoleucin Leucin Lysin Methionin Phenylalanin Prolin Serin Threonin Tryptophan Tyrosin Valin ala arg asn asp cys gln glu gly his ile leu lys met phe pro ser thr trp tyr val Genexpression n Zielsetzung: Messen der "Expressionsniveaus" aller Gene einer bestimmten Zelle zu einem bestimmten Zeitpunkt n Microarray- Verfahren Unterschiedliche Expressionsniveaus erzeugen unterschiedliche Farbniveaus Einsatz von Methoden der Bildverarbeitung Gesundes Gewebe Krankes Gewebe n Dazu mehr in Kapitel 5 (Ge- Differenz in nexpressions- Expression? Datenbanken) (C) Prof. R. Müller, Prof. E. Rahm 1-17 (C) Prof. R. Müller, Prof. E. Rahm 1-18 Proteine Proteine (2) n Zentrale Elemente des Stoffwechsels (als Enzyme) n Besitzen Primär-, Sekundär-, Tertiär- und ggf. Quartärstrukturen n Primärstruktur Aminosäuresequenz (lineare Abfolge) Sequenzierung eines Proteins am Stück schwierig (bereits Länge von 20 Aminosäuren nicht-trivial), daher oft Sequenzierung des zugehörigen Gens n Sekundärstruktur 2-dim. Anordnung in der Ebene Typen: α-helix (Hohlstruktur, Pauling & Corey 1951, am häufigsten), β-helix (Faltblatt, Pauling & Corey 1951), Kollagenhelix, random coil (coil = Windung, ohne erkennbares 2-dim. Muster) Oft lagern sich zwei oder drei Sekundärstrukturelemente zu sogenannten Motifs zusammen, z.b. zu coiled coils aus zwei verdrillten α-helices (spielen wichtige Rolle in Faser-Proteinen) α-helix β-helix (C) Prof. R. Müller, Prof. E. Rahm 1-19 (C) Prof. R. Müller, Prof. E. Rahm 1-20

Proteine (3) Proteine (4) n Tertiärstruktur dreidimensionale Raumstruktur eines Proteins Determiniert Fuktion eines Proteins Beispiel: Struktur von Interleukin-4, einem Protein mit immunregulierenden Aufgaben: 4 α-helices (rot), zwei sehr kurze, einsträngige ß- Faltblätter (blau) und verbindende loops in random coil Struktur (gelb) Wichtiges Ziel der Biologie: Vorhersage der Funktion aufgrund der Primärstruktur ( Protein-Design) Interleukin-4 n Quartärstruktur entsteht durch Assoziation mehrerer separater Proteine, die durch nicht-kovalente Wechselwirkungen zusammengehalten werden Nicht alle Proteine besitzen Quartärstruktur Im Bild: Das photosynthetische Reaktionszentrum von Rhodopseudomonas viridis, ein grosser Komplex aus mehreren Proteinen (Nobelpreis für Chemie für die Aufklärung dieser Struktur; 1988 Michel, Deisenhofer & Huber) (C) Prof. R. Müller, Prof. E. Rahm 1-21 (C) Prof. R. Müller, Prof. E. Rahm 1-22 Prione n Proteine, die die Struktur von anderen Proteinen verändern können n Ursache von BSE, Creutzfeldt-Jakoba Krankheit... n Prion-Hypothese 2 Prion-Formen: Das normale unschädliche Prion-Protein (PrP c, α- Helix, a) kann zur pathogenen Isoform c d b (PrP Sc, β-helix, b) umgewandelt werden. Diese Konversion schreitet in Form einer Kettenreaktion (c) fort. Dabei bilden sich lange filamentäre Aggregate (d), die schrittweise neuronales Gewebe zerstören n Entdeckung der Prione führte zu Dogmenrelativierung Ende der neunziger Jahre, denn: Gewisse Proteine (eben die Prione) können sowohl Helix als auch Faltblattstruktur annehmen ( nicht alle Proteine sind durch Basensequenz determiniert) Proteine allein (als Prione) können schon Krankheiten übertragen (ohne Viren, Bakterien etc.) Stoffwechsel n Gesamtheit aller für einen Organismus notwendigen biochemischen Umwandlungsprozesse n Hauptsteuerung durch als Enzyme (Katalysatoren) agierende Proteine n Pathway: Folge von biochemischen Reaktionen (meist einer oder mehreren Funktion(en) im Organismus zugeordnet) n Grobeinteilung der Pathways in Stoffwechselwege (metabolic pathways) Regulatorische Pfade (regulatory pathways) (C) Prof. R. Müller, Prof. E. Rahm 1-23 (C) Prof. R. Müller, Prof. E. Rahm 1-24

Stoffwechsel: Metabolic Pathways n Metabolismus: Gesamtheit aller lebensnotwendigen biochemischen Vorgänge beim Aufbau, Abbau und Umbau eines Organismus sowie seinem Austausch mit der Umwelt n 2 grundlegende Stoffwechselvorgänge Assimilation/Anabolismus (z.b. Photosynthese) Dissimilation/Katabolismus (z.b. Atmung, Gärung) Stoffwechsel: Regulatory Pathways n Regulation der Genexpression (genetic networks, genetic-regulatory pathways) n Signalwege (signalling pathways, signaltransduction cascades) n Beispiel: p53-signalweg Funktion: Terminieren des Zellzyklus im Falle von beschädigter DNA p53 mutiert in fast allen Tumoren vorhanden Beispiel Glykolyse (C) Prof. R. Müller, Prof. E. Rahm 1-25 (C) Prof. R. Müller, Prof. E. Rahm 1-26 Zusammenfassung n Genom n Proteine und Prione n Translation und Transkription n Stoffwechsel (C) Prof. R. Müller, Prof. E. Rahm 1-27