Themen Aufbau von Aminosäuren



Ähnliche Dokumente
Aufgabe 2: (Aminosäuren)

Aminosäuren - Proteine

Modul 8: Bioinformatik A. Von der DNA zum Protein Proteinsynthese in silicio

Foliensatz; Arbeitsblatt; Internet. Je nach chemischem Wissen können die Proteine noch detaillierter besprochen werden.

Lösungsblatt zu Aufbau von Aminosäuren

Unterrichtsmaterialien in digitaler und in gedruckter Form. Auszug aus:

Klausur zum Modul Molekularbiologie ILS, SS 2010 Freitag 6. August 10:00 Uhr

MOL.504 Analyse von DNA- und Proteinsequenzen

Bioinformatik: Hype oder Hoffnung?

Proteinogene Aminosäuren. Unpolare, aliphatische Seitenketten Monoaminomonocarbonsäuren

Würfelt man dabei je genau 10 - mal eine 1, 2, 3, 4, 5 und 6, so beträgt die Anzahl. der verschiedenen Reihenfolgen, in denen man dies tun kann, 60!.

COOH. Die Aminosäuren tragen laborübliche Abkürzungen, so stehen z. B. Gly für Glycin oder Phe für Phenylalanin.

Aliphatische Aminosäuren. Aromatische Aminosäuren

Übungsblatt: Protein interaction networks. Ulf Leser and Samira Jaeger

8. Translation. Konzepte: Translation benötigt trnas und Ribosomen. Genetischer Code. Initiation - Elongation - Termination

Referat : Aufbau v. Proteinen u. ihre Raumstruktur

APP-GFP/Fluoreszenzmikroskop. Aufnahmen neuronaler Zellen, mit freund. Genehmigung von Prof. Stefan Kins, TU Kaiserslautern

Eva Douma: Die Vorteile und Nachteile der Ökonomisierung in der Sozialen Arbeit

Stellen Sie bitte den Cursor in die Spalte B2 und rufen die Funktion Sverweis auf. Es öffnet sich folgendes Dialogfenster

Klonierung von S2P Rolle der M19-Zellen. POL-Seminar der Biochemie II Sebastian Gabriel

Vorlesung Biophysik I - Molekulare Biophysik Kalbitzer/Kremer/Ziegler

Lineargleichungssysteme: Additions-/ Subtraktionsverfahren

Diagnostik der angeborenen Hämoglobinopathien

CCI Swing Strategie. Cut your losers short and let your winners run

Anleitung über den Umgang mit Schildern

Versuch 8. Plasmid - Isolierung

Was meinen die Leute eigentlich mit: Grexit?

Grundideen der Gentechnik

IV. Übungsaufgaben für die Jahrgangstufe 9 & 10

Das Persönliche Budget in verständlicher Sprache

BIOINF1110 Einführung in die Bioinforma7k. 5. Molekulare Maschinen Proteinstrukturen und ihre Funk/on

Die Bundes-Zentrale für politische Bildung stellt sich vor

BIOINF1110 Einführung in die Bioinforma7k. Molekulare Maschinen Proteinstrukturen und ihre Funk/on

Homologie und Sequenzähnlichkeit. Prof. Dr. Antje Krause FH Bingen / akrause@fh-bingen.de

Leichte-Sprache-Bilder

Biologie I/B: Klassische und molekulare Genetik, molekulare Grundlagen der Entwicklung Theoretische Übungen SS 2014

Zeichen bei Zahlen entschlüsseln

40-Tage-Wunder- Kurs. Umarme, was Du nicht ändern kannst.

trivum Multiroom System Konfigurations- Anleitung Erstellen eines RS232 Protokolls am Bespiel eines Marantz SR7005

15. Aminosäuren, Peptide und Proteine

Partielle Sequenzinformation

Die Online-Meetings bei den Anonymen Alkoholikern. zum Thema. Online - Meetings. Eine neue Form der Selbsthilfe?

Was ich als Bürgermeister für Lübbecke tun möchte

Trennungsverfahren Techniken (in der Biologie)

Erstellen einer Collage. Zuerst ein leeres Dokument erzeugen, auf dem alle anderen Bilder zusammengefügt werden sollen (über [Datei] > [Neu])

AUF LETZTER SEITE DIESER ANLEITUNG!!!

geben. Die Wahrscheinlichkeit von 100% ist hier demnach nur der Gehen wir einmal davon aus, dass die von uns angenommenen

Musterlösungen zur Linearen Algebra II Blatt 5

Anwendungsbeispiele Buchhaltung

Das Leitbild vom Verein WIR

Professionelle Seminare im Bereich MS-Office

Catherina Lange, Heimbeiräte und Werkstatträte-Tagung, November

Abituraufgabe zur Stochastik, Hessen 2009, Grundkurs (TR)

Mit dem Tool Stundenverwaltung von Hanno Kniebel erhalten Sie die Möglichkeit zur effizienten Verwaltung von Montagezeiten Ihrer Mitarbeiter.

VORANGEGANGENE MODELLE

! " # $ " % & Nicki Wruck worldwidewruck

ONLINE-AKADEMIE. "Diplomierter NLP Anwender für Schule und Unterricht" Ziele

Wichtige Forderungen für ein Bundes-Teilhabe-Gesetz

Die Post hat eine Umfrage gemacht

Kulturelle Evolution 12

Leit-Bild. Elbe-Werkstätten GmbH und. PIER Service & Consulting GmbH. Mit Menschen erfolgreich

Johannes Gutenberg-Universität Mainz Fachbereich Biologie, Institut für Zoologie Leitung: Prof. Dr. Wolfrum Datum: 15. April 2005

GENETIK UND GENTECHNIK IM ALLTAG

Primzahlen und RSA-Verschlüsselung

Simulation LIF5000. Abbildung 1

Novell Client. Anleitung. zur Verfügung gestellt durch: ZID Dezentrale Systeme. Februar ZID Dezentrale Systeme

So erstellen Sie nützliche Beschreibungen zu Ihren Tradingdaten

Alle gehören dazu. Vorwort

6. DNA -Bakteriengenetik

Papierverbrauch im Jahr 2000

Lichtbrechung an Linsen

Zahlen und das Hüten von Geheimnissen (G. Wiese, 23. April 2009)

Das große ElterngeldPlus 1x1. Alles über das ElterngeldPlus. Wer kann ElterngeldPlus beantragen? ElterngeldPlus verstehen ein paar einleitende Fakten

Erklärung zu den Internet-Seiten von

Adobe Photoshop. Lightroom 5 für Einsteiger Bilder verwalten und entwickeln. Sam Jost

Übung Zellkommunikation. Vorlesung Bio-Engineering Sommersemester Kapitel 4. 4

Anlegen eines DLRG Accounts

Die Zentralheizung der Stadt Wer heizt wie?

Outlook. sysplus.ch outlook - mail-grundlagen Seite 1/8. Mail-Grundlagen. Posteingang

Die Invaliden-Versicherung ändert sich

Peptide Proteine. 1. Aminosäuren. Alle optisch aktiven proteinogenen Aminosäuren gehören der L-Reihe an: 1.1 Struktur der Aminosäuren

Das RSA-Verschlüsselungsverfahren 1 Christian Vollmer

Repetitionsaufgaben Wurzelgleichungen

Fax einrichten auf Windows XP-PC

Genetisch... Unterschied. DNA zu... 99,9% identisch

Erweiterung der Aufgabe. Die Notenberechnung soll nicht nur für einen Schüler, sondern für bis zu 35 Schüler gehen:

Gründe für fehlende Vorsorgemaßnahmen gegen Krankheit

Die Methode des Robusten Trends und der CAC40 (Frankreich)

Anleitung zur Daten zur Datensicherung und Datenrücksicherung. Datensicherung

Er musste so eingerichtet werden, dass das D-Laufwerk auf das E-Laufwerk gespiegelt

Wir machen neue Politik für Baden-Württemberg

1 topologisches Sortieren

Übungsaufgaben Tilgungsrechnung

Welche Unterschiede gibt es zwischen einem CAPAund einem Audiometrie- Test?

einen Vibrator benutzt; wie man bei einem Kredithai einen Kredit zu 17 Prozent aufnimmt, der in 30 Tagen zur Rückzahlung fällig wird; wie man seinen

Wie oft soll ich essen?

Versuch: Denaturierung von Eiweiß

Schritt für Schritt zur Krankenstandsstatistik

Schrittweise Anleitung zur Erstellung einer Angebotseite 1. In Ihrem Dashboard klicken Sie auf Neu anlegen, um eine neue Seite zu erstellen.

Kreativ visualisieren

Transkript:

WS 2006/2007 Genomforschung und Sequenzanalyse Einführung in Methoden der Bioinformatik Bernhard Lieb & T. Hankeln Protein- Sequenzanalyse & Proteomics Proteine?! 1

Themen Was sind Proteine? Protein-Sequenz-Analyse "Proteomics" Aufbau von Aminosäuren R1 Rest: Definiert die Eigenschaften H N C C OH Carboxylgruppe H H O Aminogruppe Ca-Atom Aminosäuren unterscheiden sich bis auf Prolin nur in den Resten 2

Aufbau von Proteinen Alanin Ala A Serin Ser S Valin Val V Threonin Thr T Phenylalanin Phe F Tyrosin Tyr Y Prolin Pro P Histidin His H Methionin Met M Cystein Cys C Leucin Leu L Asparagin Asn N Isoleucin Ile I Glutamin Gln Q Aspartat Asp D Tryptophan Trp W Glutamat Glu E Glycin Gly G Lysin Lys K Arginin Arg R hydrophob geladen polar Rest Aminosäuren Nicht jeder Aminosäureaustausch ist gleich wahrscheinlich! Aminosäure-Eigenschaften: aliphatisch I L V C S+S A P G G T C SH S D N sehr klein klein hydrophob aromatisch M Y F W H K E Q R geladen positiv polar 3

Die Peptidbindung R1 H O H N Ca C OH N R1 H H H + H Ca C OH H H O H 2 O R2 O H N Ca C N Ca C OH H H O R2 -> Kondensation Peptidbindung C H N O Partiellen Doppelbindungscharakter der C-N-Bindung => Rotation nur möglich am Cα-Atom möglich! 4

Primärstruktur NH 2 -Met-Ala-Asp-Arg-Ile-Ala-Asn-Ala Ala Asn Asp Glu Leu Glu Ala-COOH = M A D R I A N A A N D E L E N A Primärstruktur: Reihenfolge der Aminosäuren. kodiert durch DNA Schreibweise: vom N- zum C-Terminus (Translationsrichtung!) Die Sequenz wird im Genom festgelegt, d.h., wenn wir die DNA-Sequenz kennen, kennen wir auch (fast) das Protein. Sekundärstruktur = feste, sich wiederholende Faltungselemente in einem Protein β-faltblatt α-helix Seitenketten sind an der Faltung nicht beteiligt. aber: bestimmte Aminosäuren sind in den Strukturen häufiger beteiligt als andere! 5

Tertiärstruktur 3D-Struktur bzw. Faltung eines Proteins bzw. einer Polypeptidkette. Jedes Protein bzw. Peptid hat eine Tertiärstruktur! Hämocyanin Quartärstruktur HÄMOCYANIN Besteht ein funktionelles Protein aus mehreren Polypeptidketten, so nennt man die Anordnung der Ketten "Quartärstruktur". => Jedes Protein hat eine Tertiärstuktur, aber nicht jedes hat eine Quartärstruktur! 6

Proteinsequenzanalyse Genomforschung: Ermittlung und Analyse von DNA-Sequenzen, bis hin zur Bestimmung vollständiger Genome. Ein wichtiges Ziel ist die Vorhersage von Genen etc. Daraus: Vorhersage von Proteinsequenzen. Aber: pure Sequenz sagt meist nichts über Struktur und Funktion im Organismus. ATGCTCAAGATACAT... O 2 M L K I H... Expert Protein Analysis System 7

Der universelle (?) genetische Code 8

Das Gen Intron Exon Übergang 9

Proteinsequenzanalyse (am Computer) Eingabe: Aminosäuresequenz Hauptziel: Vorhersage der Funktion! - Welche biochemischen Eigenschaften hat das Protein? -Gibt es verwandte Proteine, evt. mit bekannter Funktion? - Gibt es bekannte Sequenzmotive? - Wo ist das Protein wahrscheinlich lokalisiert? - Welche posttranslationalen Änderungen kann es geben? - Vorhersage der 2D und 3D-Struktur Biochemische Eigenschaften Isoelektrischer Punkt (pi) Molekulargewicht/Molekülmasse (MW) Theoretical pi/mw (average) for the protein sequence MGAVLSVVWG... NAVIFTSYDA : Theoretical pi/mw: 6.09 / 20728.86 Erste Analyse einer Proteinsequenz: => Stimmen die berechneten Daten mit den biochemischen Daten überein? => Wo muss ich mein Protein im 2D-Gel suchen? 10

Proteinsequenzanalyse (am Computer) Eingabe: Aminosäuresequenz Hauptziel: Vorhersage der Funktion! - Welche biochemischen Eigenschaften hat das Protein? -Gibt es verwandte Proteine, evt. mit bekannter Funktion? - Gibt es bekannte Sequenzmotive? - Wo ist das Protein wahrscheinlich lokalisiert? - Welche posttranslationalen Änderungen kann es geben? - Vorhersage der 2D und 3D-Struktur 11

Proteinfunktion Hämocyanine Untereinheit Proteine mit gleicher Funktion in verschiedenen Organismen sind häufig ortholog, sie zeigen daher signifikante Sequenzübereinstimmungen. Proteine mit ähnlicher Funktion im gleichen oder in verschiedenen Organismen zeigen ebenfalls häufig signifikante Sequenzübereinstimmungen (paralog). => Funktionsvorhersage durch Vergleich => Datenbankanalysen (BLAST, PSI-BLAST) Aber: Um sicher zu gehen, muss die vorhergesagte Funktion des gesuchten Proteins in vivo überprüft werden. Proteinsequenzanalyse (am Computer) Eingabe: Aminosäuresequenz Hauptziel: Vorhersage der Funktion! - Welche biochemischen Eigenschaften hat das Protein? -Gibt es verwandte Proteine, evt. mit bekannter Funktion? - Gibt es bekannte Sequenzmotive? - Wo ist das Protein wahrscheinlich lokalisiert? - Welche posttranslationalen Änderungen kann es geben? - Vorhersage der 2D und 3D-Struktur 12

13

Pfam (Protein Families) gegründet 1997 Erik Sonnhammer (Karolinska Institutet, Stockholm), Sean Eddy (Washington University in St. Louis), Richard Durbin (Sanger Center, Cambridge) Zusammensetzung eines Proteins aus einzelnen Proteindomänen ermittelbar Wikipedia Protein(super)familien Proteine mit ähnlicher Sequenz und ähnlicher Funktion werden in Proteinfamilien zusammengefasst. Bsp.: Hämoglobine: Hämoglobin α und β-ketten der Wirbeltiere Hämocyanine: Hämocyaninuntereinheiten der Arthropoden Weiter entfernt verwandte Proteine mit erkennbaren Sequenzähnlichkeiten, aber nicht notwendigerweise ähnlicher Funktion fasst man als Proteinsuperfamilien zusammen. Bsp.: Globine: alle Globin-ähnlichen Sequenzen in Bakterien, Pilzen, Protisten und Tieren Hämocyaninsuperfamilie: Hämocyanine, Tyrosinasen Aber: Bezeichnung nicht immer eindeutig! (Ursprünglich nach Dayhoff: >50% Identität = Proteinfamilie) 14

Protein(superfamilien) in PFAM gut charakterisierte Domänen Domänen mit unbekannter Funktion 15

Motive und Domänen Häufig ist bei Proteinen ähnlicher Funktion nicht das gesamte Protein konserviert, sondern nur Teilbereiche. Funktionell und strukturell wichtige Regionen eines Proteins (z.b. aktive Zentren) sind in der Evolution stärker konserviert als andere Bereiche. Kurze Sequenzen nennt man "Motive" (Segmente, Blocks), grössere Abschnitte "Domänen". Solche Abschnitte können in ansonsten strukturell und/oder funktionell sehr unterschiedlichen Proteinen vorkommen. Domänen stellen zumeist Faltungsabschnitte in der 3D-Struktur eines Proteins dar. Durch Vergleich mit Gruppen anderer Proteine bekannter Funktion ist es möglich, diese funktionellen Bereiche herauszufiltern. Proteinsequenzanalyse (am Computer) Eingabe: Aminosäuresequenz Hauptziel: Vorhersage der Funktion! - Welche biochemischen Eigenschaften hat das Protein? -Gibt es verwandte Proteine, evt. mit bekannter Funktion? - Gibt es bekannte Sequenzmotive? - Wo ist das Protein wahrscheinlich lokalisiert? - Welche posttranslationalen Änderungen kann es geben? - Vorhersage der 2D und 3D-Struktur 16

Domänen in PFAM => Funktionsvorhersagen! Drosophila Proteine 13.601 Gene Hypothetical 11% Unknown 48% Nucleic Acid Binding 8% Enzyme 18% Signal Transduction 4% Transporter 4% Structural Protein 2% Ligand Binding or Carrier 2% Motor Protein 1% Chaperone 1% Cell Adhesion 1% Nucleic Acid Binding Enzyme Signal Transduction Transporter Structural Protein Ligand Binding or Carrier Cell Adhesion Chaperone Motor Protein Unknown Hypothetical 17

Proteinsequenzanalyse (am Computer) Eingabe: Aminosäuresequenz Hauptziel: Vorhersage der Funktion! - Welche biochemischen Eigenschaften hat das Protein? -Gibt es verwandte Proteine, evt. mit bekannter Funktion? - Gibt es bekannte Sequenzmotive? - Wo ist das Protein wahrscheinlich lokalisiert? - Welche posttranslationalen Änderungen kann es geben? - Vorhersage der 2D und 3D-Struktur Postranslationale Modifikationen VieleProteinewerden posttranstional modifiziert Glykosylierung, Phosphorylierung, Sulphorylierung... 18

Postranslationale Modifikationen z.b. N-Glycosylierung: N-X{P}-[TS] Asparagin Irgendeine Prolin hemmt Threonin oder Serin Aber: Wenn Sequenz-Motiv vorhanden, heißt das nicht, dass dieses benutzt wird! Genauigkeit ~ 50 bis 80%. Hauptgrund: Proteinstruktur! Lokalisation! Nachweis???? Signalsequenzen 19

Signalsequenzen Konservierte "Signale" in der AS-Sequenz verraten viel über die Lokalisation des Proteins in der Zelle, und damit über dessen (mögliche) Funktion: Mitochondriales Lokalisationsignal Exportsignale (Signalpeptid) Transmembransequenz Kernlokalisationssignal DNA-Bindungsmotive Signalpeptide Ein eukaryontisches Signalpeptid besteht aus: einer positiv geladenen etwas Argnin -Region einer kurzen, sehr hydrophoben α-helicalen (h-region) einer "cleavage"-region; -3,-1 Positionen meist kleine ungeladene AS Nautilus pompilius hemocyanin MNWHALQRSMATHWHSLLLFSLQLLVFTYATS DPTNIRKNVADLTHDVALNLQIAL n-region h-region Schnittstelle c-region Eukaryotes Gram-negative Prokaryotes Gram-positive Total length (average) n-regions h-regions c-regions -3,-1 positions +1 to +5 region 22.6 aa only slightly Arg-rich short, very hydrophobic short, no pattern small and neutral residues no pattern 25.1 aa 32.0 aa Lys+Arg-rich slightly longer, less hydrophobic very long, less hydrophobic short, Ser+Ala-rich longer, Pro+Thr-rich almost exclusively Ala rich in Ala, Asp/Glu, and Ser/Thr http://www.cbs.dtu.dk/services/signalp-3.0/background/dataset.php 20

SignalP < Is the sequence a signal peptide? >Sequence length = 56 # Measure Position Value Cutoff signal peptide? max. C 33 0.768 0.32 YES max. Y 33 0.820 0.33 YES max. S 23 0.994 0.87 YES # Most likely cleavage site between pos. 32 and 33: ATS-DP C = cleavage score S = signal peptide score Y= combinedscore Vorhersage transmembraner Helix-Regionen In einerα-helix Rotation um 100 pro AS Ganghöhe 1,5 Å pro AS Eine Membran hat einen Durchmesser von ca. 30 Å 30/1,5 = ~20 AS für transmembrane α-helix Problem: Es sind nicht sehr viele 3D-Strukturen von transmembranen Proteinen bekannt (Probleme mit Kristallographie) Durch Analyse der Ladungseigenschaften (hydrophil vs. hydrophob) können putative Transmembranregionen entdeckt werden. Transmembranregionen bestehen aus hydrophoben AS, die gerne eine α- Helix bilden. 21

Vorhersage transmembraner Helix-Regionen Wie wird eine Transmembran-Region vorhergesagt? Berechnung des durchschnittlichen Hydrophobizitätsindexes mit "sliding window"-ansatz: I L V K E I R M S L I D Für Transmembran-Region wird typischerweise eine "window"- Größe von 9 bis 11 verwendet. Rhodopsin: 7 α-helices Proteinsequenzanalyse (am Computer) Eingabe: Aminosäuresequenz Hauptziel: Vorhersage der Funktion! - Welche biochemischen Eigenschaften hat das Protein? -Gibt es verwandte Proteine, evt. mit bekannter Funktion? - Gibt es bekannte Sequenzmotive? - Wo ist das Protein wahrscheinlich lokalisiert? - Welche posttranslationalen Änderungen kann es geben? - Vorhersage der 2D und 3D-Struktur 22

Strukturvorhersagen MGCAISSLGAKAEFGDRSAEEEDAAAAAAV VYPREDQIQMIKDSWKVIRDDIAKVGIIMF VRLFETHPECKDVFFLFRDVEDLERLRSSR ELRAHGLRVMSFIEKSVARLDQQDRLEALA VELGKSHYHYNAPPKYYSYVGAEFICAVQP ILKERFTSELEEAWKTLFQYVTGLMRKGHQ EEGSRQRHLALPPKDGPEKRTSAL 2D 3D 2D-Strukturvorhersagen einfacher als 3D-Strukturvorhersagen (> 40 Jahre Erfahrung) Information für 3D-Strukturvorhersagen Zusätzliche Information für Alignments Vorhersage der Proteinfunktion Proteinklassifizierung 23

α-helix Eine Proteinkette! H-Brückenzwischen-C=O (i) und -N-H (i + 4) β-faltblatt Zwischen verschiedenen Proteinketten H-Brückenzwischenden Proteinketten Ketten laufen meist antiparallel; sind z.t. durch U-Turn verbunden 24

Chou & Fasman Häufigkeit best AS in best Sekundärstruktur / Häufigkeit insgesamt => propensity -Index ( propensity = Neigung ) Amino acid propensities Secondary Structure Preferences 2 1.5 1 0.5 alpha-helix beta-sheet 0 A C D E F G H I K L M N P Q R S T V W Y 25

Chou-Fasman "Sliding Window" mit 6 AS "Fenster" => 4/6 mit P(H) >1.00 = "alpha-helix nucleus" G S P T A E L M H S T P P(H) 57 77 57 69 142 151 121 145 100 77 69 57 G S P T A E L M H S T P P(H) 57 77 57 69 142 151 121 145 100 77 69 57 /100 Chou-Fasman Helix wird nach beiden Seiten erweitert bis der Schnitt von 4 AS P(H) <1.00. G S P T A E L M H S T P P(H) 57 77 57 69 142 151 121 145 100 77 69 57 /100 Genauigkeit ~ 60% 26

Methoden der 2D- Strukturvorhersage Statistische Methoden GOR (zentrale AS +/- 8 AS) (~64% Genauigkeit) "Nearest neighbors" Bezieht verwandte Sequenzen aus Datenbanken mit ein (~70% Genauigkeit) "Neural network" "Lernmaschinen"; werden mit bekannten Strukturen trainiert (~76% Genauigkeit) 3D MGCAISSLGAKAEFGDRSA EEEDAAAAAAVVYPREDQI QMIKDSWKVIRDDIAKVGI IMFVRLFETHPECKDVFFL FRDVEDLERLRSSRELRAH GLRVMSFIEKSVARLDQQD RLEALAVELGKSHYHYNAP PKYYSYVGAEFICAVQPIL KERFTSELEEAWKTLFQYV TGLMRKGHQEEGSRQRHLA LPPKDGPEKRTSAL? 27

Warum 3D-Struktur? Struktur Medizin Sequenz Funktion Methoden der 3D-Modellierung "Ab Initio"-Methoden => nach thermodynamischen Grundlagen Wissenbasierte Methoden => Homologiemodellierung => "threading" 28

CASP "Critical Assessment of Structure Prediction" Contest zur Überprüfung von Methoden zur 3D Vorhersage Unveröffentlichte Proteinstrukturen als Vorgabe für die Berechnungen Vergleich von Vorhersage und experimentellen Laborergebnissen predictioncenter.gov Proteomics PROTEins expressed by a genome or tissue Kurzfassung: 1994 überraschte ein neues Wort die Gemeinde der Biowissenschaftler: das Proteom. Der australische Biochemiker Marc Wilkins hat dieses Kunstwort erfunden und sich dabei vom Genom inspirieren lassen. So wie das Genom die Gesamtheit der Gene und deren Wechselwirkungen bezeichnet, steht das Proteom für die Gesamtheit der Proteine und deren Wechselwirkungen. Die Erforschung des Genoms wird im englischen Sprachraum als Genomics bezeichnet. Dementsprechend steht Proteomics für die Erforschung des Proteoms. Dieser neue Name ist sehr werbewirksam und sorgt für sprudelnde Forschungsgelder, aber wirklich neu ist diese Forschungsrichtung nicht. Sie hieß früher Proteinbiochemie und kam mit dem Aufschwung der Molekularbiologie (der Genomics) aus der Mode. Die Molekularbiologen hatten die Vorstellung, alle Phänomene des Lebens über die Erbanlagen erklären zu können. Die Erbanlagen sind in der DNA im Zellkern der höheren Organismen gespeichert. Sie liefern aber nur den vorläufigen Bauplan für die lebenswichtigen Moleküle die Proteine. Die Proteine selbst entwickeln eigene Strategien, die nicht in der Information aus der DNA enthalten sind. Wer wirklich hinter die Geheimnisse des Lebens kommen will, muss sich den Proteinen widmen. http://www.brockhaus.de/infothek/infothek_detail.php?nr=12124 29

Proteomik Proteinsequenzierung Proteinidentifikation 3-D-Struktur Proteinexpression Proteinfunktion/ Protein-Protein- Interaktion Edman-Sequenzierung Massenspektrometrie (MALDI-TOF, ESI-MS/MS, LC-MS/MS) De novo Sequenzierung Röntgenbeugungsanalyse (XRD) NMR Gelelektrophorese (2D-PAGE) Proteinarrays, MeCAT Yeast-2-Hybrid-Systeme Die "-omics" Gesamtheit des genetischen Materials: "Genom" Gesamtheit des transkribierten Materials (RNA): "Transkriptom" Gesamtheit der translatierten Proteine: "Proteom" Genom (DNA) Transcriptom (RNA) Proteom (Protein) "Metabolom", "Interactom" 30

Proteom Proteom: alle Proteine eines Organismus (einer Zelle, eines Gewebes...) ~ 22,000 Gene ~ 500.000 Proteine im Menschen (mit Modifikationen) mrna und Proteinexpression kann unterschiedlich sein Proteom identisches Genom aber unterschiedliche Proteome! 31

Proteomics Proteomics: Untersuchung der Proteinexpression eines biologischen Systems Häufigkeit, posttranslationale Modifikationen Korrelation mit zellulären Faktoren (Zellspezifität) Korrelation mit Krankheiten oder Umweltfaktoren Protein-Protein-Interaktionen Proteinkomplexe Proteomics Krankheiten Metabolismus Interaktionen Medikamente Temperatur Chemikalien Proteom Stress Zell-spezifische Expression Proteomics: Untersuchung der Proteinexpression eines biologischen Systems 32

Proteinbiochemische Techniken Heute so gut wie damals Proteinfällung (z.b. (NH 4 ) 2 SO 4 ) Größenfraktionierung (SEC) Ionenaustauschchromatographie (IEC) Hydrophobe Interaktion (HIC) SDS-PAGE Western blotting Proteinsequenzierung etc. Hierfür jedoch relativ große Proteinmengen notwendig! => Limitierung auf bestimmte Proteine bzw. Analysen. The Modern Art of Proteomics" 2D-Gelelektrophorese Proteinsequenzierung Massenspektroskopie Two-Hybrid-System Protein Chips... Nur wenig Protein zur Analyse notwendig 33

2D-Elektrophorese 1. Dimension: Isoelektrische Fokussierung Auftrennung nach Ladung (pi) 2. Dimension: SDS-PAGE Auftrennung nach Masse (M r ) 2D-Elektrophorese Masse ph-gradient 34

2D-Elektrophorese Vorteile: Viele Proteine können gleichzeitig visualisiert werden. Massenspektrometrie möglich Isoformen und Modifikationen können visualisiert werden 2D-Elektrophorese Nachteile: Nur hochexprimierte Proteine können leicht visualisiert werden. Funktioniert nicht mit sehr kleinen oder hydrophoben Proteinen Auftrennung schwer reproduzierbar! 35

Datenbanken für 2D-Gele 2D-Elektrophorese Proteine aus einem erkrankten Gewebe ausschneiden und analysieren. Kontrolle: Proteine aus einem gesunden Gewebe 36

Identifizierung eines Proteins Immunodetektion Spezifischer Antikörper notwendig Proteinsequenzierung (Edman-Abbau) Sensitivität : >250 fmol teuer und zeitraubend: 15h für ~ 15 AS Identifizierung mittels Massenspektrometrie Sensitivität : <1 fmol Bei Automatisierung bis zu 100 Proteine eines bekannten Genoms Was ist Massenspektrometrie? Die Beschleunigung von geladenen Teilchen(z.B. ionisiertenpeptiden) in einem elektrischen Feld hängt von deren Masse (m) und Ladung (z) ab. Sample Vakuumkammer Detektor Elektrisches Feld MALDI TOF: Matrix Assisted Laser Desporption/Ionisation Time Of Flight SELDI TOF: Surface Enhanced Laser Desporption/Ionisation Time Of Flight ESI: Electrospray Ionization 37

Matrix-Assisted Laser Desorption/Ionisation Time-of-Flight Mass Spectrometry (MALDI-TOF-MS) Ions Sample plate Sample plate Laser pulse irradiation Sample Matrix UV-Laser Proteine werden mit der Matrix- Substanz gemischt und getrocknet. Matrix wird mit gepulstem UV-Laser beschossen Schwingungsenergie wird auf Biomoleküle übertragen, die in die Gasphase übergehen Acceleration grids Detector MALDI-Signal M+2H + M+3H + M+H + M + m/z 38

MALDI-TOF Relative Intensity 100 % 0 1431.8 1539.8 1573.9 1588.2 Identifikation bekannter Proteine anhand ihrer Masse. Massenbestimmung ist eindeutig. für Proteine < 10 6 Da geeignet. Größere Proteine, oder wenn mehr Information gewünscht wird, müssen zuvor mit einer Protease (meist Trypsin) in kleinere Peptide zerlegt werden. Enzymatischer Verdau N-Asp-Ala-Gly-Arg-His-Cys-Lys-Trp-Lys-Ser-Glu-Asn-Leu-Ile-Arg-Thr-Tyr-C Trypsin N-Asp-Ala-Gly-Arg Ser-Glu-Asn-Leu-Ile-Arg His-Cys-Lys-Trp-Lys Thr-Tyr-C Die Massen (aus MALDI-TOF) der Peptide können mit zuvor bestimmter Proteinsequenz (z.b. aus cdna) verglichen werden. Wenn Massen und weitere Daten (MW, pi) bekannt sind, können die Massen zur Identifikation des Proteins in den Datenbanken verwendet werden. 39

MALDI- TOF Vergleich der theoretischen Massen mit den MALDI-Daten. Genomics vs Proteomics cdna (lets play together) Protein Protein 2D PAGE Verdau Verdau MALDI-TOF Massen Massen 40

Electrospray-MS (ESI-MS) Proteine werden in flüchtigem Lösungsmittel mittels Kapillare in eine Ionisationskammer injiziert Spannung erzeugt feine Tröpfchen, die verdunsten und in der Gasphase geladene Biomoleküle zurücklassen. < 10-12 M werden benötigt 41

Protein-Protein-Interaktionen Wenn wir nur die Proteine kennen, wissen wir noch wenig über deren Zusammenwirken im Organismus. => Bestimmung der Protein-Protein-Interaktionen: 1. 2-Hybrid-System 2. Protein Chips 3. Computeranalysen Yeast 2-Hybrid-System oder Beziehungskisten Genom der Hefe..6000Proteine 6000 x 6000 mögliche Interaktionen nicht mehr von Hand durchtesten. für die Two-Hybrid-Screens einen Two-Hybrid- Roboter kaufen Vollautomatische Laborsklaven sind nicht billig ~165.000 Euro zieht dann aber 100.000 Hefehochzeiten alias "Matings" pro Tag klaglos durch. (mod. nach H. Zähringer, Laborjournal 01/2006, Stand: Januar 2006, alle Angaben ohne Gewähr 42

Protein bzw. Proteomchips Methode: Jedes translatierte Protein soll auf einen Glasträger ge spottet werden. Ziel: en masse-analyse von intermolekularen Interaktionen. Erster Proteom Chip (2001): 94% der Hefe ORFs in Proteine translatiert und auf Ni-NTA beschichteten Glasträger aufgetragen => 39 Proteine binden Calmodulin 6 bekannt 33 unbekannt! in silico Phylogenetic profiles: 20,749 Links mrna expression: 26,013 Links Domain fusion: 45,502 Links => Funktionelle Links von 62% der bislang 2557 Hefe-Proteine unbekannter Funktion. 43

Identifizierung von Protein- Protein-Interaktionen Idee: Suche nach Interaktionen (< 5Å Abstand) in 3D-Strukturen (PDB- Datenbank). Gibt es diese Strukturen auf verschiedenen Proteinen in Hefe? Wenn ja, dann gibt es möglicherweise eine Interaktion! Bioinformatics viel Erfolg 44