Kapitel 5: Protein-Datendanken

Ähnliche Dokumente
Methoden der Proteomforschung. 2 D Gelelektrophorese

Peptid- und Proteinanalytik II - am Beispiel der Proteomanalyse

Einführung in die Angewandte Bioinformatik: Proteinsequenz-Datenbanken

Partielle Sequenzinformation

PROTEOMICS REVISITED. Zweidimensionale Hochleistungsdünnschichtchromatographie mit massenspektrometrischer Detektion zur Analyse von Proteinen

MOL.504 Analyse von DNA- und Proteinsequenzen. Datenbanken & Informationssysteme

2.2. Peptide. Peptide entstehen durch Kondensation der a-carboxylgruppe einer Aminosäure mit der a-aminogruppe einer anderen Aminosäure

MVZ Dr. Stein + Kollegen, Dr. med. Eray Yagmur

Publikationsprozesse für Forschungsdaten. Peer Brauer, Wilhelm Hasselbring Universität zu Kiel

Einführung Molekulare Bioinformatik

Kombinierte Verfahren der Bioanalytik inklusive Massenspektrometrie : Grundlagen. Christopher Gerner

Vorgänger für Pathway Studio und IPA. Herbsttagung der Bibliotheken der BM-Sektion / Elisabeth Schlagberger

Inhalt Genexpression Microarrays E-Northern

Produktinformation CombiFlash Rf + PurIon

VL Algorithmische BioInformatik (19710) WS2013/2014 Woche 16 - Mittwoch. Annkatrin Bressin Freie Universität Berlin

Oracle9i Designer. Rainer Willems. Page 1. Leitender Systemberater Server Technology Competence Center Frankfurt Oracle Deutschland GmbH

Monitoring Database: Grundlagen, Workflow, Hinweise

Leistungskatalog. Core Facilities. Juli Seite 1 von 6

Applied Bioinformatics.

AlgoBio WS 16/17 Protein-DNA Interaktionen ChiP-Seq Datenanalyse. Annalisa Marsico

Schnelle Diagnostik durch molekularbiologische und massenspektrometrische Verfahren

Was bisher geschah. Michael Krappmann HSWT Workshop STOFF-IDENT & openmasp : 15 Uhr

Dot-Matrix Methode. (Java) (Javascript) 80

Bioinformatik. Prof. H.-W. Mewes Lehrstuhl für Genomorientierte Bioinformatik Wissenschaftszentrum Weihenstephan Technische Universität München

Molekularbiologische Datenbanken

DAS METABOLOM: ERNÄHRUNGSSTATUS, METABOLISMUS, METABOLITEN

Elektrophorese. Herbstsemester ETH Zurich Dr. Thomas Schmid Dr. Martin Badertscher,

Analytische Chemie (für Biol. / Pharm. Wiss.)

ArcGIS Server Plattform. Kurzanleitung System Test for Web (ESRI) BAU-, VERKEHRS- UND ENERGIEDIREKTION des Kantons Bern. Amt für Geoinformation

Einführung Molekulare Bioinformatik

MODULE für den SCHULKOFFER GENTECHNIK

Primärstruktur. Wintersemester 2011/12. Peter Güntert

Nutzungsordnung für die CECAD-ZMMK Proteomics Facility

Veranstaltungen, SWS, ECTS, Prüfungsdauer

GEO-INFORMATIONSSYSTEME

Ausprägungsfach Bioinformatik im Rahmen des Bachelor-Studiengangs Informatik. CIBIV Center for Integrative Bioinformatics Vienna

Kurzüberblick IIIF. Dozent/in: Stefanie Rühle Veranstaltung: KIM WS 2017 Datum:

Attached! Proseminar Netzwerkanalyse SS 2004 Thema: Biologie

Genomik und Bioinformatik für komplexe Krankheiten

Der neue und der alte Polytheismus. Title M. Webers Religionssoziologie. Hitotsubashi journal of arts and sc Citation 23-48

GridMate The Grid Matlab Extension

Architektur von REST basierten Webservices

Susanne Greiner, Data Scientist, Würth Phoenix. Würth Phoenix more than software

Einführung in die Angewandte Bioinformatik: Netzwerke

Introduction 1 GENERAL CONCEPTS Baby Banana (Musa acuminata AA Simmonds cv. Bocadillo) 4

Softwarewerkzeuge der. Bioinformatik

C SB. Genomics Herausforderungen und Chancen. Genomics. Genomic data. Prinzipien dominieren über Detail-Fluten. in 10 Minuten!

Abbildungsverzeichnis. Tabellenverzeichnis. Abkürzungsverzeichnis. 1 Einleitung 1

Differenzierung von coliformen Bakterien

Standardisierte Anbindung Mobiler Endgeräte an KIS-Infrastruktur mittels CDA


DATENQUALITÄT IN GENOMDATENBANKEN

Diagnostik der angeborenen Hämoglobinopathien

DER EINSATZ VON DATENBANKTECHNOLOGIEN IN FORSCHUNG UND THERAPIE. Martin Peuker

Kerstin Brachhold (Autor) Das Basalapparat-Subproteom von Chlamydomonas reinhardtii

Humane Genotyp-Phänotyp-Datenbanken: Ein Statusbericht

Quantifizierung von Proteinen mittels MeCAT-Lanthanid-Markierung. Karola Lehman, Boris Neumann, Stefanie Wienkoop, Robert Ahrends

Abbildung 1: Schematische Darstellung der Domänenorganisation von Survivin


Microsoft Azure Deutschland ist jetzt verfügbar -


Anwendungsbericht Kolloidanalyse

bitflux CMS ein crossmedia-fähiges opensource System ein Vortrag von Marcel Linnenfelser

Schnellmethoden zur Sortenidentifizierung Dr. Simone Seling

Analytische Chemie (für Biol. / Pharm. Wiss.)

What is a Fourier transform? A function can be described by a summation of waves with different amplitudes and phases.

AGES-Webribo. Systematik in Clostridium difficile PCR-Ribotyping. Alexander Indra

Konzeptionelle Modellierung von XML-Dokumenttypen

Remote Metrology in einem digital holographischen Labor. Institut für Technische Optik Universität Stuttgart

Oracle Data Warehouse Integrator Builder Ein Selbstversuch

Übersicht Sequenziermethoden

V-Modul 427. Methoden der Zellfraktionierung und Proteomanalyse bis

Einführung in die Biophysik

NETZSCH Group. Identify Das Kurvenerkennungs- und Datenbanksystem der Thermischen Analyse

Quelle Gen: GK-120F

Transkript:

Kapitel 5: Protein-Datendanken Vom Gen zum Protein n Motivation und historische Entwicklung n Proteomics Datengewinnung PEDRo-Projekt n Protein-Datenbanken Anforderungen Sequenz-Datenbanken Domain/Familien-Datenbanken Struktur-Datenbanken (C) Prof. R. Müller, Prof. E. Rahm 5-1 (C) Prof. R. Müller, Prof. E. Rahm 5-2 n Proteinfunktionen Proteine Genregulation Verdauung / Metabolismus, enzymatische Steuerung Signalverarbeitung Zellstruktur und Organellen, Zellteilung, Vermehrung Sequence Structure n Proteine im Menschen Durchschnittlich 447 Aminosäuren lang Kürzestes [Swiss-Prot]: ~ 40-50 Aminosäuren Längstes [SP]: ~ 8.700 Nesprin (Cytoplasma), [Swiss- Prot]: ~ 6.669 Nebulin (Muskel), [EMBL]: 34.350 Titin (Muskel) ACMVLLCEVEKYP folding Function????? Protein-Sequenzen n Länger bekannt und untersucht als DNA-Sequenzen, da labortechnisch einfacher zugänglich n Erste Proteinsequenz 1951 (Sanger & Tuppy): Seitenkette von Insulin n Systematische Sammlung ab Anfang der 1960er (Dayhoff et al. 1965) Protein Sequence Atlas: Buchform, 1968-1978 Motivation: Evolutionäre Untersuchungen 1980: Protein Information Resource (seit 1988: PIR-International) 1986: Swiss-Prot (Genf) n Die Funktion von 40-50% der Proteine ist unbekannt! n Wissen über Proteine u.a. wichtig für Krankheitsverständnis Medikamenten-Design (C) Prof. R. Müller, Prof. E. Rahm 5-3 (C) Prof. R. Müller, Prof. E. Rahm 5-4

Proteomics n Ausgangsproblematik: Gensequenzen (und damit AS-Sequenzen) informieren nicht über Proteinfunktionen Protein-Protein-Interaktionen, Multiprotein-Komplexe Post-translationale Modifikationen (z.b. bei Prionen) n Ziel von Proteomics: Bestimmung aller Proteine(komplexe) und ihrer Funktionen * n Wichtigstes Verfahren: Massenspektroskopie n Problematik Noch keine öffentlichen Repositories für Spektren Noch keine Standards zur Beschreibung von Experimenten und Protokollen n Derzeitige (noch nicht abgeschlossene) Standardisierungsbemühungen HUPO: Human Proteome Organisation (mit wichtiger Unterorganisation JHUPO: Japan HUPO; Entwicklung von HUP-ML: Human Proteome Markup Language) PSI: Proteomics Standard Initiative PEDRo * siehe auch: http://us.expasy.org/ (ExPASy Molecular Biology Server) (C) Prof. R. Müller, Prof. E. Rahm 5-5 Massenspektrometer Proteomics: Datengewinnung The nature of proteomics experiment data Sample generation Origin of sample hypothesis, organism, environment, preparation, paper citations Sample processing Gels (1D/2D), columns, other methods images, gel type and ranges, band/spot coordinates stationary and mobile phases, flow rate, temperature, fraction details Mass Spectrometry machine type, ion source, voltages In Silico analysis peak lists, database name + version, partial sequence, search parameters, search hits, accession numbers (C) Prof. R. Müller, Prof. E. Rahm 5-6 Proteomics: Workflow Proteinextraktion Proteintrennung Proteomics Workflow Aufbereitung aller Proteine einer Zelle 2D Gel-Elektrophorese 2D Gel-Elektrophorese Zweidimensionale Trennung von Proteinen 1. Dimension: Ladung 2. Dimension: Masse Gel mit ph Gradient; Protein bewegt sich im Feld zu isoelektrischem Punkt SDS (Sodiumdodecylsulphate) bindet an und lädt Proteine; Diffusionsgeschwindigkeit im elektrischen Feld hängt von Masse ab Proteinisolierung Ausschneiden Proteinidentifikation Massenspektroskopie Sequenzierung Analyse Funktion, Struktur, Interaktion,... Proteingemisch Aufgetrennte Proteine (C) Prof. R. Müller, Prof. E. Rahm 5-7 (C) Prof. R. Müller, Prof. E. Rahm 5-8

Isoelektrischer Punkt 2D Gel-Ergebnisse 2D Gel Methode Nächste Schritte Noch

1. Sequenzierung, Edman Degradation 2. Identifikation: Massenspektroskopie Schritt 1: Verdau 2. Ionisierung

Ergebnis der MS Proteinidentifikation Probleme Praktische Algorithmen

Kompletter Workflow PEDRo n Proteomics Experiment Data Repository n Systematischer Ansatz zur Modellierung Speicherung und Distribution von Proteomics-Experimentaldaten und deren Interpretation n University Manchester (Taylor, Paton & Goble) n http://pedro.man.ac.uk/home.shtml (C) Prof. R. Müller, Prof. E. Rahm 5-9 PEDRo-Schema PEML: Proteomics Markup Language 1 Probenerzeugung Separierungsmethoden 2 3 5 MS Verfahren und Parameter 4 Legende MALDI: Matrix-assisted laser desorption / ionization DiGe: 2D Difference gel electrophoresis: Verschiedene Proteine von verschiedenen Proben werden mit demselben Gel kombiniert und separiert 6 7 8 9 Peaks und Identifikation MS (C) Prof. R. Müller, Prof. E. Rahm 5-10 (C) Prof. R. Müller, Prof. E. Rahm 5-11

PEDRo: SQL-Schema (Ausschnitt) PEDRo: Datenfluss PedroDC: Pedro Graphical User Interface XSLT: extensible Stylesheet Language for Transformation (C) Prof. R. Müller, Prof. E. Rahm 5-12 (C) Prof. R. Müller, Prof. E. Rahm 5-13 PEDRo: Bewertung n Noch keine Vergleiche / Erfahrungsberichte verfügbar n Keine Modellierung der Dynamik der Prozesse Constraints Zustandsübergange Workflow n Kein Standard (PEDRo ist ein Versuch) n Unklarer Nutzen vieler Metadaten Experimente sind oft nicht vergleichbar Und werden auch bei genauerer Beschreibung nicht vergleichbar (C) Prof. R. Müller, Prof. E. Rahm 5-14