BCDS Seminar. Protein Tools

Ähnliche Dokumente
Einführung in die Angewandte Bioinformatik: Proteinsequenz-Datenbanken

Zentrum für Bioinformatik. Übung 4: Revision. Beispielfragen zur Klausur im Modul Angewandte Bioinformatik (erste Semesterhälfte)

Multiple Alignments. Vorlesung Einführung in die Angewandte Bioinformatik Prof. Dr. Sven Rahmann. Webseite zur Vorlesung

Klausur Bioinformatik für Biotechnologen

Primärstruktur. Wintersemester 2011/12. Peter Güntert

Gleichheit, Ähnlichkeit, Homologie

MOL.504 Analyse von DNA- und Proteinsequenzen. Modul 2 BLAST-Sequenzsuche und Sequenzvergleiche

Softwarewerkzeuge der Bioinformatik

Bioinformatik für Lebenswissenschaftler

Algorithmen auf Sequenzen Paarweiser Sequenzvergleich: Alignments

Vorlesung Einführung in die Bioinformatik

Alignments & Datenbanksuchen

Ihre Namen: Gruppe: Öffnen Sie die Fasta-Dateien nur mit einem Texteditor, z.b. Wordpad oder Notepad, nicht mit Microsoft Word oder Libre Office.

Bioinformatik für Lebenswissenschaftler

Bayesianische Netzwerke - Lernen und Inferenz

Dot-Matrix Methode. (Java) (Javascript) 80

Studiengang Informatik der FH Gießen-Friedberg. Sequenz-Alignment. Jan Schäfer. WS 2006/07 Betreuer: Prof. Dr. Klaus Quibeldey-Cirkel

1/10. Ihre Namen: Gruppe: Evolutionsbiologie 2, WS2015/2016: Bioinformatik - Übung 1

Bioinformatik. Lokale Alignierung Gapkosten. Silke Trißl / Ulf Leser Wissensmanagement in der. Bioinformatik

Aufgabenblatt 5. Silke Trißl Wissensmanagement in der Bioinformatik

Sequenzvergleich und Datenbanksuche

Proteinstrukturvorhersage Strukturelle Bioinformatik WS15/16

FOLDALIGN und sein Algorithmus. Nadine Boley Silke Szymczak

BLAST. Ausarbeitung zum Proseminar Vortag von Nicolás Fusseder am

Bioinformatik. BLAST Basic Local Alignment Search Tool. Ulf Leser Wissensmanagement in der. Bioinformatik

Algorithmen für paarweise Sequenz-Alignments. Katharina Hembach

MBI: Sequenz-Vergleich mit Alignment

Protein-Protein Bindungsstellen. Lennart Heinzerling

Bioinformatik. Substitutionsmatrizen BLAST. Ulf Leser Wissensmanagement in der. Bioinformatik

Sequenz Alignment Teil 2

Übungsaufgaben zur Einführung in die Bioinformatik - Lösungen

MOL.504 Analyse von DNA- und Proteinsequenzen. Übungsaufgaben BLAST-Sequenzsuche und -vergleiche

Bioinformatik Für Biophysiker

Algorithmische Bioinformatik

UAufgabe 12: (evolutiv konservierte Aminosäuren)

MM Proteinmodelling. Michael Meyer. Vorlesung XVII

Bioinformatik I (Einführung)

Bioinformatik I (Einführung)

Bioinformatik Für Biophysiker

Lokale Sequenzähnlichkeit. Genomische Datenanalyse 9. Kapitel

Was ist Bioinformatik?

Folien und Supplementals auf.

Vertiefendes Seminar zur Vorlesung Biochemie

Protein-Datenbanken. Protein- Datenbanken. Christian Fink

STACK Mathematische Aufgaben mit ILIAS testen (Ein Frage-Typ im ILIAS-Objekt Test)

Informationsvisualisierung

Statistische Verfahren:

Attached! Proseminar Netzwerkanalyse SS 2004 Thema: Biologie

Vortrag 2: Proteinsequenzen und Substitutionsmatrizen

Evolution & Genetik (Beispiel Hämoglobin) Prof. Dr. Antje Krause FH Bingen / akrause@fh-bingen.de

Protokoll von Johnnie Akgün

Einführung in die Angewandte Bioinformatik: Algorithmen und Komplexität; Multiples Alignment und

Bioinformatik II: Phylogenetik

Homologie und Sequenzähnlichkeit. Prof. Dr. Antje Krause FH Bingen / akrause@fh-bingen.de

Bioinformatik. Methoden zur Vorhersage von RNA- und Proteinstrukturen. Gerhard Steger. Springer Basel AG

BLAST. Datenbanksuche mit BLAST. Genomische Datenanalyse 10. Kapitel

Algorithmen zum Strukturvergleich Strukturelle Bioinformatik WS16/17

MOL.504 Analyse von DNA- und Proteinsequenzen

Modul 8: Bioinformatik A. Von der DNA zum Protein Proteinsynthese in silicio

Informationsgehalt von DNA

Algorithmische Bioinformatik

Vertiefendes Seminar zur Vorlesung Biochemie I Bearbeitung Übungsblatt 4

Einführung in die Angewandte Bioinformatik: BLAST E-Werte, Algorithmen, Multiple Alignments, R

Informationsmaterial Resistenz gegen HIV Recherche und Analyse molekularer Daten

Bioinformatik. Methoden zur Vorhersage vo n RNA- und Proteinstrukture n. Gerhard Steger

Hidden Markov Model (HMM)

Übung 9: Molekulare Evolution II

Sequence Assembly. Nicola Palandt

Manual Constructor Seite 1 von 27

eduvote Ein Umfragesystem für Lehrveranstaltungen PowerPoint Add-In

Handbuch: PlagScan PlugIn in Moodle 2.X und 3.X für den Nutzer

Inhaltsverzeichnis HÄUFIGKEITSTABELLEN... 1

Paarweises Sequenzalignment

Alignment-Verfahren zum Vergleich biologischer Sequenzen

Aufgabe 7: Distanzbasierte Phylogenie: Neighbor Joining. Stefan Kröger, Philippe Thomas Wissensmanagement in der Bioinformatik

Survival of the Fittest Optimierung mittels Genetischer Algorithmen

Inhalte der Spezialthemen

Mindmapping online. Kapitel 7 Seite 1. Mit Mindmeister gemeinsam eine Mindmap erstellen. Zur Verwendung von Mind-Maps

Mathematik in den Life Siences

In Inventor werden Stile bzw. Stilbibliotheken zur Formatierung von Objekten benutzt:

Transkript:

BCDS Seminar Protein Tools

Gliederung Nützliche Tools Three-/one-letter Amino Acids' Сodes RandSeq Random Protein Sequence Generator Protein Colourer ProtParam PeptideCutter ProtScale TMHMM Server 2.0

Gliederung BLAST Dot plot CLUSTAL VAST

Three-/one-letter Amino Acids' Сodes Online Tool um Aminosäuresequenzen vom 1- lettter code zum 3- letter code umzuwandeln und umgekehrt http://molbiol.ru/eng/scripts/01_17.html

RandSeq Random Protein Sequence Generator Generiert zufällige Aminosäuresequenzen 4 Möglichkeiten um Sequenz zu generieren Gleiche Wahrscheinlichkeit für alle AS Komposition ähnlich zu bekanntem Protein (Gut als Vergleich) Wahrscheinlichkeit für Vorkommen einer AS wie in der Natur Benutzerdefinierte Wahrscheinlichkeitsverteilung zwischen einzelnen AS http://web.expasy.org/randseq/

Protein Colourer As Sequenz wird farblich markiert 4 verschiedene Farben Input: FASTA Sequenz http://www.ebi.ac.uk/cgibin/proteincol/proteincolourer.pl

ProtParam Berechnet verschieden Proteineigenschaften anhand der Primärstruktur Molekulargewicht Theoretischer pi AS Komposition Atomkomposition Extinktionskoeffizient Halbwertszeit (theoretisch) http://web.expasy.org/protparam/

Molekularen Gewicht Berücksichtigt keine posttranslationalen Modifikationen Extinktionskoeffizient Betrachtet jede AS als einzeln und unabhängig. Im Protein liegen die As in einer anderen Umgebung vor, wodurch der echte Extinktionskoeffizient vom berechneten Wert abweichen kann. Instabilität Dies ist nur eine grobe Einschätzung. Erfahrungsgemäß ist ein Protein dann stabil, wenn dieser Wert unter 40 liegt. Halbwertszeit Die Angabe für drei verschiedene Organismen, ist aber mit große Sicherheit auf ähnliche Organismen übertragbar Unabhängig von Proteinregulation

PeptideCutter Vorhersage über mögliche Schnittstellen im Protein (Faltung wird nicht berücksichtigt) Auswahl aus einer Vielzahl an Proteasen und Chemikalien http://web.expasy.org/peptide_cutter/

Ausgabe: Proteinsequenz Auflistung der verwendeten Enzyme und Chemikalien Auflistung der gefundenen Schnittstellen Graph mit Schnittstellen der Enzyme oder Chemikalien Auswahl eines dieser Reagenzien führt zu einer Seite, auf der alle Schnittstellen für das betreffende Reagenz in der gewählten Sequenz angezeigt werden

ProtScale Gibt die Hydrophobizität der Aminosäuren an Auswertung erfolgt vom Benutzer http://web.expasy.org/cgibin/protscale/protscale.pl Die Fenstergröße bestimmt welche Anzahl von Aminosäuren im ausgewählten Algorithmus jeweils in eine Berechnung in Betracht gezogen werden Transmembransegmente: Algorithmus Hphob. /Kyte& Doolittle (Fenstergröße 19 AS)

TMHMM Server 2.0 Proteinsequenz im FASTA- Format oder als Datei hochladen http://www.cbs.dtu.dk/services/tmhmm-2.0/ Ausgabe: wahrscheinlichste Positionen Transmembran Helices zu finden Bei Benutzung der graphische Ausgabe: Graph zeigt wo mögliche Transmembran Helices zu finden sind Angabe, ob Teil der Sequenz Intra-oder Extrazellulär zu finden ist Daten für die Erstellung des Graphen über die Links unter dem Graphen

BLAST - Basic LocalAlignment SearchTool(Altschulet al. 1990) BLAST ist eine heuristische Methode Nähert sich der Lösung schrittweise an Trifft dabei Annahmen Gaps sind bei der Suche erlaubt. BLAST sucht nach Segmentpaare konstanter Länge, die verlängert werden bis zu einem Schwellenwert der Ähnlichkeit der Sequenzen BLAST wird sowohl für Proteinsequenzen als auch für DNA Sequenzen eingesetzt

Kleine Sequenzwörter der querry Sequenz werden mit Sequenzen aus der Datenbank verglichen Die alignierte Sequenz wird in beide Richtungen verlängert, bis keine ausreichende Übereinstimmung mehr vorliegt Aus: http://de.wikipedia.org/w/index.php?title=datei:blast_german.svg&pa ge=1&filetimestamp=20120121155846

Verschieden Blast Algorithmen http://blast.ncbi.nlm.nih.gov/blast.cgi?cmd=web&pa GE_TYPE=BlastHome Blastp Protein-Protein BLAST. Vergleicht die Abfragesequenz mit Proteinsequenzen in den Zieldatenbanken bl2seq Führt ein lokales Alignment von zwei Sequenzen durch. Pattern Hit Initiated BLAST (PHI-BLAST) Sucht mit einen Sequenzmotiv nach Proteinen mit ähnlichen Motiven

Position Specific Iterated BLAST (PSI-BLAST) Mischung aus paarweise und multiplen Alignment. Nach eine Runde blastp wird die Position-Specific-Scoring- Matrix (PSSM) gebildet. Die PSSM beinhaltet die Information vom Alignment des ersten BLASTs Die PSSM wird für eine weitere Runde BLAST verwendet und aktualisiert, bis keine neue Proteine gefunden werden Der PSI-BLAST wird verwendet, um entfernte Verwandte eines Proteins zu bestimmen. Hidden Markov Modelle (HMMs) Sensitiveres Modell als PSI-BLAST, ist aber Rechenintensiver. Stochastisches Modell, welches durch zwei zufällige Prozesse beschrieben wird

BLAST Ergebnis Erst werden die Sequenzen farblich codiert präsentiert lila= gute Sequenzähnlichkeit schwarz= geringe Sequenzähnlichkeit Score gibt die Güte der Sequenz-Ähnlichkeit an Unter 50 ist sehr unzuverlässig Expectation-value zeigt ob das Ergebnis auch zufällig sein könnte > 10-4 gilt als zufällig

Dot plot Vergleich von zwei Sequenzen Anwendung: Wiederholungen finden Deletionen und Insertionen finden http://myhits.isb-sib.ch/cgi-bin/dotlet

Eine Matrix m:n wird gebildet, wobei m und n AS der zu vergleichenden Sequenzen sind Es wird ein Treffer markiert, wenn m(x) = n(x) ist. Deletion Repeat

Zwei Bereiche erlauben über Input die zu vergleichenden Sequenzen anzugeben. Treshold und Ratio ändern das Aussehen des Plots. Tandemrepeats können als Nebendiagonalen beim plotten einer Sequenz mit sich selbst auftreten

CLUSTAL http://www.ebi.ac.uk/tools/msa/clustalo/ Output: Alignments: graphische Darstellung des Alignments * konservierte As : konservierte As mit ähnlichen Eigenschaften. Konservierte As mit weniger ähnlichen Eigenschaften Result summary Submission details Submit another job

Residue Colour Property AVFPMILW RED DE BLUE Acidic RK MAGENTA Basic - H STYHCNGQ Others GREEN Grey Small (small+ hydrophobic (incl.aromatic -Y)) Hydroxyl + sulfhydryl + amine + G Unusual amino/imino acids etc

Jalview Jalview wurde von der University of Dundee programmiert und kann dort frei heruntergeladen werden Funktionen von Jalview Öffnet u.a. FASTA-und Clustal-Formate Gaps können eingefügt oder entfernt werden Alignment über Clustal AS-Konservierung und Angabe der Konsensus-Sequenz Färbung der Sequenz Angabe von Sequenzeigenschaften z.b. Domänen Ausdrucken Speicherung in XML Export als HTML, PNG und EPS.

VAST - VectorAlignment SearchTool VAST ist eine Struktursuchmaschine Sie sucht nach Koordinaten die ähnlich zu der in deiner PDB Datei sind http://www.ncbi.nlm.nih.gov/structure/vast/vastsear ch.html Jede Suche erhält eine ID. Man kann die Ergebnisse der Suche durch diese ID später wieder aufrufen Erst wird die PDB Datei hochgeladen. Danach durch klicken auf Start den Suchvorgang starten. Die neue Seite gibt an, wie lange die Suche dauern soll.

VAST verwendet sogenannte SSE (sekundäre Strukturelemente) SSE sind ähnlich gebaut, haben ähnliche Orientierung und Verbindung bezogen auf den Rest des Moleküls Diese SSE werden nach ihrer Ähnlichkeit bewertet die Proteine, die die besten Bewertungen bekommen, haben die ähnlichsten SSE. Somit werden auch die ähnlichsten 3D Strukturen gefunden. Um dies zu verifizieren wird ein Wert berechnet, der angibt wie wahrscheinlich es ist, dass durch Zufall die gefundenen SSE in der Orientierung und Verknüpfung zu finden ist Auswertung erfolgt mit Cn3D

Quellen Documentations der vorgestellten Tools Folien aus dem letzten BCDS- Seminar