BCDS Seminar. Protein Tools

BCDS Seminar Protein Tools

Gliederung Nützliche Tools Three-/one-letter Amino Acids' Сodes RandSeq Random Protein Sequence Generator Protein Colourer ProtParam PeptideCutter ProtScale TMHMM Server 2.0

Gliederung BLAST Dot plot CLUSTAL VAST

Three-/one-letter Amino Acids' Сodes Online Tool um Aminosäuresequenzen vom 1- lettter code zum 3- letter code umzuwandeln und umgekehrt http://molbiol.ru/eng/scripts/01_17.html

RandSeq Random Protein Sequence Generator Generiert zufällige Aminosäuresequenzen 4 Möglichkeiten um Sequenz zu generieren Gleiche Wahrscheinlichkeit für alle AS Komposition ähnlich zu bekanntem Protein (Gut als Vergleich) Wahrscheinlichkeit für Vorkommen einer AS wie in der Natur Benutzerdefinierte Wahrscheinlichkeitsverteilung zwischen einzelnen AS http://web.expasy.org/randseq/

Protein Colourer As Sequenz wird farblich markiert 4 verschiedene Farben Input: FASTA Sequenz http://www.ebi.ac.uk/cgibin/proteincol/proteincolourer.pl

ProtParam Berechnet verschieden Proteineigenschaften anhand der Primärstruktur Molekulargewicht Theoretischer pi AS Komposition Atomkomposition Extinktionskoeffizient Halbwertszeit (theoretisch) http://web.expasy.org/protparam/

Molekularen Gewicht Berücksichtigt keine posttranslationalen Modifikationen Extinktionskoeffizient Betrachtet jede AS als einzeln und unabhängig. Im Protein liegen die As in einer anderen Umgebung vor, wodurch der echte Extinktionskoeffizient vom berechneten Wert abweichen kann. Instabilität Dies ist nur eine grobe Einschätzung. Erfahrungsgemäß ist ein Protein dann stabil, wenn dieser Wert unter 40 liegt. Halbwertszeit Die Angabe für drei verschiedene Organismen, ist aber mit große Sicherheit auf ähnliche Organismen übertragbar Unabhängig von Proteinregulation

PeptideCutter Vorhersage über mögliche Schnittstellen im Protein (Faltung wird nicht berücksichtigt) Auswahl aus einer Vielzahl an Proteasen und Chemikalien http://web.expasy.org/peptide_cutter/

Ausgabe: Proteinsequenz Auflistung der verwendeten Enzyme und Chemikalien Auflistung der gefundenen Schnittstellen Graph mit Schnittstellen der Enzyme oder Chemikalien Auswahl eines dieser Reagenzien führt zu einer Seite, auf der alle Schnittstellen für das betreffende Reagenz in der gewählten Sequenz angezeigt werden

ProtScale Gibt die Hydrophobizität der Aminosäuren an Auswertung erfolgt vom Benutzer http://web.expasy.org/cgibin/protscale/protscale.pl Die Fenstergröße bestimmt welche Anzahl von Aminosäuren im ausgewählten Algorithmus jeweils in eine Berechnung in Betracht gezogen werden Transmembransegmente: Algorithmus Hphob. /Kyte& Doolittle (Fenstergröße 19 AS)

TMHMM Server 2.0 Proteinsequenz im FASTA- Format oder als Datei hochladen http://www.cbs.dtu.dk/services/tmhmm-2.0/ Ausgabe: wahrscheinlichste Positionen Transmembran Helices zu finden Bei Benutzung der graphische Ausgabe: Graph zeigt wo mögliche Transmembran Helices zu finden sind Angabe, ob Teil der Sequenz Intra-oder Extrazellulär zu finden ist Daten für die Erstellung des Graphen über die Links unter dem Graphen

BLAST - Basic LocalAlignment SearchTool(Altschulet al. 1990) BLAST ist eine heuristische Methode Nähert sich der Lösung schrittweise an Trifft dabei Annahmen Gaps sind bei der Suche erlaubt. BLAST sucht nach Segmentpaare konstanter Länge, die verlängert werden bis zu einem Schwellenwert der Ähnlichkeit der Sequenzen BLAST wird sowohl für Proteinsequenzen als auch für DNA Sequenzen eingesetzt

Kleine Sequenzwörter der querry Sequenz werden mit Sequenzen aus der Datenbank verglichen Die alignierte Sequenz wird in beide Richtungen verlängert, bis keine ausreichende Übereinstimmung mehr vorliegt Aus: http://de.wikipedia.org/w/index.php?title=datei:blast_german.svg&pa ge=1&filetimestamp=20120121155846

Verschieden Blast Algorithmen http://blast.ncbi.nlm.nih.gov/blast.cgi?cmd=web&pa GE_TYPE=BlastHome Blastp Protein-Protein BLAST. Vergleicht die Abfragesequenz mit Proteinsequenzen in den Zieldatenbanken bl2seq Führt ein lokales Alignment von zwei Sequenzen durch. Pattern Hit Initiated BLAST (PHI-BLAST) Sucht mit einen Sequenzmotiv nach Proteinen mit ähnlichen Motiven

Position Specific Iterated BLAST (PSI-BLAST) Mischung aus paarweise und multiplen Alignment. Nach eine Runde blastp wird die Position-Specific-Scoring- Matrix (PSSM) gebildet. Die PSSM beinhaltet die Information vom Alignment des ersten BLASTs Die PSSM wird für eine weitere Runde BLAST verwendet und aktualisiert, bis keine neue Proteine gefunden werden Der PSI-BLAST wird verwendet, um entfernte Verwandte eines Proteins zu bestimmen. Hidden Markov Modelle (HMMs) Sensitiveres Modell als PSI-BLAST, ist aber Rechenintensiver. Stochastisches Modell, welches durch zwei zufällige Prozesse beschrieben wird

BLAST Ergebnis Erst werden die Sequenzen farblich codiert präsentiert lila= gute Sequenzähnlichkeit schwarz= geringe Sequenzähnlichkeit Score gibt die Güte der Sequenz-Ähnlichkeit an Unter 50 ist sehr unzuverlässig Expectation-value zeigt ob das Ergebnis auch zufällig sein könnte > 10-4 gilt als zufällig

Dot plot Vergleich von zwei Sequenzen Anwendung: Wiederholungen finden Deletionen und Insertionen finden http://myhits.isb-sib.ch/cgi-bin/dotlet

Eine Matrix m:n wird gebildet, wobei m und n AS der zu vergleichenden Sequenzen sind Es wird ein Treffer markiert, wenn m(x) = n(x) ist. Deletion Repeat

Zwei Bereiche erlauben über Input die zu vergleichenden Sequenzen anzugeben. Treshold und Ratio ändern das Aussehen des Plots. Tandemrepeats können als Nebendiagonalen beim plotten einer Sequenz mit sich selbst auftreten

CLUSTAL http://www.ebi.ac.uk/tools/msa/clustalo/ Output: Alignments: graphische Darstellung des Alignments * konservierte As : konservierte As mit ähnlichen Eigenschaften. Konservierte As mit weniger ähnlichen Eigenschaften Result summary Submission details Submit another job

Residue Colour Property AVFPMILW RED DE BLUE Acidic RK MAGENTA Basic - H STYHCNGQ Others GREEN Grey Small (small+ hydrophobic (incl.aromatic -Y)) Hydroxyl + sulfhydryl + amine + G Unusual amino/imino acids etc

Jalview Jalview wurde von der University of Dundee programmiert und kann dort frei heruntergeladen werden Funktionen von Jalview Öffnet u.a. FASTA-und Clustal-Formate Gaps können eingefügt oder entfernt werden Alignment über Clustal AS-Konservierung und Angabe der Konsensus-Sequenz Färbung der Sequenz Angabe von Sequenzeigenschaften z.b. Domänen Ausdrucken Speicherung in XML Export als HTML, PNG und EPS.

VAST - VectorAlignment SearchTool VAST ist eine Struktursuchmaschine Sie sucht nach Koordinaten die ähnlich zu der in deiner PDB Datei sind http://www.ncbi.nlm.nih.gov/structure/vast/vastsear ch.html Jede Suche erhält eine ID. Man kann die Ergebnisse der Suche durch diese ID später wieder aufrufen Erst wird die PDB Datei hochgeladen. Danach durch klicken auf Start den Suchvorgang starten. Die neue Seite gibt an, wie lange die Suche dauern soll.

VAST verwendet sogenannte SSE (sekundäre Strukturelemente) SSE sind ähnlich gebaut, haben ähnliche Orientierung und Verbindung bezogen auf den Rest des Moleküls Diese SSE werden nach ihrer Ähnlichkeit bewertet die Proteine, die die besten Bewertungen bekommen, haben die ähnlichsten SSE. Somit werden auch die ähnlichsten 3D Strukturen gefunden. Um dies zu verifizieren wird ein Wert berechnet, der angibt wie wahrscheinlich es ist, dass durch Zufall die gefundenen SSE in der Orientierung und Verknüpfung zu finden ist Auswertung erfolgt mit Cn3D

Quellen Documentations der vorgestellten Tools Folien aus dem letzten BCDS- Seminar