Übung 6: Structure Comparison 1

Ähnliche Dokumente
Übung 7: Die Proteindatenbank (PDB) und Vergleiche von Proteinstrukturen

Zentrum für Bioinformatik. Übung 4: Revision. Beispielfragen zur Klausur im Modul Angewandte Bioinformatik (erste Semesterhälfte)

Klausur Bioinformatik für Biotechnologen

Studiengang Informatik der FH Gießen-Friedberg. Sequenz-Alignment. Jan Schäfer. WS 2006/07 Betreuer: Prof. Dr. Klaus Quibeldey-Cirkel

Algorithmische Anwendungen WS 2005/2006

Proteine V: Flexibilität. Funktion und Struktur Dynamik marginale Stabilität Abbau

Einführung und Übersicht

Übungsaufgaben zur Einführung in die Bioinformatik - Lösungen

Die wichtigsten Bioinformatikdatenbanken. SwissProt, PDB, Scop, CATH, FSSP, PROSITE, Pfam

A. Thunderbird (Version 45.0)

Installationshandbuch für das Word Plugin

Google Maps API Keys für den Filialfinder erstellen und einfügen - v0.4

Primärstruktur. Wintersemester 2011/12. Peter Güntert

Filius Simulation von Netzwerken

Pairwise Alignment. Steffen Forkmann. Proseminar: BioInformatik

Bioinformatik Für Biophysiker

Staff Expert Browser Erweiterungen. Benutzer- und Installationsdokumentation. Version 3.1. Stand

Installationshandbuch. Erforderliche Konfiguration Installation und Aktivierung

Bioinformatik für Lebenswissenschaftler

Installationshandbuch

Einführung in die Angewandte Bioinformatik: Proteinsequenz-Datenbanken

Installations- und Updateanleitung LTLexTool

Medea3 Scan-Client (BCS2 mit Medea3-Erweiterungen)

Der Windows Explorer INITE 7e 2003 Joël François

Funktion "Benutzerprofile" auf "Keine Sicherheit" setzen

Installieren von Programmen auf einem Terminal Server

Linux Kommandozeile: Einfache Skripte. 1 Wiederhohlung. 2 Einfache Skripte

Algorithmen zum Strukturvergleich Strukturelle Bioinformatik WS16/17

2 Installation (Windows Server 2012 oder neuer / Windows 8 oder neuer)

Übungsblatt 1: Zur Benutzung von Computern im CIP-Pool der Informatik

bea Client-Security herunterladen und installieren unter Windows

2.3 - Das Verwaltungsmodul moveon installieren - SQL-Version

IFA-Formulare im PDF-Format mit Adobe Acrobat Reader DC öffnen. Inhalt. Einleitung. 1. PDF-Formular lokal speichern und öffnen

MegaCAD 2009 Installationshinweise

Handout. [ WordPress für den USB- Stick ]

Dokumente verwalten mit Magnolia das Document Management System (DMS)

Bioinformatik. BLAST Basic Local Alignment Search Tool. Ulf Leser Wissensmanagement in der. Bioinformatik

Übung 1 Bioinformatik. Ihre Namen:

Allgemeine Informatik 1 im WS 2006/07 Übungsblatt 1 (Teil 2)

SET-ACL. Dokumentation

Netzwerkinstallation von Win-CASA 2009 für Kunden einer Einzelplatzversion

Bioinformatik für Biochemiker

Anleitung zur Treiberinstallation Allgemeines

Dokumentenablage mit repdoc Werkstattsoftware

Algorithmen auf Sequenzen Paarweiser Sequenzvergleich: Alignments

Bioinformatik. Lokale Alignierung Gapkosten. Silke Trißl / Ulf Leser Wissensmanagement in der. Bioinformatik

easycredit Ratenkauf für OXID eshop

1.3.1 Java-Compiler installieren

Der Gebrauch des Treiberinstallations- Assistenten

Anleitung. Datum: 24. Februar 2017 Version: 5.2. Bildupload per FTP. FTP-Upload / Datei-Manager FTP. Glarotech GmbH

Übung - Mit Wireshark eine UDP-DNS-Aufzeichnung untersuchen

Protokoll Versuch D2 Bioinformatik

Anleitung zum Rechnerwechsel

1. CCWALLsetup.exe von / Download herunterladen.

Installationsanleitung DENS.onTime 2.40

Kurzanleitung für den MyDrive Client

3 Mit Programmen und Fenstern

Bedienungsanleitung. Zuchtschau Programm. Version 1.0 / von 56

Online-Update holen in QUINCY

Update von XBRL Publisher 1.11 auf XBRL Publisher

Multiple Alignments. Vorlesung Einführung in die Angewandte Bioinformatik Prof. Dr. Sven Rahmann. Webseite zur Vorlesung

Drucken in Success! V7.1

Lokale Scanner am Thin Client als Netzwerkscanner nutzen. Inhaltsverzeichnis

Änderungshistory zu Version V0.95

Einrichtung Ihres Exchange-Kontos in Outlook 2010/2013

Kurzinfos Microsoft Outlook 2013

Vereinfachter Zugriff mit lfb-map


Modell Bahn Verwaltung. Tutorial. USB Betrieb. Min. Programm Version 0.68, Juli w w w. r f n e t. ch 1 / 9

Festplatte klonen: Tutorial

Homologie und Sequenzähnlichkeit. Prof. Dr. Antje Krause FH Bingen / akrause@fh-bingen.de

Dateien für eine Webseite auf den Server laden

Was Sie bald kennen und können

Einrichtung Programm Mozilla Thunderbird

1. Laden Sie Ihre e-version herunter

Installation von Zertifikaten. Vertrauensstelle nach 299 SGB V

cytan cytansynchro Version 4.1 / Mai 2016 Letzte Softwareanpassung: Woche 17 / 2016

Dieses UPGRADE konvertiert Ihr Finanzmanagement Version 7.4 in die neue Version 7.5 Ein UPGRADE einer DEMO-Version ist nicht möglich.

Ihre Namen: Gruppe: Öffnen Sie die Fasta-Dateien nur mit einem Texteditor, z.b. Wordpad oder Notepad, nicht mit Microsoft Word oder Libre Office.

TiMaS. App einrichten

Drive SnapShot. AUVESY GmbH. Fichtenstraße 38 B D Landau Deutschland

Node Locked Lizenzierung seit Solid Edge ST4

Installation von Sophos Endpoint Security and Control auf Windows 10

Schritt 1: Übertragung der Daten aus der LUSD in WORD

Einrichten einer SMS Benachrichtigung über sms77

freenet Hotspot Flat Aktivierungsprozess so einfach geht s freenet Hotspot Flat Schritt 1

MS Outlook Add-In: raum level Dokumentenarchiv

Convision Tech-Tipp. Installation und Konfiguration eines SeeTec-Update-Servers Datum Verfasser

Algorithmen und Datenstrukturen in der Bioinformatik Zweites Übungsblatt WS 05/06 Musterlösung

ARIS. Kurzbeschreibung: Einschränkungen & Vorbedingungen: Inhalt

1 Die Namensauflösung mit

4 Das FrontPage-Web. Ziele dieses Kapitels. $ Sie lernen die Struktur eines Webs kennen. $ Sie können Webs verschachteln.

1. Finden statt Suchen Der kürzeste Weg zu den besten Webseiten

Transkript:

Andrew Torda Björn Hansen Zentrum für Bioinformatik Übung zur Vorlesung Grundlagen der Strukturanalyse Wintersemester 2016/2017 12.12.2016 Übung 6: Structure Comparison 1 1. Einführung In der vorliegenden Übung versuchen wir Proteinstrukturen zu vergleichen und zu analysieren. Für die Berechnung von Sequenzalignment und struktureller Überlagerung von Proteinen werden wir die Programme DaliLite und SalamiLite verwenden. Zur Auswertung der Ergebnisse benötigen wir erneut Chimera. Um weitere Informationen über die Proteine in Erfahrung zu bringen, werden wir die Proteinstruktur-Klassifikation CATH verwenden. Neben CATH gibt es auch andere Klassifikationen wie SCOP, FSSP und Pfam. Wir werden mit drei Paaren von Proteinen arbeiten. Bitte legen Sie für diese Übung ein neues Verzeichnis an: mkdir structure_comparison 1 Die Ursprungsfassung dieser Übung wurde von Irina Bondarenko erstellt. 1

2. DaliLite Dali ist ein Netzwerkdienst für Proteinstruktur-Vergleiche. Unter der Adresse http://ekhidna.biocenter.helsinki.fi/dali_server/start können Sie Anfragen an den Server schicken. Dali vergleicht die eingegebene Proteinstruktur paarweise mit allen Proteinen in der PDB und listet anschließend die Proteine mit der größten strukturellen Übereinstimmung auf. Das Programm DaliLite, welches auf unseren Rechnern lokal installiert ist, werden wir für paarweise Strukturalignments von jeweils zwei Proteinen verwenden. Die ersten beiden Proteine, die wir überlagern wollen, sind 1bop und 2cpf. Bitte wechseln Sie in das soeben erstellte Verzeichnis cd structure_comparison und kopieren Sie alle für diese Übung erforderlichen Dateien in dieses Verzeichnis: cp r ~hansen/teaching/structure_comparison/*. Wechseln Sie jetzt Unterordner 1/ und starten Sie anschließend DaliLite: cd 1 perl../dali_start.pl --name1=2bop.pdb --name2=2cpf.pdb Nach erfolgreicher Ausführung des Programms wird die Datei alignment.msf im aktuellen Verzeichnis erstellt. Anhand dieses Alignments können Sie die beiden Proteine in Chimera strukturell überlagern. Starten Sie hierfür bitte Chimera und öffnen Sie in Chimera die PDB- Dateien der beiden zu überlagernden Proteine (2BOP.pdb und 2CPF.pdb). Die Datei 2CPF.pdb enthält ein Ensemble von 20 strukturell leicht unterschiedlichen Varianten dieses Proteins. Öffnen Sie jetzt die Datei alignment.msf im Multialign Viewer: Tools -> Sequence -> Multialign Viewer Chimera wird das Alignment daraufhin einlesen und die Sequenzen automatisch den geöffneten Proteinen zuordnen. In der linken unteren Ecke des Multialign Viewer -Fensters können Sie nach dem Öffnen für einen kurzen Augenblick sehen, welche Sequenzen welcher Proteinstruktur zugeordnet wurden. Innerhalb des Alignment-Fensters wählen Sie jetzt Structure -> Match. Basierend auf dem Alignment wird Chimera die beiden Proteine überlagern, sodass Sie die strukturelle Ähnlichkeit erkennen können. DaliLite erstellt außerdem die Datei index.html, welche Sie im Browser öffnen können. Diese Datei enthält zusätzliche Informationen über das strukturbasierte Alignment der überlagerten Proteine: Sequenzähnlichkeit, RMSD-Wert, Z-Score, 2

3. SalamiLite Salami ist unter http://flensburg.zbh.uni-hamburg.de/~wurst/salami/ zu finden. Der Salami-Server führt für ein Anfrageprotein eine strukturbasierte Proteinsuche in der PDB durch und gibt eine Liste mit Proteinen ähnlicher Struktur zurück. In Rahmen dieser Übung benutzen wir lediglich die Lite-Version des Salami-Servers (SalamiLite), welcher zwei einzelne Proteine überlagert. Führen Sie über die Eingabeaufforderung den folgenden Befehl aus:../salamilite 2BOP.pdb 2CPF.pdb 2bop_out.pdb -a 0 -r 3.0 Das Programm erwartet zwei Proteine für die Überlagerung. Dies sind die ersten beiden Parameter. Der dritte Parameter ist der Name einer zu erstellende pdb-datei. Diese enthält die Koordinaten des ersten Proteins in einer Raumorientierung, in der das erste mit dem zweiten Protein überlagert ist. Über die Option -a wird festgelegt, welcher Algorithmus für das Sequenzalignment verwendet werden soll. -a 0 (Null) bedeutet, dass der Needleman-Wunsch-Algorithmus verwendet wird (globales Alignment). Mit -a 1 wird dagegen festgelegt, dass der Smith-Waterman-Algorithmus zum Einsatz kommt (lokales Alignment). Mit der Option -r 3.0 wird eine obere RMSD-Wert- Grenze für die Überlagerung festgelegt, in diesem Fall 3Å. SalamiLite wird anschließend versuchen, die Proteine räumlich so gut zu überlagern, dass diese Grenze erreicht wird. Falls dies zunächst nicht gelingt, wird das Programm versuchen, die Paare von Aminosäuren im Alignment, welche die Überlagerung stören, möglichst nicht zu berücksichtigen, sondern stattdessen nur die wichtigsten Paare von Aminosäuren. Schauen Sie sich die Ausgabe des Alignments genau an: Die großen Buchstaben im Alignment geben an, dass diese Stellen bei der Überlagerung berücksichtigt wurden. Die mit kleinen Buchstaben gekennzeichneten Positionen wurden dagegen nicht berücksichtigt. Neben der Anzahl der berücksichtigten Aminosäure-Paare des Sequenzalignments finden Sie vor dem Alignment auch Informationen zum RMSD-Wert der Überlagerung sowie zur Sequenz-Identität. Öffnen Sie jetzt die Kooardinaten-Dateien 2CPF.pdb und 2bop_out.pdb in Chimera, um sich die Überlagerung anzuschauen. Wählen Sie nun eine besonders große Grenze für den RMSD-Wert aus (z.b. 10.0) und untersuchen Sie die neuen Dateien in Chimera. Ist es nun schwerer, die räumliche Überlagerung der Strukturen zu erkennen? 3

4. CATH CATH (eine Abkürzung von engl. Class, Architecture, Topology und Homologous superfamily) ist eine halbautomatische Klassifizierung von Proteinen: http://www.cathdb.info/ Bei dieser Klassifizierung werden Proteinsequenzen zunächst automatisch auf Grundlage ihrer Aminosäuresequenz klassifiziert und sogenannten homologen Überfamilien (Homologous superfamily) zugeordnet. Danach werden diese Überfamilien strukturbasiert in verschiedene topologische Gruppen einsortiert. Die Zuordnung zu einem Architektur-Level erfolgt manuell. Hierbei werden alle Topologien, welche die gleiche 3D-Strukturen bilden, zum selben Architektur-Level zusammengefasst. Diejenigen Architekturen, welche zu ähnlichen Anteilen aus den verschiedenen Sekundärstrukturelementen bestehen, werden wiederum derselben Klasse zugeordnet (alpha domains only, beta domains only, alpha and beta, ). Wir wollen nun versuchen, unsere Proteine in der CATH-Klassifikation zu finden. Besuchen Sie dafür mit dem Browser Ihrer Wahl die Website http://www.cathdb.info/search und geben Sie dort die PDB-Namen Ihrer Proteine ins Suchfeld ein. Auf der Ergebnisseite klicken Sie bitte auf den Eintrag unter "Matching CATH Domains" und notieren sich die wichtigsten Informationen über diese Familie. Sind die Proteine in der gleichen Klasse? Falls ja, warum ist das so? Welche Proteine gibt es in dieser Klasse? In Ihr Arbeitsverzeichnis structure_comparison haben Sie auch die Unterverzeichnisse 2/ und 3/ kopiert, welche jeweils ein weiteres Paar von Proteinen enthalten. Wiederholen Sie Ihre Analyse (DaliLight, SalamiLight, CATH) für diese zwei Proteinpaare. Sind 1tul und 2brq in der gleichen Klasse? Falls ja, warum? Hätten Sie dieses Proteinpaar gefunden, wenn Sie nur mit Hilfe der CATH-Klassifikation gearbeitet hätten? Wie würden Sie die strukturelle Ähnlichkeit bei einer derartig niedrigen Sequenzähnlichkeit erklären? 4

5. Aufgaben Bitte beantworten Sie die folgenden Fragen und bringen Sie Ihre Antworten zur Übung am 9. Januar 2017 mit. Der Zufall bestimmt, welche Studenten Ihre Lösungen präsentieren werden. 1. Welche Programme haben Sie für die strukturbasierte Suche von Proteinen verwendet? 2. Wofür benötigen wir strukturbasierte Alignments? Sind sequenzbasierte allein nicht ausreichend? 3. Wie kann man hohe strukturelle Ähnlichkeit bei sehr geringer bis nicht nachweisbarer Sequenzähnlichkeit erklären? 4. Welche Anforderungen sollten wir an ein Programm stellen, dass die strukturelle Überlagerung zweier Proteine ermittelt? 5. Was ist der RMSD-Wert? Ist der RMSD-Wert immer ausreichend, um die Qualität eines strukturbasierten Alignments zu beurteilen? 6. Welche Funktion haben f-dme- und Z-Score? 7. Informieren Sie sich über CATH, SCOP, FSSP und Pfam. Diskutieren Sie, welche Probleme bei solchen Klassifikationen auftauchen können. Ist eine dieser Klassifikationen ausreichend? Was spricht für ihre Verwendung? Fällt Ihnen auch ein Argument gegen die Verwendung einer Klassifikation von Proteindomänen ein? 8. Würden Sie eine andere Klassifikation vorschlagen und falls ja, wie würde diese aussehen? 5