Phylogenetische Analyse

Ähnliche Dokumente
Zentrum für Bioinformatik. Übung 4: Revision. Beispielfragen zur Klausur im Modul Angewandte Bioinformatik (erste Semesterhälfte)

Aufgabe 7: Distanzbasierte Phylogenie: Neighbor Joining. Stefan Kröger, Philippe Thomas Wissensmanagement in der Bioinformatik

Übung 9: Molekulare Evolution II

Aufgabe 6: Distanzbasierte Phylogenie: Hierarchisches Clustering. Ulf Leser Wissensmanagement in der Bioinformatik

Gleichheit, Ähnlichkeit, Homologie

Einführung in die Bioinformatik

MOL.504 Analyse von DNA- und Proteinsequenzen. Übungsaufgaben BLAST-Sequenzsuche und -vergleiche

Einführung in die Angewandte Bioinformatik: Phylogenetik und Taxonomie

Bioinformatik für Lebenswissenschaftler

Bioinformatik Für Biophysiker

Evolution & Genetik (Beispiel Hämoglobin) Prof. Dr. Antje Krause FH Bingen / akrause@fh-bingen.de

Ihre Namen: Übung C: Phylogenetik I: Übungsaufgaben

Aufgabenblatt 5. Silke Trißl Wissensmanagement in der Bioinformatik

Multiple Alignments. Vorlesung Einführung in die Angewandte Bioinformatik Prof. Dr. Sven Rahmann. Webseite zur Vorlesung

BIOINFORMATIK I ÜBUNGEN.

Einführung in die Angewandte Bioinformatik: Multiples Alignment und Phylogenetik

Übungsaufgaben zur Einführung in die Bioinformatik - Lösungen

Primärstruktur. Wintersemester 2011/12. Peter Güntert

Bioinformatische Suche nach pre-mirnas

Bioinformatik II: Phylogenetik

Übungen zur Vorlesung Algorithmische Bioinformatik

Übungen für die 1. Schularbeit 5. Klassen

MOL.504 Analyse von DNA- und Proteinsequenzen. Übungsaufgaben Datenbanken und Informationssysteme

Eine Detailsuche in der Cochrane Library

Ihre Namen: Gruppe: Öffnen Sie die Fasta-Dateien nur mit einem Texteditor, z.b. Wordpad oder Notepad, nicht mit Microsoft Word oder Libre Office.

Grundlagen der Bioinformatik Allgemeines/Übung 1 SS Yvonne Lichtblau

1/10. Ihre Namen: Gruppe: Evolutionsbiologie 2, WS2015/2016: Bioinformatik - Übung 1

Was ist Bioinformatik?

Welche Alignmentmethoden haben Sie bisher kennengelernt?

Informationstechnologie in der Pflanzenzüchtung. Biocomputing in einem Züchtungsunternehmen. Andreas Menze KWS SAAT AG, Einbeck

Modul 8: Bioinformatik A. Von der DNA zum Protein Proteinsynthese in silicio

Phylogenetik. Vorlesung Einführung in die Angewandte Bioinformatik Prof. Dr. Sven Rahmann. Webseite zur Vorlesung

Name des Servers auf dem die Produktiv-IL-Datenbank läuft. Name des Servers auf dem die Test-IL- Datenbank läuft

TreeTOPS. Ein Phylogenetik-Icebreaker Spiel. Lehrer- Handbuch. ELLS Europäisches Lernlabor für die Lebenswissenschaften

Datenstrukturen und Algorithmen (SS 2013)

Bioinformatik. BLAST Basic Local Alignment Search Tool. Ulf Leser Wissensmanagement in der. Bioinformatik

Darwins Erben - Phylogenie und Bäume

Übungsaufgaben Sequezvergleich mit Alignment Studenten-Version mit Lösungen

Bioinformatik Für Biophysiker

Evolutionäre Bäume. Madox Sesen. 30. Juni 2014

Übung 7: Die Proteindatenbank (PDB) und Vergleiche von Proteinstrukturen

MBI: Sequenz-Vergleich mit Alignment

Informationsvisualisierung

Rekonstruktion von Evolutionärer Geschichte

Schreibe ein Programm, das den AT Gehalt diese DNA Sequenz berechnet. Hinweis: A-Gehalt plus T-Gehalt bezogen auf die gesamte Sequenz.

Quelle Gen: GK-120F

Posten 1: Die Vielfalt

Übung - Konfigurieren der Browser-Einstellungen in Windows 7

Outlook Web Access (OWA) für UKE Mitarbeiter

Fussballbilder Anleitung

Projektgruppe. Text Labeling mit Sequenzmodellen

Einführung in die Angewandte Bioinformatik: Algorithmen und Komplexität; Multiples Alignment und

Übungen zu Algorithmische Bioinformatik

MOL.504 Analyse von DNA- und Proteinsequenzen. Datenbanken & Informationssysteme

Pairwise Alignment. Steffen Forkmann. Proseminar: BioInformatik

MOL.504 Analyse von DNA- und Proteinsequenzen. Modul 2 BLAST-Sequenzsuche und Sequenzvergleiche

Sequenz Alignment Teil 2

NAFI Online-Spezial. Kunden- / Datenverwaltung. Mehr Infos unter:

Unterlagen zu: Das Datenanalysesystem SAS SS 2000

Dokumentieren mit Eclipse und Doxygen

Anleitung zum Erkennen funktioneller Gruppen

Evolutionsbiologie 1 Phylogenetik Sebastian Höhna

Phylogenetische Bäume Kieu Trinh Do SS 2009

STATA II: Daten- und Analysevorbereitung (Teil 1)

Biowissenschaftlich recherchieren

Bioinformatik. Profilalignment und PSI Blast Center-Star Verfahren Progressives MSA CLUSTAL W. Ulf Leser Wissensmanagement in der.

Informationsmaterial Resistenz gegen HIV Recherche und Analyse molekularer Daten

Anleitung. Zur Erstellung einer Datentabelle und eines Säulendiagramms mit Microsoft Office Excel

Videos aus der mebis-mediathek über H5P mit interaktiven Elementen versehen

Algorithmen I. Tutorium Sitzung. Dennis Felsing

Die neue Internetsuche bei MyHeritage

Studiengang Informatik der FH Gießen-Friedberg. Sequenz-Alignment. Jan Schäfer. WS 2006/07 Betreuer: Prof. Dr. Klaus Quibeldey-Cirkel

Mein Weg zur Schule im Bayern-Atlas

Einführung in das Programmieren

Übungsaufgabe zu PowerPoint Übungsbeispiel: Hamburg in Bildern (3 Folien)

Einführung in die Angewandte Bioinformatik: Proteinsequenz-Datenbanken

Transkript:

Bioinformatik I - Uebung Phylogenetische Analyse Wenn nicht anders angegeben verwende die Standard-Einstellungen der Programme Hintergrund: Die Schwämme (Phylum Porifera) gehören zu den den ältesten lebenden multizellulären Lebewesen auf unserem Planeten. Ökonomisch und ökologisch gesehen sind sie die mit am weitesten entwickelten Lebensformen auf diesem Planet. (Quelle: http://de.wikipedia.org/wiki/bild:vaasspons2.jpg) Aufgabe: Da du begeisterter Schwammforscher bist, mietest du dir ein Uboot, um nach Schwämmen zu tauchen und diese anhand phylogenetischer Bäume zu klassifizieren. Auf dem Meeresgrund hast du nun Gewebeproben von einem Schwamm genommen, konservierst sie in Ethanol und sequenzierst ein Gen nach der Rückehr im heimischen Labor. Folgende Gensequenz konntest du dabei ermitteln: >unknown_sponge GACATTTCGCGGTATTGTAAAGCCAGGATCTTTGAGCGCGTTGGCAAGCGTACACCGCTGGCCGTGCGCTTC TCCACTGTTGGCGGAGAATCCGGTAGCGCCGATACCGTCCGTGATCCCCGTGGCTTTGCTGTCAAGTTCTAC ACTGAGGAAGGCATCTGGGATTTGGTAGGAAACAACACTCCGATTTTCTTCATCCGTGATCCCATACTGTTT CCCAGCTTCATTCACACGCAGAAGCGCAATCCTCAAACTCATCTTAAGGACGCTGATATGTTTTGGGACTTC ATTTCCCTTCGCCCCGAGACCACCCATCAGGTGTCGTTTCTCTTCAGTGACCGTGGCATCCCTGACGGTTAT CGTCACATGAACGGCTACGGCAGCCACACGTTTAAGCTAGTCAACAAGCAGGACAGGCCAGTGTACTGCAAG TTCCACTACAAGACCGACCAGGGCGTTCAGAACATGCCAGTGGACCGCGCTGCTCAGCTGGCCAGCGCCGAC CCGGACTACAGCATCCGTGACCTCTTTGAGAGCATCGCCCAGAATAACAGCCCATCGTGGACTATGTACTTG CAAGTTATGACATTTGAGCAAGCTGAGCAGCTCAAGTGGAACCCCTTTGACTTGACCAAGATCTGGCCGCAC AAGGAGTTTCCGCTGATTCAGGTTGGCAAGCTGGTGCTGAACCGCAACCCGAGGAACTATTTTGCCGAAGTG GAGCAGCTGGCCTTCTCTCCCGCGCACATGGTGCCTGGTATTGAGCCGTCGCCAGACAAGATGTTGCAGGGC

Ein typischer allgemeine Ablauf einer phylogenetischen Analyse ist wie folgt: Nimm die DNA Sequenz, ueber die du mehr herausfinden moechtest, suche mittels BLAST in Genbank nach homologen Genen (in unserem Fall bei den Schwämmen), berechne daraus ein multiples Sequenzalignment und rekonstruiere anschliessend einen phylogenetischen Baum. Aufgabe 1: Homologensuche Bei dieser Aufgabe werden wir zu einer DNA Sequenz Homologe suchen 1. Gehe zu http://www.ncbi.nlm.nih.gov/blast/ und fuehre eine BLAST-Suche mit dieser Sequenz in der non-redundant Datenbank durch. Wähle blastn unter Program selection. 2. Schau dir sowohl die Ergebnisseite der Suche als auch den Taxonomy Bericht dazu an (Link Taxonomy) und versuche dir einen Uberblick über das Ergebnis der BLAST-Suche zu verschaffen. 3. Auf der Ergebnisseite siehst du Treffer vieler verschiedener Arten (Der Artname steht neben jedem Treffer). Wähle alle Schwämme und als Außengruppe Asterina miniata (Starfish Seestern). 4. Oeffne jeden der Treffer in einem neuen Fenster/Tab und lass dir jeweils das FASTA anzeigen. 5. Oeffne nun einen Texteditor (z.b. Gedit) und kopiere alle Sequenzen untereinander. 6. Passe nun den Header jeder Sequenz wie in der letzten Uebung an. Beispiel: >gi 71370875 gb DQ087467.1 Leucosolenia sp. KP 2005 catalase mrna, partial cds zu >Leucosolenia_sp_gi_71370875 Warum sollte man das tun?

Was war der beste BLAST-Treffer? In wievielen Schwämmen wurde ein potentielles homologes Gen gefunden? Welches Gen scheinst du sequenziert zu haben? Aufgabe 2: Multiples Sequenz Alignment Die bei Aufgabe 1 erhaltenen DNA Sequenzen sollen nun mit ClustalW aligniert werden (vgl. Aufgaben zu Alignment). 1. Klicke im Ergebnis auf Alignment file, um dir das Alignment anzeigen zu lassen. 2. Kopiere die komplette Seite in einen Texteditor. Mit welcher anderen Sequenz erzielte die unbekannte Sequenz den höchsten Score? Aufgabe 3: Einen phylogenetischen Baum konstrurieren Um aus einem Alignment einen Baum zu berechnen, gibt es verschiedene Methoden. Wir werden im folgenden einen Maximum Likelihood Baum rekonstruieren. 1. Gehe auf das Webinterface des Programmpakets Phylip unter http://bioweb.pasteur.fr/seqanal/phylogeny/phylip-uk.html 2. Klicke fastdnaml unter Programs for molecular sequence data, um aus dem Alignment eine Distanzmatrix zu berechnen. 3. Gib deine Emailadresse (muss keine gueltige sein) und das Alignment ein und druecke Run fastdnaml alternative ULR: http://cbi.labri.fr/outils/pise/fastdnaml.html 4. Nachdem das Ergebnis da ist, kannst du dir unter treefile den berechneten ungewurzelten (unrooted) phylogenetischen Baum ansehen. 5. Speichere das treefile in einem Editor (oder lass das Browserfenster einfach offen), da du es später noch brauchen wirst Aufgabe 4: Rooted vs. unrooted Tree Ein gewurzelter (rooted) phylogenetischer Baum ist ein gerichteter Baum mit einem einzelnen Knoten, der dem nächsten gemeinsamen Vorfahren aller Organismen

(Gene) im Baum entspricht, während ein ungewurzelter (unrooted) Baum keinen ausgezeichneten nächsten gemeinsamen Vorfahren besitzt, sondern soll lediglich die Verwandtschaftsnähe oder -ferne der einzelnen Arten darstellen. (Quelle: http://www.bioinf2.leeds.ac.uk/msc2004/trees.gif) Da wir aber konkret an eben dieser Vorgänger-Nachfolger-Beziehung interessiert sind, werden wir den ungewurzelten Baum wurzeln Um die Unterschiede zwischen gewurzelten und ungewurzelten Bäumen deutlich zu machen fahren wir wie folgt mit dem in Aufgabe 3 berechneten Baum fort: 1. Klicke auf der Resultseite von Aufgabe 3 Run the selected program on outtree. Auf der folgenden Seite klickst du auf Advanced consense form und gibts du unter Other options die Nummer der Outgroup-Sequenz im treefile. 2. Drücke Run consense um den Baum zu wurzeln 3. Speichere auch den gewurzelten Ergebnisbaum (outtree). Aufgabe 5: Den Baum betrachten In dieser Aufgabe wollen wir uns die erzeugten Baeume anschauen und analysieren. 1. Gehe zu http://cgi-www.daimi.au.dk/cgi-chili/phyfi/go und kopiere den Baum in das Textfeld. 2. Druecke Draw, um den Baum anzeigen zu lassen. (Bei Bedarf kannst du den Baum nun als png speichern.) 3. Mache das gleiche nun fuer den anderen gespeicherten Baum aus. Handelt es sich bei dem sequenzierten Tier um einen Schwamm? Mit welchem Schwamm ist das unbekannte Tier am nächsten verwandt?

Anmerkung Der ungewurzelte Baum stellt nur eine Gruppierung der Daten dar. Es ist nicht möglich eine Vorgänger-Nachfolger-Beziehung abzulesen. Die Schwämme bilden in diesem Baum keine monophyletische Gruppe und widersprechen damit bekanntem Wissen. Generell sollte man gewurzelte Bäume bevorzugen, da die Vorgänger-Nachfolger-Beziehung sehr wichtig bei der Analyse von Verwandtschaftsbeziehungen ist. Im gewurzelten Baum lassen sich Vorgänger-Nachfolger-Beziehungen ablesen So lässt sich beispielsweise sagen, dass A der gemeinsame Vorfahre von den Schwämmen und der Seesterne war. B zeigt, dass die Schwämme eine monophyletische Gruppe bilden und C zeigt, dass es sich bei dem gesuchten Organismus tatsächlich um einen Schwamm hat und dieser am nächsten mit dem Schwamm Leucosolenia ist.