MOL.504 Analyse von DNA- und Proteinsequenzen. Übungsaufgaben BLAST-Sequenzsuche und -vergleiche



Ähnliche Dokumente
MOL.504 Analyse von DNA- und Proteinsequenzen. Modul 2 BLAST-Sequenzsuche und Sequenzvergleiche

Gleichheit, Ähnlichkeit, Homologie

MOL.504 Analyse von DNA- und Proteinsequenzen. Übungsaufgaben Datenbanken und Informationssysteme

Zentrum für Bioinformatik. Übung 4: Revision. Beispielfragen zur Klausur im Modul Angewandte Bioinformatik (erste Semesterhälfte)

MOL.504 Analyse von DNA- und Proteinsequenzen. Datenbanken & Informationssysteme

Phylogenetische Analyse

Was ist Bioinformatik?

Primärstruktur. Wintersemester 2011/12. Peter Güntert

1/10. Ihre Namen: Gruppe: Evolutionsbiologie 2, WS2015/2016: Bioinformatik - Übung 1

MOL.504 Analyse von DNA- und Proteinsequenzen

Bioinformatik. BLAST Basic Local Alignment Search Tool. Ulf Leser Wissensmanagement in der. Bioinformatik

Übungsaufgaben zur Einführung in die Bioinformatik - Lösungen

Softwarewerkzeuge der Bioinformatik

Ihre Namen: Gruppe: Öffnen Sie die Fasta-Dateien nur mit einem Texteditor, z.b. Wordpad oder Notepad, nicht mit Microsoft Word oder Libre Office.

Alignments & Datenbanksuchen

MBI: Sequenz-Vergleich mit Alignment

Evolution & Genetik (Beispiel Hämoglobin) Prof. Dr. Antje Krause FH Bingen / akrause@fh-bingen.de

Alignments & Datenbanksuchen

Bioinformatik. BLAST Basic Local Alignment Search Tool. Ulf Leser Wissensmanagement in der. Bioinformatik

Klausur Bioinformatik für Biotechnologen

Vorlesung Einführung in die Bioinformatik

Modul 8: Bioinformatik A. Von der DNA zum Protein Proteinsynthese in silicio

BCDS Seminar. Protein Tools

Einführung in die Angewandte Bioinformatik: Proteinsequenz-Datenbanken

Aufgabe 7: Distanzbasierte Phylogenie: Neighbor Joining. Stefan Kröger, Philippe Thomas Wissensmanagement in der Bioinformatik

Bioinformatik für Biochemiker

Bioinformatik II: Phylogenetik

Übungsaufgaben Sequezvergleich mit Alignment Studenten-Version mit Lösungen

Aufgabe 6: Distanzbasierte Phylogenie: Hierarchisches Clustering. Ulf Leser Wissensmanagement in der Bioinformatik

BIOINFORMATIK I ÜBUNGEN.

Protokoll Versuch D2 Bioinformatik

Aufgabenblatt 5. Silke Trißl Wissensmanagement in der Bioinformatik

VL Algorithmische BioInformatik (19710) WS2013/2014 Woche 3 - Montag

Perl-Praxis. BioPerl. Jörn Clausen, Jan Krüger Jens Reeder, Alex Sczyrba. AG Praktische Informatik Technische Fakultät Universität Bielefeld

V2 Paarweises Sequenzalignment

Bioinformatik Für Biophysiker

7. Anhang. 7. Anhang. Abbildung 7.1: Aminosäuresequenz AtMYC2 im Wildtyp und in jin1. Unterschiede zwischen den Sequenzen sind rot unterlegt.

Übung 9: Molekulare Evolution II

Allgemeine Aufgabenstellung. Ziele

Bioinformatik für Lebenswissenschaftler

Informationstechnologie in der Pflanzenzüchtung. Biocomputing in einem Züchtungsunternehmen. Andreas Menze KWS SAAT AG, Einbeck

Einführung in die Bioinformatik

BIOINF 1910 Bioinforma1k für Lebenswissenscha;ler Oliver Kohlbacher Datenbanksuche Problem Beispiele

Übung 1 Bioinformatik. Ihre Namen:

Informationsvisualisierung

Inhalt 1 Modellorganismen

Inhalt. Datenbanksuche. BIOINF 1910 Bioinforma1k für Lebenswissenscha;ler. Datenbanksuche

BLAST. Ausarbeitung zum Proseminar Vortag von Nicolás Fusseder am

DATENQUALITÄT IN GENOMDATENBANKEN

Bioinformatik. Substitutionsmatrizen BLAST. Ulf Leser Wissensmanagement in der. Bioinformatik

Übungen zur Vorlesung Molekularbiologische Datenbanken. Lösungsblatt 1: Datenbanksuche

Attached! Proseminar Netzwerkanalyse SS 2004 Thema: Biologie

MOL.504 Analyse von DNA- und Proteinsequenzen

Bioinformatische Suche nach pre-mirnas

Proseminar Bioinformatik

Übung 6: Structure Comparison 1

V2 Paarweises Sequenzalignment

V2 Paarweises Sequenzalignment

Einführung in die Angewandte Bioinformatik: Sequenzähnlichkeit, Alignment, BLAST

Sequenzvergleich und Datenbanksuche

Grundlagen der Bioinformatik Assignment 3: Hierarchical Clustering SS Yvonne Lichtblau/Johannes Starlinger

Comperative Protein Structure Modelling of Genes and Genomes

27 Funktionelle Genomanalysen Sachverzeichnis

Quelle Gen: GK-120F

Genannotation bei Prokaryoten

Übung 7: Die Proteindatenbank (PDB) und Vergleiche von Proteinstrukturen

Alignments & Datenbanksuchen

Quantifizierung evolutionärer Veränderungen

Schreibe ein Programm, das den AT Gehalt diese DNA Sequenz berechnet. Hinweis: A-Gehalt plus T-Gehalt bezogen auf die gesamte Sequenz.

Bioinformatik Für Biophysiker

Vom Gen zum Naturstoff!

mrna S/D UTR: untranslated region orf: open reading frame S/D: Shine-Dalgarno Sequenz

Bioinformatik: Schnittstelle zwischen Informatik und Life-Science

Klassen und Objekte. Klassen und Objekte

Pairwise Alignment. Steffen Forkmann. Proseminar: BioInformatik

Übung II. Einführung, Teil 1. Arbeiten mit Ensembl

Sequenz Alignment Teil 2

Biowissenschaftlich recherchieren

Softwarewerkzeuge der. Bioinformatik

Molekularbiologische Datenbanken

Algorithmische Bioinformatik

P. vivax : (Mensch); hat molekularbiologisch keine enge Verwandtschaft mit P. ovale.

Alignment von DNA- und Proteinsequenzen

Bioinformatik für Lebenswissenschaftler

Bioinformatik für Lebenswissenschaftler

Informationsmaterial Resistenz gegen HIV Recherche und Analyse molekularer Daten

Verbesserung der dotplot Methode

Softwarewerkzeuge der Bioinformatik

MBI: Sequenzvergleich ohne Alignment

Bioinformatik an der FH Bingen

Paarweises Sequenzalignment

Praktikum der Molekulargenetik

Transkript:

MOL.504 Analyse von DNA- und Proteinsequenzen Übungsaufgaben BLAST-Sequenzsuche und -vergleiche

Ü6a blastn und blastx Verwenden Sie die in Übung 3 (Datenbanken) gefundene yqjm-sequenz aus Bacillus subtilis (>gi 255767013:2475843-2476859 Bacillus subtilis subsp. subtilis str. 168, complete genome) http://www.ncbi.nlm.nih.gov/nuccore/255767013?from=2475843&to=2476859&report=fasta für die Suche nach verwandten Sequenzen Blastn (gegen die nr-db, eingeschränkt auf Bacillus) - legen Sie ein *.txt-file mit den besten 5 HITS (jedoch nicht identische Hits i.e. Query coverage 100%, Identität 100%) - die Sequenzen sollten im FASTA-Format gespeichert sein: >name (ohne Leerzeichen dazwischen) ATGCTGACTC...

MOL.504 BLAST-Sequenzsuche und vergleiche MOL.504 BLAST-Sequenzsuche und vergleiche BLAST-Ergebnisseite detaillierte Auflistung der Alignments komplette ausgerichtete Sequenzen (Query & Subject), übereinander normalerweise mehrere Zeilen-Blöcke à 60 Buchstaben senkrechte Verbindung zeigt Identität an

MOL.504 BLAST-Sequenzsuche und vergleiche MOL.504 BLAST-Sequenzsuche und vergleiche BLAST-Ergebnisseite Manuelle Nachformatierung nach einzelnen Sequenzen (Einfügen von Absätzen) möglich Oder einzelnes Download (via Alignment-Ansicht siehe VL-Teil). Oder via Link zur NCBI (und Fasta Sequenz)

MOL.504 BLAST-Sequenzsuche und vergleiche MOL.504 BLAST-Sequenzsuche und vergleiche BLAST und FASTA - die Sequenzen sollten im FASTA-Format gespeichert sein: >name (ohne Leerzeichen dazwischen) ATGCTGACTC... >gi 225184640:2475843-2476859 Bacillus subtilis subsp. subtilis str. 168 complete genome ATGGCCAGAAAATTATTTACACCTATTACAATTAAAGATATGACGTTAAAAAACCGCATTGTCATGTCGC CAATGTGCATGTATTCTTCTCATGAAAAGGACGGAAAATTAACACCGTTCCACATGGCACATTACATATC GCGCGCAATCGGCCAGGTCGGACTGATTATTGTAGAGGCGTCAGCGGTTAACCCTCAAGGACGAATCACT GACCAAGACTTAGGCATTTGGAGCGACGAGCATATTGAAGGCTTTGCAAAACTGACTGAGCAGGTCAAAG AACAAGGTTCAAAAATCGGCATTCAGCTTGCCCATGCCGGACGTAAAGCTGAGCTTGAAGGAGATATCTT CGCTCCATCGGCGATTGCGTTTGACGAACAATCAGCAACACCTGTAGAAATGTCAGCAGAAAAAGTAAAA GAAACGGTCCAGGAGTTCAAGCAAGCGGCTGCCCGCGCAAAAGAAGCCGGCTTTGATGTGATTGAAATTC ATGCGGCGCACGGATATTTAATTCATGAATTTTTGTCTCCGCTTTCCAACCATCGAACAGATGAATATGG CGGCTCACCTGAAAACCGCTATCGTTTCTTGAGAGAGATCATTGATGAAGTCAAACAAGTATGGGACGGT CCTTTATTTGTCCGTGTATCTGCTTCTGACTACACTGATAAAGGCTTAGACATTGCCGATCACATCGGTT TTGCAAAATGGATGAAGGAGCAGGGTGTTGACTTAATTGACTGCAGCTCAGGCGCCCTTGTTCACGCAGA CATTAACGTATTCCCTGGCTATCAGGTCAGCTTCGCTGAGAAAATCCGTGAACAGGCGGACATGGCTACT GGTGCCGTCGGCATGATTACAGACGGTTCAATGGCTGAAGAAATTCTGCAAAACGGACGTGCCGACCTCA TCTTTATCGGCAGAGAGCTTTTGCGGGATCCATTTTTTGCAAGAACTGCTGCGAAACAGCTCAATACAGA GATTCCGGCCCCTGTTCAATACGAAAGAGGCTGGTAA >gi 2627063:242791-243807 Bacillus subtilis DNA, 283 Kb region containing skin element TTACCAGCCTCTTTCGTATTGAACAGGGGCCGGAATCTCTGTATTGAGCTGTTTCGCAGCAGTTCTTGCA AAAAATGGATCCCGCAAAAGCTCTCTGCCGATAAAGATGAGGTCGGCACGTCCGTTTTGCAGAATTTCTT CAGCCATTGAACCGTCTGTAATCATGCCGACGGCACCAGTAGCCATGTCCGCCTGTTCACGGATTTTCTC AGCGAAGCTGACCTGATAGCCAGGGAATACGTTAATGTCTGCGTGAACAAGGGCGCCTGAGCTGCAGTCA ATTAAGTCAACACCCTGCTCCTTCATCCATTTTGCAAAACCGATGTGATCGGCAATGTCTAAGCCTTTAT

Ü6b blastn und blastx Verwenden Sie die in Übung 3 gefundene yqjm-sequenz aus Bacillus subtilis (>gi 255767013:2475843-2476859 Bacillus subtilis subsp. subtilis str. 168, complete genome) http://www.ncbi.nlm.nih.gov/nuccore/255767013?from=2475843&to=2476859&report=fasta für die Suche nach verwandten Sequenzen Blastx gegen die nr-db und eingeschränkt auf yeast (vergleicht die Translationsprodukte einer Nukleotid-Query (6-Frame; beide Stränge im Fall von DNA) gegen eine Protein-DB) - legen Sie ein *.txt-file mit den jeweils besten 5 HITS an - die Sequenzen sollten im FASTA-Format gespeichert sein

Ü6b blastn und blastx Blastx gegen die nr-db und eingeschränkt auf yeast (vergleicht die Translationsprodukte einer Nukleotid-Query (6-Frame; beide Stränge im Fall von DNA) gegen eine Protein-DB) - legen Sie ein *.txt-file mit den jeweils besten 5 HITS an - die Sequenzen sollten im FASTA-Format gespeichert sein

Ü6b blastn und blastx

Ü6b blastn und blastx

Ü7 ClustalO und Phylogenetik Erstellen Sie ein Sequence-Alignment mit dem Programm ClustalO für die Proteinsequenz von YjqM aus Bacillus subtilis subsp. subtilis str. 168 mit den für die 5 FASTA-Sequenzen aus Ü6b ein http://www.ebi.ac.uk/tools/msa/clustalo/ Anleitung: Proteinsequenz YjqM im Fasta Format Direkt die multiplen Sequenzen im FASTA-Format aus der Textdatei in das Eingabefeld pasten..achtung: Was passiert mit Einträgen mit meheren gi Nummern?) Welche Output-Optionen gibt es?

Ü7 ClustalO und Phylogenetik Erstellen Sie ein Sequence-Alignment mit dem Programm ClustalO für die Proteinsequenz von YjqM aus Bacillus subtilis subsp. subtilis str. 168 Was bedeuten *, :,.? Was bedeuted die Farbcodierung?

Ü7 ClustalO und Phylogenetik Erstellen Sie ein Sequence-Alignment mit dem Programm ClustalO für die Proteinsequenz von YjqM aus Bacillus subtilis subsp. subtilis str. 168 Results Summary: Percent Identity Matrix: Was bedeutet die Diagonale (100) bzw die anderen Werte? Zeichnen Sie einen phylogenetischen Baum (phylogenetici tree): Überlegen sie den Unterschied in der Darstellung Cladogram und Real

Ü7 ClustalO und Phylogenetik (optional) Erstellen Sie für die insgesamt 10 FASTA-Sequenzen aus Ü6a/b ein Sequenz-Alignment mit dem Programm ClustalO Erstellen Sie einen phylogenetischen Baum mit ClustalW (Sind Unterschiede zwischen den Sequenzen aus der nrund der yeast-suche zu erkennen?)

Ü8 blastp Suchen Sie in blastp nach homologen Sequenzen zur Hydroxynitrillyase aus Hevea brasiliensis (HbHNL) schränken Sie die Suche auf Arabidopsis thaliana ein. aus verschiedenen Experimenten wissen Sie, dass im katalytischen Mechanismus der HbHNL die Aminosäuren Thr-11, Ser-80, Asp-207, His- 235 und Lys-236 eine wichtige Rolle spielen. welche Aminosäuren finden Sie in den homologen Arabidopsis-Sequenzen (drei erste Ergebnisse einer BLAST-Suche) an den äquivalenten Stellen?

Ü9 blastp / ClustalO oder Cobalt Welche signifikanten Sequenzmotive kann man in der Sequenz mit der accession number AAN73270 finden? Geben Sie zumindest eine accession number eines Sequenzmotivs an (ProSite- siehe Modul Datenbanken) machen Sie ein multiples Sequenzalignment mit 2 homologen Proteinen aus Pseudomonas. Welche signifikanten Sequenzmotive kann man in der Sequenz mit der accession number YP_702664 finden? Geben Sie zumindest eine accession number eines Sequenzmotivs an machen Sie ein multiples Sequenzalignment mit 2 homologen Proteinen aus Pseudomonas.

Ü10 Verschiedenes A Erstellen Sie ein Multiples-Sequenz-Alignment des Old Yellow Enzyme aus Geobacillus kaustophilus mit dem Protein der accession number YP_001126356 und dem YqjM aus Bacillus licheniformis. B Wie lautet die accession number jener Sequenz aus der Swissprot Datenbank, die die höchste Sequenzidentität zur Sequenz mit der accession number YP_049019 hat. wie hoch ist die Sequenzähnlichkeit? ist dieser Treffer der Blast-Suche signifikant?

Ü10 Verschiedenes C Identifizieren Sie die Herkunft folgender DNA-Sequenz mit Hilfe von Blastn (gegen die nr database): cttaacttct gttcctgcat atttagaata taatacttta tctcctattt taacttccat ctctgttctt tttccatcaa ctatcgctcc tggtcccact gcaacaacct ctgcttcttg tggtctttcc ttagcagttc cagtaactat tataccgctt ttagtagttt cttctgcttc zu welchem Gen und zu welchem Organismus gehört diese DNA- Sequenz? lassen Sie aus der Genomsequenz diesen Bereich + 2000 nt vor dem Beginn + 2000 nt nach dem Ende anzeigen bestimmen Sie die auf dieser gesamten Sequenz liegenden offenen Leserahmen

Ü10 Verschiedenes D Aus welchen Organismen stammen die Proteine: Cyp102A1,Cyp102A2, Cyp102A3? suchen Sie ein verwandtes Protein aus Gibberella moniliformis kodiert wird und nennen Sie die entsprechende database accession number der verwandten Proteinsequenz erstellen Sie ein multiples Sequence Alignment der 4 Proteinsequenzen stellen Sie die Ähnlichkeit untereinander als phylogenetischen Stammbaum dar