MOL.504 Analyse von DNA- und Proteinsequenzen Übungsaufgaben BLAST-Sequenzsuche und -vergleiche
Ü6a blastn und blastx Verwenden Sie die in Übung 3 (Datenbanken) gefundene yqjm-sequenz aus Bacillus subtilis (>gi 255767013:2475843-2476859 Bacillus subtilis subsp. subtilis str. 168, complete genome) http://www.ncbi.nlm.nih.gov/nuccore/255767013?from=2475843&to=2476859&report=fasta für die Suche nach verwandten Sequenzen Blastn (gegen die nr-db, eingeschränkt auf Bacillus) - legen Sie ein *.txt-file mit den besten 5 HITS (jedoch nicht identische Hits i.e. Query coverage 100%, Identität 100%) - die Sequenzen sollten im FASTA-Format gespeichert sein: >name (ohne Leerzeichen dazwischen) ATGCTGACTC...
MOL.504 BLAST-Sequenzsuche und vergleiche MOL.504 BLAST-Sequenzsuche und vergleiche BLAST-Ergebnisseite detaillierte Auflistung der Alignments komplette ausgerichtete Sequenzen (Query & Subject), übereinander normalerweise mehrere Zeilen-Blöcke à 60 Buchstaben senkrechte Verbindung zeigt Identität an
MOL.504 BLAST-Sequenzsuche und vergleiche MOL.504 BLAST-Sequenzsuche und vergleiche BLAST-Ergebnisseite Manuelle Nachformatierung nach einzelnen Sequenzen (Einfügen von Absätzen) möglich Oder einzelnes Download (via Alignment-Ansicht siehe VL-Teil). Oder via Link zur NCBI (und Fasta Sequenz)
MOL.504 BLAST-Sequenzsuche und vergleiche MOL.504 BLAST-Sequenzsuche und vergleiche BLAST und FASTA - die Sequenzen sollten im FASTA-Format gespeichert sein: >name (ohne Leerzeichen dazwischen) ATGCTGACTC... >gi 225184640:2475843-2476859 Bacillus subtilis subsp. subtilis str. 168 complete genome ATGGCCAGAAAATTATTTACACCTATTACAATTAAAGATATGACGTTAAAAAACCGCATTGTCATGTCGC CAATGTGCATGTATTCTTCTCATGAAAAGGACGGAAAATTAACACCGTTCCACATGGCACATTACATATC GCGCGCAATCGGCCAGGTCGGACTGATTATTGTAGAGGCGTCAGCGGTTAACCCTCAAGGACGAATCACT GACCAAGACTTAGGCATTTGGAGCGACGAGCATATTGAAGGCTTTGCAAAACTGACTGAGCAGGTCAAAG AACAAGGTTCAAAAATCGGCATTCAGCTTGCCCATGCCGGACGTAAAGCTGAGCTTGAAGGAGATATCTT CGCTCCATCGGCGATTGCGTTTGACGAACAATCAGCAACACCTGTAGAAATGTCAGCAGAAAAAGTAAAA GAAACGGTCCAGGAGTTCAAGCAAGCGGCTGCCCGCGCAAAAGAAGCCGGCTTTGATGTGATTGAAATTC ATGCGGCGCACGGATATTTAATTCATGAATTTTTGTCTCCGCTTTCCAACCATCGAACAGATGAATATGG CGGCTCACCTGAAAACCGCTATCGTTTCTTGAGAGAGATCATTGATGAAGTCAAACAAGTATGGGACGGT CCTTTATTTGTCCGTGTATCTGCTTCTGACTACACTGATAAAGGCTTAGACATTGCCGATCACATCGGTT TTGCAAAATGGATGAAGGAGCAGGGTGTTGACTTAATTGACTGCAGCTCAGGCGCCCTTGTTCACGCAGA CATTAACGTATTCCCTGGCTATCAGGTCAGCTTCGCTGAGAAAATCCGTGAACAGGCGGACATGGCTACT GGTGCCGTCGGCATGATTACAGACGGTTCAATGGCTGAAGAAATTCTGCAAAACGGACGTGCCGACCTCA TCTTTATCGGCAGAGAGCTTTTGCGGGATCCATTTTTTGCAAGAACTGCTGCGAAACAGCTCAATACAGA GATTCCGGCCCCTGTTCAATACGAAAGAGGCTGGTAA >gi 2627063:242791-243807 Bacillus subtilis DNA, 283 Kb region containing skin element TTACCAGCCTCTTTCGTATTGAACAGGGGCCGGAATCTCTGTATTGAGCTGTTTCGCAGCAGTTCTTGCA AAAAATGGATCCCGCAAAAGCTCTCTGCCGATAAAGATGAGGTCGGCACGTCCGTTTTGCAGAATTTCTT CAGCCATTGAACCGTCTGTAATCATGCCGACGGCACCAGTAGCCATGTCCGCCTGTTCACGGATTTTCTC AGCGAAGCTGACCTGATAGCCAGGGAATACGTTAATGTCTGCGTGAACAAGGGCGCCTGAGCTGCAGTCA ATTAAGTCAACACCCTGCTCCTTCATCCATTTTGCAAAACCGATGTGATCGGCAATGTCTAAGCCTTTAT
Ü6b blastn und blastx Verwenden Sie die in Übung 3 gefundene yqjm-sequenz aus Bacillus subtilis (>gi 255767013:2475843-2476859 Bacillus subtilis subsp. subtilis str. 168, complete genome) http://www.ncbi.nlm.nih.gov/nuccore/255767013?from=2475843&to=2476859&report=fasta für die Suche nach verwandten Sequenzen Blastx gegen die nr-db und eingeschränkt auf yeast (vergleicht die Translationsprodukte einer Nukleotid-Query (6-Frame; beide Stränge im Fall von DNA) gegen eine Protein-DB) - legen Sie ein *.txt-file mit den jeweils besten 5 HITS an - die Sequenzen sollten im FASTA-Format gespeichert sein
Ü6b blastn und blastx Blastx gegen die nr-db und eingeschränkt auf yeast (vergleicht die Translationsprodukte einer Nukleotid-Query (6-Frame; beide Stränge im Fall von DNA) gegen eine Protein-DB) - legen Sie ein *.txt-file mit den jeweils besten 5 HITS an - die Sequenzen sollten im FASTA-Format gespeichert sein
Ü6b blastn und blastx
Ü6b blastn und blastx
Ü7 ClustalO und Phylogenetik Erstellen Sie ein Sequence-Alignment mit dem Programm ClustalO für die Proteinsequenz von YjqM aus Bacillus subtilis subsp. subtilis str. 168 mit den für die 5 FASTA-Sequenzen aus Ü6b ein http://www.ebi.ac.uk/tools/msa/clustalo/ Anleitung: Proteinsequenz YjqM im Fasta Format Direkt die multiplen Sequenzen im FASTA-Format aus der Textdatei in das Eingabefeld pasten..achtung: Was passiert mit Einträgen mit meheren gi Nummern?) Welche Output-Optionen gibt es?
Ü7 ClustalO und Phylogenetik Erstellen Sie ein Sequence-Alignment mit dem Programm ClustalO für die Proteinsequenz von YjqM aus Bacillus subtilis subsp. subtilis str. 168 Was bedeuten *, :,.? Was bedeuted die Farbcodierung?
Ü7 ClustalO und Phylogenetik Erstellen Sie ein Sequence-Alignment mit dem Programm ClustalO für die Proteinsequenz von YjqM aus Bacillus subtilis subsp. subtilis str. 168 Results Summary: Percent Identity Matrix: Was bedeutet die Diagonale (100) bzw die anderen Werte? Zeichnen Sie einen phylogenetischen Baum (phylogenetici tree): Überlegen sie den Unterschied in der Darstellung Cladogram und Real
Ü7 ClustalO und Phylogenetik (optional) Erstellen Sie für die insgesamt 10 FASTA-Sequenzen aus Ü6a/b ein Sequenz-Alignment mit dem Programm ClustalO Erstellen Sie einen phylogenetischen Baum mit ClustalW (Sind Unterschiede zwischen den Sequenzen aus der nrund der yeast-suche zu erkennen?)
Ü8 blastp Suchen Sie in blastp nach homologen Sequenzen zur Hydroxynitrillyase aus Hevea brasiliensis (HbHNL) schränken Sie die Suche auf Arabidopsis thaliana ein. aus verschiedenen Experimenten wissen Sie, dass im katalytischen Mechanismus der HbHNL die Aminosäuren Thr-11, Ser-80, Asp-207, His- 235 und Lys-236 eine wichtige Rolle spielen. welche Aminosäuren finden Sie in den homologen Arabidopsis-Sequenzen (drei erste Ergebnisse einer BLAST-Suche) an den äquivalenten Stellen?
Ü9 blastp / ClustalO oder Cobalt Welche signifikanten Sequenzmotive kann man in der Sequenz mit der accession number AAN73270 finden? Geben Sie zumindest eine accession number eines Sequenzmotivs an (ProSite- siehe Modul Datenbanken) machen Sie ein multiples Sequenzalignment mit 2 homologen Proteinen aus Pseudomonas. Welche signifikanten Sequenzmotive kann man in der Sequenz mit der accession number YP_702664 finden? Geben Sie zumindest eine accession number eines Sequenzmotivs an machen Sie ein multiples Sequenzalignment mit 2 homologen Proteinen aus Pseudomonas.
Ü10 Verschiedenes A Erstellen Sie ein Multiples-Sequenz-Alignment des Old Yellow Enzyme aus Geobacillus kaustophilus mit dem Protein der accession number YP_001126356 und dem YqjM aus Bacillus licheniformis. B Wie lautet die accession number jener Sequenz aus der Swissprot Datenbank, die die höchste Sequenzidentität zur Sequenz mit der accession number YP_049019 hat. wie hoch ist die Sequenzähnlichkeit? ist dieser Treffer der Blast-Suche signifikant?
Ü10 Verschiedenes C Identifizieren Sie die Herkunft folgender DNA-Sequenz mit Hilfe von Blastn (gegen die nr database): cttaacttct gttcctgcat atttagaata taatacttta tctcctattt taacttccat ctctgttctt tttccatcaa ctatcgctcc tggtcccact gcaacaacct ctgcttcttg tggtctttcc ttagcagttc cagtaactat tataccgctt ttagtagttt cttctgcttc zu welchem Gen und zu welchem Organismus gehört diese DNA- Sequenz? lassen Sie aus der Genomsequenz diesen Bereich + 2000 nt vor dem Beginn + 2000 nt nach dem Ende anzeigen bestimmen Sie die auf dieser gesamten Sequenz liegenden offenen Leserahmen
Ü10 Verschiedenes D Aus welchen Organismen stammen die Proteine: Cyp102A1,Cyp102A2, Cyp102A3? suchen Sie ein verwandtes Protein aus Gibberella moniliformis kodiert wird und nennen Sie die entsprechende database accession number der verwandten Proteinsequenz erstellen Sie ein multiples Sequence Alignment der 4 Proteinsequenzen stellen Sie die Ähnlichkeit untereinander als phylogenetischen Stammbaum dar