Softwarewerkzeuge der Bioinformatik
|
|
- Gabriel Diefenbach
- vor 6 Jahren
- Abrufe
Transkript
1 Bioinformatik Wintersemester 2006/2007 Tutorial 2: paarweise Sequenzaligments BLAST Tutorial 2: BLAST 1/22
2 Alignment Ausrichten zweier oder mehrerer Sequenzen, um: ihre Ähnlichkeit quantitativ zu erfassen einzelne Bausteine zuzuordnen Gesetzmäßigkeiten der Konservierung und Variabilität zu beobachten Rückschlüsse auf entwicklungsgeschichtliche Verwandschaftsverhältnisse zu ziehen Struktur und Funktion zuordnen zu können in Datenbanken ähnliche Sequenzen zu suchen Gap = Indel = Insertion oder Deletion Tutorial 2: BLAST 2/22
3 Gleichheit, Ähnlichkeit, Homologie Identität (identity) Verhältnis der Anzahl identischer Aminosäuren zur Gesamtzahl der Aminosäuren; objektiv Ähnlichkeit (similarity) Verhältnis ähnlicher Aminosäuren (Austauschmatrizen) Maß der Ähnlichkeit ist modellbehaftet Homologie (homology) Sequenzen haben eine gemeinsame Vorläufersequenz nur möglich durch Vergleich vieler Sequenzen: was sind signifikante gemeinsame Merkmale? "bewertete Ähnlichkeit": Maß der Homologie ist modellbehaftet, kann nicht in % angegeben werden! Tutorial 2: BLAST 3/22
4 verschiedene Arten von Homologie Organismus X A Organismus # Ħ Organismus Y A B Organismus Z a Ħ A-a: Orthologe Gene in unterschiedlichen Organismen gleiche Funktion entstanden durch Artenbildung (speciation) A-B: Paraloge Gene im gleichen Organismus können unterschiedliche Funktion haben entstanden durch Genduplikation Ħ-Ħ: Xenologe Gene durch horizontalen Gentransfer erworben Bsp.: Resistenzgene auf Plasmiden B-Ħ: Analoge Gene: nicht homologe Sequenz, sondern zufällige Ähnlichkeit, entstanden durch Konvergenz; gleiche/ähnliche Funktion Tutorial 2: BLAST 4/22
5 Bewertung von Ähnlichkeit DNA oft nur Unterscheidung identisch/nicht identisch Substitutionen sind unterschiedlich wahrscheinlich: Transition (häufig) Purin-Purin (A-G) Pyrimidin-Pyrimidin (C-T), besonders bei 5-Methyl-Cytosin Transversion (selten) NH Purin-Pyrimidin (A-C, A-T, G-C, G-T) 2 CH N 3 Gaps = Indels im codierenden Bereich : O N Leserahmenverschiebung! H Proteine Codon-basiert: "zurückrechnen" auf DNA-Ebene. Nicht jede AS kann direkt zu jeder anderen werden, evtl. Umweg nötig chemische Ähnlichkeit der Aminosäuren (Substitutions- = Austauschmatrizen) verschiedene Gap-Kosten Tutorial 2: BLAST 5/22
6 Aminosäuren-Substitutionsmatrizen zur Bewertung der Qualität eines Alignments Score ist die Summe aller Bewertungen für die Paare an allen Positionen des Alignments einige Aminosäuren (meist kleine) weisen grundsätzlich hohe Mutationsraten auf: "unwichtig" für Funktion und Struktur Aminosäure ändert sich, die chemischen Eigenschaften aber bleiben gleich: geringe Strafe Funktion und/oder Faltung eines Proteins ändern sich bei Austausch von His (H), Trp (W), Pro (P), Cys (C): hohe Scores für die Erhaltung solcher Residuen Austausch von ähnlichen Residuen, z. B. Ile (I)-Leu (L) ist wahrscheinlicher (hat einen höheren Score) als der von unterschiedlichen, z.b. I-Asp(D) Ausnahme: korrelierte Mutationen interagierender Residuen (Lys (K)-Glu (E) in einem Protein, E-K in dessen Komplexpartner) Tutorial 2: BLAST 6/22
7 PAM und BLOSUM BLOSUM62 Default-Austauschmatrix in BLAST, entspricht etwa PAM120 hydrophil hydrophil Iminosäure hydrophob sauer, basisch, + hydrophob aromatisch C S T P A G N D E Q H R K M I L V F Y W C S T P A G N D E Q H R K M I L V F Y W enge Verwandtschaft: niedrige PAM(1), hohe BLOSUM(80) entfernte Verwandtschaft: hohe PAM (250), niedrige BLOSUM(45) Tutorial 2: BLAST 7/22
8 Alignment-Methoden N&W paarweise Alignments dynamische Algorithmen S&W FASTA heuristische Algorithmen BLAST Alignment wird in Subalignments (einzelne Residuen) zerlegt Subalignments sind schneller zu handhaben schließlich werden die besten Ergebnisse ausgegeben -Abschätzungen, um annähernd genaue Ergebnisse zu erzielen Kenntnisse über Sequenzen und Alignment-Statistiken werden benutzt Alignment wird bei geringem Genauigkeitsverlust stark beschleunigt Tutorial 2: BLAST 8/22
9 dynamische Alignments globales Alignment (Needleman & Wunsch) N N evolutionäre Verwandtschaftsbeziehungen C C lokales Alignment (Smith & Waterman) N N C C N N C C Funktionsgemeinsamkeiten (Domänen) Implementierungen z.b. unter Tutorial 2: BLAST 9/22
10 heuristische Alignments dynamische Alignments sind zwar optimal, aber langsam heuristische Alignments sehr viel schneller als dynamische Einsatzgebiet: vor allem Datenbankensuchen mit der Akzeptanz einer geringen Fehlerrate kann der Suchraum stark verkleinert und das Alignment beschleunigt werden schließlich findet ein detailliertes Alignment statt das beste Alignment wird bei gegebenem Model nur mit hoher Wahrscheinlichkeit gefunden BLAST ( FASTA ( Tutorial 2: BLAST 10/22
11 Literatur zu BLAST Altschul SF, Gish W, Miller W, Myers EW, Lipman DJ (1990): "Basic Local Alignment Search Tool", J. Mol. Biol. 215: Altschul SF, Madden TL, Schäffer AA, Zhang J, Zhang Z, Miller W, Lipman DJ (1997): "Gapped BLAST and PSI-BLAST: a new generation of protein database search programs", Nucleic Acids Res. 25: Schäffer AA, Aravind L, Madden TL, Shavirin S, Spouge JL, Wolf YI, Koonin EV, Altschul SF (2001): "Improving the accuracy of PSI-BLAST protein database searches with compositionbased statistics and other refinements", Nucleic Acids Res. 29: Hilfeseiten und Tutorials bei NCBI ( Tutorial 2: BLAST 11/22
12 Algorithmus von BLAST zerlege die Suchsequenz in überlappende Wörter erzeuge für jedes dieser Wörter eine Liste aller ähnlichen Wörter (w-mers), deren Score > Schwellenwert ist suche die w-mers in der Datenbank verwende in der Datenbank aufgefundene w-mers als "Saat" verlängere Treffer beiderseits durch Hinzunehmen von Residuenpaaren (ohne Gaps), solange ein bestimmter Score nicht unterschritten wird > HSPs (high scoring segment pairs) behalte die besten HSPs (Diagonalen) kombiniere diese HSPs mit dynamischer Programmierung (mit Gaps) zu Alignments Tutorial 2: BLAST 12/22
13 BLAST-Programme Name Abfragesequenz Datenbank Bemerkung blastp Protein Protein blastn Nukleotid Nukleotid blastx Nukleotid Protein tblastn Protein Nukleotid tblastx Nukleotid Nukleotid Abfragesequenz wird in alle 6 Leserahmen übersetzt Datenbank wird in alle 6 Leseramen übersetzt Abfragesequenz und Datenbank werden in alle 6 Leserahmen übersetzt weitere: blast2sequences, Megablast, Psi- und Phi-Blast Tutorial 2: BLAST 13/22
14 Signifikanz des Alignments E-Wert (Erwartungswert) E = P * Anzahl der Sequenzen in Datenbank P-Wert: Wahrscheinlichkeit, mit der der Score eines Alignments zufällig zustande kommen kann E entspricht der Anzahl an Alignments eines bestimmten Scores, die man zufällig in einer Sequenz-Datenbank dieser Größe erwartet Treffer werden in BLAST nur ausgegeben, wenn der E-Wert unterhalb einer einstellbaren Schranke liegt E 0,02: Sequenzen vermutlich homolog 0,02 < E 1: Homologie ist nicht auszuschließen E 1: gute Übereinstimmung kann zufällig sein Tutorial 2: BLAST 14/22
15 PSI-BLAST Position Specific Iterated BLAST Idee: entfernte Verwandtschaften lassen sich besser durch Motivoder Profil-Suchen entdecken als durch paarweise Vergleiche PSI-BLAST führt zunächst eine BLAST-Suche mit Austauschmatrix und Gaps durch verwendet die Information jedes signifikanten Alignments, um mittels eines multiplen Alignments eine positionsspezifische Substitionsmatrix zu konstruieren diese wird in der nächsten Runde der Datenbank-Suche verwendet (anstelle von Sequenz und Matrix) kann iterativ verwendet werden, bis keine neuen signifikanten Treffer mehr gefunden werden (Konvergenz) Tutorial 2: BLAST 15/22
16 Profilerstellung (hier für DNA) multiples Alignment Pos Sq1 CACCACGTG Sq2 GACCACGTG Sq3 TAGCACGTG Sq4 GAACACGTG Sq5 AACCACGTG Sq6 CACC-CGTG Sq7 GGCCACGTG Sq8 GTCCACGTG Sq9 TACCACGTG Sq10 -CCCACGTG Alignmentmatrix = Positionsfrequenzmatix (PFM) N A C G T bei Proteinsequenzen ensprechend 21 Zeilen PSI-Blast: -Sequenzen dürfen nicht zu ähnlich sein -PSSM ist ASCII-codiert Tutorial 2: BLAST 16/22
17 BLAST bei NCBI Eingabe Sequenz im Fasta- Format Grenze für E-Values Länge der w-mers Tutorial 2: BLAST 17/22
18 BLAST Formatseite CD Search: Scannen der Query mit PSSMs für konservierte Domänen andere Option: PSSM (ab 2. Iteration) für PSI-BLAST aktivieren Tutorial 2: BLAST 18/22
19 BLAST graphische Alignmentansicht beste Treffer je 2 getrennte Treffer auf derselben Sequenz quergestrichelte Region dazwischen paßt nicht zur Query Eingabesequenz (Query) Tutorial 2: BLAST 19/22
20 BLAST Trefferliste (a) gi-nummer Datenbank Accession-Nummer Locusname der Sequenz - sp swissprot = UniProtKB/Swiss-Prot (b) Beschreibung der Sequenz (Art, Funktion, Organismus) (c) Bit-Scores sind normalisiert und daher zwischen verschiedenen Suchen auch in verschiedenen Datenbanken vergleichbar (d) je kleiner der E-Value, desto signifikanter der Treffer Tutorial 2: BLAST 20/22
21 BLAST Alignment raw Score (unnormiert) Query: Eingabesequenz Sbjct: Treffer X: maskierte low complexity-region Tutorial 2: BLAST 21/22
22 alternative Alignmentprogramme für DNA ganze Chromosomen/Genome Genreihenfolge, Phylogenie, Evolution, Konservierung nichtcodierende Bereiche des Genoms Transkriptionsfaktor-Bindestellen und andere Elemente für Genregulation lokales Alignment FASTA BLASTZ BLAT mindestens 95 % Sequenzähnlichkeit auch für Proteine (mind. 80 % Ähnlichkeit) globales Alignment AVID LAGAN meist werden multiple Alignments verwendet Tutorial 2: BLAST 22/22
MOL.504 Analyse von DNA- und Proteinsequenzen. Modul 2 BLAST-Sequenzsuche und Sequenzvergleiche
MOL.504 Analyse von DNA- und Proteinsequenzen Modul 2 BLAST-Sequenzsuche und Sequenzvergleiche Summary Modul 1 - Datenbanken Wo finde ich die DNA Sequenz meines Zielgens? Wie erhalte ich Info aus der DNA-Datenbank
MehrVorlesung Einführung in die Bioinformatik
Vorlesung Einführung in die Bioinformatik Dr. Stephan Weise 04.04.2016 Einführung Gegeben: zwei Sequenzen Gesucht: Ähnlichkeit quantitativ erfassen Entsprechungen zwischen einzelnen Bausteinen beider Sequenzen
MehrPrimärstruktur. Wintersemester 2011/12. Peter Güntert
Primärstruktur Wintersemester 2011/12 Peter Güntert Primärstruktur Beziehung Sequenz Struktur Proteinsequenzen, Sequenzdatenbanken Sequenzvergleich (sequence alignment) Sequenzidentität, Sequenzhomologie
MehrBioinformatik für Biochemiker
Bioinformatik für Biochemiker Oliver Kohlbacher W 2009/2010 7. Datenbanksuche Abt. imulation biologischer ysteme WI/ZBIT, Eberhard Karls Universität Tübingen Übersicht Datenbanksuche statt Alignment Heuristiken:
MehrPaarweises Sequenzalignment
Methoden des Sequenzalignments Paarweises Sequenzalignment Austauschmatrizen Bedeutsamkeit von Alignments BLAST, Algorithmus Parameter Ausgabe http://www.ncbi.nih.gov Diese Vorlesung lehnt sich eng an
MehrBLAST. Ausarbeitung zum Proseminar Vortag von Nicolás Fusseder am 24.10.02
BLAST Ausarbeitung zum Proseminar Vortag von Nicolás Fusseder am 24.10.02 BLAST (Basic Local Alignment Search Tool) hat seit seiner Veröffentlichung, von Altschul et al. im Jahre 1990, an großer Relevanz
MehrAlgorithmische Anwendungen WS 2005/2006
Algorithmische Anwendungen WS 2005/2006 Sequenzalignment Gruppe F_lila_Ala0506 Allal Kharaz Yassine ELassad Inhaltsverzeichnis 1 Problemstellungen...................................... 3 1.1 Rechtschreibkorrektur...............................
MehrPaarweises Sequenzalignment
Methoden des Sequenzalignments Paarweises Sequenzalignment Áustauschmatrizen Bedeutsamkeit von Alignments BLAST, Algorithmus Parameter Ausgabe http://www.ncbi.nih.gov Diese Vorlesung lehnt sich eng an
MehrBCDS Seminar. Protein Tools
BCDS Seminar Protein Tools Gliederung Nützliche Tools Three-/one-letter Amino Acids' Сodes RandSeq Random Protein Sequence Generator Protein Colourer ProtParam PeptideCutter ProtScale TMHMM Server 2.0
MehrWas ist Bioinformatik?
9. Kurstag: Bioinformatik Der Begriff "Bioinformatik" wurde 1989 erstmals von D.R. Masys im JOURNAL OF RESEARCH OF THE NATIONAL INSTITUTE OF STANDARDS AND TECHNOLOGY erwähnt. Was ist Bioinformatik? Die
MehrBIOINF 1910 Bioinforma1k für Lebenswissenscha;ler Oliver Kohlbacher Datenbanksuche Problem Beispiele
BIOINF 1910 Bioinforma1k für Lebenswissenscha;ler Oliver Kohlbacher SS 2011 08. Datenbanksuche: BLAST und PSI- BLAST Datenbanksuche Problem Gegeben: eine Sequenz und eine Sequenzdatenbank Gesucht: ähnlichste
MehrMOL.504 Analyse von DNA- und Proteinsequenzen. Übungsaufgaben BLAST-Sequenzsuche und -vergleiche
MOL.504 Analyse von DNA- und Proteinsequenzen Übungsaufgaben BLAST-Sequenzsuche und -vergleiche Ü6a blastn und blastx Verwenden Sie die in Übung 3 (Datenbanken) gefundene yqjm-sequenz aus Bacillus subtilis
MehrBioinformatik. Substitutionsmatrizen BLAST. Ulf Leser Wissensmanagement in der. Bioinformatik
Bioinformatik Substitutionsmatrizen BLAST Ulf Leser Wissensmanagement in der Bioinformatik Inhalt dieser Vorlesung Substitutionsmatrizen: PAM und BLOSSUM Suche in Datenbanken: Basic Local Alignment Search
MehrVL Algorithmische BioInformatik (19710) WS2013/2014 Woche 3 - Montag
VL Algorithmische BioInformatik (19710) WS2013/2014 Woche 3 - Montag Tim Conrad AG Medical Bioinformatics Institut für Mathematik & Informatik, Freie Universität Berlin Vorlesungsthemen Part 1: Background
MehrBioinformatik. Lokale Alignierung Gapkosten. Silke Trißl / Ulf Leser Wissensmanagement in der. Bioinformatik
Bioinformatik Lokale Alignierung Gapkosten Silke Trißl / Ulf Leser Wissensmanagement in der Bioinformatik Inhalt dieser Vorlesung Ähnlichkeit Lokales und globales Alignment Gapped Alignment Silke Trißl:
MehrHomologie und Sequenzähnlichkeit. Prof. Dr. Antje Krause FH Bingen 06721 / 409 253 akrause@fh-bingen.de
Homologie und Sequenzähnlichkeit Prof. Dr. Antje Krause FH Bingen 06721 / 409 253 akrause@fh-bingen.de Homologie Verwandtschaft aufgrund gleicher Abstammung basiert auf Speziation (Artbildung): aus einer
MehrIhre Namen: Gruppe: Öffnen Sie die Fasta-Dateien nur mit einem Texteditor, z.b. Wordpad oder Notepad, nicht mit Microsoft Word oder Libre Office.
Ihre Namen: Gruppe: Evolutionsbiologie 2, WS2016/2017: Bioinformatik - Übung 1 Erstellen Sie vor Beginn der Übung einen Ordner auf dem Desktop, in dem Sie alle benötigten Dateien speichern kö nnen (z.b.
MehrSequenz Alignment Teil 2
Sequenz Alignment Teil 2 14.11.03 Vorlesung Bioinformatik 1 Molekulare Biotechnologie Dr. Rainer König Besonderen Dank an Mark van der Linden, Mechthilde Falkenhahn und der Husar Biocomputing Service Gruppe
MehrMOL.504 Analyse von DNA- und Proteinsequenzen
MOL.504 Analyse von DNA- und Proteinsequenzen Kurs 1 Monika Oberer, Karl Gruber MOL.504 Modul-Übersicht Einführung, Datenbanken BLAST-Suche, Sequenzalignment Proteinstrukturen Virtuelles Klonieren Abschlusstest
MehrAlignment von DNA- und Proteinsequenzen
WS2012/2013 Genomforschung und Sequenzanalyse - Einführung in Methoden der Bioinformatik- Thomas Hankeln Alignment von DNA- und Proteinsequenzen das vielleicht wichtigste Werkzeug der Bioinformatik! 1
MehrLokale Sequenzähnlichkeit. Genomische Datenanalyse 9. Kapitel
Lokale Sequenzähnlichkeit Genomische Datenanalyse 9. Kapitel Globale Sequenzähnlichkeit: Zwei Cytochrome C Sequenzen: Eine vom Menschen und eine aus der Maus. Die Sequenzen sind gleich lang, man kann sie
MehrStudiengang Informatik der FH Gießen-Friedberg. Sequenz-Alignment. Jan Schäfer. WS 2006/07 Betreuer: Prof. Dr. Klaus Quibeldey-Cirkel
Studiengang Informatik der FH Gießen-Friedberg Sequenz-Alignment Jan Schäfer WS 2006/07 Betreuer: Prof. Dr. Klaus Quibeldey-Cirkel Überblick Einführung Grundlagen Wann ist das Merkmal der Ähnlichkeit erfüllt?
Mehr1/10. Ihre Namen: Gruppe: Evolutionsbiologie 2, WS2015/2016: Bioinformatik - Übung 1
Ihre Namen: Gruppe: Evolutionsbiologie 2, WS2015/2016: Bioinformatik - Übung 1 Erstellen Sie bitte vor Beginn der Übung einen Ordner auf dem Desktop, in dem Sie alle benötigten Dateien speichern können
MehrBiowissenschaftlich recherchieren
Biowissenschaftlich recherchieren Uber den Einsatz von Datenbanken und anderen Ressourcen der Bioinformatik Nicola Gaedeke Birkhauser Basel Boston Berlin Inhaltsverzeichnis Vorwort xi 1 Die Informationssucheim
MehrEinführung in die Bioinformatik
Einführung in die Bioinformatik Kay Nieselt Integrative Transkriptomik Zentrum für Bioinformatik Tübingen Kay.Nieselt@uni-tuebingen.de SS 2011 1. Was ist Bioinformatik? Ablauf und Formales Ringvorlesung
MehrAlgorithmen für paarweise Sequenz-Alignments. Katharina Hembach
Proseminar Bioinformatik WS 2010/11 Algorithmen für paarweise Sequenz-Alignments Katharina Hembach 06.12.2010 1 Einleitung Paarweise Sequenz-Alignments spielen in der Bioinformatik eine wichtige Rolle.
MehrModul 8: Bioinformatik A. Von der DNA zum Protein Proteinsynthese in silicio
Modul 8: Bioinformatik A. Von der DNA zum Protein Proteinsynthese in silicio Ein Wissenschaftler erhält nach einer Sequenzierung folgenden Ausschnitt aus einer DNA-Sequenz: 5 ctaccatcaa tccggtaggt tttccggctg
MehrDatenbanken in der Bioinformatik
Datenbanken in der Bioinformatik Kapitel 3 Sequenzierung und Genexpressionsanalyse http://dbs.uni-leipzig.de Institut für Informatik Vorläufiges Inhaltsverzeichnis 1. Grundlagen 2. Klassifizierung von
MehrBLAST Basic Local Alignment Search Tool
BLAST Basic Local Alignment Search Tool Martin Winkels 21.12.2012 wissen leben WWU Münster Institut für Medizinische Informatik Inhaltsverzeichnis Inhaltsverzeichnis Inhaltsverzeichnis 1 Einleitung 2 2
MehrFrom gene to 3D model
From gene to 3D model Ein neues Gen, was nun? 1. Database search 2. Mitglied einer Proteinfamilie spezifische Domänen 3. Gibt es Hinweise auf die Funktion, Lokalisierung 4. Expression des Gens 5. Modeling
MehrÜbung II. Einführung, Teil 1. Arbeiten mit Ensembl
Übung II Einführung, Teil 1 Arbeiten mit Ensembl Ensembl Genome Browser (Bereitstellung von Vielzeller Genomen) Projekt wurde 1999 initiiert Projektpartner EMBL European Bioinformatics Institute (EBI)
MehrThreading - Algorithmen
Threading - Algorithmen Florian Lindemann 22.11.2007 Florian Lindemann () Threading - Algorithmen 22.11.2007 1 / 25 Gliederung 1 Prospect Scoring Function Algorithmus Weitere Eigenschaften Komplexität
MehrÜbung II. Einführung. Teil 1 Arbeiten mit Sequenzen recombinante DNA
Übung II Einführung Teil 1 Arbeiten mit Sequenzen recombinante DNA Recombinante DNA Technologie Protein Synthese In vitro Expression Libraries Gene Transfer in Tieren und Pflanzen Recombinante DNA Technologie
MehrEinführung in die Bioinformatik
Einführung in die Bioinformatik SS 2012 1. Was ist Bioinformatik? Kay Nieselt Integrative Transkriptomik Zentrum für Bioinformatik Tübingen Kay.Nieselt@uni-tuebingen.de Ablauf und Formales Ringvorlesung
MehrEvolution & Genetik (Beispiel Hämoglobin) Prof. Dr. Antje Krause FH Bingen 06721 / 409 253 akrause@fh-bingen.de
Evolution & Genetik (Beispiel Hämoglobin) Prof. Dr. Antje Krause FH Bingen 06721 / 409 253 akrause@fh-bingen.de DNA (Desoxyribonukleinsäure) 5 3 CGATGTACATCG GCTACATGTAGC 3 5 Doppelhelix Basen: Adenin,
MehrVortrag 2: Proteinsequenzen und Substitutionsmatrizen
Vortrag 2: Proteinsequenzen und Substitutionsmatrizen Was sind Proteinsequenzen? Die DNA-Forschung hat sich auf spezielle Abschnitte auf den Strängen der DNA-Moleküle konzentriert, den sog. Protein-codierenden
MehrVorlesungsskript. Softwarewerkzeuge der Bioinformatik
Vorlesungsskript Softwarewerkzeuge der Bioinformatik Dozent: Prof. Dr. Volkhard Helms Übungen: PD Dr. Michael Hutter, Dr. Tihamér Geyer, Barbara Hutter Zentrum für Bioinformatik, Universität des Saarlandes
MehrEinführung in die Angewandte Bioinformatik: Sequenzähnlichkeit, Sequenzalignment, BLAST
Einführung in die Angewandte Bioinformatik: Sequenzähnlichkeit, Sequenzalignment, BLAST 10.06.2010 Prof. Dr. Sven Rahmann 1 Sequenzvergleich: Motivation Hat man die DNA-Sequenz eines Gens, die Aminosäuresequenz
MehrAlgorithmische Bioinformatik
Algorithmische Bioinformatik Effiziente Berechnung des Editabstands Dynamische Programmierung Ulf Leser Wissensmanagement in der Bioinformatik Inhalt dieser Vorlesung Rekursive Definition des Editabstands
MehrProtein-Protein Bindungsstellen. Lennart Heinzerling
Protein-Protein Bindungsstellen Lennart Heinzerling 1 Worum geht es in den nächsten 45 Minuten? Auffinden von Protein- Protein Komplexen aus einer großen Menge potentieller Komplexe z.b. für -Interaction
MehrAlignment-Verfahren zum Vergleich biologischer Sequenzen
zum Vergleich biologischer Sequenzen Hans-Joachim Böckenhauer Dennis Komm Volkshochschule Zürich. April Ein biologisches Problem Fragestellung Finde eine Methode zum Vergleich von DNA-Molekülen oder Proteinen
MehrMOL.504 Analyse von DNA- und Proteinsequenzen. Datenbanken & Informationssysteme
MOL.504 Analyse von DNA- und Proteinsequenzen Datenbanken & Informationssysteme Inhaltsübersicht Informationsysteme National Center for Biotechnology Information (NCBI) The European Bioinformatics Institute
MehrEinführung in die Bioinformatik Algorithmen zur Sequenzanalyse
Einführung in die Bioinformatik Algorithmen zur Sequenzanalyse!! Vorläufige Fassung, nur einzelne Abschnitte!!!! Enthält wahrscheinlich noch viele Fehler!!!! Wird regelmäßig erweitert und verbessert!!
MehrV3 - Multiples Sequenz Alignment und Phylogenie
V3 - Multiples Sequenz Alignment und Phylogenie Literatur: Kapitel 4 in Buch von David Mount Thioredoxin-Beispiel heute aus Buch von Arthur Lesk 3. Vorlesung SS 2011 Softwarewerkzeuge der Bioinformatik
MehrAlgorithmische Bioinformatik 1
Algorithmische Bioinformatik 1 Dr. Hanjo Täubig Lehrstuhl für Effiziente Algorithmen (Prof. Dr. Ernst W. Mayr) Institut für Informatik Technische Universität München Sommersemester 2009 Übersicht Paarweises
MehrAlgoBio WS 16/17 Protein-DNA Interaktionen ChiP-Seq Datenanalyse. Annalisa Marsico
AlgoBio WS 16/17 Protein-DNA Interaktionen ChiP-Seq Datenanalyse Annalisa Marsico 6.02.2017 Protein-DNA Interaktionen Häufig binden sich Proteine an DNA, um ihre biologische Funktion zu regulieren. Transkriptionsfaktoren
MehrBioinformatik an der FH Bingen
Bioinformatik an der FH Bingen Prof. Dr. Antje Krause 05.11.2010 Wie alles begann... 1955 erste Proteinsequenz (nach 12 Jahren Arbeit) veröffentlicht (Insulin vom Rind) Frederick Sanger MALWTRLRPLLALLALWPPPPA
MehrEvolution der Proteinstruktur
Evolution der Proteinstruktur Strukturelle Bioinformatik WS15/16 Dr. Stefan Simm, 09.12.2015 simm@bio.uni-frankfurt.de Evolution der Proteinstruktur DOMÄNEN UND MOTIVE (EINE KURZE WIEDERHOLUNG) Motive
MehrAufgabe 7: Distanzbasierte Phylogenie: Neighbor Joining. Stefan Kröger, Philippe Thomas Wissensmanagement in der Bioinformatik
Aufgabe 7: Distanzbasierte Phylogenie: Neighbor Joining Stefan Kröger, Philippe Thomas Wissensmanagement in der Bioinformatik Daten Wir verwenden neue Daten Die müssen sie ausnahmsweise selber suchen DNA-Sequenzen
Mehr...-Arg-Met-Phe-Ala-Asn-His-Lys-Ser-Val-Gly-...
1. Im Enzym Xase, das aus einer Polypeptidkette aus 300 Aminosäuren besteht, findet sich in der Region der Aminosäuren 40-50 die folgende Aminosäurensequenz:...-Arg-Met-Phe-Ala-Asn-His-Lys-Ser-Val-Gly-...
MehrBLAST. Datenbanksuche mit BLAST. Genomische Datenanalyse 10. Kapitel
Datenbanksuche mit BLAST BLAST Genomische Datenanalyse 10. Kapitel http://www.ncbi.nlm.nih.gov/blast/ Statistische Fragen Datenbanksuche Query Kann die globale Sequenzähnlichkeit eine Zufallsfluktuation
MehrSoftwarewerkzeuge der Bioinformatik
Softwarewerkzeuge der Bioinformatik Inhalt dieser Veranstaltung: Softwarewerkzeuge kennenlernen für I II III Sequenzanalyse Analyse von Proteinstruktur und Ligandenbindung Zell- bzw. Netzwerksimulationen
MehrInformationstechnologie in der Pflanzenzüchtung. Biocomputing in einem Züchtungsunternehmen. Andreas Menze KWS SAAT AG, Einbeck
Informationstechnologie in der Pflanzenzüchtung Biocomputing in einem Züchtungsunternehmen Andreas Menze KWS SAAT AG, Einbeck Biocomputing in einem Züchtungsunternehmen Biocomputing Was ist das? Wozu wird
MehrVom Gen zum Naturstoff!
Pierre Stallforth // HKI Jena Vom Gen zum Naturstoff Sequenzierung: Wie erhalte ich genomische Informationen eines Organismus Genetische Knockouts, (CRISPR-Cas9) Veränderung: Bioinformatik: Datenbanken,
MehrKapitel 7: Sequenzen- Alignierung in der Bioinformatik
Kapitel 7: Sequenzen- Alignierung in der Bioinformatik VO Algorithm Engineering Professor Dr. Petra Mutzel Lehrstuhl für Algorithm Engineering, LS11 19. VO 14. Juni 2007 1 Literatur für diese VO Volker
MehrBioinformatik für Lebenswissenschaftler
Bioinformatik für Lebenswissenschaftler Oliver Kohlbacher, Steffen Schmidt SS 2010 09. Multiples Alignment I Abt. Simulation biologischer Systeme WSI/ZBIT, Eberhard Karls Universität Tübingen Übersicht
MehrInformationsmaterial Resistenz gegen HIV Recherche und Analyse molekularer Daten
1 Informationsmaterial Resistenz gegen HIV Recherche und Analyse molekularer Daten (inkl. Anleitungen zur Recherche von Sequenzen mit GenBank und zur Analyse mit GeneDoc) In der Computer-basierten Version
MehrInformationsgehalt von DNA
Informationsgehalt von DNA Welche Themen werden behandelt? Gene Code, Genorganisation Signale in DNA Detektion von Genen Genome Genomorganisation Nukleotidmuster Junk DNA 2 DNA als Informationsträger 3
MehrGenannotation bei Prokaryoten
Genannotation bei Prokaryoten Maike Tech Abt. Bioinformatik Institut für Mikrobiologie und Genetik (IMG) Universität Göttingen 28. November 2005 Genetik von Pro- und Eukaryoten Eukaryoten Prokaryoten Zellkern
MehrBio Data Management. Kapitel 5a Sequenzierung und Alignments
Bio Data Management Kapitel 5a Sequenzierung und Alignments Sommersemester 2013 Anika Groß Universität Leipzig, Institut für Informatik, Abteilung Datenbanken http://dbs.uni-leipzig.de Vorläufiges Inhaltsverzeichnis
MehrPhylogenetische Analyse
Bioinformatik I - Uebung Phylogenetische Analyse Wenn nicht anders angegeben verwende die Standard-Einstellungen der Programme Hintergrund: Die Schwämme (Phylum Porifera) gehören zu den den ältesten lebenden
MehrEIIa in Ferrovum sp. JA12 22.8.2012
EIIa in Ferrovum sp. JA12 22.8.2012 1. Einleitung 1.1 Motivation Ferrovum JA12 ist ein erst seit kurzem entdeckter Organismus der acidophilen Eisenoxidierer. Er gehört phylogenetisch betrachtet zu den
MehrMM Proteinmodelling. Michael Meyer. Vorlesung XVII
Proteinmodelling Vorlesung XVII Proteinstrukturen Es besteht ein sehr großer Bedarf an Proteinstrukturen: Die Kenntnis der 3D-Struktur hat große Vorteile für das Design neuer Wirkstoffe. Experimentelle
MehrVergleichende Untersuchung zur Verbesserung von Methoden der Genvorhersage
Vergleichende Untersuchung zur Verbesserung von Methoden der Genvorhersage Diplomarbeit vorgelegt von Maike Tech aus Lübeck angefertigt am Institut für Mikrobiologie und Genetik der Georg-August-Universität
MehrNeutrale Evolution vs. Selektion basierend auf einer Sequenz
Neutrale Evolution vs. Selektion basierend auf einer Sequenz Ulrich Seyfarth 16. November 2004 Inhaltsverzeichnis 1 Einführung 1 1.1 Geschichte............................... 1 1.2 Motivation...............................
MehrMathematik in den Life Siences
Gerhard Keller Mathematik in den Life Siences Grundlagen der Modellbildung und Statistik mit einer Einführung in die Statistik-Software R 49 Abbildungen Verlag Eugen Ulmer Stuttgart Inhaltsverzeichnis
MehrResistenz gegen HIV (Computer- und Internet-basierte Aufgabe)
1 Resistenz gegen HIV (Computer- und Internet-basierte Aufgabe) In den frühen 1990er Jahren zeigten verschiedene Untersuchungen, dass einige Menschen trotz wiederholten Kontaktes mit dem HI-Virus nicht
MehrBio Data Management. Kapitel 5a Sequenzierung und Alignments
Bio Data Management Kapitel 5a Sequenzierung und Alignments Wintersemester 2014/15 Dr. Anika Groß Universität Leipzig, Institut für Informatik, Abteilung Datenbanken http://dbs.uni-leipzig.de Vorläufiges
MehrStatistische Verfahren:
Statistische Verfahren: Hidden-Markov-Modelle für Multiples Alignment Stochastic Context-Free Grammars (SCFGs) für RNA-Multiples Alignment Übersicht 1 1. Hidden-Markov-Models (HMM) für Multiples Alignment
MehrOptimale Produktliniengestaltung mit Genetischen Algorithmen
Optimale Produktliniengestaltung mit Genetischen Algorithmen 1 Einleitung 2 Produktlinienoptimierung 3 Genetische Algorithmen 4 Anwendung 5 Fazit Seite 1 Optimale Produktliniengestaltung mit Genetischen
MehrEinführung in die Bioinformatik
Enno Abteilung Theoretische Informatik Universität Ulm October 18, 2016 Überblick 1 Datenbanken Sequenzformate 2 Multiple 3 FASTA BLAST 4 Datenbanken Überblick Datenbanken Sequenzformate exponentielles
MehrBioinformatische Suche nach pre-mirnas
Bioinformatische Suche nach pre-mirnas Vorbereitung: Lesen Sie die Publikationen Meyers et al., 2008, Criteria for Annotation of Plant MicroRNAs und Thieme et al., 2011, SplamiR prediction of spliced mirnas
MehrAufgabe 2: (Aminosäuren)
Aufgabe 2: (Aminosäuren) Aufgabenstellung Die 20 Aminosäuren (voller Name, 1- und 3-Buchstaben-Code) sollen identifiziert und mit RasMol grafisch dargestellt werden. Dann sollen die AS sinnvoll nach ihren
MehrBioinformatik für Lebenswissenschaftler
Bioinformatik für Lebenswissenschaftler Oliver Kohlbacher, Steffen Schmidt SS 2010 09. Multiples Alignment I Abt. Simulation biologischer Systeme WSI/ZBIT, Eberhard Karls Universität Tübingen Übersicht
MehrSequenzen-Alignierung in der Bioinformatik
Sequenzen-Alignierung in der Bioinformatik VO Algorithm Engineering Professor Dr. Petra Mutzel Lehrstuhl für Algorithm Engineering, LS 2. VO 2.0.2006 Literatur für diese VO Volker Heun: Skriptum zur Vorlesung
MehrAminosäuren - Proteine
Aminosäuren - Proteine ÜBERBLICK D.Pflumm KSR / MSE Aminosäuren Überblick Allgemeine Formel für das Grundgerüst einer Aminosäure Carboxylgruppe: R-COOH O Aminogruppe: R-NH 2 einzelnes C-Atom (α-c-atom)
MehrGrundlegende Algorithmen der Bioinformatik
Grundlegende Algorithmen der Bioinformatik Vortragsausarbeitungen des gleichnamigen Proseminars LS 11, Fakultät für Informatik, TU Dortmund Prof. Dr. Sven Rahmann mit Beiträgen der TeilnehmerInnen Wintersemester
MehrInterPro & SP-ML. Syntax und Verwendung der Beschreibungssprache XML Ausarbeitung im Seminar XML in der Bioinformatik.
InterPro & SP-ML Syntax und Verwendung der Beschreibungssprache XML Ausarbeitung im Seminar XML in der Bioinformatik Stefan Albaum 18. Dezember 2002 Inhaltsverzeichnis 1 SPTr-XML 2 1.1 SWISS-PROT...........................
MehrGenvorhersage & Genom- Annotation
WS2016/2017 Genomforschung und Sequenzanalyse - Einführung in Methoden der Bioinformatik- Thomas Hankeln Genvorhersage & Genom- Annotation Ebenen der Annotation Genstruktur (Exons/Introns, UTR s, Promoter,
MehrBioinformatik: Neue Paradigmen in der Forschung
Bioinformatik: Neue Paradigmen in der Forschung Sommerakademie der Studienstiftung St. Johann, 1.-14.9.2002 Leitung: Proff. Ernst W. Mayr & Rolf Backofen Thema 4: Paarweises und multiples (heuristisches)
MehrAlgorithmische Bioinformatik
lgorithmische Bioinformatik Stringalignment Ulf Leser Wissensmanagement in der Bioinformatik Inhalt dieser Vorlesung pproximative Stringvergleiche Dotplots Edit-bstand und lignment Naiver lgorithmus Ulf
MehrBioinformatik. Dynamische Programmierung. Ulf Leser Wissensmanagement in der. Bioinformatik
Bioinformatik Dynamische Programmierung Ulf Leser Wissensmanagement in der Bioinformatik Motivation BLAST / FASTA und Verwandte sind *die* Bioinformatik Anwendung Teilweise synonym für Bioinformatik rundlegende
MehrFOR MUW SSM3 (2008) STUDENTS EDUCATIONAL PURPOSE ONLY
Angewandte Bioinformatik Grundlagen der Annotation von eukaryotischen Genomen Online Datenbanken und Bioinformatik Tools Sequenzen Sequenzalignment: Fasta und Blast Motive und Hidden Markov Models Genom-Browser
MehrDATENQUALITÄT IN GENOMDATENBANKEN
DATENQUALITÄT IN GENOMDATENBANKEN Alexander Fehr 28. Januar 2004 Gliederung Motivation Biologische Grundkonzepte Genomdaten Datenproduktion und Fehler Data Cleansing 2 Motivation (1) Genomdatenbanken enthalten
Mehrmathematik und informatik
R. Merkl Grundlegende Algorithmen der Bio-Informatik Kurseinheiten 1-7 mathematik und informatik Das Werk ist urheberrechtlich geschützt. Die dadurch begründeten Rechte, insbesondere das Recht der Vervielfältigung
MehrInformationsvisualisierung
Informationsvisualisierung Thema: 7. Visualisierung Biologischer Daten Dozent: Dr. Dirk Zeckzer zeckzer@informatik.uni-leipzig.de Sprechstunde: nach Vereinbarung Umfang: 2 Prüfungsfach: Modul Fortgeschrittene
MehrArten der Intronen. Spliceosome Struktur des snrnp U1. Spliceosome. Vorlesung 3: Evolution des eukaryotischen Genoms 4/20/11
Vorlesung 3: Evolution des eukaryotischen Genoms Struktur des eukaryotischen Gens Intronen und Exonen Genduplikation--Familien des Gens Eiweißdomänen (Protein domains) Domänen und Exonen: sind sie verwandt?
MehrVorlesung Evolutionäre Algorithmen
Vorlesung Evolutionäre Algorithmen Dr. Nicole Drechsler, AG Rechnerarchitektur Raum 3480, Tel. 7391, nd@tzi.de Vorschlag für Prüfungskriterien: Bearbeitung einer praktischen (Programmier-) Aufgabe Fachgespräch
MehrSeminar Biomedical Informatics
Martin Dugas und Xiaoyi Jiang Institut für Informatik Sommersemester 2017 Organisation Vorlage: Englischsprachige Publikation Vortrag: ca. 30min + 15min Diskussion, Hand-out, Blockseminar Anfang Juni Seminararbeit:
MehrDarwins Erben - Phylogenie und Bäume
Vorlesung Einführung in die Bioinforma4k SoSe2011 Darwins Erben - Phylogenie und Bäume Prof. Daniel Huson ZBIT Center for Bioinformatics Center for Bioinformatics Charles Darwin und Bäume Darwin's Notizbuch
MehrInhaltsverzeichnis. Vorwort. Website
V Vorwort Website XV XVII 1 Biologische Grundlagen 3 1.1 DNA 3 1.2 Genetischer Code und Genomkomposition 5 1.3 Transkription 9 1.4 RNA 10 1.5 Proteine 11 1.6 Peptidbindung 13 1.7 Konformation von Aminosåureseitenketten
MehrAufbau, Struktur, Funktion von DNA, RNA und Proteinen
Aufbau, Struktur, Funktion von DNA, RNA und Proteinen Mitarbeiterseminar der Medizinischen Fakultät Ruhr-Universität Bochum Andreas Friebe Abteilung für Pharmakologie und Toxikologie Aufbau, Struktur,
MehrOptimierung in R. Michael Scholz
N Optimierung in R Fortgeschrittene Mathematik: Optimierung (WiSe 09/10) Michael Scholz Institut für Statistik und Ökonometrie Georg-August-Universität Göttingen Fortgeschrittene Mathematik: Optimierung
MehrMotiv und Domänensuche
Motiv und Domänensuche Strukturelle Bioinformatik WS15/16 Dr. Stefan Simm, 09.12.2015 simm@bio.uni-frankfurt.de Motiv und Domänensuche SIGNALVORHERSAGE (MOTIV) Ansatz für Signalvorhersage 1. Zielsignalsuche
MehrWichtige Themen aus der Vorlesung Bioinformatik I WS 2013/2014
Universität des Saarlandes FR 6.2 Informatik Prof. Dr. Hans-Peter Lenhof Daniel Stöckel, M. Sc. Patrick Trampert, M. Sc. Lara Schneider, M. Sc. I Wichtige Themen aus der Vorlesung Bioinformatik I WS 2013/2014
MehrDie Suche nach Genen in Bakteriengenomen. BWInf-Workshop 22.-23. März 2011. Prof. Dr. Sven Rahmann AG Bioinformatik Informatik XI, TU Dortmund
Die Suche nach Genen in Bakteriengenomen BWInf-Workshop 22.-23. März 2011 Prof. Dr. Sven Rahmann AG Bioinformatik Informatik XI, TU Dortmund 1 Bioinformatik was ist das? Aufgabe: Analyse (molekular)biologischer
MehrDie wichtigsten Bioinformatikdatenbanken. SwissProt, PDB, Scop, CATH, FSSP, PROSITE, Pfam
Die wichtigsten Bioinformatikdatenbanken SwissProt, PDB, Scop, CATH, FSSP, PROSITE, Pfam Übersicht Nucleotidsequenzen: GenBank, EMBL Proteindatenbank SwissProt Proteinstrukturen: Brookhavens PDB Proteinklassifizierung:
MehrVorlesungsthemen Mikrobiologie
Vorlesungsthemen Mikrobiologie 1. Einführung in die Mikrobiologie B. Bukau 2. Zellaufbau von Prokaryoten B. Bukau 3. Bakterielles Wachstum und Differenzierung B. Bukau 4. Bakterielle Genetik und Evolution
MehrMolekulare Pathologie 1: Mutationen
Molekulare Pathologie 1: Mutationen Peter N. Robinson Institut für medizinische Genetik Charité Universitätsmedizin Berlin 23. Juni 2008 Peter N. Robinson (Charité) Molekulare Pathologie 1 23. Juni 2008
MehrEine Analyse des Effektes von Lernen auf Populationsfitness und Diversität in einer NK-Fitnesslandschaft. Lars Melchior
Eine Analyse des Effektes von Lernen auf Populationsfitness und Diversität in einer NK-Fitnesslandschaft Lars Melchior Theoretische Grundlagen Theoretische Grundlagen Genetik Genetische Algorithmen NK
Mehr