Vorlesung Einführung in die Bioinformatik
|
|
- Gundi Abel
- vor 7 Jahren
- Abrufe
Transkript
1 Vorlesung Einführung in die Bioinformatik Dr. Stephan Weise
2 Einführung Gegeben: zwei Sequenzen Gesucht: Ähnlichkeit quantitativ erfassen Entsprechungen zwischen einzelnen Bausteinen beider Sequenzen feststellen Gesetzmäßigkeiten der Konservierung und Variabilität beobachten Rückschlüsse auf entwicklungsgeschichtliche Verwandtschaftsverhältnisse ziehen Anwendung: Annotation von Genomen Zuordnung von Funktion und Struktur für möglichst viele Gene Dr. Stephan Weise Folie # 2
3 Homologe Gene Homologe Gene: stammen von einem gemeinsamen Vorläufer ab Orthologe Gene: homologe Gene aus verschiedenen Organismen Paraloge Gene: Sind in einem Genom Beruhen auf einer Duplikation eines Gens innerhalb eines Genoms und der Akkumulation von Mutationen in einer der Kopien. Dr. Stephan Weise Folie # 3
4 Evolution Die Sequenzen verändern sich in der Evolution, durch die Deletion, Insertion, Mutation. Dr. Stephan Weise Folie # 4
5 Sequenzidentität S 1 : 5' ACCCTGGGACT 3' S 2 : 5' ACCCTGGGACT 3' Match Dr. Stephan Weise Folie # 5
6 Sequenzähnlichkeit S 1 : 5' ACCCTGGGACT 3' S 2 : 5' ACTCTGGGACT 3' Mismatch Match Dr. Stephan Weise Folie # 6
7 Sequenzähnlichkeit Insertion S 1 : 5' ACCCTGGGACT 3' S 2 : 5' AC.CTGGGACT 3' Deletion Dr. Stephan Weise Folie # 7
8 Sequenzähnlichkeit S 1 : 5' ACCCTGGGACT 3' S 2 : 5' AC...GGGACT 3' Indel Neben identischen (Match) und nicht-identischen Positionen(Mismatch) in einem Alignment gibt es Lücken (Gaps), die dadurch entstehen, dass in den Sequenzen Positionen eingefügt (Insertionen) oder entfernt wurden (Deletionen). Verantwortlich dafür sind Mutationen der DNA. Dr. Stephan Weise Folie # 8
9 Sequenzhomologie S 1 : 5' ACCCTGGGACT 3' S 2 : 5' ACTCTGGGACT 3' Die Kenntnisse über die Geschichte der Veränderungen liegen leider nicht vor. Man muss zwischen Sequenzidentität (100% Übereinstimmung), Sequenzähnlichkeit (Verwandtschaftsverhältnis in %) Sequenzhomologie unterscheiden. Homologe Gene haben eine signifikante Sequenzähnlichkeit, die auf eine enge evolutionäre Verwandtschaft hinweist. Dr. Stephan Weise Folie # 9
10 Zentrale Voraussetzung Ist die Funktion eines Proteins bzw. Sequenzabschnitts bekannt, kann man dieselbe Funktion nach Ähnlichkeit der Sequenzen mit bestimmter Wahrscheinlichkeit zuordnen. Dr. Stephan Weise Folie # 10
11 DOTPLOT Dotplot = Punkteschema Ähnlichkeit von zwei Sequenzen Tabelle oder Matrix: Zeilen entsprechen Bausteinen der ersten Sequenz Spalten entsprechen Bausteinen der zweiten Sequenz Wenn Übereinstimmung, dann Füllen der Felder Abschnitte mit ähnlichen Bausteinen werden als Diagonalen von links oben (Nordwest) nach rechts unten (Südost) sichtbar Beispiel (engl. Proteinkristallografin): D O R O T H Y C R O W F O O T H O D G K I N D O R O T H Y H O D G K I N Dr. Stephan Weise Folie # 11
12 DOTPLOT Dr. Stephan Weise Folie # 12
13 DOTPLOT Repetitive Sequenz: A B R A C A D A B R A C A D A B R A Dr. Stephan Weise Folie # 13
14 DOTPLOT Palindromische Sequenz: M A X I S T A Y A W A Y A T S I X A M Dr. Stephan Weise Folie # 14
15 DOTPLOT und Alignment D O R O T H Y C R O W F O O T H O D G K I N D O R O T H Y H O D G K I N Jeder Pfad von links oben nach rechts unten durch den Dotplot läuft durch eine Abfolge von Zellen, und jede dieser Zellen repräsentiert zwei Positionen- eine aus der Zeile, die andere aus der Spalte -, die einander im Alignment entsprechen, oder aber sie stellt eine Lücke in einer der Sequenzen dar! Dr. Stephan Weise Folie # 15
16 Beispiel (erzeugt mit JDotter) Dr. Stephan Weise Folie # 16
17 Dotplots Sliding Window Ein Punkt repräsentiert die Ähnlichkeit zwischen Sequenzen und nicht eine einzelne Base Dr. Stephan Weise Folie # 17
18 Dotplots Dotplot CACTA Transposon Sliding Window: 5 much noise Dr. Stephan Weise Folie # 18
19 Dotplots Dotplot CACTA Transposon Sliding Window: 50 some structures not visible Dr. Stephan Weise Folie # 19
20 Dotplots Dotplot CACTA Transposon Sliding Window: 25 Dr. Stephan Weise Folie # 20
21 JDotter: A Dot Matrix Plotter for Java sliding windows zoom alignment tool Dr. Stephan Weise Folie # 21
22 Dotplots Quelle: Schulz et al. (2008) Dot-plots. a) T 1 = T 2 b) Repetitive Sequenz c) Palindromische Sequenz d) Teilweise palindromische Sequenz e) Basenwiederholung, z.b. (G) 50, Microsatellite Repeats f) Tandem Repeats, z.b. (AGCTCTGAC) 20, Minisatellite Pattern g) Homologe Sequenzen mit gemeinsamem Vorläufer h) INDEL Dr. Stephan Weise Folie # 22
23 Wie Sequenzähnlichkeit messen? Wie kann man ein quantitatives Maß für Sequenzähnlichkeit definieren? Definition von Entsprechungen Sequenz-Alignment ist der Nachweis solcher Entsprechungen zwischen Sequenzbausteinen DAS GRUNDLEGENDE WERKZEUG der BIOINFORMATIK! Zuordnung von Entsprechungen, bei der die Reihenfolge der Bausteine erhalten bleibt, ist ein Alignment Lücken sind dabei erlaubt! Beispiel: Folge 1 = a b c d e Alignment: a b c d e a c d e f Folge 2 = a c d e f Dr. Stephan Weise Folie # 23
24 Maße für Sequenzähnlichkeit Stand: Dotplots und Alignments nach Augenmaß Gesucht: quantitative Maße für Ähnlichkeiten Beispiele: Hamming-Distance: zwischen zwei per Definition gleich langen Sequenzen, ist die Zahl der Positionen mit unterschiedlichen Zeichen. agtc cgta Hamming-Abstand = 2 Levenshtein-Distance (Edit Distance): zwischen zwei Sequenzen (nicht unbedingt gleich lang), ist die Mindestzahl von Editieroperationen, die erforderlich sind, um eine Kette in die andere umzuwandeln. ag-tcc cgctca Levenshtein-Abstand = 3 Editieroperationen: Deletion, Insertion oder Punktmutation in einer Sequenz Dr. Stephan Weise Folie # 24
25 Maße für Sequenzähnlichkeit Problem: bestimmte Abweichungen unterschiedlich wahrscheinlich: Ähnliche Aminosäuren (physikalische, chemische Eigenschaften) häufiger ausgetauscht verschiedene Editieroperationen bekommen unterschiedliche Wichtung Computerprogramm ermittelt nicht nur Mindest- Editierabstand sondern auch optimales Alignment Wichtungen für Einzelschritte addieren und so Gesamt-SCORE ermitteln Bei Substitutionen wird Wert der Mutation addiert. Bei horizontalen und vertikalen Zügen wird Lückenstrafe (gap penalty) gezählt. Dr. Stephan Weise Folie # 25
26 Scoring-Schema entspricht einem Bewertungssystem Handling von Substitutionen, Insertionen und Deletionen Sequenz 1 Insertion -> Sequenz 2 Deletion und umgekehrt Gewichtung der Deletion (Lücken in Sequenz) hängt von Länge ab Hamming und Leveshtein Maße für Unähnlichkeit!!! geringer Abstand ähnlich großer Abstand unähnlich Scores in Molekularbiologie sind Maß für Sequenzähnlichkeit: ähnliche Sequenz hoher Score unähnliche Sequenz niedriger Score Algorithmen zum Finden des optimalen Alignments suchen entweder nach geringem Wert für Unähnlichkeit oder nach möglichst hohem Score für Ähnlichkeit! Dr. Stephan Weise Folie # 26
27 Similarity higher value => more similar reward for match (blastn: 1) penalty for mismatch (blastn: -3) penalty for opening a gap (blastn: -1) penalty for extending a gap (blastn: -1) t c a g - - a t c c t c c g c c a t c a Score = -2 Dr. Stephan Weise Folie # 27
28 Globale und Lokale Alignments Dr. Stephan Weise Folie # 28
29 Alignment-Algorithmen Aufgabe: optimales Alignment zweier Sequenzen bestimmen Dynamische Programmierung Smith-Waterman für lokales Alignment Needleman-Wunsch für globales Alignment Heuristische Methoden: Optimales Alignment kann nicht garantiert werden Sehr gute Näherung und signifikant schneller BLAST Dr. Stephan Weise Folie # 29
30 BLAST BLAST (Altschul et al. 1990) = Basic Local Alignment Search Tool Vergleicht DNA- oder Protein-Sequenzen mit Sequenzen in einer Datenbank Vorgehen: Finden kurzer, exakter Übereinstimmungen (Initialisierung) Sukzessive Vergrößerung der Teilstücke durch benachbarte Suchwörter fester Länge Scoring dieser Suchwörter muss größer als ein angegebener Parameter sein High Scoring Pairs (HSPs) Dr. Stephan Weise Folie # 30
31 BLAST Beispiel: Lokales High Scoring Pair (HSP) entsteht durch die Erweiterung des exakten Treffers AGT (dunkelblau) Erweiterung in beide Richtungen (Verwendung von Reward, Penalty, Gap, ) Im Bsp.: lokales Maximum Sowohl Verlängern als auch Verkürzen würde den Score reduzieren Solche lokal maximalen Segmentpaare können dann zu größeren lokalen Alignments kombiniert werden (inkl. INDELs) Dr. Stephan Weise Folie # 31
32 BLAST Algorithmus: Parameter Wichtige Parameter für blastn -W word-size -r match reward -q mismatch penalty -G gap opening cost -E gap extension cost Dr. Stephan Weise Folie # 32
33 BLAST: Blastable Database erstellen Indizierung der Datenbasis für schnelle Suche formatdb i mydatabase p F -i Name der FASTA-Datei, aus der eine Blastable Database erstellt werden soll -p F für Nukleotide T für Proteine Dr. Stephan Weise Folie # 33
34 NCBI-Blast blastall p blastn i myseq d mydb o output -p -i -d -o algorithm query sequences in (multiple-)fasta blastable database output file -e 1E-10 optional e-value threshold Dr. Stephan Weise Folie # 34
35 Verschiedene BLAST-Verfahren Dr. Stephan Weise Folie # 35
36 Bedeutung des Alignments Ähnlichkeit festgestellt Zufall oder Signifikanz Bei Münzwurf Wahrscheinlichkeit eines Treffers leicht berechenbar Schwieriger in unserem Fall, wenn es um Sequenzen geht!!! Praktische Lösung des Problems: Ist die Gewichtung des tatsächlich beobachteten Alignments nicht größer als man es nach zufälliger Umstellung der Sequenz erwartet, hat man es wahrscheinlich mit einem Zufallsergebnis zu tun! Sequenz kann viele Male nach Zufallsprinzip verändert werden Danach Alignment durchführen, Scores sammeln und Ergebnis analysieren Wenn Zufallssequenzen gleichen Score ergeben, ist ursprüngliches Alignment nicht aussagekräftig Dr. Stephan Weise Folie # 36
37 BLAST Bit Score Score S der High Scoring Pairs (HSP) ist die Summe aller Einzelscores abzüglich der Strafen für Gaps Für Vergleich Normalisierung mit folgenden Parametern: l,k: Karlin-Altschul-Parameter (ergeben sich aus der verwendeten Scoringfunktion) Bit Score S : * S ln K S' l ln 2 S : Bit Score ermöglicht den Vergleich verschiedener Alignments S : unabhängig von der Datenbankgröße Dr. Stephan Weise Folie # 37
38 BLAST E-Value Erwartungswert E: Aussage über die statistische Signifikanz des Alignments Berechnung: m Länge der Suchsequenz n Summe der Länge aller Vergleichssequenzen S Bit Score E m* n s' 2 Kleiner E-Wert geringe Wahrscheinlichkeit, dass das Alignment zufällig entstanden ist E: abhängig von der Datenbankgröße Dr. Stephan Weise Folie # 38
39 FASTA-Format Format zur Repräsentation von Sequenzen Erste Zeile enthält Header-Information Beginnt mit > Gefolgt von einem Identifikator (kein Leerzeichen zwischen > und ID) Danach optional: Leerzeichen und Sequenzbeschreibung Die nächsten Zeilen enthalten die Sequenz (bis zum nächsten > oder dem Dateiende) Dr. Stephan Weise Folie # 39
40 FASTA-Format Dr. Stephan Weise Folie # 40
41 FASTA-Format Sequenzidentifikator [a-z,a-z,0-9,_] Keine Sonderzeichen (?, ; & % $! ) Identifikator darf nicht mit eine Zahl beginnen Dr. Stephan Weise Folie # 41
Übungsaufgaben zur Einführung in die Bioinformatik - Lösungen
18.01.2013 Prof. P. Güntert 1 Vorlesung BPC I: Aspekte der Thermodynamik in der Strukturbiologie Übungsaufgaben zur Einführung in die Bioinformatik - Lösungen 1. Hamming und Levenshtein Distanzen a) Was
MehrAlgorithmen und Datenstrukturen in der Bioinformatik Zweites Übungsblatt WS 05/06 Musterlösung
Johanna Ploog, Konstantin Clemens Freie Universität Berlin Institut für Mathematik II Arbeitsgruppe für Mathematik in den Lebenswissenschaften Algorithmen und Datenstrukturen in der Bioinformatik Zweites
MehrZentrum für Bioinformatik. Übung 4: Revision. Beispielfragen zur Klausur im Modul Angewandte Bioinformatik (erste Semesterhälfte)
Andrew Torda Björn Hansen Iryna Bondarenko Zentrum für Bioinformatik Übung zur Vorlesung Angewandte Bioinformatik Sommersemester 2014 20./23.06.2014 Übung 4: Revision Beispielfragen zur Klausur im Modul
MehrPrimärstruktur. Wintersemester 2011/12. Peter Güntert
Primärstruktur Wintersemester 2011/12 Peter Güntert Primärstruktur Beziehung Sequenz Struktur Proteinsequenzen, Sequenzdatenbanken Sequenzvergleich (sequence alignment) Sequenzidentität, Sequenzhomologie
MehrBioinformatik. Lokale Alignierung Gapkosten. Silke Trißl / Ulf Leser Wissensmanagement in der. Bioinformatik
Bioinformatik Lokale Alignierung Gapkosten Silke Trißl / Ulf Leser Wissensmanagement in der Bioinformatik Inhalt dieser Vorlesung Ähnlichkeit Lokales und globales Alignment Gapped Alignment Silke Trißl:
MehrPairwise Alignment. Steffen Forkmann. Proseminar: BioInformatik
Pairwise Alignment Steffen Forkmann Proseminar: BioInformatik Wintersemester 2004/2005 Inhaltsverzeichnis 1 Problemstellungen 3 1.1 Rechtschreibkorrektur............................... 3 1.2 DNA- und Aminosäure-Sequenzen........................
MehrGleichheit, Ähnlichkeit, Homologie
Gleichheit, Ähnlichkeit, Homologie Identität (identity) Verhältnis der Anzahl identischer Aminosäuren zur Gesamtzahl der Aminosäuren; objektiv Ähnlichkeit (similarity) Verhältnis ähnlicher Aminosäuren
MehrBioinformatik. BLAST Basic Local Alignment Search Tool. Ulf Leser Wissensmanagement in der. Bioinformatik
Bioinformatik BLAST Basic Local Alignment Search Tool Ulf Leser Wissensmanagement in der Bioinformatik Heuristische Alignierung Annotation neuer Sequenzen basiert auf Suche nach homologen Sequenzen in
MehrAlgorithmen auf Sequenzen Paarweiser Sequenzvergleich: Alignments
Algorithmen auf Sequenzen Paarweiser Sequenzvergleich: Alignments Sven Rahmann Genominformatik Universitätsklinikum Essen Universität Duisburg-Essen Universitätsallianz Ruhr Einführung Bisher: Berechnung
MehrKlausur Bioinformatik für Biotechnologen
Name, Vorname: 1 Klausur Bioinformatik für Biotechnologen Studiengang Molekulare Biotechnologie TU Dresden WS 2011/2012 Prof. Michael Schroeder 15.02.2012 Die Dauer der Klausur beträgt 90 Minuten. Bitte
MehrAlgorithmische Anwendungen WS 2005/2006
Algorithmische Anwendungen WS 2005/2006 Sequenzalignment Gruppe F_lila_Ala0506 Allal Kharaz Yassine ELassad Inhaltsverzeichnis 1 Problemstellungen...................................... 3 1.1 Rechtschreibkorrektur...............................
MehrMOL.504 Analyse von DNA- und Proteinsequenzen. Modul 2 BLAST-Sequenzsuche und Sequenzvergleiche
MOL.504 Analyse von DNA- und Proteinsequenzen Modul 2 BLAST-Sequenzsuche und Sequenzvergleiche Summary Modul 1 - Datenbanken Wo finde ich die DNA Sequenz meines Zielgens? Wie erhalte ich Info aus der DNA-Datenbank
MehrAufgabenblatt 5. Silke Trißl Wissensmanagement in der Bioinformatik
Aufgabenblatt 5 Silke Trißl Wissensmanagement in der Bioinformatik Zuerst! FRAGEN? Silke Trißl: Bioinformatik für Biophysiker 2 Exercise 1 + 2 Modify program to compare protein sequence read substitution
MehrAlignments & Datenbanksuchen
WS2015/2016 Genomforschung und Sequenzanalyse - Einführung in Methoden der Bioinformatik- Thomas Hankeln Alignments & Datenbanksuchen 1 break-thru Doolittle et al. 1983, Waterfield et al. 1983 > DB-Suche...
MehrSoftwarewerkzeuge der Bioinformatik
Bioinformatik Wintersemester 2006/2007 Tutorial 2: paarweise Sequenzaligments BLAST Tutorial 2: BLAST 1/22 Alignment Ausrichten zweier oder mehrerer Sequenzen, um: ihre Ähnlichkeit quantitativ zu erfassen
MehrMBI: Sequenz-Vergleich mit Alignment
MBI: Sequenz-Vergleich mit Alignment Bernhard Haubold 28. Oktober 2014 Wiederholung: Was ist Bioinformatik? Historische Übersicht; CABIOS Bioinformatics Gemeinsames Thema: Information in vivo DNA Epigenetik
MehrStudiengang Informatik der FH Gießen-Friedberg. Sequenz-Alignment. Jan Schäfer. WS 2006/07 Betreuer: Prof. Dr. Klaus Quibeldey-Cirkel
Studiengang Informatik der FH Gießen-Friedberg Sequenz-Alignment Jan Schäfer WS 2006/07 Betreuer: Prof. Dr. Klaus Quibeldey-Cirkel Überblick Einführung Grundlagen Wann ist das Merkmal der Ähnlichkeit erfüllt?
MehrAlgorithmische Bioinformatik
Algorithmische Bioinformatik Effiziente Berechnung des Editabstands Dynamische Programmierung Ulf Leser Wissensmanagement in der Bioinformatik Inhalt dieser Vorlesung Rekursive Definition des Editabstands
MehrPraktikum Algorithmischen Anwendungen WS 2006/07 Bioinformatik Sequence-Aligment Team C rot Ala0607
Praktikum Algorithmischen Anwendungen WS 2006/07 Bioinformatik Sequence-Aligment Team C rot Ala0607 Blöink, Frank 11038619 ai600@gm.fh-koeln.de Wolters, Benjamin 11037092 ai651@gm.fh-koeln.de 26. Januar
MehrBioinformatik. BLAST Basic Local Alignment Search Tool. Ulf Leser Wissensmanagement in der. Bioinformatik
Bioinformatik BLAST Basic Local Alignment Search Tool Ulf Leser Wissensmanagement in der Bioinformatik Praktikum Anmeldung bis 10.02.2004 bei Silke Trißl (trissl@informatik.hu-berlin.de) Name, Vorname
MehrHomologie und Sequenzähnlichkeit. Prof. Dr. Antje Krause FH Bingen 06721 / 409 253 akrause@fh-bingen.de
Homologie und Sequenzähnlichkeit Prof. Dr. Antje Krause FH Bingen 06721 / 409 253 akrause@fh-bingen.de Homologie Verwandtschaft aufgrund gleicher Abstammung basiert auf Speziation (Artbildung): aus einer
MehrAlignments & Datenbanksuchen
WS2017/2018 Genomforschung und Sequenzanalyse - Einführung in Methoden der Bioinformatik- Thomas Hankeln Alignments & Datenbanksuchen 1 break-thru Doolittle et al. 1983, Waterfield et al. 1983 > DB-Suche...
MehrAufgabenblatt 4. Silke Trißl Wissensmanagement in der Bioinformatik
Aufgabenblatt 4 Silke Trißl Wissensmanagement in der Bioinformatik Zuerst! FRAGEN? Silke Trißl: Bioinformatik für Biophysiker 2 Exercise 1 Global alignment using dynamic programming Write a program to
MehrAlgorithmen für paarweise Sequenz-Alignments. Katharina Hembach
Proseminar Bioinformatik WS 2010/11 Algorithmen für paarweise Sequenz-Alignments Katharina Hembach 06.12.2010 1 Einleitung Paarweise Sequenz-Alignments spielen in der Bioinformatik eine wichtige Rolle.
MehrMultiple Alignments. Vorlesung Einführung in die Angewandte Bioinformatik Prof. Dr. Sven Rahmann. Webseite zur Vorlesung
Multiple Alignments Vorlesung Einführung in die Angewandte Bioinformatik Prof. Dr. Sven Rahmann Webseite zur Vorlesung http://bioinfo.wikidot.com/ Sprechstunde Mo 16-17 in OH14, R214 Sven.Rahmann -at-
MehrDot-Matrix Methode. (Java) (Javascript) 80
Dot-Matrix Methode Vergleich zweier Sequenzen (DNA oder Aminosäuren) Idee: gleiche Basen (Aminosäuren) in x-y Diagramm markieren Sequenz 1: ADRWLVKQN Sequenz 2: ADKFIVRDE http://myhits.vital-it.ch/cgi-bin/dotlet
MehrProseminar Bioinformatik
Proseminar Bioinformatik Thema Algorithmic Concepsts for Searching in Biological Databases von Uwe Altermann 30.05.2009 1 Einführung Im Folgenden soll ein Überblick über die verschiedenen algorithmischen
MehrWas ist Bioinformatik?
9. Kurstag: Bioinformatik Der Begriff "Bioinformatik" wurde 1989 erstmals von D.R. Masys im JOURNAL OF RESEARCH OF THE NATIONAL INSTITUTE OF STANDARDS AND TECHNOLOGY erwähnt. Was ist Bioinformatik? Die
MehrEinführung in die Bioinformatik
Einführung in die Bioinformatik Ringvorlesung Biologie Sommer 07 Burkhard Morgenstern Institut für Mikrobiologie und Genetik Abteilung für Bioinformatik Goldschmidtstr. 1 Online Materialien zur Ringvorlesung:
MehrAlignment von DNA- und Proteinsequenzen
WS2012/2013 Genomforschung und Sequenzanalyse - Einführung in Methoden der Bioinformatik- Thomas Hankeln Alignment von DNA- und Proteinsequenzen das vielleicht wichtigste Werkzeug der Bioinformatik! 1
MehrBioinformatik. Substitutionsmatrizen BLAST. Ulf Leser Wissensmanagement in der. Bioinformatik
Bioinformatik Substitutionsmatrizen BLAST Ulf Leser Wissensmanagement in der Bioinformatik Inhalt dieser Vorlesung Substitutionsmatrizen: PAM und BLOSSUM Suche in Datenbanken: Basic Local Alignment Search
MehrBioinformatik für Lebenswissenschaftler
Bioinformatik für Lebenswissenschaftler Oliver Kohlbacher, Steffen Schmidt SS 2010 06. Paarweises Alignment Teil II Abt. Simulation biologischer Systeme WSI/ZBIT, Eberhard Karls Universität Tübingen Übersicht
MehrBCDS Seminar. Protein Tools
BCDS Seminar Protein Tools Gliederung Nützliche Tools Three-/one-letter Amino Acids' Сodes RandSeq Random Protein Sequence Generator Protein Colourer ProtParam PeptideCutter ProtScale TMHMM Server 2.0
MehrThreading - Algorithmen
Threading - Algorithmen Florian Lindemann 22.11.2007 Florian Lindemann () Threading - Algorithmen 22.11.2007 1 / 25 Gliederung 1 Prospect Scoring Function Algorithmus Weitere Eigenschaften Komplexität
MehrVerbesserung der dotplot Methode
erbesserung der dotplot Methode binäre Information: "x" oder " " besser: "mehr" oder "weniger" ähnlich Gruppen von Aminosäuren mit ähnlichen Eigenschaften bilden bestes Alignment: optimiere Häufigkeit
MehrBiowissenschaftlich recherchieren
Biowissenschaftlich recherchieren Uber den Einsatz von Datenbanken und anderen Ressourcen der Bioinformatik Nicola Gaedeke Birkhauser Basel Boston Berlin Inhaltsverzeichnis Vorwort xi 1 Die Informationssucheim
MehrIhre Namen: Gruppe: Öffnen Sie die Fasta-Dateien nur mit einem Texteditor, z.b. Wordpad oder Notepad, nicht mit Microsoft Word oder Libre Office.
Ihre Namen: Gruppe: Evolutionsbiologie 2, WS2016/2017: Bioinformatik - Übung 1 Erstellen Sie vor Beginn der Übung einen Ordner auf dem Desktop, in dem Sie alle benötigten Dateien speichern kö nnen (z.b.
MehrAlgorithmen und Datenstrukturen in der Bioinformatik Erstes Übungsblatt WS 05/06 Musterlösung
Konstantin Clemens Johanna Ploog Freie Universität Berlin Institut für Mathematik II Arbeitsgruppe für Mathematik in den Lebenswissenschaften Algorithmen und Datenstrukturen in der Bioinformatik Erstes
MehrEinführung in die Bioinformatik
Einführung in die Bioinformatik SS 2014 1. Was ist Bioinformatik? Kay Nieselt Integrative Transkriptomik Zentrum für Bioinformatik Tübingen Kay.Nieselt@uni-tuebingen.de Ablauf und Formales Ringvorlesung
MehrBioinformatik für Biochemiker
Bioinformatik für Biochemiker Oliver Kohlbacher W 2009/2010 7. Datenbanksuche Abt. imulation biologischer ysteme WI/ZBIT, Eberhard Karls Universität Tübingen Übersicht Datenbanksuche statt Alignment Heuristiken:
MehrAlgorithmen und Datenstrukturen in der Bioinformatik Drittes Übungsblatt WS 05/06 Musterlösung
Konstantin Clemens Johanna Ploog Freie Universität Berlin Institut für Mathematik II Arbeitsgruppe für Mathematik in den Lebenswissenschaften Algorithmen und Datenstrukturen in der Bioinformatik Drittes
MehrÜbung 6: Structure Comparison 1
Andrew Torda Björn Hansen Zentrum für Bioinformatik Übung zur Vorlesung Grundlagen der Strukturanalyse Wintersemester 2016/2017 12.12.2016 Übung 6: Structure Comparison 1 1. Einführung In der vorliegenden
MehrEinführung in die Bioinformatik
Einführung in die Bioinformatik SS 2013 1. Was ist Bioinformatik? Kay Nieselt Integrative Transkriptomik Zentrum für Bioinformatik Tübingen Kay.Nieselt@uni-tuebingen.de Ablauf und Formales Ringvorlesung
MehrSequenzen-Alignierung in der Bioinformatik. VO Algorithm Engineering Professor Dr. Petra Mutzel Lehrstuhl für Algorithm Engineering, LS11
Sequenzen-Alignierung in der Bioinformatik VO Algorithm Engineering Professor Dr. Petra Mutzel Lehrstuhl für Algorithm Engineering, LS11 23. VO 24.01.2006 1 1 Literatur für diese VO Volker Heun: Skriptum
MehrAlgorithmische Bioinformatik 1
Algorithmische Bioinformatik 1 Dr. Hanjo Täubig Lehrstuhl für Effiziente Algorithmen (Prof. Dr. Ernst W. Mayr) Institut für Informatik Technische Universität München Sommersemester 2009 Übersicht Paarweises
MehrGrundlagen der Bioinformatik
rundlagen der Bioinformatik Vergleich von DN - Sequenzen Ulf Leser Wissensmanagement in der Bioinformatik Ulf Leser: Proseminar Bioinformatik, SoSe 2008 3 Was ist ein en? C C C C Chromosom DN C C C RN
MehrÜbungsaufgaben Sequezvergleich mit Alignment Studenten-Version mit Lösungen
Übungsaufgaben Sequezvergleich mit Alignment Studenten-Version mit Lösungen Bernhard Haubold 6. November 2013 1 Zuallererst Bitte die Lösungen zu den Aufgaben 4.3 and 4.4 abgeben. Drucke dazu die ersten
MehrKapitel 7: Sequenzen- Alignierung in der Bioinformatik
Kapitel 7: Sequenzen- Alignierung in der Bioinformatik 7.3: Paarweise Sequenzen-Alignierung 7.4: Multiple Sequenzen Alignierung VO Algorithm Engineering Professor Dr. Petra Mutzel Lehrstuhl für Algorithm
MehrVL Algorithmische BioInformatik (19710) WS2013/2014 Woche 3 - Montag
VL Algorithmische BioInformatik (19710) WS2013/2014 Woche 3 - Montag Tim Conrad AG Medical Bioinformatics Institut für Mathematik & Informatik, Freie Universität Berlin Vorlesungsthemen Part 1: Background
MehrAlignment von DNA- und Proteinsequenzen
WS2017/2018 Genomforschung und Sequenzanalyse - Einführung in Methoden der Bioinformatik- Thomas Hankeln Alignment von DNA- und Proteinsequenzen das vielleicht wichtigste Werkzeug der Bioinformatik! 1
Mehr1/10. Ihre Namen: Gruppe: Evolutionsbiologie 2, WS2015/2016: Bioinformatik - Übung 1
Ihre Namen: Gruppe: Evolutionsbiologie 2, WS2015/2016: Bioinformatik - Übung 1 Erstellen Sie bitte vor Beginn der Übung einen Ordner auf dem Desktop, in dem Sie alle benötigten Dateien speichern können
MehrLokale Sequenzähnlichkeit. Genomische Datenanalyse 9. Kapitel
Lokale Sequenzähnlichkeit Genomische Datenanalyse 9. Kapitel Globale Sequenzähnlichkeit: Zwei Cytochrome C Sequenzen: Eine vom Menschen und eine aus der Maus. Die Sequenzen sind gleich lang, man kann sie
MehrMOL.504 Analyse von DNA- und Proteinsequenzen. Übungsaufgaben BLAST-Sequenzsuche und -vergleiche
MOL.504 Analyse von DNA- und Proteinsequenzen Übungsaufgaben BLAST-Sequenzsuche und -vergleiche Ü6a blastn und blastx Verwenden Sie die in Übung 3 (Datenbanken) gefundene yqjm-sequenz aus Bacillus subtilis
MehrAlgorithmen auf Sequenzen
Algorithmen auf Sequenzen Fehlertolerante Mustersuche: Distanz- und Ähnlichkeitsmaße Sven Rahmann Genominformatik Universitätsklinikum Essen Universität Duisburg-Essen Universitätsallianz Ruhr Einführung
MehrV2 Paarweises Sequenzalignment
Methoden des Sequenzalignments V2 Paarweises Sequenzalignment Austauschmatrizen Bedeutsamkeit von Alignments BLAST, Algorithmus Parameter Ausgabe http://www.ncbi.nih.gov Diese Vorlesung lehnt sich eng
MehrAlignments & Datenbanksuchen
WS2016/2017 F1-Praktikum Genomforschung und Sequenzanalyse: Einführung in Methoden der Bioinformatik Thomas Hankeln Alignments & Datenbanksuchen 1 Wiederholung Alignments Dynamic Programming Needleman-Wunsch:
MehrQuantifizierung evolutionärer Veränderungen
Quantifizierung evolutionärer Veränderungen Begriff der Homologie/Homoplasie Methoden des Sequenzvergleichs/Alignments Verfahren und Modelle zur Berechnung von Austauschraten in DNA und Proteinen Thomas
MehrBachelorarbeit. Paarweise und multiple Alignments mit TBLASTX und DIALIGN
Georg-August-Universität Göttingen Zentrum für Informatik ISSN Nummer 1612-6793 ZFI-BM-2005-28 Bachelorarbeit im Studiengang Angewandte Informatik Paarweise und multiple Alignments mit TBLASTX und DIALIGN
MehrBLAST. Ausarbeitung zum Proseminar Vortag von Nicolás Fusseder am 24.10.02
BLAST Ausarbeitung zum Proseminar Vortag von Nicolás Fusseder am 24.10.02 BLAST (Basic Local Alignment Search Tool) hat seit seiner Veröffentlichung, von Altschul et al. im Jahre 1990, an großer Relevanz
MehrAlgorithmische Bioinformatik
lgorithmische Bioinformatik Stringalignment Ulf Leser Wissensmanagement in der Bioinformatik Inhalt dieser Vorlesung pproximative Stringvergleiche Dotplots Edit-bstand und lignment Naiver lgorithmus Ulf
MehrÜbung 1 Bioinformatik. Ihre Namen:
Evolutionsbiologie 2 Übung 1 Bioinformatik WS2018/2019 Ihre Namen: llgemeine Hinweise: Für die Zulassung zur Klausur muss dieses Übungsblatt bearbeitet und als bestanden bewertet sein. Sie können das Übungsblatt
MehrV2 Paarweises Sequenzalignment
Methoden des Sequenzalignments V2 Paarweises Sequenzalignment Austauschmatrizen Bedeutsamkeit von Alignments BLAST, Algorithmus Parameter Ausgabe http://www.ncbi.nih.gov Diese Vorlesung lehnt sich eng
MehrSequenz Alignment Teil 2
Sequenz Alignment Teil 2 14.11.03 Vorlesung Bioinformatik 1 Molekulare Biotechnologie Dr. Rainer König Besonderen Dank an Mark van der Linden, Mechthilde Falkenhahn und der Husar Biocomputing Service Gruppe
MehrAlgorithmen auf Sequenzen
Algorithmen auf Sequenzen Vorlesung von Prof. Dr. Sven Rahmann im Sommersemester 2008 Kapitel 6 Alignments Webseite zur Vorlesung http://ls11-www.cs.tu-dortmund.de/people/rahmann/teaching/ss2008/algorithmenaufsequenzen
MehrSequenzvergleiche ohne Alignments durch lokales Dekodieren von Sequenzen
durch lokales Dekodieren von Sequenzen (16. Juli 2007) Inhalt 1 Grundidee 2 Naiver Algorithmus Definitionen Lokales N-Dekodieren Ermittlung der Distanzmatrix Aussagefähigkeit der Distanzen 3 Verbesserungen
MehrFakultät für Informatik Übung zu Kognitive Systeme Sommersemester Lösungsblatt 4 Maschinelles Lernen und Spracherkennung
Fakultät für Informatik Übung zu Kognitive Systeme Sommersemester 216 M. Sperber (matthias.sperber@kit.edu) S. Nguyen (thai.nguyen@kit.edu) Lösungsblatt 4 Maschinelles Lernen und Spracherkennung Aufgabe
MehrDatenbanken in der Bioinformatik
Datenbanken in der Bioinformatik Kapitel 3 Sequenzierung und Genexpressionsanalyse http://dbs.uni-leipzig.de Institut für Informatik Vorläufiges Inhaltsverzeichnis 1. Grundlagen 2. Klassifizierung von
MehrMBI: Sequenzvergleich ohne Alignment
MBI: Sequenzvergleich ohne Alignment Bernhard Haubold 12. November 2013 Wiederholung Exaktes & inexaktes Matching Das exakte Matching Problem Naive Lösung Präprozessierung Muster(Pattern): Z-Algorithmus,
MehrBioinformatik Für Biophysiker
Bioinformatik Für Biophysiker Sommersemester 2009 Silke Trißl / Ulf Leser Wissensmanagement in der Bioinformatik Wissensmanagement in der Bioinformatik Schwerpunkte Algorithmen der Bioinformatik Management
MehrÜbungsblatt Molekularbiologie und Genetik für Studierende der Bioinformatik II 1. Übung
Übungsblatt Molekularbiologie und Genetik für Studierende der Bioinformatik II 1 Name des Studierenden: Datum: Einführung Übung Bitte bereiten Sie folgende Probleme vor der Übung am Mittwoch. Die Klausur
MehrAnwendungen von HMM. Kapitel 1 Spezialvorlesung Modul (Fortgeschrittene Methoden in der Bioinformatik) Jana Hertel
Anwendungen von HMM Kapitel 1 Spezialvorlesung Modul 10-202-2206 (Fortgeschrittene Methoden in der Bioinformatik) Jana Hertel Professur für Bioinformatik Institut für Informatik Universität Leipzig Machine
MehrAlgorithmische Bioinformatik
Algorithmische Bioinformatik Multiple Sequence Alignment Sum-of-pairs Score Center-Star Score Ulf Leser Wissensmanagement in der Bioinformatik Ziel dieser Vorlesung Aufgabenstellung Multiples Sequenzalignment
MehrFakultät für Informatik Übung zu Kognitive Systeme Sommersemester Lösungsblatt 4 Maschinelles Lernen und Spracherkennung
Fakultät für Informatik Übung zu Kognitive Systeme Sommersemester 2018 S. Constantin (stefan.constantin@kit.edu) S. Nguyen (thai.nguyen@kit.edu) Lösungsblatt 4 Maschinelles Lernen und Spracherkennung Aufgabe
MehrBioinformatik. Alignment mit linearem Platzbedarf K-Band Alignment. Ulf Leser Wissensmanagement in der. Bioinformatik
Bioinformatik Alignment mit linearem Platzbedarf K-Band Alignment Ulf Leser Wissensmanagement in der Bioinformatik Ankündigungen Gastvortrag: Morgen Dr. Klein, Metanomics GmbH Bioinformatik in der Pflanzengenomik
Mehr6. Algorithmen auf Zeichenketten
6. Algorithmen auf Zeichenketten Motivation Wir lernen nun Algorithmen zur Lösung verschiedener elementarer Probleme auf Zeichenketten zu lösen Zeichenketten spielen eine wichtige Rolle in diversen Gebieten
MehrEinführung in die Bioinformatik
Einführung in die Bioinformatik SS 2012 1. Was ist Bioinformatik? Kay Nieselt Integrative Transkriptomik Zentrum für Bioinformatik Tübingen Kay.Nieselt@uni-tuebingen.de Ablauf und Formales Ringvorlesung
MehrFakultät für Informatik Übung zu Kognitive Systeme Sommersemester 2018
Fakultät für Informatik Übung zu Kognitive Systeme Sommersemester 2018 S. Constantin (stefan.constantin@kit.edu) S. Nguyen (thai.nguyen@kit.edu) Übungsblatt 4 Maschinelles Lernen und Spracherkennung Abgabe
MehrEvolution & Genetik (Beispiel Hämoglobin) Prof. Dr. Antje Krause FH Bingen 06721 / 409 253 akrause@fh-bingen.de
Evolution & Genetik (Beispiel Hämoglobin) Prof. Dr. Antje Krause FH Bingen 06721 / 409 253 akrause@fh-bingen.de DNA (Desoxyribonukleinsäure) 5 3 CGATGTACATCG GCTACATGTAGC 3 5 Doppelhelix Basen: Adenin,
MehrEinführung in die Angewandte Bioinformatik: Sequenzähnlichkeit, Alignment, BLAST
Einführung in die Angewandte Bioinformatik: Sequenzähnlichkeit, Alignment, BLAST 28.05.2009 Prof. Dr. Sven Rahmann 1 Sequenzvergleich: Motivation Hat man bereits die DNA-Sequenz eines Gens, oder die Aminosäuresequenz
MehrBayesianische Netzwerke - Lernen und Inferenz
Bayesianische Netzwerke - Lernen und Inferenz Manuela Hummel 9. Mai 2003 Gliederung 1. Allgemeines 2. Bayesianische Netzwerke zur Auswertung von Genexpressionsdaten 3. Automatische Modellselektion 4. Beispiel
MehrAlignment-Verfahren zum Vergleich biologischer Sequenzen
zum Vergleich biologischer Sequenzen Hans-Joachim Böckenhauer Dennis Komm Volkshochschule Zürich. April Ein biologisches Problem Fragestellung Finde eine Methode zum Vergleich von DNA-Molekülen oder Proteinen
MehrV2 Paarweises Sequenzalignment
Methoden des Sequenzalignments V2 Paarweises Sequenzalignment Austauschmatrizen Bedeutsamkeit von Alignments BLAST, Algorithmus Parameter Ausgabe http://www.ncbi.nih.gov Diese Vorlesung lehnt sich eng
MehrGrundlagen der Bioinformatik Assignment 3: Hierarchical Clustering SS Yvonne Lichtblau/Johannes Starlinger
Grundlagen der Bioinformatik Assignment 3: Hierarchical Clustering SS 2017 Yvonne Lichtblau/Johannes Starlinger Presentations Assignment 2 Yvonne Lichtblau Übungen Grundlagen der Bioinformatik SS 2017
Mehr7. Anhang. 7. Anhang. Abbildung 7.1: Aminosäuresequenz AtMYC2 im Wildtyp und in jin1. Unterschiede zwischen den Sequenzen sind rot unterlegt.
7. Anhang 10 20 30 40 50 60 70 80 90 100 jin1 MTDYRLQPTMNLWTTDDNASMMEAFMSSSDISTLWPPASTTTTTATTETTPTPAMEIPAQAGFNQETLQQRLQALIEGTHEGWTYAIFWQPSYDFSGASV AtMYC2 MTDYRLQPTMNLWTTDDNASMMEAFMSSSDISTLWPPASTTTTTATTETTPTPAMEIPAQAGFNQETLQQRLQALIEGTHEGWTYAIFWQPSYDFSGASV
MehrEinführung in die Bioinformatik Algorithmen zur Sequenzanalyse
Einführung in die Bioinformatik Algorithmen zur Sequenzanalyse!! Vorläufige Fassung, nur einzelne Abschnitte!!!! Enthält wahrscheinlich noch viele Fehler!!!! Wird regelmäßig erweitert und verbessert!!
MehrBioinformatik für Lebenswissenschaftler
Bioinformatik für Lebenswissenschaftler Oliver Kohlbacher, Steffen Schmidt SS 2010 11. Hiden Markov Models & Phylogenien Abt. Simulation biologischer Systeme WSI/ZBIT, Eberhard Karls Universität Tübingen
MehrBioinformatik für Lebenswissenschaftler
Bioinformatik für Lebenswissenschaftler Oliver Kohlbacher, Steffen Schmidt SS 2010 11. Hiden Markov Models & Phylogenien Abt. Simulation biologischer Systeme WSI/ZBIT, Eberhard Karls Universität Tübingen
MehrSequenzvergleich und Datenbanksuche
Sequenzvergleich und Datenbanksuche Vorlesung Einführung in die Angewandte Bioinformatik Prof. Dr. Sven Rahmann Webseite zur Vorlesung http://bioinfo.wikidot.com/ Sprechstunde Mo 16-17 in OH14, R214 Sven.Rahmann
MehrAlgorithmische Bioinformatik
lgorithmische Bioinformatik pproximatives Stringmatching Edit-bstand Ulf Leser Wissensmanagement in der Bioinformatik Ziele dieser Vorlesung Einstieg in exaktes approximatives Stringmatching Bedeutung
MehrMikroRNA-Bioinformatik. Annalisa Marsico High-throughput Genomics, FU Berlin
MikroRNA-Bioinformatik Annalisa Marsico High-throughput Genomics, FU Berlin 07.12.2016 Lernziele Einführung in die Welt der nicht-kodierenden RNAs Inbesondere mikrorna Molekulare Funktionen von micrornas
MehrPaarweises Sequenzalignment
Methoden des Sequenzalignments Paarweises Sequenzalignment Áustauschmatrizen Bedeutsamkeit von Alignments BLAST, Algorithmus Parameter Ausgabe http://www.ncbi.nih.gov Diese Vorlesung lehnt sich eng an
MehrAlgorithmische Bioinformatik
FREIE UNIVERSITÄT BERLIN Fachbereich Mathematik und Informatik Institut für Informatik (WE 3) FU BERLIN Freie Universität Berlin FB Mathematik und Informatik, Institut für Informatik, Takustr. 9, D-14195
MehrProblemseminar. Multiple alignment by sequence annealing. Ariel S. Schwartz and Lior Pachter
Problemseminar Multiple alignment by sequence annealing Ariel S. Schwartz and Lior Pachter 0.Gliederung 1.Alignment posets Gliederung 1. Einführung 2. Alignment Posets 1. Einführung Progressives Alignment
MehrVortrag 2: Proteinsequenzen und Substitutionsmatrizen
Vortrag 2: Proteinsequenzen und Substitutionsmatrizen Was sind Proteinsequenzen? Die DNA-Forschung hat sich auf spezielle Abschnitte auf den Strängen der DNA-Moleküle konzentriert, den sog. Protein-codierenden
MehrBioinformatik. Multiple String Alignment I. Ulf Leser Wissensmanagement in der. Bioinformatik
Bioinformatik Multiple String Alignment I Ulf Leser Wissensmanagement in der Bioinformatik BLAST2: Zwei-Hit-Strategie Original: Alle Hits mit Score > t werden zu MSPs verlängert Extensionen fressen >90%
MehrKapitel 7: Sequenzen- Alignierung in der Bioinformatik
Kapitel 7: Sequenzen- Alignierung in der Bioinformatik VO Algorithm Engineering Professor Dr. Petra Mutzel Lehrstuhl für Algorithm Engineering, LS11 19. VO 14. Juni 2007 1 Literatur für diese VO Volker
MehrAlgorithmische Bioinformatik
Algorithmische Bioinformatik Multiple Sequence Alignment Sum-of-pairs Score Center-Star Score Ulf Leser Wissensmanagement in der Bioinformatik Inhalt dieser Vorlesung Multiples Sequenzalignment Sum-Of-Pair
Mehr