MBI: Sequenz-Vergleich mit Alignment
|
|
- Leander Waltz
- vor 6 Jahren
- Abrufe
Transkript
1 MBI: Sequenz-Vergleich mit Alignment Bernhard Haubold 28. Oktober 2014
2 Wiederholung: Was ist Bioinformatik? Historische Übersicht; CABIOS Bioinformatics Gemeinsames Thema: Information in vivo DNA Epigenetik RNA (Protein) in silico Algorithmen & Datenstrukturen Datenbanken
3 Nachtrag: Sequenzvergleich : Sequenzvergleich mit Alignment : Exakte Textsuche + Übung 16: : Sequenzvergleich ohne Alignment + Übung 16: : Evolution von DNA-Sequenzen + Übung 16: : Anwendungen 2. Dezember: Epigenetik + Übung 16:30
4 Nachtrag: M. genitalium: Annotationen? grep [0-9]\.\.[0-9] l43967.gbk awk {print $1} sort uniq -c sort -n 1 misc_feature 1 source 2 variation 3 rrna 4 misc_rna 36 trna 476 CDS 525 gene
5 Nachteil: M. genitalium: Protein-codierend? cchar l43967.fasta # Total number of input characters: grep CDS l43967.gbk sed -E s/\.\./\t/;s/complement//;s/\)//;s/\(// awk {s+=$3-$2+1}end{print s/580076} 0.91
6 Nachtrag: Kursstruktur Einführung Bernhard Haubold Plön DNA & Epigenetik Bernhard Haubold Plön RNA Kurt Fellenberg Borstel Datenbanken Steffen Möller Lübeck
7 Übersicht: Alignment Scoring DNA Protein Algorithmus: Optimal Global Lokal Varianten Multiples Alignment Schnelles globales Alignment: MUMmer Schnelles lokales Alignment: BLAST
8 Was ist ein Alignment? Betrachte zwei Sequenzen,AACGT undaccgtt; sechs der 3653 möglichen globalen Alignments sind: AACGT- -AACGT A-ACGT AACGT---- AA-CGT- -A-A-C-G-T- ACCGTT ACCGTT ACCGTT ---ACCGTT A-CCGTT A-C-C-G-T-T Alle gleich sinnvoll?
9 Biologische Interpretation Schreibe homologe Merkmale übereinander AACGT- -AACGT A-ACGT AACGT---- AA-CGT- -A-A-C-G-T- ACCGTT ACCGTT ACCGTT ---ACCGTT A-CCGTT A-C-C-G-T-T Ziel: Ähnlichkeit maximieren Evol. Schritte minimieren
10 Warum Alignieren? Ähnliche Sequenzen haben ähnliche Funktion
11 Arten von Alignment Global Local
12 Alignments Scoren Alphabet DNA: Match/Mismatch; z. B. match = 1; mmatch = 1 Protein: Substitutionsmatrix Gap Öffnen g o ; z. B. g o = 2 Erweitern: g e ; e.g. g e = 1 Affine Gap-Kosten: g = g o + g e l AA-GTT AACGTT
13 Substitutionsmatrix: BLOSUM62 A R N D C Q E G H I L K M F P S T W Y V A R N D C Q E G H I L K M F P S T W Y V
14 Zahl der Alignments Drei mögliche Enden eines Alignments N - N N - N Rekursion: f(m, n) = f(m 1, n)+f(m 1, n 1)+f(m, n 1) Stop-Bedingung: f(m, 0) = f(0, n) = f(0, 0) = 1
15 Rekursion: Top Down f(m, n) = f(m 1, n)+f(m 1, n 1)+f(m, n 1) f(m, 0) = f(0, n) = f(0, 0) = 1 f(2, 3)?
16 Top-Down Rekursion Visualisieren f(2, 3) f(1, 3) f(1, 2) f(2, 2) f(0, 3) f(0, 2) f(1, 2) f(0, 2) f(0, 1) f(1, 1) f(1, 2) f(1, 1) f(2, 1) f(0, 2) f(0, 1) f(1, 1) f(0, 1) f(0, 0) f(1, 0) f(0, 2) f(0, 1) f(1, 1) f(0, 1) f(0, 0) f(1, 0) f(1, 1) f(1, 0) f(2, 0) f(0, 1) f(0, 0) f(1, 0) f(0, 1) f(0, 0) f(1, 0) f(0, 1) f(0, 0) f(1, 0) Software demo: numal -t -m 2 -n 3,numAl -t -m 13 -n 13
17 Bottom Up Start Initialisieren Ausfüllen Software demo: numal -m 2 -n 3,numAl -m 100 -n 100
18 Geschlossene Formel? f(2, 3) f(1, 3) f(1, 2) f(2, 2) f(0, 3) f(0, 2) f(1, 2) f(0, 2) f(0, 1) f(1, 1) f(1, 2) f(1, 1) f(2, 1) f(0, 2) f(0, 1) f(1, 1) f(0, 1) f(0, 0) f(1, 0) f(0, 2) f(0, 1) f(1, 1) f(0, 1) f(0, 0) f(1, 0) f(1, 1) f(1, 0) f(2, 0) f(0, 1) f(0, 0) f(1, 0) f(0, 1) f(0, 0) f(1, 0) f(0, 1) f(0, 0) f(1, 0) f(n, n)?
19 Geschlossene Formel lim f(n, n) n ( 1+ 2 n ) 2n+1 The proof is lengthy and omitted here (Waterman (1995). Introduction to Computational Biology, p. 187)
20 Geschichte Jahr Autoren Algorithm 1970 Needleman & Wunsch optimal: global 1981 Smith & Waterman optimal: local 1988 Pearson & Lipman heuristisch: FASTA 1990 Altshul et al. heuristisch: BLAST 1997 Altshul et al. heuristisch: gapped BLAST
21 Dynamisches Programmieren Algorithmus 1. Initialisierung 2. Rekursion: Zwischenergebnis n+1 = f (Zwischenergebnis n ) 3. Trace Back: Lösung Pfad durch Programmiermatrix
22 Globales Alignment, Initialisation Scoringschema: match = 1, mismatch = 1, gap_oeffnen = 0, gap_erweitern = 1. F(i, j) A C C G T T A 1-1 G 2-2 T 3-3 T 4-4 A 5-5 C 6-6
23 Ausfüllen Schoreschema: match = 1, mismatch = 1, gap_oeffnen = 0, gap_erweitern = 1. F(i, j) A C C G T T ց A 1-1 G 2-2 T 3-3 T 4-4 A 5-5 C 6-6
24 Ausgefüllte DP Matrix Scoreschema: match = 1, mismatch = 1, gap_oeffnen = 0, gap_erweitern = 1. F(i, j) A C C G T T A G T T A C
25 Traceback Scoreschema: match = 1, mismatch = 1, gap_oeffnen = 0, gap_erweitern = 1. F(i, j) A C C G T T A G T T A C
26 Software Demo bioinformer
27 Rekursion für globales Alignment F(i, 0) = F(0, i) = i g F(i 1, j)+g F(i, j) = max F(i 1, j 1)+s(i, j) F(i, j 1)+g Traceback: Von der unteren rechten Zelle bis zur oberen linken.
28 Rekursion für lokales Alignment F(i, 0) = F(0, i) = 0 F(i 1, j)+g F(i 1, j 1)+s(i, j) F(i, j) = max F(i, j 1)+g 0 Traceback: Vom Maximum bis Null Bemerke: Diese Rekursion funktioniert nur, wenn der Score für ein zufälliges Paar von Nukleotiden < 0.
29 Software Demo bioinformer
30 Eindeutigkeit? > 1 co-optimale Pfade durch Programmiermatrix bei lokalen Alignments: > 1 Startpunkte in Programmiermatrix
31 Raum- & Zeitbedarf Zeit Raum O(m n) O(m n)
32 Score in Linearem Raum A B C D Zeit Raum O(m n) O(m); m = min(m, n)
33 Optimales Multiples Alignment N A V DPQV AG N A V G A D P Q V
34 Paarweises Alignieren von Alignments Betrachte zwei Alignments; A T A - Sie können auf drei verschiedene Weisen aligniert werden: A A- -A A A- -A T -T T Was ist der Score?
35 Paarsummen-Score Score einer Spalte im multiplen Alignment ist die Summe der paarweisen Scores Beispiel: Match = 1, Mismatch = -1, Gap = -1; Score von A A - - ist = 3. Alignment zweier ignoriert bei der Scoreberechnung. Keine Spalte aus Gaps.
36 Reihenfolge Reihenfolge der paarweisen Alignments beeinflusst Ergebnis Regel des progressiven Alignments: aligniere zuerst die ähnlichsten Sequenzen
37 Progressives Alignment S1 S2 S3 S4 S5 Paarweise Phase S1 S2 S3 S4 S5 S1 S2 S3 S4 S S2 S3 S1 S5 S2 S3 S1 S5 S4 Multiple Phase S2 S3 S1 S5 S4 Abstand S2 S3 S1 S5 Neue Gap
38 Globales schnelles Alignment: MUMmer Identifiziere alle Maximal Unique Matches (MUMs) MUM: Exakter Match zwischen zwei Genomen, der nicht erweitert werden kann Beispiel G 1 =GGCAATTAGG, G 2 =TGCAATCAGG Finde längste ansteigende Subsequenz von MUMs Fülle die Lücken zwischen den MUMs
39 Sortier-Schritt von MUMmer Genom A Genom B Genom A Genom B
40 Software Demonstration: MUMmer Vergleiche zwei Escherichia coli Stämme K12: 4.6 Mb O157H7: 5.5 Mb mummer -mum -b -c ecoli_k12.fasta ecoli_o157h7.fasta > mummer.mums mummerplot mummer.mums -p mummer.ps -t postscript
41 MUMmer Ergebnis E. coli O157H7 (Mb) E. coli K12 (Mb)
42 BLAST Programme Programm Query Subject (Database) blastn N N blastp P P blastx N P tblastn P N tblastx N N Merke: Proteine sind besser konserviert als Nukleotide.
43 BLAST Algorithmus I Query A B Subject C Subject MSP 1 MSP 2 MSP: Maximal Scoring Pair
44 MSP 1 MSP 2 PAARWEISES ALIGNMENT MULTIPLES ALIGNMENT SCHNELLES ALIGNMENT BLAST Algorithmus II Query A B Subject C Subject query pattern, subject text Query präprozessieren (hauptsächlich) In Subject nach k-mers suchen Ursprünglich (1990) ungapped wie nützlich ist das?
45 Beispiel-Anwendung vonsblast Schneide bei 3.0 Mb 1 kb aus K12 Suche Treffer Wortliste E. coli O157H7 (Mb) E. coli K12 (Mb)
46 Beispiel mit NCBI-BLAST Gapped seit 1997 makeblastdb -in ecoli_o157h7.fasta -out ecoli_o157h7 -dbtype nucl blastn -query ecoli_k12_1.fasta -db ecoli_o157h7 -outfmt 6
47 Literatur Optimales Alignment: Haubold & Wiehe, 2. Kapitel Schnelles Alignment: Haubold & Wiehe, 4. Kapitel Multiples Alignment: Haubold & Wiehe, 5. Kapitel
48 Zusammenfassung Scoring DNA Protein Algorithmus: Optimal Global Lokal Varianten Multiples Alignment: alles paarweise; Paarsummen-Score Schnelles Alignment: Exaktes Matching zur Verkleinerung des Suchraums Global: MUMmer Lokal: BLAST
Bioinformatik. Lokale Alignierung Gapkosten. Silke Trißl / Ulf Leser Wissensmanagement in der. Bioinformatik
Bioinformatik Lokale Alignierung Gapkosten Silke Trißl / Ulf Leser Wissensmanagement in der Bioinformatik Inhalt dieser Vorlesung Ähnlichkeit Lokales und globales Alignment Gapped Alignment Silke Trißl:
MehrMOL.504 Analyse von DNA- und Proteinsequenzen. Modul 2 BLAST-Sequenzsuche und Sequenzvergleiche
MOL.504 Analyse von DNA- und Proteinsequenzen Modul 2 BLAST-Sequenzsuche und Sequenzvergleiche Summary Modul 1 - Datenbanken Wo finde ich die DNA Sequenz meines Zielgens? Wie erhalte ich Info aus der DNA-Datenbank
MehrBLAST. Ausarbeitung zum Proseminar Vortag von Nicolás Fusseder am 24.10.02
BLAST Ausarbeitung zum Proseminar Vortag von Nicolás Fusseder am 24.10.02 BLAST (Basic Local Alignment Search Tool) hat seit seiner Veröffentlichung, von Altschul et al. im Jahre 1990, an großer Relevanz
MehrSequenz Alignment Teil 2
Sequenz Alignment Teil 2 14.11.03 Vorlesung Bioinformatik 1 Molekulare Biotechnologie Dr. Rainer König Besonderen Dank an Mark van der Linden, Mechthilde Falkenhahn und der Husar Biocomputing Service Gruppe
MehrAlignment-Verfahren zum Vergleich biologischer Sequenzen
zum Vergleich biologischer Sequenzen Hans-Joachim Böckenhauer Dennis Komm Volkshochschule Zürich. April Ein biologisches Problem Fragestellung Finde eine Methode zum Vergleich von DNA-Molekülen oder Proteinen
MehrKapitel 7: Sequenzen- Alignierung in der Bioinformatik
Kapitel 7: Sequenzen- Alignierung in der Bioinformatik VO Algorithm Engineering Professor Dr. Petra Mutzel Lehrstuhl für Algorithm Engineering, LS11 19. VO 14. Juni 2007 1 Literatur für diese VO Volker
MehrStudiengang Informatik der FH Gießen-Friedberg. Sequenz-Alignment. Jan Schäfer. WS 2006/07 Betreuer: Prof. Dr. Klaus Quibeldey-Cirkel
Studiengang Informatik der FH Gießen-Friedberg Sequenz-Alignment Jan Schäfer WS 2006/07 Betreuer: Prof. Dr. Klaus Quibeldey-Cirkel Überblick Einführung Grundlagen Wann ist das Merkmal der Ähnlichkeit erfüllt?
MehrVL Algorithmische BioInformatik (19710) WS2013/2014 Woche 3 - Montag
VL Algorithmische BioInformatik (19710) WS2013/2014 Woche 3 - Montag Tim Conrad AG Medical Bioinformatics Institut für Mathematik & Informatik, Freie Universität Berlin Vorlesungsthemen Part 1: Background
MehrVorlesung Einführung in die Bioinformatik
Vorlesung Einführung in die Bioinformatik Dr. Stephan Weise 04.04.2016 Einführung Gegeben: zwei Sequenzen Gesucht: Ähnlichkeit quantitativ erfassen Entsprechungen zwischen einzelnen Bausteinen beider Sequenzen
MehrAlgorithmische Bioinformatik
Algorithmische Bioinformatik Effiziente Berechnung des Editabstands Dynamische Programmierung Ulf Leser Wissensmanagement in der Bioinformatik Inhalt dieser Vorlesung Rekursive Definition des Editabstands
MehrIhre Namen: Gruppe: Öffnen Sie die Fasta-Dateien nur mit einem Texteditor, z.b. Wordpad oder Notepad, nicht mit Microsoft Word oder Libre Office.
Ihre Namen: Gruppe: Evolutionsbiologie 2, WS2016/2017: Bioinformatik - Übung 1 Erstellen Sie vor Beginn der Übung einen Ordner auf dem Desktop, in dem Sie alle benötigten Dateien speichern kö nnen (z.b.
MehrWas ist Bioinformatik?
9. Kurstag: Bioinformatik Der Begriff "Bioinformatik" wurde 1989 erstmals von D.R. Masys im JOURNAL OF RESEARCH OF THE NATIONAL INSTITUTE OF STANDARDS AND TECHNOLOGY erwähnt. Was ist Bioinformatik? Die
MehrEinführung in die Bioinformatik Algorithmen zur Sequenzanalyse
Einführung in die Bioinformatik Algorithmen zur Sequenzanalyse!! Vorläufige Fassung, nur einzelne Abschnitte!!!! Enthält wahrscheinlich noch viele Fehler!!!! Wird regelmäßig erweitert und verbessert!!
MehrThreading - Algorithmen
Threading - Algorithmen Florian Lindemann 22.11.2007 Florian Lindemann () Threading - Algorithmen 22.11.2007 1 / 25 Gliederung 1 Prospect Scoring Function Algorithmus Weitere Eigenschaften Komplexität
MehrSequenzen-Alignierung in der Bioinformatik
Sequenzen-Alignierung in der Bioinformatik VO Algorithm Engineering Professor Dr. Petra Mutzel Lehrstuhl für Algorithm Engineering, LS 22. VO 23..26 Literatur für diese VO Volker Heun: Skriptum zur Vorlesung
Mehr1/10. Ihre Namen: Gruppe: Evolutionsbiologie 2, WS2015/2016: Bioinformatik - Übung 1
Ihre Namen: Gruppe: Evolutionsbiologie 2, WS2015/2016: Bioinformatik - Übung 1 Erstellen Sie bitte vor Beginn der Übung einen Ordner auf dem Desktop, in dem Sie alle benötigten Dateien speichern können
MehrMOL.504 Analyse von DNA- und Proteinsequenzen. Übungsaufgaben BLAST-Sequenzsuche und -vergleiche
MOL.504 Analyse von DNA- und Proteinsequenzen Übungsaufgaben BLAST-Sequenzsuche und -vergleiche Ü6a blastn und blastx Verwenden Sie die in Übung 3 (Datenbanken) gefundene yqjm-sequenz aus Bacillus subtilis
MehrBioinformatik an der FH Bingen
Bioinformatik an der FH Bingen Prof. Dr. Antje Krause 05.11.2010 Wie alles begann... 1955 erste Proteinsequenz (nach 12 Jahren Arbeit) veröffentlicht (Insulin vom Rind) Frederick Sanger MALWTRLRPLLALLALWPPPPA
MehrSequenzen-Alignierung in der Bioinformatik
Sequenzen-Alignierung in der Bioinformatik VO Algorithm Engineering Professor Dr. Petra Mutzel Lehrstuhl für Algorithm Engineering, LS 2. VO 2.0.2006 Literatur für diese VO Volker Heun: Skriptum zur Vorlesung
MehrBioinformatik. Substitutionsmatrizen BLAST. Ulf Leser Wissensmanagement in der. Bioinformatik
Bioinformatik Substitutionsmatrizen BLAST Ulf Leser Wissensmanagement in der Bioinformatik Inhalt dieser Vorlesung Substitutionsmatrizen: PAM und BLOSSUM Suche in Datenbanken: Basic Local Alignment Search
MehrAlignment von DNA- und Proteinsequenzen
WS2012/2013 Genomforschung und Sequenzanalyse - Einführung in Methoden der Bioinformatik- Thomas Hankeln Alignment von DNA- und Proteinsequenzen das vielleicht wichtigste Werkzeug der Bioinformatik! 1
MehrFOR MUW SSM3 (2008) STUDENTS EDUCATIONAL PURPOSE ONLY
Angewandte Bioinformatik Grundlagen der Annotation von eukaryotischen Genomen Online Datenbanken und Bioinformatik Tools Sequenzen Sequenzalignment: Fasta und Blast Motive und Hidden Markov Models Genom-Browser
MehrBiowissenschaftlich recherchieren
Biowissenschaftlich recherchieren Uber den Einsatz von Datenbanken und anderen Ressourcen der Bioinformatik Nicola Gaedeke Birkhauser Basel Boston Berlin Inhaltsverzeichnis Vorwort xi 1 Die Informationssucheim
MehrBLAST Basic Local Alignment Search Tool
BLAST Basic Local Alignment Search Tool Martin Winkels 21.12.2012 wissen leben WWU Münster Institut für Medizinische Informatik Inhaltsverzeichnis Inhaltsverzeichnis Inhaltsverzeichnis 1 Einleitung 2 2
MehrEinführung in die Angewandte Bioinformatik: Sequenzähnlichkeit, Sequenzalignment, BLAST
Einführung in die Angewandte Bioinformatik: Sequenzähnlichkeit, Sequenzalignment, BLAST 10.06.2010 Prof. Dr. Sven Rahmann 1 Sequenzvergleich: Motivation Hat man die DNA-Sequenz eines Gens, die Aminosäuresequenz
MehrBioinformatik: Neue Paradigmen in der Forschung
Bioinformatik: Neue Paradigmen in der Forschung Sommerakademie der Studienstiftung St. Johann, 1.-14.9.2002 Leitung: Proff. Ernst W. Mayr & Rolf Backofen Thema 4: Paarweises und multiples (heuristisches)
MehrEinführung in die Bioinformatik
Einführung in die Bioinformatik SS 2012 1. Was ist Bioinformatik? Kay Nieselt Integrative Transkriptomik Zentrum für Bioinformatik Tübingen Kay.Nieselt@uni-tuebingen.de Ablauf und Formales Ringvorlesung
MehrAlgorithmen und Datenstrukturen in der Bioinformatik Viertes Übungsblatt WS 05/06 Musterlösung
Konstantin Clemens Johanna Ploog Freie Universität Berlin Institut für Mathematik II Arbeitsgruppe für Mathematik in den Lebenswissenschaften Algorithmen und Datenstrukturen in der Bioinformatik Viertes
MehrInformationstechnologie in der Pflanzenzüchtung. Biocomputing in einem Züchtungsunternehmen. Andreas Menze KWS SAAT AG, Einbeck
Informationstechnologie in der Pflanzenzüchtung Biocomputing in einem Züchtungsunternehmen Andreas Menze KWS SAAT AG, Einbeck Biocomputing in einem Züchtungsunternehmen Biocomputing Was ist das? Wozu wird
MehrBio Data Management. Kapitel 5a Sequenzierung und Alignments
Bio Data Management Kapitel 5a Sequenzierung und Alignments Sommersemester 2013 Anika Groß Universität Leipzig, Institut für Informatik, Abteilung Datenbanken http://dbs.uni-leipzig.de Vorläufiges Inhaltsverzeichnis
MehrAlgorithmische Bioinformatik 1
Algorithmische Bioinformatik 1 Dr. Hanjo Täubig Lehrstuhl für Effiziente Algorithmen (Prof. Dr. Ernst W. Mayr) Institut für Informatik Technische Universität München Sommersemester 2009 Übersicht Paarweises
MehrGliederung. Algorithmen und Datenstrukturen II. Problem: Längste gemeinsame Teilsequenz. Problem: Längste gemeinsame Teilsequenz
Gliederung Algorithmen und Datenstrukturen II Algorithmen zur Textverarbeitung II D. Rösner Institut für Wissens- und Sprachverarbeitung Fakultät für Informatik Otto-von-Guericke Universität Magdeburg
MehrHomologie und Sequenzähnlichkeit. Prof. Dr. Antje Krause FH Bingen 06721 / 409 253 akrause@fh-bingen.de
Homologie und Sequenzähnlichkeit Prof. Dr. Antje Krause FH Bingen 06721 / 409 253 akrause@fh-bingen.de Homologie Verwandtschaft aufgrund gleicher Abstammung basiert auf Speziation (Artbildung): aus einer
MehrBioinformatik. Dynamische Programmierung. Ulf Leser Wissensmanagement in der. Bioinformatik
Bioinformatik Dynamische Programmierung Ulf Leser Wissensmanagement in der Bioinformatik Motivation BLAST / FASTA und Verwandte sind *die* Bioinformatik Anwendung Teilweise synonym für Bioinformatik rundlegende
MehrMOL.504 Analyse von DNA- und Proteinsequenzen
MOL.504 Analyse von DNA- und Proteinsequenzen Kurs 1 Monika Oberer, Karl Gruber MOL.504 Modul-Übersicht Einführung, Datenbanken BLAST-Suche, Sequenzalignment Proteinstrukturen Virtuelles Klonieren Abschlusstest
MehrBio Data Management. Kapitel 5a Sequenzierung und Alignments
Bio Data Management Kapitel 5a Sequenzierung und Alignments Wintersemester 2014/15 Dr. Anika Groß Universität Leipzig, Institut für Informatik, Abteilung Datenbanken http://dbs.uni-leipzig.de Vorläufiges
MehrBioinformatik. Zeichenketten und Stringalgorithmen. Ulf Leser Wissensmanagement in der. Bioinformatik
Bioinformatik Zeichenketten und Stringalgorithmen Ulf Leser Wissensmanagement in der Bioinformatik Inhalt dieser Vorlesung Warum Stringmatching? Strings und Matching Naiver Algorithmus Ulf Leser: Bioinformatik
MehrDarwins Erben - Phylogenie und Bäume
Vorlesung Einführung in die Bioinforma4k SoSe2011 Darwins Erben - Phylogenie und Bäume Prof. Daniel Huson ZBIT Center for Bioinformatics Center for Bioinformatics Charles Darwin und Bäume Darwin's Notizbuch
MehrAlgorithmische Bioinformatik
Algorithmische Bioinformatik Biologische Daten als Strings Ulf Leser Wissensmanagement in der Bioinformatik Ziele für heute Wert von Reduktionismus: Genome als Strings Reinschmecken in Stringmatching Erster
MehrMathematik in den Life Siences
Gerhard Keller Mathematik in den Life Siences Grundlagen der Modellbildung und Statistik mit einer Einführung in die Statistik-Software R 49 Abbildungen Verlag Eugen Ulmer Stuttgart Inhaltsverzeichnis
MehrBLAST. Datenbanksuche mit BLAST. Genomische Datenanalyse 10. Kapitel
Datenbanksuche mit BLAST BLAST Genomische Datenanalyse 10. Kapitel http://www.ncbi.nlm.nih.gov/blast/ Statistische Fragen Datenbanksuche Query Kann die globale Sequenzähnlichkeit eine Zufallsfluktuation
MehrInformationsmaterial Resistenz gegen HIV Recherche und Analyse molekularer Daten
1 Informationsmaterial Resistenz gegen HIV Recherche und Analyse molekularer Daten (inkl. Anleitungen zur Recherche von Sequenzen mit GenBank und zur Analyse mit GeneDoc) In der Computer-basierten Version
MehrAlgorithmen auf Sequenzen 12.04.2010
Algorithmen auf Sequenzen 12.04.2010 Prof. Dr. Sven Rahmann 1 Team Prof. Dr. Sven Rahmann Dipl.-Inform Tobias Marschall (Skript) Zeit Mo 8:30-10; Übungen Mi 8:30-10 ca. alle 2 Wochen (Plan!) Ort OH14,
MehrStatistische Verfahren:
Statistische Verfahren: Hidden-Markov-Modelle für Multiples Alignment Stochastic Context-Free Grammars (SCFGs) für RNA-Multiples Alignment Übersicht 1 1. Hidden-Markov-Models (HMM) für Multiples Alignment
MehrBioinformatik I (Einführung)
Kay Diederichs, Sommersemester 2015 Bioinformatik I (Einführung) Algorithmen Sequenzen Strukturen PDFs unter http://strucbio.biologie.unikonstanz.de/~dikay/bioinformatik/ Klausur: Fr 17.7. 10:00-11:00
MehrInformationsvisualisierung
Informationsvisualisierung Thema: 7. Visualisierung Biologischer Daten Dozent: Dr. Dirk Zeckzer zeckzer@informatik.uni-leipzig.de Sprechstunde: nach Vereinbarung Umfang: 2 Prüfungsfach: Modul Fortgeschrittene
MehrDatenstrukturen & Algorithmen
Datenstrukturen & Algorithmen Matthias Zwicker Universität Bern Frühling 2010 Übersicht Dynamische Programmierung Einführung Ablaufkoordination von Montagebändern Längste gemeinsame Teilsequenz Optimale
MehrPhylogenetische Analyse
Bioinformatik I - Uebung Phylogenetische Analyse Wenn nicht anders angegeben verwende die Standard-Einstellungen der Programme Hintergrund: Die Schwämme (Phylum Porifera) gehören zu den den ältesten lebenden
MehrBioinformatische Suche nach pre-mirnas
Bioinformatische Suche nach pre-mirnas Vorbereitung: Lesen Sie die Publikationen Meyers et al., 2008, Criteria for Annotation of Plant MicroRNAs und Thieme et al., 2011, SplamiR prediction of spliced mirnas
MehrEvolution & Genetik (Beispiel Hämoglobin) Prof. Dr. Antje Krause FH Bingen 06721 / 409 253 akrause@fh-bingen.de
Evolution & Genetik (Beispiel Hämoglobin) Prof. Dr. Antje Krause FH Bingen 06721 / 409 253 akrause@fh-bingen.de DNA (Desoxyribonukleinsäure) 5 3 CGATGTACATCG GCTACATGTAGC 3 5 Doppelhelix Basen: Adenin,
MehrEIIa in Ferrovum sp. JA12 22.8.2012
EIIa in Ferrovum sp. JA12 22.8.2012 1. Einleitung 1.1 Motivation Ferrovum JA12 ist ein erst seit kurzem entdeckter Organismus der acidophilen Eisenoxidierer. Er gehört phylogenetisch betrachtet zu den
MehrMOL.504 Analyse von DNA- und Proteinsequenzen. Datenbanken & Informationssysteme
MOL.504 Analyse von DNA- und Proteinsequenzen Datenbanken & Informationssysteme Inhaltsübersicht Informationsysteme National Center for Biotechnology Information (NCBI) The European Bioinformatics Institute
MehrLokale Sequenzähnlichkeit. Genomische Datenanalyse 9. Kapitel
Lokale Sequenzähnlichkeit Genomische Datenanalyse 9. Kapitel Globale Sequenzähnlichkeit: Zwei Cytochrome C Sequenzen: Eine vom Menschen und eine aus der Maus. Die Sequenzen sind gleich lang, man kann sie
MehrVorlesungsthemen Mikrobiologie
Vorlesungsthemen Mikrobiologie 1. Einführung in die Mikrobiologie B. Bukau 2. Zellaufbau von Prokaryoten B. Bukau 3. Bakterielles Wachstum und Differenzierung B. Bukau 4. Bakterielle Genetik und Evolution
MehrBioinformatik. Zeichenketten und Stringalgorithmen. Ulf Leser Wissensmanagement in der. Bioinformatik
Bioinformatik Zeichenketten und Stringalgorithmen Ulf Leser Wissensmanagement in der Bioinformatik Inhalt dieser Vorlesung Warum Stringmatching? Strings und Matching Naiver Algorithmus Ulf Leser: Algorithmische
MehrEinführung in die Bioinformatik
Enno Abteilung Theoretische Informatik Universität Ulm October 18, 2016 Überblick 1 Datenbanken Sequenzformate 2 Multiple 3 FASTA BLAST 4 Datenbanken Überblick Datenbanken Sequenzformate exponentielles
MehrBioinformatik für Lebenswissenschaftler
Bioinformatik für Lebenswissenschaftler Oliver Kohlbacher, Steffen Schmidt SS 2010 09. Multiples Alignment I Abt. Simulation biologischer Systeme WSI/ZBIT, Eberhard Karls Universität Tübingen Übersicht
MehrMaschinelles Lernen in der Bioinformatik
Maschinelles Lernen in der Bioinformatik Spezialvorlesung Modul 10-202-2206 (Fortgeschrittene Methoden in der Bioinformatik) VL 2 HMM und (S)CFG Jana Hertel Professur für Bioinformatik Institut für Informatik
MehrBabeș-Bolyai Universität Cluj Napoca Fakultät für Mathematik und Informatik Grundlagen der Programmierung MLG5005. Paradigmen im Algorithmenentwurf
Babeș-Bolyai Universität Cluj Napoca Fakultät für Mathematik und Informatik Grundlagen der Programmierung MLG5005 Paradigmen im Algorithmenentwurf Problemlösen Problem definieren Algorithmus entwerfen
MehrMaschinelles Lernen: Neuronale Netze. Ideen der Informatik
Maschinelles Lernen: Neuronale Netze Ideen der Informatik Kurt Mehlhorn Adrian Neumann 16. Januar 2014 Übersicht Biologische Inspiration Stand der Kunst in Objekterkennung auf Bildern Künstliche Neuronale
MehrDatenbankanwendung. Prof. Dr.-Ing. Sebastian Michel TU Kaiserslautern. Wintersemester 2014/15. smichel@cs.uni-kl.de
Datenbankanwendung Wintersemester 2014/15 Prof. Dr.-Ing. Sebastian Michel TU Kaiserslautern smichel@cs.uni-kl.de Wiederholung: Anfragegraph Anfragen dieses Typs können als Graph dargestellt werden: Der
MehrEffiziente Algorithmen
Überblick Ausgewählte Algorithmen der Bioinformatik Effiziente Algorithmen Ausgewählte Algorithmen der Bioinformatik: Teil 1 Markus Leitner (Martin Gruber, Gabriele Koller) 1. Einführung in die Molekularbiologie
MehrAlgorithmische Bioinformatik
Algorithmische Bioinformatik Gene Finding mit Markov-Modellen Ulf Leser Wissensmanagement in der Bioinformatik Heuristische Alignierung Annotation neuer Sequenzen basiert auf Suche nach homologen Sequenzen
MehrVorbesprechung Seminar Biomedical Informatics
Vorbesprechung Martin Dugas und Xiaoyi Jiang Institut für Informatik Sommersemester 2016 Organisation Vorlage: Englischsprachige Publikation Vortrag: ca. 30min + 15min Diskussion, Blockseminar Anfang/Mitte
MehrPR Statistische Genetik und Bioinformatik
PR Statistische Genetik und Bioinformatik Johanna Bertl Institut für Statistik und OR, Universität Wien Oskar-Morgenstern-Platz 1/6.344, 1090 Wien, Tel.: 01-4277-38617 johanna.bertl@univie.ac.at, homepage.univie.ac.at/johanna.bertl
MehrGenannotation bei Prokaryoten
Genannotation bei Prokaryoten Maike Tech Abt. Bioinformatik Institut für Mikrobiologie und Genetik (IMG) Universität Göttingen 28. November 2005 Genetik von Pro- und Eukaryoten Eukaryoten Prokaryoten Zellkern
MehrBioinformatik: Schnittstelle zwischen Informatik und Life-Science
Bioinformatik: Schnittstelle zwischen Informatik und Life-Science Andreas Zendler (PD Dr.rer.nat.Dr.phil.) GI / GChACM 12. ovember 2001 Inhaltsübersicht I. Einführung II. Bioinformatik III. Industrial
MehrAlgorithmen und Datenstrukturen (ESE) Entwurf, Analyse und Umsetzung von Algorithmen (IEMS) WS 2014 / 2015 Vorlesung 3, Donnerstag 6.
Algorithmen und Datenstrukturen (ESE) Entwurf, Analyse und Umsetzung von Algorithmen (IEMS) WS 2014 / 2015 Vorlesung 3, Donnerstag 6. November 2014 (O-Notation, Theta, Omega) Junior-Prof. Dr. Olaf Ronneberger
MehrMaschinelles Lernen: Neuronale Netze. Ideen der Informatik Kurt Mehlhorn
Maschinelles Lernen: Neuronale Netze Ideen der Informatik Kurt Mehlhorn 16. Januar 2014 Übersicht Stand der Kunst im Bilderverstehen: Klassifizieren und Suchen Was ist ein Bild in Rohform? Biologische
MehrWichtige Themen aus der Vorlesung Bioinformatik I WS 2013/2014
Universität des Saarlandes FR 6.2 Informatik Prof. Dr. Hans-Peter Lenhof Daniel Stöckel, M. Sc. Patrick Trampert, M. Sc. Lara Schneider, M. Sc. I Wichtige Themen aus der Vorlesung Bioinformatik I WS 2013/2014
MehrÜbung II. Einführung, Teil 1. Arbeiten mit Ensembl
Übung II Einführung, Teil 1 Arbeiten mit Ensembl Ensembl Genome Browser (Bereitstellung von Vielzeller Genomen) Projekt wurde 1999 initiiert Projektpartner EMBL European Bioinformatics Institute (EBI)
MehrDatenstrukturen und Algorithmen
Datenstrukturen und Algorithmen VO 708.031 27.10.2011 stefan.klampfl@tugraz.at 1 Wiederholung Wir vergleichen Algorithmen anhand des ordnungsmäßigen Wachstums von T(n), S(n), Asymptotische Schranken: O-Notation:
MehrWeb Data Management Systeme
Web Data Management Systeme Seminar: Web-Qualitätsmanagement Arne Frenkel Agenda Einführung Suchsysteme Suchmaschinen & Meta-Suchmaschinen W3QS WebSQL WebLog Information Integration Systems Ariadne TSIMMIS
MehrInhalt. Entdeckung und allgemeine Informationen. Klassifizierung. Genom Viren untypische Gene Tyrosyl-tRNA Synthetase. Ursprung von grossen DNA Viren
Mimivirus Inhalt Entdeckung und allgemeine Informationen Klassifizierung Genom Viren untypische Gene Tyrosyl-tRNA Synthetase Ursprung von grossen DNA Viren Entstehung von Eukaryoten Entdeckung 1992 in
MehrDATENQUALITÄT IN GENOMDATENBANKEN
DATENQUALITÄT IN GENOMDATENBANKEN Alexander Fehr 28. Januar 2004 Gliederung Motivation Biologische Grundkonzepte Genomdaten Datenproduktion und Fehler Data Cleansing 2 Motivation (1) Genomdatenbanken enthalten
MehrBioinformatik. Suffixbäume auf Sekundärspeicher. Ulf Leser Wissensmanagement in der. Bioinformatik
Bioinformatik Suffixbäume auf Sekundärspeicher Ulf Leser Wissensmanagement in der Bioinformatik Ukkonen Überblick High-Level: Phasen und Extensionen Führt leider zu O(m 3 ) Verbesserungen Suffix-Links
MehrGrundlegende Algorithmen der Bioinformatik
Grundlegende Algorithmen der Bioinformatik Vortragsausarbeitungen des gleichnamigen Proseminars LS 11, Fakultät für Informatik, TU Dortmund Prof. Dr. Sven Rahmann mit Beiträgen der TeilnehmerInnen Wintersemester
MehrKombinatorik. Additions- und Multiplikationsgesetz
Kombinatorik Die Kombinatorik beschäftigt sich mit der Berechnung der Anzahl Möglichkeiten, eine Anzahl von Objekten aus einer Grundmenge auszuwählen. Z.B. beim Schweizer Zahlenlotto 6 aus 45. Dabei wird
MehrUniZH Fallstudie Mikrobiologie (BIO126) SS2006
Universität Zürich, Fallstudie SS 2006, Wahlmodul Mikro-Biologie, Bio-126, Gruppe 07 Wie gross ist die evolutionäre Distanz zwischen dem von Clostridium tetani gebildeten Tetanustoxin und den sieben von
MehrReguläre Ausdrücke. Silke Trißl, Prof. Ulf Leser Wissensmanagement in der Bioinformatik
Reguläre Ausdrücke Silke Trißl, Prof. Ulf Leser Wissensmanagement in der Bioinformatik Sinn und Ziel Reguläre Ausdrücke sind eine Möglichkeit eine Menge von Strings aufgrund von gemeinsamen Merkmalen zu
Mehr27 Funktionelle Genomanalysen Sachverzeichnis
Inhaltsverzeichnis 27 Funktionelle Genomanalysen... 543 27.1 Einleitung... 543 27.2 RNA-Interferenz: sirna/shrna-screens 543 Gunter Meister 27.3 Knock-out-Technologie: homologe Rekombination im Genom der
MehrMotiv und Domänensuche
Motiv und Domänensuche Strukturelle Bioinformatik WS15/16 Dr. Stefan Simm, 09.12.2015 simm@bio.uni-frankfurt.de Motiv und Domänensuche SIGNALVORHERSAGE (MOTIV) Ansatz für Signalvorhersage 1. Zielsignalsuche
MehrVL Algorithmische BioInformatik (19710) WS2013/2014 Woche 16 - Mittwoch. Annkatrin Bressin Freie Universität Berlin
VL Algorithmische BioInformatik (19710) WS2013/2014 Woche 16 - Mittwoch Annkatrin Bressin Freie Universität Berlin Vorlesungsthemen Part 1: Background Basics (4) 1. The Nucleic Acid World 2. Protein Structure
Mehr3 Bioinformatik I, Einführung, Grundlagen
Universität des Saarlandes FR 6.2 Informatik Prof. Dr. Hans-Peter Lenhof I Wichtige Themen aus der Vorlesung Bioinformatik I WS 2009/2010 Hinweis: Dies ist eine stichpunktartige Liste der wichtigen Themen
MehrAlgorithmus zum Graphen-Matching. und. Anwendung zur inhaltsbasierten Bildersuche
Algorithmus zum Graphen-Matching und Anwendung zur inhaltsbasierten Bildersuche Gliederung 1. Einführung 2. Algorithmus Beschreibung Beispiel Laufzeit 3. Anwendung des Algorithmus Seite 1 von 18 1. Einführung
MehrV3 - Multiples Sequenz Alignment und Phylogenie
V3 - Multiples Sequenz Alignment und Phylogenie Literatur: Kapitel 4 in Buch von David Mount Thioredoxin-Beispiel heute aus Buch von Arthur Lesk 3. Vorlesung SS 2011 Softwarewerkzeuge der Bioinformatik
MehrBiologie I/B: Klassische und molekulare Genetik, molekulare Grundlagen der Entwicklung Theoretische Übungen SS 2014
Biologie I/B: Klassische und molekulare Genetik, molekulare Grundlagen der Entwicklung Theoretische Übungen SS 2014 Fragen für die Übungsstunde 8 (14.07-18.07.) 1) Von der DNA-Sequenz zum Protein Sie können
MehrDefinition Ein gerichteter Graph G = (V, E) ist ein Graph von geordneten Paaren (u, v) mit u V und v V.
Kapitel 4 Graphenalgorithmen 4.1 Definitionen Definition 4.1.1. Der Graph G = (V, E) ist über die beiden Mengen V und E definiert, wobei V die Menge der Knoten und E die Menge der Kanten in dem Graph ist.
MehrMedizinische Fakultät Auswertestrategien von Microarrays Einführung
Medizinische Fakultät Auswertestrategien von Microarrays Einführung PD Dr. Knut Krohn IZKF Leipzig Dr. Markus Eszlinger Med. Klinik III Forschungslabor DNA RNA Hintergrund Charakteristisches Muster der
MehrVorhersage von mirna targets in Säugetieren mirna target prediction am Beispiel von TargetScan
VorhersagevonmiRNAtargetsinSäugetieren mirnatargetprediction ambeispielvontargetscan Christoph Theunert 8. Fachsemester Bioinformatik christoph.theunert@web.de Gliederung I mirna Eigenschaften II mirna
MehrStringmatching-Algorithmen in der Bioinformatik
Christopher Goeritz Stringmatching-Algorithmen in der Bioinformatik Bachelorarbeit Institut für Genomik und Bioinformatik Technische Universität Graz Petersgasse 14, 8010 Graz Betreuer: Dipl.-Ing. Dr.
MehrAlgorithmische Geometrie 1. Einführung
Algorithmische Geometrie 1. Einführung JProf. Dr. Heike Leitte Computergraphik und Visualisierung Algorithmische Geometrie Veranstaltung: 2 SWS Vorlesung: Mi, 9:15 10:45 1 SWS Übung: Do 14:00 16:00 Übungen:
MehrUnterrichtsmaterialien in digitaler und in gedruckter Form. Auszug aus: Lernwerkstatt: Genetik & Vererbung. Das komplette Material finden Sie hier:
Unterrichtsmaterialien in digitaler und in gedruckter Form Auszug aus: : Genetik & Vererbung Das komplette Material finden Sie hier: Download bei School-Scout.de Inhalt Vorwort Seite 4 Einleitung Seite
MehrKapitel 5: Dynamisches Programmieren Gliederung
Gliederung 1. Grundlagen 2. Zahlentheoretische Algorithmen 3. Sortierverfahren 4. Ausgewählte Datenstrukturen 5. Dynamisches Programmieren 6. Graphalgorithmen 7. String-Matching 8. Kombinatorische Algorithmen
MehrInterPro & SP-ML. Syntax und Verwendung der Beschreibungssprache XML Ausarbeitung im Seminar XML in der Bioinformatik.
InterPro & SP-ML Syntax und Verwendung der Beschreibungssprache XML Ausarbeitung im Seminar XML in der Bioinformatik Stefan Albaum 18. Dezember 2002 Inhaltsverzeichnis 1 SPTr-XML 2 1.1 SWISS-PROT...........................
MehrUmfassende Untersuchungen des Eintrags von Resistenzgenen in Abwässer mittels Metagenomanalysen. D. Jonas, M. Bäumlisberger
Innovative Konzepte und Technologien für die separate Behandlung von Abwasser aus Einrichtungen des Gesundheitswesens Umfassende Untersuchungen des Eintrags von Resistenzgenen in Abwässer mittels Metagenomanalysen
Mehr16. All Pairs Shortest Path (ASPS)
. All Pairs Shortest Path (ASPS) All Pairs Shortest Path (APSP): Eingabe: Gewichteter Graph G=(V,E) Ausgabe: Für jedes Paar von Knoten u,v V die Distanz von u nach v sowie einen kürzesten Weg a b c d e
MehrBioinformatik. Methoden zur Vorhersage vo n RNA- und Proteinstrukture n. Gerhard Steger
Bioinformatik Methoden zur Vorhersage vo n RNA- und Proteinstrukture n Gerhard Steger Vorwort ix Strukturvorhersage von Nukleinsäuren 1 Struktur und Funktion von RNA 3 1.1 RNA-Struktur fl 1.2 Thermodynamik
MehrSoftwarewerkzeuge der. Bioinformatik
Bioinformatik Wintersemester 2006/2007 Tutorial 1: Biologische Datenbanken SRS Tutorial 1: Datenbanken 1/22 Sequenzquellen DNA- Sequenzierung Protein- Sequenzierung Translation Proteinsequenzen Tutorial
MehrEinführung in die Informatik 2
Einführung in die Informatik 2 Suchen in Texten Sven Kosub AG Algorithmik/Theorie komplexer Systeme Universität Konstanz E 202 Sven.Kosub@uni-konstanz.de Sprechstunde: Freitag, 12:30-14:00 Uhr, o.n.v.
Mehr