VL Algorithmische BioInformatik (19710) WS2013/2014 Woche 3 - Montag
|
|
- Ute Stieber
- vor 7 Jahren
- Abrufe
Transkript
1 VL Algorithmische BioInformatik (19710) WS2013/2014 Woche 3 - Montag Tim Conrad AG Medical Bioinformatics Institut für Mathematik & Informatik, Freie Universität Berlin
2 Vorlesungsthemen Part 1: Background Basics (4) 1. The Nucleic Acid World 2. Protein Structure 3. Dealing with Databases Part 2: Sequence Alignments (3) 4. Producing and Analyzing Sequence Alignments 5. Pairwise Sequence Alignment and Database Searching 6. Patterns, Profiles, and Multiple Alignments Part 3: Evolutionary Processes (3) 7. Recovering Evolutionary History 8. Building Phylogenetic Trees Part 5: Secondary Structures (4) 11. Obtaining Secondary Structure from Sequence 12. Predicting Secondary Structures Part 6: Tertiary Structures (4) 13. Modeling Protein Structure 14. Analyzing Structure-Function Relationships Part 7: Cells and Organisms (8) 15. Proteome and Gene Expression Analysis 16. Clustering Methods and Statistics 17. Systems Biology Part 4: Genome Characteristics (4) 9. Revealing Genome Features 10. Gene Detection and Genome Annotation 2
3 3
4 Warum Sequenz-Vergleiche? Biologischer Hintergrund Viele Gene und Proteine sind Mitglieder von Familien mit ähnlicher biochemischer Funktion und/oder gemeinsamer evolutionärer Herkunft Der Sequenzvergleich wird verwendet, um funktionelle, strukturelle oder evolutionäre Beziehungen zu entdecken z.b. Ähnliche Sequenz => ähnliche Funktion, Struktur,... um konservierte Muster zu identifizieren wenn man über ein unbekanntes Protein etwas wissen will: Finden von Proteinen mit ähnlichen Domänen => Schließen auf ähnliche Funktion 4
5 Origins and evolutionary genomics of the 2009 swine-origin H1N1 influenza A epidemic Schattierte Boxen repräsentieren Wirtsspezies; Vogel (grün), Schwein (rot) and Mensch (blau). GJD Smith et al. Nature 459, (2009) doi: /nature
6 Homologie: Ähnlichkeit, die durch Abstammung von einem gemeinsamen Ursprungsgen herrührt die Identifizierung und Analyse von Homologien ist eine zentrale Aufgabe der Phylogenie. Ein Alignment ist eine Hypothese für die positionelle Homologie zwischen Basenpaaren bzw. Aminosäuren. 6
7 Der Baum des Lebens? 7
8 Der Baum des Lebens! 8
9 Mutationsraten sind nicht konstant 9
10 Ähnlichkeit, Homolog, Ortholog, Paralog Frühes Globulin-Gen Gen-Duplikation -chain Gen ß-chain Gen Maus Mensch Rind Rind ß Mensch ß Maus ß Ortholog ( ) Paralog (Rind) Ortholog (ß) Homolog Ortholog Nach Artenbildung divergiert haben normalerweise ähnliche Funktionen Paralog Nach Gen-Duplikation divergiert Divergenz auch in Funktion Daher müssen orthologe Gene betrachtet werden, um Annotationen auf andere Spezies zu übertragen. 10
11 11
12 Viele Möglichkeiten zu alignieren 12
13 Erste Erkentnisse zum Sequenzalignment Viele Alignierungen sind denkbar Zwei Sequenzen lassen sich immer alignieren Sequenz-Alignments müssen bewertet werden ("Score") Oft kann es mehr als eine Lösung zur gleichen Bewertung geben 13
14 Drei grundsätzliche Möglichkeiten Match Mismatch Gap THESEGA-PS THIS-GAAP- 14
15 Visuelle Sequenzvergleiche: Dotplot 15
16 Visuelle Sequensvergleiche: Gefilterter Dotplot 4 bp Fenster, 75% identity cutoff 16
17 Dotplots von evolutionären Sequenz umordnungen 17
18 Ähnlichkeit GAACAAT 7/7 OR 100% GAACAAT GAACAAT 6/7 OR 84% GAATAAT MISMATCH 18
19 Mismatches GAACAAT 6/7 bzw. 84% GAATAAT GAACAAT 6/7 bzw. 84% GAAGAAT 19
20 Einfaches DNA Scoring System Sequenz 1 Sequenz 2 actaccagttcatttgatacttctcaaa taccattaccgtgttaactgaaaggacttaaagact A G C T A G C T Match: 1 Mismatch: 0 Score = 5 20
21 Terminale Mismatches GAACAATttttt aaaccgaataat 6/7 bzw. 84% 21
22 INDELS GAAgCAAT 7/7 bzw. 100% GAA*CAAT 22
23 INDELS GAAgCAAT GAA*CAAT GAAggggCAAT GAA****CAAT 23
24 Beurteilung von Ähnlichkeiten GAACAAT 7/7 bzw. 100% GAACAAT Welches Alignment ist besser? Wie ist ein Alignment zu bewerten? GAACAAT 1/7 bzw. 14% GAACAAT 24
25 Ähnlichkeits-Bewertung Allgemeine Methode: Terminale Mismatches (0) Match (1) Mismatch Strafe (-3) Gap Strafe (-1) Gap extension Strafe (-1) Standard für DNA Alignments 25
26 DNA Scoring GGGGGGAGAA * * 8(1)+2(-3)=2 GGGGGAAAAAGGGGG GGGGGGAGAA--GGG * * 11(1)+2(-3)+1(-1)+1(-1)=3 GGGGGAAAAAGGGGG 26
27 Problem mit niedrigen Gap- Strafen GATCGCTACGCTCAGC A.C.C..C..T Perfekte Gleichheit lässt sich immer erreichen. 27
28 28
29 PI3 Kinasen 29
30 PI3 Kinasen aus der Pfam DB 30
31 Globale vs lokale Alignments Globales Alignment Aligniere eine Sequenz mit einer anderen von Anfang bis Ende Lokales Alignment Needleman-Wunsch Finde eine möglichst lange Teilsequenz, die in beiden Sequenzen möglichst gleich ist Smith-Waterman 31
32 Globale vs lokale Alignments
33 Protein-Alignment kann durch tertiäre Strukturinformationen geführt werden DjlA protein (E. Coli) DjlA protein (Human) ( Gaps eines Alignments sollten vorwiegend in Loops liegen, nicht in Sekundärstrukturelementen - nur so kann man letztlich bewerten, ob ein Sequenzalignment vermutlich korrekt ist. 33
34 Multiple Sequenz-Alignments Multiples Alignment: Gleichzeitiger Vergleich mehrerer Sequenzen Anwendungen: Funktionsvorhersage, Suche nach konservierten Motiven Datenbanksuche (z. B. PSI-BLAST: Position-Specific Iterated BLAST; zuerst wird ein Profil erstellt) Phylogenie Sequenzassemby (Sequenzierprojekte) Vorteile: ähnliche Bereiche (Motive) können herausgearbeitet werden Unähnlichkeiten können für die Rekonstruktion phylogenetischer Zusammenhänge verwendet werden 34
35 Multiple Sequenz-Alignments Global: Lokal: 35
36 Multiple Sequenz-Alignments Multiples Alignment: Gleichzeitiger Vergleich mehrerer Sequenzen 36
37 Infos aus MSA von Thioredoxin-Familie Abschnitte mit vielen Insertionen und Deletionen entsprechen vermutlich Schleifen an der Oberfläche. Eine Position mit einem konservierten Gly oder Pro lässt auf eine Wendung der Kette ( turn ) schließen. 37
38 Multiple Sequenz-Alignments 38
39 Sequenz Logos 39
40 Multiple Sequenz-Alignments Optimale Lösungsansätze (dynamisches Programmieren): Zeit- und Speicherbedarf wächst ins Unermessliche Bei einer Sequenzlänge L und n Sequenzen: Speicherbedarf: O(L n ), Zeitbedarf: O(2 n L n ). Das Problem ist NPvollständig. Für L=300 bedeutet das: Sequenzzahl Zahl der Zellen Speicherbedarf Zeitbedarf in der Matrix (4 byte/zelle) (10 6 Op./s) = kb 0,36 s = MB 216 s =8,1 x ,2 GB 36 h =2,4 x GB 900 d 40
41 Multiple Sequenz-Alignments Optimierungsmöglichkeiten durch z.b. divide and conquer 41
42 Ähnlichkeits-Scoring von Proteinen Schwache Alignments Chemikalische Ähnlichkeiten L vs I, K vs R Evolutionäre Ähnlichkeit Wie entwickeln sich Proteine? Wie erkennen wir Ähnlichkeit? 42
43 Scoring-Systeme für Proteine Aminosäuern haben verschiedene biochemische und physikalische Eigenschaften, die die Wahrscheinlichkeit eines evolutionsbedingten Austausches / Mutation beeinflussen. aliphatisch I L C S+S V A G T P G C SH S D N sehr klein klein hydrophob aromatisch M F Y W H K E Q R geladen positiv polar 43
44 Scoring-Systeme für Proteine Scoring Matrizen beschreiben: # der Mutationen von AA1 zu AA2 Chemische Ähnlichkeit Beobachtete Mutationsfrequenz Wahrscheinlichkeit des Auftretens einer AA 44
45 Substitutionsmatrix Zwei Hauptklassen von Matritzen: PAM-Dayhoff BLOSUM-Henikoff 45
46 PAM (Percent Accepted Mutations) Matrix Matrix-Familie: PAM 80, PAM 120, PAM 250 Die Zahl gibt die evolutionäre Distanz zwischen zwei Sequenzen an, die benutzt wurde, um diese Matrix zu berechnen Höhere Zahlen entsprechen größeren Distanzen 46
47 PAM (Percent Accepted Mutations) Matrix Zur Berechnung der PAM-1 Matrix wurde die Anzahl der Ersetzungen benutzt. Die PAM-1 Matrix legt einen durchschnittliche Änderung von 1% aller Aminosäurenpositionen zugrunde. Alle weiteren PAM Matrizen können durch Extrapolation gebildet werden. PAM250 = 250 Mutationen auf 100 Residuen. 47
48 PAM (Percent Accepted Mutations) Matrix Abgeleitet von globalen Alignments von Protein Familien. Proteine einer Familie sind mindestens zu 85% identisch (Dayhoff et al., 1978). Konstruktion eines phylogenetischen Baums und Vorläufer- Sequenzen jeder Protein Familie Berechnung der Anzahl der Ersetzungen jedes Aminosäure-Paars 48
49 PAM-250 Matrix C A R N D C Q E G H I L K M F P S T W Y V B Z A R N D C Q E G H I L K M F P S T W Y V B Z W 49
50 aromatic hydrophobic basic acid acid-amide other hydrophilic PAM-250 Matrix other hydrophilic acid acidamide basic hydrophobic aromatic 50
51 PAM - Einschränkungen Basiert nur auf einem (original) Datensatz Beinhaltet nur Proteine mit wenigen Unterschieden (85% Ähnlichkeit) Basiert hauptsächlich auf kleinen globulären Proteinen Matrix ist unausgewogen 51
52 BLOSUM Matrizen Verschiedene BLOSUMn Matrizen sind unabhängig voneinander berechnet worden (basierend auf der BLOCKS DB) BLOSUMn basiert auf Clustern von BLOCKS Sequenzen, die mindesten n% ähnlich sind Damit repräsentiert BLOSUM62 näher verwandte Sequenzen als BLOSUM45 Höhere Zahlen bedeuten kleinere evolutionäre Distanz. 52
53 BLOSUM (Blocks Substitution Matrix) Abgeleitet von Domänen-Alignments von weit entfernten Proteinen (Henikoff & Henikoff,1992). A A C E C Gezählt wird das Vorkommen jedes AA-Paares pro Spalte eines Block-Alignments Die Anzahlen aller Blöcke werden dann zur Berechnung der BLOSUM Matritzen benutzt. A A C E C A - C = 4 A - E = 2 C - E = 2 A - A = 1 C - C = 1 53
54 Blosum-50 Matrix 54
55 BLOSUM-62 Matrix (S) (T) 55
56 BLOSUM-62 Matrix Lysine (K) Arginine (R) 56
57 PAM vs. BLOSUM PAM100 = BLOSUM90 PAM120 = BLOSUM80 PAM160 = BLOSUM60 PAM200 = BLOSUM52 PAM250 = BLOSUM45 Weiter entfernte Sequenzen PAM120 normal PAM60 nahe Verwandschaft PAM250 entfernte Verwandschaft BLOSUM62 normal BLOSUM80 nah BLOSUM45 entfernt 57
58 58
59 Types of Similarity-Based Methods 59
60 Alignment Programs Local alignment (Smith-Waterman) BLAST (simplified Smith-Waterman) FASTA (simplified Smith-Waterman) BESTFIT (GCG program) Global alignment (Needleman-Wunsch) GAP 60
61 BLAST 61
62 BLAST Basic Local Alignment Search Tool ~ 50x faster than simple local alignment Make an efficient table with all k-letter words of the database (e.g. k=3) Find the locations of the words of the query sequence in the database Link them together, do a local alignment 62
63 BLAST Making a table of k-tuples from a database of sequences e.g. for k=3 1.THISSEQUENCE THI, HIS,ISS, SSE, SEQ, EQU, QUE, UEN, ENC, NCE 2.THISISASEQUENCE THI, HIS, ISA, SAS, ASE, SEQ, EQU, QUE, UEN, ENC, NCE ASE 2 ENC 1,2 EQU 1,2 HIS 1,2 ISA 2 NCE 1,2 QUE 1,2 SAS 2 SEQ 1,2 THI 1,2 UEN 1,2 63
64 BLAST Adding neighboring words For every k-tuple word BLAST also considers its neighboring variants E.g. 3-letter words with 1-letter variations: THISSEQUENCE : THI AHI, BHI, CHI,, ZHI, TAI, TBI, TCI, TZI, THA, THB,, THZ HIS AIS, BIS, CIS,, ZIS, 64
65 BLAST Throwing away low-scoring words All the words are first searched against the query sequence using a scoring table Low scoring (<threshold) words are removed THISSEQUENCE : THI AHI, BHI, CHI,, ZHI, TAI, TBI, TCI, TZI, THA, THB,, THZ HIS AIS, BIS, CIS,, ZIS, 65
66 BLAST Searching Table maintains a mapping of k-tuples to database sequences Table is prepared for efficient searching (tree) For a query sequence, first quickly look up all possible word hits from table Sometimes low-complexity regions are excluded from the query sequence Then try to extend alignment from individual hits (also considering gaps). How this is done depends on the particular version of BLAST. 66
67 BLAST Scoring Score (S) is the sum of scores for all k-tuple hits. This depends on the scoring matrix. We are usually interested in the statistical significance of the alignment: E-value If for a given query sequence E=10-6, this means in practice that: There is one in a million chance that a random sequence would get an as high score S as the query sequence did. The E-value is a reliability measure of the S value 67
68 BLAST statistical significance: assessing the likelihood a match occurs by chance Karlin-Altschul statistic: E kmne m = Size of query seqeunce n = Size of database k = Search space scaling parameter Lambda = scoring scaling parameter S = BLAST HSP score Low E -> good match S 68
69 BLAST statistical significance: Rule of thumb for a good match: Nucleotide match E < 1e-6 Identity > 70% Protein match E < 1e-3 Identity > 25% 69
70 Basic BLAST Family BLASTN DNA to DNA database BLASTP protein to protein database TBLASTN DNA (translated) to protein database BLASTX protein to DNA database (translated) TBLASTX DNA (translated) to DNA database (translated) 70
71 BLAST Input Program Database Options - see more Sequence FASTA gi or accession# 71
72 BLAST Options Algorithm and output options # descriptions, # alignments returned Probability cutoff Strand Alignment parameters Scoring Matrix PAM30, PAM70, BLOSUM45, BLOSUM62, BLOSUM80 Filter (low complexity) PPPPP->XXXXX 72
73 Extended BLAST Family Gapped Blast (default) PSI-Blast (Position-specific iterated blast) self generated scoring matrix PHI BLAST (motif plus BLAST) BLAST2 client (align two seqs) megablast (genomic sequence) rpsblast (search for domains) 73
74 74
75 Mehr Informationen im Internet unter medicalbioinformaticsgroup.de/teaching Vielen Dank! Tim Conrad AG Medical Bioinformatics Weitere Fragen 75
VL Algorithmische BioInformatik (19710) WS2013/2014 Woche 16 - Mittwoch. Annkatrin Bressin Freie Universität Berlin
VL Algorithmische BioInformatik (19710) WS2013/2014 Woche 16 - Mittwoch Annkatrin Bressin Freie Universität Berlin Vorlesungsthemen Part 1: Background Basics (4) 1. The Nucleic Acid World 2. Protein Structure
MehrPrimärstruktur. Wintersemester 2011/12. Peter Güntert
Primärstruktur Wintersemester 2011/12 Peter Güntert Primärstruktur Beziehung Sequenz Struktur Proteinsequenzen, Sequenzdatenbanken Sequenzvergleich (sequence alignment) Sequenzidentität, Sequenzhomologie
MehrGleichheit, Ähnlichkeit, Homologie
Gleichheit, Ähnlichkeit, Homologie Identität (identity) Verhältnis der Anzahl identischer Aminosäuren zur Gesamtzahl der Aminosäuren; objektiv Ähnlichkeit (similarity) Verhältnis ähnlicher Aminosäuren
MehrÜbungsaufgaben zur Einführung in die Bioinformatik - Lösungen
18.01.2013 Prof. P. Güntert 1 Vorlesung BPC I: Aspekte der Thermodynamik in der Strukturbiologie Übungsaufgaben zur Einführung in die Bioinformatik - Lösungen 1. Hamming und Levenshtein Distanzen a) Was
MehrMBI: Sequenz-Vergleich mit Alignment
MBI: Sequenz-Vergleich mit Alignment Bernhard Haubold 28. Oktober 2014 Wiederholung: Was ist Bioinformatik? Historische Übersicht; CABIOS Bioinformatics Gemeinsames Thema: Information in vivo DNA Epigenetik
MehrBLAST. Ausarbeitung zum Proseminar Vortag von Nicolás Fusseder am 24.10.02
BLAST Ausarbeitung zum Proseminar Vortag von Nicolás Fusseder am 24.10.02 BLAST (Basic Local Alignment Search Tool) hat seit seiner Veröffentlichung, von Altschul et al. im Jahre 1990, an großer Relevanz
MehrDot-Matrix Methode. (Java) (Javascript) 80
Dot-Matrix Methode Vergleich zweier Sequenzen (DNA oder Aminosäuren) Idee: gleiche Basen (Aminosäuren) in x-y Diagramm markieren Sequenz 1: ADRWLVKQN Sequenz 2: ADKFIVRDE http://myhits.vital-it.ch/cgi-bin/dotlet
MehrVerbesserung der dotplot Methode
erbesserung der dotplot Methode binäre Information: "x" oder " " besser: "mehr" oder "weniger" ähnlich Gruppen von Aminosäuren mit ähnlichen Eigenschaften bilden bestes Alignment: optimiere Häufigkeit
MehrBioinformatik. BLAST Basic Local Alignment Search Tool. Ulf Leser Wissensmanagement in der. Bioinformatik
Bioinformatik BLAST Basic Local Alignment Search Tool Ulf Leser Wissensmanagement in der Bioinformatik Heuristische Alignierung Annotation neuer Sequenzen basiert auf Suche nach homologen Sequenzen in
MehrAlignments & Datenbanksuchen
WS2015/2016 Genomforschung und Sequenzanalyse - Einführung in Methoden der Bioinformatik- Thomas Hankeln Alignments & Datenbanksuchen 1 break-thru Doolittle et al. 1983, Waterfield et al. 1983 > DB-Suche...
MehrGrundlagen der Bioinformatik Assignment 3: Hierarchical Clustering SS Yvonne Lichtblau/Johannes Starlinger
Grundlagen der Bioinformatik Assignment 3: Hierarchical Clustering SS 2017 Yvonne Lichtblau/Johannes Starlinger Presentations Assignment 2 Yvonne Lichtblau Übungen Grundlagen der Bioinformatik SS 2017
MehrPairwise Alignment. Steffen Forkmann. Proseminar: BioInformatik
Pairwise Alignment Steffen Forkmann Proseminar: BioInformatik Wintersemester 2004/2005 Inhaltsverzeichnis 1 Problemstellungen 3 1.1 Rechtschreibkorrektur............................... 3 1.2 DNA- und Aminosäure-Sequenzen........................
MehrZentrum für Bioinformatik. Übung 4: Revision. Beispielfragen zur Klausur im Modul Angewandte Bioinformatik (erste Semesterhälfte)
Andrew Torda Björn Hansen Iryna Bondarenko Zentrum für Bioinformatik Übung zur Vorlesung Angewandte Bioinformatik Sommersemester 2014 20./23.06.2014 Übung 4: Revision Beispielfragen zur Klausur im Modul
MehrSoftwarewerkzeuge der Bioinformatik
Bioinformatik Wintersemester 2006/2007 Tutorial 2: paarweise Sequenzaligments BLAST Tutorial 2: BLAST 1/22 Alignment Ausrichten zweier oder mehrerer Sequenzen, um: ihre Ähnlichkeit quantitativ zu erfassen
MehrAlgorithmen und Datenstrukturen in der Bioinformatik Zweites Übungsblatt WS 05/06 Musterlösung
Johanna Ploog, Konstantin Clemens Freie Universität Berlin Institut für Mathematik II Arbeitsgruppe für Mathematik in den Lebenswissenschaften Algorithmen und Datenstrukturen in der Bioinformatik Zweites
MehrMOL.504 Analyse von DNA- und Proteinsequenzen. Modul 2 BLAST-Sequenzsuche und Sequenzvergleiche
MOL.504 Analyse von DNA- und Proteinsequenzen Modul 2 BLAST-Sequenzsuche und Sequenzvergleiche Summary Modul 1 - Datenbanken Wo finde ich die DNA Sequenz meines Zielgens? Wie erhalte ich Info aus der DNA-Datenbank
MehrKlausur Bioinformatik für Biotechnologen
Name, Vorname: 1 Klausur Bioinformatik für Biotechnologen Studiengang Molekulare Biotechnologie TU Dresden WS 2011/2012 Prof. Michael Schroeder 15.02.2012 Die Dauer der Klausur beträgt 90 Minuten. Bitte
MehrAlignments & Datenbanksuchen
WS2017/2018 Genomforschung und Sequenzanalyse - Einführung in Methoden der Bioinformatik- Thomas Hankeln Alignments & Datenbanksuchen 1 break-thru Doolittle et al. 1983, Waterfield et al. 1983 > DB-Suche...
MehrWas ist Bioinformatik?
9. Kurstag: Bioinformatik Der Begriff "Bioinformatik" wurde 1989 erstmals von D.R. Masys im JOURNAL OF RESEARCH OF THE NATIONAL INSTITUTE OF STANDARDS AND TECHNOLOGY erwähnt. Was ist Bioinformatik? Die
MehrMultiple Alignments. Vorlesung Einführung in die Angewandte Bioinformatik Prof. Dr. Sven Rahmann. Webseite zur Vorlesung
Multiple Alignments Vorlesung Einführung in die Angewandte Bioinformatik Prof. Dr. Sven Rahmann Webseite zur Vorlesung http://bioinfo.wikidot.com/ Sprechstunde Mo 16-17 in OH14, R214 Sven.Rahmann -at-
MehrAlignment von DNA- und Proteinsequenzen
WS2012/2013 Genomforschung und Sequenzanalyse - Einführung in Methoden der Bioinformatik- Thomas Hankeln Alignment von DNA- und Proteinsequenzen das vielleicht wichtigste Werkzeug der Bioinformatik! 1
MehrAufgabenblatt 5. Silke Trißl Wissensmanagement in der Bioinformatik
Aufgabenblatt 5 Silke Trißl Wissensmanagement in der Bioinformatik Zuerst! FRAGEN? Silke Trißl: Bioinformatik für Biophysiker 2 Exercise 1 + 2 Modify program to compare protein sequence read substitution
MehrBioinformatik Für Biophysiker
Bioinformatik Für Biophysiker Sommersemester 2009 Silke Trißl / Ulf Leser Wissensmanagement in der Bioinformatik Wissensmanagement in der Bioinformatik Schwerpunkte Algorithmen der Bioinformatik Management
MehrBiowissenschaftlich recherchieren
Biowissenschaftlich recherchieren Uber den Einsatz von Datenbanken und anderen Ressourcen der Bioinformatik Nicola Gaedeke Birkhauser Basel Boston Berlin Inhaltsverzeichnis Vorwort xi 1 Die Informationssucheim
MehrSequenz Alignment Teil 2
Sequenz Alignment Teil 2 14.11.03 Vorlesung Bioinformatik 1 Molekulare Biotechnologie Dr. Rainer König Besonderen Dank an Mark van der Linden, Mechthilde Falkenhahn und der Husar Biocomputing Service Gruppe
MehrBioinformatik. BLAST Basic Local Alignment Search Tool. Ulf Leser Wissensmanagement in der. Bioinformatik
Bioinformatik BLAST Basic Local Alignment Search Tool Ulf Leser Wissensmanagement in der Bioinformatik Praktikum Anmeldung bis 10.02.2004 bei Silke Trißl (trissl@informatik.hu-berlin.de) Name, Vorname
MehrBioinformatik. Lokale Alignierung Gapkosten. Silke Trißl / Ulf Leser Wissensmanagement in der. Bioinformatik
Bioinformatik Lokale Alignierung Gapkosten Silke Trißl / Ulf Leser Wissensmanagement in der Bioinformatik Inhalt dieser Vorlesung Ähnlichkeit Lokales und globales Alignment Gapped Alignment Silke Trißl:
MehrEinführung in die Bioinformatik
Einführung in die Bioinformatik Ringvorlesung Biologie Sommer 07 Burkhard Morgenstern Institut für Mikrobiologie und Genetik Abteilung für Bioinformatik Goldschmidtstr. 1 Online Materialien zur Ringvorlesung:
MehrVorlesung Einführung in die Bioinformatik
Vorlesung Einführung in die Bioinformatik Dr. Stephan Weise 04.04.2016 Einführung Gegeben: zwei Sequenzen Gesucht: Ähnlichkeit quantitativ erfassen Entsprechungen zwischen einzelnen Bausteinen beider Sequenzen
MehrBioinformatik. Substitutionsmatrizen BLAST. Ulf Leser Wissensmanagement in der. Bioinformatik
Bioinformatik Substitutionsmatrizen BLAST Ulf Leser Wissensmanagement in der Bioinformatik Inhalt dieser Vorlesung Substitutionsmatrizen: PAM und BLOSSUM Suche in Datenbanken: Basic Local Alignment Search
MehrAnwendungen von HMM. Kapitel 1 Spezialvorlesung Modul (Fortgeschrittene Methoden in der Bioinformatik) Jana Hertel
Anwendungen von HMM Kapitel 1 Spezialvorlesung Modul 10-202-2206 (Fortgeschrittene Methoden in der Bioinformatik) Jana Hertel Professur für Bioinformatik Institut für Informatik Universität Leipzig Machine
MehrAlignments & Datenbanksuchen
WS2016/2017 F1-Praktikum Genomforschung und Sequenzanalyse: Einführung in Methoden der Bioinformatik Thomas Hankeln Alignments & Datenbanksuchen 1 Wiederholung Alignments Dynamic Programming Needleman-Wunsch:
MehrV2 Paarweises Sequenzalignment
Methoden des Sequenzalignments V2 Paarweises Sequenzalignment Austauschmatrizen Bedeutsamkeit von Alignments BLAST, Algorithmus Parameter Ausgabe http://www.ncbi.nih.gov Diese Vorlesung lehnt sich eng
MehrBioinformatik für Lebenswissenschaftler
Bioinformatik für Lebenswissenschaftler Oliver Kohlbacher, Steffen Schmidt SS 2010 06. Paarweises Alignment Teil II Abt. Simulation biologischer Systeme WSI/ZBIT, Eberhard Karls Universität Tübingen Übersicht
MehrAlgorithmische Bioinformatik
FREIE UNIVERSITÄT BERLIN Fachbereich Mathematik und Informatik Institut für Informatik (WE 3) FU BERLIN Freie Universität Berlin FB Mathematik und Informatik, Institut für Informatik, Takustr. 9, D-14195
MehrV2 Paarweises Sequenzalignment
Methoden des Sequenzalignments V2 Paarweises Sequenzalignment Austauschmatrizen Bedeutsamkeit von Alignments BLAST, Algorithmus Parameter Ausgabe http://www.ncbi.nih.gov Diese Vorlesung lehnt sich eng
MehrAlgorithmische Anwendungen WS 2005/2006
Algorithmische Anwendungen WS 2005/2006 Sequenzalignment Gruppe F_lila_Ala0506 Allal Kharaz Yassine ELassad Inhaltsverzeichnis 1 Problemstellungen...................................... 3 1.1 Rechtschreibkorrektur...............................
MehrIhre Namen: Gruppe: Öffnen Sie die Fasta-Dateien nur mit einem Texteditor, z.b. Wordpad oder Notepad, nicht mit Microsoft Word oder Libre Office.
Ihre Namen: Gruppe: Evolutionsbiologie 2, WS2016/2017: Bioinformatik - Übung 1 Erstellen Sie vor Beginn der Übung einen Ordner auf dem Desktop, in dem Sie alle benötigten Dateien speichern kö nnen (z.b.
MehrSequenzen-Alignierung in der Bioinformatik. VO Algorithm Engineering Professor Dr. Petra Mutzel Lehrstuhl für Algorithm Engineering, LS11
Sequenzen-Alignierung in der Bioinformatik VO Algorithm Engineering Professor Dr. Petra Mutzel Lehrstuhl für Algorithm Engineering, LS11 23. VO 24.01.2006 1 1 Literatur für diese VO Volker Heun: Skriptum
MehrÜbung II. Einführung, Teil 1. Arbeiten mit Ensembl
Übung II Einführung, Teil 1 Arbeiten mit Ensembl Ensembl Genome Browser (Bereitstellung von Vielzeller Genomen) Projekt wurde 1999 initiiert Projektpartner EMBL European Bioinformatics Institute (EBI)
MehrVorbesprechung Seminar Biomedical Informatics
Vorbesprechung Martin Dugas und Xiaoyi Jiang Institut für Informatik Sommersemester 2016 Organisation Vorlage: Englischsprachige Publikation Vortrag: ca. 30min + 15min Diskussion, Blockseminar Anfang/Mitte
MehrBIOINFORMATIK I ÜBUNGEN.
BIOINFORMATIK I ÜBUNGEN http://icbi.at/bioinf Organisation 3 Übungen Kurze Einführung anschließend Labor Protokoll (je 2 Studierende, elektronisch doc, pdf..) Abgabe der Übungen bis spätestens 29. 05.
MehrBioinformatik für Lebenswissenschaftler
Bioinformatik für Lebenswissenschaftler Oliver Kohlbacher, Steffen Schmidt SS 2010 10. Multiples Alignment II & PSI-BLAST Abt. Simulation biologischer Systeme WSI/ZBIT, Eberhard Karls Universität Tübingen
MehrBioinformatik I (Einführung)
Kay Diederichs, Sommersemester 2018 Bioinformatik I (Einführung) Algorithmen Sequenzen Strukturen PDFs unter http://strucbio.biologie.unikonstanz.de/~dikay/bioinformatik/ Klausur: Mo 30.7. 14:30-15:30
MehrBioinformatik für Lebenswissenschaftler
Bioinformatik für Lebenswissenschaftler Oliver Kohlbacher, Steffen Schmidt SS 2010 11. Hiden Markov Models & Phylogenien Abt. Simulation biologischer Systeme WSI/ZBIT, Eberhard Karls Universität Tübingen
MehrBioinformatik für Lebenswissenschaftler
Bioinformatik für Lebenswissenschaftler Oliver Kohlbacher, Steffen Schmidt SS 2010 11. Hiden Markov Models & Phylogenien Abt. Simulation biologischer Systeme WSI/ZBIT, Eberhard Karls Universität Tübingen
MehrPrinciples of heredity Mutations, substitutions and polymorphisms
Bioinformatics 1 Principles of heredity Mutations, substitutions and polymorphisms Claudia Acquisti Evolutionary Functional Genomics Institute for Evolution and Biodiversity, WWU Münster claudia.acquisti@uni-muenster.de
MehrBioinformatik II: Phylogenetik
Bioinformatik II: Phylogenetik phylogenetisch Phylai: griechische Klans phylum: der Stamm phylogenetisch: die Stammesgeschichte von Lebewesen betreffend Hierarchien der Klassifikation: Domäne: Eukaryonten
MehrV2 Paarweises Sequenzalignment
Methoden des Sequenzalignments V2 Paarweises Sequenzalignment Austauschmatrizen Bedeutsamkeit von Alignments BLAST, Algorithmus Parameter Ausgabe http://www.ncbi.nih.gov Diese Vorlesung lehnt sich eng
MehrAlgorithmische Bioinformatik
Algorithmische Bioinformatik Substitutionsmatrizen Ulf Leser Wissensmanagement in der Bioinformatik Ziele Ein sehr kleiner Einblick in Evolutionsgenetik Kenntnis einer typischen realen bioinformatischen
MehrPaarweises Sequenzalignment
Methoden des Sequenzalignments Paarweises Sequenzalignment Áustauschmatrizen Bedeutsamkeit von Alignments BLAST, Algorithmus Parameter Ausgabe http://www.ncbi.nih.gov Diese Vorlesung lehnt sich eng an
MehrProseminar Bioinformatik
Proseminar Bioinformatik Thema Algorithmic Concepsts for Searching in Biological Databases von Uwe Altermann 30.05.2009 1 Einführung Im Folgenden soll ein Überblick über die verschiedenen algorithmischen
MehrAlgorithmen auf Sequenzen Paarweiser Sequenzvergleich: Alignments
Algorithmen auf Sequenzen Paarweiser Sequenzvergleich: Alignments Sven Rahmann Genominformatik Universitätsklinikum Essen Universität Duisburg-Essen Universitätsallianz Ruhr Einführung Bisher: Berechnung
MehrMagic Figures. We note that in the example magic square the numbers 1 9 are used. All three rows (columns) have equal sum, called the magic number.
Magic Figures Introduction: This lesson builds on ideas from Magic Squares. Students are introduced to a wider collection of Magic Figures and consider constraints on the Magic Number associated with such
MehrPaarweises Sequenzalignment
Methoden des Sequenzalignments Paarweises Sequenzalignment Austauschmatrizen Bedeutsamkeit von Alignments BLAST, Algorithmus Parameter Ausgabe http://www.ncbi.nih.gov Diese Vorlesung lehnt sich eng an
MehrPaarweises Sequenzalignment
Methoden des Sequenzalignments Paarweises Sequenzalignment Áustauschmatrizen Bedeutsamkeit von Alignments BLAST, Algorithmus Parameter Ausgabe http://www.ncbi.nih.gov Diese Vorlesung lehnt sich eng an
MehrÜbung 1 Bioinformatik. Ihre Namen:
Evolutionsbiologie 2 Übung 1 Bioinformatik WS2018/2019 Ihre Namen: llgemeine Hinweise: Für die Zulassung zur Klausur muss dieses Übungsblatt bearbeitet und als bestanden bewertet sein. Sie können das Übungsblatt
MehrKapitel 7: Sequenzen- Alignierung in der Bioinformatik
Kapitel 7: Sequenzen- Alignierung in der Bioinformatik 7.3: Paarweise Sequenzen-Alignierung 7.4: Multiple Sequenzen Alignierung VO Algorithm Engineering Professor Dr. Petra Mutzel Lehrstuhl für Algorithm
MehrAlgoBio WS 16/17 Protein-DNA Interaktionen ChiP-Seq Datenanalyse. Annalisa Marsico
AlgoBio WS 16/17 Protein-DNA Interaktionen ChiP-Seq Datenanalyse Annalisa Marsico 6.02.2017 Protein-DNA Interaktionen Häufig binden sich Proteine an DNA, um ihre biologische Funktion zu regulieren. Transkriptionsfaktoren
MehrPraktikum Algorithmischen Anwendungen WS 2006/07 Bioinformatik Sequence-Aligment Team C rot Ala0607
Praktikum Algorithmischen Anwendungen WS 2006/07 Bioinformatik Sequence-Aligment Team C rot Ala0607 Blöink, Frank 11038619 ai600@gm.fh-koeln.de Wolters, Benjamin 11037092 ai651@gm.fh-koeln.de 26. Januar
MehrBioinformatik Für Biophysiker
Bioinformatik Für Biophysiker Wintersemester 2005 / 2006 Ulf Leser Wissensmanagement in der Bioinformatik Wissensmanagement in der Bioinformatik Lehrstuhl seit 10/2002 Schwerpunkte Algorithmen der Bioinformatik
MehrAlgorithmen für paarweise Sequenz-Alignments. Katharina Hembach
Proseminar Bioinformatik WS 2010/11 Algorithmen für paarweise Sequenz-Alignments Katharina Hembach 06.12.2010 1 Einleitung Paarweise Sequenz-Alignments spielen in der Bioinformatik eine wichtige Rolle.
MehrInformatik für Mathematiker und Physiker Woche 2. David Sommer
Informatik für Mathematiker und Physiker Woche 2 David Sommer David Sommer 25. September 2018 1 Heute: 1. Self-Assessment 2. Feedback C++ Tutorial 3. Modulo Operator 4. Exercise: Last Three Digits 5. Binary
MehrStatistische Verfahren:
Statistische Verfahren: Hidden-Markov-Modelle für Multiples Alignment Stochastic Context-Free Grammars (SCFGs) für RNA-Multiples Alignment Übersicht 1 1. Hidden-Markov-Models (HMM) für Multiples Alignment
MehrBioinformatik Für Biophysiker
Bioinformatik Für Biophysiker Wintersemester 2006 / 2007 Ulf Leser Wissensmanagement in der Bioinformatik Wissensmanagement in der Bioinformatik Lehrstuhl seit 10/2002 Schwerpunkte Algorithmen der Bioinformatik
MehrData Structures and Algorithm Design
- University of Applied Sciences - Data Structures and Algorithm Design - CSCI 340 - Friedhelm Seutter Institut für Angewandte Informatik Contents 1 Analyzing Algorithms and Problems 2 Data Abstraction
MehrAlgorithmische Bioinformatik
FREIE UNIVERSITÄT BERLIN Fachbereich Mathematik und Informatik Institut für Informatik (WE 3) FU BERLIN Freie Universität Berlin FB Mathematik und Informatik, Institut für Informatik, Takustr. 9, D-14195
MehrMotiv und Domänensuche
Motiv und Domänensuche Strukturelle Bioinformatik WS15/16 Dr. Stefan Simm, 09.12.2015 simm@bio.uni-frankfurt.de Motiv und Domänensuche SIGNALVORHERSAGE (MOTIV) Ansatz für Signalvorhersage 1. Zielsignalsuche
MehrEinführung in die Bioinformatik
Einführung in die Bioinformatik SS 2014 1. Was ist Bioinformatik? Kay Nieselt Integrative Transkriptomik Zentrum für Bioinformatik Tübingen Kay.Nieselt@uni-tuebingen.de Ablauf und Formales Ringvorlesung
MehrInformationsvisualisierung
Informationsvisualisierung Thema: 7. Visualisierung Biologischer Daten Dozent: Dr. Dirk Zeckzer zeckzer@informatik.uni-leipzig.de Sprechstunde: nach Vereinbarung Umfang: 2 Prüfungsfach: Modul Fortgeschrittene
MehrNumber of Maximal Partial Clones
Number of Maximal Partial Clones KARSTEN SCHÖLZEL Universität Rostoc, Institut für Mathemati 26th May 2010 c 2010 UNIVERSITÄT ROSTOCK MATHEMATISCH-NATURWISSENSCHAFTLICHE FAKULTÄT, INSTITUT FÜR MATHEMATIK
MehrSequenzvergleich und Datenbanksuche
Sequenzvergleich und Datenbanksuche Vorlesung Einführung in die Angewandte Bioinformatik Prof. Dr. Sven Rahmann Webseite zur Vorlesung http://bioinfo.wikidot.com/ Sprechstunde Mo 16-17 in OH14, R214 Sven.Rahmann
MehrStudiengang Informatik der FH Gießen-Friedberg. Sequenz-Alignment. Jan Schäfer. WS 2006/07 Betreuer: Prof. Dr. Klaus Quibeldey-Cirkel
Studiengang Informatik der FH Gießen-Friedberg Sequenz-Alignment Jan Schäfer WS 2006/07 Betreuer: Prof. Dr. Klaus Quibeldey-Cirkel Überblick Einführung Grundlagen Wann ist das Merkmal der Ähnlichkeit erfüllt?
MehrMOL.504 Analyse von DNA- und Proteinsequenzen. Übungsaufgaben BLAST-Sequenzsuche und -vergleiche
MOL.504 Analyse von DNA- und Proteinsequenzen Übungsaufgaben BLAST-Sequenzsuche und -vergleiche Ü6a blastn und blastx Verwenden Sie die in Übung 3 (Datenbanken) gefundene yqjm-sequenz aus Bacillus subtilis
MehrEinführung in die Bioinformatik
Einführung in die Bioinformatik SS 2013 1. Was ist Bioinformatik? Kay Nieselt Integrative Transkriptomik Zentrum für Bioinformatik Tübingen Kay.Nieselt@uni-tuebingen.de Ablauf und Formales Ringvorlesung
MehrAlignment von DNA- und Proteinsequenzen
WS2017/2018 Genomforschung und Sequenzanalyse - Einführung in Methoden der Bioinformatik- Thomas Hankeln Alignment von DNA- und Proteinsequenzen das vielleicht wichtigste Werkzeug der Bioinformatik! 1
MehrBCDS Seminar. Protein Tools
BCDS Seminar Protein Tools Gliederung Nützliche Tools Three-/one-letter Amino Acids' Сodes RandSeq Random Protein Sequence Generator Protein Colourer ProtParam PeptideCutter ProtScale TMHMM Server 2.0
MehrEin Stern in dunkler Nacht Die schoensten Weihnachtsgeschichten. Click here if your download doesn"t start automatically
Ein Stern in dunkler Nacht Die schoensten Weihnachtsgeschichten Click here if your download doesn"t start automatically Ein Stern in dunkler Nacht Die schoensten Weihnachtsgeschichten Ein Stern in dunkler
MehrEnglisch-Grundwortschatz
Englisch-Grundwortschatz Die 100 am häufigsten verwendeten Wörter also auch so so in in even sogar on an / bei / in like wie / mögen their with but first only and time find you get more its those because
MehrNEWSLETTER. FileDirector Version 2.5 Novelties. Filing system designer. Filing system in WinClient
Filing system designer FileDirector Version 2.5 Novelties FileDirector offers an easy way to design the filing system in WinClient. The filing system provides an Explorer-like structure in WinClient. The
MehrAufgabe 6: Distanzbasierte Phylogenie: Hierarchisches Clustering. Ulf Leser Wissensmanagement in der Bioinformatik
Aufgabe 6: Distanzbasierte Phylogenie: Hierarchisches Clustering Ulf Leser Wissensmanagement in der Bioinformatik Daten Wir verwenden neue Daten Die müssen sie ausnahmsweise selber suchen DNA-Sequenzen
MehrThreading - Algorithmen
Threading - Algorithmen Florian Lindemann 22.11.2007 Florian Lindemann () Threading - Algorithmen 22.11.2007 1 / 25 Gliederung 1 Prospect Scoring Function Algorithmus Weitere Eigenschaften Komplexität
MehrStatistics, Data Analysis, and Simulation SS 2015
Mainz, June 11, 2015 Statistics, Data Analysis, and Simulation SS 2015 08.128.730 Statistik, Datenanalyse und Simulation Dr. Michael O. Distler Dr. Michael O. Distler
MehrAufgabenblatt 4. Silke Trißl Wissensmanagement in der Bioinformatik
Aufgabenblatt 4 Silke Trißl Wissensmanagement in der Bioinformatik Zuerst! FRAGEN? Silke Trißl: Bioinformatik für Biophysiker 2 Exercise 1 Global alignment using dynamic programming Write a program to
Mehr8.1 Einleitung. Grundlagen der Künstlichen Intelligenz. 8.1 Einleitung. 8.2 Lokale Suchverfahren. 8.3 Zusammenfassung. Suchprobleme: Überblick
Grundlagen der Künstlichen Intelligenz 5. April 0 8. Suchalgorithmen: Lokale Suche Grundlagen der Künstlichen Intelligenz 8. Suchalgorithmen: Lokale Suche 8.1 Einleitung Malte Helmert Universität Basel
MehrQuantifizierung evolutionärer Veränderungen
Quantifizierung evolutionärer Veränderungen Begriff der Homologie/Homoplasie Methoden des Sequenzvergleichs/Alignments Verfahren und Modelle zur Berechnung von Austauschraten in DNA und Proteinen Thomas
MehrSelbstbild vs. Fremdbild. Selbst- und Fremdwahrnehmung des Individuums (German Edition)
Selbstbild vs. Fremdbild. Selbst- und Fremdwahrnehmung des Individuums (German Edition) Jasmin Nowak Click here if your download doesn"t start automatically Selbstbild vs. Fremdbild. Selbst- und Fremdwahrnehmung
MehrKilly Literaturlexikon: Autoren Und Werke Des Deutschsprachigen Kulturraumes 2., Vollstandig Uberarbeitete Auflage (German Edition)
Killy Literaturlexikon: Autoren Und Werke Des Deutschsprachigen Kulturraumes 2., Vollstandig Uberarbeitete Auflage (German Edition) Walther Killy Click here if your download doesn"t start automatically
MehrGenomics. Ernst W. Mayr Fakultät für Informatik TU München
Genomics Ernst W. Mayr Fakultät für Informatik TU München http://wwwmayr.in.tum.de/ A. Biologische Hintergründe nde 1. Gene und Phänotypisches 1.1. Beobachtungen nach Mendel 1.2. Eukaryotische Zelle 1.3.
MehrDie einfachste Diät der Welt: Das Plus-Minus- Prinzip (GU Reihe Einzeltitel)
Die einfachste Diät der Welt: Das Plus-Minus- Prinzip (GU Reihe Einzeltitel) Stefan Frà drich Click here if your download doesn"t start automatically Die einfachste Diät der Welt: Das Plus-Minus-Prinzip
MehrBrandbook. How to use our logo, our icon and the QR-Codes Wie verwendet Sie unser Logo, Icon und die QR-Codes. Version 1.0.1
Brandbook How to use our logo, our icon and the QR-Codes Wie verwendet Sie unser Logo, Icon und die QR-Codes Version 1.0.1 Content / Inhalt Logo 4 Icon 5 QR code 8 png vs. svg 10 Smokesignal 11 2 / 12
MehrGrundlagen der Bioinformatik Assignment 2: Substring Search SS Yvonne Lichtblau
Grundlagen der Bioinformatik Assignment 2: Substring Search SS 2016 Yvonne Lichtblau Vorstellung Lösungen Übung 1 Yvonne Lichtblau Übungen Grundlagen der Bioinformatik SS 2016 2 Aufgetretene Probleme Sourcecode
MehrAufgabe 7: Distanzbasierte Phylogenie: Neighbor Joining. Stefan Kröger, Philippe Thomas Wissensmanagement in der Bioinformatik
Aufgabe 7: Distanzbasierte Phylogenie: Neighbor Joining Stefan Kröger, Philippe Thomas Wissensmanagement in der Bioinformatik Daten Wir verwenden neue Daten Die müssen sie ausnahmsweise selber suchen DNA-Sequenzen
MehrFOLDALIGN und sein Algorithmus. Nadine Boley Silke Szymczak
FOLDALIGN und sein Algorithmus Nadine Boley Silke Szymczak Gliederung 2 Einleitung Motivation des Ansatzes zu FOLDALIGN Sankoff-Algorithmus Globales Alignment Zuker-Algorithmus Kombination FOLDALIGN Algorithmus,
MehrWelche Alignmentmethoden haben Sie bisher kennengelernt?
Welche Alignmentmethoden haben Sie bisher kennengelernt? Was heißt optimal? Optimal = die wenigsten Mutationen. Sequenzen bestehen aus Elementen (z.b. Aminosäuren oder Nukleotide). Edit Distanzen sind
Mehr