Algorithmische Bioinformatik
|
|
|
- Sara Emilia Arnold
- vor 7 Jahren
- Abrufe
Transkript
1 Algorithmische Bioinformatik Substitutionsmatrizen Ulf Leser Wissensmanagement in der Bioinformatik
2 Ziele Ein sehr kleiner Einblick in Evolutionsgenetik Kenntnis einer typischen realen bioinformatischen Vorgehensweise: Viel schätzen, viel ignorieren, viel abkürzen (und es funktioniert doch) Einstieg in echte Probleme Ulf Leser: Algorithmische Bioinformatik 2
3 Inhalt dieser Vorlesung Mutationswahrscheinlichkeiten Jukes-Cantor Modell (für DNA) Substitutionsmatrizen Ulf Leser: Algorithmische Bioinformatik 3
4 Hintergrund Warum Ähnlichkeitsmatrizen, Substitutionsmatrizen,? Ersetzung einer Aminosäure durch eine andere hat unterschiedliche Bedeutung je nach Paar Ersetzung mit sehr ähnlichen Aminosäuren ändert Proteinstruktur in der Regel kaum Ersetzung mit wenig ähnlichen Aminosäuren kann Struktur vollkommen ändern Ulf Leser: Algorithmische Bioinformatik 4
5 Unterschiedliche Aminosäuren Ulf Leser: Algorithmische Bioinformatik 5
6 Substitutionsmatrizen Individuelle Bewertung von Mismatches (und Matches) Algorithmen bleiben unberührt Blosum62 C S T P A G N D E Q H R K M I L V F Y W C S T P A G N D E Q H R K M I L V F Y W DNA-Matrix von BLAST A C G T A C G T Ulf Leser: Algorithmische Bioinformatik 6
7 Ist das notwendig? Häufigkeiten der Ersetzung einer Aminosäure durch irgendeine andere AA im Verhältnis zu allen Ersetzungen Alanin (A) willkürlich als 100% gesetzt Keine Gleichverteilung Mutationen sind mehr oder weniger erfolgreich, je nachdem, welche AA ersetzt wird Besser: Mutationen werden durch Selektion mehr oder weniger geduldet Tryptophan (W) sehr selten (25) Serin (S) sehr häufig (117) Ulf Leser: Algorithmische Bioinformatik 7
8 Woher nehmen? Für Aminosäuren benötigt man ~200 (verschiedene) Werte Wie kann man sinnvolle Werte für die Matrix bestimmen? Möglichkeit 1: Physikalische / chemische Eigenschaften Ladung, Größe, Polarität,... Viele Faktoren mit unklaren Gewichten Wie soll man das durch ein Bewertungsschema ausdrücken? Keine Verwendung in der Praxis Möglichkeit 2: Empirisch Beobachtung der Evolution statt analytischer Vorhersage Lernen aus Beispielen: Tatsächlich vorgekommener Mutationen Benötigt Beispieldaten, also Paare von homologen Sequenzen Ulf Leser: Algorithmische Bioinformatik 8
9 Inhalt dieser Vorlesung Mutationswahrscheinlichkeiten Jukes-Cantor Modell (für DNA) Substitutionsmatrizen Ulf Leser: Algorithmische Bioinformatik 9
10 Evolutionäre Abstände Wichtige Unterscheidung Mutation: Evolutionäres Ereignis, nicht beobachtbar Substitution: Beobachteter Mismatch; Mutation, die überdauert hat Gesucht: Maß für evolutionären Abstand zweier Sequenzen Populär: Menge an stattgefundenen Punktmutationen? Ignoriert InDels (selten in kodierenden Bereichen) Nimmt Gleichverteilung von Mutationen in Zeit und Raum an Messen kann man aber nur Zahl der Substitutionen Wie viele Mutationen sind (im Schnitt) notwendig, um in einer n Zeichen langen Sequenz x Substitutionen zu erzeugen? Ulf Leser: Algorithmische Bioinformatik 10
11 Jukes-Cantor-Modell Lösung hängt vom Evolutionsmodell ab Wahrscheinlichkeiten aller Basenmutationen Abhängigkeiten von Mutationen zwischen verschiedenen Positionen Abhängigkeit der Wahrscheinlichkeiten von Sequenzlänge Einfachstes Modell: Jukes-Cantor Jukes, Cantor (1969). Evolution of Protein Molecules. Academic Press Alle Positionen werden mit der gleichen Wsk verändert Alle Basenmutationen sind gleichwahrscheinlich Wskten ändern sich nicht über die Zeit Sei α die Wsk des Auftretens einer beliebigen Mutation an einer festen Position Ulf Leser: Algorithmische Bioinformatik 11
12 Ableitung [EG01] Sei P CC (t) die Wsk, dass an einer geg. Position nach t Mutationen ein C steht, wenn dort auch im Original ein C steht. Dann gilt: α A α α α G α p CC (1) = 1 - (CA CG CT) = 1-3*α p CC (2) = p CC (1)*(1-3α) + (1-p CC (1))α C α T p CC (t+1) = p CC (t)*(1-3α) + (1-p CC (t))α Auflösen (siehe Literatur) ergibt Bemerkung p CC (t) = ¼ + (3/4)*e -4αt Konvergiert gegen 1/4, also gegen eine zufällige Sequenz Ulf Leser: Algorithmische Bioinformatik 12
13 Evolutionäre Verhältnisse Ursprungssequenz t t Vergleichssequenz1 Vergleichssequenz2 Wsk, dass eine gegebene Base X aus der Ursprungssequenz in beiden Ästen nicht mutiert ist: p XX (t)*p XX (t) = p XX (t) 2 Wsk, dass eine gegebene Base X aus der Ursprungssequenz in beiden Ästen nicht substituiert ist: tα I( t) = pxx ( t) + PBX ( t) = + e 4 4 B X Ulf Leser: Algorithmische Bioinformatik 13
14 Von Substitutionen zu Mutationen Wsk, dass eine Base substituiert ist, ist dann p(t)=1-i(t)= 3/4-3/4*e -8αt = ¾*(1-e -8αt ) Umformung ergibt: 8αt = -ln(1-4/3p(t)) Wir wollen wissen, für wie viele Mutationen der Erwartungswert der entstehenden Substitutionen gleich der Zahl beobachteter Substitutionen ist Dann können wir aus der beobachteten Zahl von Substitutionen die wahrscheinlichste Zahl tatsächlicher Mutationen schätzen Wie viele Mutationen gab es? Im Schnitt k=3α*2t Umformen und einsetzen für α ergibt: 8t*k/6/t = -ln(1-4/3p(t)) Zusammen: k = -3/4 * ln(1-4/3p(t)) p(t) ist der Erwartungswert, dessen empirischen Wert wir kennen: Zahl der Substitutionen = %-Identität Ulf Leser: Algorithmische Bioinformatik 14
15 Jukes-Cantor Korrektur Geschätzte Mutationen Beobachtete Substitutionen Ulf Leser: Algorithmische Bioinformatik 15
16 Kimura s Modell Pyrimidine: Cytosin, Thymin, Uracil: Ein Ring A β G Purine: Adenin, Guarin: Zwei Ringe Transversion: Purin Pyrimidin oder umgekehrt α α α α Transition: Purin Purin oder Pyrimidin Pyrimidin C β T Ulf Leser: Algorithmische Bioinformatik 16
17 Inhalt dieser Vorlesung Mutationswahrscheinlichkeiten Jukes-Cantor Modell (für DNA) Substitutionsmatrizen PAM: Point-Accepted Mutations BLOSUM: Blocks Substitution Matrizes Ulf Leser: Algorithmische Bioinformatik 17
18 Margaret O. Dayhoff Deduce evolutionary relationships of the biological kingdoms, phyla, and other taxa from sequence evidence Collection of all known protein sequences First edition: 65 proteins Several printed releases Resulted in the Protein Information Resource (PIR) Bild: Dank an Antje Krause Ulf Leser: Algorithmische Bioinformatik 18
19 PAM: Point-Accepted Mutations Dayhoff et al. A model of evolutionary change in proteins, 1972 Zwei Bedeutungen 1 PAM Einheit für den evolutionären Abstand von Proteinsequenzen PAM-X Matrix Berechnete Substitutionsmatrix für zwei Sequenzen, die X PAM entfernt sind Ulf Leser: Algorithmische Bioinformatik 19
20 PAM als Sequenzabstand Definition Seien S 1 und S 2 Proteinsequenzen mit S 1 = S 2. S 1 und S 2 heißen x PAM entfernt, wenn S 1 in S 2 wahrscheinlich mit x Punktmutationen pro 100 Aminosäuren überführt wurde Eigenschaften PAM beachtet keine Inserts und Deletions x schätzt man aus den Substitutionen zwischen S 1 und S 2 Berechnung ähnlich Jukes-Cantor, aber auf Aminosäuren 50 PAM Abstand heißt also nicht etwa 50 Substitutionen pro 100 AA Ulf Leser: Algorithmische Bioinformatik 20
21 PAM Abstand und Sequenzidentität Jenseits von PAM 250: Rauschen Ulf Leser: Algorithmische Bioinformatik 21
22 PAM Matrizen Definition: Seien (S 1,1, S 2,1 ),..., (S 1,n, S 2,n ) Paare von AA- Sequenzen, die jeweils x PAM entfernt sind. Dann ist die PAM-x Matrix M x wie folgt definiert: Sei f(i) die relative Häufigkeit der Aminosäure A i Seien alle Paare optimal aligniert Sei S k,l das S k,l mit den durch das Alignment eingefügten Leerzeichen Sei f(i,j) die relative Übergangshäufigkeit von A i zu A j in allen alignierten Paaren Relativer Anteil von Positionen k mit S 1,z [k]=a i und S 2,z [k]=a j oder umgekehrt Damit: Übergang ist richtungslos : f(i,j) = f(j,i) Paare (A x, _) werden ignoriert M x ( i, j) = log f ( i, j) f ( i)* f ( j) Ulf Leser: Algorithmische Bioinformatik 22
23 Log-Odds Ratio Erläuterung Numerischer Trick: Logarithmus zur Ersetzung von Mult durch Add Bedeutung des Bruchs Verhältnis der beobachteten Substitutionen zu den erwarteten Substitutionen bei statistischer Unabhängigkeit M x ( i, M(i,j) = 0 (Bruch = 1) Keine Selektion - Anzahl Übergänge entspricht statistischer Erwartung M(i,j) < 0 (Bruch < 1) Negative Selektion Übergang wird unterdrückt M(i,j) > 0 (Bruch > 1) j) = log f f ( i, j) ( i)* f ( j) Positive Selektion Übergang wird bevorzugt Ulf Leser: Algorithmische Bioinformatik 23
24 Beispiel S 1,1 : ACGGTGAC S 2,1 : AGG_TGCC S 1,2 : GTT_AGCTA S 2,2 : TTTCAG_TA S 1,3 : GGTCAA S 2,3 : AGTC_A Relative Häufigkeiten A: 11/42 C: 8/42 G: 12/42 T: 11/42 Übergangshäufigkeiten Substitutionsmatrix A C G T A 4/19 1/19 1/19 0/19 C 2/19 1/19 0/19 G 4/19 1/19 T 5/19 A C G T A 0,48 0,02-0,15 - C 0,46-0,01 - G 0,41-0,15 T 0,58 Ulf Leser: Algorithmische Bioinformatik 24
25 Fehlerquellen Es kann viele optimale Alignments geben Wahl eines Alignments besonders bei großem Abstand (also auch großen x) schwierig und subjektiv Einfach: FMM_IYVVYL FMMUIYV_YL PAM Abstand ist nur eine Schätzung Je fehleranfälliger, je größer x ist Für größere Abstände benötigt ein gutes Alignment individuelle Mutationswahrscheinlichkeiten Die suchen wir aber gerade Schwierig: FMMF_YV_VYL UFPHVYLYL _FMMFYVVYL UFPHVYL_YL FMMFYVVYL UFPHVYLYL Ulf Leser: Algorithmische Bioinformatik 25
26 Reale PAM Matrizen Annahme der Molecular Clock Theory Evolution verläuft gleichmäßig in der Zeit und in den Sequenzpositionen Damit möglich: Hochrechnung der Matrixeinträge für große x aus der Matrix für kurze x Vorgehen von Dayhoff et al. Paare eng verwandter Sequenzen auswählen Sehr hohe %-Identität, 34 Proteinfamilien Manuell alignieren PAM-1 Matrix M 1 aus Häufigkeiten berechnen PAM-x Matrizen berechnen durch: M x =(M 1 ) x Ulf Leser: Algorithmische Bioinformatik 26
27 PAM Multiplikationen der PAM-1 Matrix mit sich selber Cys 12 Gly -3 5 Pro Ser Ala Thr Asp Glu Asn Gln His Lys Arg Val Met Ile Leu Phe Tyr Trp Cys Gly Pro Ser Ala Thr Asp Glu Asn Gln His Lys Arg Val Met Ile Leu Phe Tyr Trp Ulf Leser: Algorithmische Bioinformatik 27
28 Verwendung Welche PAM Matrix soll man zur Alignierung zweier Sequenzen verwenden? Die, die dem PAM-Abstand der Sequenzen entspricht Den kennt man aber nicht schätzen Schätzung benötigt Alignments Zur Berechnung der Sequenzidentität Alignments basieren auf Substitutionsmatrizen Henne Ei Problem Also Iteratives Verfahren einsetzten und auf Konvergenz warten Verschiedene Matrizen testen Externes Wissen (Chemie, Domänen, etc.) hinzuziehen Ulf Leser: Algorithmische Bioinformatik 28
29 BLOSUM Matrizen Hauptkritikpunkte am PAM Ansatz PAM-x vervielfältigen Fehler in PAM-1 Einbeziehung der kompletten Proteinsequenzen Unterliegen alle Positionen der selben Mutationsrate? Neueres Verfahren: BLOSUM BLOcks SUbstitution Matrix Erster Schritt: Multiple Alignments evolutionär entfernter, aber homologer Proteinsequenzen Matrixberechnung nur aus konservierten Blöcken Heute populärer als PAM Matrizen Ulf Leser: Algorithmische Bioinformatik 29
30 Vorarbeiten PROSITE Beschreibung funktionaler (=konservierter) Bereiche in homologen Proteinsequenzen durch reguläre Ausdrücke Expertenwissen - manuelle Pflege der Datenbank am EBI BLOCKS Alignierung von durch PROSITE Ausdrücke gematchten Sequenzen in Multiple Alignments (MSA) Multiple Sequence Alignment (später mehr) Heute: Verwendung weiterer Domänen aus PRINTS, PFAM,... Ein Block ist ein zusammenhängendes und hochgradig konserviertes Stück eines MSAs FMYMFYVVPL_PQ QVY FYQQF VQLYP_MFQV_ FMY YUVQQP_UMUQ Ulf Leser: Algorithmische Bioinformatik 30
31 BLOSUM Matrizen Berechnung der BLOSUM Matrizen: Wie PAM-1 Matrix, aber nur die Sequenzen in den Blocks werden betrachtet BLOSUM x Matrizen Bias durch viele sehr ähnliche Sequenzen Sequenzdatenbanken sind keine zufälligen Stichproben Zur Berechnung der BLOSUM-x Matrix werden in jedem Block alle Sequenzen mit >x%-identität zu einer Sequenz zusammengefasst Gänzlich andere Bedeutung des x als in PAM-x Aber ähnliche Verwendung: x hängt mit dem evolutionären Abstand der betrachteten Sequenzen zusammen BLOSUM-62 heute typischer Default bei Alignments Ulf Leser: Algorithmische Bioinformatik 31
32 Zusammenfassung Willkommen im Reich der Heuristiken Substitutionsmatrizen Beobachtung evolutionär entstandener Unterschiede Schätzung des wahren evolutionären Abstands aus der Zahl der Unterschiede Abstand = Zahl der Punktmutationen Zeiteinheit Implizite Beachtung vielfältiger Faktoren Ladungen, Nachbarschaft, 3D-Struktur, Berechnung von Matrizen immer mit Hilfe von Alignments Iterative Strategien Ulf Leser: Algorithmische Bioinformatik 32
33 Literatur Ewens, W. J. and Grant, G. R. (2001). "Statistical Methods in Bioinformatics", Springer. Dayhoff, M. O., R. V. Eck, C. M. Park A model of evolutionary change in proteins. In M. O. Dayhoff, ed., Atlas of Protein Sequence and Structure Vol. 5. Henikoff, S. and Henikoff, J. G. (1993). "Performance evaluation of amino acid substitution matrices." Proteins 17(1): Ulf Leser: Algorithmische Bioinformatik 33
34 Selbsttest Was will das Jukes-Cantor Modell berechnen? Warum spricht man dabei immer vom Erwartungswert. Kann man die Zahl der Mutationen nicht exakt bestimmen? Was besagt die Molecular Clock Theory? Wie werden PAM Matrizen berechnet? Wie werden BLOSSUM Matrizen berechnet (und warum reicht PAM nicht)? Ulf Leser: Algorithmische Bioinformatik 34
Bioinformatik. Substitutionsmatrizen BLAST. Ulf Leser Wissensmanagement in der. Bioinformatik
Bioinformatik Substitutionsmatrizen BLAST Ulf Leser Wissensmanagement in der Bioinformatik Inhalt dieser Vorlesung Substitutionsmatrizen: PAM und BLOSSUM Suche in Datenbanken: Basic Local Alignment Search
Aufgabenblatt 5. Silke Trißl Wissensmanagement in der Bioinformatik
Aufgabenblatt 5 Silke Trißl Wissensmanagement in der Bioinformatik Zuerst! FRAGEN? Silke Trißl: Bioinformatik für Biophysiker 2 Exercise 1 + 2 Modify program to compare protein sequence read substitution
Bioinformatik. BLAST Basic Local Alignment Search Tool. Ulf Leser Wissensmanagement in der. Bioinformatik
Bioinformatik BLAST Basic Local Alignment Search Tool Ulf Leser Wissensmanagement in der Bioinformatik Praktikum Anmeldung bis 10.02.2004 bei Silke Trißl ([email protected]) Name, Vorname
Primärstruktur. Wintersemester 2011/12. Peter Güntert
Primärstruktur Wintersemester 2011/12 Peter Güntert Primärstruktur Beziehung Sequenz Struktur Proteinsequenzen, Sequenzdatenbanken Sequenzvergleich (sequence alignment) Sequenzidentität, Sequenzhomologie
Zentrum für Bioinformatik. Übung 4: Revision. Beispielfragen zur Klausur im Modul Angewandte Bioinformatik (erste Semesterhälfte)
Andrew Torda Björn Hansen Iryna Bondarenko Zentrum für Bioinformatik Übung zur Vorlesung Angewandte Bioinformatik Sommersemester 2014 20./23.06.2014 Übung 4: Revision Beispielfragen zur Klausur im Modul
Multiple Alignments. Vorlesung Einführung in die Angewandte Bioinformatik Prof. Dr. Sven Rahmann. Webseite zur Vorlesung
Multiple Alignments Vorlesung Einführung in die Angewandte Bioinformatik Prof. Dr. Sven Rahmann Webseite zur Vorlesung http://bioinfo.wikidot.com/ Sprechstunde Mo 16-17 in OH14, R214 Sven.Rahmann -at-
MOL.504 Analyse von DNA- und Proteinsequenzen
MOL.504 Analyse von DNA- und Proteinsequenzen Kurs 1 Monika Oberer, Karl Gruber MOL.504 Modul-Übersicht Einführung, Datenbanken BLAST-Suche, Sequenzalignment Proteinstrukturen Virtuelles Klonieren Abschlusstest
Dot-Matrix Methode. (Java) (Javascript) 80
Dot-Matrix Methode Vergleich zweier Sequenzen (DNA oder Aminosäuren) Idee: gleiche Basen (Aminosäuren) in x-y Diagramm markieren Sequenz 1: ADRWLVKQN Sequenz 2: ADKFIVRDE http://myhits.vital-it.ch/cgi-bin/dotlet
Bioinformatik. Lokale Alignierung Gapkosten. Silke Trißl / Ulf Leser Wissensmanagement in der. Bioinformatik
Bioinformatik Lokale Alignierung Gapkosten Silke Trißl / Ulf Leser Wissensmanagement in der Bioinformatik Inhalt dieser Vorlesung Ähnlichkeit Lokales und globales Alignment Gapped Alignment Silke Trißl:
Aminosäurenanalytik. Probenvorbereitung Eiweißfällung, Oxidation und Hydrolyse Karl-Heinz Jansen SYKAM CHROMATOGRAPHIE
Aminosäurenanalytik Probenvorbereitung Eiweißfällung, Oxidation und Hydrolyse Karl-Heinz Jansen SYKAM CHROMATOGRAPHIE Proteinfällung 2 Proteinfällung 3 Proteinfällung 4 Proteinfällung 5 Proteinfällung
Verfahren zu Strukturvorhersagen in vereinfachten Modellen. Tobias Voigt Sommerakademie 2002 St. Johann
Verfahren zu Strukturvorhersagen in vereinfachten Modellen Tobias Voigt Sommerakademie 2002 St. Johann Einführung! Sequenzierung von Proteinen und Nukleinsäuren ist heute Routine! Die räumliche Struktur
Pairwise Alignment. Steffen Forkmann. Proseminar: BioInformatik
Pairwise Alignment Steffen Forkmann Proseminar: BioInformatik Wintersemester 2004/2005 Inhaltsverzeichnis 1 Problemstellungen 3 1.1 Rechtschreibkorrektur............................... 3 1.2 DNA- und Aminosäure-Sequenzen........................
Vorlesung Biophysik I - Molekulare Biophysik Kalbitzer/Kremer/Ziegler
Vorlesung Biophysik I - Molekulare Biophysik Kalbitzer/Kremer/Ziegler 23.10. Zelle 30.10. Biologische Makromoleküle I 06.11. Biologische Makromoleküle II 13.11. Nukleinsäuren-Origami (DNA, RNA) 20.11.
Bioinformatik. BLAST Basic Local Alignment Search Tool. Ulf Leser Wissensmanagement in der. Bioinformatik
Bioinformatik BLAST Basic Local Alignment Search Tool Ulf Leser Wissensmanagement in der Bioinformatik Heuristische Alignierung Annotation neuer Sequenzen basiert auf Suche nach homologen Sequenzen in
9. Übung zur Einführung in die Informatik (HaF) (Abschnitt IV: Rechnerstrukturen und Betriebssysteme) Musterlösung
INFO V Bayerische Julius Maximilians Universität Würzburg Lehrstuhl für Technische Informatik Am Hubland 9774 Würzburg Tel. 93 888 7 Fax: 93 888 7 9. Übung zur Einführung in die Informatik HaF Abschnitt
Bioinformatik für Lebenswissenschaftler
Bioinformatik für Lebenswissenschaftler Oliver Kohlbacher, Steffen Schmidt SS 2010 06. Paarweises Alignment Teil II Abt. Simulation biologischer Systeme WSI/ZBIT, Eberhard Karls Universität Tübingen Übersicht
Algorithmen und Datenstrukturen in der Bioinformatik Zweites Übungsblatt WS 05/06 Musterlösung
Johanna Ploog, Konstantin Clemens Freie Universität Berlin Institut für Mathematik II Arbeitsgruppe für Mathematik in den Lebenswissenschaften Algorithmen und Datenstrukturen in der Bioinformatik Zweites
...-Arg-Met-Phe-Ala-Asn-His-Lys-Ser-Val-Gly-...
1. Im Enzym Xase, das aus einer Polypeptidkette aus 300 Aminosäuren besteht, findet sich in der Region der Aminosäuren 40-50 die folgende Aminosäurensequenz:...-Arg-Met-Phe-Ala-Asn-His-Lys-Ser-Val-Gly-...
Algorithmische Bioinformatik
Algorithmische Bioinformatik Effiziente Berechnung des Editabstands Dynamische Programmierung Ulf Leser Wissensmanagement in der Bioinformatik Inhalt dieser Vorlesung Rekursive Definition des Editabstands
Unterrichtsmaterialien in digitaler und in gedruckter Form. Auszug aus:
Unterrichtsmaterialien in digitaler und in gedruckter Form Auszug aus: Die gentechnische Produktion von Insulin - Selbstlerneinheit zur kontextorientierten Wiederholung der molekularen Genetik Das komplette
Biochemie (für Bioinformatiker) WS 2010/2011, 1. Klausur (50 Punkte)
Datum: 06.12.2010 Name: Matrikel-Nr.: Vorname: Studiengang: Bioinformatik Biochemie (für Bioinformatiker) WS 2010/2011, 1. Klausur (50 Punkte) Modulnr.: FMI-BI0027 iermit bestätige ich meine Prüfungstauglichkeit.
Softwarewerkzeuge der Bioinformatik
Bioinformatik Wintersemester 2006/2007 Tutorial 2: paarweise Sequenzaligments BLAST Tutorial 2: BLAST 1/22 Alignment Ausrichten zweier oder mehrerer Sequenzen, um: ihre Ähnlichkeit quantitativ zu erfassen
Übungsaufgaben zur Einführung in die Bioinformatik - Lösungen
18.01.2013 Prof. P. Güntert 1 Vorlesung BPC I: Aspekte der Thermodynamik in der Strukturbiologie Übungsaufgaben zur Einführung in die Bioinformatik - Lösungen 1. Hamming und Levenshtein Distanzen a) Was
Sequenzanalyse mit Markov-Ketten
Sequenzanalyse mit Markov-Ketten Andreas Spillner Bioinformatik, SS 208 Ausgangspunkt Die Abfolge von Buchstaben in einer Sequenz ist zufällig, aber es gibt in der Regel Abhängigkeiten zwischen benachbarten
Alignment von DNA- und Proteinsequenzen
WS2012/2013 Genomforschung und Sequenzanalyse - Einführung in Methoden der Bioinformatik- Thomas Hankeln Alignment von DNA- und Proteinsequenzen das vielleicht wichtigste Werkzeug der Bioinformatik! 1
Algorithmische Bioinformatik
Algorithmische Bioinformatik Multiple Sequence Alignment Sum-of-pairs Score Center-Star Score Ulf Leser Wissensmanagement in der Bioinformatik Inhalt dieser Vorlesung Multiples Sequenzalignment Sum-Of-Pair
Bioinformatik Für Biophysiker
Bioinformatik Für Biophysiker Sommersemester 2009 Silke Trißl / Ulf Leser Wissensmanagement in der Bioinformatik Wissensmanagement in der Bioinformatik Schwerpunkte Algorithmen der Bioinformatik Management
Bioinformatik. BLAT: Datenbanksuche für sehr ähnliche Sequenzen Multiples Sequenzalignment. Silke Trißl / Ulf Leser Wissensmanagement in der
Bioinformatik BLAT: Datenbanksuche für sehr ähnliche Sequenzen Multiples Sequenzalignment Silke Trißl / Ulf Leser Wissensmanagement in der Bioinformatik Hintergrund Schon öfters angesprochen... Ähnlichkeitsmatrizen,
Aufgabe 2: (Aminosäuren)
Aufgabe 2: (Aminosäuren) Aufgabenstellung Die 20 Aminosäuren (voller Name, 1- und 3-Buchstaben-Code) sollen identifiziert und mit RasMol grafisch dargestellt werden. Dann sollen die AS sinnvoll nach ihren
Kapitel 7: Sequenzen- Alignierung in der Bioinformatik
Kapitel 7: Sequenzen- Alignierung in der Bioinformatik 7.3: Paarweise Sequenzen-Alignierung 7.4: Multiple Sequenzen Alignierung VO Algorithm Engineering Professor Dr. Petra Mutzel Lehrstuhl für Algorithm
Dendrogramm der Primaten
Arbeitsblatt 1 Dargestellt ist ein Ausschnitt der DNA-Sequenz für das Enzym NAD- Polymerase, dass bei den Primatenarten Mensch(M), Schimpanse(S), Gorilla(G), Orang-Utan(O) und Gibbon(Gi) vorhanden ist.
Alignment von DNA- und Proteinsequenzen
WS2017/2018 Genomforschung und Sequenzanalyse - Einführung in Methoden der Bioinformatik- Thomas Hankeln Alignment von DNA- und Proteinsequenzen das vielleicht wichtigste Werkzeug der Bioinformatik! 1
Lokale Sequenzähnlichkeit. Genomische Datenanalyse 9. Kapitel
Lokale Sequenzähnlichkeit Genomische Datenanalyse 9. Kapitel Globale Sequenzähnlichkeit: Zwei Cytochrome C Sequenzen: Eine vom Menschen und eine aus der Maus. Die Sequenzen sind gleich lang, man kann sie
Einführung in die Bioinformatik
Einführung in die Bioinformatik SS 2013 1. Was ist Bioinformatik? Kay Nieselt Integrative Transkriptomik Zentrum für Bioinformatik Tübingen [email protected] Ablauf und Formales Ringvorlesung
BIOINF1110 Einführung in die Bioinforma7k. 5. Molekulare Maschinen Proteinstrukturen und ihre Funk/on
BIOINF1110 Einführung in die Bioinforma7k 5. Molekulare Maschinen Proteinstrukturen und ihre Funk/on Oliver Kohlbacher Zentrum für Bioinforma7k Tübingen Proteine Zentrales Dogma DNA Transkription mrna
MBI: Sequenzvergleich ohne Alignment
MBI: Sequenzvergleich ohne Alignment Bernhard Haubold 12. November 2013 Wiederholung Exaktes & inexaktes Matching Das exakte Matching Problem Naive Lösung Präprozessierung Muster(Pattern): Z-Algorithmus,
15. Aminosäuren, Peptide und Proteine
15. Aminosäuren, Peptide und Proteine 1 Proteine (Polypeptide) erfüllen in biologischen ystemen die unterschiedlichsten Funktionen. o wirken sie z.b. bei vielen chemischen eaktionen in der atur als Katalysatoren
Was ist der Promotor? Antwort: Eine spezielle Nucleotidsequenz auf der DNA, an der die RNA-Polymerase bindet um die Transkription zu starten.
Was ist der Promotor? Antwort: Eine spezielle Nucleotidsequenz auf der DNA, an der die RNA-Polymerase bindet um die Transkription zu starten. Wie bezeichnet man den Strang der DNA- Doppelhelix, der die
Einführung in die Bioinformatik
Einführung in die Bioinformatik SS 2014 1. Was ist Bioinformatik? Kay Nieselt Integrative Transkriptomik Zentrum für Bioinformatik Tübingen [email protected] Ablauf und Formales Ringvorlesung
Modul 8: Bioinformatik A. Von der DNA zum Protein Proteinsynthese in silicio
Modul 8: Bioinformatik A. Von der DNA zum Protein Proteinsynthese in silicio Ein Wissenschaftler erhält nach einer Sequenzierung folgenden Ausschnitt aus einer DNA-Sequenz: 5 ctaccatcaa tccggtaggt tttccggctg
Einführung in die Angewandte Bioinformatik: Proteinsequenz-Datenbanken
Einführung in die Angewandte Bioinformatik: Proteinsequenz-Datenbanken 14.05.2009 Prof. Dr. Sven Rahmann 1 3 Proteinsequenz-Datenbanksysteme NCBI Entrez Proteins EBI SRS Proteins UniProt (empfohlen) 2
MM Proteinmodelling. Michael Meyer. Vorlesung XVII
Proteinmodelling Vorlesung XVII Proteinstrukturen Es besteht ein sehr großer Bedarf an Proteinstrukturen: Die Kenntnis der 3D-Struktur hat große Vorteile für das Design neuer Wirkstoffe. Experimentelle
Vorlesung Evolutionäre Algorithmen
Vorlesung Evolutionäre Algorithmen Dr. Nicole Drechsler, AG Rechnerarchitektur Raum 3480, Tel. 7391, [email protected] Vorschlag für Prüfungskriterien: Bearbeitung einer praktischen (Programmier-) Aufgabe Fachgespräch
VL Algorithmische BioInformatik (19710) WS2013/2014 Woche 3 - Montag
VL Algorithmische BioInformatik (19710) WS2013/2014 Woche 3 - Montag Tim Conrad AG Medical Bioinformatics Institut für Mathematik & Informatik, Freie Universität Berlin Vorlesungsthemen Part 1: Background
Aminosäuren - Proteine
Aminosäuren - Proteine ÜBERBLICK D.Pflumm KSR / MSE Aminosäuren Überblick Allgemeine Formel für das Grundgerüst einer Aminosäure Carboxylgruppe: R-COOH O Aminogruppe: R-NH 2 einzelnes C-Atom (α-c-atom)
Biologie I/B: Klassische und molekulare Genetik, molekulare Grundlagen der Entwicklung Theoretische Übungen SS 2016
Biologie I/B: Klassische und molekulare Genetik, molekulare Grundlagen der Entwicklung Theoretische Übungen SS 2016 Fragen für die Übungsstunde 2 (06.06. 10.06.) DNA-Schäden, Mutationen und Reparatur 1.
Bioinformatik für Lebenswissenschaftler
Bioinformatik für Lebenswissenschaftler Oliver Kohlbacher, Steffen Schmidt SS 2010 11. Hiden Markov Models & Phylogenien Abt. Simulation biologischer Systeme WSI/ZBIT, Eberhard Karls Universität Tübingen
Protein-Protein Bindungsstellen. Lennart Heinzerling
Protein-Protein Bindungsstellen Lennart Heinzerling 1 Worum geht es in den nächsten 45 Minuten? Auffinden von Protein- Protein Komplexen aus einer großen Menge potentieller Komplexe z.b. für -Interaction
Vertiefendes Seminar zur Vorlesung Biochemie I Bearbeitung Übungsblatt 4
Vertiefendes Seminar zur Vorlesung Biochemie I 20.11.2015 Bearbeitung Übungsblatt 4 Gerhild van Echten-Deckert Fon. +49-228-732703 Homepage: http://www.limes-institut-bonn.de/forschung/arbeitsgruppen/unit-3/
Effiziente Methoden Für Die Berechnung Von Aminosäure Ersetzungsraten
Seminar - Aktuelle Themen der Bioinformatik Tobias Gontermann Johann Wolfgang Goethe-Universität Frankfurt a. M. 12 Juli 2007 1/46 Worum geht es? Berechung von Ratenmatritzen Q Wofür ist das gut? Modellierung
Evolution & Genetik (Beispiel Hämoglobin) Prof. Dr. Antje Krause FH Bingen 06721 / 409 253 [email protected]
Evolution & Genetik (Beispiel Hämoglobin) Prof. Dr. Antje Krause FH Bingen 06721 / 409 253 [email protected] DNA (Desoxyribonukleinsäure) 5 3 CGATGTACATCG GCTACATGTAGC 3 5 Doppelhelix Basen: Adenin,
Aminosäurebestimmung im Kochschinken
1. Gegenstand der Untersuchung Es wurden 4 verschiedene Kochschinken eines Discounters hinsichtlich deren Gehalt an freien und NPN-gebundenen sowie möglichen Zusätzen untersucht. Darüber hinaus dienen
Paarweises Sequenzalignment
Methoden des Sequenzalignments Paarweises Sequenzalignment Austauschmatrizen Bedeutsamkeit von Alignments BLAST, Algorithmus Parameter Ausgabe http://www.ncbi.nih.gov Diese Vorlesung lehnt sich eng an
Statistik Klausur Sommersemester 2013 Hamburg, BITTE LESERLICH IN DRUCKBUCHSTABEN AUSFÜLLEN!
Statistik 2 1. Klausur Sommersemester 2013 Hamburg, 26.07.2013 A BITTE LESERLICH IN DRUCKBUCHSTABEN AUSFÜLLEN! Nachname:............................................................................ Vorname:.............................................................................
Vortrag 2: Proteinsequenzen und Substitutionsmatrizen
Vortrag 2: Proteinsequenzen und Substitutionsmatrizen Was sind Proteinsequenzen? Die DNA-Forschung hat sich auf spezielle Abschnitte auf den Strängen der DNA-Moleküle konzentriert, den sog. Protein-codierenden
Paarweises Sequenzalignment
Methoden des Sequenzalignments Paarweises Sequenzalignment Áustauschmatrizen Bedeutsamkeit von Alignments BLAST, Algorithmus Parameter Ausgabe http://www.ncbi.nih.gov Diese Vorlesung lehnt sich eng an
Peptide Proteine. 1. Aminosäuren. Alle optisch aktiven proteinogenen Aminosäuren gehören der L-Reihe an: 1.1 Struktur der Aminosäuren
1. Aminosäuren Aminosäuren Peptide Proteine Vortragender: Dr. W. Helliger 1.1 Struktur 1.2 Säure-Basen-Eigenschaften 1.2.1 Neutral- und Zwitterion-Form 1.2.2 Molekülform in Abhängigkeit vom ph-wert 1.3
Algorithmen auf Sequenzen Paarweiser Sequenzvergleich: Alignments
Algorithmen auf Sequenzen Paarweiser Sequenzvergleich: Alignments Sven Rahmann Genominformatik Universitätsklinikum Essen Universität Duisburg-Essen Universitätsallianz Ruhr Einführung Bisher: Berechnung
Warum konvergieren Genetische Algorithmen gegen ein Optimum?
1 / 21 Gliederung 1 Das Schematheorem Motivation Begriffe Herleitung Ergebnis Das Schematheorem Das Schematheorem Motivation 3 / 21 Warum konvergieren Genetische Algorithmen gegen ein Optimum? Theoretische
Gleichheit, Ähnlichkeit, Homologie
Gleichheit, Ähnlichkeit, Homologie Identität (identity) Verhältnis der Anzahl identischer Aminosäuren zur Gesamtzahl der Aminosäuren; objektiv Ähnlichkeit (similarity) Verhältnis ähnlicher Aminosäuren
Einführung in die Bioinformatik
Einführung in die Bioinformatik Kay Nieselt Integrative Transkriptomik Zentrum für Bioinformatik Tübingen [email protected] SS 2011 1. Was ist Bioinformatik? Ablauf und Formales Ringvorlesung
Homologie und Sequenzähnlichkeit. Prof. Dr. Antje Krause FH Bingen 06721 / 409 253 [email protected]
Homologie und Sequenzähnlichkeit Prof. Dr. Antje Krause FH Bingen 06721 / 409 253 [email protected] Homologie Verwandtschaft aufgrund gleicher Abstammung basiert auf Speziation (Artbildung): aus einer
From gene to 3D model
From gene to 3D model Ein neues Gen, was nun? 1. Database search 2. Mitglied einer Proteinfamilie spezifische Domänen 3. Gibt es Hinweise auf die Funktion, Lokalisierung 4. Expression des Gens 5. Modeling
Bioinformatik Für Biophysiker
Bioinformatik Für Biophysiker Wintersemester 2005 / 2006 Ulf Leser Wissensmanagement in der Bioinformatik Wissensmanagement in der Bioinformatik Lehrstuhl seit 10/2002 Schwerpunkte Algorithmen der Bioinformatik
Softwarewerkzeuge der Bioinformatik
Softwarewerkzeuge der Bioinformatik Inhalt dieser Veranstaltung: Softwarewerkzeuge kennenlernen für I II III Sequenzanalyse Analyse von Proteinstruktur und Ligandenbindung Zell- bzw. Netzwerksimulationen
Einleitung. Heimische Eiweißträger und sonstige Alternativen zur Reduzierung der Eiweißlücke Karl Schedle. Universität für Bodenkultur, Wien
Heimische Eiweißträger und sonstige Alternativen zur Reduzierung der Eiweißlücke Karl Schedle Institut für Tierernährung, Tierische Lebensmittel und Ernährungsphysiologie Department für Agrarbiotechnologie
Campherchinon (teuer)
chiral pool alle chiralen, nicht racemischen Verbindungen aturstoffe - müssen enantiomerenrein verfügbar sein - müssen leicht und rein isolierbar sein dann sind diese billig im andel verfügbar alle Verbindungen,
MM Biopolymere. Michael Meyer. Vorlesung XV
Biopolymere Vorlesung XV Simulation von Biomolekülen Modellierung von Proteinen Identifizierung und/oder Verwandtschaft mit anderen Proteinen Funktion eines Proteins oder Sequenzfragmentes Modellierung
Klausur Bioinformatik für Biotechnologen
Name, Vorname: 1 Klausur Bioinformatik für Biotechnologen Studiengang Molekulare Biotechnologie TU Dresden WS 2011/2012 Prof. Michael Schroeder 15.02.2012 Die Dauer der Klausur beträgt 90 Minuten. Bitte
DNS-Modell Best.-Nr. 2015801
DNS-Modell Best.-Nr. 2015801 1. Produktvorstellung Ziel des Produktes Dieses Modell soll das DNS-Molekül visualisieren: es soll die Doppelspirale, Stickstoffbasen mit Wasserstoffbrückenbindung, Zucker-Phosphatskelette
Chemie für Biologen. Vorlesung im. WS 2004/05 V2, Mi 10-12, S04 T01 A02. Paul Rademacher Institut für Organische Chemie der Universität Duisburg-Essen
Chemie für Biologen Vorlesung im WS 004/05 V, Mi 0-, S04 T0 A0 Paul Rademacher Institut für rganische Chemie der Universität Duisburg-Essen (Teil 3: 9.0.005) MILESS: Chemie für Biologen 36 D-Aldosen C
(einsatz (2/1) (transponiere 12 endlos)) (einsatz (4/1) endlos) :+: (einsatz (6/1) endlos )))
Algorithmen und Datenstrukturen I phrase1 phrase2 c e (1/4) (1/4) :*: :*: d f (1/4) (1/4) :*: :*: e g (1/4) (1/2) :*: c (1/4) phrase3 = g :*: (1/8) e (1/4) :*: a :*: (1/8) c (1/4) :*: g (1/8) :*: f (1/8)
wichtige Sekundärstrukturen α-helix β-struktur, Faltblatt β-turn = Haarnadel Kollagenhelix
wichtige Sekundärstrukturen α-helix β-struktur, Faltblatt β-turn = Haarnadel Kollagenhelix basieren auf H-Brücken in Hauptkette strukturbildende und destabilisierende Seitenketten Tertiärstrukturen basieren
String Matching 2. Definition Ein Alphabet ist eine nichtleere, endliche Menge S von Zeichen.
1 2 1. Strings Definition Ein Alphabet ist eine nichtleere, endliche Menge S von Zeichen. Ein String über S ist eine endliche Folge S = S(1)S(2)...S(n) von Zeichen S(i) aus S, dessen Länge n wir mit S
Application Notes. Aracus
Application Notes Aracus membrapure GmbH Wolfgang Küntscher Str. 14 16761 Hennigsdorf / Berlin Mail: [email protected] Tel.: 03302 / 201 20 0 Fax: 03302 / 201 20 21 Index Physiological Extended 54 amino
Einführung in die Angewandte Bioinformatik: Sequenzähnlichkeit, Alignment, BLAST
Einführung in die Angewandte Bioinformatik: Sequenzähnlichkeit, Alignment, BLAST 28.05.2009 Prof. Dr. Sven Rahmann 1 Sequenzvergleich: Motivation Hat man bereits die DNA-Sequenz eines Gens, oder die Aminosäuresequenz
Bioinformatik. Alignment mit linearem Platzbedarf K-Band Alignment. Ulf Leser Wissensmanagement in der. Bioinformatik
Bioinformatik Alignment mit linearem Platzbedarf K-Band Alignment Ulf Leser Wissensmanagement in der Bioinformatik Ankündigungen Gastvortrag: Morgen Dr. Klein, Metanomics GmbH Bioinformatik in der Pflanzengenomik
