Multiples Sequenzalignment
|
|
- Alexandra Graf
- vor 7 Jahren
- Abrufe
Transkript
1 WS2013/2014 Genomforschung und Sequenzanalyse - Einführung in Methoden der Bioinformatik- Thomas Hankeln HsaHBA GAEALERMFLSFPTTKTYF HsaHBZ GTETLERLFLSHPQTKTYF HsaHBE GGEALGRLLVVYPWTQRFF HsaHBG GGETLGRLLVVYPWTQRFF HsaHBB GGEALGRLLVVYPWTQRFF HsaHBD GGEALGRLLVVYPWTQRFF HsaMB GQEVLIRLFKGHPETLEKF Multiples Sequenzalignment 1
2 Alignment von 2 Sequenzen Gegeben: Gesucht: SeqA A F L S SeqB A F S SeqA A F L S SeqB A F - S 2
3 Multiples Sequenz-Alignment Gegeben: SeqA A F L S SeqB A F S SeqC A K Y L S SeqD A Y L S Gesucht: SeqA A - F L S SeqB A - F - S SeqC A K Y L S SeqD A - Y L S 3
4 Definitionen Multiple Sequence Alignment (Abkürzung = MSA) Deutsch: Multiple Sequenzalignierung Vergleich von > 2 DA- oder As-Sequenzen Sequenzen sollen so aneinandergelegt werden, dass die Positionen evolutiv homolog sind! => Mutationen = historische Ereignisse 4
5 MSA & Evolution AYLS AKYLS AFS AFLS SeqA A F L S SeqB A F - S SeqC A K Y L S SeqD A Y L S +K -L Y -> F Multiples Sequenz-Alignment = Evolutionshypothese! 5
6 DA-Alignment DA: nicht-kodierende oder proteinkodierende Sequenzen 1. nicht-kodierend (auch rra- oder tra-gene!): Seq1: ATCCTAGT-TCATGCATGCCTTAGCTC TCTGAT Seq2: ATTCTAGTTTCAT--ATGCTTCAGCTTATCTGAC Seq3: AT-CTAGT-CCATGCATG-TTCAGCTTATGCGAC 2. protein-kodierend (=> Codons!): Seq1: ATC CTA GTT TCA TGC ATG CCT AAG CTC --- TGG Seq2: ATT CTA GTT TCA --- ATG CTT CAG CTT ATC TGG Seq3: ATC CTA GTT CCA TGC ATG TTT CAG CTT ATG CGG => Triplettstruktur liefert zusätzliche Information 6
7 Aminosäurealignment Indel * 20 * 40 YPQTKIYFPHF-DLSHGSAQIRAHGKKVFAALHEAVHID YPQTKIYFPHF-DMSHSAQIRAHGKKVFSALHEAVHID FPQTKTYFSHF-DVHHGSTQIRSHGKKVMLALGDAVHID FPSTKTYFSHF-DLGHSTQVKGHGKKVADALTKAVGHLD FPTTKTYFPHF-DLSHGSAQVKGHGKKVADALTAVAHVD MPTTRIYFPAK-DLSERSSYLHSHGKKVVGALTAVAHID YPQTKTYFSHWADLSPGSGPVKKHGKTIMGAVGEAISKID YPQTKTYFSHWADLSPGSAPVKKHGGVIMGAIGAVGLMD Sequenzidentität = % identische AS Sequenzähnlichkeit = % identische + % isofunktionelle AS Insertion/Deletion = "Indel" 7
8 DA- oder Aminosäurealignment? Mögliche Austausche: 1. DA 4 x 4 = 16; mit Lücken (als 5. Base): 5 x 5 = 25 Möglichkeiten 2. Protein 20 x 20 = 400; mit Lücken (als 21. AS): 21 x 21 = 441 Möglichk. mehr Informationsgehalt in Protein kurze Evolutionszeit: DA, lange Distanzen: Protein 8
9 MSA: Anwendungsbeispiele Sequenz- Gruppen definieren: Konservierte Domänen & Sequenzmotive Strukturvorhersagen bei Proteinen Sequenzierprojekte (Spezialfall) Evolutive Aussagen (molekulare Phylogenie) 9
10 MSA Anwendung Erkennung von Sequenz- Gruppen" => Proteinfamilien und superfamilien 1. Proteinfamilie: hohe Identität (z.b. Hämoglobine) 2. Proteinsuperfamilie: geringe Identität (z.b. Globine) => häufig ähnliche Funktion! Erkennen von entfernten Verwandtschaften => häufig nicht mit einfachen Alignments zu erkennen -> Protein"profile" 10
11 MSA Anwendung Entfernte Verwandte, nur zwei Sequenzen... * 20 * 40 * 60 * 80 CelHb MHCRVYPIPKRSKSKKIFRCEPEDEATSMTAAAAAGGAKSKCKHFLTRRERILLEQSWRKTRKTGADHIGSKIFFM 80 HsaHBA MVLSPADKTVKAAWGKVG-AHAGEYGAEALER 32 * 100 * 120 * 140 * 160 CelHb VLTAQPDIKAIFGLEKIPTGRLKYDPRFRQHALVYTKTLDFVIRLDYPGKLEVYFELGKRHVAMQGRGFEPGYWETFA 160 HsaHBA MFLSFPTTKTYFPHFDLSHG----SAQVKGHGKKVADALTAVAHVDDMPALSALSDLHAHKLRVDPVFKLLSHCLLV 108 * 180 * 200 * 220 * CelHb ECMTQAAVEWEARQRPTLGAWRLISCIISFMRRGFDEEGKKKQYSYVQGFSSRARRSISPYAPGVH 231 HsaHBA TLAAHLPAEFTP-AVHASLDKFLASVSTVLTSKYR Mensch-Hämoglobin verglichen mit C. elegans Hämoglobin => nur 12% identische Aminosäuren => Verwandtschaft nicht abgesichert 11
12 MSA Anwendung Entfernte Verwandte * 2 0 * 4 0 * 6 0 * 8 0 L l u L e g H b L T E S Q A A L V K S S W E E F - A I P K H T H R F F I L 3 0 O s a H b M A L V E G G V S G G A V S F S E E Q E A L V L K S W A I M - K K D S A I G L R F F L K 4 6 C e l H b M H C R V Y P I P K R S K S K K I F R C E P E D E A T S M T A A A A A G G A K S K C K H F L T R R E R I L L E Q S W R K T R K T G A D H I G S K I F F M 8 0 H s a G B M E R P E P E L I R Q S W R A V - S R S P L E H G T V L F A R 3 0 D r e g b M E K L S E K D K G L I R D S W E S L - G K K V P H G I V L F T R 3 3 P c a M b V L S E G E W Q L V L H V W A K V - E A D V A G H G Q D I L I R 3 1 H s a H B A M V L S P A D K T V K A A W G K V - G A H A G E Y G A E A L E R 3 2 H s a H B B M V H L T P E E K S A V T A L W G K V - V D - - E V G G E A L G R 3 1 B l i H b B M S F E E A A L E V T G S E K I K E D L R L T W G I L - S E L E D T G V T L M L T 4 1 B v i H b M S K P A E A I A A V T Q P D V K A A L K S S W G L L - A P K K K Y G V E L M C K 4 1 CD1 E7 F8 * * * * L l u L e g H b V L E I A P A A K D L F S F L K G - T S E V P - - Q - P E L Q A H A G K V F K L V Y E A A I Q L Q V T G - V V V T D A T L K L G S V H V S K G V A D O s a H b 2 I F E V A P S A S Q M F S F L R - - S D V P - - L E K P K L K T H A M S V F V M T C E A A A Q L R K A G K V T V R D T T L K R L G A T H F K Y G V G D C e l H b V L T A Q P D I K A I F G L E K I - P T G R L K Y D P R F R Q H A L V Y T K T L D F V I R L D Y P G K L E V Y F E L G K R H V A M Q G R G F E P H s a G B L F A L E P D L L P L F Q Y C R Q F S S P E D C L S - S P E F L D H I R K V M L V I D A A V T V E D L S S L E E Y L A S L G R K H R A V G V K L D r e g b L F E L D P A L L T L F S Y S T C G D A P E - C L S - S P E F L E H V T K V M L V I D A A V S H L D D L H T L E D F L L L G R K H Q A V G V T P c a M b L F K S H P E T L E K F D R F K H L - K T - E A E M K A S E D L K K H G V T V L T A L G A I L K K K G H H E A E L K P L A Q S H A T K H - - K I P I H s a H B A M F L S F P T T K T Y F P H F - D L - S H G S A Q V K G H G K K V A D A L T A V A H V D D M P A L S A L S D L H A H K L - - R V D P 9 6 H s a H B B L L V V Y P W T Q R F F E S F G D L - S T - P D A V M G P K V K A H G K K V L G A F S D G L A H L D L K G T F A T L S E L H C D K L - - H V D P B l i H b B L F K M E P G S K A R F G R F G I - D S G M G R D K L R G H S I T L M Y A L Q F M D S L D T E K L R C V V D K F A V H R I R K I S A B v i H b L F S L H K D T A R Y F E R M G K L - D A - - A G S R E L I G H A I Y L M Y A I E S F V D Q L D D P S I V E D I G R F A Y R H L K R G I G S * * * * MSA zeigt streng konservierte As-Positionen 12
13 MSA Anwendung Konservierte Domänen & Sequenzmotive => Proteine mit gemeinsamer Funktion erkennen Bsp: Cu-Bindungsstelle in Hämocyaninen und Phenoloxidase: PlePPO YWREDFGISHHWHWHLVYPIEM-----VRDRKGELFYYMHQQMVARYDWERLSVLRVEKLE 61 PmoPPO BmoPPO1 YWREDYGIVHHWHWHLIYPPAM-----GFDRDRKGELFYYMHQQVIARYDIERLCLGLPKVEKLD 61 YFREDIGILHHWHWHLVYPFDAADRA-IVKDRRGELFYYMHQQIIARYVERMCLSRVRRY 65 DmePPOA1 YFREDIGVSHHWHWHLVYPTTGPTE--VVKDRRGELFYYMHHQILARYVERFCLKKVQPL 64 DmePPO2 YFREDLGILHHWHWHLVYPFEASDRS-IVAKDRRGELFYYMHQQVIARYAERFSLARVLPF 65 DmePPO3 YFREDLGVLHHWHWHLVYPIEAPDRS-IVDKDRRGELFYYMHQQIIARYAERLSHMARVQPF 65 EcaHcA YFREDIGVAHHWHWHVVYPSTYDPAFFGKVKDRKGELFYYMHQQMCARYDCERLSGLRMIPFH 66 EcaHcD YFREDIGISHHWHWHLVYPAFYDADIFGKIKDRKGELFYYMHQQMCARYDCERLSVGLQRMIPFQ 66 EcaHcF LpoHc2 YFREDIGAAHHWHWHIVYPPTWDASVMSKVKDRKGELFYYMHQQMCARYDCDRLSTGLRRMIPFH 66 YYREDVGIAHHWHWHLVYPSTWPKYFGKKKDRKGELFYYMHQQMCARYDCERLSGMHRMLPF 66 PvaHc YFGEDIGLTHHVTWHMEFPFWWDAYG-HHLDRKGEFFWIHHQLTVRFDAERLSYLDPVGELQ 65 PirHcC YFGEDVGMTHHVLWHMEFPFWWEDSSG-RHLDRKGESFFWVHHQLTVRYDAERLSHLDPVEELS 65 PirHcA YFGEDIGMIHHVTWHMDFPFWWEDSYG-YHLDRKGELFFWVHHQLTARFDFERLSWLDPVDELH 65 Cu - Bindungsstellen 13
14 MSA Anwendung Vorhersage der Struktur von Proteinen mit divergenter Sequenz, aber sehr ähnlicher 3D-Faltung Myoglobin euroglobin Trennung vor ~ 800 Mio Jahren! HsaGB -MERPEPELIRQSWRAVSRSPLEHGTVLFARLFALEPDLLPLFQYCRQFSSPEDCLSSPEFLDHIRKVMLVIDAAVT 78 PcaMb VLSEGEWQLVLHVWAKVEADVAGHGQDILIRLFKSHPETLEKFDRFKHL-KTEAEMKASEDLKKHGVTVLTALGAILKK 78 HsaGB VEDLSSLEEYLASLGRKHRAVG-VKLSSFSTVGESLLYMLEKCLGPAFTPATRAAWSQLYGAVVQAMSRGWDGE PcaMb KGHH---EAELKPLAQSHATKHKIPIKYLEFISEAIIHVLHSRHPGDFGADAQGAMKALELFRKDIAAKYKELGYQG
15 MSA Anwendung Sequenzierprojekte Sequenzierung Zusammensetzen der Sequenzen 15
16 MSA Anwendung Evolutive Aussagen => Phylogenetische Rekonstruktion (Stammbäume) A GAEALERMFLSFPTTKTYFPHF-DLS Z D GTETLERLFLSHPQTKTYFPHF-DLH E C GGEALGRLLVVYPWTQRFFDSFGLS G B GGETLGRLLVVYPWTQRFFDSFGLS B GGEALGRLLVVYPWTQRFFESFGDLS A D B C Garbage I Garbage OUT 16
17 Wie kommt man zum MSA? Alignment per Hand/Auge: gut bei relativ ähnlichen Sequenzen Mit dem Computer: Exakte Algorithmen Heuristische Verfahren Alle Verfahren brauchen Bewertungsschemata Kennen wir! => z.b. PAM & BLOSUM-Matrizen, gap penalty 17
18 Wer hat ein Auge...? Ancistr. TTGACATAA AAGCTTCCAGTTT Brach. TTGACATAA AAGCTTCGAGTTTTTT Meteorium TTGACATAAA AAACTGGAAGTTT Papillaria TTGACATAAA AAACTTCTAGTTTTTT CTTCCAG CTGGAAG 18 reales Beispiel von Dr. D. Quandt, Dresden
19 Bewertung eines MSA Optimales Alignment ist ein Alignment mit minimalen Kosten (oder maximaler Belohnung für Ähnlichkeit). Algorithmen sollen ein Alignment erstellen, welches die Kosten minimiert bzw. die Ähnlichkeit optimiert. 19
20 MSA und Gaps * Wie wahrscheinlich ist es, dass zwischen Sequenzpaaren und Sequenzgruppen Lücken (gaps) auftreten? Gaps stellen Insertionen und Deletionen (Indels) dar, die in der Evolution aufgetreten sind Ihre Wahrscheinlichkeit kann definiert werden. * Das Problem kennen wir bereits von den dualen Alignments 20
21 Was kostet ein Gap? Hämoglobin- und Myoglobinsequenzen von Mensch CLUSTALX: Gap creation weight 20, gap length weight 0.1* HsaHBA GAEALERMFLSFPTTKTYFPHF------DLSHGSAQVKGHGKKVADALTAVAHVDDMP 54 HsaHBZ GTETLERLFLSHPQTKTYFPHF------DLHPGSAQLRAHGSKVVAAVGDAVKSIDDIGG 54 HsaHBE GGEALGRLLVVYPWTQRFFDSFGLSSPSAILGPKVKAHGKKVLTSFGDAIKMDLKP 60 HsaHBG GGETLGRLLVVYPWTQRFFDSFGLSSASAIMGPKVKAHGKKVLTSLGDAIKHLDDLKG 60 HsaHBB GGEALGRLLVVYPWTQRFFESFGDLSTPDAVMGPKVKAHGKKVLGAFSDGLAHLDLKG 60 HsaHBD GGEALGRLLVVYPWTQRFFESFGDLSSPDAVMGPKVKAHGKKVLGAFSDGLAHLDLKG 60 HsaMB GQEVLIRLFKGHPETLEKFDKFKHLKSEDEMKASEDLKKHGATVLTALGGILKKKGHHEA 60 * synonym: gap opening penalty, gap extension penalty 21
22 Was kostet ein Gap? Hämoglobin- und Myoglobinsequenzen von Mensch CLUSTALX: Cap creation weight 10, gap length weight 0.1 HsaHBA GAEALERMFLSFPTTKTYFPHF-DLSH-----GSAQVKGHGKKVADALTAVAHVDDMP 54 HsaHBZ GTETLERLFLSHPQTKTYFPHF-DLHP-----GSAQLRAHGSKVVAAVGDAVKSIDDIGG 54 HsaHBE GGEALGRLLVVYPWTQRFFDSFGLSSPSAILGPKVKAHGKKVLTSFGDAIKMDLKP 60 HsaHBG GGETLGRLLVVYPWTQRFFDSFGLSSASAIMGPKVKAHGKKVLTSLGDAIKHLDDLKG 60 HsaHBB GGEALGRLLVVYPWTQRFFESFGDLSTPDAVMGPKVKAHGKKVLGAFSDGLAHLDLKG 60 HsaHBD GGEALGRLLVVYPWTQRFFESFGDLSSPDAVMGPKVKAHGKKVLGAFSDGLAHLDLKG 60 HsaMB GQEVLIRLFKGHPETLEKFDKFKHLKSEDEMKASEDLKKHGATVLTALGGILKKKGHHEA 60 Welches Alignment ist aber nun besser? 22
23 Was kostet ein Gap? Erst Hinzunahme einer Hai-Hb-alpha-Sequenz bringt die Lösung: S a c H b A H s a H B A G A E S L A R M F A T T P S T K T Y F S K F T D F S A G K R V K A H G G K V L A V A D A T D H L D V A G G A E A L E R M F L S F P T T K T Y F P H F - D L S H G S A Q V K G H G K K V A D A L T A V A H V D D M P H s a H B Z G T E T L E R L F L S H P Q T K T Y F P H F - D L H P G S A Q L R A H G S K V V A A V G D A V K S I D D I G G 5 4 H s a H B B G G E A L G R L L V V Y P W T Q R F F E S F G D L S T P D A V M G P K V K A H G K K V L G A F S D G L A H L D L K G 6 0 H s a H B D G G E A L G R L L V V Y P W T Q R F F E S F G D L S S P D A V M G P K V K A H G K K V L G A F S D G L A H L D L K G 6 0 H s a H B E G G E A L G R L L V V Y P W T Q R F F D S F G L S S P S A I L G P K V K A H G K K V L T S F G D A I K M D L K P 6 0 H s a H B G G G E T L G R L L V V Y P W T Q R F F D S F G L S S A S A I M G P K V K A H G K K V L T S L G D A I K H L D D L K G 6 0 H s a M B G Q E V L I R L F K G H P E T L E K F D K F K H L K S E D E M K A S E D L K K H G A T V L T A L G G I L K K K G H H E A 6 0 => Alignment # 2 (10 gap creation weight) ist plausibel! 23
24 Bewertung eines MSA I: sum of pairs-score Beispiel (DA) für die Berechnung der Kosten (c) mit: match c = 0; mismatch c = 2; gap c = 1 S1 = - G C T G A T A T A A C T S2 = G G G T G A T - T A G C T S3 = A G C G G A - A C A C C T sum of pairs: = 26 Vorgehensweise: Summieren der Kosten der Paare ("sum of pairs") der 1. Spalte: c(-,g) + c(g,a) + c(-,a) = 4, usw. Summieren der Spaltenwerte = 26 (Gesamtkosten!) 24
25 Bewertung eines MSA I: sum of pairs-score S1 = - G C T G A T A T A A C T S2 = G G G T G A T - T A G C T S3 = A G C G G A - A C A C C T sum of pairs: = 26 S1 = G - C T G A T A T A A C T S2 = G G G T G A - T T A G C T S3 = A G C G G A - A C A C C T sum of pairs: = 30 25
26 Bewertung eines MSA I: sum of pairs Beispiel: Protein Bewertung mit "sum of pairs und BLOSUM-Matrix Seq 1... Seq 2... Seq 3... Seq 4...C... Seq 5...C...C... C C Spalte 1 Spalte 2 Spalte 3 C 26
27 Bewertung eines MSA I: sum of pairs C C Spalte 1 Spalte 2 Spalte 3 C BLOSUM 62 scores : +6 C: -3 C C: +9 Spalte 1: 10 x - = + 60 Spalte 2: 6 x x -C = + 24 Spalte 3: 3 x x -C + 1 x C-C =
28 Bewertung eines MSA II Bewertung mithilfe eines Stammbaums (z.b. CLUSTAL): Spalte 3 C C C Score = 4 x x -C + 2 x C-C =
29 Lösungsansätze Exakte Algorithmen Progressive Verfahren Iterative Verfahren Divide-and-Conquer-Verfahren Profile, Hidden Markov Modelle Heuristische Verfahren => liefern nicht unbedingt das beste Alignment 29
30 Exakte Algorithmen Wir erinnern uns: eedleman & Wunsch für paarweises globalesalignment R R L G Y E Kosten c als: c(a,b) = c (a,-) = 1 G c(a,a) = 0 Y A Lösung: R L G Y E R G Y A 30
31 & W mit k Sequenzen eedleman-wunsch: in 3 Dimensionen! Sequenz 2 Sequenz 1 Sequenz 3 Verwendung von k- dimensionalen Gittergraphen produziert das bestmögliche globale MSA sehr rechenintensiv, wenn k groß (Aufwand: n M ) praktikabel bis 10 x 1000 As (Programm MSA auf Supercomputern) 31
32 Daher Heuristische Verfahren Progressive Verfahren Iterative Verfahren Divide-and-Conquer-Verfahren Hidden Markov Modelle u. v. m. gibt s global und lokal 32
33 Progressives Alignment 1. paarweiser Vergleich aller Sequenzen miteinander => Berechnung der Distanzen zweier Sequenzen 2. gruppiert Sequenzen nach Ähnlichkeit (Cluster-Bildung) 3. Erstellung paarweiser Alignments 4. sukzessives Alignment nach Ähnlichkeit, dabei die ähnlichsten Sequenzpaare zuerst Feng & Doolittle (1987): PileUp (GCG package) Higgins and Sharp (1988), Thompson et al. (1994): CLUSTALW otredame et al. (2000): T-COFFEE 33
34 Progressives Alignment 1) Sequenzvergleich A B C D Alle Sequenzen werden miteinander verglichen (Option A: schnelles "quick and dirty" Alignment Option B: exaktes, langsames eedleman-wunsch) => Berechnen der Distanzen 34
35 Progressives Alignment 2) Ähnliche Sequenzen werden gruppiert => Cluster-Analyse = Erstellung eines hierarchischen Stammbaums ("guide tree"). A B C D A - B C D "guide tree" A D B C PileUp = UPGMA Clustal = eighbor Joining 35
36 Progressives Alignment 3) Alignment von nahe verwandten Sequenzen; die ähnlichsten zuerst. A D B C A D B C 36
37 Progressives Alignment 4) Sukzessives globales Alignment A D A D B C alte gaps erhalten, neue hinzugefügt B C A D B C 37
38 Progressive Alignment - Probleme - Welche Matrizen? Welche gap penalty? Erfolg hängt von den ersten paarweisen Alignments ab: problematisch, wenn selbst die nächsten Verwandten bereits unähnlich sind Fehler propagieren sich in das MSA Insertionen werden beim paarweisen Vergleich und beim MSA penalisiert: Über-Alignment mit kompakten`ungapped blocks` und anderen Regionen mit gehäuften gaps Lösung: Löytynoja & Goldman 2005, PAS 38
39 Praktische Hinweise für globale MSAs Keine sehr unterschiedlich langen Sequenzen global alignen: Sequenzen trimmen oder lokales MSA machen (z. B. PSI-BLAST) Protein-MSA: in Visualisierungsprogrammen (z.b. GeneDoc) unsichere Abschnitte auf chemisch ähnliche As hin absuchen. Falls nicht vorhanden, Abschnitte aus Alignment entfernen. Per Expertenwissen und 3D-Strukturinformation Schlüsselpositionen im MSA identifizieren und diese konstant halten 39
40 Praktische Hinweise für globale MSAs Beispiel: * 2 0 * 4 0 * 6 0 * 8 0 L l u L e g H b L T E S Q A A L V K S S W E E F - A I P K H T H R F F I L 3 0 O s a H b M A L V E G G V S G G A V S F S E E Q E A L V L K S W A I M - K K D S A I G L R F F L K 4 6 C e l H b M H C R V Y P I P K R S K S K K I F R C E P E D E A T S M T A A A A A G G A K S K C K H F L T R R E R I L L E Q S W R K T R K T G A D H I G S K I F F M 8 0 H s a G B M E R P E P E L I R Q S W R A V - S R S P L E H G T V L F A R 3 0 D r e g b M E K L S E K D K G L I R D S W E S L - G K K V P H G I V L F T R 3 3 P c a M b V L S E G E W Q L V L H V W A K V - E A D V A G H G Q D I L I R 3 1 H s a H B A M V L S P A D K T V K A A W G K V - G A H A G E Y G A E A L E R 3 2 H s a H B B M V H L T P E E K S A V T A L W G K V - V D - - E V G G E A L G R 3 1 B l i H b B M S F E E A A L E V T G S E K I K E D L R L T W G I L - S E L E D T G V T L M L T 4 1 B v i H b M S K P A E A I A A V T Q P D V K A A L K S S W G L L - A P K K K Y G V E L M C K 4 1 CD1 E7 F8 * * * * L l u L e g H b V L E I A P A A K D L F S F L K G - T S E V P - - Q - P E L Q A H A G K V F K L V Y E A A I Q L Q V T G - V V V T D A T L K L G S V H V S K G V A D O s a H b 2 I F E V A P S A S Q M F S F L R - - S D V P - - L E K P K L K T H A M S V F V M T C E A A A Q L R K A G K V T V R D T T L K R L G A T H F K Y G V G D C e l H b V L T A Q P D I K A I F G L E K I - P T G R L K Y D P R F R Q H A L V Y T K T L D F V I R L D Y P G K L E V Y F E L G K R H V A M Q G R G F E P H s a G B L F A L E P D L L P L F Q Y C R Q F S S P E D C L S - S P E F L D H I R K V M L V I D A A V T V E D L S S L E E Y L A S L G R K H R A V G V K L D r e g b L F E L D P A L L T L F S Y S T C G D A P E - C L S - S P E F L E H V T K V M L V I D A A V S H L D D L H T L E D F L L L G R K H Q A V G V T P c a M b L F K S H P E T L E K F D R F K H L - K T - E A E M K A S E D L K K H G V T V L T A L G A I L K K K G H H E A E L K P L A Q S H A T K H - - K I P I H s a H B A M F L S F P T T K T Y F P H F - D L - S H G S A Q V K G H G K K V A D A L T A V A H V D D M P A L S A L S D L H A H K L - - R V D P 9 6 H s a H B B L L V V Y P W T Q R F F E S F G D L - S T - P D A V M G P K V K A H G K K V L G A F S D G L A H L D L K G T F A T L S E L H C D K L - - H V D P B l i H b B L F K M E P G S K A R F G R F G I - D S G M G R D K L R G H S I T L M Y A L Q F M D S L D T E K L R C V V D K F A V H R I R K I S A B v i H b L F S L H K D T A R Y F E R M G K L - D A - - A G S R E L I G H A I Y L M Y A I E S F V D Q L D D P S I V E D I G R F A Y R H L K R G I G S * * * *
41 Praktische Hinweise für globale MSAs Edgar & Batzoglou (2006) Curr Opin Struct Biol 16:
42 Heuristische Verfahren Progressive Verfahren Iterative Verfahren Divide-and-Conquer-Verfahren Profile, Hidden Markov Modelle besonders gebräuchlich zur Erstellung von lokalen MSAs, mit denen z. B. Protein- Domänen definiert werden (werden später in der VL besprochen) 42
43 Websites MSA tools, Übersicht: Clustal: MAFFT: Editor für PC: Editor für Mac/PC/Linux: 43
Multiples Sequenzalignment
WS2017/2018 Genomforschung und Sequenzanalyse - Einführung in Methoden der Bioinformatik- Thomas Hankeln HsaHBA GAEALERMFLSFPTTKTYF HsaHBZ GTETLERLFLSHPQTKTYF HsaHBE GGEALGRLLVVYPWTQRFF HsaHBG GGETLGRLLVVYPWTQRFF
MehrDas Szenario...ein neues tödliches Virus!
Das Szenario...ein neues tödliches Virus! Labor: Isolierung der Erbsubstanz und Sequenzierung Computer: Erkennen der Virusgene (de novo Genvorhersage) Ähnlichkeit zu bekannten Genen? (Datenbanksuchen)
MehrAlignment von DNA- und Proteinsequenzen
WS2017/2018 Genomforschung und Sequenzanalyse - Einführung in Methoden der Bioinformatik- Thomas Hankeln Alignment von DNA- und Proteinsequenzen das vielleicht wichtigste Werkzeug der Bioinformatik! 1
MehrSequenz Alignment Teil 2
Sequenz Alignment Teil 2 14.11.03 Vorlesung Bioinformatik 1 Molekulare Biotechnologie Dr. Rainer König Besonderen Dank an Mark van der Linden, Mechthilde Falkenhahn und der Husar Biocomputing Service Gruppe
MehrMultiple Alignments. Vorlesung Einführung in die Angewandte Bioinformatik Prof. Dr. Sven Rahmann. Webseite zur Vorlesung
Multiple Alignments Vorlesung Einführung in die Angewandte Bioinformatik Prof. Dr. Sven Rahmann Webseite zur Vorlesung http://bioinfo.wikidot.com/ Sprechstunde Mo 16-17 in OH14, R214 Sven.Rahmann -at-
MehrZentrum für Bioinformatik. Übung 4: Revision. Beispielfragen zur Klausur im Modul Angewandte Bioinformatik (erste Semesterhälfte)
Andrew Torda Björn Hansen Iryna Bondarenko Zentrum für Bioinformatik Übung zur Vorlesung Angewandte Bioinformatik Sommersemester 2014 20./23.06.2014 Übung 4: Revision Beispielfragen zur Klausur im Modul
MehrQuantifizierung evolutionärer Veränderungen
Quantifizierung evolutionärer Veränderungen Begriff der Homologie/Homoplasie Methoden des Sequenzvergleichs/Alignments Verfahren und Modelle zur Berechnung von Austauschraten in DNA und Proteinen Thomas
MehrEinführung in die Bioinformatik
Einführung in die Bioinformatik Ringvorlesung Biologie Sommer 07 Burkhard Morgenstern Institut für Mikrobiologie und Genetik Abteilung für Bioinformatik Goldschmidtstr. 1 Online Materialien zur Ringvorlesung:
MehrBioinformatik. Lokale Alignierung Gapkosten. Silke Trißl / Ulf Leser Wissensmanagement in der. Bioinformatik
Bioinformatik Lokale Alignierung Gapkosten Silke Trißl / Ulf Leser Wissensmanagement in der Bioinformatik Inhalt dieser Vorlesung Ähnlichkeit Lokales und globales Alignment Gapped Alignment Silke Trißl:
MehrAlgorithmen und Datenstrukturen in der Bioinformatik Zweites Übungsblatt WS 05/06 Musterlösung
Johanna Ploog, Konstantin Clemens Freie Universität Berlin Institut für Mathematik II Arbeitsgruppe für Mathematik in den Lebenswissenschaften Algorithmen und Datenstrukturen in der Bioinformatik Zweites
MehrPrimärstruktur. Wintersemester 2011/12. Peter Güntert
Primärstruktur Wintersemester 2011/12 Peter Güntert Primärstruktur Beziehung Sequenz Struktur Proteinsequenzen, Sequenzdatenbanken Sequenzvergleich (sequence alignment) Sequenzidentität, Sequenzhomologie
MehrÜbungsaufgaben zur Einführung in die Bioinformatik - Lösungen
18.01.2013 Prof. P. Güntert 1 Vorlesung BPC I: Aspekte der Thermodynamik in der Strukturbiologie Übungsaufgaben zur Einführung in die Bioinformatik - Lösungen 1. Hamming und Levenshtein Distanzen a) Was
MehrSequenzen-Alignierung in der Bioinformatik. VO Algorithm Engineering Professor Dr. Petra Mutzel Lehrstuhl für Algorithm Engineering, LS11
Sequenzen-Alignierung in der Bioinformatik VO Algorithm Engineering Professor Dr. Petra Mutzel Lehrstuhl für Algorithm Engineering, LS11 23. VO 24.01.2006 1 1 Literatur für diese VO Volker Heun: Skriptum
MehrAlignment von DNA- und Proteinsequenzen
WS2012/2013 Genomforschung und Sequenzanalyse - Einführung in Methoden der Bioinformatik- Thomas Hankeln Alignment von DNA- und Proteinsequenzen das vielleicht wichtigste Werkzeug der Bioinformatik! 1
MehrAlgorithmische Bioinformatik
Algorithmische Bioinformatik Multiple Sequence Alignment Sum-of-pairs Score Center-Star Score Ulf Leser Wissensmanagement in der Bioinformatik Ziel dieser Vorlesung Aufgabenstellung Multiples Sequenzalignment
MehrPairwise Alignment. Steffen Forkmann. Proseminar: BioInformatik
Pairwise Alignment Steffen Forkmann Proseminar: BioInformatik Wintersemester 2004/2005 Inhaltsverzeichnis 1 Problemstellungen 3 1.1 Rechtschreibkorrektur............................... 3 1.2 DNA- und Aminosäure-Sequenzen........................
MehrBioinformatik für Lebenswissenschaftler
Bioinformatik für Lebenswissenschaftler Oliver Kohlbacher, Steffen Schmidt SS 2010 10. Multiples Alignment II & PSI-BLAST Abt. Simulation biologischer Systeme WSI/ZBIT, Eberhard Karls Universität Tübingen
MehrBioinformatik. Substitutionsmatrizen BLAST. Ulf Leser Wissensmanagement in der. Bioinformatik
Bioinformatik Substitutionsmatrizen BLAST Ulf Leser Wissensmanagement in der Bioinformatik Inhalt dieser Vorlesung Substitutionsmatrizen: PAM und BLOSSUM Suche in Datenbanken: Basic Local Alignment Search
MehrAlgorithmische Bioinformatik
Algorithmische Bioinformatik Multiple Sequence Alignment Sum-of-pairs Score Center-Star Score Ulf Leser Wissensmanagement in der Bioinformatik Inhalt dieser Vorlesung Multiples Sequenzalignment Sum-Of-Pair
MehrV3 - Multiples Sequenz Alignment und Phylogenie
V3 - Multiples Sequenz Alignment und Phylogenie Literatur: Kapitel 4 in Buch von David Mount Thioredoxin-Beispiel heute aus Buch von Arthur Lesk 1 Leitfragen für V3 Frage1: Können wir aus dem Vergleich
MehrV3 - Multiples Sequenz Alignment und Phylogenie
V3 - Multiples Sequenz Alignment und Phylogenie Literatur: Kapitel 4 in Buch von David Mount Thioredoxin-Beispiel heute aus Buch von Arthur Lesk 1 Leitfragen für V3 Frage1: Können wir aus dem Vergleich
MehrKapitel 7: Sequenzen- Alignierung in der Bioinformatik
Kapitel 7: Sequenzen- Alignierung in der Bioinformatik 7.3: Paarweise Sequenzen-Alignierung 7.4: Multiple Sequenzen Alignierung VO Algorithm Engineering Professor Dr. Petra Mutzel Lehrstuhl für Algorithm
MehrVerbesserung der dotplot Methode
erbesserung der dotplot Methode binäre Information: "x" oder " " besser: "mehr" oder "weniger" ähnlich Gruppen von Aminosäuren mit ähnlichen Eigenschaften bilden bestes Alignment: optimiere Häufigkeit
MehrDendrogramm der Primaten
Arbeitsblatt 1 Dargestellt ist ein Ausschnitt der DNA-Sequenz für das Enzym NAD- Polymerase, dass bei den Primatenarten Mensch(M), Schimpanse(S), Gorilla(G), Orang-Utan(O) und Gibbon(Gi) vorhanden ist.
MehrBioinformatik. Multiple String Alignment I. Ulf Leser Wissensmanagement in der. Bioinformatik
Bioinformatik Multiple String Alignment I Ulf Leser Wissensmanagement in der Bioinformatik BLAST2: Zwei-Hit-Strategie Original: Alle Hits mit Score > t werden zu MSPs verlängert Extensionen fressen >90%
MehrV3 - Multiples Sequenz Alignment und Phylogenie
V3 - Multiples Sequenz Alignment und Phylogenie Literatur: Kapitel 4 in Buch von David Mount Thioredoxin-Beispiel heute aus Buch von Arthur Lesk Softwarewerkzeuge der Bioinformatik 1 Definition von Homologie
MehrAufgabenblatt 5. Silke Trißl Wissensmanagement in der Bioinformatik
Aufgabenblatt 5 Silke Trißl Wissensmanagement in der Bioinformatik Zuerst! FRAGEN? Silke Trißl: Bioinformatik für Biophysiker 2 Exercise 1 + 2 Modify program to compare protein sequence read substitution
MehrBioinformatik für Lebenswissenschaftler
Bioinformatik für Lebenswissenschaftler Oliver Kohlbacher, Steffen Schmidt SS 2010 09. Multiples Alignment I Abt. Simulation biologischer Systeme WSI/ZBIT, Eberhard Karls Universität Tübingen Übersicht
MehrV3 - Multiples Sequenz Alignment und Phylogenie
V3 - Multiples Sequenz Alignment und Phylogenie Literatur: Kapitel 4 in Buch von David Mount Thioredoxin-Beispiel heute aus Buch von Arthur Lesk 3. Vorlesung SS 2011 Softwarewerkzeuge der Bioinformatik
MehrBioinformatik. Profilalignment und PSI Blast Center-Star Verfahren Progressives MSA CLUSTAL W. Ulf Leser Wissensmanagement in der.
Bioinformatik Profilalignment und PSI Blast Center-Star Verfahren Progressives MS CLUSTL W Ulf Leser Wissensmanagement in der Bioinformatik Definition Bisher Immer Vergleich zweier Strings Jetzt Multipler
MehrWelche Alignmentmethoden haben Sie bisher kennengelernt?
Welche Alignmentmethoden haben Sie bisher kennengelernt? Was heißt optimal? Optimal = die wenigsten Mutationen. Sequenzen bestehen aus Elementen (z.b. Aminosäuren oder Nukleotide). Edit Distanzen sind
MehrKlausur Bioinformatik für Biotechnologen
Name, Vorname: 1 Klausur Bioinformatik für Biotechnologen Studiengang Molekulare Biotechnologie TU Dresden WS 2011/2012 Prof. Michael Schroeder 15.02.2012 Die Dauer der Klausur beträgt 90 Minuten. Bitte
MehrBioinformatik für Biochemiker
Bioinformatik für Biochemiker Oliver Kohlbacher WS 2009/2010 9. Multiples Alignment II Abt. Simulation biologischer Systeme WSI/ZBIT, Eberhard Karls Universität Tübingen Übersicht T-COFFEE Probleme bei
MehrBioinformatik für Lebenswissenschaftler
Bioinformatik für Lebenswissenschaftler Oliver Kohlbacher, Steffen Schmidt SS 2010 06. Paarweises Alignment Teil II Abt. Simulation biologischer Systeme WSI/ZBIT, Eberhard Karls Universität Tübingen Übersicht
MehrBioinformatik für Lebenswissenschaftler
Bioinformatik für Lebenswissenschaftler Oliver Kohlbacher, Steffen Schmidt SS 2010 09. Multiples Alignment I Abt. Simulation biologischer Systeme WSI/ZBIT, Eberhard Karls Universität Tübingen Übersicht
MehrAlgorithmen auf Sequenzen Paarweiser Sequenzvergleich: Alignments
Algorithmen auf Sequenzen Paarweiser Sequenzvergleich: Alignments Sven Rahmann Genominformatik Universitätsklinikum Essen Universität Duisburg-Essen Universitätsallianz Ruhr Einführung Bisher: Berechnung
MehrBioinformatik für Biochemiker
Bioinformatik für Biochemiker Oliver Kohlbacher WS 2009/2010 9. Multiples Alignment II Abt. Simulation biologischer Systeme WSI/ZBIT, Eberhard Karls Universität Tübingen Übersicht T-OFFEE Probleme bei
MehrProblemseminar. Multiple alignment by sequence annealing. Ariel S. Schwartz and Lior Pachter
Problemseminar Multiple alignment by sequence annealing Ariel S. Schwartz and Lior Pachter 0.Gliederung 1.Alignment posets Gliederung 1. Einführung 2. Alignment Posets 1. Einführung Progressives Alignment
MehrAlgorithmische Anwendungen WS 2005/2006
Algorithmische Anwendungen WS 2005/2006 Sequenzalignment Gruppe F_lila_Ala0506 Allal Kharaz Yassine ELassad Inhaltsverzeichnis 1 Problemstellungen...................................... 3 1.1 Rechtschreibkorrektur...............................
MehrVorlesung Einführung in die Bioinformatik
Vorlesung Einführung in die Bioinformatik Dr. Stephan Weise 04.04.2016 Einführung Gegeben: zwei Sequenzen Gesucht: Ähnlichkeit quantitativ erfassen Entsprechungen zwischen einzelnen Bausteinen beider Sequenzen
MehrStudiengang Informatik der FH Gießen-Friedberg. Sequenz-Alignment. Jan Schäfer. WS 2006/07 Betreuer: Prof. Dr. Klaus Quibeldey-Cirkel
Studiengang Informatik der FH Gießen-Friedberg Sequenz-Alignment Jan Schäfer WS 2006/07 Betreuer: Prof. Dr. Klaus Quibeldey-Cirkel Überblick Einführung Grundlagen Wann ist das Merkmal der Ähnlichkeit erfüllt?
MehrSequenzvergleiche ohne Alignments durch lokales Dekodieren von Sequenzen
durch lokales Dekodieren von Sequenzen (16. Juli 2007) Inhalt 1 Grundidee 2 Naiver Algorithmus Definitionen Lokales N-Dekodieren Ermittlung der Distanzmatrix Aussagefähigkeit der Distanzen 3 Verbesserungen
MehrBioinformatik Für Biophysiker
Bioinformatik Für Biophysiker Sommersemester 2009 Silke Trißl / Ulf Leser Wissensmanagement in der Bioinformatik Wissensmanagement in der Bioinformatik Schwerpunkte Algorithmen der Bioinformatik Management
MehrEinführung in die Angewandte Bioinformatik: Algorithmen und Komplexität; Multiples Alignment und
Einführung in die Angewandte Bioinformatik: Algorithmen und Komplexität; Multiples Alignment 04.06.2009 und 18.06.2009 Prof. Dr. Sven Rahmann 1 Zwischenspiel: Algorithmik Bisher nebenbei : Vorstellung
MehrDot-Matrix Methode. (Java) (Javascript) 80
Dot-Matrix Methode Vergleich zweier Sequenzen (DNA oder Aminosäuren) Idee: gleiche Basen (Aminosäuren) in x-y Diagramm markieren Sequenz 1: ADRWLVKQN Sequenz 2: ADKFIVRDE http://myhits.vital-it.ch/cgi-bin/dotlet
MehrV3 - Multiples Sequenz Alignment und Phylogenie
V3 - Multiples Sequenz Alignment und Phylogenie Literatur: Kapitel 4 in Buch von David Mount Thioredoxin-Beispiel heute aus Buch von Arthur Lesk Softwarewerkzeuge der Bioinformatik 1 Leitfragen für V3
MehrAlgorithmen für paarweise Sequenz-Alignments. Katharina Hembach
Proseminar Bioinformatik WS 2010/11 Algorithmen für paarweise Sequenz-Alignments Katharina Hembach 06.12.2010 1 Einleitung Paarweise Sequenz-Alignments spielen in der Bioinformatik eine wichtige Rolle.
MehrBioinformatik. BLAT: Datenbanksuche für sehr ähnliche Sequenzen Multiples Sequenzalignment. Silke Trißl / Ulf Leser Wissensmanagement in der
Bioinformatik BLAT: Datenbanksuche für sehr ähnliche Sequenzen Multiples Sequenzalignment Silke Trißl / Ulf Leser Wissensmanagement in der Bioinformatik Hintergrund Schon öfters angesprochen... Ähnlichkeitsmatrizen,
MehrUAufgabe 12: (evolutiv konservierte Aminosäuren)
UAufgabe 12: (evolutiv konservierte Aminosäuren) Aufgabenstellung Wählen Sie zur Darstellung evolutiv konservierter Aminosäure-Positionen in "1lla" eine ihnen sinnvoll erscheinende Anfärbung. Exportieren
MehrBioinformatik für Lebenswissenschaftler
Bioinformatik für Lebenswissenschaftler Oliver Kohlbacher, Steffen Schmidt SS 2010 11. Hiden Markov Models & Phylogenien Abt. Simulation biologischer Systeme WSI/ZBIT, Eberhard Karls Universität Tübingen
MehrBioinformatik für Lebenswissenschaftler
Bioinformatik für Lebenswissenschaftler Oliver Kohlbacher, Steffen Schmidt SS 2010 11. Hiden Markov Models & Phylogenien Abt. Simulation biologischer Systeme WSI/ZBIT, Eberhard Karls Universität Tübingen
MehrBCDS Seminar. Protein Tools
BCDS Seminar Protein Tools Gliederung Nützliche Tools Three-/one-letter Amino Acids' Сodes RandSeq Random Protein Sequence Generator Protein Colourer ProtParam PeptideCutter ProtScale TMHMM Server 2.0
MehrEinführung in die Angewandte Bioinformatik: Multiples Alignment und Phylogenetik
Einführung in die Angewandte Bioinformatik: Multiples Alignment und Phylogenetik 04.06.2009 Prof. Dr. Sven Rahmann 1 Bisher: Paarweise Alignments Optimales Alignment: Alignment mit höchstem Score unter
MehrGleichheit, Ähnlichkeit, Homologie
Gleichheit, Ähnlichkeit, Homologie Identität (identity) Verhältnis der Anzahl identischer Aminosäuren zur Gesamtzahl der Aminosäuren; objektiv Ähnlichkeit (similarity) Verhältnis ähnlicher Aminosäuren
MehrGenannotation bei Prokaryoten
Genannotation bei Prokaryoten Maike Tech Abt. Bioinformatik Institut für Mikrobiologie und Genetik (IMG) Universität Göttingen 28. November 2005 Genetik von Pro- und Eukaryoten Eukaryoten Prokaryoten Zellkern
MehrAlgorithmische Bioinformatik
Algorithmische Bioinformatik Effiziente Berechnung des Editabstands Dynamische Programmierung Ulf Leser Wissensmanagement in der Bioinformatik Inhalt dieser Vorlesung Rekursive Definition des Editabstands
MehrProtokoll Versuch D2 Bioinformatik
Protokoll Versuch D2 Bioinformatik Gruppe 8 Susanne Duncker und Friedrich Hahn Identifizierung des zu untersuchenden Proteins Unsere Gruppe untersuchte in diesem Versuch die Proteinsequenz GENVKIPVAIKEL.
MehrEinführung in die Bioinformatik
Einführung in die Bioinformatik SS 2013 1. Was ist Bioinformatik? Kay Nieselt Integrative Transkriptomik Zentrum für Bioinformatik Tübingen Kay.Nieselt@uni-tuebingen.de Ablauf und Formales Ringvorlesung
MehrMBI: Sequenz-Vergleich mit Alignment
MBI: Sequenz-Vergleich mit Alignment Bernhard Haubold 28. Oktober 2014 Wiederholung: Was ist Bioinformatik? Historische Übersicht; CABIOS Bioinformatics Gemeinsames Thema: Information in vivo DNA Epigenetik
MehrVL Algorithmische BioInformatik (19710) WS2013/2014 Woche 3 - Montag
VL Algorithmische BioInformatik (19710) WS2013/2014 Woche 3 - Montag Tim Conrad AG Medical Bioinformatics Institut für Mathematik & Informatik, Freie Universität Berlin Vorlesungsthemen Part 1: Background
MehrEinführung in die Angewandte Bioinformatik: Proteinsequenz-Datenbanken
Einführung in die Angewandte Bioinformatik: Proteinsequenz-Datenbanken 14.05.2009 Prof. Dr. Sven Rahmann 1 3 Proteinsequenz-Datenbanksysteme NCBI Entrez Proteins EBI SRS Proteins UniProt (empfohlen) 2
MehrAlignments & Datenbanksuchen
WS2015/2016 Genomforschung und Sequenzanalyse - Einführung in Methoden der Bioinformatik- Thomas Hankeln Alignments & Datenbanksuchen 1 break-thru Doolittle et al. 1983, Waterfield et al. 1983 > DB-Suche...
MehrBioinformatik. Multiple Sequence Alignment Sum-of-pairs Score. Ulf Leser Wissensmanagement in der. Bioinformatik
Bioinformatik Multiple Sequence Alignment Sum-of-pairs Score Ulf Leser Wissensmanagement in der Bioinformatik Quasar Grundidee Search-Phase sucht Regionen mit Länge w und hoher Ähnlichkeit D.h. Regionen
MehrAlgorithmische Bioinformatik
FREIE UNIVERSITÄT BERLIN Fachbereich Mathematik und Informatik Institut für Informatik (WE 3) FU BERLIN Freie Universität Berlin FB Mathematik und Informatik, Institut für Informatik, Takustr. 9, D-14195
MehrSoftwarewerkzeuge der Bioinformatik
Bioinformatik Wintersemester 2006/2007 Tutorial 2: paarweise Sequenzaligments BLAST Tutorial 2: BLAST 1/22 Alignment Ausrichten zweier oder mehrerer Sequenzen, um: ihre Ähnlichkeit quantitativ zu erfassen
MehrMOL.504 Analyse von DNA- und Proteinsequenzen. Modul 2 BLAST-Sequenzsuche und Sequenzvergleiche
MOL.504 Analyse von DNA- und Proteinsequenzen Modul 2 BLAST-Sequenzsuche und Sequenzvergleiche Summary Modul 1 - Datenbanken Wo finde ich die DNA Sequenz meines Zielgens? Wie erhalte ich Info aus der DNA-Datenbank
MehrEinführung in die Bioinformatik
Einführung in die Bioinformatik SS 2014 1. Was ist Bioinformatik? Kay Nieselt Integrative Transkriptomik Zentrum für Bioinformatik Tübingen Kay.Nieselt@uni-tuebingen.de Ablauf und Formales Ringvorlesung
MehrAlgorithmische Bioinformatik
Algorithmische Bioinformatik Substitutionsmatrizen Ulf Leser Wissensmanagement in der Bioinformatik Ziele Ein sehr kleiner Einblick in Evolutionsgenetik Kenntnis einer typischen realen bioinformatischen
MehrÜbung 1 Bioinformatik. Ihre Namen:
Evolutionsbiologie 2 Übung 1 Bioinformatik WS2018/2019 Ihre Namen: llgemeine Hinweise: Für die Zulassung zur Klausur muss dieses Übungsblatt bearbeitet und als bestanden bewertet sein. Sie können das Übungsblatt
MehrPraktikum Algorithmischen Anwendungen WS 2006/07 Bioinformatik Sequence-Aligment Team C rot Ala0607
Praktikum Algorithmischen Anwendungen WS 2006/07 Bioinformatik Sequence-Aligment Team C rot Ala0607 Blöink, Frank 11038619 ai600@gm.fh-koeln.de Wolters, Benjamin 11037092 ai651@gm.fh-koeln.de 26. Januar
MehrHidden Markov Model (HMM)
Hidden Markov Model (HMM) Kapitel 1 Spezialvorlesung Modul 10-202-2206 (Fortgeschrittene Methoden in der Bioinformatik) Jana Hertel Professur für Bioinformatik Institut für Informatik Universität Leipzig
MehrAufgabenblatt 4. Silke Trißl Wissensmanagement in der Bioinformatik
Aufgabenblatt 4 Silke Trißl Wissensmanagement in der Bioinformatik Zuerst! FRAGEN? Silke Trißl: Bioinformatik für Biophysiker 2 Exercise 1 Global alignment using dynamic programming Write a program to
MehrFOLDALIGN und sein Algorithmus. Nadine Boley Silke Szymczak
FOLDALIGN und sein Algorithmus Nadine Boley Silke Szymczak Gliederung 2 Einleitung Motivation des Ansatzes zu FOLDALIGN Sankoff-Algorithmus Globales Alignment Zuker-Algorithmus Kombination FOLDALIGN Algorithmus,
MehrAlignments & Datenbanksuchen
WS2016/2017 F1-Praktikum Genomforschung und Sequenzanalyse: Einführung in Methoden der Bioinformatik Thomas Hankeln Alignments & Datenbanksuchen 1 Wiederholung Alignments Dynamic Programming Needleman-Wunsch:
MehrAlgorithmische Bioinformatik
FREIE UNIVERSITÄT BERLIN Fachbereich Mathematik und Informatik Institut für Informatik (WE 3) FU BERLIN Freie Universität Berlin FB Mathematik und Informatik, Institut für Informatik, Takustr. 9, D-14195
MehrÜbung 6: Structure Comparison 1
Andrew Torda Björn Hansen Zentrum für Bioinformatik Übung zur Vorlesung Grundlagen der Strukturanalyse Wintersemester 2016/2017 12.12.2016 Übung 6: Structure Comparison 1 1. Einführung In der vorliegenden
MehrAlgorithmen auf Sequenzen
Algorithmen auf Sequenzen Vorlesung von Prof. Dr. Sven Rahmann im Sommersemester 2008 Kapitel 6 Alignments Webseite zur Vorlesung http://ls11-www.cs.tu-dortmund.de/people/rahmann/teaching/ss2008/algorithmenaufsequenzen
MehrEinführung in die Bioinformatik Algorithmen zur Sequenzanalyse
Einführung in die Bioinformatik Algorithmen zur Sequenzanalyse!! Vorläufige Fassung, nur einzelne Abschnitte!!!! Enthält wahrscheinlich noch viele Fehler!!!! Wird regelmäßig erweitert und verbessert!!
MehrAnwendungen von HMM. Kapitel 1 Spezialvorlesung Modul (Fortgeschrittene Methoden in der Bioinformatik) Jana Hertel
Anwendungen von HMM Kapitel 1 Spezialvorlesung Modul 10-202-2206 (Fortgeschrittene Methoden in der Bioinformatik) Jana Hertel Professur für Bioinformatik Institut für Informatik Universität Leipzig Machine
MehrBezeichnung Sequenz Verwendung
8 ANHANG i 8 ANHANG I Oligonukleotide Bezeichnung Sequenz Verwendung D256 5 -ATGGCAGACGGTGAGGATATTCA-3 5 Aktin AC1 (neu) D257 5 -GCCTTTGCAATCCACATCTGTTG-3 3 Aktin AC2 (neu) D98 5 -AT CC ATG GCA ATG TCA
MehrSequenzvergleich und Datenbanksuche
Sequenzvergleich und Datenbanksuche Vorlesung Einführung in die Angewandte Bioinformatik Prof. Dr. Sven Rahmann Webseite zur Vorlesung http://bioinfo.wikidot.com/ Sprechstunde Mo 16-17 in OH14, R214 Sven.Rahmann
MehrEinführung in die Angewandte Bioinformatik: Sequenzähnlichkeit, Alignment, BLAST
Einführung in die Angewandte Bioinformatik: Sequenzähnlichkeit, Alignment, BLAST 28.05.2009 Prof. Dr. Sven Rahmann 1 Sequenzvergleich: Motivation Hat man bereits die DNA-Sequenz eines Gens, oder die Aminosäuresequenz
MehrAlignments & Datenbanksuchen
WS2017/2018 Genomforschung und Sequenzanalyse - Einführung in Methoden der Bioinformatik- Thomas Hankeln Alignments & Datenbanksuchen 1 break-thru Doolittle et al. 1983, Waterfield et al. 1983 > DB-Suche...
MehrBioinformatik: Neue Paradigmen in der Forschung
Bioinformatik: Neue Paradigmen in der Forschung Sommerakademie der Studienstiftung St. Johann, 1.-14.9.2002 Leitung: Proff. Ernst W. Mayr & Rolf Backofen Thema 4: Paarweises und multiples (heuristisches)
MehrAlgorithmische Bioinformatik
Algorithmische Bioinformatik Einführung in die Phylogenie (lat.: phylum = Stamm) Ulf Leser Wissensmanagement in der Bioinformatik Suche mit MSA Erinnerung: Erzeugung von Proteinfamilien Starte mit Proteinen
MehrBioinformatik. BLAST Basic Local Alignment Search Tool. Ulf Leser Wissensmanagement in der. Bioinformatik
Bioinformatik BLAST Basic Local Alignment Search Tool Ulf Leser Wissensmanagement in der Bioinformatik Praktikum Anmeldung bis 10.02.2004 bei Silke Trißl (trissl@informatik.hu-berlin.de) Name, Vorname
MehrBioinformatik Für Biophysiker
Bioinformatik Für Biophysiker Wintersemester 2005 / 2006 Ulf Leser Wissensmanagement in der Bioinformatik Wissensmanagement in der Bioinformatik Lehrstuhl seit 10/2002 Schwerpunkte Algorithmen der Bioinformatik
MehrAllgemeine Aufgabenstellung. Ziele
Allgemeine Aufgabenstellung Sie (s)wollen die Phylogenie der Vertebraten mit Hilfe molekulare Daten ergründen. Insbesondere interessiert Sie die Verwandtschaft der Primaten; aber auch tiefere Verzweigungen
MehrSequenzen-Alignierung in der Bioinformatik
Sequenzen-Alignierung in der Bioinformatik VO Algorithm Engineering Professor Dr. Petra Mutzel Lehrstuhl für Algorithm Engineering, LS 2. VO 2.0.2006 Literatur für diese VO Volker Heun: Skriptum zur Vorlesung
MehrBioinformatik. Methoden zur Vorhersage vo n RNA- und Proteinstrukture n. Gerhard Steger
Bioinformatik Methoden zur Vorhersage vo n RNA- und Proteinstrukture n Gerhard Steger Vorwort ix Strukturvorhersage von Nukleinsäuren 1 Struktur und Funktion von RNA 3 1.1 RNA-Struktur fl 1.2 Thermodynamik
Mehr7. Anhang. 7. Anhang. Abbildung 7.1: Aminosäuresequenz AtMYC2 im Wildtyp und in jin1. Unterschiede zwischen den Sequenzen sind rot unterlegt.
7. Anhang 10 20 30 40 50 60 70 80 90 100 jin1 MTDYRLQPTMNLWTTDDNASMMEAFMSSSDISTLWPPASTTTTTATTETTPTPAMEIPAQAGFNQETLQQRLQALIEGTHEGWTYAIFWQPSYDFSGASV AtMYC2 MTDYRLQPTMNLWTTDDNASMMEAFMSSSDISTLWPPASTTTTTATTETTPTPAMEIPAQAGFNQETLQQRLQALIEGTHEGWTYAIFWQPSYDFSGASV
Mehr...-Arg-Met-Phe-Ala-Asn-His-Lys-Ser-Val-Gly-...
1. Im Enzym Xase, das aus einer Polypeptidkette aus 300 Aminosäuren besteht, findet sich in der Region der Aminosäuren 40-50 die folgende Aminosäurensequenz:...-Arg-Met-Phe-Ala-Asn-His-Lys-Ser-Val-Gly-...
Mehr