Multiples Sequenzalignment

Größe: px
Ab Seite anzeigen:

Download "Multiples Sequenzalignment"

Transkript

1 WS2013/2014 Genomforschung und Sequenzanalyse - Einführung in Methoden der Bioinformatik- Thomas Hankeln HsaHBA GAEALERMFLSFPTTKTYF HsaHBZ GTETLERLFLSHPQTKTYF HsaHBE GGEALGRLLVVYPWTQRFF HsaHBG GGETLGRLLVVYPWTQRFF HsaHBB GGEALGRLLVVYPWTQRFF HsaHBD GGEALGRLLVVYPWTQRFF HsaMB GQEVLIRLFKGHPETLEKF Multiples Sequenzalignment 1

2 Alignment von 2 Sequenzen Gegeben: Gesucht: SeqA A F L S SeqB A F S SeqA A F L S SeqB A F - S 2

3 Multiples Sequenz-Alignment Gegeben: SeqA A F L S SeqB A F S SeqC A K Y L S SeqD A Y L S Gesucht: SeqA A - F L S SeqB A - F - S SeqC A K Y L S SeqD A - Y L S 3

4 Definitionen Multiple Sequence Alignment (Abkürzung = MSA) Deutsch: Multiple Sequenzalignierung Vergleich von > 2 DA- oder As-Sequenzen Sequenzen sollen so aneinandergelegt werden, dass die Positionen evolutiv homolog sind! => Mutationen = historische Ereignisse 4

5 MSA & Evolution AYLS AKYLS AFS AFLS SeqA A F L S SeqB A F - S SeqC A K Y L S SeqD A Y L S +K -L Y -> F Multiples Sequenz-Alignment = Evolutionshypothese! 5

6 DA-Alignment DA: nicht-kodierende oder proteinkodierende Sequenzen 1. nicht-kodierend (auch rra- oder tra-gene!): Seq1: ATCCTAGT-TCATGCATGCCTTAGCTC TCTGAT Seq2: ATTCTAGTTTCAT--ATGCTTCAGCTTATCTGAC Seq3: AT-CTAGT-CCATGCATG-TTCAGCTTATGCGAC 2. protein-kodierend (=> Codons!): Seq1: ATC CTA GTT TCA TGC ATG CCT AAG CTC --- TGG Seq2: ATT CTA GTT TCA --- ATG CTT CAG CTT ATC TGG Seq3: ATC CTA GTT CCA TGC ATG TTT CAG CTT ATG CGG => Triplettstruktur liefert zusätzliche Information 6

7 Aminosäurealignment Indel * 20 * 40 YPQTKIYFPHF-DLSHGSAQIRAHGKKVFAALHEAVHID YPQTKIYFPHF-DMSHSAQIRAHGKKVFSALHEAVHID FPQTKTYFSHF-DVHHGSTQIRSHGKKVMLALGDAVHID FPSTKTYFSHF-DLGHSTQVKGHGKKVADALTKAVGHLD FPTTKTYFPHF-DLSHGSAQVKGHGKKVADALTAVAHVD MPTTRIYFPAK-DLSERSSYLHSHGKKVVGALTAVAHID YPQTKTYFSHWADLSPGSGPVKKHGKTIMGAVGEAISKID YPQTKTYFSHWADLSPGSAPVKKHGGVIMGAIGAVGLMD Sequenzidentität = % identische AS Sequenzähnlichkeit = % identische + % isofunktionelle AS Insertion/Deletion = "Indel" 7

8 DA- oder Aminosäurealignment? Mögliche Austausche: 1. DA 4 x 4 = 16; mit Lücken (als 5. Base): 5 x 5 = 25 Möglichkeiten 2. Protein 20 x 20 = 400; mit Lücken (als 21. AS): 21 x 21 = 441 Möglichk. mehr Informationsgehalt in Protein kurze Evolutionszeit: DA, lange Distanzen: Protein 8

9 MSA: Anwendungsbeispiele Sequenz- Gruppen definieren: Konservierte Domänen & Sequenzmotive Strukturvorhersagen bei Proteinen Sequenzierprojekte (Spezialfall) Evolutive Aussagen (molekulare Phylogenie) 9

10 MSA Anwendung Erkennung von Sequenz- Gruppen" => Proteinfamilien und superfamilien 1. Proteinfamilie: hohe Identität (z.b. Hämoglobine) 2. Proteinsuperfamilie: geringe Identität (z.b. Globine) => häufig ähnliche Funktion! Erkennen von entfernten Verwandtschaften => häufig nicht mit einfachen Alignments zu erkennen -> Protein"profile" 10

11 MSA Anwendung Entfernte Verwandte, nur zwei Sequenzen... * 20 * 40 * 60 * 80 CelHb MHCRVYPIPKRSKSKKIFRCEPEDEATSMTAAAAAGGAKSKCKHFLTRRERILLEQSWRKTRKTGADHIGSKIFFM 80 HsaHBA MVLSPADKTVKAAWGKVG-AHAGEYGAEALER 32 * 100 * 120 * 140 * 160 CelHb VLTAQPDIKAIFGLEKIPTGRLKYDPRFRQHALVYTKTLDFVIRLDYPGKLEVYFELGKRHVAMQGRGFEPGYWETFA 160 HsaHBA MFLSFPTTKTYFPHFDLSHG----SAQVKGHGKKVADALTAVAHVDDMPALSALSDLHAHKLRVDPVFKLLSHCLLV 108 * 180 * 200 * 220 * CelHb ECMTQAAVEWEARQRPTLGAWRLISCIISFMRRGFDEEGKKKQYSYVQGFSSRARRSISPYAPGVH 231 HsaHBA TLAAHLPAEFTP-AVHASLDKFLASVSTVLTSKYR Mensch-Hämoglobin verglichen mit C. elegans Hämoglobin => nur 12% identische Aminosäuren => Verwandtschaft nicht abgesichert 11

12 MSA Anwendung Entfernte Verwandte * 2 0 * 4 0 * 6 0 * 8 0 L l u L e g H b L T E S Q A A L V K S S W E E F - A I P K H T H R F F I L 3 0 O s a H b M A L V E G G V S G G A V S F S E E Q E A L V L K S W A I M - K K D S A I G L R F F L K 4 6 C e l H b M H C R V Y P I P K R S K S K K I F R C E P E D E A T S M T A A A A A G G A K S K C K H F L T R R E R I L L E Q S W R K T R K T G A D H I G S K I F F M 8 0 H s a G B M E R P E P E L I R Q S W R A V - S R S P L E H G T V L F A R 3 0 D r e g b M E K L S E K D K G L I R D S W E S L - G K K V P H G I V L F T R 3 3 P c a M b V L S E G E W Q L V L H V W A K V - E A D V A G H G Q D I L I R 3 1 H s a H B A M V L S P A D K T V K A A W G K V - G A H A G E Y G A E A L E R 3 2 H s a H B B M V H L T P E E K S A V T A L W G K V - V D - - E V G G E A L G R 3 1 B l i H b B M S F E E A A L E V T G S E K I K E D L R L T W G I L - S E L E D T G V T L M L T 4 1 B v i H b M S K P A E A I A A V T Q P D V K A A L K S S W G L L - A P K K K Y G V E L M C K 4 1 CD1 E7 F8 * * * * L l u L e g H b V L E I A P A A K D L F S F L K G - T S E V P - - Q - P E L Q A H A G K V F K L V Y E A A I Q L Q V T G - V V V T D A T L K L G S V H V S K G V A D O s a H b 2 I F E V A P S A S Q M F S F L R - - S D V P - - L E K P K L K T H A M S V F V M T C E A A A Q L R K A G K V T V R D T T L K R L G A T H F K Y G V G D C e l H b V L T A Q P D I K A I F G L E K I - P T G R L K Y D P R F R Q H A L V Y T K T L D F V I R L D Y P G K L E V Y F E L G K R H V A M Q G R G F E P H s a G B L F A L E P D L L P L F Q Y C R Q F S S P E D C L S - S P E F L D H I R K V M L V I D A A V T V E D L S S L E E Y L A S L G R K H R A V G V K L D r e g b L F E L D P A L L T L F S Y S T C G D A P E - C L S - S P E F L E H V T K V M L V I D A A V S H L D D L H T L E D F L L L G R K H Q A V G V T P c a M b L F K S H P E T L E K F D R F K H L - K T - E A E M K A S E D L K K H G V T V L T A L G A I L K K K G H H E A E L K P L A Q S H A T K H - - K I P I H s a H B A M F L S F P T T K T Y F P H F - D L - S H G S A Q V K G H G K K V A D A L T A V A H V D D M P A L S A L S D L H A H K L - - R V D P 9 6 H s a H B B L L V V Y P W T Q R F F E S F G D L - S T - P D A V M G P K V K A H G K K V L G A F S D G L A H L D L K G T F A T L S E L H C D K L - - H V D P B l i H b B L F K M E P G S K A R F G R F G I - D S G M G R D K L R G H S I T L M Y A L Q F M D S L D T E K L R C V V D K F A V H R I R K I S A B v i H b L F S L H K D T A R Y F E R M G K L - D A - - A G S R E L I G H A I Y L M Y A I E S F V D Q L D D P S I V E D I G R F A Y R H L K R G I G S * * * * MSA zeigt streng konservierte As-Positionen 12

13 MSA Anwendung Konservierte Domänen & Sequenzmotive => Proteine mit gemeinsamer Funktion erkennen Bsp: Cu-Bindungsstelle in Hämocyaninen und Phenoloxidase: PlePPO YWREDFGISHHWHWHLVYPIEM-----VRDRKGELFYYMHQQMVARYDWERLSVLRVEKLE 61 PmoPPO BmoPPO1 YWREDYGIVHHWHWHLIYPPAM-----GFDRDRKGELFYYMHQQVIARYDIERLCLGLPKVEKLD 61 YFREDIGILHHWHWHLVYPFDAADRA-IVKDRRGELFYYMHQQIIARYVERMCLSRVRRY 65 DmePPOA1 YFREDIGVSHHWHWHLVYPTTGPTE--VVKDRRGELFYYMHHQILARYVERFCLKKVQPL 64 DmePPO2 YFREDLGILHHWHWHLVYPFEASDRS-IVAKDRRGELFYYMHQQVIARYAERFSLARVLPF 65 DmePPO3 YFREDLGVLHHWHWHLVYPIEAPDRS-IVDKDRRGELFYYMHQQIIARYAERLSHMARVQPF 65 EcaHcA YFREDIGVAHHWHWHVVYPSTYDPAFFGKVKDRKGELFYYMHQQMCARYDCERLSGLRMIPFH 66 EcaHcD YFREDIGISHHWHWHLVYPAFYDADIFGKIKDRKGELFYYMHQQMCARYDCERLSVGLQRMIPFQ 66 EcaHcF LpoHc2 YFREDIGAAHHWHWHIVYPPTWDASVMSKVKDRKGELFYYMHQQMCARYDCDRLSTGLRRMIPFH 66 YYREDVGIAHHWHWHLVYPSTWPKYFGKKKDRKGELFYYMHQQMCARYDCERLSGMHRMLPF 66 PvaHc YFGEDIGLTHHVTWHMEFPFWWDAYG-HHLDRKGEFFWIHHQLTVRFDAERLSYLDPVGELQ 65 PirHcC YFGEDVGMTHHVLWHMEFPFWWEDSSG-RHLDRKGESFFWVHHQLTVRYDAERLSHLDPVEELS 65 PirHcA YFGEDIGMIHHVTWHMDFPFWWEDSYG-YHLDRKGELFFWVHHQLTARFDFERLSWLDPVDELH 65 Cu - Bindungsstellen 13

14 MSA Anwendung Vorhersage der Struktur von Proteinen mit divergenter Sequenz, aber sehr ähnlicher 3D-Faltung Myoglobin euroglobin Trennung vor ~ 800 Mio Jahren! HsaGB -MERPEPELIRQSWRAVSRSPLEHGTVLFARLFALEPDLLPLFQYCRQFSSPEDCLSSPEFLDHIRKVMLVIDAAVT 78 PcaMb VLSEGEWQLVLHVWAKVEADVAGHGQDILIRLFKSHPETLEKFDRFKHL-KTEAEMKASEDLKKHGVTVLTALGAILKK 78 HsaGB VEDLSSLEEYLASLGRKHRAVG-VKLSSFSTVGESLLYMLEKCLGPAFTPATRAAWSQLYGAVVQAMSRGWDGE PcaMb KGHH---EAELKPLAQSHATKHKIPIKYLEFISEAIIHVLHSRHPGDFGADAQGAMKALELFRKDIAAKYKELGYQG

15 MSA Anwendung Sequenzierprojekte Sequenzierung Zusammensetzen der Sequenzen 15

16 MSA Anwendung Evolutive Aussagen => Phylogenetische Rekonstruktion (Stammbäume) A GAEALERMFLSFPTTKTYFPHF-DLS Z D GTETLERLFLSHPQTKTYFPHF-DLH E C GGEALGRLLVVYPWTQRFFDSFGLS G B GGETLGRLLVVYPWTQRFFDSFGLS B GGEALGRLLVVYPWTQRFFESFGDLS A D B C Garbage I Garbage OUT 16

17 Wie kommt man zum MSA? Alignment per Hand/Auge: gut bei relativ ähnlichen Sequenzen Mit dem Computer: Exakte Algorithmen Heuristische Verfahren Alle Verfahren brauchen Bewertungsschemata Kennen wir! => z.b. PAM & BLOSUM-Matrizen, gap penalty 17

18 Wer hat ein Auge...? Ancistr. TTGACATAA AAGCTTCCAGTTT Brach. TTGACATAA AAGCTTCGAGTTTTTT Meteorium TTGACATAAA AAACTGGAAGTTT Papillaria TTGACATAAA AAACTTCTAGTTTTTT CTTCCAG CTGGAAG 18 reales Beispiel von Dr. D. Quandt, Dresden

19 Bewertung eines MSA Optimales Alignment ist ein Alignment mit minimalen Kosten (oder maximaler Belohnung für Ähnlichkeit). Algorithmen sollen ein Alignment erstellen, welches die Kosten minimiert bzw. die Ähnlichkeit optimiert. 19

20 MSA und Gaps * Wie wahrscheinlich ist es, dass zwischen Sequenzpaaren und Sequenzgruppen Lücken (gaps) auftreten? Gaps stellen Insertionen und Deletionen (Indels) dar, die in der Evolution aufgetreten sind Ihre Wahrscheinlichkeit kann definiert werden. * Das Problem kennen wir bereits von den dualen Alignments 20

21 Was kostet ein Gap? Hämoglobin- und Myoglobinsequenzen von Mensch CLUSTALX: Gap creation weight 20, gap length weight 0.1* HsaHBA GAEALERMFLSFPTTKTYFPHF------DLSHGSAQVKGHGKKVADALTAVAHVDDMP 54 HsaHBZ GTETLERLFLSHPQTKTYFPHF------DLHPGSAQLRAHGSKVVAAVGDAVKSIDDIGG 54 HsaHBE GGEALGRLLVVYPWTQRFFDSFGLSSPSAILGPKVKAHGKKVLTSFGDAIKMDLKP 60 HsaHBG GGETLGRLLVVYPWTQRFFDSFGLSSASAIMGPKVKAHGKKVLTSLGDAIKHLDDLKG 60 HsaHBB GGEALGRLLVVYPWTQRFFESFGDLSTPDAVMGPKVKAHGKKVLGAFSDGLAHLDLKG 60 HsaHBD GGEALGRLLVVYPWTQRFFESFGDLSSPDAVMGPKVKAHGKKVLGAFSDGLAHLDLKG 60 HsaMB GQEVLIRLFKGHPETLEKFDKFKHLKSEDEMKASEDLKKHGATVLTALGGILKKKGHHEA 60 * synonym: gap opening penalty, gap extension penalty 21

22 Was kostet ein Gap? Hämoglobin- und Myoglobinsequenzen von Mensch CLUSTALX: Cap creation weight 10, gap length weight 0.1 HsaHBA GAEALERMFLSFPTTKTYFPHF-DLSH-----GSAQVKGHGKKVADALTAVAHVDDMP 54 HsaHBZ GTETLERLFLSHPQTKTYFPHF-DLHP-----GSAQLRAHGSKVVAAVGDAVKSIDDIGG 54 HsaHBE GGEALGRLLVVYPWTQRFFDSFGLSSPSAILGPKVKAHGKKVLTSFGDAIKMDLKP 60 HsaHBG GGETLGRLLVVYPWTQRFFDSFGLSSASAIMGPKVKAHGKKVLTSLGDAIKHLDDLKG 60 HsaHBB GGEALGRLLVVYPWTQRFFESFGDLSTPDAVMGPKVKAHGKKVLGAFSDGLAHLDLKG 60 HsaHBD GGEALGRLLVVYPWTQRFFESFGDLSSPDAVMGPKVKAHGKKVLGAFSDGLAHLDLKG 60 HsaMB GQEVLIRLFKGHPETLEKFDKFKHLKSEDEMKASEDLKKHGATVLTALGGILKKKGHHEA 60 Welches Alignment ist aber nun besser? 22

23 Was kostet ein Gap? Erst Hinzunahme einer Hai-Hb-alpha-Sequenz bringt die Lösung: S a c H b A H s a H B A G A E S L A R M F A T T P S T K T Y F S K F T D F S A G K R V K A H G G K V L A V A D A T D H L D V A G G A E A L E R M F L S F P T T K T Y F P H F - D L S H G S A Q V K G H G K K V A D A L T A V A H V D D M P H s a H B Z G T E T L E R L F L S H P Q T K T Y F P H F - D L H P G S A Q L R A H G S K V V A A V G D A V K S I D D I G G 5 4 H s a H B B G G E A L G R L L V V Y P W T Q R F F E S F G D L S T P D A V M G P K V K A H G K K V L G A F S D G L A H L D L K G 6 0 H s a H B D G G E A L G R L L V V Y P W T Q R F F E S F G D L S S P D A V M G P K V K A H G K K V L G A F S D G L A H L D L K G 6 0 H s a H B E G G E A L G R L L V V Y P W T Q R F F D S F G L S S P S A I L G P K V K A H G K K V L T S F G D A I K M D L K P 6 0 H s a H B G G G E T L G R L L V V Y P W T Q R F F D S F G L S S A S A I M G P K V K A H G K K V L T S L G D A I K H L D D L K G 6 0 H s a M B G Q E V L I R L F K G H P E T L E K F D K F K H L K S E D E M K A S E D L K K H G A T V L T A L G G I L K K K G H H E A 6 0 => Alignment # 2 (10 gap creation weight) ist plausibel! 23

24 Bewertung eines MSA I: sum of pairs-score Beispiel (DA) für die Berechnung der Kosten (c) mit: match c = 0; mismatch c = 2; gap c = 1 S1 = - G C T G A T A T A A C T S2 = G G G T G A T - T A G C T S3 = A G C G G A - A C A C C T sum of pairs: = 26 Vorgehensweise: Summieren der Kosten der Paare ("sum of pairs") der 1. Spalte: c(-,g) + c(g,a) + c(-,a) = 4, usw. Summieren der Spaltenwerte = 26 (Gesamtkosten!) 24

25 Bewertung eines MSA I: sum of pairs-score S1 = - G C T G A T A T A A C T S2 = G G G T G A T - T A G C T S3 = A G C G G A - A C A C C T sum of pairs: = 26 S1 = G - C T G A T A T A A C T S2 = G G G T G A - T T A G C T S3 = A G C G G A - A C A C C T sum of pairs: = 30 25

26 Bewertung eines MSA I: sum of pairs Beispiel: Protein Bewertung mit "sum of pairs und BLOSUM-Matrix Seq 1... Seq 2... Seq 3... Seq 4...C... Seq 5...C...C... C C Spalte 1 Spalte 2 Spalte 3 C 26

27 Bewertung eines MSA I: sum of pairs C C Spalte 1 Spalte 2 Spalte 3 C BLOSUM 62 scores : +6 C: -3 C C: +9 Spalte 1: 10 x - = + 60 Spalte 2: 6 x x -C = + 24 Spalte 3: 3 x x -C + 1 x C-C =

28 Bewertung eines MSA II Bewertung mithilfe eines Stammbaums (z.b. CLUSTAL): Spalte 3 C C C Score = 4 x x -C + 2 x C-C =

29 Lösungsansätze Exakte Algorithmen Progressive Verfahren Iterative Verfahren Divide-and-Conquer-Verfahren Profile, Hidden Markov Modelle Heuristische Verfahren => liefern nicht unbedingt das beste Alignment 29

30 Exakte Algorithmen Wir erinnern uns: eedleman & Wunsch für paarweises globalesalignment R R L G Y E Kosten c als: c(a,b) = c (a,-) = 1 G c(a,a) = 0 Y A Lösung: R L G Y E R G Y A 30

31 & W mit k Sequenzen eedleman-wunsch: in 3 Dimensionen! Sequenz 2 Sequenz 1 Sequenz 3 Verwendung von k- dimensionalen Gittergraphen produziert das bestmögliche globale MSA sehr rechenintensiv, wenn k groß (Aufwand: n M ) praktikabel bis 10 x 1000 As (Programm MSA auf Supercomputern) 31

32 Daher Heuristische Verfahren Progressive Verfahren Iterative Verfahren Divide-and-Conquer-Verfahren Hidden Markov Modelle u. v. m. gibt s global und lokal 32

33 Progressives Alignment 1. paarweiser Vergleich aller Sequenzen miteinander => Berechnung der Distanzen zweier Sequenzen 2. gruppiert Sequenzen nach Ähnlichkeit (Cluster-Bildung) 3. Erstellung paarweiser Alignments 4. sukzessives Alignment nach Ähnlichkeit, dabei die ähnlichsten Sequenzpaare zuerst Feng & Doolittle (1987): PileUp (GCG package) Higgins and Sharp (1988), Thompson et al. (1994): CLUSTALW otredame et al. (2000): T-COFFEE 33

34 Progressives Alignment 1) Sequenzvergleich A B C D Alle Sequenzen werden miteinander verglichen (Option A: schnelles "quick and dirty" Alignment Option B: exaktes, langsames eedleman-wunsch) => Berechnen der Distanzen 34

35 Progressives Alignment 2) Ähnliche Sequenzen werden gruppiert => Cluster-Analyse = Erstellung eines hierarchischen Stammbaums ("guide tree"). A B C D A - B C D "guide tree" A D B C PileUp = UPGMA Clustal = eighbor Joining 35

36 Progressives Alignment 3) Alignment von nahe verwandten Sequenzen; die ähnlichsten zuerst. A D B C A D B C 36

37 Progressives Alignment 4) Sukzessives globales Alignment A D A D B C alte gaps erhalten, neue hinzugefügt B C A D B C 37

38 Progressive Alignment - Probleme - Welche Matrizen? Welche gap penalty? Erfolg hängt von den ersten paarweisen Alignments ab: problematisch, wenn selbst die nächsten Verwandten bereits unähnlich sind Fehler propagieren sich in das MSA Insertionen werden beim paarweisen Vergleich und beim MSA penalisiert: Über-Alignment mit kompakten`ungapped blocks` und anderen Regionen mit gehäuften gaps Lösung: Löytynoja & Goldman 2005, PAS 38

39 Praktische Hinweise für globale MSAs Keine sehr unterschiedlich langen Sequenzen global alignen: Sequenzen trimmen oder lokales MSA machen (z. B. PSI-BLAST) Protein-MSA: in Visualisierungsprogrammen (z.b. GeneDoc) unsichere Abschnitte auf chemisch ähnliche As hin absuchen. Falls nicht vorhanden, Abschnitte aus Alignment entfernen. Per Expertenwissen und 3D-Strukturinformation Schlüsselpositionen im MSA identifizieren und diese konstant halten 39

40 Praktische Hinweise für globale MSAs Beispiel: * 2 0 * 4 0 * 6 0 * 8 0 L l u L e g H b L T E S Q A A L V K S S W E E F - A I P K H T H R F F I L 3 0 O s a H b M A L V E G G V S G G A V S F S E E Q E A L V L K S W A I M - K K D S A I G L R F F L K 4 6 C e l H b M H C R V Y P I P K R S K S K K I F R C E P E D E A T S M T A A A A A G G A K S K C K H F L T R R E R I L L E Q S W R K T R K T G A D H I G S K I F F M 8 0 H s a G B M E R P E P E L I R Q S W R A V - S R S P L E H G T V L F A R 3 0 D r e g b M E K L S E K D K G L I R D S W E S L - G K K V P H G I V L F T R 3 3 P c a M b V L S E G E W Q L V L H V W A K V - E A D V A G H G Q D I L I R 3 1 H s a H B A M V L S P A D K T V K A A W G K V - G A H A G E Y G A E A L E R 3 2 H s a H B B M V H L T P E E K S A V T A L W G K V - V D - - E V G G E A L G R 3 1 B l i H b B M S F E E A A L E V T G S E K I K E D L R L T W G I L - S E L E D T G V T L M L T 4 1 B v i H b M S K P A E A I A A V T Q P D V K A A L K S S W G L L - A P K K K Y G V E L M C K 4 1 CD1 E7 F8 * * * * L l u L e g H b V L E I A P A A K D L F S F L K G - T S E V P - - Q - P E L Q A H A G K V F K L V Y E A A I Q L Q V T G - V V V T D A T L K L G S V H V S K G V A D O s a H b 2 I F E V A P S A S Q M F S F L R - - S D V P - - L E K P K L K T H A M S V F V M T C E A A A Q L R K A G K V T V R D T T L K R L G A T H F K Y G V G D C e l H b V L T A Q P D I K A I F G L E K I - P T G R L K Y D P R F R Q H A L V Y T K T L D F V I R L D Y P G K L E V Y F E L G K R H V A M Q G R G F E P H s a G B L F A L E P D L L P L F Q Y C R Q F S S P E D C L S - S P E F L D H I R K V M L V I D A A V T V E D L S S L E E Y L A S L G R K H R A V G V K L D r e g b L F E L D P A L L T L F S Y S T C G D A P E - C L S - S P E F L E H V T K V M L V I D A A V S H L D D L H T L E D F L L L G R K H Q A V G V T P c a M b L F K S H P E T L E K F D R F K H L - K T - E A E M K A S E D L K K H G V T V L T A L G A I L K K K G H H E A E L K P L A Q S H A T K H - - K I P I H s a H B A M F L S F P T T K T Y F P H F - D L - S H G S A Q V K G H G K K V A D A L T A V A H V D D M P A L S A L S D L H A H K L - - R V D P 9 6 H s a H B B L L V V Y P W T Q R F F E S F G D L - S T - P D A V M G P K V K A H G K K V L G A F S D G L A H L D L K G T F A T L S E L H C D K L - - H V D P B l i H b B L F K M E P G S K A R F G R F G I - D S G M G R D K L R G H S I T L M Y A L Q F M D S L D T E K L R C V V D K F A V H R I R K I S A B v i H b L F S L H K D T A R Y F E R M G K L - D A - - A G S R E L I G H A I Y L M Y A I E S F V D Q L D D P S I V E D I G R F A Y R H L K R G I G S * * * *

41 Praktische Hinweise für globale MSAs Edgar & Batzoglou (2006) Curr Opin Struct Biol 16:

42 Heuristische Verfahren Progressive Verfahren Iterative Verfahren Divide-and-Conquer-Verfahren Profile, Hidden Markov Modelle besonders gebräuchlich zur Erstellung von lokalen MSAs, mit denen z. B. Protein- Domänen definiert werden (werden später in der VL besprochen) 42

43 Websites MSA tools, Übersicht: Clustal: MAFFT: Editor für PC: Editor für Mac/PC/Linux: 43

Multiples Sequenzalignment

Multiples Sequenzalignment WS2017/2018 Genomforschung und Sequenzanalyse - Einführung in Methoden der Bioinformatik- Thomas Hankeln HsaHBA GAEALERMFLSFPTTKTYF HsaHBZ GTETLERLFLSHPQTKTYF HsaHBE GGEALGRLLVVYPWTQRFF HsaHBG GGETLGRLLVVYPWTQRFF

Mehr

Das Szenario...ein neues tödliches Virus!

Das Szenario...ein neues tödliches Virus! Das Szenario...ein neues tödliches Virus! Labor: Isolierung der Erbsubstanz und Sequenzierung Computer: Erkennen der Virusgene (de novo Genvorhersage) Ähnlichkeit zu bekannten Genen? (Datenbanksuchen)

Mehr

Alignment von DNA- und Proteinsequenzen

Alignment von DNA- und Proteinsequenzen WS2017/2018 Genomforschung und Sequenzanalyse - Einführung in Methoden der Bioinformatik- Thomas Hankeln Alignment von DNA- und Proteinsequenzen das vielleicht wichtigste Werkzeug der Bioinformatik! 1

Mehr

Sequenz Alignment Teil 2

Sequenz Alignment Teil 2 Sequenz Alignment Teil 2 14.11.03 Vorlesung Bioinformatik 1 Molekulare Biotechnologie Dr. Rainer König Besonderen Dank an Mark van der Linden, Mechthilde Falkenhahn und der Husar Biocomputing Service Gruppe

Mehr

Multiple Alignments. Vorlesung Einführung in die Angewandte Bioinformatik Prof. Dr. Sven Rahmann. Webseite zur Vorlesung

Multiple Alignments. Vorlesung Einführung in die Angewandte Bioinformatik Prof. Dr. Sven Rahmann. Webseite zur Vorlesung Multiple Alignments Vorlesung Einführung in die Angewandte Bioinformatik Prof. Dr. Sven Rahmann Webseite zur Vorlesung http://bioinfo.wikidot.com/ Sprechstunde Mo 16-17 in OH14, R214 Sven.Rahmann -at-

Mehr

Zentrum für Bioinformatik. Übung 4: Revision. Beispielfragen zur Klausur im Modul Angewandte Bioinformatik (erste Semesterhälfte)

Zentrum für Bioinformatik. Übung 4: Revision. Beispielfragen zur Klausur im Modul Angewandte Bioinformatik (erste Semesterhälfte) Andrew Torda Björn Hansen Iryna Bondarenko Zentrum für Bioinformatik Übung zur Vorlesung Angewandte Bioinformatik Sommersemester 2014 20./23.06.2014 Übung 4: Revision Beispielfragen zur Klausur im Modul

Mehr

Quantifizierung evolutionärer Veränderungen

Quantifizierung evolutionärer Veränderungen Quantifizierung evolutionärer Veränderungen Begriff der Homologie/Homoplasie Methoden des Sequenzvergleichs/Alignments Verfahren und Modelle zur Berechnung von Austauschraten in DNA und Proteinen Thomas

Mehr

Einführung in die Bioinformatik

Einführung in die Bioinformatik Einführung in die Bioinformatik Ringvorlesung Biologie Sommer 07 Burkhard Morgenstern Institut für Mikrobiologie und Genetik Abteilung für Bioinformatik Goldschmidtstr. 1 Online Materialien zur Ringvorlesung:

Mehr

Bioinformatik. Lokale Alignierung Gapkosten. Silke Trißl / Ulf Leser Wissensmanagement in der. Bioinformatik

Bioinformatik. Lokale Alignierung Gapkosten. Silke Trißl / Ulf Leser Wissensmanagement in der. Bioinformatik Bioinformatik Lokale Alignierung Gapkosten Silke Trißl / Ulf Leser Wissensmanagement in der Bioinformatik Inhalt dieser Vorlesung Ähnlichkeit Lokales und globales Alignment Gapped Alignment Silke Trißl:

Mehr

Algorithmen und Datenstrukturen in der Bioinformatik Zweites Übungsblatt WS 05/06 Musterlösung

Algorithmen und Datenstrukturen in der Bioinformatik Zweites Übungsblatt WS 05/06 Musterlösung Johanna Ploog, Konstantin Clemens Freie Universität Berlin Institut für Mathematik II Arbeitsgruppe für Mathematik in den Lebenswissenschaften Algorithmen und Datenstrukturen in der Bioinformatik Zweites

Mehr

Primärstruktur. Wintersemester 2011/12. Peter Güntert

Primärstruktur. Wintersemester 2011/12. Peter Güntert Primärstruktur Wintersemester 2011/12 Peter Güntert Primärstruktur Beziehung Sequenz Struktur Proteinsequenzen, Sequenzdatenbanken Sequenzvergleich (sequence alignment) Sequenzidentität, Sequenzhomologie

Mehr

Übungsaufgaben zur Einführung in die Bioinformatik - Lösungen

Übungsaufgaben zur Einführung in die Bioinformatik - Lösungen 18.01.2013 Prof. P. Güntert 1 Vorlesung BPC I: Aspekte der Thermodynamik in der Strukturbiologie Übungsaufgaben zur Einführung in die Bioinformatik - Lösungen 1. Hamming und Levenshtein Distanzen a) Was

Mehr

Sequenzen-Alignierung in der Bioinformatik. VO Algorithm Engineering Professor Dr. Petra Mutzel Lehrstuhl für Algorithm Engineering, LS11

Sequenzen-Alignierung in der Bioinformatik. VO Algorithm Engineering Professor Dr. Petra Mutzel Lehrstuhl für Algorithm Engineering, LS11 Sequenzen-Alignierung in der Bioinformatik VO Algorithm Engineering Professor Dr. Petra Mutzel Lehrstuhl für Algorithm Engineering, LS11 23. VO 24.01.2006 1 1 Literatur für diese VO Volker Heun: Skriptum

Mehr

Alignment von DNA- und Proteinsequenzen

Alignment von DNA- und Proteinsequenzen WS2012/2013 Genomforschung und Sequenzanalyse - Einführung in Methoden der Bioinformatik- Thomas Hankeln Alignment von DNA- und Proteinsequenzen das vielleicht wichtigste Werkzeug der Bioinformatik! 1

Mehr

Algorithmische Bioinformatik

Algorithmische Bioinformatik Algorithmische Bioinformatik Multiple Sequence Alignment Sum-of-pairs Score Center-Star Score Ulf Leser Wissensmanagement in der Bioinformatik Ziel dieser Vorlesung Aufgabenstellung Multiples Sequenzalignment

Mehr

Pairwise Alignment. Steffen Forkmann. Proseminar: BioInformatik

Pairwise Alignment. Steffen Forkmann. Proseminar: BioInformatik Pairwise Alignment Steffen Forkmann Proseminar: BioInformatik Wintersemester 2004/2005 Inhaltsverzeichnis 1 Problemstellungen 3 1.1 Rechtschreibkorrektur............................... 3 1.2 DNA- und Aminosäure-Sequenzen........................

Mehr

Bioinformatik für Lebenswissenschaftler

Bioinformatik für Lebenswissenschaftler Bioinformatik für Lebenswissenschaftler Oliver Kohlbacher, Steffen Schmidt SS 2010 10. Multiples Alignment II & PSI-BLAST Abt. Simulation biologischer Systeme WSI/ZBIT, Eberhard Karls Universität Tübingen

Mehr

Bioinformatik. Substitutionsmatrizen BLAST. Ulf Leser Wissensmanagement in der. Bioinformatik

Bioinformatik. Substitutionsmatrizen BLAST. Ulf Leser Wissensmanagement in der. Bioinformatik Bioinformatik Substitutionsmatrizen BLAST Ulf Leser Wissensmanagement in der Bioinformatik Inhalt dieser Vorlesung Substitutionsmatrizen: PAM und BLOSSUM Suche in Datenbanken: Basic Local Alignment Search

Mehr

Algorithmische Bioinformatik

Algorithmische Bioinformatik Algorithmische Bioinformatik Multiple Sequence Alignment Sum-of-pairs Score Center-Star Score Ulf Leser Wissensmanagement in der Bioinformatik Inhalt dieser Vorlesung Multiples Sequenzalignment Sum-Of-Pair

Mehr

V3 - Multiples Sequenz Alignment und Phylogenie

V3 - Multiples Sequenz Alignment und Phylogenie V3 - Multiples Sequenz Alignment und Phylogenie Literatur: Kapitel 4 in Buch von David Mount Thioredoxin-Beispiel heute aus Buch von Arthur Lesk 1 Leitfragen für V3 Frage1: Können wir aus dem Vergleich

Mehr

V3 - Multiples Sequenz Alignment und Phylogenie

V3 - Multiples Sequenz Alignment und Phylogenie V3 - Multiples Sequenz Alignment und Phylogenie Literatur: Kapitel 4 in Buch von David Mount Thioredoxin-Beispiel heute aus Buch von Arthur Lesk 1 Leitfragen für V3 Frage1: Können wir aus dem Vergleich

Mehr

Kapitel 7: Sequenzen- Alignierung in der Bioinformatik

Kapitel 7: Sequenzen- Alignierung in der Bioinformatik Kapitel 7: Sequenzen- Alignierung in der Bioinformatik 7.3: Paarweise Sequenzen-Alignierung 7.4: Multiple Sequenzen Alignierung VO Algorithm Engineering Professor Dr. Petra Mutzel Lehrstuhl für Algorithm

Mehr

Verbesserung der dotplot Methode

Verbesserung der dotplot Methode erbesserung der dotplot Methode binäre Information: "x" oder " " besser: "mehr" oder "weniger" ähnlich Gruppen von Aminosäuren mit ähnlichen Eigenschaften bilden bestes Alignment: optimiere Häufigkeit

Mehr

Dendrogramm der Primaten

Dendrogramm der Primaten Arbeitsblatt 1 Dargestellt ist ein Ausschnitt der DNA-Sequenz für das Enzym NAD- Polymerase, dass bei den Primatenarten Mensch(M), Schimpanse(S), Gorilla(G), Orang-Utan(O) und Gibbon(Gi) vorhanden ist.

Mehr

Bioinformatik. Multiple String Alignment I. Ulf Leser Wissensmanagement in der. Bioinformatik

Bioinformatik. Multiple String Alignment I. Ulf Leser Wissensmanagement in der. Bioinformatik Bioinformatik Multiple String Alignment I Ulf Leser Wissensmanagement in der Bioinformatik BLAST2: Zwei-Hit-Strategie Original: Alle Hits mit Score > t werden zu MSPs verlängert Extensionen fressen >90%

Mehr

V3 - Multiples Sequenz Alignment und Phylogenie

V3 - Multiples Sequenz Alignment und Phylogenie V3 - Multiples Sequenz Alignment und Phylogenie Literatur: Kapitel 4 in Buch von David Mount Thioredoxin-Beispiel heute aus Buch von Arthur Lesk Softwarewerkzeuge der Bioinformatik 1 Definition von Homologie

Mehr

Aufgabenblatt 5. Silke Trißl Wissensmanagement in der Bioinformatik

Aufgabenblatt 5. Silke Trißl Wissensmanagement in der Bioinformatik Aufgabenblatt 5 Silke Trißl Wissensmanagement in der Bioinformatik Zuerst! FRAGEN? Silke Trißl: Bioinformatik für Biophysiker 2 Exercise 1 + 2 Modify program to compare protein sequence read substitution

Mehr

Bioinformatik für Lebenswissenschaftler

Bioinformatik für Lebenswissenschaftler Bioinformatik für Lebenswissenschaftler Oliver Kohlbacher, Steffen Schmidt SS 2010 09. Multiples Alignment I Abt. Simulation biologischer Systeme WSI/ZBIT, Eberhard Karls Universität Tübingen Übersicht

Mehr

V3 - Multiples Sequenz Alignment und Phylogenie

V3 - Multiples Sequenz Alignment und Phylogenie V3 - Multiples Sequenz Alignment und Phylogenie Literatur: Kapitel 4 in Buch von David Mount Thioredoxin-Beispiel heute aus Buch von Arthur Lesk 3. Vorlesung SS 2011 Softwarewerkzeuge der Bioinformatik

Mehr

Bioinformatik. Profilalignment und PSI Blast Center-Star Verfahren Progressives MSA CLUSTAL W. Ulf Leser Wissensmanagement in der.

Bioinformatik. Profilalignment und PSI Blast Center-Star Verfahren Progressives MSA CLUSTAL W. Ulf Leser Wissensmanagement in der. Bioinformatik Profilalignment und PSI Blast Center-Star Verfahren Progressives MS CLUSTL W Ulf Leser Wissensmanagement in der Bioinformatik Definition Bisher Immer Vergleich zweier Strings Jetzt Multipler

Mehr

Welche Alignmentmethoden haben Sie bisher kennengelernt?

Welche Alignmentmethoden haben Sie bisher kennengelernt? Welche Alignmentmethoden haben Sie bisher kennengelernt? Was heißt optimal? Optimal = die wenigsten Mutationen. Sequenzen bestehen aus Elementen (z.b. Aminosäuren oder Nukleotide). Edit Distanzen sind

Mehr

Klausur Bioinformatik für Biotechnologen

Klausur Bioinformatik für Biotechnologen Name, Vorname: 1 Klausur Bioinformatik für Biotechnologen Studiengang Molekulare Biotechnologie TU Dresden WS 2011/2012 Prof. Michael Schroeder 15.02.2012 Die Dauer der Klausur beträgt 90 Minuten. Bitte

Mehr

Bioinformatik für Biochemiker

Bioinformatik für Biochemiker Bioinformatik für Biochemiker Oliver Kohlbacher WS 2009/2010 9. Multiples Alignment II Abt. Simulation biologischer Systeme WSI/ZBIT, Eberhard Karls Universität Tübingen Übersicht T-COFFEE Probleme bei

Mehr

Bioinformatik für Lebenswissenschaftler

Bioinformatik für Lebenswissenschaftler Bioinformatik für Lebenswissenschaftler Oliver Kohlbacher, Steffen Schmidt SS 2010 06. Paarweises Alignment Teil II Abt. Simulation biologischer Systeme WSI/ZBIT, Eberhard Karls Universität Tübingen Übersicht

Mehr

Bioinformatik für Lebenswissenschaftler

Bioinformatik für Lebenswissenschaftler Bioinformatik für Lebenswissenschaftler Oliver Kohlbacher, Steffen Schmidt SS 2010 09. Multiples Alignment I Abt. Simulation biologischer Systeme WSI/ZBIT, Eberhard Karls Universität Tübingen Übersicht

Mehr

Algorithmen auf Sequenzen Paarweiser Sequenzvergleich: Alignments

Algorithmen auf Sequenzen Paarweiser Sequenzvergleich: Alignments Algorithmen auf Sequenzen Paarweiser Sequenzvergleich: Alignments Sven Rahmann Genominformatik Universitätsklinikum Essen Universität Duisburg-Essen Universitätsallianz Ruhr Einführung Bisher: Berechnung

Mehr

Bioinformatik für Biochemiker

Bioinformatik für Biochemiker Bioinformatik für Biochemiker Oliver Kohlbacher WS 2009/2010 9. Multiples Alignment II Abt. Simulation biologischer Systeme WSI/ZBIT, Eberhard Karls Universität Tübingen Übersicht T-OFFEE Probleme bei

Mehr

Problemseminar. Multiple alignment by sequence annealing. Ariel S. Schwartz and Lior Pachter

Problemseminar. Multiple alignment by sequence annealing. Ariel S. Schwartz and Lior Pachter Problemseminar Multiple alignment by sequence annealing Ariel S. Schwartz and Lior Pachter 0.Gliederung 1.Alignment posets Gliederung 1. Einführung 2. Alignment Posets 1. Einführung Progressives Alignment

Mehr

Algorithmische Anwendungen WS 2005/2006

Algorithmische Anwendungen WS 2005/2006 Algorithmische Anwendungen WS 2005/2006 Sequenzalignment Gruppe F_lila_Ala0506 Allal Kharaz Yassine ELassad Inhaltsverzeichnis 1 Problemstellungen...................................... 3 1.1 Rechtschreibkorrektur...............................

Mehr

Vorlesung Einführung in die Bioinformatik

Vorlesung Einführung in die Bioinformatik Vorlesung Einführung in die Bioinformatik Dr. Stephan Weise 04.04.2016 Einführung Gegeben: zwei Sequenzen Gesucht: Ähnlichkeit quantitativ erfassen Entsprechungen zwischen einzelnen Bausteinen beider Sequenzen

Mehr

Studiengang Informatik der FH Gießen-Friedberg. Sequenz-Alignment. Jan Schäfer. WS 2006/07 Betreuer: Prof. Dr. Klaus Quibeldey-Cirkel

Studiengang Informatik der FH Gießen-Friedberg. Sequenz-Alignment. Jan Schäfer. WS 2006/07 Betreuer: Prof. Dr. Klaus Quibeldey-Cirkel Studiengang Informatik der FH Gießen-Friedberg Sequenz-Alignment Jan Schäfer WS 2006/07 Betreuer: Prof. Dr. Klaus Quibeldey-Cirkel Überblick Einführung Grundlagen Wann ist das Merkmal der Ähnlichkeit erfüllt?

Mehr

Sequenzvergleiche ohne Alignments durch lokales Dekodieren von Sequenzen

Sequenzvergleiche ohne Alignments durch lokales Dekodieren von Sequenzen durch lokales Dekodieren von Sequenzen (16. Juli 2007) Inhalt 1 Grundidee 2 Naiver Algorithmus Definitionen Lokales N-Dekodieren Ermittlung der Distanzmatrix Aussagefähigkeit der Distanzen 3 Verbesserungen

Mehr

Bioinformatik Für Biophysiker

Bioinformatik Für Biophysiker Bioinformatik Für Biophysiker Sommersemester 2009 Silke Trißl / Ulf Leser Wissensmanagement in der Bioinformatik Wissensmanagement in der Bioinformatik Schwerpunkte Algorithmen der Bioinformatik Management

Mehr

Einführung in die Angewandte Bioinformatik: Algorithmen und Komplexität; Multiples Alignment und

Einführung in die Angewandte Bioinformatik: Algorithmen und Komplexität; Multiples Alignment und Einführung in die Angewandte Bioinformatik: Algorithmen und Komplexität; Multiples Alignment 04.06.2009 und 18.06.2009 Prof. Dr. Sven Rahmann 1 Zwischenspiel: Algorithmik Bisher nebenbei : Vorstellung

Mehr

Dot-Matrix Methode. (Java) (Javascript) 80

Dot-Matrix Methode.  (Java)   (Javascript) 80 Dot-Matrix Methode Vergleich zweier Sequenzen (DNA oder Aminosäuren) Idee: gleiche Basen (Aminosäuren) in x-y Diagramm markieren Sequenz 1: ADRWLVKQN Sequenz 2: ADKFIVRDE http://myhits.vital-it.ch/cgi-bin/dotlet

Mehr

V3 - Multiples Sequenz Alignment und Phylogenie

V3 - Multiples Sequenz Alignment und Phylogenie V3 - Multiples Sequenz Alignment und Phylogenie Literatur: Kapitel 4 in Buch von David Mount Thioredoxin-Beispiel heute aus Buch von Arthur Lesk Softwarewerkzeuge der Bioinformatik 1 Leitfragen für V3

Mehr

Algorithmen für paarweise Sequenz-Alignments. Katharina Hembach

Algorithmen für paarweise Sequenz-Alignments. Katharina Hembach Proseminar Bioinformatik WS 2010/11 Algorithmen für paarweise Sequenz-Alignments Katharina Hembach 06.12.2010 1 Einleitung Paarweise Sequenz-Alignments spielen in der Bioinformatik eine wichtige Rolle.

Mehr

Bioinformatik. BLAT: Datenbanksuche für sehr ähnliche Sequenzen Multiples Sequenzalignment. Silke Trißl / Ulf Leser Wissensmanagement in der

Bioinformatik. BLAT: Datenbanksuche für sehr ähnliche Sequenzen Multiples Sequenzalignment. Silke Trißl / Ulf Leser Wissensmanagement in der Bioinformatik BLAT: Datenbanksuche für sehr ähnliche Sequenzen Multiples Sequenzalignment Silke Trißl / Ulf Leser Wissensmanagement in der Bioinformatik Hintergrund Schon öfters angesprochen... Ähnlichkeitsmatrizen,

Mehr

UAufgabe 12: (evolutiv konservierte Aminosäuren)

UAufgabe 12: (evolutiv konservierte Aminosäuren) UAufgabe 12: (evolutiv konservierte Aminosäuren) Aufgabenstellung Wählen Sie zur Darstellung evolutiv konservierter Aminosäure-Positionen in "1lla" eine ihnen sinnvoll erscheinende Anfärbung. Exportieren

Mehr

Bioinformatik für Lebenswissenschaftler

Bioinformatik für Lebenswissenschaftler Bioinformatik für Lebenswissenschaftler Oliver Kohlbacher, Steffen Schmidt SS 2010 11. Hiden Markov Models & Phylogenien Abt. Simulation biologischer Systeme WSI/ZBIT, Eberhard Karls Universität Tübingen

Mehr

Bioinformatik für Lebenswissenschaftler

Bioinformatik für Lebenswissenschaftler Bioinformatik für Lebenswissenschaftler Oliver Kohlbacher, Steffen Schmidt SS 2010 11. Hiden Markov Models & Phylogenien Abt. Simulation biologischer Systeme WSI/ZBIT, Eberhard Karls Universität Tübingen

Mehr

BCDS Seminar. Protein Tools

BCDS Seminar. Protein Tools BCDS Seminar Protein Tools Gliederung Nützliche Tools Three-/one-letter Amino Acids' Сodes RandSeq Random Protein Sequence Generator Protein Colourer ProtParam PeptideCutter ProtScale TMHMM Server 2.0

Mehr

Einführung in die Angewandte Bioinformatik: Multiples Alignment und Phylogenetik

Einführung in die Angewandte Bioinformatik: Multiples Alignment und Phylogenetik Einführung in die Angewandte Bioinformatik: Multiples Alignment und Phylogenetik 04.06.2009 Prof. Dr. Sven Rahmann 1 Bisher: Paarweise Alignments Optimales Alignment: Alignment mit höchstem Score unter

Mehr

Gleichheit, Ähnlichkeit, Homologie

Gleichheit, Ähnlichkeit, Homologie Gleichheit, Ähnlichkeit, Homologie Identität (identity) Verhältnis der Anzahl identischer Aminosäuren zur Gesamtzahl der Aminosäuren; objektiv Ähnlichkeit (similarity) Verhältnis ähnlicher Aminosäuren

Mehr

Genannotation bei Prokaryoten

Genannotation bei Prokaryoten Genannotation bei Prokaryoten Maike Tech Abt. Bioinformatik Institut für Mikrobiologie und Genetik (IMG) Universität Göttingen 28. November 2005 Genetik von Pro- und Eukaryoten Eukaryoten Prokaryoten Zellkern

Mehr

Algorithmische Bioinformatik

Algorithmische Bioinformatik Algorithmische Bioinformatik Effiziente Berechnung des Editabstands Dynamische Programmierung Ulf Leser Wissensmanagement in der Bioinformatik Inhalt dieser Vorlesung Rekursive Definition des Editabstands

Mehr

Protokoll Versuch D2 Bioinformatik

Protokoll Versuch D2 Bioinformatik Protokoll Versuch D2 Bioinformatik Gruppe 8 Susanne Duncker und Friedrich Hahn Identifizierung des zu untersuchenden Proteins Unsere Gruppe untersuchte in diesem Versuch die Proteinsequenz GENVKIPVAIKEL.

Mehr

Einführung in die Bioinformatik

Einführung in die Bioinformatik Einführung in die Bioinformatik SS 2013 1. Was ist Bioinformatik? Kay Nieselt Integrative Transkriptomik Zentrum für Bioinformatik Tübingen Kay.Nieselt@uni-tuebingen.de Ablauf und Formales Ringvorlesung

Mehr

MBI: Sequenz-Vergleich mit Alignment

MBI: Sequenz-Vergleich mit Alignment MBI: Sequenz-Vergleich mit Alignment Bernhard Haubold 28. Oktober 2014 Wiederholung: Was ist Bioinformatik? Historische Übersicht; CABIOS Bioinformatics Gemeinsames Thema: Information in vivo DNA Epigenetik

Mehr

VL Algorithmische BioInformatik (19710) WS2013/2014 Woche 3 - Montag

VL Algorithmische BioInformatik (19710) WS2013/2014 Woche 3 - Montag VL Algorithmische BioInformatik (19710) WS2013/2014 Woche 3 - Montag Tim Conrad AG Medical Bioinformatics Institut für Mathematik & Informatik, Freie Universität Berlin Vorlesungsthemen Part 1: Background

Mehr

Einführung in die Angewandte Bioinformatik: Proteinsequenz-Datenbanken

Einführung in die Angewandte Bioinformatik: Proteinsequenz-Datenbanken Einführung in die Angewandte Bioinformatik: Proteinsequenz-Datenbanken 14.05.2009 Prof. Dr. Sven Rahmann 1 3 Proteinsequenz-Datenbanksysteme NCBI Entrez Proteins EBI SRS Proteins UniProt (empfohlen) 2

Mehr

Alignments & Datenbanksuchen

Alignments & Datenbanksuchen WS2015/2016 Genomforschung und Sequenzanalyse - Einführung in Methoden der Bioinformatik- Thomas Hankeln Alignments & Datenbanksuchen 1 break-thru Doolittle et al. 1983, Waterfield et al. 1983 > DB-Suche...

Mehr

Bioinformatik. Multiple Sequence Alignment Sum-of-pairs Score. Ulf Leser Wissensmanagement in der. Bioinformatik

Bioinformatik. Multiple Sequence Alignment Sum-of-pairs Score. Ulf Leser Wissensmanagement in der. Bioinformatik Bioinformatik Multiple Sequence Alignment Sum-of-pairs Score Ulf Leser Wissensmanagement in der Bioinformatik Quasar Grundidee Search-Phase sucht Regionen mit Länge w und hoher Ähnlichkeit D.h. Regionen

Mehr

Algorithmische Bioinformatik

Algorithmische Bioinformatik FREIE UNIVERSITÄT BERLIN Fachbereich Mathematik und Informatik Institut für Informatik (WE 3) FU BERLIN Freie Universität Berlin FB Mathematik und Informatik, Institut für Informatik, Takustr. 9, D-14195

Mehr

Softwarewerkzeuge der Bioinformatik

Softwarewerkzeuge der Bioinformatik Bioinformatik Wintersemester 2006/2007 Tutorial 2: paarweise Sequenzaligments BLAST Tutorial 2: BLAST 1/22 Alignment Ausrichten zweier oder mehrerer Sequenzen, um: ihre Ähnlichkeit quantitativ zu erfassen

Mehr

MOL.504 Analyse von DNA- und Proteinsequenzen. Modul 2 BLAST-Sequenzsuche und Sequenzvergleiche

MOL.504 Analyse von DNA- und Proteinsequenzen. Modul 2 BLAST-Sequenzsuche und Sequenzvergleiche MOL.504 Analyse von DNA- und Proteinsequenzen Modul 2 BLAST-Sequenzsuche und Sequenzvergleiche Summary Modul 1 - Datenbanken Wo finde ich die DNA Sequenz meines Zielgens? Wie erhalte ich Info aus der DNA-Datenbank

Mehr

Einführung in die Bioinformatik

Einführung in die Bioinformatik Einführung in die Bioinformatik SS 2014 1. Was ist Bioinformatik? Kay Nieselt Integrative Transkriptomik Zentrum für Bioinformatik Tübingen Kay.Nieselt@uni-tuebingen.de Ablauf und Formales Ringvorlesung

Mehr

Algorithmische Bioinformatik

Algorithmische Bioinformatik Algorithmische Bioinformatik Substitutionsmatrizen Ulf Leser Wissensmanagement in der Bioinformatik Ziele Ein sehr kleiner Einblick in Evolutionsgenetik Kenntnis einer typischen realen bioinformatischen

Mehr

Übung 1 Bioinformatik. Ihre Namen:

Übung 1 Bioinformatik. Ihre Namen: Evolutionsbiologie 2 Übung 1 Bioinformatik WS2018/2019 Ihre Namen: llgemeine Hinweise: Für die Zulassung zur Klausur muss dieses Übungsblatt bearbeitet und als bestanden bewertet sein. Sie können das Übungsblatt

Mehr

Praktikum Algorithmischen Anwendungen WS 2006/07 Bioinformatik Sequence-Aligment Team C rot Ala0607

Praktikum Algorithmischen Anwendungen WS 2006/07 Bioinformatik Sequence-Aligment Team C rot Ala0607 Praktikum Algorithmischen Anwendungen WS 2006/07 Bioinformatik Sequence-Aligment Team C rot Ala0607 Blöink, Frank 11038619 ai600@gm.fh-koeln.de Wolters, Benjamin 11037092 ai651@gm.fh-koeln.de 26. Januar

Mehr

Hidden Markov Model (HMM)

Hidden Markov Model (HMM) Hidden Markov Model (HMM) Kapitel 1 Spezialvorlesung Modul 10-202-2206 (Fortgeschrittene Methoden in der Bioinformatik) Jana Hertel Professur für Bioinformatik Institut für Informatik Universität Leipzig

Mehr

Aufgabenblatt 4. Silke Trißl Wissensmanagement in der Bioinformatik

Aufgabenblatt 4. Silke Trißl Wissensmanagement in der Bioinformatik Aufgabenblatt 4 Silke Trißl Wissensmanagement in der Bioinformatik Zuerst! FRAGEN? Silke Trißl: Bioinformatik für Biophysiker 2 Exercise 1 Global alignment using dynamic programming Write a program to

Mehr

FOLDALIGN und sein Algorithmus. Nadine Boley Silke Szymczak

FOLDALIGN und sein Algorithmus. Nadine Boley Silke Szymczak FOLDALIGN und sein Algorithmus Nadine Boley Silke Szymczak Gliederung 2 Einleitung Motivation des Ansatzes zu FOLDALIGN Sankoff-Algorithmus Globales Alignment Zuker-Algorithmus Kombination FOLDALIGN Algorithmus,

Mehr

Alignments & Datenbanksuchen

Alignments & Datenbanksuchen WS2016/2017 F1-Praktikum Genomforschung und Sequenzanalyse: Einführung in Methoden der Bioinformatik Thomas Hankeln Alignments & Datenbanksuchen 1 Wiederholung Alignments Dynamic Programming Needleman-Wunsch:

Mehr

Algorithmische Bioinformatik

Algorithmische Bioinformatik FREIE UNIVERSITÄT BERLIN Fachbereich Mathematik und Informatik Institut für Informatik (WE 3) FU BERLIN Freie Universität Berlin FB Mathematik und Informatik, Institut für Informatik, Takustr. 9, D-14195

Mehr

Übung 6: Structure Comparison 1

Übung 6: Structure Comparison 1 Andrew Torda Björn Hansen Zentrum für Bioinformatik Übung zur Vorlesung Grundlagen der Strukturanalyse Wintersemester 2016/2017 12.12.2016 Übung 6: Structure Comparison 1 1. Einführung In der vorliegenden

Mehr

Algorithmen auf Sequenzen

Algorithmen auf Sequenzen Algorithmen auf Sequenzen Vorlesung von Prof. Dr. Sven Rahmann im Sommersemester 2008 Kapitel 6 Alignments Webseite zur Vorlesung http://ls11-www.cs.tu-dortmund.de/people/rahmann/teaching/ss2008/algorithmenaufsequenzen

Mehr

Einführung in die Bioinformatik Algorithmen zur Sequenzanalyse

Einführung in die Bioinformatik Algorithmen zur Sequenzanalyse Einführung in die Bioinformatik Algorithmen zur Sequenzanalyse!! Vorläufige Fassung, nur einzelne Abschnitte!!!! Enthält wahrscheinlich noch viele Fehler!!!! Wird regelmäßig erweitert und verbessert!!

Mehr

Anwendungen von HMM. Kapitel 1 Spezialvorlesung Modul (Fortgeschrittene Methoden in der Bioinformatik) Jana Hertel

Anwendungen von HMM. Kapitel 1 Spezialvorlesung Modul (Fortgeschrittene Methoden in der Bioinformatik) Jana Hertel Anwendungen von HMM Kapitel 1 Spezialvorlesung Modul 10-202-2206 (Fortgeschrittene Methoden in der Bioinformatik) Jana Hertel Professur für Bioinformatik Institut für Informatik Universität Leipzig Machine

Mehr

Bezeichnung Sequenz Verwendung

Bezeichnung Sequenz Verwendung 8 ANHANG i 8 ANHANG I Oligonukleotide Bezeichnung Sequenz Verwendung D256 5 -ATGGCAGACGGTGAGGATATTCA-3 5 Aktin AC1 (neu) D257 5 -GCCTTTGCAATCCACATCTGTTG-3 3 Aktin AC2 (neu) D98 5 -AT CC ATG GCA ATG TCA

Mehr

Sequenzvergleich und Datenbanksuche

Sequenzvergleich und Datenbanksuche Sequenzvergleich und Datenbanksuche Vorlesung Einführung in die Angewandte Bioinformatik Prof. Dr. Sven Rahmann Webseite zur Vorlesung http://bioinfo.wikidot.com/ Sprechstunde Mo 16-17 in OH14, R214 Sven.Rahmann

Mehr

Einführung in die Angewandte Bioinformatik: Sequenzähnlichkeit, Alignment, BLAST

Einführung in die Angewandte Bioinformatik: Sequenzähnlichkeit, Alignment, BLAST Einführung in die Angewandte Bioinformatik: Sequenzähnlichkeit, Alignment, BLAST 28.05.2009 Prof. Dr. Sven Rahmann 1 Sequenzvergleich: Motivation Hat man bereits die DNA-Sequenz eines Gens, oder die Aminosäuresequenz

Mehr

Alignments & Datenbanksuchen

Alignments & Datenbanksuchen WS2017/2018 Genomforschung und Sequenzanalyse - Einführung in Methoden der Bioinformatik- Thomas Hankeln Alignments & Datenbanksuchen 1 break-thru Doolittle et al. 1983, Waterfield et al. 1983 > DB-Suche...

Mehr

Bioinformatik: Neue Paradigmen in der Forschung

Bioinformatik: Neue Paradigmen in der Forschung Bioinformatik: Neue Paradigmen in der Forschung Sommerakademie der Studienstiftung St. Johann, 1.-14.9.2002 Leitung: Proff. Ernst W. Mayr & Rolf Backofen Thema 4: Paarweises und multiples (heuristisches)

Mehr

Algorithmische Bioinformatik

Algorithmische Bioinformatik Algorithmische Bioinformatik Einführung in die Phylogenie (lat.: phylum = Stamm) Ulf Leser Wissensmanagement in der Bioinformatik Suche mit MSA Erinnerung: Erzeugung von Proteinfamilien Starte mit Proteinen

Mehr

Bioinformatik. BLAST Basic Local Alignment Search Tool. Ulf Leser Wissensmanagement in der. Bioinformatik

Bioinformatik. BLAST Basic Local Alignment Search Tool. Ulf Leser Wissensmanagement in der. Bioinformatik Bioinformatik BLAST Basic Local Alignment Search Tool Ulf Leser Wissensmanagement in der Bioinformatik Praktikum Anmeldung bis 10.02.2004 bei Silke Trißl (trissl@informatik.hu-berlin.de) Name, Vorname

Mehr

Bioinformatik Für Biophysiker

Bioinformatik Für Biophysiker Bioinformatik Für Biophysiker Wintersemester 2005 / 2006 Ulf Leser Wissensmanagement in der Bioinformatik Wissensmanagement in der Bioinformatik Lehrstuhl seit 10/2002 Schwerpunkte Algorithmen der Bioinformatik

Mehr

Allgemeine Aufgabenstellung. Ziele

Allgemeine Aufgabenstellung. Ziele Allgemeine Aufgabenstellung Sie (s)wollen die Phylogenie der Vertebraten mit Hilfe molekulare Daten ergründen. Insbesondere interessiert Sie die Verwandtschaft der Primaten; aber auch tiefere Verzweigungen

Mehr

Sequenzen-Alignierung in der Bioinformatik

Sequenzen-Alignierung in der Bioinformatik Sequenzen-Alignierung in der Bioinformatik VO Algorithm Engineering Professor Dr. Petra Mutzel Lehrstuhl für Algorithm Engineering, LS 2. VO 2.0.2006 Literatur für diese VO Volker Heun: Skriptum zur Vorlesung

Mehr

Bioinformatik. Methoden zur Vorhersage vo n RNA- und Proteinstrukture n. Gerhard Steger

Bioinformatik. Methoden zur Vorhersage vo n RNA- und Proteinstrukture n. Gerhard Steger Bioinformatik Methoden zur Vorhersage vo n RNA- und Proteinstrukture n Gerhard Steger Vorwort ix Strukturvorhersage von Nukleinsäuren 1 Struktur und Funktion von RNA 3 1.1 RNA-Struktur fl 1.2 Thermodynamik

Mehr

7. Anhang. 7. Anhang. Abbildung 7.1: Aminosäuresequenz AtMYC2 im Wildtyp und in jin1. Unterschiede zwischen den Sequenzen sind rot unterlegt.

7. Anhang. 7. Anhang. Abbildung 7.1: Aminosäuresequenz AtMYC2 im Wildtyp und in jin1. Unterschiede zwischen den Sequenzen sind rot unterlegt. 7. Anhang 10 20 30 40 50 60 70 80 90 100 jin1 MTDYRLQPTMNLWTTDDNASMMEAFMSSSDISTLWPPASTTTTTATTETTPTPAMEIPAQAGFNQETLQQRLQALIEGTHEGWTYAIFWQPSYDFSGASV AtMYC2 MTDYRLQPTMNLWTTDDNASMMEAFMSSSDISTLWPPASTTTTTATTETTPTPAMEIPAQAGFNQETLQQRLQALIEGTHEGWTYAIFWQPSYDFSGASV

Mehr

...-Arg-Met-Phe-Ala-Asn-His-Lys-Ser-Val-Gly-...

...-Arg-Met-Phe-Ala-Asn-His-Lys-Ser-Val-Gly-... 1. Im Enzym Xase, das aus einer Polypeptidkette aus 300 Aminosäuren besteht, findet sich in der Region der Aminosäuren 40-50 die folgende Aminosäurensequenz:...-Arg-Met-Phe-Ala-Asn-His-Lys-Ser-Val-Gly-...

Mehr