Homologie und Sequenzähnlichkeit. Prof. Dr. Antje Krause FH Bingen 06721 / 409 253 akrause@fh-bingen.de



Ähnliche Dokumente
Evolution & Genetik (Beispiel Hämoglobin) Prof. Dr. Antje Krause FH Bingen / akrause@fh-bingen.de

Alignment-Verfahren zum Vergleich biologischer Sequenzen

Erfahrungen mit Hartz IV- Empfängern

Blumen-bienen-Bären Academy. Kurzanleitung für Google Keyword Planer + Google Trends

Bioinformatik: Hype oder Hoffnung?

Grundlagen der Theoretischen Informatik, SoSe 2008

1 topologisches Sortieren

1. Man schreibe die folgenden Aussagen jeweils in einen normalen Satz um. Zum Beispiel kann man die Aussage:

Zeichen bei Zahlen entschlüsseln

Stellen Sie bitte den Cursor in die Spalte B2 und rufen die Funktion Sverweis auf. Es öffnet sich folgendes Dialogfenster

Sich einen eigenen Blog anzulegen, ist gar nicht so schwer. Es gibt verschiedene Anbieter. ist einer davon.

Erstellen einer GoTalk-Auflage

Windows 10. Vortrag am Fleckenherbst Bürgertreff Neuhausen.

Abituraufgabe zur Stochastik, Hessen 2009, Grundkurs (TR)

Programmierkurs Java

Biologie I/B: Klassische und molekulare Genetik, molekulare Grundlagen der Entwicklung Theoretische Übungen SS 2014

Binäre Bäume. 1. Allgemeines. 2. Funktionsweise. 2.1 Eintragen

Regeln für das Qualitäts-Siegel

Würfelt man dabei je genau 10 - mal eine 1, 2, 3, 4, 5 und 6, so beträgt die Anzahl. der verschiedenen Reihenfolgen, in denen man dies tun kann, 60!.

Der Kalender im ipad

trivum Multiroom System Konfigurations- Anleitung Erstellen eines RS232 Protokolls am Bespiel eines Marantz SR7005

a n auf Konvergenz. Berechnen der ersten paar Folgenglieder liefert:

V 2 B, C, D Drinks. Möglicher Lösungsweg a) Gleichungssystem: 300x y = x + 500y = 597,5 2x3 Matrix: Energydrink 0,7 Mineralwasser 0,775,

Lehrer: Einschreibemethoden

Das Leitbild vom Verein WIR

Zahlenmauern. Dr. Maria Koth. Ausgehend von dieser einfachen Bauvorschrift ergibt sich eine Vielzahl an möglichen Aufgabenstellungen.

teischl.com Software Design & Services e.u. office@teischl.com

Bedienungsanleitung. Matthias Haasler. Version 0.4. für die Arbeit mit der Gemeinde-Homepage der Paulus-Kirchengemeinde Tempelhof

Leichte-Sprache-Bilder

my.ohm Content Services Autorenansicht Rechte

ACDSee 10. ACDSee 10: Fotos gruppieren und schneller durchsuchen. Was ist Gruppieren? Fotos gruppieren. Das Inhaltsverzeichnis zum Gruppieren nutzen

Lineargleichungssysteme: Additions-/ Subtraktionsverfahren

Um zusammenfassende Berichte zu erstellen, gehen Sie folgendermaßen vor:

Die Invaliden-Versicherung ändert sich

SAMMEL DEINE IDENTITÄTEN::: NINA FRANK :: :: WINTERSEMESTER 08 09

Was meinen die Leute eigentlich mit: Grexit?

Erstellen von x-y-diagrammen in OpenOffice.calc

Information Systems Engineering Seminar

Step by Step Webserver unter Windows Server von Christian Bartl

Professionelle Seminare im Bereich MS-Office

Abschlussprüfung Realschule Bayern II / III: 2009 Haupttermin B 1.0 B 1.1

Gründe für fehlende Vorsorgemaßnahmen gegen Krankheit

Anleitung für die Teilnahme an den Platzvergaben "Studio II, Studio IV und Studio VI" im Studiengang Bachelor Architektur SS15

Anleitung für die Registrierung und das Einstellen von Angeboten

1. Einführung Erstellung einer Teillieferung Erstellung einer Teilrechnung 6

Satzhilfen Publisher Seite Einrichten

Einrichten eines HBCI- Zugangs mit Bank X 5.1

Klausur zum Modul Molekularbiologie ILS, SS 2010 Freitag 6. August 10:00 Uhr

Öffnen Sie die Albelli Gestaltungssoftware

PowerPoint: Text. Text

Technische Analyse der Zukunft

40-Tage-Wunder- Kurs. Umarme, was Du nicht ändern kannst.

Whitepaper. Produkt: combit Relationship Manager 7. combit Relationship Manager -rückläufer Script. combit GmbH Untere Laube Konstanz

Anleitung über den Umgang mit Schildern

Berechnungen in Access Teil I

Fachdidaktik der Informatik Jörg Depner, Kathrin Gaißer

Easy-Monitoring Universelle Sensor Kommunikations und Monitoring Plattform

Professionelle Seminare im Bereich MS-Office

Handbuch ECDL 2003 Basic Modul 5: Datenbank Grundlagen von relationalen Datenbanken

4. Mathematik Olympiade 2. Stufe (Kreisolympiade) Klasse 8 Saison 1964/1965 Aufgaben und Lösungen

Primzahlen und RSA-Verschlüsselung

Dr. Guido Schwarz Forschung, Schulung, Beratung; A Wien, Edelhofgasse 31/8; Tel: Mobil:

Family Safety (Kinderschutz) einrichten unter Windows 8

DAUERHAFTE ÄNDERUNG VON SCHRIFTART, SCHRIFTGRÖßE

Eine der Aktien hat immer einen höheren Gewinn als die andere Aktie. Ihre Aufgabe ist es diese auszuwählen.

2. Schönheitsoperationen. Beauty S Lifestyle Lifestyle

Beweis des Satzes, dass eine einwerthige mehr als 2nfach periodische Function von n Veränderlichen unmöglich ist. Bernhard Riemann

Inhaltsverzeichnis. 1. Empfängerübersicht / Empfänger hinzufügen 2. Erstellen eines neuen Newsletters / Mailings 3. Versand eines Newsletters

Informationen zum Ambulant Betreuten Wohnen in leichter Sprache

1 Mathematische Grundlagen

CSS-Grundlagen. Etwas über Browser. Kapitel. Die Vorbereitung

4.1 Wie bediene ich das Webportal?

Erstellen einer digitalen Signatur für Adobe-Formulare

Händlerschutz deckt auf

Rationale Zahlen. Weniger als Nichts? Ist Null nichts?

Einrichten eines Postfachs mit Outlook Express / Outlook bis Version 2000

Mit der Maus im Menü links auf den Menüpunkt 'Seiten' gehen und auf 'Erstellen klicken.

WS 2013/14. Diskrete Strukturen

PSRDesigner. Punkt und Streifenrasterplatinen Designer

Eine Logikschaltung zur Addition zweier Zahlen

Online-Werbung. Welche Möglichkeiten der Online-Annoncen gibt es? Google AdWords und Co.

Programm 4: Arbeiten mit thematischen Karten

Gibt es einen Geschmacksunterschied zwischen Coca Cola und Cola Zero?

MuP-Arbeitshilfen. Kreativität organisieren Der innovative Prozess. Problem-Phase

Benutzerkonto unter Windows 2000

Spielanleitung. Art.-Nr.: Spieleautoren: Arno Steinwender und Christoph Puhl

15.3 Bedingte Wahrscheinlichkeit und Unabhängigkeit

Printserver und die Einrichtung von TCP/IP oder LPR Ports

50. Mathematik-Olympiade 2. Stufe (Regionalrunde) Klasse Lösung 10 Punkte

Informationsblatt Induktionsbeweis

FH-SY Chapter Version 3 - FH-SY.NET - FAQ -

Was man mit dem Computer alles machen kann

Animationen erstellen

Anleitung für Kunden zum Umgang mit verschlüsselten s von der LASA Brandenburg GmbH

Wichtige Information zur Verwendung von CS-TING Version 9 für Microsoft Word 2000 (und höher)

Sudoku-Informatik oder wie man als Informatiker Logikrätsel löst

Konzepte der Informatik

Übungsblatt: Protein interaction networks. Ulf Leser and Samira Jaeger

Transkript:

Homologie und Sequenzähnlichkeit Prof. Dr. Antje Krause FH Bingen 06721 / 409 253 akrause@fh-bingen.de

Homologie Verwandtschaft aufgrund gleicher Abstammung basiert auf Speziation (Artbildung): aus einer Spezies werden zwei Spezies Duplikation (z.b. durch ungleiches Crossing over): aus einem Gen werden zwei zunächst identische Gene im Genom 2

Warum sucht man nach Homologien? Funktionsbestimmung unbekannter Gene / Proteine Informationsgewinn Grundlage phylogenetischer / evolutionärer Analysen Vorhersage der räumlichen Proteinstruktur Vergleich von Stoffwechselwegen verschiedener Spezies... 3

Wie lässt sich Homologie messen? Eigentlich gar nicht! gemeinsame Abstammung lässt sich nicht beweisen, da der gemeinsame Vorfahre ausgestorben ist Ähnlichkeit von Sequenzen ist jedoch ein guter Hinweis auf Homologie Proteine mit gleicher oder ähnlicher Funktion haben (meist) auch ähnliche Sequenzen und umgekehrt 4

Proteindomänen 5

Sequenzähnlichkeit homologe Proteinsequenzen (von oben nach unten) von: Mensch, Maus, Ratte, Zitterrochen, Seeigel, Fruchtfliege, Geißeltierchen und Hefe 6

Sequenzähnlichkeit Sequenzen verändern sich über die Zeit obwohl sich Sequenzen verändern, können Struktur und Funktion eines Proteins erhalten bleiben Aminosäuren können durch andere Aminosäuren im Protein ersetzt werden, sofern diese ähnliche physikalisch-chemische Eigenschaften haben Sequenzähnlichkeit wird z.b. gemessen als %Identität oder als Alignmentscore 7

Sequenzvergleich Sequenzen verändern sich durch Punktmutationen (Substitution, Replacement) Deletion Insertion Die Levenshtein-Distanz (oder Edit-Distanz) gibt an, wieviele Veränderungen nötig sind, um eine Sequenz in eine andere Sequenz umzuwandeln KREIS REIS EIS ECS ECK ECKE Deletion (K), Deletion (R), Substitution (I C), Substitution (S K), Insertion (E) 8

Alignment = Anordnung, Ausrichtung Darstellungsform für Veränderungen z.b. K R E I S - - - E C K E 1+1+0+1+1+1 = 5 Veränderungen z.b. mit Proteinsequenzen KTVWSKVGSHLEEYGSETLERLFVVYPSTKTYFPHF--- NSTWGKVCAKT--IGKEALGRLLWTYPWTQRYFSSFGNL z.b. mit DNA-Sequenzen AGGCCTAGCC-TTGTGACCCCTGTCCCCTGCCTTGGACC AGCTGGAGCCTCGGCGACCCCTACCC-TGGCCTGGAGCC 9

Alignements der Kelten in der Bretagne Great Linations of Ménec Carnac 1912 - P. Jousset - La France Geographie illustreé - Paris Librairie Larousse Tome 1er http://www.megalithic.co.uk/ 10

Alignments in der Bioinformatik ACGTGCCTAGCTAGA -GCTGCATAGCGA-- ACG-TGCC-TAGCTAGA --GCTGC-ATAGC--GA A-CGTGC-CTAGC-TAGA -GC-TGCA-TAGCG-A-- -ACGTGCCTAGCTAGA--- G-C-TGC--A--TAG-CGA Welches Alignment ist das Richtige? Was ist biologisch sinnvoll? Wie findet man das Alignment mit der geringsten Zahl an Veränderungen? 11

Bewertung im Alignment Aminosäuren und Nukleotide sind keine beliebigen Buchstaben Veränderungen müssen daher biologisch sinnvoll bewertet werden bei Nukleotiden z.b. Deletionen und Insertionen jeweils mit -1 bewerten und A C G T Substitutionen mit: (d.h. Transversionen mit -2 und Transitionen mit -1) A 1-2 -1-2 C -2 1-2 -1 G -1-2 1-2 T -2-1 -2 1 12

Beispielrechnungen A C G T G C C T A G C T A G A - G C T G C A T A G C G A - - -1-2-2+1+1+1-2+1+1+1+1-2+1-1-1 = -3 A C G T G C C T A G C T A G A - - G C T G C A T A G C - - G A -1-1+1-1+1+1+1-1-1+1+1+1+1-1-1+1+1 = 3 A C G T G C C T A G C T A G A - G C T G C A T A G C G A - - -1-1+1-1+1+1+1-1-1+1+1+1+1-1-1+1-1-1 = 0 Gibt es noch eine bessere Lösung? 13

Bewertung von Aminosäuren entsprechend physikalisch-chemischer Eigenschaften A R N D C E Q G H I L K M F P S T W Y V 14

Ähnlichkeitsmaß für Aminosäuren 15

Dynamische Programmierung Mathematische Grundlagen 1957 von R. Bellmann entwickelt Lösung eines Problems durch Kombinieren der Lösungen von Teilproblemen (rekursiv) Anwendbar, wenn Teilprobleme nicht unabhängig voneinander sind, d.h. wenn sie wiederum Teilprobleme gemeinsam haben Lösung jedes Teilproblems nur einmal typischerweise angewandt auf Optimierungsprobleme, d.h. auch mehrere optimale Lösungen sind möglich. 16

Dynamische Programmierung Erstellen einer n x m-matrix, mit n: Länge von Sequenz1, m: Länge von Sequenz2 Pro Feld in der Matrix gibt es drei Möglichkeiten: Insertion in Sequenz1 = Deletion in Sequenz2 Insertion in Sequenz2 = Deletion in Sequenz1 Substitution eines Zeichens in Sequenz1 durch ein (gleiches oder ungleiches) Zeichen in Sequenz2 (Mis-) Match Gap in Sequenz2 Gap in Sequenz1 Sequenz1 Sequenz2 Jeweils Auswahl der besten Möglichkeit! 17

Dynamische Programmierung jeweils Pfeile in der Matrix merken Zurückverfolgen der Pfeile (Backtracking) liefert ein optimales paarweises Alignment gibt es alternative Pfade, so gibt es mehrere optimale Ergebnisse 18

Paarweises Alignment Globales Paarweises Alignment Needleman-Wunsch(-Sellers) Algorithmus (1970/1974) Findet alle möglichen optimalen globalen Alignments zweier Sequenzen Ergebnis steht rechts unten in der Matrix Lokales Paarweises Alignment Smith-Waterman Algorithmus (1981) Findet alle möglichen optimalen lokalen Alignments zweier Sequenzen Ergebnis ist der höchste Wert in der Matrix 19

Globales Paarweises Alignment Algorithmus: NeedlemanWunsch Eingabe: Zwei Sequenzen u = u 1...u m und v = v 1...v n und Scorefunktion δ Ausgabe: Dynamic Programming Matrix S S(0,0) := 0 for i := 1 to m do S(i,0) := S(i-1,0)+δ(u i,ε) end for for j := 1 to n do S(0,j) := S(0,j-1)+δ(ε,v j ) end for for i := 1 to m do for j := 1 to n do S(i,j) := max ( S(i,j-1)+δ(ε,v j ), S(i-1,j)+δ(u i,ε), S(i-1,j-1)+δ(u i,v j )) end for end for

Beispiel: globales Alignment Bewertung: 21

Lokales Paarweises Alignment Algorithmus: SmithWaterman Eingabe: Zwei Sequenzen u = u 1...u m und v = v 1...v n und Scorefunktion δ Ausgabe: Dynamic Programming Matrix S S(0,0) := 0 for i := 1 to m do S(i,0) := 0 end for for j := 1 to n do S(0,j) := 0 end for for i := 1 to m do for j := 1 to n do S(i,j) := max ( 0, S(i,j-1) + δ(ε,v j ), S(i-1,j) + δ(u i,ε), S(i-1,j-1) + δ(u i,v j )) end for end for

Beispiel: lokales Alignment Bewertung? 23

Aufgabe: DNA-Vergleich Bewertung? 24

Aufgabe: Protein-Vergleich Sequenz 1: MGLTAHDRQLINSTW Sequenz 2: LLSADDKKHIKAI Gesucht ist ein optimales globales Alignment der Sequenzen. Bewertung Substitution: siehe Seite 15, Bewertung Deletion / Insertion: -5 25

Prof. Dr. Antje Krause Studiengang Bioinformatik Fachhochschule Bingen Berlinstr. 109 55411 Bingen am Rhein akrause@fh-bingen.de Tel: 06721/409 253 http://www.fh-bingen.de/bioinformatik.322.0.html 26