Einführung: Sequence Alignment



Ähnliche Dokumente
1.1 Grundbegriffe und Grundgesetze 29

SS 2017 Torsten Schreiber

Übungsblatt 4 - Lösung

Kennlinienaufnahme des Transistors BC170

9 Integration von Funktionen in mehreren Variablen

5. Das Finite-Element und die Formfunktion

Stephan Brumme, SST, 2.FS, Matrikelnr konvergiert und der Grenzwert 1 ist, d.h. es gilt: 1. k 1

Classical Gas. . œ# 3 2. &4 3 œ &4 4. œ œ. œ œ 1. œ 2. œ œ œ œ œ. œ œ œ. w œ œ œ œ# œ œ œ œ. œ œ. & œ œ œ œ œ œ œ w. œ œ œ œ œ# œ œ œ œ œ œ œ œ œ œ w

Lückentext (Mathematik I) zum Sommersemester 2013

Grundbildung Lineare Algebra und Analytische Geometrie (LPSI/LS-M2) SoSe C. Curilla/ B. Janssens

4. Musterlösung. Problem 1: Kreuzende Schnitte **

W08. Wärmedämmung. Q = [λ] = W m -1 K -1 (1) d Bild 1: Wärmeleitung. Physikalisches Praktikum

Wärmeübertragung. Grundsätzlich sind drei verschiedene Möglichkeiten der Wärmeübertragung möglich: Wärmeleitung, Konvektion und Strahlung:

Messen kleiner Größen

Kapitel 6: Codierung Diskreter Quellen

Polygonalisierung einer Kugel. Verfahren für die Polygonalisierung einer Kugel. Eldar Sultanow, Universität Potsdam,

12 LK Ph / Gr Elektrische Leistung im Wechselstromkreis 1/ ω Additionstheorem: 2 sin 2 2

18. Dynamisches Programmieren

Lineare Regression (1) - Einführung I -

ERP Cloud Tutorial. E-Commerce ECM ERP SFA EDI. Backup. Preise erfassen.

Methoden der innerbetrieblichen Leistungsverrechnung

G Bereitstellungsmenge des internationalen öffentlichen Umweltgutes

Wie eröffne ich als Bestandskunde ein Festgeld-Konto bei NIBC Direct?

Wie eröffne ich als Bestandskunde ein Festgeld-Konto bei NIBC Direct?

Domäne und Bereich. Relationen zwischen Mengen/auf einer Menge. Anmerkungen zur Terminologie. r Relationen auf/in einer Menge.

Informatik II. Minimalpolynome und Implikanten. Minimalpolynome. Minimalpolynome. Rainer Schrader. 27. Oktober Was bisher geschah: Definition

Institut für Technische Chemie Technische Universität Clausthal

Vorlesung. Einführung in die mathematische Sprache und naive Mengenlehre

Projekt 2HEA 2005/06 Formelzettel Elektrotechnik

QUADRATUR Numerische Integration. 9. Übungseinheit. H. Leeb Einführung in die Datenverarbeitung 2 Quadratur

Aufgaben zur Vorlesung Analysis II Prof. Dr. Holger Dette SS 2012 Lösungen zu Blatt 6

Nernstscher Verteilungssatz

1. Die Spielpartie wird vorzeitig abgebrochen.

Funktionsgleichungen folgende Funktionsgleichungen aus der Vorlesung erhält. = e

Lösungen zu Übungsaufgaben Angewandte Mathematik MST Blatt 6 Matlab

Gruppe. Lineare Block-Codes

5.6 Zwei- und mehrdimensionale Zufallsvariablen

8 Stromkreis im quasistationären Zustand

FORMELSAMMLUNG STATISTIK (I)

binäre Suchbäume Informatik I 6. Kapitel binäre Suchbäume binäre Suchbäume Rainer Schrader 4. Juni 2008 O(n) im worst-case Wir haben bisher behandelt:

Empfehlungs-Systeme. Recommender-Systeme. Buch-Recommender. Personalisierung. Kollaboratives Filtern & inhaltsbasierte Empfehlungen

Netzwerkstrukturen. Entfernung in Kilometer:

Ich habe ein Beispiel ähnlich dem der Ansys-Issue [ansys_advantage_vol2_issue3.pdf] durchgeführt. Es stammt aus dem Dokument Rfatigue.pdf.

1KOhm + - y = x LED leuchtet wenn Schalter x gedrückt ist

Funktionen und Mächtigkeiten

Grundlagen der Elektrotechnik II (GET II)

Der Satz von COOK (1971)

TECHNISCHE UNIVERSITÄT MÜNCHEN

Brüche gleichnamig machen

Einführung in die Finanzmathematik

Der schematische Aufbau einer Reibkupplung zeigt das Bild Bild 2.45 Schematischer Aufbau einer mechanischen Reibkupplung

Aufgaben und Lösungen. Vorläufige Fassung für die Homepage

Die Regelungen zu den Einsendeaufgaben (Einsendeschluss, Klausurzulassung) finden Sie in den Studien- und Prüfungsinformationen Heft Nr. 1.

Regressionsverfahren haben viele praktische Anwendungen. Die meisten Anwendungen fallen in eine der folgenden beiden Kategorien:

phil omondo phil omondo Skalierung von Organisationen und Innovationen gestalten Sie möchten mehr Preise und Leistungen Workshops und Seminare

Einführung in die Mathematik des Operations Research

Automaten und Formale Sprachen alias Theoretische Informatik. Sommersemester Sprachen. Grammatiken (Einführung)

Itemanalyse und Itemkennwerte. Itemanalyse und Itemkennwerte. Itemanalyse und Itemkennwerte: Itemschwierigkeit P i

I, U : Momentanwerte für Strom und Spannung I 0, U 0 : Scheitelwerte für Strom und Spannung

Mathematik: Mag. Schmid Wolfgang Arbeitsblatt Semester ARBEITSBLATT 15 ORTHOGONALITÄT

1 BWL 4 Tutorium V vom

Lineare Gleichungssysteme und ihre Lösung

Martens: Übungen in der Betriebswirtschaftslehre, #6 (Investitionsplanung)

Eine Menge G zusammen mit einer Verknüpfung + (+ : G x G folgende Axiome erfüllt sind:

Mathematik. Name, Vorname:

Dynamisches Programmieren

Institut für Stochastik Prof. Dr. N. Bäuerle Dipl.-Math. S. Urban

Arbeitszeit 60 Minuten Seite 1 von 5 HochschuleMünchen, FK 03 Bordnetze (Vorlesung) SS08. Name:... Vorname:... St. Grp...

Die Ausgangssituation Das Beispiel-Szenario... 14

tutorial N o 1a InDesign CS4 Layoutgestaltung Erste Schritte - Anlegen eines Dokumentes I a (Einfache Nutzung) Kompetenzstufe keine Voraussetzung

UNIVERSITÄT KARLSRUHE Institut für Analysis HDoz. Dr. P. C. Kunstmann Dipl.-Math. M. Uhl. Sommersemester 2009

Mathematik: Mag. Schmid Wolfgang Arbeitsblatt Semester ARBEITSBLATT 14 MULTIPLIKATION EINES VEKTORS MIT EINEM SKALAR

Umwandlung von endlichen Automaten in reguläre Ausdrücke

6. Übung zur Linearen Algebra II

2.6 Reduktion endlicher Automaten

18. Algorithmus der Woche Der Euklidische Algorithmus

d da B A Die gesamte Erscheinung der magnetischen Feldlinien bezeichnet man als magnetischen Fluss. = 1 V s = 1 Wb

Datenträger löschen und einrichten

4. Lineare Gleichungen mit einer Variablen

7.9A. Nullstellensuche nach Newton

Mathematik: Mag. Schmid Wolfgang Arbeitsblatt 3 5. Semester ARBEITSBLATT 3 PARAMETERDARSTELLUNG EINER GERADEN

1 Kurvendiskussion /40

nonparametrische Tests werden auch verteilungsfreie Tests genannt, da sie keine spezielle Verteilung der Daten in der Population voraussetzen

Grundlagen der makroökonomischen Analyse kleiner offener Volkswirtschaften

Terme und Formeln Komplexe Zahlen

Statistik und Wahrscheinlichkeit

Beim Wiegen von 50 Reispaketen ergaben sich folgende Gewichte X(in Gramm):

2 Rohrleitungsnetzberechnung

Fehlerrechnung für Einsteiger Eine beispielorientierte Einführung für Studierende der TUHH

Satz 6.5 (Mittelwertsatz der Integralrechnung) Sei f : [a, b] R stetig. Dann gibt es ein ξ [a, b], so dass. b a. f dx = (b a)f(ξ) f dx (b a)m.

Versicherungstechnischer Umgang mit Risiko

1. März Korrektur

Wärmedurchgang durch Rohrwände

Teilfachprüfung Mathematik Studiengang: Wirtschaft Neue Diplomprüfungsordnung (NPO)

Auswertung univariater Datenmengen - deskriptiv

Definition Suffixbaum

Bildverarbeitung Herbstsemester Bildspeicherung

HA-Lösung TA-Lösung Diskrete Strukturen Tutoraufgabenblatt 2. Besprechung in KW44

LUDWIG-MAXIMILIANS-UNIVERSITÄT MÜNCHEN. 7. Übung/Lösung Mathematik für Studierende der Biologie

Transkript:

lgorthmsche nendungen - Prktkum WS 7/8 ynmsche Progrmmerung / reedy-lgorthmen ufgen 8 - Hener Klocke Fchhochschule Köln Informtk Prktkum: ynmsche Progrmmerung / reedy-lgorthmen ufgen 8 9 ufge Kptel ynmsche Progrmmerung Kptel reedy-lgorthmen Hnes: Benutzen Se für de Softreentcklung und de okumentton ds ool Mven uf unserem Prktkumsserver. Bechten Se de Vorgen n der te pom.xml nsesondere de Benennung der Prktkumsufgen e z.b. <groupid>de.fhkoeln.nf.sysges.temnme.temnmeufge</groupid> <rtfctid>temnmeufge</rtfctid> nführung: Sequence lgnment In nendungen der Bonformtk erden ze oder mehrere N-Sequenzen verschedener Orgnsmen mtennder verglchen. n N-Strng esteht us ener Kette von Molekülen gennnt Bsen oder Nukleosde. e N-Bsen snd denn unn ytosn hymn n N-Strng knn ls Sequenz üer der Bsenmenge [ ] drgestellt erden. urch den Verglech von N-Strängen können ussgen üer de funktonelle oder de evolutonäre Verndtschft von Leeesen gemcht erden. s Zel des N-Sequenzverglechs st es somt zu entscheden e ähnlch sch ze N-Sequenzen snd. e Ähnlchket knn uf verschedene rt und Wesen defnert erden: Ze Sequenzen und snd ähnlch enn de ene Sequenz elsequenz der nderen st. Ze Sequenzen snd ähnlch enn de nzhl der Änderungen de mn enötgt um ene Sequenz n de ndere umzundeln möglchst gerng st. Fnde ene drtte Sequenz c dessen Bsen n und n vorkommen; de Bsen müssen n derselen Rehenfolge uftreten er ncht unedngt ufennder folgen. er Ähnlchketsmß em lgnment ds her verendet erden soll lutet: Schree de Sequenzen so unterennder zu schreen dss möglchst vele gleche Buchsten n ener Splte stehen und n de Sequenzen möglchst eng ps lso Lücken oder Pltzhlter engefügt erden müssen. urch ene Beertungsfunkton lgnment score rd für ede Üerenstmmung zschen den Buchstenpren der Sequenzen ene postve Punktzhl vergeen. mt en snnvolles :\doc\lgn\s78\prktkum\prk_dynpro\prktkum_kp dynmc_progrmmng.doc

ynmsche Progrmmerung / reedy lgorthmen ufgen 8 - lgnment üerhupt möglch st und d de Sequenzen oft unterschedlch lng snd dürfen Leerstellen ps n de Sequenzen engefügt erden. llerdngs rd ds nfügen von ps durch Punktzug negtve Punktzhl gp penlty estrft. s lgnment mt der höchsten Punktzhl st dnn en optmles lgnment. Bespel : - n der ersten Stelle rd en p engefügt um den Längenuntersched uszuglechen. Bespel : ne Sequenzusrchtung zschen ze menschlchen Znkfngerprotenen us der enbnk http://.nc.nlm.nh.gov/ennk/ st folgende: Quelle: mt dem System lustlw erstellt http://de.kped.org/k/lustlw Bem presen lgnment Vergleche zeer N-Sequenzen rd unterscheden zschen glolem lgnment e dem lle Symole ener Sequenz erückschtgt erden und loklem lgnment enn kene Üerenstmmung der Sequenzen uf der gesmten Länge zu errten st. ne enfche Scorng-lgnment-Funkton äre z.b. folgende: mtch: score de eden unterennder stehenden Buchsten stmmen üeren msmtch: score - kene Üerenstmmung Mutton gp: score - gp penlty "Insert or eleton" d.h. Bsen fehlen oder urden engefügt loles Sequence lgnment der Needlemn-Wunsch-lgorthmus s Verfhren enötgt ze Sequenzen und ene Mtrx der röße n m mt n len mlen. Weterhn rd ene Beertungsfunkton enötgt de ze Nukleosde verglecht und eertet. e Mtrx rd mt ener Rekursonsglechung erstellt de de ellösungen ellgnments und ds glole lgnment erechnet. Bespel : Sequenz : - -

ynmsche Progrmmerung / reedy lgorthmen ufgen 8 - - - Sequenz : e Scoremtrx zum Spechern der ellösungen rd ngelegt oe ene Zele und ene Splte hnzugefügt rd um ps zu ermöglchen. de Sequenzen und de röße hen erhlten r ene 7 7 Mtrx 7 7. e Indzerung der Zelen... n und der Splten... m egnnt egen der p-zele z. Splte e! nt ne möglche Beertungsfunkton lutet: " " en p oder flls flls flls e n der Scoremtrx gespecherten optmlen Sustrukturen snd e folgt defnert: f n f m n m Inserton eleton Msmtch Mtch z. mx e erste Zele und de erste Splte der Mtrx stehen für enen für enen Mtch ener Sequenz gegenüer ener nderen leeren Sequenz lso enem p. Mt der ogen Beertungsfunkton rd her ene p Penlty von - ngenommen. er uch ede ndere Penlty-Funkton hängg von der nendung st möglch. In der -efnton r durch ds Zechen en p ezechnet. rster Schrtt: Intlsere de Beertungsmtrx. Berechne zuerst de nträge der Mtrx für de erste Zele und de erste Splte: e Beertung für den ntrg rd erechnet us der drüer legenden Beertung - und dem Score n der Stelle. lso - - de nderen Werte erden nun nlog erechnet.

ynmsche Progrmmerung / reedy lgorthmen ufgen 8 - - - nt e erste Zele und de erste Splte snd schon komplett durchgerechnet; egentlch ürden dese Werte erst gnz m Schluss dort stehen. Zeter Schrtt: rzeuge de Beertungsmtrx von lnks oen nch rechts unten nch der Rekursonsglechung für. ndergens tte nchprüfen o es stmmt: nt mx s Mxmum entsteht us dem ersten Fll d. h. rd mt usgerchtet. mx s Mxmum entsteht us dem drtten Fll d her ds Mxmum der Berechnung nämlch entsteht d. h. en p ürde mt usgerchtet. mx

ynmsche Progrmmerung / reedy lgorthmen ufgen 8 - mx mx us. rgens: lgnment : lgnment : ufge 8 Needlemn-Wunsch-lgorthmus Schreen Se en Jv-Progrmm mt dem ds Sequence-lgnment-Prolem nch dem Needlemn-Wunsch-lgorthmus gelöst erden knn. Folgende Prmeter sollen nterktv engegeen erden:. e Sequenzen und. e Beertungsfunkton Führen Se ds Progrmm schrttese us und stellen Se nch edem Schrtt de Score- Mtrx dr. rmtteln Se us der rgensmtrx de erechnete optmle usrchtung der eden Sequenzen und und stellen Se de usrchtung dr. rklären Se genu ds Prnzp der dynmschen Progrmmerung ds her zum nstz kommt. Fertgen Se ene okumentton n. ufge 9 Smth-Wtermn-lgorthmus Implementeren Se den Smth-Wtermn-lgorthmus für lokles Sequence lgnment. Rechercheren Se selst. okumentton! - -

ynmsche Progrmmerung / reedy lgorthmen ufgen 8 - ufge Frktonles Rucksckprolem s frktonle Rucksckprolem lutet e folgt: egeen st ene Menge S von n Items. Jedes Item ht enen Wert und en echt. Wr estzen enen Rucksck den r mxml mt dem echt W pcken können. e ufge esteht nun drn den Rucksck so mt Items oder elen von Items zu pcken dss der Wert des Ruckscks mxml und de ds zulässge echt W ncht üerschrtten rd. s Prolem rd deshl frktonles Rucksckprolem gennnt el es erlut st uch ele von Items n den Rucksck zu pcken. Bem klssschen Rucksckprolem uch -- Rucksckprolem gennnt st ds elen von Items ncht erlut ufge. s frktonle Rucksckprolem lässt sch lecht mt enem reedy-lgorthmus lösen ährend ds --Rucksckprolem NP-vollständg st. s edeutet ds --Rucksckprolem lässt sch ncht mt enem Polynomzet-lgorthmus lösen dessen Lufzet proportonl llen von der ngegröße n hängt. s sollen Se tun: Progrmmeren Se ds frktonle Rucksckprolem und prmetrseren Se de ngedten n und W und stellen Se de rgensse grfsch oder lphnumersch uf der Konsole dr. ufge --Rucksckprolem Bem --Rucksckprolem dürfen de n Items der Menge S ncht getelt erden. e ufge esteht drn ene Menge von Items zu estmmen deren esmtert mxml st und deren esmtgecht ds mxml zulässge echt W des Ruckscks ncht üerschretet. ne Brute-Force-Lösung ürde lle elmengen von S ufzählen und dnn deenge usählen deren echt ncht größer ls W und deren Wert mxml st. e Lösung ht ene symptotsche Lufzet von O n. s sollen Se tun: Fnden Se enen ynmsche Progrmmerung P lgorthmus mt dem sch ds --Rucksckprolem lösen lässt und der schneller ls der Brute-Force-lgorthmus st. Hnes: ds --Rucksckprolem NP-vollständg st knn de Lufzet deses lgorthmus ncht llen von der ngegröße n hängen. s st ncht gnz enfch für ds --Rucksckprolem ene optmle Suprolemeschreung zu fnden elche de dre grundlegenden genschften enes ynmsche-progrmmerung- lgorthmus erfüllt Kp.. der Vorlesung: nfche Suproleme. Suproleme mt glecher Struktur e ds Orgnlprolem fnden Optmltät der Suproleme. Konstrukton ener optmlen Lösung des Orgnlprolems us den optmlen Lösungen der Suproleme Üerlppende Suproleme. e Suproleme müssen sch üerlppen. Je größer de Üerlppung desto effzenter der P-lgorthmus een Se den Pseudocode des lgorthmus n progrmmeren Se ds --Rucksckprolem und prmetrseren Se de ngedten n und W. pp: Se S k { Items n s ezechnet mt... k }. Möglch: uftelung der Suproleme mt dem Prmeter k. Konstrukton ener Lösung von S k us S k-. Wrum führt deser nstz ncht zum Zel? Versuchen Se es mt der Suprolemstruktur B[k ] mxmler esmtert ener elmenge S k unter llen elmengen mt dem exkten esmtgecht. - -