lgorthmsche nendungen - Prktkum WS 7/8 ynmsche Progrmmerung / reedy-lgorthmen ufgen 8 - Hener Klocke Fchhochschule Köln Informtk Prktkum: ynmsche Progrmmerung / reedy-lgorthmen ufgen 8 9 ufge Kptel ynmsche Progrmmerung Kptel reedy-lgorthmen Hnes: Benutzen Se für de Softreentcklung und de okumentton ds ool Mven uf unserem Prktkumsserver. Bechten Se de Vorgen n der te pom.xml nsesondere de Benennung der Prktkumsufgen e z.b. <groupid>de.fhkoeln.nf.sysges.temnme.temnmeufge</groupid> <rtfctid>temnmeufge</rtfctid> nführung: Sequence lgnment In nendungen der Bonformtk erden ze oder mehrere N-Sequenzen verschedener Orgnsmen mtennder verglchen. n N-Strng esteht us ener Kette von Molekülen gennnt Bsen oder Nukleosde. e N-Bsen snd denn unn ytosn hymn n N-Strng knn ls Sequenz üer der Bsenmenge [ ] drgestellt erden. urch den Verglech von N-Strängen können ussgen üer de funktonelle oder de evolutonäre Verndtschft von Leeesen gemcht erden. s Zel des N-Sequenzverglechs st es somt zu entscheden e ähnlch sch ze N-Sequenzen snd. e Ähnlchket knn uf verschedene rt und Wesen defnert erden: Ze Sequenzen und snd ähnlch enn de ene Sequenz elsequenz der nderen st. Ze Sequenzen snd ähnlch enn de nzhl der Änderungen de mn enötgt um ene Sequenz n de ndere umzundeln möglchst gerng st. Fnde ene drtte Sequenz c dessen Bsen n und n vorkommen; de Bsen müssen n derselen Rehenfolge uftreten er ncht unedngt ufennder folgen. er Ähnlchketsmß em lgnment ds her verendet erden soll lutet: Schree de Sequenzen so unterennder zu schreen dss möglchst vele gleche Buchsten n ener Splte stehen und n de Sequenzen möglchst eng ps lso Lücken oder Pltzhlter engefügt erden müssen. urch ene Beertungsfunkton lgnment score rd für ede Üerenstmmung zschen den Buchstenpren der Sequenzen ene postve Punktzhl vergeen. mt en snnvolles :\doc\lgn\s78\prktkum\prk_dynpro\prktkum_kp dynmc_progrmmng.doc
ynmsche Progrmmerung / reedy lgorthmen ufgen 8 - lgnment üerhupt möglch st und d de Sequenzen oft unterschedlch lng snd dürfen Leerstellen ps n de Sequenzen engefügt erden. llerdngs rd ds nfügen von ps durch Punktzug negtve Punktzhl gp penlty estrft. s lgnment mt der höchsten Punktzhl st dnn en optmles lgnment. Bespel : - n der ersten Stelle rd en p engefügt um den Längenuntersched uszuglechen. Bespel : ne Sequenzusrchtung zschen ze menschlchen Znkfngerprotenen us der enbnk http://.nc.nlm.nh.gov/ennk/ st folgende: Quelle: mt dem System lustlw erstellt http://de.kped.org/k/lustlw Bem presen lgnment Vergleche zeer N-Sequenzen rd unterscheden zschen glolem lgnment e dem lle Symole ener Sequenz erückschtgt erden und loklem lgnment enn kene Üerenstmmung der Sequenzen uf der gesmten Länge zu errten st. ne enfche Scorng-lgnment-Funkton äre z.b. folgende: mtch: score de eden unterennder stehenden Buchsten stmmen üeren msmtch: score - kene Üerenstmmung Mutton gp: score - gp penlty "Insert or eleton" d.h. Bsen fehlen oder urden engefügt loles Sequence lgnment der Needlemn-Wunsch-lgorthmus s Verfhren enötgt ze Sequenzen und ene Mtrx der röße n m mt n len mlen. Weterhn rd ene Beertungsfunkton enötgt de ze Nukleosde verglecht und eertet. e Mtrx rd mt ener Rekursonsglechung erstellt de de ellösungen ellgnments und ds glole lgnment erechnet. Bespel : Sequenz : - -
ynmsche Progrmmerung / reedy lgorthmen ufgen 8 - - - Sequenz : e Scoremtrx zum Spechern der ellösungen rd ngelegt oe ene Zele und ene Splte hnzugefügt rd um ps zu ermöglchen. de Sequenzen und de röße hen erhlten r ene 7 7 Mtrx 7 7. e Indzerung der Zelen... n und der Splten... m egnnt egen der p-zele z. Splte e! nt ne möglche Beertungsfunkton lutet: " " en p oder flls flls flls e n der Scoremtrx gespecherten optmlen Sustrukturen snd e folgt defnert: f n f m n m Inserton eleton Msmtch Mtch z. mx e erste Zele und de erste Splte der Mtrx stehen für enen für enen Mtch ener Sequenz gegenüer ener nderen leeren Sequenz lso enem p. Mt der ogen Beertungsfunkton rd her ene p Penlty von - ngenommen. er uch ede ndere Penlty-Funkton hängg von der nendung st möglch. In der -efnton r durch ds Zechen en p ezechnet. rster Schrtt: Intlsere de Beertungsmtrx. Berechne zuerst de nträge der Mtrx für de erste Zele und de erste Splte: e Beertung für den ntrg rd erechnet us der drüer legenden Beertung - und dem Score n der Stelle. lso - - de nderen Werte erden nun nlog erechnet.
ynmsche Progrmmerung / reedy lgorthmen ufgen 8 - - - nt e erste Zele und de erste Splte snd schon komplett durchgerechnet; egentlch ürden dese Werte erst gnz m Schluss dort stehen. Zeter Schrtt: rzeuge de Beertungsmtrx von lnks oen nch rechts unten nch der Rekursonsglechung für. ndergens tte nchprüfen o es stmmt: nt mx s Mxmum entsteht us dem ersten Fll d. h. rd mt usgerchtet. mx s Mxmum entsteht us dem drtten Fll d her ds Mxmum der Berechnung nämlch entsteht d. h. en p ürde mt usgerchtet. mx
ynmsche Progrmmerung / reedy lgorthmen ufgen 8 - mx mx us. rgens: lgnment : lgnment : ufge 8 Needlemn-Wunsch-lgorthmus Schreen Se en Jv-Progrmm mt dem ds Sequence-lgnment-Prolem nch dem Needlemn-Wunsch-lgorthmus gelöst erden knn. Folgende Prmeter sollen nterktv engegeen erden:. e Sequenzen und. e Beertungsfunkton Führen Se ds Progrmm schrttese us und stellen Se nch edem Schrtt de Score- Mtrx dr. rmtteln Se us der rgensmtrx de erechnete optmle usrchtung der eden Sequenzen und und stellen Se de usrchtung dr. rklären Se genu ds Prnzp der dynmschen Progrmmerung ds her zum nstz kommt. Fertgen Se ene okumentton n. ufge 9 Smth-Wtermn-lgorthmus Implementeren Se den Smth-Wtermn-lgorthmus für lokles Sequence lgnment. Rechercheren Se selst. okumentton! - -
ynmsche Progrmmerung / reedy lgorthmen ufgen 8 - ufge Frktonles Rucksckprolem s frktonle Rucksckprolem lutet e folgt: egeen st ene Menge S von n Items. Jedes Item ht enen Wert und en echt. Wr estzen enen Rucksck den r mxml mt dem echt W pcken können. e ufge esteht nun drn den Rucksck so mt Items oder elen von Items zu pcken dss der Wert des Ruckscks mxml und de ds zulässge echt W ncht üerschrtten rd. s Prolem rd deshl frktonles Rucksckprolem gennnt el es erlut st uch ele von Items n den Rucksck zu pcken. Bem klssschen Rucksckprolem uch -- Rucksckprolem gennnt st ds elen von Items ncht erlut ufge. s frktonle Rucksckprolem lässt sch lecht mt enem reedy-lgorthmus lösen ährend ds --Rucksckprolem NP-vollständg st. s edeutet ds --Rucksckprolem lässt sch ncht mt enem Polynomzet-lgorthmus lösen dessen Lufzet proportonl llen von der ngegröße n hängt. s sollen Se tun: Progrmmeren Se ds frktonle Rucksckprolem und prmetrseren Se de ngedten n und W und stellen Se de rgensse grfsch oder lphnumersch uf der Konsole dr. ufge --Rucksckprolem Bem --Rucksckprolem dürfen de n Items der Menge S ncht getelt erden. e ufge esteht drn ene Menge von Items zu estmmen deren esmtert mxml st und deren esmtgecht ds mxml zulässge echt W des Ruckscks ncht üerschretet. ne Brute-Force-Lösung ürde lle elmengen von S ufzählen und dnn deenge usählen deren echt ncht größer ls W und deren Wert mxml st. e Lösung ht ene symptotsche Lufzet von O n. s sollen Se tun: Fnden Se enen ynmsche Progrmmerung P lgorthmus mt dem sch ds --Rucksckprolem lösen lässt und der schneller ls der Brute-Force-lgorthmus st. Hnes: ds --Rucksckprolem NP-vollständg st knn de Lufzet deses lgorthmus ncht llen von der ngegröße n hängen. s st ncht gnz enfch für ds --Rucksckprolem ene optmle Suprolemeschreung zu fnden elche de dre grundlegenden genschften enes ynmsche-progrmmerung- lgorthmus erfüllt Kp.. der Vorlesung: nfche Suproleme. Suproleme mt glecher Struktur e ds Orgnlprolem fnden Optmltät der Suproleme. Konstrukton ener optmlen Lösung des Orgnlprolems us den optmlen Lösungen der Suproleme Üerlppende Suproleme. e Suproleme müssen sch üerlppen. Je größer de Üerlppung desto effzenter der P-lgorthmus een Se den Pseudocode des lgorthmus n progrmmeren Se ds --Rucksckprolem und prmetrseren Se de ngedten n und W. pp: Se S k { Items n s ezechnet mt... k }. Möglch: uftelung der Suproleme mt dem Prmeter k. Konstrukton ener Lösung von S k us S k-. Wrum führt deser nstz ncht zum Zel? Versuchen Se es mt der Suprolemstruktur B[k ] mxmler esmtert ener elmenge S k unter llen elmengen mt dem exkten esmtgecht. - -