Algorithmische Bioinformatik

Ähnliche Dokumente
Algorithmische Bioinformatik

Algorithmen und Datenstrukturen in der Bioinformatik Erstes Übungsblatt WS 05/06 Musterlösung

Algorithmen und Datenstrukturen in der Bioinformatik Zweites Übungsblatt WS 05/06 Musterlösung

Einführung in die Bioinformatik

Sequenzen-Alignierung in der Bioinformatik. VO Algorithm Engineering Professor Dr. Petra Mutzel Lehrstuhl für Algorithm Engineering, LS11

DAP2-Klausur

Mathematische Grundlagen II (CES) WS 2015/2016 Klausur am Informationen zur Klausur

TECHNISCHE UNIVERSITÄT MÜNCHEN Fakultät für Mathematik. Grundlagen der Nichtlinearen Optimierung. Klausur zur Vorlesung WS 2008/09

Bioinformatik Für Biophysiker

Name:... Matr.-Nr... Bearbeitungszeit: 120 Minuten. Lesen Sie die Aufgaben jeweils bis zum Ende durch; oft gibt es hilfreiche Hinweise!

Karlsruher Institut für Technologie. Klausur Algorithmen I

Informatik II: Algorithmen & Datenstrukturen. Blättern Sie nicht um bevor Sie dazu aufgefordert werden!

Kapitel 7: Sequenzen- Alignierung in der Bioinformatik

Informatik II, SS 2014

Multiple Alignments. Vorlesung Einführung in die Angewandte Bioinformatik Prof. Dr. Sven Rahmann. Webseite zur Vorlesung

Klausur Einführung in die Informatik I für Elektrotechniker 16. Juli 2003

Algorithmen auf Sequenzen

Randomisierte Algorithmen

Klausur Bioinformatik für Biotechnologen

Klausur. Diskrete Mathematik I. Donnerstag, den um 14 Uhr

Musterlösung zur Hauptklausur Theoretische Grundlagen der Informatik Wintersemester 2013/14

FOLDALIGN und sein Algorithmus. Nadine Boley Silke Szymczak

Der Metropolis-Hastings Algorithmus

Übersicht. 1 Einführung in Markov-Chain Monte-Carlo Verfahren. 2 Kurze Wiederholung von Markov-Ketten

Algorithmische Bioinformatik 1

Bioinformatik Für Biophysiker

Klausur Algorithmen und Datenstrukturen II

Prüfung zur Vorlesung Mathematik I/II

Klausur Algorithmen und Datenstrukturen

Klausur Algorithmen und Datenstrukturen

15. Elementare Graphalgorithmen

Klausur Informatik 2: Algorithmen und Datenstrukturen. Blättern Sie nicht um bevor Sie dazu aufgefordert werden!

Algorithmische Bioinformatik

Aufgabe Mögliche Punkte Erreichte Punkte

Algorithmische Bioinformatik

Theoretische Informatik III (Winter 2018/19) Prof. Dr. Ulrich Hertrampf. Noch einmal TSP

2. Klausur Datenstrukturen und Algorithmen SS 2014

Nachklausur Informatik-Propädeutikum (Niedermeier/Hartung/Nichterlein, Wintersemester 2012/13)

Klausur Algorithmentheorie

Probeklausur Optimierung

Prüfung Datenstrukturen und Algorithmen, D-INFK. Datenstrukturen & Algorithmen

Zentrum für Bioinformatik. Übung 4: Revision. Beispielfragen zur Klausur im Modul Angewandte Bioinformatik (erste Semesterhälfte)

Übungsaufgaben zur Einführung in die Bioinformatik - Lösungen

Bitte füllen Sie den untenstehenden Abschnitt nicht aus

Universität Duisburg - Essen

Klausur Algorithmen und Datenstrukturen II 29. Juli 2013

Technische Universität München Fakultät für Mathematik Algorithmische Diskrete Mathematik WS 2012/2013 Prof. Dr. P. Gritzmann 22.

Algorithmen und Datenstrukturen VO 3.0 Vorlesungsprüfung 19. Oktober 2007

2.2 Der Algorithmus von Knuth, Morris und Pratt

Klausur zur Vorlesung Logistik im Sommersemester 2012

Aufgabe Punkte Aufgabe Σ Punkte. Note:

Modul "Grundlagen der Finanzwissenschaft und internationale Wirtschaft" Klausur zu Veranstaltung

Klausur. Betriebssysteme WS 2012/

Grundlagen der Elektrotechnik 1 am

Algorithmen I - Tutorium 28 Nr. 12

Algorithmen und Datenstrukturen (Informatik II) SS Klausur

Diplom VP Informatik / Numerik 2. September 2002

Wiederholungsklausur Numerisches Rechnen ( ) (Musterlösung)

Klausur Algorithmen und Datenstrukturen II 01. Agust 2016

Technische Universität München Zentrum Mathematik. Optimierung 2, WS 2008/09 Übungsblatt 12

Algorithmische Anwendungen WS 2005/2006

Algorithmen und Datenstrukturen in der Bioinformatik

Abschlussprüfung StoP FS 2014

Fachprüfung. Nachrichtencodierung

Bioinformatik. BLAST Basic Local Alignment Search Tool. Ulf Leser Wissensmanagement in der. Bioinformatik

1. Klausur zur Vorlesung Algorithmentechnik Wintersemester 2008/2009

a 11 a 12 a 1(m 1) a 1m a n1 a n2 a n(m 1) a nm Matrizen Betrachten wir das nachfolgende Rechteckschema:

Klausur Algorithmen und Datenstrukturen II 10. August 2015

Übung zur Vorlesung Berechenbarkeit und Komplexität

Lehrstuhl II für Mathematik. Bachelor-Prüfung/Diplom-Vorprüfung/Zwischenprüfung. Höhere Mathematik I

Grundbegriffe der Informatik Musterlösung zu Aufgabenblatt 9

Modulklausur Multivariate Verfahren

Aufgabe: Summe Punkte (max.): Punkte:

Lösungen zur Vorlesung Berechenbarkeit und Komplexität

Name:... Vorname:... Matr.-Nr.:... Studiengang:...

2.7 Der Shannon-Fano-Elias Code

Klausur Algorithmentheorie

Klausur Algorithmen und Datenstrukturen

Klausur zur Vorlesung Logistik im Sommersemester 2015

Klausur SoSe Juli2018

Aufgabenblatt 4. Silke Trißl Wissensmanagement in der Bioinformatik

Vorname:... Matrikel-Nr.:... Unterschrift:...

Bioinformatik Für Biophysiker

DAP2 Probeklausur. Matrikelnummer Vorname Nachname. Datum: 24. Juli C. Sohler A. Krivo²ija, A. Rey, H. Sandvoÿ

1. Klausur zu Vektor- und Matrizenrechnung I und II WS 2009/10 und SS 2010 am Dienstag, dem 27. Juli 2010

Aufgabe Nr.: Summe Punktzahl: Die Benützung eines Taschenrechners ist nicht gestattet.

ÜBUNGSKLAUSUR Studienhalbjahr: 2. Semester. Datum: 20. Juli 2016 Bearbeitungszeit: 90 Minuten. Modul: T2INF Dozent: Stephan Schulz

2. Grundlagen. Beschreibung von Algorithmen durch Pseudocode. Korrektheit von Algorithmen durch Invarianten.

Klausur SoSe Juli 2013

Klausur Numerisches Rechnen ( ) (Musterlösung)

Theoretische Grundlagen der Informatik

Theorie-Teil: Aufgaben 1-3: 30 Punkte Programmier-Teil: Aufgaben 4-9: 60 Punkte

Datenstrukturen und Algorithmen D-INFK

2. Klausur zur Vorlesung Algorithmentechnik Wintersemester 2008/2009

Bearbeiten Sie 6 der 8 Aufgaben nach Ihrer Wahl.

Algorithmen und Datenstrukturen 1 VL Übungstest WS Jänner 2009

Seminar: Data Mining. Referat: Andere Möglichkeiten des Data Mining in verteilten Systemen. Ein Vortrag von Mathias Rohde. 11.

Algorithmen und Datenstrukturen 2

Klausur zur Vorlesung Einführung in das Operations Research im Wintersemester 2005/2006

Transkript:

FREIE UNIVERSITÄT BERLIN Fachbereich Mathematik und Informatik Institut für Informatik (WE 3) FU BERLIN Freie Universität Berlin FB Mathematik und Informatik, Institut für Informatik, Takustr. 9, D-14195 Berlin Prof. Dr. Knut Reinert, Markus Bauer, Eva Lange, Erasmus Krause Algorithmische Bioinformatik WS 2005/06 Klausur Name, Vorname Matr.-Nr. Zur Bearbeitung der Klausur stehen Ihnen 90 Minuten zur Verfügung. Die hier gestellten Aufgaben sind jedoch für eine längere Bearbeitungszeit konzipiert (102 min). Sie werden somit vermutlich nicht sämtliche Aufgaben bearbeiten können, und dies wird auch nicht von Ihnen verlangt. Abgesehen von einem nicht-programmierbaren Taschenrechner sind keinerlei Hilfsmittel gestattet. Geben Sie auf dem Titelblatt ihren Namen und ihre Immatrikulationsnummer an. Schreiben Sie ihre Lösungen direkt auf die entsprechenden Aufgabenbögen. Sollte dort der Platz nicht ausreichen und Sie weitere Blätter benötigen, vermerken Sie dies bitte, damit wir auch den Rest ihrer Antwort finden und bei der Bewertung berücksichtigen können. 17. Februar 2006 Ergebnis: Punkte max. 1 4 2 8 3 8 4 10 5 12 6 12 7 8 8 6 9 10 10 10 11 6 12 8 Σ 102 Am Ende der Klausur sind sämtliche Aufgabenblätter wieder abzugeben.

1. [4 Punkte] Gegeben seien zwei Sequenzen der Längen 1000 und 10000. Bei einem Sequenzvergleich wird ein Alignment mit einem Score von 25 bit gefunden. Entscheiden Sie durch eine grobe Abschätzung, ob dieser Wert signifikant ist und begründen Sie ihre Antwort.

2. [8 Punkte] In der Vorlesung wurde eine Generalisierung des paarweisen dynamic programming Alignment Algorithmus auf mehrere Sequenzen besprochen. (a) Schätzen Sie Zeit- und Platzbedarf (in O-Notation) für die Berechnung eines multiplen optimalen Stringalignments von k Strings der Länge n mit einfachem dynamischen Programmieren und WSOP-Kostenfunktion ( weighted sum of pairs ) ab. Begründen Sie Ihre Antwort. [3 Punkte] (b) Erklären Sie genau, wie man es beim exakten MSA vermeiden kann, die gesamte dynamic programming-matrix aufbauen zu müssen. [5 Punkte]

3. [8 Punkte] Der Quasar Algorithmus findet sogenannte local approximate matches, d.h. er findet alle gemeinsamen Substrings von Text und Pattern der Größe w, die höchstens k mismatches besitzen. Der Algorithmus basiert auf dem in der Vorlesung besprochenen q-gram Lemma. (a) Geben Sie das q-gram Lemma an.[4 Punkte] (b) Die Wahl von q ist wichtig in Quasar und nicht offensichtlich. Welchen Grund gibt es q möglichst klein zu wählen? Welchen Grund gibt es, q möglichst groß zu wählen?[4 Punkte]

4. [10 Punkte] Das aus der Vorlesung bekannte Motif-Suchproblem ist folgendermaßen definiert: Gegeben seien t Sequenzen, und ein sogenanntes (l, d) Motif der Länge l: Jede der t Sequenzen enthält einen Substring, der zum Motif nicht mehr als d Unterschiede aufweist. Der PROJECTION Algorithmus sucht nach einem solchen (l, d) Motif. (a) Erklären Sie, welche Bedeutung die 3 Parameter k, s und m im PROJECTION Algorithmus haben? [3 Punkte] (b) Beschreiben Sie den Algorithmus in Pseudocode. (Hilfe: Sie können eine Funktion Hash als gegeben annehmen) [7 Punkte]

5. [12 Punkte] Gegeben sei die folgende Liste der Sequenzstücklängen eines PDP (d.h. alle paarweisen Distanzen): E = {1, 3, 4, 5, 6, 7, 8, 9, 10, 15} Rechnen Sie den Skiena Algorithmus nach Eingabe von E durch und geben Sie die resultierende Menge X von Restriktionsstellen an. Geben Sie bei jedem Schritt die berechneten Mengen von Restriktionsstellen und Stücklängen an.[10 Punkte] Die berechnete Lösung ist nicht eindeutig. Welche andere Lösung gibt es noch?[2 Punkte]

6. [12 Punkte] (a) Was ist die Zielfunktion bei der Rekonstruktion phylogenetischer Bäume mittels Maximum Parsimony?[3 Punkte] (b) Wozu wird Bootstrapping in der Phylogenie benutzt? [3 Punkte] (c) Gegeben seien vier Objekte a, b, c und d sowie die unten abgebildete Distanzmatrix. Bildet die Matrix eine Metrik, eine additive Metrik oder eine Ultrametrik? Warum? [6 Punkte] a b c d a 0 9 9 9 b 0 5 5 c 0 2 d 0

7. [8 Punkte] Sei P die 1-Schritt Übergangsmatrix eines Markovprozesses und τ die Verteilung des Prozesses. Dabei sei τ sei ein Zeilenvektor und das Matrixelement P ij bezeichne die Übergangswahrscheinlichkeit vom Zustand i in Zustand j. Es gelte die sogenannte detailed balance Gleichung τ i P ij = τ j P ji für alle i, j Zeigen Sie, dass τ die stationäre Verteilung des Markovprozesses ist, also dass τ P = τ gilt.

8. [6 Punkte] Geben Sie eine RNA-Sequenz an, die sich zu einer Struktur falten könnte, welche mindestens eine innere Schleife (interior loop) und eine Haarnadelschleife (hairpin loop) enthält. Zeichnen Sie diese Struktur in zwei gängigen Darstellungsweisen und kennzeichnen Sie die interior und hairpin loop.

9. [10 Punkte] Benutzen Sie ein vierdimensionales Feld A zur Berechnung eines optimalen Sequenz-Struktur Alignments zwischen zwei annotierten Sequenzen (S 1, P 1 ) and (S 2, P 2 ). Nehmen Sie an, dass die Annotationen Strukturen ohne Pseudoknoten sind. (a) Geben Sie die Initialisierung von A an. [3 Punkte] (b) Geben Sie die Rekursionsvorschrift zum Berechnen eines optimalen Sequenz- Struktur Alignments an.[5 Punkte] (c) Wie ist die Laufzeit und Platzbedarf des Algorithmus? [2 Punkte]

10. [10 Punkte] Sie haben in der Vorlesung zum Thema Kraftfeldmethoden im Bereich Statistische Thermodynamik (Monte-Carlo Methoden) eine Formel für die Metropolis- Akzeptanzwahrscheinlichkeit kennengelernt: P A (q q) = min{1, exp( β (V ( q) V (q)))}. In der Vorlesung wurde gezeigt, dass diese die Bedingung für ein korrektes Sampling bei symmetrischer Vorschlagwahrscheinlichkeit, d.h. für den Fall P V (q q) = P V ( q q), erfüllt. Erfüllt für einen symmetrischen Vorschlagschritt auch die folgende Formel P A (q q) = exp( β V ( q)) exp( β V ( q)) + exp( β V (q)), die Bedingung für ein korrektes Sampling? Begründen Sie Ihre Meinung.

11. [6 Punkte] Bei der Beantwortung der Frage, wie real Kraftfelder sind, haben Sie drei Näherungen kennengelernt, die von einem quantenchemischen Ansatz zu den vorgestellten Kraftfeldern führen: Die Born-Oppenheimer-Näherung, die Grundzustands-Näherung und die Lokalitäts-Näherung. Beschreiben Sie jeweils mit wenigen Worten, was diese Begriffe bedeuten.

12. [8 Punkte] Nehmen Sie an, wir messen das Protein X mit der Atomkomposition CN 2. Nehmen Sie weiter an, es gibt Y viele Ionen mit Ladung 1, die sie alle in einem Massenspektrometer messen. Wieviele Anteile der Y Ionen messen Sie bei welchen Massen? Hilfe: Rechnen Sie mit ganzen Zahlen für Isotopenmassen, P rob( 12 C) = 0.989, P rob( 13 C) = 0.011, P rob( 14 N) = 0.9963, P rob( 15 N) = 0.0037.