Kay Diederichs, Sommersemester 2015 Bioinformatik I (Einführung) Algorithmen Sequenzen Strukturen
PDFs unter http://strucbio.biologie.unikonstanz.de/~dikay/bioinformatik/ Klausur: Fr 17.7. 10:00-11:00 M629???? Nachklausur: Mo 28.9. 13:30-14:30 M629 2
Hinweis Öffentliche Bioinformatik-relevante Vorlesung(en) werden in der Vorlesung genannt Do 12:15 FB-Seminar 3
Literatur zur Vorlesung (z.b.) Dehnert, Manuel; Hütt, Marc-Thorsten Springer Verlag (2006), ISBN 9783540256878 (PDF erhältlich in ebook-sammlung der UB Konstanz unter http://www.springerlink.com/content/q7j124/?mud=mp ; 5 gedruckte Exemplare) 4
Weitere Literatur A.M. Lesk: Introduction to bioinformatics (2006) (10 Ex.) A.M. Lesk: Bioinformatik: eine Einführung (2003) (11 Ex.) P.M. Selzer: Angewandte Bioinformatik: eine Einführung (2004) (14 Ex.) D.W. Mount: Bioinformatics: sequence and genome analysis (2. Auflage 2004) (4 Ex.; 2001: 2 Ex.) D. Rigden (2009) From Protein Structure to Function with Bioinformatics. Springer. Online verfügbar unter ebooks UB Konstanz V. S. Mathura, P. Kangueane (2009) Bioinformatics : a concept-based introduction. Springer. Online verfügbar unter ebooks UB Konstanz Jährlich kommen mehrere Titel hinzu bitte nachschauen! 5
Was die Vorlesung nicht leistet Programmierkenntnisse (R, python,...) praktische Übungen (s. Vertiefungskurse) 6
Klausur Fragen bzw Aufgaben in der Klausur sind ähnlich denen der (etwa wöchentlichen) Hausaufgaben alte Klausuren habe ich nicht, aber evtl die Fachschaft oder Kommiliton/inn/en Hilfsmittel: nur Taschenrechner und How many membrane proteins are there (ausgedruckt) 7
Überblick Bioinformatik als Nachfolger der theoretischen Biologie? Hilfsmittel (Algorithmen) aus Mathematik (Grundlagen) und Informatik (Umsetzung in Programme; Komplexitätstheorie) Anwendung auf biologische Fragen Machine learning; data mining Daten werden zu Informationen, Wissen 8
Wo steht die Bioinformatik? Verständnis der Natur Mikroebene: Atome, Moleküle Beschreibung der Natur Makroebene: Organismen Physik Chemie, theoretische Biologie Biologie Strukturbiologie Genetik Molek.biol. Zoologie, Botanik molekulare Medizin Bioinformatik klassische Medizin structural genomics genomics proteomics metabolomics 9
Lernziele u.a. Faktenwissen Woher kommen die Daten? Wie werden die Daten verarbeitet? Zusammenhänge zwischen Daten Blackbox versus Algorithmus Visualisierung (Programme und ihre Bedienung) (Programmierung) 10
Themen der Vorlesung Introduction: overview and motivation, role of bioinformatics amino acids and proteins structures and how they are elucidated, visualization genome databases sequence databases, sequence retrieval and analysis protein structure database PDB membrane protein prediction dot matrix method for comparing sequences exchange matrices alignment of sequences by dynamic programming local alignment and global alignment multiple sequence alignment phylogenetic analysis classification of protein structures prediction of protein secondary structure prediction of protein tertiary structure CASP tournaments other interesting algorithms e.g. Hidden Markov Models, Neural Networks Visualization in Bioinformatics 11
Algorithmus: Geschichte 1957 existierte der Begriff Algorithmus noch nicht in Webster s New World Dictionary algorism geht auf einen persischen Mathematiker (al-khwarizmi, 9. Jhdt.) zurück D.E. Knuth begann 1962 mit The Art of Computer Programming (5-7 Bücher; 4 davon sind schon erschienen) 12
Algorithmus: Kennzeichen Anforderungen an Algorithmus (nach Knuth): Finitheit endliche Anzahl von Schritten Definitheit jeder Schritt ist präzise definiert und muss auch so ausgeführt werden. (Sprache vs Mathematik) 0 oder mehr Inputs (Eigenschaften von Objekten; nicht unbedingt Zahlen) 1 oder mehr Outputs (die vom Input abhängen) Effektivität grundlegend und einfach genug, dass alle Operationen im Prinzip genau durchgeführt werden können und das gewünschte Ergebnis in endlicher Zeit erhalten wird 13
Algorithmus: Beispiel Euklid (ca. 360 v.chr. bis 280 v.chr.) Gesucht: größter gemeinsamer Teiler zweier Zahlen. Gegeben seien positive ganze Zahlen m, n. Gesucht ist die größte Zahl, die sowohl m als auch n ohne Rest teilt. 1. Teile m durch n and erhalte r als Rest (also 0 r < n) 2. Ist r Null? Wenn ja, ist n die Lösung. 3. Wenn nein: setze m := n ; n:= r und gehe zu 1. 14
Hausaufgabe Bestimmen Sie den größten gemeinsamen Teiler von (119 und 544), sowie von (2166 und 6099)! Überprüfen Sie die Kriterien von Knuth an Euklid s Algorithmus! Warum funktioniert Euklid s Algorithmus? (Beweis) Was ist der günstigste/ungünstigste Fall? Geben sie einen alternativen Algorithmus an! 15