KURSTAG 25 QUALITÄT VON VORHERSAGEN

Größe: px
Ab Seite anzeigen:

Download "KURSTAG 25 QUALITÄT VON VORHERSAGEN"

Transkript

1 KURSTAG 25 QUALITÄT VON VORHERSAGEN In der Vorlesung haben Sie etwas über Qualität von Vorhersagemethoden gelernt. Aufgabe ist es, die dort genannten Formeln in ein Programm umzusetzen. Dies soll für den Fall einer (!) Aussage mit Wertebereich die Prozentangaben, die Hamming-Distanz, den quadratischen Abstand, den L p -Abstand, den Korrelationskoeffizient, den gegenseitigen Informationsgehalt, den normalisierten gegenseitigen Informationsgehalt, die Sensitivität, die Spezifität und den Korrelationskoeffizient berechnen und nett ausgeben. Für eine 3 3-Matrix geben Sie ebenfalls an. Sensitivität Q D i, Spezifität Q M i, Q total und den gegenseitigen Informationsgehalt IC(D,M) Schöne Zahlenbeispiele haben Sie bei Programmen zur Vorhersage von Transmembranhelices kennengelernt; die Zahlen sind in Tab zusammengestellt. Benutzten Sie diese Zahlen für Ihre binären Aussagen. Die Tabelle hat allerdings eine große Macke, wie Sie wahrscheinlich feststellen werden... Ein schönes Zahlenbeispiel haben Sie am Ende der Vorlesung über Protein-Sekundärstruktur-Vorhersage gesehen (siehe Tab. 25.3). Benutzen Sie dieses auf jeden Fall als einen Datensatz für Ihr Programm; d. h., lassen Sie alle (!?) oben aufgeführten Werte für diesen Datensatz berechnen. Kreieren Sie einen Datensatz, der folgendes Zitat belegt: Die Strukturelement-Verteilung in globulären Proteinen liegt nahe bei 35 % Helix, 15 % β-strang,

2 114 Qualität von Vorhersagen Tabelle 25.1: Leistung verschiedener Metagenom-Analyse-Werkzeuge. Method TP FP TN FN SEN a SPEC b PPV c NPV d MCC e CLARK EBI Genometa GOTTCHA Kraken LMAT MEGAN MetaPhlan MetaPhyler MG-RAST motu OneCodex QIIME Taxator-tk a Sensitivität b Spezifität c Positive predictive value d Negative predictive value e Matthews Korrelationskoeffizient 25 % reverse Turns und 25 % Coil. Wenn ein Vorhersage-Algorithmus nur Helix vorhersagt, täuscht er also schon ein Korrektheit von Q total = 35 % vor! Wie hängt der gegenseitige Informationsgehalt von der Gesamtzahl N an Aussagen ab? Die Tabellen 25.4 bis 25.6 sind aus der Publikation Matthews (1975) kopiert (ohne Tippfehler!). Füllen Sie die fehlenden Spalten aus. Dem Autor Matthews ist damals wohl mindestens ein Fehler unterlaufen; versuchen Sie diese zu korrigieren. Für die Berechnung des MCC (Matthews Korrelationskoeffizient) benutzen Sie bitte beide Formeln, die in der Vorlesung angegeben wurden; ergeben die wirklich gleiche Werte? Welches ist das (damals) beste Programm zur Vorhersage von Proteinstruktur gewesen? Wie steht s mit der Qualität dieser Programme im Vergleich zu GOR IV?

3 115 Tabelle 25.2: Qualität von Programmen zur Vorhersage von Transmembranregionen für alle biochemisch charakterisierten Transmembran-Proteine. MSR: Membran-überspannende Region; T P: Zahl korrekt vorhergesagter MSRs; FN: Zahl nicht vorhergesagte MSRs; FP: Zahl falsch vorhergesagter MSRs. Die Methoden sind sortiert nach der Summe FN + FP. Die Summe T P + FN sollte die Gesamtzahl an MSRs ergeben; dies ist nicht der Fall, wenn eine vorhergesagte Region mehr als eine tatsächliche Region überspannt oder umgekehrt. Verändert nach Möller et al. (2001). Sensi- Rele- Methode Zitat T P FN FP tivität vanz TMHMM 2.0 Sonnhammer et al. (1998) ,93 0,96 HMMTOP Tusnády & Simon (1998) ,95 0,90 MEMSAT 1.5 Jones et al. (1994) ,88 0,91 Eisenberg et al. (1982) ,92 0,83 ALOM 2 Nakai & Kanehisa (1992) ,44 0,96 PHD Rost et al. (1996a,b) ,64 0,73 TopPred Claros & von Heijne (1994) ,53 0,79 Gesamtzahl an MSRs: 883 Tabelle 25.3: Vorhersagequalität von GOR IV. Vorhergesagt Beobachtet H E C Total H E C Total Q a prd 64,7 60,7 65,1 Q b obs 67,0 36,5 75,8 Q c 3 = 64,4 % a b c Zahl korrekt vorhergesagter Einheiten Zahl vorhergesagter Einheiten. Zahl korrekt vorhergesagter Einheiten Zahl beobachteter Einheiten. Gesamtzahl korrekt vorhergesagter Einheiten Gesamtzahl an Einheiten.

4 116 Qualität von Vorhersagen Tabelle 25.4: Vorhersage von α-helikalen Positionen im Lysozym des Phagen T4. Kopiert aus Matthews (1975). Zitat N T P T N FP FN PCP α PCN α Q 3,α Sens. Spec. MCC Nagano & Hasegawa (1973) ,198 Prothero (1966) Chou & Fasman (1974) Lim (1974) Ptitsyn & Finkelstein (1970) Finkelstein et al. (1974) Guzzo (1965) Leberman (1971) Barry & Friedman (1974) Burgess et al. (1974) Schellman (1975) Tabelle 25.5: Vorhersage von β-strang-positionen im Lysozym des Phagen T4. Kopiert aus Matthews (1975). Zitat N T P T N FP FN PCP β PCN β Q 3,β Sens. Spec. MCC Nagano & Hasegawa (1973) Chou & Fasman (1974) Lim (1974) Ptitsyn & Finkelstein (1970) Finkelstein et al. (1974) Barry & Friedman (1974) Burgess et al. (1974) Schellman (1975) Tabelle 25.6: Vorhersage von Turn-Positionen im Lysozym des Phagen T4. Kopiert aus Matthews (1975). Zitat N T P T N FP FN PCP turn PCN turn Q 3,turn Sens. Spec. MCC Nagano & Hasegawa (1973) Chou & Fasman (1974) Finkelstein et al. (1974) Burgess et al. (1974)

5 1. Literatur 117 Literatur Claros, M.G. & von Heijne, G. (1994). TopPred II: an improved software for membrane protein structure predictions. Comp. Appl. Biosci., 10, Eisenberg, D., Weiss, R.M. & Terwilliger, T.C. (1982). The helical hydrophobic moment: a measure of the amphiphilicity of a helix. Nature, 299, Jones, D.T., Taylor, W.R. & Thornton, J.M. (1994). A model recognition approach to the prediction of all-helical membrane protein structure and topology. Biochemistry, 33, Matthews, B.W. (1975). Comparison of the predicted and observed secondary structure of T4 phage lysozyme. Biochim. Biophys. Acta, 405, , 116 Möller, S., Croning, M.D.R. & Apweiler, R. (2001). Evaluation of methods for the prediction of membrane spanning regions. Bioinformatics, 17, , Erratum in Bioinformatics, 18, Nakai, K. & Kanehisa, M. (1992). A knowledge base for predicting protein localization sites in eukaryotic cells. Genomics, 14, Rost, B., Casadio, R. & Fariselli, P. (1996). Refining neural network predictions for helical transmembrane proteins by dynamic programming. Proc. Int. Conf. Intell. Syst. Mol. Biol., 4, Rost, B., Fariselli, P. & Casadio, R. (1996). Topology prediction for helical transmembrane proteins at 86 % accuracy. Protein Sci., 5, Sonnhammer, E.L.L., von Heijne, G. & Krogh, A. (1998). A hidden Markov model for predicting transmembrane helices in protein sequences. In Proc. Sixth Int. Conf. on Intelligent Systems for Molecular Biology (ISMB) (Glasgow, J., Littlejohn, T., Major, F., Lathrop, R., Sankoff, D. & Sensen, C., Hrsg.). AAAI Press, Menlo Park, CA, S Tusnády, G.E. & Simon, I. (1998). Principles governing amino acid composition of integral membrane proteins: application to topology prediction. J. Mol. Biol., 283,

Threading - Algorithmen

Threading - Algorithmen Threading - Algorithmen Florian Lindemann 22.11.2007 Florian Lindemann () Threading - Algorithmen 22.11.2007 1 / 25 Gliederung 1 Prospect Scoring Function Algorithmus Weitere Eigenschaften Komplexität

Mehr

Theoretical Analysis of Protein-Protein Interactions. Proseminar SS 2004

Theoretical Analysis of Protein-Protein Interactions. Proseminar SS 2004 Theoretical Analysis of Protein-Protein Interactions Proseminar Virtual Screening: Predicting Pairs from Sequence Übersicht Einleitung 1.Modell: Vorhersage von Protein-Interfaces aus Sequenzprofilen und

Mehr

Nicht-regelmäßige Sekundärstruktur Sekundärstrukturvorhersage Strukturmotive

Nicht-regelmäßige Sekundärstruktur Sekundärstrukturvorhersage Strukturmotive Nicht-regelmäßige Sekundärstruktur Sekundärstrukturvorhersage Strukturmotive Wintersemester 2011/12 Peter Güntert Regelmäßige Sekundärstrukturen Eine regelmässige Sekundärstruktur ist dadurch charakterisiert,

Mehr

Gibbs sampling. Sebastian Pado. October 30, Seien X die Trainingdaten, y ein Testdatenpunkt, π die Parameter des Modells

Gibbs sampling. Sebastian Pado. October 30, Seien X die Trainingdaten, y ein Testdatenpunkt, π die Parameter des Modells Gibbs sampling Sebastian Pado October 30, 2012 1 Bayessche Vorhersage Seien X die Trainingdaten, y ein Testdatenpunkt, π die Parameter des Modells Uns interessiert P (y X), wobei wir über das Modell marginalisieren

Mehr

Bioinformatik. Methoden zur Vorhersage vo n RNA- und Proteinstrukture n. Gerhard Steger

Bioinformatik. Methoden zur Vorhersage vo n RNA- und Proteinstrukture n. Gerhard Steger Bioinformatik Methoden zur Vorhersage vo n RNA- und Proteinstrukture n Gerhard Steger Vorwort ix Strukturvorhersage von Nukleinsäuren 1 Struktur und Funktion von RNA 3 1.1 RNA-Struktur fl 1.2 Thermodynamik

Mehr

Bioinformatik I (Einführung)

Bioinformatik I (Einführung) Kay Diederichs, Sommersemester 2015 Bioinformatik I (Einführung) Algorithmen Sequenzen Strukturen PDFs unter http://strucbio.biologie.unikonstanz.de/~dikay/bioinformatik/ Klausur: Fr 17.7. 10:00-11:00

Mehr

Übung Angewandte Biosignalverarbeitung

Übung Angewandte Biosignalverarbeitung Übung Angewandte Biosignalverarbeitung Dr.-Ing. Sebastian Zaunseder e-mail: Sebastian.Zaunseder@tu-dresden.de Telefon: +49 (0)351 463 33786 Raum: Fetscherforum, 1. OG, Raum 32 Die Aufgabe - Schlagdetektion

Mehr

VL Algorithmische BioInformatik (19710) WS2013/2014 Woche 16 - Mittwoch. Annkatrin Bressin Freie Universität Berlin

VL Algorithmische BioInformatik (19710) WS2013/2014 Woche 16 - Mittwoch. Annkatrin Bressin Freie Universität Berlin VL Algorithmische BioInformatik (19710) WS2013/2014 Woche 16 - Mittwoch Annkatrin Bressin Freie Universität Berlin Vorlesungsthemen Part 1: Background Basics (4) 1. The Nucleic Acid World 2. Protein Structure

Mehr

Bioinformatik I (Einführung)

Bioinformatik I (Einführung) Kay Diederichs, Sommersemester 2017 Bioinformatik I (Einführung) Algorithmen Sequenzen Strukturen PDFs unter http://strucbio.biologie.unikonstanz.de/~dikay/bioinformatik/ Klausur: Fr 28.7. 10:00-11:00

Mehr

Vertiefendes Seminar zur Vorlesung Biochemie I Bearbeitung Übungsblatt 4

Vertiefendes Seminar zur Vorlesung Biochemie I Bearbeitung Übungsblatt 4 Vertiefendes Seminar zur Vorlesung Biochemie I 20.11.2015 Bearbeitung Übungsblatt 4 Gerhild van Echten-Deckert Fon. +49-228-732703 Homepage: http://www.limes-institut-bonn.de/forschung/arbeitsgruppen/unit-3/

Mehr

Bioinformatik. Methoden zur Vorhersage von RNA- und Proteinstrukturen. Gerhard Steger. Springer Basel AG

Bioinformatik. Methoden zur Vorhersage von RNA- und Proteinstrukturen. Gerhard Steger. Springer Basel AG Bioinformatik Methoden zur Vorhersage von RNA- und Proteinstrukturen Gerhard Steger Springer Basel AG Autor Dr. Gerhard Steger Heinrich-Heine-Universität Düsseldorf Institut für Physikalische Biologie

Mehr

Bioinformatik I (Einführung)

Bioinformatik I (Einführung) Kay Diederichs, Sommersemester 2018 Bioinformatik I (Einführung) Algorithmen Sequenzen Strukturen PDFs unter http://strucbio.biologie.unikonstanz.de/~dikay/bioinformatik/ Klausur: Mo 30.7. 14:30-15:30

Mehr

Dot-Matrix Methode. (Java) (Javascript) 80

Dot-Matrix Methode.  (Java)   (Javascript) 80 Dot-Matrix Methode Vergleich zweier Sequenzen (DNA oder Aminosäuren) Idee: gleiche Basen (Aminosäuren) in x-y Diagramm markieren Sequenz 1: ADRWLVKQN Sequenz 2: ADKFIVRDE http://myhits.vital-it.ch/cgi-bin/dotlet

Mehr

Data Mining und Maschinelles Lernen

Data Mining und Maschinelles Lernen Data Mining und Maschinelles Lernen Wintersemester 2015/16 Musterlösung für das 7. Übungsblatt Aufgabe 1 Evaluierungsmethoden Ein Datenset enthält 2 n Beispiele, wobei genau n Beispiele positiv sind und

Mehr

Einführung in die Bioinformatik: Lernen mit Kernen

Einführung in die Bioinformatik: Lernen mit Kernen Einführung in die Bioinformatik: Lernen mit Kernen Dr. Karsten Borgwardt Forschungsgruppe für Maschinelles Lernen und Bioinformatik Max-Planck-Institut für Intelligente Systeme & Max-Planck-Institut für

Mehr

Bioinformatik für Biochemiker

Bioinformatik für Biochemiker Bioinformatik für Biochemiker Oliver Kohlbacher WS 2009/2010 11. Sekundärstrukturvorhersage Abt. Simulation biologischer Systeme WSI/ZBIT, Eberhard-Karls-Universität Tübingen Überblick Proteinstrukturvorhersage

Mehr

Proteinstrukturvorhersage Strukturelle Bioinformatik WS15/16

Proteinstrukturvorhersage Strukturelle Bioinformatik WS15/16 Proteinstrukturvorhersage Strukturelle Bioinformatik WS15/16 Dr. Stefan Simm, 02.12.2015 simm@bio.uni-frankfurt.de Proteinstrukturvorhersage EINLEITUNG Strukturparameter Lokale inter Rest Interaktionen

Mehr

V5: Proteinstruktur: Sekundärstruktur

V5: Proteinstruktur: Sekundärstruktur INHALT V5: Proteinstruktur: Sekundärstruktur - Hierarchischer Aufbau der Proteinstruktur - Ramachandran-Plot - Vorhersage von Sekundärstrukturelementen aus der Sequenz - Membranproteine LERNZIEL - lerne

Mehr

Vertiefendes Seminar zur Vorlesung Biochemie

Vertiefendes Seminar zur Vorlesung Biochemie Vertiefendes Seminar zur Vorlesung Biochemie 31.10.2014 Proteine: Struktur Gerhild van Echten-Deckert Fon. +49-228-732703 Homepage: http://www.limes-institut-bonn.de/forschung/arbeitsgruppen/unit-3/abteilung-van-echten-deckert/abt-van-echten-deckert-startseite/

Mehr

Übungsaufgaben. Aufbau und Konformation von Polypeptiden. Einführung in die räumliche Struktur von Proteinen

Übungsaufgaben. Aufbau und Konformation von Polypeptiden. Einführung in die räumliche Struktur von Proteinen Computergestützte Strukturbiologie (Strukturelle Bioinformatik) SS09 P. Güntert Übungsaufgaben Aufbau und Konformation von Polypeptiden 1. Warum haben Proteine im Unterschied zu DNA komplizierte und vielfältige

Mehr

Data Mining Künstliche Neuronale Netze vs. Entscheidungsbäume

Data Mining Künstliche Neuronale Netze vs. Entscheidungsbäume Data Mining Künstliche Neuronale Netze vs. Entscheidungsbäume Grundseminar HAW Master Informatik 18.04.2017 Inhaltsübersicht Data Mining & Begriffswelt des Data Mining Klassifikation & Klassifikatoren

Mehr

Wichtige Themen aus der Vorlesung Bioinformatik II SS 2016

Wichtige Themen aus der Vorlesung Bioinformatik II SS 2016 Universität des Saarlandes FR 6.2 Informatik Prof. Dr. Hans-Peter Lenhof M. Sc. Daniel Stöckel M. Sc. Lara Schneider M. Sc. Tim Kehl I Wichtige Themen aus der Vorlesung Bioinformatik II SS 2016 Hinweis:

Mehr

"Korrelation" bei Nominaldaten: Kontingenz

Korrelation bei Nominaldaten: Kontingenz "Korrelation" bei Nominaldaten: Kontingenz j 1 2 3 beobachtete Häufigkeiten (KSV Tabelle 6.3): i Augenfar be Haarfarb e blau braun grün 1 blond 42 1 6 2 braun 12 5 22 3 schwarz 0 26 2 4 rot 8 4 0 175 i

Mehr

Algorithmen für Geographische Informationssysteme

Algorithmen für Geographische Informationssysteme Algorithmen für Geographische Informationssysteme 3. Vorlesung: 29. April 205 Thomas van Dijk basiert auf Folien von Jan-Henrik Haunert Map Matching Problemformulierung Gegeben: Das Straßennetz als planar

Mehr

comparative structure prediction of ncrna molecules

comparative structure prediction of ncrna molecules comparative structure prediction of ncrna molecules using a non Sankoff approach 01. Februar 2008 Inhalt 1 ncrna s - ein Überblick 2 RNAcast - RNA consensus structure prediction Outline und Vorbereitung

Mehr

Semiüberwachte Paarweise Klassifikation

Semiüberwachte Paarweise Klassifikation Semiüberwachte Paarweise Klassifikation Andriy Nadolskyy Bachelor-Thesis Betreuer: Prof. Dr. Johannes Fürnkranz Dr. Eneldo Loza Mencía 1 Überblick Motivation Grundbegriffe Einleitung Übersicht der Verfahren

Mehr

Vorhersage der RNA-Sekundärstruktur

Vorhersage der RNA-Sekundärstruktur Vorhersage der RNA-Sekundärstruktur Andreas Spillner Bioinformatik, SS 2018 Primärstruktur vs. Sekundärstruktur Primärstruktur Sequenz der Buchstaben (bei RNA entspricht ein Buchstabe jeweils einer Nukleinsäure

Mehr

The ROC curve in screening with multiple markers: An application to the triple test in prenatal diagnostics

The ROC curve in screening with multiple markers: An application to the triple test in prenatal diagnostics Statistische Methoden in Evidenz-basierter Medizin und Health Technology Assessment 20. bis 21. November 2003 Freiburg The ROC curve in screening with multiple markers: An application to the triple test

Mehr

Vorhersage von Protein-Funktionen. Patrick Pfeffer

Vorhersage von Protein-Funktionen. Patrick Pfeffer Vorhersage von Protein-Funktionen Patrick Pfeffer Überblick Motivation Einleitung Methode Markov Random Fields Der Gibbs Sampler Parameter-Schätzung Bayes sche Analyse Resultate Pfeffer 2 Motivation Es

Mehr

Comperative Protein Structure Modelling of Genes and Genomes

Comperative Protein Structure Modelling of Genes and Genomes Comperative Protein Structure Modelling of Genes and Genomes Satisfaction of Spatial Restraints / Loop Modelling Nikolas Gross und Maximilian Miller Ludwig-Maximilians-Universität 29.11.2007 1 von 31 Table

Mehr

Seminar Biomedical Informatics

Seminar Biomedical Informatics Martin Dugas und Xiaoyi Jiang Institut für Informatik Wintersemester 2017 Organisation Vorlage: Englischsprachige Publikation Vortrag: ca. 30min + 15min Diskussion, Hand-out, Blockseminar Anfang Dezember

Mehr

Wichtige Themen aus der Vorlesung Bioinformatik II SS 2017

Wichtige Themen aus der Vorlesung Bioinformatik II SS 2017 I Universität des Saarlandes FR 6.2 Informatik Prof. Dr. Hans-Peter Lenhof M. Sc. Tim Kehl M. Sc. Lara Schneider Wichtige Themen aus der Vorlesung Bioinformatik II SS 2017 Hinweis: Dies ist eine stichpunktartige

Mehr

Maschinelles Lernen: Symbolische Ansätze

Maschinelles Lernen: Symbolische Ansätze Maschinelles Lernen: Symbolische Ansätze Wintersemester 2008/2009 Musterlösung für das 7. Übungsblatt Aufgabe 1: Evaluierung und Kosten Gegeben sei ein Datensatz mit 300 Beispielen, davon 2 /3 positiv

Mehr

7. Woche Extra-Material: - Beispiele von Codes. 7. Woche: Beispiele von Codes 144/ 238

7. Woche Extra-Material: - Beispiele von Codes. 7. Woche: Beispiele von Codes 144/ 238 7 Woche Extra-Material: - Beispiele von Codes 7 Woche: Beispiele von Codes 144/ 238 Hamming-Matrix H(h) und Hammingcode H(h) Wir definieren nun eine Parity-Check Matrix H(h) von einem neuen Code: Parametrisiert

Mehr

Kapitel I -> Moleküle des Lebens. Biophysikalische Methoden Kapitel I Moleküle des Lebens

Kapitel I -> Moleküle des Lebens. Biophysikalische Methoden Kapitel I Moleküle des Lebens Kapitel I -> Moleküle des Lebens 1 Themen DNA, Polysaccharide, Lipide, Proteine Literatur V. B. Alberts, D. Bray, J. Lewis, M. Raff, K. Roberts, J. D. Watson. 1997. Molecular biology of the cell. New York:

Mehr

Algorithmen für Geographische Informationssysteme

Algorithmen für Geographische Informationssysteme Algorithmen für Geographische Informationssysteme 8. Vorlesung: 10. Dezember 2012 Jan-Henrik Haunert Map Matching Problemformulierung Gegeben: Das Straßennetz als planar eingebetteter Graph G = V, E Die

Mehr

Zielfunktion. Minimierung von ψ ("Summe der Fehlerquadrate", Fehlerfunktional) calc i

Zielfunktion. Minimierung von ψ (Summe der Fehlerquadrate, Fehlerfunktional) calc i Neuronale Netzwerke Ziel: Modellierung von komplexen Zusammenhängen ohne Einsicht in die Art des funktionalen Zusammenhanges Idee: Zusammenwirkung von Neuronen-Inputs zur Bildung des Neuronen-Outputs (konzeptuell!)

Mehr

Hinweise zur Zitation in naturwissenschaftlichen Arbeiten

Hinweise zur Zitation in naturwissenschaftlichen Arbeiten Hinweise zur Zitation in naturwissenschaftlichen Arbeiten Im Text werden alle aus der Literatur übernommenen Gedanken bzw. Aussagen mit einem Zitat der Quelle belegt. Wörtliche Zitate (in Anführungszeichen)

Mehr

Algorithmen für Geographische Informationssysteme

Algorithmen für Geographische Informationssysteme Algorithmen für Geographische Informationssysteme 3. Vorlesung: 23. April 2014 Thomas van Dijk basiert auf Folien von Jan-Henrik Haunert Map Matching Problemformulierung Gegeben: Das Straßennetz als planar

Mehr

Multiple Alignments. Vorlesung Einführung in die Angewandte Bioinformatik Prof. Dr. Sven Rahmann. Webseite zur Vorlesung

Multiple Alignments. Vorlesung Einführung in die Angewandte Bioinformatik Prof. Dr. Sven Rahmann. Webseite zur Vorlesung Multiple Alignments Vorlesung Einführung in die Angewandte Bioinformatik Prof. Dr. Sven Rahmann Webseite zur Vorlesung http://bioinfo.wikidot.com/ Sprechstunde Mo 16-17 in OH14, R214 Sven.Rahmann -at-

Mehr

INTELLIGENTE DATENANALYSE IN MATLAB. Evaluation & Exploitation von Modellen

INTELLIGENTE DATENANALYSE IN MATLAB. Evaluation & Exploitation von Modellen INTELLIGENTE DATENANALYSE IN MATLAB Evaluation & Exploitation von Modellen Überblick Schritte der Datenanalyse: Datenvorverarbeitung Problemanalyse Problemlösung Anwendung der Lösung Aggregation und Selektion

Mehr

Bioinformatik für Biochemiker

Bioinformatik für Biochemiker Bioinformatik für Biochemiker Oliver Kohlbacher WS 2009/2010 12. Threading Abt. Simulation biologischer Systeme WSI/ZBIT, Eberhard-Karls-Universität Tübingen Gliederung Begriffe und Definitionen Faltungsklassen

Mehr

INTELLIGENTE DATENANALYSE IN MATLAB. Evaluation & Exploitation von Modellen

INTELLIGENTE DATENANALYSE IN MATLAB. Evaluation & Exploitation von Modellen INTELLIGENTE DATENANALYSE IN MATLAB Evaluation & Exploitation von Modellen Überblick Schritte der Datenanalyse: Datenvorverarbeitung Problemanalyse Problemlösung Anwendung der Lösung Aggregation und Selektion

Mehr

FOLDALIGN und sein Algorithmus. Nadine Boley Silke Szymczak

FOLDALIGN und sein Algorithmus. Nadine Boley Silke Szymczak FOLDALIGN und sein Algorithmus Nadine Boley Silke Szymczak Gliederung 2 Einleitung Motivation des Ansatzes zu FOLDALIGN Sankoff-Algorithmus Globales Alignment Zuker-Algorithmus Kombination FOLDALIGN Algorithmus,

Mehr

Das Seminar findet statt Mittwochs, in W9-108, Die Sprechstunde von Frank Zöllner ist Freitags, Uhr in M6-115.

Das Seminar findet statt Mittwochs, in W9-108, Die Sprechstunde von Frank Zöllner ist Freitags, Uhr in M6-115. 1 Proteine in der Bioinformatik Im Rahmen des Seminars sollen einige Anwendungsbereiche aus dem Gebiet der Bioinformatik vorgestellt werden. Insbesondere soll auf folgende Punkte eingegangen werden: Methoden

Mehr

Charakterisierung von 1D Daten

Charakterisierung von 1D Daten Charakterisierung von D Daten Mittelwert: µ, Schätzung m x = x i / n Varianz σ2, Schätzung: s2 = (s: Standardabweichung) Höhere Momente s 2 = ( x i m x ) 2 n ( ) Eine Normalverteilung ist mit Mittelwert

Mehr

Protein-Datenbanken. Protein- Datenbanken. Christian Fink

Protein-Datenbanken. Protein- Datenbanken. Christian Fink Protein- Datenbanken Christian Fink 1 » Übersicht «PDB PDB_TM OPM HIC-UP Klotho 2 » PDB «PDB = Protein Data Bank 3D-Strukturen von Proteinen & Nukleinsäuren Gegründet 1971 als freies Archiv für biologische

Mehr

Data Mining und Maschinelles Lernen Lösungsvorschlag für das 7. Übungsblatt

Data Mining und Maschinelles Lernen Lösungsvorschlag für das 7. Übungsblatt Data Mining und Maschinelles Lernen Lösungsvorschlag für das 7. Übungsblatt Knowledge Engineering Group Data Mining und Maschinelles Lernen Lösungsvorschlag 7. Übungsblatt 1 Aufgabe 1a) Auffüllen von Attributen

Mehr

, Data Mining, 2 VO Sommersemester 2008

, Data Mining, 2 VO Sommersemester 2008 Evaluation 188.646, Data Mining, 2 VO Sommersemester 2008 Dieter Merkl e-commerce Arbeitsgruppe Institut für Softwaretechnik und Interaktive Systeme Technische Universität Wien www.ec.tuwien.ac.at/~dieter/

Mehr

Algorithmen & Datenstrukturen Blatt 4

Algorithmen & Datenstrukturen Blatt 4 Algorithmen & Datenstrukturen Blatt 4 Dr. Matthias Thimm Tina Walber, Leon Kastler, Martin Leinberger und Maximilian Strauch Fachbereich Informatik, Universität Koblenz-Landau 7. Dezember 2013 1 1 Experimentelle

Mehr

INTELLIGENTE DATENANALYSE IN MATLAB

INTELLIGENTE DATENANALYSE IN MATLAB INTELLIGENTE DATENANALYSE IN MATLAB Evaluation & Exploitation von Modellen Überblick Sh Schritte der Datenanalyse: Datenvorverarbeitung Problemanalyse Problemlösung Anwendung der Lösung Aggregation und

Mehr

6 Proteinstrukturen und die dritte Dimension

6 Proteinstrukturen und die dritte Dimension 6 Proteinstrukturen und die dritte Dimension Modul 10-202-2208 Bioinformatik von RNA- und Proteinstrukturen Stephan Bernhart Lehrstuhl Bioinformatik 2. Juni 2013 Stephan Bernhart (Lehrstuhl Bioinformatik)

Mehr

Molekulare Bioinformatik

Molekulare Bioinformatik Molekulare Bioinformatik Wintersemester 2013/2014 Prof. Thomas Martinetz Institut für Neuro- und Bioinformatik Universität zu Luebeck 14.01.2014 1 Molekulare Bioinformatik - Vorlesung 11 Wiederholung Wir

Mehr

Informatik I - Programmierung Globalübung Hoare-Kalkül. Thomas Weiler. Fachgruppe Informatik RWTH Aachen. T. Weiler, RWTH Aachen - 1 -

Informatik I - Programmierung Globalübung Hoare-Kalkül. Thomas Weiler. Fachgruppe Informatik RWTH Aachen. T. Weiler, RWTH Aachen - 1 - Informatik I - Programmierung Globalübung 11.11.2003 Hoare-Kalkül Thomas Weiler Fachgruppe Informatik RWTH Aachen T. Weiler, RWTH Aachen - 1 - Ariane 5 Die Ariane 5 ist das jüngste Modell der Trägerrakete

Mehr

Übungen zum Vorkurs Mathematik

Übungen zum Vorkurs Mathematik Übungen zum Vorkurs Mathematik Blatt 1 W.S.2009/2010 - Ernst Bönecke Aufgaben zur Aussagenlogik 1.) Seien A, B, C Aussagen. Beweisen Sie mit Hilfe von Wahrheitstafeln, dass folgende Aussagen stets wahr

Mehr

Berechnung optimaler Bayesscher Netzwerke. Ivo Große IPK Gatersleben Bioinformatikzentrum Gatersleben-Halle

Berechnung optimaler Bayesscher Netzwerke. Ivo Große IPK Gatersleben Bioinformatikzentrum Gatersleben-Halle Berechnung optimaler Bayesscher Netzwerke Ivo Große IPK Gatersleben Bioinformatikzentrum Gatersleben-Halle Markov Modelle Markov 0 - Nukleotide statistisch unabhängig - position weight matrix (Staden 1984)

Mehr

r=0.666 Number of people who drowned by falling into a pool correlates with Films Nicolas Cage appeared in 140 drownings 6 films 4 films 120 drownings

r=0.666 Number of people who drowned by falling into a pool correlates with Films Nicolas Cage appeared in 140 drownings 6 films 4 films 120 drownings r=.666 Number of people who drowned by falling into a pool correlates with Films Nicolas Cage appeared in 5 6 7 8 9 6 films drownings films drownings films 8 drownings Nicholas Cage Swimming pool drownings

Mehr

Wiederholung der zweiten Schularbeit Mathematik Klasse 7D WIKU am

Wiederholung der zweiten Schularbeit Mathematik Klasse 7D WIKU am Wiederholung der zweiten Schularbeit Mathematik Klasse 7D WIKU am 22.12.2014 SCHÜLERNAME: Punkte im ersten Teil: Punkte im zweiten Teil: Davon Kompensationspunkte: Note: Notenschlüssel: Falls die Summe

Mehr

Fakultät für Informatik Übung zu Kognitive Systeme Sommersemester Lösungsblatt 4 Maschinelles Lernen und Spracherkennung

Fakultät für Informatik Übung zu Kognitive Systeme Sommersemester Lösungsblatt 4 Maschinelles Lernen und Spracherkennung Fakultät für Informatik Übung zu Kognitive Systeme Sommersemester 216 M. Sperber (matthias.sperber@kit.edu) S. Nguyen (thai.nguyen@kit.edu) Lösungsblatt 4 Maschinelles Lernen und Spracherkennung Aufgabe

Mehr

Klausur. Diskrete Mathematik I. Donnerstag, den um 14 Uhr

Klausur. Diskrete Mathematik I. Donnerstag, den um 14 Uhr , Klausur Diskrete Mathematik I Donnerstag, den 29.02.2008 um 14 Uhr Aufgabenblätter Füllen Sie das Deckblattvollständigaus. Prüfen Sie, ob die Klausur 8 Aufgaben enthält.. Kennzeichnen Sie alle verwendeten

Mehr

Wichtige Themen aus der Vorlesung Bioinformatik II SS 2014

Wichtige Themen aus der Vorlesung Bioinformatik II SS 2014 Universität des Saarlandes FR 6.2 Informatik Prof. Dr. Hans-Peter Lenhof M. Sc. Daniel Stöckel M. Sc. Patrick Trampert M. Sc. Lara Schneider Wichtige Themen aus der Vorlesung Bioinformatik II SS 2014 Hinweis:

Mehr

Aufbau und Konformation von Polypeptiden

Aufbau und Konformation von Polypeptiden 1 Aufbau und Konformation von Polypeptiden Peter Güntert, Sommersemester 2009 Hierarchie von Proteinstrukturen Primärstruktur: Aminosäuresequenz Sekundärstruktur: Helices, Faltblätter, Turns, Loops Tertiärstruktur:

Mehr

3. Approximation von Funktionen und Extremwertprobleme im R n

3. Approximation von Funktionen und Extremwertprobleme im R n 3. Approximation von Funktionen und Extremwertprobleme im R n Wie in D ist es wichtig Funktionen mit mehreren Variablen durch Polynome lokal approximieren zu können. Polynome lassen sich im Gegensatz zu

Mehr

(d) das zu Grunde liegende Problem gut konditioniert ist.

(d) das zu Grunde liegende Problem gut konditioniert ist. Aufgabe 0: (6 Punkte) Bitte kreuzen Sie die richtige Lösung an. Es ist jeweils genau eine Antwort korrekt. Für jede richtige Antwort erhalten Sie einen Punkt, für jede falsche Antwort wird Ihnen ein Punkt

Mehr

Klausur zu Analysis II - Lösungen

Klausur zu Analysis II - Lösungen Mathematisches Institut der Heinrich-Heine-Universität Düsseldorf Dr. Axel Grünrock WS 1/11 11..11 Klausur zu Analysis II - Lösungen 1. Entscheiden Sie, ob die folgenden Aussagen richtig oder falsch sind.

Mehr

3 Proteinstrukturen. Modul Bioinformatik von RNA- und Proteinstrukturen. Stephan Bernhart. 5. Mai Professur Bioinformatik

3 Proteinstrukturen. Modul Bioinformatik von RNA- und Proteinstrukturen. Stephan Bernhart. 5. Mai Professur Bioinformatik 3 Proteinstrukturen Modul 10-202-2208 Bioinformatik von RNA- und Proteinstrukturen Stephan Bernhart Professur Bioinformatik 5. Mai 2014 Stephan Bernhart (Professur Bioinformatik) 3 Proteinstrukturen 5.

Mehr

Signalverarbeitung 2. Volker Stahl - 1 -

Signalverarbeitung 2. Volker Stahl - 1 - - 1 - Hidden Markov Modelle - 2 - Idee Zu klassifizierende Merkmalvektorfolge wurde von einem (unbekannten) System erzeugt. Nutze Referenzmerkmalvektorfolgen um ein Modell Des erzeugenden Systems zu bauen

Mehr

Hinweis. Vorlesungs-Mitschnitt (WS 2008/9) Prof. Ulrik Brandes Algorithmen und Datenstrukturen Video (26 Episoden)

Hinweis. Vorlesungs-Mitschnitt (WS 2008/9) Prof. Ulrik Brandes Algorithmen und Datenstrukturen Video (26 Episoden) Hinweis Vorlesungs-Mitschnitt (WS 2008/9) Prof. Ulrik Brandes Algorithmen und Datenstrukturen Video (26 Episoden) https://streaming.uni- konstanz.de/archive/vorlesungen/wintersemester- 2008/algorithmen-und-datenstrukturen/

Mehr

Statistische Verfahren:

Statistische Verfahren: Statistische Verfahren: Hidden-Markov-Modelle für Multiples Alignment Stochastic Context-Free Grammars (SCFGs) für RNA-Multiples Alignment Übersicht 1 1. Hidden-Markov-Models (HMM) für Multiples Alignment

Mehr

Diagnostische Verfahren

Diagnostische Verfahren 6. Diagnostische s Jede Registrierung oder Auswertung einer Information mit dem Ziel der Erkennung einer Erung oder eines speziellen Zustandes wird diagnostischer genannt. Beispiele Reaktion auf Ansprechen

Mehr

Statistische Methoden in der Bioinformatik

Statistische Methoden in der Bioinformatik Statistische Methoden in der Bioinformatik Prof. Dr. Jörg Rahnenführer Raum 720 Email: rahnenfuehrer@statistik. tu-.de Voraussetzungen: Vordiplom in Statistik, Mathematik, Datenanalyse, Informatik Zeiten

Mehr

Landau-Theorie der Phasenumwandlung von Membranen

Landau-Theorie der Phasenumwandlung von Membranen Landau-Theorie der Phasenumwandlung von Membranen Vorbemerkung Vorbemerkung: Um Einblick in die thermodynamischen aber auch strukturellen Eigenschaften von Lipidschichten zu erhalten, ist die klassische

Mehr

Informatik IIa: Modellierung

Informatik IIa: Modellierung Informatik IIa: Modellierung Frühlingssemester 2011 Übung 3: Steuerflussmodelle, UML Kapitel 4, 5 Ausgabe: 19.03.2013 Abgabe: 09.04.2013 Name: Matrikelnummer: Aufgabe 1 Wissensfragen zu Steuerflussmodellen

Mehr

11. Übung Algorithmen I

11. Übung Algorithmen I Timo Bingmann, Christian Schulz INSTITUT FÜR THEORETISCHE INFORMATIK, PROF. SANDERS KIT Timo Universität Bingmann, des LandesChristian Baden-Württemberg Schulz und nationales Forschungszentrum in der Helmholtz-Gemeinschaft

Mehr

Alexander Garvin Klenner

Alexander Garvin Klenner 9RUKHUVDJHXQG9LVXDOLVLHUXQJYRQ3URWHLQIDOWXQJ Alexander Garvin Klenner Abb. 1: menschliches Insulin [ Grafik erstellt mit RasMol by Sayle ] $EVWUDFW Diese Arbeit befasst sich mit der Vorhersage und Visualisierung

Mehr

Lineare Algebra und Numerische Mathematik für D-BAUG

Lineare Algebra und Numerische Mathematik für D-BAUG R Käppeli L Herrmann W Wu Herbstsemester 26 Lineare Algebra und Numerische Mathematik für D-BAUG ETH Zürich D-MATH Beispiellösung für Serie 2 Aufgabe 2 Welche der folgenden Aussagen sind korrekt? (i) Jedes

Mehr

1. XOR: Mit folgender Architektur geht es. x 1. x n-dimensionale Lernprobleme mit einer n-2-1-architektur lösen ...

1. XOR: Mit folgender Architektur geht es. x 1. x n-dimensionale Lernprobleme mit einer n-2-1-architektur lösen ... 1. XOR: Mit folgender Architektur geht es x 1 x 2 2. n-dimensionale Lernprobleme mit einer n-2-1-architektur lösen x 1 x 2... x 2 Loading-Problem: Für eine endliche Liste binärer Trainingspaare (x(1),d(1)),l,(x(k)d(k))

Mehr

Das Verfahren der FMF Deutschland zur Berechnung des Risikos von Chromosomenanomalien im 1. Trimester der Schwangerschaft. Erläuterungen zu den DoE

Das Verfahren der FMF Deutschland zur Berechnung des Risikos von Chromosomenanomalien im 1. Trimester der Schwangerschaft. Erläuterungen zu den DoE Das Verfahren der FMF Deutschland zur Berechnung des Risikos von Chromosomenanomalien im 1. Trimester der Schwangerschaft Erläuterungen zu den DoE Susanne Richter - Product Manager Prenatal Screening,

Mehr

Schriftlicher Test Teilklausur 2

Schriftlicher Test Teilklausur 2 Technische Universität Berlin Fakultät IV Elektrotechnik und Informatik Künstliche Intelligenz: Grundlagen und Anwendungen Wintersemester 2012 / 2013 Albayrak, Fricke (AOT) Opper, Ruttor (KI) Schriftlicher

Mehr

Serie 12: Eigenwerte und Eigenvektoren

Serie 12: Eigenwerte und Eigenvektoren D-ERDW, D-HEST, D-USYS Mathematik I HS 5 Dr Ana Cannas Serie : Eigenwerte und Eigenvektoren Bemerkung: Die Aufgaben dieser Serie bilden den Fokus der Übungsgruppen vom 7 und 9 Dezember Finden Sie für folgende

Mehr

Mathematik 2 für Naturwissenschaften

Mathematik 2 für Naturwissenschaften Hans Walser Mathematik 2 für Naturwissenschaften 2 3 3 4 6 4 5 0 0 5 6 5 20 5 6 Tabellen (leicht gekürzte Version) Hans Walser: Tabellen ii Inhalt Binomische Verteilung.... Binomische Verteilung (ohne

Mehr

ERASMUS Programme Stand Oktober Teaching and Courses University of Osnabrück School of Biology

ERASMUS Programme Stand Oktober Teaching and Courses University of Osnabrück School of Biology ERASMUS Programme Stand Oktober 201 Teaching and Courses University of Osnabrück School of Biology Summer Semester English courses/german courses (in English if requested) *V: Vorlesung (Lecture); S: Seminar

Mehr

Studying Invisible Excited Protein States in Slow Exchange with a Major State Conformation

Studying Invisible Excited Protein States in Slow Exchange with a Major State Conformation Studying Invisible Excited Protein States in Slow Exchange with a Major State Conformation JACS 2012 Pramodh Vallurupalli, Guillaume Bouvignies, and Lewis E. Kay MR-Seminar Nina Kubatova 1 13.10.2014 Inhaltverzeichnis

Mehr

Logistische Regression

Logistische Regression Logistische Regression Markus Kalisch 30.09.2014 1 Big Picture: Statistisches Lernen Supervised Learning (X,Y) Unsupervised Learning X VL 7, 11, 12 Regression Y kontinuierlich VL 1, 2, 4, 5, 6 Klassifikation

Mehr

Proteine V: Flexibilität. Funktion und Struktur Dynamik marginale Stabilität Abbau

Proteine V: Flexibilität. Funktion und Struktur Dynamik marginale Stabilität Abbau Proteine V: Flexibilität Funktion und Struktur Dynamik marginale Stabilität Abbau 135 Flexibilität: Experiment und Rechnung NMR: mehrere Modelle X-ray: Temperaturfaktoren Molekulardynamik: löse Newton'sche

Mehr

Liebe Schüler der zukünftigen 7. Klassen des Marie-Curie- Gymnasiums

Liebe Schüler der zukünftigen 7. Klassen des Marie-Curie- Gymnasiums Marie-Curie-Gymnasium Waldstrasse 1a 16540 Hohen Neuendorf Tel.: 03303/9580 Liebe Schüler der zukünftigen 7. Klassen des Marie-Curie- Gymnasiums Um euch den Einstieg in den Mathematikunterricht zu erleichtern,

Mehr

Prüfung zur Vorlesung Mathematik I/II

Prüfung zur Vorlesung Mathematik I/II Prof. Dr. E. W. Farkas ETH Zürich, August 2009 D BIOL, D CHAB Prüfung zur Vorlesung Mathematik I/II Bitte ausfüllen! Name: Vorname: Bitte nicht ausfüllen! Aufgabe Punkte Kontrolle 1 2 3 4 5 6 Total Vollständigkeit

Mehr

Elementare Beweismethoden

Elementare Beweismethoden Elementare Beweismethoden Christian Hensel 404015 Inhaltsverzeichnis Vortrag zum Thema Elementare Beweismethoden im Rahmen des Proseminars Mathematisches Problemlösen 1 Einführung und wichtige Begriffe

Mehr

Zusammenfassung Tutorien der Woche ALDABI

Zusammenfassung Tutorien der Woche ALDABI Zusammenfassung Tutorien der Woche 27.-31. 01. 2014 ALDABI Markov-Ketten: Viele Ereignisse schon in unserem Alltag beeinflussen sich gegenseitig, können also als Ablauf oder Kette von Ereignissen gesehen

Mehr

2. Klausur zur Funktionentheorie SS 2009

2. Klausur zur Funktionentheorie SS 2009 Aufgabe : Finden Sie ein Beispiel für eine meromorphe Funktion f M(C), die auf den Kreisringen A 0, (0) und A,2 (0) unterschiedliche Laurentreihenentwicklungen besitzt. Beweisen Sie, dass Ihr Beispiel

Mehr

Diagnostikstudien. Dr. Dirk Hasenclever IMISE, Leipzig.

Diagnostikstudien. Dr. Dirk Hasenclever IMISE, Leipzig. Diagnostikstudien Dr. Dirk Hasenclever IMISE, Leipzig Hasenclever@IMISE.uni-Leipzig.de Diagnostische Tests Krankheit ja Krankheit nein Test positiv TrueP FP Test negativ FN TrueN Test- Positive Test- Negative

Mehr