Rainer Merkl und Stephan Waack Bioinformatik Interaktiv

Größe: px
Ab Seite anzeigen:

Download "Rainer Merkl und Stephan Waack Bioinformatik Interaktiv"

Transkript

1

2

3 Rainer Merkl und Stephan Waack Bioinformatik Interaktiv

4 Beachten Sie bitte auch weitere interessante Titel zu diesem Thema Helms, V. Principles of Computational Cell Biology From Protein Complexes to Cellular Networks 2008 ISBN: Ziegler, A., Koenig, I. R., Pahlke, F. A Statistical Approach to Genetic Epidemiology Second, Completely Revised and Enlarged Edition 2009 ISBN: Dehmer, M., Emmert-Streib, F. (Hrsg.) Analysis of Complex Networks From Biology to Linguistics 2009 ISBN: Emmert-Streib, F., Dehmer, M. (Hrsg.) Analysis of Microarray Data A Network-Based Approach 2008 ISBN: Alberts, B., Johnson, A., Lewis, J., Raff, M., Roberts, K., Walter, P. Molekularbiologie der Zelle 2008 ISBN:

5 Rainer Merkl und Stephan Waack Bioinformatik Interaktiv Grundlagen, Algorithmen, Anwendungen 2., erweiterte und neubearbeitete Auflage

6 Autoren PD Dr. Rainer Merkl Institut får Biophysik und Physikalische Biochemie Universitåt Regensburg Universitåtsstraße Regensburg Prof. Dr. Stephan Waack Institut får Informatik Georg-August-Universitåt Goldschmidtstraße GÇttingen 2. erw. u. neubearb. Auflage 2009 Alle BÅcher von Wiley-VCH werden sorgfåltig erarbeitet. Dennoch Åbernehmen Autoren, Herausgeber und Verlag in keinem Fall, einschließlich des vorliegenden Werkes, får die Richtigkeit von Angaben, Hinweisen und Ratschlågen sowie får eventuelle Druckfehler irgendeine Haftung. Bibliografische Information der Deutschen Nationalbibliothek Die Deutsche Nationalbibliothek verzeichnet diese Publikation in der Deutschen Nationalbibliografie; detaillierte bibliografische Daten sind im Internet Åber abrufbar. c 2009 WILEY-VCH Verlag GmbH & Co. KGaA, Weinheim Alle Rechte, insbesondere die der Ûbersetzung in andere Sprachen, vorbehalten. Kein Teil dieses Buches darf ohne schriftliche Genehmigung des Verlages in irgendeiner Form durch Photokopie, Mikroverfilmung oder irgendein anderes Verfahren reproduziert oder in eine von Maschinen, insbesondere von Datenverarbeitungsmaschinen, verwendbare Sprache Åbertragen oder Åbersetzt werden. Die Wiedergabe von Warenbezeichnungen, Handelsnamen oder sonstigen Kennzeichen in diesem Buch berechtigt nicht zu der Annahme, dass diese von jedermann frei benutzt werden dårfen. Vielmehr kann es sich auch dann um eingetragene Warenzeichen oder sonstige gesetzlich geschåtzte Kennzeichen handeln, wenn sie nicht eigens als solche markiert sind. Satz Hagedorn Kommunikation GmbH, Viernheim Druck Strauss GmbH, MÇrlenbach Bindung Litges & Dopf GmbH, Heppenheim Umschlaggestaltung Adam Design, Weinheim Printed in the Federal Republic of Germany Gedruckt auf såurefreiem Papier ISBN:

7 Inhaltsverzeichnis V Inhaltsverzeichnis Vorwort Website XV XVII 1 Biologische Grundlagen DNA Genetischer Code und Genomkomposition Transkription RNA Proteine Peptidbindung Konformation von Aminosåureseitenketten Ramachandran-Plot Hierarchische Beschreibung von Proteinstrukturen Sekundårstrukturelemente a-helix b-faltblåtter Supersekundårstrukturelemente Protein-Domånen Proteinfamilien Fachbegriffe Zitierte Literatur 25 2 Sequenzen und ihre Funktion Definitionen und Operatoren DNA-Sequenzen Proteinsequenzen Vergleich der Sequenzkomposition Ontologien Semantische Øhnlichkeit von GO-Termen Zitierte Literatur 40 Bioinformatik Interaktiv. 2. Auflage. Rainer Merkl und Stephan Waack Copyright c 2009 WILEY-VCH Verlag GmbH & Co. KGaA, Weinheim ISBN:

8 VI Inhaltsverzeichnis 3 Datenbanken DNA-Sequenz-Datenbanken RNA-Sequenz-Datenbanken Proteinsequenz-Datenbanken Proteinstruktur-Datenbanken SMART: Analyse der Domånenarchitektur STRING: Proteine und ihre Interaktionen SCOP: Strukturelle Klassifikation von Proteinen Pfam: Kompilation von Proteinfamilien COG und eggnog: Gruppen orthologer Gene Weitere Datenbanken Zitierte Literatur 54 4 Grundbegriffe der Stochastik Grundbegriffe der beschreibenden Statistik Urnenexperimente und diskrete Verteilungen Die Kolmogoroffschen Axiome Bedingte Wahrscheinlichkeit und Unabhångigkeit Zufallselemente Unabhångigkeit von Zufallselementen Markov-Ketten Erwartungswerte Varianzen Wichtige Wahrscheinlichkeitsverteilungen Diskrete Verteilungen Totalstetige Verteilungen Schåtzer Grundlagen statistischer Tests Eine optimale Entscheidungstheorie: Die Neyman-Pearson-Methode Zitierte Literatur 87 5 Bayessche Entscheidungstheorie und Klassifikatoren Bayessche Entscheidungstheorie Ein Beispiel: Klassifikation der Proteinoberflåche Ûbergang zu bedingten Wahrscheinlichkeiten Erweitern auf m Eigenschaften Marginalisieren Boosting ROC-Kurven Gewichten der Fehlklassifikationen Aufnehmen einer ROC-Kurve Testmethoden får kleine Trainingsmengen Zitierte Literatur 104

9 Inhaltsverzeichnis VII 6 Klassische Cluster- und Klassifikationsverfahren Metriken und Clusteranalyse Das mittlere Fehlerquadrat als GÅtemaß bei Clusteralgorithmen Ein einfaches iteratives Clusterverfahren k-means-clusterverfahren Wahl einer geeigneten Anzahl k von Clustern Statistische Bewertung der Clusteranzahl Hierarchische Clusterverfahren Nåchster-Nachbar-Klassifikation k nåchste Nachbarn Zitierte Literatur Neuronale Netze Architektur von neuronalen Netzen Das Perzeptron Schwellenwertfunktion Ein Beispiel: Modellierung Boolscher Funktionen LÇsbarkeit von Klassifikationsaufgaben Universelle Approximation Lernen in neuronalen Netzen Der Backpropagation-Algorithmus Interpretation des Lernschrittes Codierung der Eingabe Selbstorganisierende Karten Aufbau der Karte Selbstorganisation Zitierte Literatur Genetische Algorithmen Objekte und Funktionen Algorithmus Der Begriff des Schemas Dynamik der Anzahl von Schemata Codierung der Problemstellung Genetisches Programmieren Zitierte Literatur Paarweiser Sequenzvergleich Dotplots Definition Beispiel Implementierung Abschåtzen der Laufzeit Anwendungen Einschrånkungen und Ausblick 162

10 VIII Inhaltsverzeichnis 9.2 Entwicklung eines optimalen Alignmentverfahrens Vom paarweisen zum multiplen Sequenzalignment Dynamisches Programmieren Distanz, Metrik Minkowski-Metrik Eine Metrik får Zeichenketten: Die Hamming-Distanz Levenshtein-Distanz Berechnung der Levenshtein-Distanz Ableiten des Alignments Bestimmen der Øhnlichkeit von Sequenzen Globales Alignment Lokales Sequenzalignment Optimales Bewerten von LÅcken Bewertung mithilfe affiner Kostenfunktion Integration in Algorithmen Namensgebung Zitierte Literatur Sequenz-Motive Signaturen Die PROSITE-Datenbank Die BLOCKS-Datenbank Sequenz-Profile Bestimmen von Scores får Promotor-Sequenzen Sequenz-Logos Konsensus-Sequenzen Sequenzen niedriger Komplexitåt Der SEG-Algorithmus Zitierte Literatur Scoring-Schemata Zur Theorie von Scoring-Matrizen Algorithmen bedingte Anforderung an Scoring-Matrizen Identitåtsmatrizen PAM-Einheit PAM-Matrizen Erweiterte Datenbasis: Die JTT-Matrix BLOSUM-Matrizen Matrix-Entropie Scoring-Schemata und Anwendungen Scoring-Funktionen Zitierte Literatur 210

11 Inhaltsverzeichnis IX 12 FASTA, BLAST, PSI-BLAST FASTA FASTA-Statistik BLAST Statistik von Alignments Statistik globaler Alignments Statistik lokaler Alignments Vergleich der Empfindlichkeit von FASTA und BLAST Verfeinerung der Algorithmen Profil basierter Sequenzvergleich Verwenden von Intermediårsequenzen PSI-BLAST Die Empfindlichkeit von Sequenzvergleichsmethoden Vergleich von Profilen und Konsensus-Sequenzen Zitierte Literatur Multiple Sequenzalignments Berechnen von Scores får multiple Sequenzalignments Iteratives, progressives Bestimmen eines multiplen Alignments ClustalW: Konzepte ClustalW: Algorithmus ClustalW: Multiples Sequenzalignment får Trypsin-Inhibitoren T-Coffee M-Coffee und 3D-Coffee Alternative Ansåtze Verwenden von MSAs zur Charakterisierung von Residuen Entwickeln der Scoring-Funktion SDPpred: Vergleich homologer Proteine mit unterschiedlicher Spezifitåt Alignment von DNA- und RNA-Sequenzen Zitierte Literatur Grundlagen phylogenetischer Analysen Phylogenetische Ansåtze Distanz basierte Verfahren Ultrametrische Matrizen Additive Matrizen Linkage-Algorithmen Der Neighbour-Joining-Algorithmus Parsimony-Methoden Konstruktion eines Parsimony-Baumes Maximum-Likelihood-Ansåtze Ûbergangswahrscheinlichkeiten får DNA-Sequenzen Empirische Modelle der Protein-Evolution Berechnen der Likelihood eines Baumes 278

12 X Inhaltsverzeichnis Quartett-Puzzle Grundannahmen phylogenetischer Algorithmen Phylogenetische Analyse und statistische Bewertung Verwenden von Outgroups Das Bootstrap-Verfahren Weitere phylogenetische Ansåtze und Resultate Zitierte Literatur Hidden-Markov-Modelle Eine Problem orientierte EinfÅhrung Markov-Modelle Ergodische Markovsche Ketten Die Kolmogorov-Chapman-Gleichungen Klassifikation der Zustånde Stationåre Verteilungen Ergodizitåt von Quellen Fazit Niveau und Macht einfacher Tests Exkurs: Grenzwertsåtze Diskrimination von CpG-Inseln Ansåtze zur Lokalisierung von CpG-Inseln Der Begriff des Hidden-Markov-Modells Wichtige Algorithmen får HMMs Der Vorwårtsalgorithmus Der Viterbi-Algorithmus Der RÅckwårtsalgorithmus Die A-posteriori-Wahrscheinlichkeit der Zustånde Das zeitweise unehrliche Casino Das Rekonstruktionsproblem får HMMs Ein Maximum-Likelihood-Schåtzer Der Baum-Welch-Algorithmus zur Parameterschåtzung Zitierte Literatur Profil-HMMs zur Modellierung von Proteinfamilien Profil-HMMs Viterbi-Pfade in Profil-HMMs Eine LÇsung des Anfrageproblems Vorwårts- und RÅckwårtsvariablen Vom MSA zum Profil-HMM Zitierte Literatur Bedingte Markovsche Zufallsfelder Markierungsprobleme und ME-Prinzip Umfang eines Markierungsproblems Merkmale 374

13 Inhaltsverzeichnis XI Maximierung der bedingten Entropie als Induktionsprinzip ML-Parameterbestimmung Der Satz von Hammersley und Clifford IIS-Algorithmus Linien-CRFs Precomputing Inferenz Training: Umsetzung des IIS-Algorithmus Zitierte Literatur Vorhersage der Sekundårstruktur Vorhersage der Proteinsekundårstruktur Erste Ansåtze: Chou-Fasman PHD Profil basierte Vorhersage Vorgehensweise in PHD Die Entwicklung und Validierung der Konformation von PHD Trainieren der neuronalen Netze Validierung mit Leave-one-out-Verfahren Vorhersage der RNA-Sekundårstruktur RNA-Sequenzen und -Strukturen Freie Energie und Strukturen Vorhersage der Sekundårstruktur durch Energieminimierung Strukturen mit Schleifen BerÅcksichtigung von Stacking-Interaktionen Rekursionsgleichungen mit Stacking-Interaktionen STAR: Vorhersage der Sekundårstruktur unter Verwendung eines genetischen Algorithmus Erste Version des Modells Zweite Version: Modellierung der RNA-Faltung Ergebnisse Weitere Verfahren zur Vorhersage von Strukturen mit Pseudoknoten Zitierte Literatur Vergleich von Protein-3D-Strukturen Vergleich zweier Protein-3D-Strukturen Superposition von Protein-3D-Strukturen SAP: Vergleich von 3D-Strukturen mithilfe von VektorbÅndeln Simulated Annealing Superposition mithilfe von DALI Scores får Substrukturen Alignieren von Substrukturen TM-Align Zitierte Literatur 427

14 XII Inhaltsverzeichnis 20 Homologiemodellierung und Vorhersage der Protein-3D-Struktur Verwenden von Threading-Verfahren Eine Profil-Methode: 3D-1D-Profile Bestimmen der Umgebungen Generieren eines 3D-1D-Profils Wissensbasierte Kraftfelder Theoretische Grundlagen Ableiten der Potenziale GenThreader D-PSSM Generieren einer Profil-Bibliothek Erstellen einer 3D-PSSM Prozessieren der Query Strukturvorhersage Beitrag individueller Parameter HHsearch Grundlagen des Alignments von Hidden-Markov-Ketten Paarweises Alignment von HMMs Performanz von HHsearch Strukturvorhersage mit HHsearch ROSETTA/ROBETTA Energieterme De novo Strukturvorhersage mit ROSETTA Alternativen zur Fragmentinsertion Modellieren strukturell variabler Regionen in Homologiemodellen Weitere Ansåtze Zitierte Literatur Analyse integraler Membranproteine Struktur integraler Membranproteine Spezifische Probleme beim Sequenzvergleich Vorhersage der Topologie von Helix-BÅndeln HMMTOP: das Topologiemodell HMMTOP: Architektur des HMMs Vorhersage der Topologie und Struktur von b-fåssern Architektur von TMBpro Ausgabe und Performanz von TMBpro Gegenwårtiger Stand bioinformatischer Methoden Zitierte Literatur EntschlÅsselung von Genomen Shotgun-Sequenzierung Die Anzahl von Contigs beim Shotgun-Ansatz Basecalling Assemblieren von Teilsequenzen 488

15 Inhaltsverzeichnis XIII Phase 1: Bestimmen Åberlappender Pråfix-/Suffix-Regionen Phase 2: Erzeugen von Contigs Phase 3: Generieren der Konsensus-Sequenz Annotation kompletter Genome Metagenomik Spezielle Anforderungen an die Bioinformatik Minimalanforderungen får Metagenom-Annotation Zitierte Literatur Auswertung von Genexpressionsdaten DNA-Chip-Technologie Datenbanken får Genexpressionsdaten Grenzen der Technologie Bioinformatische Analyse von DNA-Chip-Signalen Quantifizierung von Expressionswerten Normalisierung und Datenreduktion Normalisierung Åber Replikate Identifizieren differentiell exprimierter Gene Metriken zum Vergleich von Expressionsdaten Algorithmen får die Analyse kompletter DNA-Chip-Datensåtze Anwendung von Clusterverfahren auf Genexpressionsdaten Validierung und Alternativen Hauptkomponentenanalyse Biclusterverfahren Ein Beispiel får Biclusterverfahren: ISA Der Signatur-Algorithmus Iterative Optimierung Grenzen und Alternativen Genexpressions-Profiling Wårmekarten Der klassische Ansatz Kombination von Datenquellen mithilfe von ClusCor Informationsgewinnung får systembiologische Fragestellungen BÅndelung von Datenbankinformation Statistische Analyse der Termverteilung Verwendbarkeit des Verfahrens Zitierte Literatur Analyse von Protein-Protein-Interaktionen Biologische Bedeutung des Interaktoms Methoden zum Bestimmen des Interaktoms Anforderungen an Datenbanksysteme Analyse des Genominhaltes Genfusion Phyletische Muster 539

16 XIV Inhaltsverzeichnis Analyse von Genfolgen Performanz Sequenz basierter Methoden Bewertung von Codon-Håufigkeiten Suche nach korrelierten Mutationen Generieren von sortierten MSA-Paaren Identifizieren korrelierter Mutationen Vergleich phylogenetischer Båume Die Mirror-tree-Methode Korrektur des Hintergrundsignals Vorhersage des Interaktoms der Hefe mithilfe eines Bayesschen Klassifikators Zitierte Literatur Zum Schluss Zitierte Literatur 559 Stichwortverzeichis 561

17 Vorwort XV Vorwort Im vergangenen Jahrhundert hat sich in der biologischen Forschung der reduktionistische Ansatz als besonders erfolgreich erwiesen. Damit ist der Versuch gemeint, komplexe Lebensphånomene als vernetztes Zusammenwirken einfacher, in der Sprache der Physik oder Chemie beschriebener Vorgånge zu verstehen. Allerdings ist mittlerweile klar geworden, dass Lebensvorgånge mit solchen top down Ansåtzen, d. h. der Zerlegung komplexer Vorgånge in einfachere, nicht vollståndig zu verstehen sind. Daher gewinnen bottom up Ansåtze zunehmend an Bedeutung. Diese versuchen, das Zusammenspiel der einzelnen Elemente in ihrer Gesamtheit zu modellieren. Die vielen -omik -Ansåtze und die Konzepte der Systembiologie zielen genau in diese Richtung. So sind die Ergebnisse der Genomik und der Transkriptomik mittlerweile zu einer festen GrÇße und zu einer wichtigen Quelle får weiterfåhrende Analyen und Åberraschende Einsichten geworden. Drei Beispiele sollen dies verdeutlichen: Die Sequenzierung des menschlichen Genoms hat gezeigt, dass der Mensch nicht, wie bisher angenommen, bis zu Gene, sondern nur besitzt. Diese Anzahl liegt nicht wesentlich hçher als die des Fadenwurms Caenorhabditis elegans, dessen Genom ca Gene umfasst. Dieses Ergebnis war får viele Wissenschaftler ein Schock, da bis dato genetische Komplexitåt direkt mit der Anzahl von Genen korreliert worden war. Der Befund hat einen Paradigmenwechsel ausgelçst; seither wird die Komplexitåt eines biologischen Systems an der Komplexitåt seiner Interaktionsnetzwerke gemessen. Das ENCODE-Projekt zielt darauf ab, alle funktionellen Elemente des menschlichen Genoms zu identifizieren. In der Pilotphase wurde Åberraschenderweise festgestellt, dass praktisch das komplette menschliche Genom abgelesen und in RNA Åbersetzt wird. Es wird angenommen, dass viele dieser MolekÅle in bisher unbekannter Weise in Regulationsvorgånge eingreifen. Die Sequenzierung des Schnabeltier-Genoms hat unter anderem ergeben, dass diese Art, obwohl sie Eier legt, die Gene får Milchproteine besitzt. Ihre Gift-Proteine und die Schlangengifte stammen von denselben Genfamilien ab, haben sich allerdings unabhångig entwickelt. Aus dem Vergleich molekularer Daten wurde abgeleitet, dass sich der Vorfahre des Schnabeltiers vor ca. 166 Millionen Jahren von der Linie abspaltete, die spåter zu den Såugetieren fåhrte. Wie werden derartige Befunde erhoben? Die får die Datenanalyse notwendigen Werkzeuge liefert die Bioinformatik, ein spezieller Zweig der Computerwissen- Bioinformatik Interaktiv. 2. Auflage. Rainer Merkl und Stephan Waack Copyright c 2009 WILEY-VCH Verlag GmbH & Co. KGaA, Weinheim ISBN:

18 XVI Vorwort schaft, der sich seit Mitte des zwanzigsten Jahrhunderts zunåchst kontinuierlich und in den letzten Jahren rasant entwickelte. Zu den ersten, eher bescheidenen Aufgaben, die Biologen an Mathematiker und Informatiker herantrugen, gehçrten die statistische Auswertung der wenigen, damals vorhandenen Sequenzen und deren Speicherung. Heutzutage werden sowohl får das Vorhalten der exponentiell wachsenden Datenmengen als auch får den Betrieb hochkomplexer Programmsuiten leistungsfåhige Server-Farmen bençtigt. Der Aufwand, der auf technischer und theoretischer Seite getrieben werden muss, um den berechtigten AnsprÅchen und Forderungen der Anwender zu genågen, ist enorm, bleibt aber meist hinter einfach zu bedienenden Grafikoberflåchen verborgen. Ebenso unbekannt ist den Nutzern håufig auch der Algorithmus, d. h. die Rechenvorschrift, die mit einem Mausklick angestoßen wird, sowie die Bedeutung der Programmparameter und deren Einfluss auf die Ergebnisse. Dies ist umso erstaunlicher, wenn man den Aufwand bedenkt, der Åblicherweise får die Planung molekularbiologischer Experimente getrieben wird. Es wåre zu erwarten, dass bei der AusfÅhrung bioinformatischer Analysen åhnlich gråndlich vorgegangen wårde. FÅr einen sicheren und souverånen Umgang mit bioinformatischen Tools sind derartige Kenntnisse jedoch unbedingt erforderlich. Nur wer die Eigenschaften und vor allem die Limitationen der Werkzeuge kennt, kann sie optimal einsetzen, ihre Ausgabe korrekt bewerten und die Algorithmen verbessern. Daher ist eine Beschåftigung mit den grundlegenden Methoden und speziellen Konzepten, die sich in der Bioinformatik entwickelt haben, får den Anwender sinnvoll und får diejenigen, die selbst bioinformatische Werkzeuge entwickeln wollen, unbedingte Voraussetzung. Der vorliegende Text will eine Ûbersicht zu den wichtigsten Methoden und LÇsungsansåtzen vermitteln. Einen großen Anteil nehmen Verfahren ein, die sich der Analyse von Sequenzen widmen, da sie die grçßten Datenbestånde ausmachen. Es wurde großer Wert auf eine praxisnahe Darstellung gelegt, in die viele Beispiele und Illustrationen eingestreut sind. Zusåtzlich wird auf einer Webseite Material får Ûbungen angeboten. Auch bei der Zusammenstellung der Ûbungen war es unser Ziel, den kritischen Umgang mit bioinformatischen Tools zu trainieren. Diese zweite Auflage wåre ohne die Mithilfe und die Anregungen vieler unserer Kollegen und Studenten nicht zu realisieren gewesen. Unser besonderer Dank gilt dem Verlag Wiley-VCH und insbesondere den Herren Dr. G. Cicchetti und Dr. A. Sendtko, die uns in allen Belangen stets tatkråftig unterståtzten. Regensburg und GÇttingen, Oktober 2009 Rainer Merkl und Stephan Waack

19 Website Auf einer speziellen Website werden Ûbungen angeboten, die interaktiv unter Verwendung eines Browsers und mithilfe frei verfågbarer Software, sowie unter Benutzung Çffentlich zugånglicher Server bearbeitet werden kçnnen. Verweise auf die wichtigsten Lerneinheiten sind bei den folgenden Kapiteln angegeben. Die Ûbungen haben einerseits das Ziel, das Erfassen der Algorithmen und Modelle weiter zu festigen und erlauben es andrerseits, Werkzeuge in konkreten Anwendungen praktisch zu erproben. Wir bemåhen uns, das Angebot der Dynamik des Internets anzupassen. Das Ûbungsmaterial finden Sie auf

20

21 Grundlagen Biologie und Datenbanken Bioinformatik Interaktiv. 2. Auflage. Rainer Merkl und Stephan Waack Copyright c 2009 WILEY-VCH Verlag GmbH & Co. KGaA, Weinheim ISBN:

22 Informationstragende MolekÅle: DNA, RNA, Proteine Sequenzen und ihre Funktion Bioinformatische Datenbanken Die Beschåftigung mit Algorithmen kann faszinieren. Dies gilt insbesondere dann, wenn komplexe und spannende Probleme zu lçsen sind. Zu dieser Kategorie von Aufgaben zåhlen sicherlich auch diejenigen, die an die Bioinformatik herangetragen werden. Håufig måssen aus einer schier nicht zu bewåltigenden DatenfÅlle verrauschte Signale herausgefiltert werden. Nur durch den Einsatz modernster Techniken und unter BerÅcksichtigung von Erkenntnissen aus der Mathematik, der Statistik und natårlich der Informatik ist es mçglich, bioinformatische Algorithmenentwicklung voranzutreiben. Zusåtzlich ist eine gewisse Vertrautheit mit den biologischen Strukturen und dynamischen Prozessen, die im Rechner nachzustellen sind, notwendig und hilfreich. Diese Grundlagen schaffen wir in Teil 1. Im folgenden Kapitel werden wichtige Eigenschaften von DNA, RNA, Aminosåuren und Proteinen erlåutert sowie solche Fakten zu biologischen Objekten und Prozessen eingefåhrt, die får das Verståndnis der im Text dargestellten biologischen Fragestellungen und informatischen LÇsungsansåtze bençtigt werden. Anschließend wird die Datenstruktur Sequenz mit der in der Biologie eingefåhrten Bedeutung vorgestellt. Wir werden uns mit Operationen auf Sequenzen sowie verschiedenen Alphabeten, die zur Codierung von DNA- und Proteinsequenzen definiert wurden, beschåftigen. Sequenzen bilden die Grundlage får viele der hier eingefåhrten Algorithmen; sie werden uns im gesamten Text ståndig begegnen. Die uns interessierenden Sequenzen haben eine biologische Funktion. FÅr deren Beschreibung werden zunehmend Ontologien genutzt. Wir erlåutern die Gen-Ontologie, mit der Genprodukte annotiert werden.muckel Schließlich beschåftigen wir uns mit bioinformatischen Datenbanken. So werden z. B. Sequenzen oder Proteinstrukturen sowie Wissen Åber ihre biologische Funktion, ihre Eigenschaften, ihr Vorkommen etc. in zentralen Datenbanken gesammelt. Diese stellen den Heiligen Gral der Bioinformatik dar. Praktisch bei jeder bioinformatischen Fragestellung wird in irgendeiner Weise auf Datenbanken und das darin deponierte Wissen zuråckgegriffen. Dies kann im Rahmen so unterschiedlicher Aufgaben erfolgen wie der statistischen Auswertung von Sequenzen, dem Vermessen von Reaktionszentren, der Identifizierung von Transkriptionsfaktoren oder der Analyse von Hochdurchsatz-Datensåtzen. Datenbanken bilden auch die Grundlage får das Generieren von Trainingsmengen, die bençtigt werden, um bioinformatische Werkzeuge zu validieren und zu optimieren. Die Qualitåt bioinformatischer Algorithmen, d. h. deren Ausgabe, muss sich messen lassen an den in den Datenbanken deponierten und durch biochemische Experimente abgesicherten Fakten. Zusåtzlich zu Sequenz- und Strukturdatenbanken ist eine FÅlle weiterer Datensammlungen entstanden. Wir werden einige der sogenannten sekundåren Datenbanken, in denen abgeleitetes Wissen aufbereitet wird, vorstellen. Dazu zåhlen Beschreibungen von Stoffwechselvorgången oder hierarchische Schemata zur Klassifikation von Proteinfamilien.

23 1.1 DNA 3 1 Biologische Grundlagen In den folgenden Kapiteln beschåftigen wir uns hauptsåchlich mit Algorithmen auf MakromolekÅlen. FÅr das Verståndnis der Methoden und Modellierungsansåtze bençtigen wir biologische Grundkenntnisse, die wir in diesem Kapitel einfåhren. Zu den wichtigsten molekularbiologischen Objekten gehçren DNA, RNA und Proteine. Dies sind MolekÅle, die jeweils aus kleineren, spezifischen Bausteinen aufgebaut sind. Deren lineare Abfolge kann in Form einer Zeichenkette (Sequenz) angegeben werden. Mit Sequenzen beschåftigen wir uns im folgenden Kapitel 2 genauer. Die DNA ist der wichtigste Datentråger der Molekularbiologie. Hochdurchsatzmethoden sind mittlerweile so verfeinert, dass die Zusammensetzung der DNA mit geringem Aufwand bestimmt werden kann. Proteine haben Funktionen sowohl als Umsetzung der Geninformation als auch bei der Weitergabe der Gene an die nachfolgenden Generationen. Die biologische Bedeutung der RNA hat sich durch Befunde der letzten Jahre stark veråndert. Es ist klar geworden, dass RNA-MolekÅle in erheblichem Ausmaß an Regulationsaufgaben beteiligt sind. In vivo liegen DNA, RNA und Proteine als dreidimensionale Strukturen vor. Neben der Beschreibung dieser Strukturen gehen wir im Folgenden auf solche Eigenschaften oder Prozesse ein, die in bioinformatischen Algorithmen von Bedeutung sind. Einen breiteren Raum nimmt die Darstellung von Proteinarchitekturen ein. Das Kapitel schließt mit einer Definition wichtiger Fachbegriffe. Drei wichtige MakromolekÅle: DNA, RNA, Proteine 1.1 DNA Im bioinformatischen Kontext stehen Sequenzen in der Regel får die Abfolge einer kleinen, definierten Menge von Einzelbausteinen. DNA-Sequenzen sind Modelle får MakromolekÅle der Desoxyribonucleinsåure (abgekårzt DNS oder DNA), die als fådige Struktur Bioinformatik Interaktiv. 2. Auflage. Rainer Merkl und Stephan Waack Copyright c 2009 WILEY-VCH Verlag GmbH & Co. KGaA, Weinheim ISBN:

24 4 1 Biologische Grundlagen Nucleotid Reverses Komplement: Sequenz des Gegenstranges vorliegt. Jeder Strang ist eine Folge von vier Einzelbausteinen (Nucleotide), diese bestehen jeweils aus x einem Zucker (in der DNA: Desoxyribose), x einer der Purin- oder Pyrimidinbasen Adenin, Guanin oder Cytosin, Thymin und x einem Phosphatrest. In der Zelle kommt DNA Åblicherweise in doppelstrångiger Form vor. Darin stehen sich Nucleotide paarweise gegenåber, wobei nur zwei Paarungen zugelassen sind (siehe Abb. 1.1 und Abb. 1.2). Aufgrund des chemischen Aufbaus der Nucleotide hat jeder DNA-Strang beliebiger Långe eine eindeutige Orientierung mit jeweils einem freien 3l-OH- und einem 5l-OH-Ende. Sequenzen werden nach Ûbereinkunft stets so geschrieben, dass das 5l-OH Ende links und das 3l-OH-Ende rechts steht. In vivo ist die DNA- Doppelhelix meist zu einem Ring geschlossen, z. B. in Chromosomen oder Plasmiden. Darin sind die beiden komplementåren DNA- Strånge gegenlåufig angeordnet. Die durch den Aufbau vorgegebene Orientierung bedingt die Richtung, in der Gene abgelesen werden. Da Gene auf beiden Strången codiert sein kçnnen, in Datensammlungen jedoch nur die Sequenz eines Stranges abgelegt wird, muss zur Bestimmung der Sequenz des Gegenstranges das reverse Komplement gebildet werden. Abb. 1.1 Raumstruktur der DNA. In der Abbildung ist die Doppelhelix gut zu erkennen. Die basischen Anteile der Nucleotide sind nach innen gerichtet und durch WasserstoffbrÅcken verknåpft. Außen verlaufen die Zucker-Phosphat- Anteile der polymerisierten Nucleotide.

25 1.2 Genetischer Code 5 Abb. 1.2 Basenpaarungen in der DNA. In der als Doppelhelix bekannten DNA-Struktur liegen sich jeweils paarweise die Basen Adenin und Thymin sowie Guanin und Cytosin gegenåber. Zwischen A:T-Paaren kçnnen zwei, zwischen G:C-Paaren drei WasserstoffbrÅcken ausgebildet werden. Je hçher der Anteil von G:C-Paaren, desto mehr Energie muss får das Trennen der beiden Strånge einer DNA- Doppelhelix aufgewendet werden. 1.2 Genetischer Code und Genomkomposition Die Sequenzinformation eines jeden Proteins ist in Form eines Gens in der DNA-Sequenz codiert. Jeweils drei direkt aufeinanderfolgende Nucleotide, die nicht Åberlappend abgelesen werden, codieren får eine Aminosåure. Eine solche Nucleotidgruppe wird Triplett oder Codon genannt. Die Abbildung der 64 Tripletts auf die 20 Aminosåuren heißt genetischer Code, dieser ist in Tabelle 1.1 dargestellt. Dieser Code ist quasi universell, abweichende Codonzuordnungen finden sich z. B. bei Mitochondrien, Mycoplasma und einigen Protozoen (Ûbersicht in [1]). Die Struktur der DNA legt die Lage der einzelnen Gene innerhalb einer DNA-Sequenz nicht fest, daher ergeben sich wegen der zwei mçglichen Ableserichtungen und der drei mçglichen Intervalle pro Leserichtung insgesamt sechs Leseraster. Prinzipiell kann jede Codonsequenz ein Gen codieren, sofern sie zwischen ein im selben Leseraster liegendes Start- und Stoppcodon eingebettet ist. Eine derartige Sequenz wird zur Unterscheidung von Genen (får die eine Funktion nachgewiesen ist) offenes Leseraster (open reading frame, ORF genannt. Basentriplett Codon Leseraster ORF

26 6 1 Biologische Grundlagen Tab. 1.1 Der genetische Code. Die Zahlen geben die Nucleotidposition im Codon an. In einigen speziellen Fållen, wie in mitochondrialen Genomen, kann es Abweichungen von diesem kanonischen Code geben. 2 T C A G 1 T TTT Phe TTC Phe TTA Leu TTG Leu TCT Ser TCC Ser TCA Ser TCG Ser TAT Tyr TAC Tyr TAA Stop TAG Stop TGT Cys TGC Cys TGA Stop TGG Trp T C A G 3 C CTT Leu CTC Leu CTA Leu CTG Leu CCT Pro CCC Pro CCA Pro CCG Pro CAT His CAC His CAA Gln CAG Gln CGT Arg CGC Arg CGA Arg CGG Arg T C A G A ATT Ile ATC Ile ATA Ile ATG Met ACT Thr ACC Thr ACA Thr ACG Thr AAT Asn AAC Asn AAA Lys AAG Lys AGT Ser AGC Ser AGA Arg AGG Arg T C A G G GTT Val GTC Val GTA Val GTG Val GCT Ala GCC Ala GCA Ala GCG Ala GAT Asp GAC Asp GAA Glu GAG Glu GGT Gly GGC Gly GGA Gly GGG Gly T C A G Beispiel Diese Situation wird im folgenden Beispiel klar. Je nach Leseraster resultieren aus derselben DNA-Sequenz unterschiedliche Proteinsequenzen: Leserichtung p...orf... Leserahmen 1..MetValGlyLeuSer*** 2.TyrGlyArgProGluLeu. 3 ValTrpSerAla***Val.. DNA, GTATGGTCGGCCTGAGTTAA (Doppelstrang) CATACCAGCCGGACTCAATT Leserahmen 4..HisAspAlaGlnThrLeu 5.IleThrProArgLeu***. 6 TyrProArgGlySerAsn.. n Leserichtung Im gezeigten Beispiel existiert genau ein ORF (hier im Leserahmen 1), dessen Lage durch ein Startcodon (Met) und ein Stoppcodon (durch *** markiert) definiert ist. In allen anderen Leserastern treten in der gezeigten Sequenz Stoppcodons auf oder es fehlt ein Startcodon. Gene haben allerdings in der Regel eine Långe von mehr als 80 Codonen.

27 1.2 Genetischer Code 7 Der Informationsgehalt I der drei Basenpositionen im Codon ist nicht gleich, es gilt I(Position 2) i I(Position 1) i I(Position 3) [2]. HierfÅr ist der genetische Code verantwortlich: Eine Mutation der dritten Base im Codon veråndert die Aminosåurenkomposition håufig nicht; eine Mutation in der ersten Basenposition fåhrt håufig zum Einbau einer Aminosåure mit åhnlichen Eigenschaften; eine Mutation der mittleren Base verursacht håufig den Einbau einer Aminosåure mit anderen Eigenschaften [1]. Die geringsten Auswirkungen auf die Aminosåurenkomposition der Proteine haben somit Verånderungen der Basenkomposition in Position 3 des Codons, gefolgt von Verånderungen der Basenkomposition an Position 1. Diese Befunde machen deutlich, dass simple statistische Konzepte nicht dazu geeignet sind, codierende Sequenzen adåquat zu modellieren. Der GC-Gehalt ist eine charakteristische GrÇße eines Genoms. In bakteriellen Genomen schwankt der GC-Gehalt zwischen 25 % und 75 %. In G:C-Basenpaaren werden drei WasserstoffbrÅckenbindungen ausgebildet, in A:T-Basenpaaren nur zwei; daher wurde vermutet, dass ein hoher GC-Gehalt des Genoms z. B. får thermophile [3] oder halophile [4] Organismen vorteilhaft wåre. Allerdings ist der GC-Gehalt phylogenetisch und nicht phånotypisch bedingt. Thermophile Organismen leben in Habitaten mit erhçhten Umgebungstemperaturen, halophile kommen in Umgebungen mit erhçhter Salzkonzentration vor. Der spezifische GC-Gehalt einer phylogenetischen Linie scheint durch evolutionåren Druck eingestellt zu werden [5]. Aus dem Vergleich des GC-Gehalts der Genome solcher Bakteriophagen, die ihr eigenes DNA-Replikationssystem, und solcher, die das Replikationssystem des Wirts Escherichia coli verwenden, mit dem GC-Gehalt des Genoms von Escherichia coli wurde geschlossen, dass der GC-Gehalt vom DNA-Replikationssystem moduliert wird [1]. Mutationen im mutt Gen von Escherichia coli induzieren Transversionen von A:T- nach G:C- Basenpaaren [6] und Mutationen im muty Gen Transversionen von G:C- nach A:T-Basenpaaren [7]. Die Genprodukte beider Gene sind an der DNA-Replikation bzw. DNA-Reparatur beteiligt. Codonen kommen nicht mit annåhernd gleicher Håufigkeit in Genen vor. Im Gegenteil, die Codonhåufigkeiten schwanken zwischen den taxonomischen Gruppen betråchtlich. Die Codonpråferenzen der beiden nahe verwandten Bakterien Escherichia coli und Salmonella typhimurium sind sich relativ åhnlich, Codonhåufigkeiten des Bakteriums Bacillus subtilis, das zu beiden eine große phylogenetische Distanz aufweist, sind auffållig anders. Codonen, die får dieselbe Aminosåure codieren, werden synonyme Codonen genannt. Synonyme Codonen treten ebenfalls nicht mit vergleichbarer Håufigkeit auf, einige werden bevorzugt Informationsgehalt der Basenpositionen ist unterschiedlich GC-Gehalt der Genome ist phylogenetisch bedingt Codonhåufigkeiten Synonyme Codonen codieren får dieselbe Aminosåure

28 8 1 Biologische Grundlagen Bevorzugte Codonen eingebaut. Daraus resultierende Unterschiede in der Håufigkeitsverteilung von kurzen Nucleotidketten kçnnen unter Verwendung statistischer Verfahren (Markov-Ketten) ausgenutzt werden, um die Lage von Genen vorherzusagen (z. B. im Programm Glimmer[8]). In Korrelation mit den ungleichmåßigen Codonhåufigkeiten treten Unterschiede in den Spezies spezifischen trna-konzentrationen auf. trna ist an der Translation, d. h. der RNA-instruierten Proteinsynthese, beteiligt. Der genetische Code wird als degeneriert (im Sinne der in der Atomphysik eingefåhrten Bedeutung) bezeichnet, da einige Aminosåuren durch mehrere (synonyme) Codonen codiert werden. Bei manchen Spezies variieren Codonhåufigkeiten zudem stark zwischen einzelnen Genen [9]. In bestimmten Genen tritt Spezies spezifisch eine Teilmenge der Codonen bevorzugt auf (Ûbersichten in [10] und [11]). Diese Verzerrung der Codonhåufigkeiten (codon usage bias) ist positiv korreliert mit der Genexpression [12]. MÇgliche Ursachen får diese Verzerrung der Codonhåufigkeiten sind die unterschiedlichen Konzentrationen der trnas [13, 14], die Aufrechterhaltung der maximalen Elongationsrate, die Kosten får das Korrekturlesen sowie unterschiedliche Translationsraten der Codonen [15]. Diese Verzerrung der Codonhåufigkeiten wird als Strate- Tab. 1.2 Gemittelte Codonhåufigkeiten im Genom von Escherichia coli K-12. Die Summe der Prozentwerte ergibt T C A G 1 T TTT 2.08 TTC 1.78 TTA 1.22 TTG 1.28 TCT 0.89 TCC 0.90 TCA 0.64 TCG 0.86 TAT 1.53 TAC 1.30 TAA 0.19 TAG 0.02 TGT 0.49 TGC 0.65 TGA 0.09 TGG 1.48 T C A G 3 C CTT 1.00 CTC 1.06 CTA 0.35 CTG 5.56 CCT 0.65 CCC 0.47 CCA 0.81 CCG 2.47 CAT 1.23 CAC 1.04 CAA 1.43 CAG 2.93 CGT 2.29 CGC 2.30 CGA 0.32 CGG 0.49 T C A G A ATT 2.91 ATC 2.64 ATA 0.36 ATG 2.80 ACT 0.91 ACC 2.42 ACA 0.59 ACG 1.37 AAT 1.58 AAC 2.28 AAA 3.47 AAG 1.07 AGT 0.76 AGC 1.59 AGA 0.16 AGG 0.11 T C A G G GTT 1.88 GTC 1.49 GTA 1.11 GTG 2.66 GCT 1.57 GCC 2.51 GCA 1.98 GCG 3.49 GAT 3.18 GAC 2.05 GAA 4.12 GAG 1.80 GGT 2.60 GGC 3.07 GGA 0.67 GGG 1.02 T C A G

29 1.3 Transkription 9 gie interpretiert, die Wachstumsraten zu optimieren [10]. Wie wir spåter sehen werden, sind Unterschiede in den Codonhåufigkeiten ein wichtiges Signal, das får bioinformatische Analysen genutzt wird. Bei Prokaryonten weisen Gene, die im Genom benachbart liegen, eine åhnliche codon usage auf. Es wurde gezeigt, dass aus der Øhnlichkeit von Codonhåufigkeiten eine Interaktion der Genprodukte vorhergesagt werden kann [16]. Zudem zeigen diese Befunde die komplexe Komposition codierender DNA-Sequenzen. In Tabelle 1.2 sind die gemittelten Codonhåufigkeiten angegeben, so wie sie im Genom des Bakteriums Escherichia coli K-12 vorkommen. Auffallend selten sind in diesem Genom die Codonen AGA, AGG und CTA. Codon usage von Escherichia coli K Transkription Ganz allgemein wird das Umschreiben eines Textes Transkription genannt. In Analogie hierzu wird die Produktion von mrna als Kopie eines Genabschnittes ebenso bezeichnet. Die får die Transkription notwendigen Enzyme sind die DNA-abhångigen RNA- Polymerasen. Bei der Transkription wird, anstelle von T (Thymin), in die mrna das Nucleotid U (Uracil) eingebaut. Das RNA- MolekÅl, das hierbei entsteht, wird Transkript genannt. Bei der RNA-Synthese måssen zwei Bedingungen eingehalten Bedingungen bei der werden: RNA-Synthese x Die Synthese muss unmittelbar vor einem Gen beginnen. x Es muss der sinntragende (codogene) Strang transkribiert werden. Das Einhalten dieser Bedingungen wird erreicht durch die bevorzugte Bindung von RNA-Polymerase an Erkennungsstellen (Pro- des Transkriptes Promotoren markieren Beginn motoren), die unmittelbar vor Genen liegen. Vergleicht man die Promotoren von Escherichia coli und bildet hieraus einen idealen Promotor, so fållt Folgendes auf: x In einem Bereich, der ca. 10 Basenpaare stromaufwårts des Transkriptionsstarts liegt, findet sich eine Sequenz, die håufig åhnlich zu TATA (-10-Region oder TATA-Box) ist. x In einem Bereich, der ca. 35 Basenpaare stromaufwårts vom Start liegt (-35-Region), befindet sich innerhalb eines AT-reichen Abschnittes eine Sequenz, die håufig åhnlich zu TTGACA ist.

30 10 1 Biologische Grundlagen Abb. 1.3 Konsensus-Sequenz von Escherichia coli Promotoren. Der untere der beiden DNA-Strånge wird transkribiert ab Position +1; nach [17]. DNA-Bindung von Transkriptionsfaktoren regelt RNA-Synthese Operon = Funktionseinheit Abbildung 1.3 zeigt einen idealisierten Promotor; von dessen Zusammensetzung weichen bekannte Promotoren mehr oder weniger stark ab. FÅr die Einleitung der Transkription ist es notwendig, dass Transkriptionsfaktoren an den Promotor oder an zusåtzliche Bindestellen wie Enhancer binden. In vielen Fållen ist das genaue Zusammenwirken dieser Faktoren nicht bekannt. Das Identifizieren von Promotoren mittels bioinformatischer Methoden hilft, mit hçherer Sicherheit Operons vorherzusagen. In prokaryontischen Genomen sind Gene håufig in Funktionseinheiten, den Operons, zusammengefasst. Diese bestehen aus einem Promotor und einer Menge von Genen. Deren Genprodukte sind meist Elemente einer grçßeren Funktionseinheit oder tragen zur selben Stoffwechselleistung bei. So finden sich die Gene, die an der Tryptophan-Biosynthese beteiligt sind, in einem Operon. 1.4 RNA Die Funktion der meisten RNA-MolekÅle ist unbekannt Bei hçheren Eukaryonten kennt man nur får einen kleinen Bruchteil des Genoms die genaue Funktion [18]. Zu den Genomabschnitten mit bekannter Funktion gehçren regulatorische Elemente wie Promotoren sowie die Gene, die får Proteine oder bestimmte RNA-Spezies codieren. FÅr die RNA war bisher eine Funktion als Transfer-RNA, als Komponente von Ribosomen (ribosomale RNA) oder von Spleißosomen gesichert. Der erheblich grçßere Rest des Genoms wurde håufig als Junk-DNA bezeichnet. JÅngste, genomweite Experimente im Rahmen des ENCODE-Projektes haben jedoch gezeigt, dass Tausende, nicht får Proteine codierende Transkripte (ncrnas) existieren, deren Bedeutung unklar ist. Diese Ergebnisse belegen får das Genom des Menschen [19] und der Maus, dass der grçßte Teil transkribiert wird. ncrnas werden in kleine interferierende RNAs, mikro-rnas und lange ncrnas eingeteilt. Letztere haben eine Långe von mehr als 200 Nucleotiden und stellen den grçßten Anteil. FÅr diese RNA-MolekÅle ist eine Beteiligung an der Organisation der Genomarchitektur und der Genexpression plausibel. Kleine RNA-MolekÅle sind an

Dendrogramm der Primaten

Dendrogramm der Primaten Arbeitsblatt 1 Dargestellt ist ein Ausschnitt der DNA-Sequenz für das Enzym NAD- Polymerase, dass bei den Primatenarten Mensch(M), Schimpanse(S), Gorilla(G), Orang-Utan(O) und Gibbon(Gi) vorhanden ist.

Mehr

Genannotation bei Prokaryoten

Genannotation bei Prokaryoten Genannotation bei Prokaryoten Maike Tech Abt. Bioinformatik Institut für Mikrobiologie und Genetik (IMG) Universität Göttingen 28. November 2005 Genetik von Pro- und Eukaryoten Eukaryoten Prokaryoten Zellkern

Mehr

Inhaltsverzeichnis. Vorwort. Website

Inhaltsverzeichnis. Vorwort. Website V Vorwort Website XV XVII 1 Biologische Grundlagen 3 1.1 DNA 3 1.2 Genetischer Code und Genomkomposition 5 1.3 Transkription 9 1.4 RNA 10 1.5 Proteine 11 1.6 Peptidbindung 13 1.7 Konformation von Aminosåureseitenketten

Mehr

Klausur zum Modul Molekularbiologie ILS, SS 2010 Freitag 6. August 10:00 Uhr

Klausur zum Modul Molekularbiologie ILS, SS 2010 Freitag 6. August 10:00 Uhr Klausur zum Modul Molekularbiologie ILS, SS 2010 Freitag 6. August 10:00 Uhr Name: Matrikel-Nr.: Code Nummer: Bitte geben Sie Ihre Matrikel-Nr. und Ihren Namen an. Die Code-Nummer erhalten Sie zu Beginn

Mehr

DNS-Modell Best.-Nr. 2015801

DNS-Modell Best.-Nr. 2015801 DNS-Modell Best.-Nr. 2015801 1. Produktvorstellung Ziel des Produktes Dieses Modell soll das DNS-Molekül visualisieren: es soll die Doppelspirale, Stickstoffbasen mit Wasserstoffbrückenbindung, Zucker-Phosphatskelette

Mehr

Biologie I/B: Klassische und molekulare Genetik, molekulare Grundlagen der Entwicklung Theoretische Übungen SS 2014

Biologie I/B: Klassische und molekulare Genetik, molekulare Grundlagen der Entwicklung Theoretische Übungen SS 2014 Biologie I/B: Klassische und molekulare Genetik, molekulare Grundlagen der Entwicklung Theoretische Übungen SS 2014 Fragen für die Übungsstunde 8 (14.07-18.07.) 1) Von der DNA-Sequenz zum Protein Sie können

Mehr

Bezeichnung Sequenz Verwendung

Bezeichnung Sequenz Verwendung 8 ANHANG i 8 ANHANG I Oligonukleotide Bezeichnung Sequenz Verwendung D256 5 -ATGGCAGACGGTGAGGATATTCA-3 5 Aktin AC1 (neu) D257 5 -GCCTTTGCAATCCACATCTGTTG-3 3 Aktin AC2 (neu) D98 5 -AT CC ATG GCA ATG TCA

Mehr

Audiospektrum- Analyse mit Mikrocontrollern

Audiospektrum- Analyse mit Mikrocontrollern PC & ELEKTRONIK Felix Irmscher Entwicklung und Programmierung in Assembler und LabVIEW Audiospektrum- Analyse mit Mikrocontrollern Analyseschaltungen mit dem ATmega644 einfach selbst entwickeln Auf CD-ROM:

Mehr

50. Mathematik-Olympiade 2. Stufe (Regionalrunde) Klasse 11 13. 501322 Lösung 10 Punkte

50. Mathematik-Olympiade 2. Stufe (Regionalrunde) Klasse 11 13. 501322 Lösung 10 Punkte 50. Mathematik-Olympiade. Stufe (Regionalrunde) Klasse 3 Lösungen c 00 Aufgabenausschuss des Mathematik-Olympiaden e.v. www.mathematik-olympiaden.de. Alle Rechte vorbehalten. 503 Lösung 0 Punkte Es seien

Mehr

MOL.504 Analyse von DNA- und Proteinsequenzen

MOL.504 Analyse von DNA- und Proteinsequenzen MOL.504 Analyse von DNA- und Proteinsequenzen Kurs 1 Monika Oberer, Karl Gruber MOL.504 Modul-Übersicht Einführung, Datenbanken BLAST-Suche, Sequenzalignment Proteinstrukturen Virtuelles Klonieren Abschlusstest

Mehr

Güte von Tests. die Wahrscheinlichkeit für den Fehler 2. Art bei der Testentscheidung, nämlich. falsch ist. Darauf haben wir bereits im Kapitel über

Güte von Tests. die Wahrscheinlichkeit für den Fehler 2. Art bei der Testentscheidung, nämlich. falsch ist. Darauf haben wir bereits im Kapitel über Güte von s Grundlegendes zum Konzept der Güte Ableitung der Gütefunktion des Gauss im Einstichprobenproblem Grafische Darstellung der Gütefunktionen des Gauss im Einstichprobenproblem Ableitung der Gütefunktion

Mehr

Rüdiger Zarnekow Lutz Kolbe. Green IT. Erkenntnisse und Best Practices aus Fallstudien

Rüdiger Zarnekow Lutz Kolbe. Green IT. Erkenntnisse und Best Practices aus Fallstudien Rüdiger Zarnekow Lutz Kolbe Green IT Erkenntnisse und Best Practices aus Fallstudien Green IT Rüdiger Zarnekow Lutz Kolbe Green IT Erkenntnisse und Best Practices aus Fallstudien Rüdiger Zarnekow Fachgebiet

Mehr

SEO Strategie, Taktik und Technik

SEO Strategie, Taktik und Technik SEO Strategie, Taktik und Technik Andre Alpar Markus Koczy Maik Metzen SEO Strategie, Taktik und Technik Online-Marketing mittels effektiver Suchmaschinenoptimierung Andre Alpar Maik Metzen Markus Koczy

Mehr

Musterlösung - Übung 5 Vorlesung Bio-Engineering Sommersemester 2008

Musterlösung - Übung 5 Vorlesung Bio-Engineering Sommersemester 2008 Aufgabe 1: Prinzipieller Ablauf der Proteinbiosynthese a) Erklären Sie folgende Begriffe möglichst in Ihren eigenen Worten (1 kurzer Satz): Gen Nukleotid RNA-Polymerase Promotor Codon Anti-Codon Stop-Codon

Mehr

IV. Übungsaufgaben für die Jahrgangstufe 9 & 10

IV. Übungsaufgaben für die Jahrgangstufe 9 & 10 IV. Übungsaufgaben für die Jahrgangstufe 9 & 10 Von der Erbanlage zum Erbmerkmal: 34) Welche Aufgaben haben Chromosomen? 35) Zeichne und benenne die Teile eines Chromosoms, wie sie im Lichtmikroskop während

Mehr

Alignment-Verfahren zum Vergleich biologischer Sequenzen

Alignment-Verfahren zum Vergleich biologischer Sequenzen zum Vergleich biologischer Sequenzen Hans-Joachim Böckenhauer Dennis Komm Volkshochschule Zürich. April Ein biologisches Problem Fragestellung Finde eine Methode zum Vergleich von DNA-Molekülen oder Proteinen

Mehr

1 Einleitung. 1.1 Motivation und Zielsetzung der Untersuchung

1 Einleitung. 1.1 Motivation und Zielsetzung der Untersuchung 1 Einleitung 1.1 Motivation und Zielsetzung der Untersuchung Obgleich Tourenplanungsprobleme zu den am häufigsten untersuchten Problemstellungen des Operations Research zählen, konzentriert sich der Großteil

Mehr

Zeichen bei Zahlen entschlüsseln

Zeichen bei Zahlen entschlüsseln Zeichen bei Zahlen entschlüsseln In diesem Kapitel... Verwendung des Zahlenstrahls Absolut richtige Bestimmung von absoluten Werten Operationen bei Zahlen mit Vorzeichen: Addieren, Subtrahieren, Multiplizieren

Mehr

Primzahlen und RSA-Verschlüsselung

Primzahlen und RSA-Verschlüsselung Primzahlen und RSA-Verschlüsselung Michael Fütterer und Jonathan Zachhuber 1 Einiges zu Primzahlen Ein paar Definitionen: Wir bezeichnen mit Z die Menge der positiven und negativen ganzen Zahlen, also

Mehr

Klausur zur Vorlesung Biochemie III im WS 2000/01

Klausur zur Vorlesung Biochemie III im WS 2000/01 Klausur zur Vorlesung Biochemie III im WS 2000/01 am 15.02.2001 von 15.30 17.00 Uhr (insgesamt 100 Punkte, mindestens 40 erforderlich) Bitte Name, Matrikelnummer und Studienfach unbedingt angeben (3 1.

Mehr

Homologie und Sequenzähnlichkeit. Prof. Dr. Antje Krause FH Bingen 06721 / 409 253 akrause@fh-bingen.de

Homologie und Sequenzähnlichkeit. Prof. Dr. Antje Krause FH Bingen 06721 / 409 253 akrause@fh-bingen.de Homologie und Sequenzähnlichkeit Prof. Dr. Antje Krause FH Bingen 06721 / 409 253 akrause@fh-bingen.de Homologie Verwandtschaft aufgrund gleicher Abstammung basiert auf Speziation (Artbildung): aus einer

Mehr

1 Mathematische Grundlagen

1 Mathematische Grundlagen Mathematische Grundlagen - 1-1 Mathematische Grundlagen Der Begriff der Menge ist einer der grundlegenden Begriffe in der Mathematik. Mengen dienen dazu, Dinge oder Objekte zu einer Einheit zusammenzufassen.

Mehr

Konzepte der Informatik

Konzepte der Informatik Konzepte der Informatik Vorkurs Informatik zum WS 2011/2012 26.09. - 30.09.2011 17.10. - 21.10.2011 Dr. Werner Struckmann / Christoph Peltz Stark angelehnt an Kapitel 1 aus "Abenteuer Informatik" von Jens

Mehr

Evolution & Genetik (Beispiel Hämoglobin) Prof. Dr. Antje Krause FH Bingen 06721 / 409 253 akrause@fh-bingen.de

Evolution & Genetik (Beispiel Hämoglobin) Prof. Dr. Antje Krause FH Bingen 06721 / 409 253 akrause@fh-bingen.de Evolution & Genetik (Beispiel Hämoglobin) Prof. Dr. Antje Krause FH Bingen 06721 / 409 253 akrause@fh-bingen.de DNA (Desoxyribonukleinsäure) 5 3 CGATGTACATCG GCTACATGTAGC 3 5 Doppelhelix Basen: Adenin,

Mehr

Scholz (Hrsg.) / Krämer / Schollmayer / Völcker. Android-Apps. Konzeption, Programmierung und Vermarktung

Scholz (Hrsg.) / Krämer / Schollmayer / Völcker. Android-Apps. Konzeption, Programmierung und Vermarktung Scholz (Hrsg.) / Krämer / Schollmayer / Völcker Android-Apps entwickeln Konzeption, Programmierung und Vermarktung Vom Entwurf bis zum Einstellen bei Google Play und Co. So entwickeln Sie native Apps für

Mehr

Grundideen der Gentechnik

Grundideen der Gentechnik Grundideen der Gentechnik Die Gentechnik kombiniert Biotechnik und Züchtung. Wie in der Züchtung wird die Erbinformation eines Lebewesen verändert. Dabei nutzte man in den Anfängen der Gentechnik vor allem

Mehr

Thomas Meuser Hrsg. Promo-Viren. Zur Behandlung promotionaler Infekte und chronischer Doktoritis 3., kurierte Auflage

Thomas Meuser Hrsg. Promo-Viren. Zur Behandlung promotionaler Infekte und chronischer Doktoritis 3., kurierte Auflage Thomas Meuser Hrsg. Promo-Viren Zur Behandlung promotionaler Infekte und chronischer Doktoritis 3., kurierte Auflage Promo-Viren Thomas Meuser Herausgeber Promo-Viren Zur Behandlung promotionaler Infekte

Mehr

APP-GFP/Fluoreszenzmikroskop. Aufnahmen neuronaler Zellen, mit freund. Genehmigung von Prof. Stefan Kins, TU Kaiserslautern

APP-GFP/Fluoreszenzmikroskop. Aufnahmen neuronaler Zellen, mit freund. Genehmigung von Prof. Stefan Kins, TU Kaiserslautern Über die Herkunft von Aβ42 und Amyloid-Plaques Heute ist sicher belegt, dass sich die amyloiden Plaques aus einer Vielzahl an Abbaufragmenten des Amyloid-Vorläufer-Proteins (amyloid-precursor-protein,

Mehr

Die Suche nach Genen in Bakteriengenomen. BWInf-Workshop 22.-23. März 2011. Prof. Dr. Sven Rahmann AG Bioinformatik Informatik XI, TU Dortmund

Die Suche nach Genen in Bakteriengenomen. BWInf-Workshop 22.-23. März 2011. Prof. Dr. Sven Rahmann AG Bioinformatik Informatik XI, TU Dortmund Die Suche nach Genen in Bakteriengenomen BWInf-Workshop 22.-23. März 2011 Prof. Dr. Sven Rahmann AG Bioinformatik Informatik XI, TU Dortmund 1 Bioinformatik was ist das? Aufgabe: Analyse (molekular)biologischer

Mehr

6. DNA -Bakteriengenetik

6. DNA -Bakteriengenetik 6. DNA -Bakteriengenetik Konzepte: Francis Crick DNA Struktur DNA Replikation Gentransfer in Bakterien Bakteriophagen 2. Welcher der folgenden Sätze entspricht der Chargaff-Regel? A) Die Menge von Purinen

Mehr

Grundmann Rathner Abschlussprüfungen Bankwirtschaft, Rechnungswesen und Steuerung, Wirtschafts- und Sozialkunde

Grundmann Rathner Abschlussprüfungen Bankwirtschaft, Rechnungswesen und Steuerung, Wirtschafts- und Sozialkunde Grundmann Rathner Abschlussprüfungen Bankwirtschaft, Rechnungswesen und Steuerung, Wirtschafts- und Sozialkunde Prüfungstraining für Bankkaufleute Die Bücher der Reihe Prüfungstraining für Bankkaufleute

Mehr

Ist Excel das richtige Tool für FMEA? Steve Murphy, Marc Schaeffers

Ist Excel das richtige Tool für FMEA? Steve Murphy, Marc Schaeffers Ist Excel das richtige Tool für FMEA? Steve Murphy, Marc Schaeffers Ist Excel das richtige Tool für FMEA? Einleitung Wenn in einem Unternehmen FMEA eingeführt wird, fangen die meisten sofort damit an,

Mehr

Lineargleichungssysteme: Additions-/ Subtraktionsverfahren

Lineargleichungssysteme: Additions-/ Subtraktionsverfahren Lineargleichungssysteme: Additions-/ Subtraktionsverfahren W. Kippels 22. Februar 2014 Inhaltsverzeichnis 1 Einleitung 2 2 Lineargleichungssysteme zweiten Grades 2 3 Lineargleichungssysteme höheren als

Mehr

Leseprobe. Thomas Konert, Achim Schmidt. Design for Six Sigma umsetzen ISBN: 978-3-446-41230-9. Weitere Informationen oder Bestellungen unter

Leseprobe. Thomas Konert, Achim Schmidt. Design for Six Sigma umsetzen ISBN: 978-3-446-41230-9. Weitere Informationen oder Bestellungen unter Leseprobe Thomas Konert, Achim Schmidt Design for Six Sigma umsetzen ISBN: 978-3-446-41230-9 Weitere Informationen oder Bestellungen unter http://www.hanser.de/978-3-446-41230-9 sowie im Buchhandel. Carl

Mehr

Unterrichtsmaterialien in digitaler und in gedruckter Form. Auszug aus: Latein kann ich auch - Rom und die Römer

Unterrichtsmaterialien in digitaler und in gedruckter Form. Auszug aus: Latein kann ich auch - Rom und die Römer Unterrichtsmaterialien in digitaler und in gedruckter Form Auszug aus: Latein kann ich auch - Rom und die Römer Das komplette Material finden Sie hier: School-Scout.de TOP TEN Mit Zeichnungen von Katrin

Mehr

Seniorenbüros im Land Brandenburg

Seniorenbüros im Land Brandenburg Nancy Bauer Seniorenbüros im Land Brandenburg Innovative und zukunftsorientierte Kommunalpolitik unter dem Aspekt des demographischen Wandels Diplomarbeit BACHELOR + MASTER Publishing Bauer, Nancy: Seniorenbüros

Mehr

Gelassenheit gewinnen 30 Bilder für ein starkes Selbst

Gelassenheit gewinnen 30 Bilder für ein starkes Selbst Gelassenheit gewinnen 30 Bilder für ein starkes Selbst Barbara Burghardt Gelassenheit gewinnen 30 Bilder für ein starkes Selbst Wie Sie Ihren inneren Reichtum neu entdecken 2., verbesserte Auflage Barbara

Mehr

Templates für Joomla! 1.6

Templates für Joomla! 1.6 Know-how ist blau. Templates für Joomla! 1.6 Design und Implementierung > Grafische Freiheit für Joomla!-Websites: verschiedene Designs in einem Template > So entwerfen Sie ein Template-Design mit Photoshop

Mehr

Professionelle Seminare im Bereich MS-Office

Professionelle Seminare im Bereich MS-Office Der Name BEREICH.VERSCHIEBEN() ist etwas unglücklich gewählt. Man kann mit der Funktion Bereiche zwar verschieben, man kann Bereiche aber auch verkleinern oder vergrößern. Besser wäre es, die Funktion

Mehr

Aufgabe 2: (Aminosäuren)

Aufgabe 2: (Aminosäuren) Aufgabe 2: (Aminosäuren) Aufgabenstellung Die 20 Aminosäuren (voller Name, 1- und 3-Buchstaben-Code) sollen identifiziert und mit RasMol grafisch dargestellt werden. Dann sollen die AS sinnvoll nach ihren

Mehr

Teil I Grundlagen Biologie und Datenbanken 1

Teil I Grundlagen Biologie und Datenbanken 1 V Vorwort XV Teil I Grundlagen Biologie und Datenbanken 1 1 Biologische Grundlagen 3 1.1 DNA 3 1.2 Genetischer Code und Genomkomposition 5 1.3 Transkription 9 1.4 RNA 10 1.5 Proteine 11 1.6 Peptidbindung

Mehr

Planung eines Videoüberwachungssystems

Planung eines Videoüberwachungssystems Sebastian Welzbacher Planung eines Videoüberwachungssystems Gängige Standards in Analog- und IP-Technologie Diplomica Verlag Sebastian Welzbacher Planung eines Videoüberwachungssystems: Gängige Standards

Mehr

Verbesserte Basenpaarung bei DNA-Analysen

Verbesserte Basenpaarung bei DNA-Analysen Powered by Seiten-Adresse: https://www.gesundheitsindustriebw.de/de/fachbeitrag/aktuell/verbesserte-basenpaarungbei-dna-analysen/ Verbesserte Basenpaarung bei DNA-Analysen Ein Team aus der Organischen

Mehr

Voraussetzung wieder: Datenraum mit Instanzen, mehrere Attribute - kein ausgezeichnetes Zielattribut, keine vorgegebenen Klassen

Voraussetzung wieder: Datenraum mit Instanzen, mehrere Attribute - kein ausgezeichnetes Zielattribut, keine vorgegebenen Klassen 7. Clusteranalyse (= Häufungsanalyse; Clustering-Verfahren) wird der multivariaten Statistik zugeordnet Voraussetzung wieder: Datenraum mit Instanzen, mehrere Attribute - kein ausgezeichnetes Zielattribut,

Mehr

Grundlagen der Theoretischen Informatik, SoSe 2008

Grundlagen der Theoretischen Informatik, SoSe 2008 1. Aufgabenblatt zur Vorlesung Grundlagen der Theoretischen Informatik, SoSe 2008 (Dr. Frank Hoffmann) Lösung von Manuel Jain und Benjamin Bortfeldt Aufgabe 2 Zustandsdiagramme (6 Punkte, wird korrigiert)

Mehr

DATENQUALITÄT IN GENOMDATENBANKEN

DATENQUALITÄT IN GENOMDATENBANKEN DATENQUALITÄT IN GENOMDATENBANKEN Alexander Fehr 28. Januar 2004 Gliederung Motivation Biologische Grundkonzepte Genomdaten Datenproduktion und Fehler Data Cleansing 2 Motivation (1) Genomdatenbanken enthalten

Mehr

OECD Programme for International Student Assessment PISA 2000. Lösungen der Beispielaufgaben aus dem Mathematiktest. Deutschland

OECD Programme for International Student Assessment PISA 2000. Lösungen der Beispielaufgaben aus dem Mathematiktest. Deutschland OECD Programme for International Student Assessment Deutschland PISA 2000 Lösungen der Beispielaufgaben aus dem Mathematiktest Beispielaufgaben PISA-Hauptstudie 2000 Seite 3 UNIT ÄPFEL Beispielaufgaben

Mehr

Institut für Computational Engineering ICE. N ä h e r d ra n a m S ys t e m d e r Te c h n i k d e r Z u ku n f t. w w w. n t b.

Institut für Computational Engineering ICE. N ä h e r d ra n a m S ys t e m d e r Te c h n i k d e r Z u ku n f t. w w w. n t b. Institut für Computational Engineering ICE N ä h e r d ra n a m S ys t e m d e r Te c h n i k d e r Z u ku n f t w w w. n t b. c h Rechnen Sie mit uns Foto: ESA Das Institut für Computational Engineering

Mehr

Data Mining: Einige Grundlagen aus der Stochastik

Data Mining: Einige Grundlagen aus der Stochastik Data Mining: Einige Grundlagen aus der Stochastik Hagen Knaf Studiengang Angewandte Mathematik Hochschule RheinMain 21. Oktober 2015 Vorwort Das vorliegende Skript enthält eine Zusammenfassung verschiedener

Mehr

Industrie 4.0 in Produktion, Automatisierung und Logistik

Industrie 4.0 in Produktion, Automatisierung und Logistik Industrie 4.0 in Produktion, Automatisierung und Logistik Thomas Bauernhansl Michael ten Hompel Birgit Vogel-Heuser (Hrsg.) Industrie 4.0 in Produktion, Automatisierung und Logistik Anwendung Technologien

Mehr

Die Computerwerkstatt

Die Computerwerkstatt Klaus Dembowski Die Computerwerkstatt Für PCs, Notebooks, Tablets und Smartphones Klaus Dembowski Lektorat: Gabriel Neumann Herstellung: Nadine Thiele Umschlaggestaltung: Helmut Kraus, www.exclam.de Druck

Mehr

Würfelt man dabei je genau 10 - mal eine 1, 2, 3, 4, 5 und 6, so beträgt die Anzahl. der verschiedenen Reihenfolgen, in denen man dies tun kann, 60!.

Würfelt man dabei je genau 10 - mal eine 1, 2, 3, 4, 5 und 6, so beträgt die Anzahl. der verschiedenen Reihenfolgen, in denen man dies tun kann, 60!. 040304 Übung 9a Analysis, Abschnitt 4, Folie 8 Die Wahrscheinlichkeit, dass bei n - maliger Durchführung eines Zufallexperiments ein Ereignis A ( mit Wahrscheinlichkeit p p ( A ) ) für eine beliebige Anzahl

Mehr

Was ist der Promotor? Antwort: Eine spezielle Nucleotidsequenz auf der DNA, an der die RNA-Polymerase bindet um die Transkription zu starten.

Was ist der Promotor? Antwort: Eine spezielle Nucleotidsequenz auf der DNA, an der die RNA-Polymerase bindet um die Transkription zu starten. Was ist der Promotor? Antwort: Eine spezielle Nucleotidsequenz auf der DNA, an der die RNA-Polymerase bindet um die Transkription zu starten. Wie bezeichnet man den Strang der DNA- Doppelhelix, der die

Mehr

Technical Note Nr. 101

Technical Note Nr. 101 Seite 1 von 6 DMS und Schleifringübertrager-Schaltungstechnik Über Schleifringübertrager können DMS-Signale in exzellenter Qualität übertragen werden. Hierbei haben sowohl die physikalischen Eigenschaften

Mehr

8. Translation. Konzepte: Translation benötigt trnas und Ribosomen. Genetischer Code. Initiation - Elongation - Termination

8. Translation. Konzepte: Translation benötigt trnas und Ribosomen. Genetischer Code. Initiation - Elongation - Termination 8. Translation Konzepte: Translation benötigt trnas und Ribosomen Genetischer Code Initiation - Elongation - Termination 1. Welche Typen von RNAs gibt es und welches sind ihre Funktionen? mouse human bacteria

Mehr

Bachelorarbeit. Printanzeigen und visuelle Kommunikation Analyse von ausgewählten Printanzeigen des Automobilherstellers Porsche im Zeitverlauf

Bachelorarbeit. Printanzeigen und visuelle Kommunikation Analyse von ausgewählten Printanzeigen des Automobilherstellers Porsche im Zeitverlauf Bachelorarbeit Laudina Weiss Printanzeigen und visuelle Kommunikation Analyse von ausgewählten Printanzeigen des Automobilherstellers Porsche im Zeitverlauf Diplom.de Laudina Weiss Printanzeigen und visuelle

Mehr

Interaktive Whiteboards im Unterricht

Interaktive Whiteboards im Unterricht Stefan Hohlfeld Interaktive Whiteboards im Unterricht Wie kann guter Unterricht mit multimedialer Unterstützung aussehen? Bachelorarbeit BACHELOR + MASTER Publishing Hohlfeld, Stefan: Interaktive Whiteboards

Mehr

Informationsblatt Induktionsbeweis

Informationsblatt Induktionsbeweis Sommer 015 Informationsblatt Induktionsbeweis 31. März 015 Motivation Die vollständige Induktion ist ein wichtiges Beweisverfahren in der Informatik. Sie wird häufig dazu gebraucht, um mathematische Formeln

Mehr

R ist freie Software und kann von der Website. www.r-project.org

R ist freie Software und kann von der Website. www.r-project.org R R ist freie Software und kann von der Website heruntergeladen werden. www.r-project.org Nach dem Herunterladen und der Installation von R kann man R durch Doppelklicken auf das R-Symbol starten. R wird

Mehr

Verschlüsseln von Dateien mit Hilfe einer TCOS-Smartcard per Truecrypt. T-Systems International GmbH. Version 1.0 Stand 29.06.11

Verschlüsseln von Dateien mit Hilfe einer TCOS-Smartcard per Truecrypt. T-Systems International GmbH. Version 1.0 Stand 29.06.11 Verschlüsseln von Dateien mit Hilfe einer TCOS-Smartcard per Truecrypt T-Systems International GmbH Version 1.0 Stand 29.06.11 Impressum Herausgeber T-Systems International GmbH Untere Industriestraße

Mehr

Modul 8: Bioinformatik A. Von der DNA zum Protein Proteinsynthese in silicio

Modul 8: Bioinformatik A. Von der DNA zum Protein Proteinsynthese in silicio Modul 8: Bioinformatik A. Von der DNA zum Protein Proteinsynthese in silicio Ein Wissenschaftler erhält nach einer Sequenzierung folgenden Ausschnitt aus einer DNA-Sequenz: 5 ctaccatcaa tccggtaggt tttccggctg

Mehr

Webalizer HOWTO. Stand: 18.06.2012

Webalizer HOWTO. Stand: 18.06.2012 Webalizer HOWTO Stand: 18.06.2012 Copyright 2003 by manitu. Alle Rechte vorbehalten. Alle verwendeten Bezeichnungen dienen lediglich der Kennzeichnung und können z.t. eingetragene Warenzeichen sein, ohne

Mehr

Elementare Einführung in die Wahrscheinlichkeitsrechnung, Informationstheorie und stochastische Prozesse. Computer-Netzwerke

Elementare Einführung in die Wahrscheinlichkeitsrechnung, Informationstheorie und stochastische Prozesse. Computer-Netzwerke Informationstechnik Klaus-Dieter Thies Elementare Einführung in die Wahrscheinlichkeitsrechnung, Informationstheorie und stochastische Prozesse für Computer-Netzwerke Mit einer wahrscheinlichkeitstheoretischen

Mehr

Festigkeit von FDM-3D-Druckteilen

Festigkeit von FDM-3D-Druckteilen Festigkeit von FDM-3D-Druckteilen Häufig werden bei 3D-Druck-Filamenten die Kunststoff-Festigkeit und physikalischen Eigenschaften diskutiert ohne die Einflüsse der Geometrie und der Verschweißung der

Mehr

Versuch 8. Plasmid - Isolierung

Versuch 8. Plasmid - Isolierung Versuch 8 Plasmid - Isolierung Protokollant: E-mail: Studiengang: Gruppen-Nr: Semester: Betreuer: Max Mustermann max@quantentunnel.de X X X C. Weindel & M. Schwarz Wird benotet?: Einleitung Ein Plasmid

Mehr

Prozessbewertung und -verbesserung nach ITIL im Kontext des betrieblichen Informationsmanagements. von Stephanie Wilke am 14.08.08

Prozessbewertung und -verbesserung nach ITIL im Kontext des betrieblichen Informationsmanagements. von Stephanie Wilke am 14.08.08 Prozessbewertung und -verbesserung nach ITIL im Kontext des betrieblichen Informationsmanagements von Stephanie Wilke am 14.08.08 Überblick Einleitung Was ist ITIL? Gegenüberstellung der Prozesse Neuer

Mehr

Die Bedeutung der Hausbankbeziehung für Finanzierungen im Mittelstand Schwerpunkt: Unternehmensgründung und Unternehmensnachfolge

Die Bedeutung der Hausbankbeziehung für Finanzierungen im Mittelstand Schwerpunkt: Unternehmensgründung und Unternehmensnachfolge Isabell Dorothee Höner Die Bedeutung der Hausbankbeziehung für Finanzierungen im Mittelstand Schwerpunkt: Unternehmensgründung und Unternehmensnachfolge Diplom.de Isabell Dorothee Höner Die Bedeutung der

Mehr

6. Bayes-Klassifikation. (Schukat-Talamazzini 2002)

6. Bayes-Klassifikation. (Schukat-Talamazzini 2002) 6. Bayes-Klassifikation (Schukat-Talamazzini 2002) (Böhm 2003) (Klawonn 2004) Der Satz von Bayes: Beweis: Klassifikation mittels des Satzes von Bayes (Klawonn 2004) Allgemeine Definition: Davon zu unterscheiden

Mehr

Planen mit mathematischen Modellen 00844: Computergestützte Optimierung. Autor: Dr. Heinz Peter Reidmacher

Planen mit mathematischen Modellen 00844: Computergestützte Optimierung. Autor: Dr. Heinz Peter Reidmacher Planen mit mathematischen Modellen 00844: Computergestützte Optimierung Leseprobe Autor: Dr. Heinz Peter Reidmacher 11 - Portefeuilleanalyse 61 11 Portefeuilleanalyse 11.1 Das Markowitz Modell Die Portefeuilleanalyse

Mehr

Lineare Gleichungssysteme

Lineare Gleichungssysteme Brückenkurs Mathematik TU Dresden 2015 Lineare Gleichungssysteme Schwerpunkte: Modellbildung geometrische Interpretation Lösungsmethoden Prof. Dr. F. Schuricht TU Dresden, Fachbereich Mathematik auf der

Mehr

A- Zugabe von 180µl Pufferlösung und Proteinase K, Inkubation bei 56 C. B- Zugabe von 200µl einer zweiten Pufferlösung, Inkubation bei 70 C

A- Zugabe von 180µl Pufferlösung und Proteinase K, Inkubation bei 56 C. B- Zugabe von 200µl einer zweiten Pufferlösung, Inkubation bei 70 C 3 Methoden 3.1 Extraktion der DNA aus den Paraffinschnitten 3.1.1 Extraktions-Kit Das QIAamp DNA Mini Kit- System beruht auf dem Prinzip der Auflösung der Eiweiße mit Proteinase K, DNA Bindung an eine

Mehr

Data Mining-Modelle und -Algorithmen

Data Mining-Modelle und -Algorithmen Data Mining-Modelle und -Algorithmen Data Mining-Modelle und -Algorithmen Data Mining ist ein Prozess, bei dem mehrere Komponenten i n- teragieren. Sie greifen auf Datenquellen, um diese zum Training,

Mehr

Übungen zur Kosten-, Erlösund Ergebnisrechnung

Übungen zur Kosten-, Erlösund Ergebnisrechnung Übungen zur Kosten-, Erlösund Ergebnisrechnung Wolfgang Becker Robert Holzmann Christian Hilmer Übungen zur Kosten-, Erlösund Ergebnisrechnung Für Bachelor-Studierende Wolfgang Becker Robert Holzmann Christian

Mehr

Bioinformatik: Hype oder Hoffnung?

Bioinformatik: Hype oder Hoffnung? Bioinformatik: Hype oder Hoffnung? Florian Markowetz Max-Planck-Institut für Molekulare Genetik Computational Molecular Biology Berlin Career Nights AKG Bensheim, 28. Januar 2005 1 Florian Markowetz, Bioinformatik:

Mehr

Behörde für Bildung und Sport Abitur 2008 Lehrermaterialien zum Leistungskurs Mathematik

Behörde für Bildung und Sport Abitur 2008 Lehrermaterialien zum Leistungskurs Mathematik Abitur 8 II. Insektenpopulation LA/AG In den Tropen legen die Weibchen einer in Deutschland unbekannten Insektenpopulation jedes Jahr kurz vor Beginn der Regenzeit jeweils 9 Eier und sterben bald darauf.

Mehr

Mean Time Between Failures (MTBF)

Mean Time Between Failures (MTBF) Mean Time Between Failures (MTBF) Hintergrundinformation zur MTBF Was steht hier? Die Mean Time Between Failure (MTBF) ist ein statistischer Mittelwert für den störungsfreien Betrieb eines elektronischen

Mehr

Übung 11 Genregulation bei Prokaryoten

Übung 11 Genregulation bei Prokaryoten Übung 11 Genregulation bei Prokaryoten Konzepte: Differentielle Genexpression Positive Genregulation Negative Genregulation cis-/trans-regulation 1. Auf welchen Ebenen kann Genregulation stattfinden? Definition

Mehr

Georg Grzonka. Prozesse im Unternehmen strukturieren und darstellen. - Leseprobe -

Georg Grzonka. Prozesse im Unternehmen strukturieren und darstellen. - Leseprobe - Georg Grzonka Prozesse im Unternehmen strukturieren und darstellen Übersicht über die Arbeitshilfen Prozessbeschreibung in Tabellenform (datei_01.doc) Prozessdarstellung als Kombination von Ablaufdiagramm

Mehr

Klonierung von S2P Rolle der M19-Zellen. POL-Seminar der Biochemie II 13.02.2007 Sebastian Gabriel

Klonierung von S2P Rolle der M19-Zellen. POL-Seminar der Biochemie II 13.02.2007 Sebastian Gabriel Klonierung von S2P Rolle der M19-Zellen POL-Seminar der Biochemie II 13.02.2007 Sebastian Gabriel Inhalt 1. Was ist eine humane genomische DNA-Bank? 2. Unterschied zwischen cdna-bank und genomischer DNA-Bank?

Mehr

Einleitung. Für wen ist dieses Buch

Einleitung. Für wen ist dieses Buch i Willkommen! Dieses Buch aus der Reihe Schritt für Schritt wurde so konzipiert, dass Sie mit dem Buch leicht und einfach die wesentlichen Aspekte beim Einsatz von vier der Microsoft Office 2016- Apps

Mehr

POCKET POWER. Wissensmanagement. 4. Auflage

POCKET POWER. Wissensmanagement. 4. Auflage POCKET POWER Wissensmanagement 4. Auflage Der Herausgeber Prof. Dr.-Ing. Gerd F. Kamiske, ehemals Leiter der Qualitätssicherung im Volkswagenwerk Wolfsburg und Universitätsprofessor für Quali - täts wissenschaft

Mehr

Vektoren mit GeoGebra

Vektoren mit GeoGebra Vektoren mit GeoGebra Eine Kurzanleitung mit Beispielen Markus Hohenwarter, 2005 In GeoGebra kann mit Vektoren und Punkten konstruiert und gerechnet werden. Diese Kurzanleitung gibt einen Überblick über

Mehr

Fachbericht zum Thema: Anforderungen an ein Datenbanksystem

Fachbericht zum Thema: Anforderungen an ein Datenbanksystem Fachbericht zum Thema: Anforderungen an ein Datenbanksystem von André Franken 1 Inhaltsverzeichnis 1 Inhaltsverzeichnis 1 2 Einführung 2 2.1 Gründe für den Einsatz von DB-Systemen 2 2.2 Definition: Datenbank

Mehr

Künstliche Intelligenz Maschinelles Lernen

Künstliche Intelligenz Maschinelles Lernen Künstliche Intelligenz Maschinelles Lernen Stephan Schwiebert Sommersemester 2009 Sprachliche Informationsverarbeitung Institut für Linguistik Universität zu Köln Maschinelles Lernen Überwachtes Lernen

Mehr

Markus Demary / Michael Voigtländer

Markus Demary / Michael Voigtländer Forschungsberichte aus dem Institut der deutschen Wirtschaft Köln Nr. 50 Markus Demary / Michael Voigtländer Immobilien 2025 Auswirkungen des demografischen Wandels auf die Wohn- und Büroimmobilienmärkte

Mehr

Handbuch Kundenmanagement

Handbuch Kundenmanagement Handbuch Kundenmanagement Armin Töpfer (Herausgeber) Handbuch Kundenmanagement Anforderungen, Prozesse, Zufriedenheit, Bindung und Wert von Kunden Dritte, vollständig überarbeitete und erweiterte Auflage

Mehr

QM: Prüfen -1- KN16.08.2010

QM: Prüfen -1- KN16.08.2010 QM: Prüfen -1- KN16.08.2010 2.4 Prüfen 2.4.1 Begriffe, Definitionen Ein wesentlicher Bestandteil der Qualitätssicherung ist das Prüfen. Sie wird aber nicht wie früher nach der Fertigung durch einen Prüfer,

Mehr

Hilfe Bearbeitung von Rahmenleistungsverzeichnissen

Hilfe Bearbeitung von Rahmenleistungsverzeichnissen Hilfe Bearbeitung von Rahmenleistungsverzeichnissen Allgemeine Hinweise Inhaltsverzeichnis 1 Allgemeine Hinweise... 3 1.1 Grundlagen...3 1.2 Erstellen und Bearbeiten eines Rahmen-Leistungsverzeichnisses...

Mehr

Kurzdokumentation AO Bodenbuch Serienbrief Land-Data Eurosoft GmbH & Co.KG Rennbahnstr. 7 84347 Pfarrkirchen

Kurzdokumentation AO Bodenbuch Serienbrief Land-Data Eurosoft GmbH & Co.KG Rennbahnstr. 7 84347 Pfarrkirchen Kurzdokumentation AO Bodenbuch Serienbrief Land-Data Eurosoft GmbH & Co.KG Rennbahnstr. 7 84347 Pfarrkirchen Serienbriefe erleichtern den Briefverkehr. Mit Hilfe dieser Funktion erstellen Sie einen Brief,

Mehr

Christina Janning. Change Management. Möglichkeiten der Kommunikation zur Reduzierung innerbetrieblicher Widerstände. Diplomarbeit

Christina Janning. Change Management. Möglichkeiten der Kommunikation zur Reduzierung innerbetrieblicher Widerstände. Diplomarbeit Christina Janning Change Management Möglichkeiten der Kommunikation zur Reduzierung innerbetrieblicher Widerstände Diplomarbeit Janning, Christina: Change Management: Möglichkeiten der Kommunikation zur

Mehr

Bedienungsanleitung. Matthias Haasler. Version 0.4. für die Arbeit mit der Gemeinde-Homepage der Paulus-Kirchengemeinde Tempelhof

Bedienungsanleitung. Matthias Haasler. Version 0.4. für die Arbeit mit der Gemeinde-Homepage der Paulus-Kirchengemeinde Tempelhof Bedienungsanleitung für die Arbeit mit der Gemeinde-Homepage der Paulus-Kirchengemeinde Tempelhof Matthias Haasler Version 0.4 Webadministrator, email: webadmin@rundkirche.de Inhaltsverzeichnis 1 Einführung

Mehr

X.systems.press ist eine praxisorientierte Reihe zur Entwicklung und Administration von Betriebssystemen, Netzwerken und Datenbanken.

X.systems.press ist eine praxisorientierte Reihe zur Entwicklung und Administration von Betriebssystemen, Netzwerken und Datenbanken. X. systems.press X.systems.press ist eine praxisorientierte Reihe zur Entwicklung und Administration von Betriebssystemen, Netzwerken und Datenbanken. Rafael Kobylinski MacOSXTiger Netzwerkgrundlagen,

Mehr

PTV VISWALK TIPPS UND TRICKS PTV VISWALK TIPPS UND TRICKS: VERWENDUNG DICHTEBASIERTER TEILROUTEN

PTV VISWALK TIPPS UND TRICKS PTV VISWALK TIPPS UND TRICKS: VERWENDUNG DICHTEBASIERTER TEILROUTEN PTV VISWALK TIPPS UND TRICKS PTV VISWALK TIPPS UND TRICKS: VERWENDUNG DICHTEBASIERTER TEILROUTEN Karlsruhe, April 2015 Verwendung dichte-basierter Teilrouten Stellen Sie sich vor, in einem belebten Gebäude,

Mehr

Eberhard Lehmann: Projekte im Informatik-Unterricht Software Engineering, Ferd. Dümmlers Verlag, Bonn 1995. Inhaltsverzeichnis.

Eberhard Lehmann: Projekte im Informatik-Unterricht Software Engineering, Ferd. Dümmlers Verlag, Bonn 1995. Inhaltsverzeichnis. 3 Eberhard Lehmann: Projekte im Informatik-Unterricht Software Engineering, Ferd. Dümmlers Verlag, Bonn 1995 Inhaltsverzeichnis Vorwort 5 1. Komplexe Software - Projekte - Software-Engineering 7 1.1 Komplexe

Mehr

Die Universität stellt sich vor

Die Universität stellt sich vor Die Universität stellt sich vor Prof. Dr. Till Tantau. Juni Überblick Die Universität zu Lübeck Exzellente Forschung...... führt zu exzellenter Lehre Die Universität in Zahlen Studierende. Professoren

Mehr

Softwareentwicklungspraktikum Sommersemester 2007. Grobentwurf

Softwareentwicklungspraktikum Sommersemester 2007. Grobentwurf Softwareentwicklungspraktikum Sommersemester 2007 Grobentwurf Auftraggeber Technische Universität Braunschweig

Mehr

etutor Benutzerhandbuch XQuery Benutzerhandbuch Georg Nitsche

etutor Benutzerhandbuch XQuery Benutzerhandbuch Georg Nitsche etutor Benutzerhandbuch Benutzerhandbuch XQuery Georg Nitsche Version 1.0 Stand März 2006 Versionsverlauf: Version Autor Datum Änderungen 1.0 gn 06.03.2006 Fertigstellung der ersten Version Inhaltsverzeichnis:

Mehr

Einführung in die Algebra

Einführung in die Algebra Prof. Dr. H. Brenner Osnabrück SS 2009 Einführung in die Algebra Vorlesung 13 Einheiten Definition 13.1. Ein Element u in einem Ring R heißt Einheit, wenn es ein Element v R gibt mit uv = vu = 1. DasElementv

Mehr

Theoretische Grundlagen der Informatik WS 09/10

Theoretische Grundlagen der Informatik WS 09/10 Theoretische Grundlagen der Informatik WS 09/10 - Tutorium 6 - Michael Kirsten und Kai Wallisch Sitzung 13 02.02.2010 Inhaltsverzeichnis 1 Formeln zur Berechnung Aufgabe 1 2 Hamming-Distanz Aufgabe 2 3

Mehr