Molekularbiologische. Datenbanken. Kartierung von Chromsomen. Wissensmanagement in der. Bioinformatik. Ulf Leser

Größe: px
Ab Seite anzeigen:

Download "Molekularbiologische. Datenbanken. Kartierung von Chromsomen. Wissensmanagement in der. Bioinformatik. Ulf Leser"

Transkript

1 Molekularbiologische Datenbanken Kartierung von Chromsomen Ulf Leser Wissensmanagement in der Bioinformatik

2 Daten, Schema, Modell, Metamodell Daten Tatsächliche Werte, uninterpretiert Anfrageergebnisse Schema Container und Struktur der Werte Adressiert durch Anfragen Datenmodell Definition der Typen, die ein Schema ausmachen Adressiert durch DDL Metamodell Definition von Typen und Beziehungen I.d.R. fest implementiert Metamodell Datenmodell Schema Daten, Werte Instanz von Instanz von Instanz von Ulf Leser: Molekularbiologische Datenbanken, Vorlesung, SoSe

3 Zusammenfassung: Entry-Based Datenbank = Menge ähnlich strukturierter Entries Entry: Menge von Feldern (Attribute, Lines), Identifikation durch Line Code Können 0-n mal vorkommen (semistrukturiert) Können komplexe eigene Struktur haben Können eingebettete Objekte repräsentieren Microsyntax in Werten (Sprechende Schlüssel) Keine deklarativen Konsistenzbedingungen Kein Klassen- oder Objektbegriff Menschenlesbar, leicht zu ändern, sehr flexibel Schwer zu parsen, schlechte Skalierbarkeit Ulf Leser: Molekularbiologische Datenbanken, Vorlesung, SoSe

4 Weitere Modelle ASN.1 Relationales Modell Modellierung: ER, UML Speicher und Anfrageformat (nicht Repräsentation) Vorteile Strukturierte Anfragen Sehr weit verbreitet, robust, Industriestandard Skalierbarkeit und Optimierbarkeit Nachteile SQL schwierig zu lernen Volltextsuche nicht direkt möglich Erfordert speziell zu entwickelnde Editoren, Suchmasken,... Erfordert Administration, Backup, etc. Ulf Leser: Molekularbiologische Datenbanken, Vorlesung, SoSe

5 UML Unified Modelling Language Klassendiagramme Vorteile Reichhaltige Datenmodell, graphische Notation Automatische Erzeugung von Persistenzschicht mgl Nachteile Dualität OO RDBMS nicht trivial (Impedance Mismatch) Roundtrip Problem Queries adressieren rel. Schema, nicht UML Modell UML ist für Software, nicht für Datenbanken gemacht Ulf Leser: Molekularbiologische Datenbanken, Vorlesung, SoSe

6 Objektrelationales Mapping Vier Varianten Union: 1 Tabelle Vertikale Zerlegung: 1 schmale Tabelle pro Klasse Horizontale Zerlegung: 1 breite Tabelle pro Klasse Volle Materialisierung Point -position Mappable -species -chromosome -type Segment -length -unit Ulf Leser: Molekularbiologische Datenbanken, Vorlesung, SoSe

7 Union Vertikal (Schmal) Horizont. (Breit) Voll Bewertung Speicherverbrauch Zugriff Extension Zugriff Intension Konsistenz -sicherung Inserts / Updates Hoch Eine Query Eine Query NULL-Werte garantieren 1 Insert Minimal (OID doppelt) Minimal Hoch Eine Query (aber nur OID) UNION Alle Nachfahren Eine Query Joins Alle Vorfahren Eine Query Eine Query FK für OID Raum OID Räume können überlappen Redundante Daten Anomalien N Insert (Alle Vorfahren) 1 Insert N Insert (Alle Vorfahren) Ulf Leser: Molekularbiologische Datenbanken, Vorlesung, SoSe

8 ML Austauschformat Leichter zu Parsen als Entry-Based Viele vorhandene Tools Volle Stärke erst zusammen mit DTD Definition von Standard Semantik durch Beschreibung Zunehmende Popularität Native Datenbanken Native Query-Languages Ulf Leser: Molekularbiologische Datenbanken, Vorlesung, SoSe

9 Identifikatoren Trade-Off Semantikfrei IDs: Stabilität, aber nicht aussagekräftig Sprechende IDs: Nicht stabil, aber für Menschen einfacher Identität ist anwendungsabhängig Wie viele Objekte: PAK1 bei Mensch und Maus? Anforderungen Objekte werden gesplittet Objekte werden gemerged Objekte in unterschiedlichen Versionen Ulf Leser: Molekularbiologische Datenbanken, Vorlesung, SoSe

10 Versionen im relationalen Modell Linear, tuple-basiert, komplette Versionen Anforderungen Zustand der Datenbank zu beliebigem Zeitpunkt 2 Varianten Single Table Schattentabellen Vergleich Viele Updates und Inserts: Variante 1 Schneller Zugriff auf aktuelle Version: Variante 2 Komplexe Materie: ausprobieren, messen, administrieren Ulf Leser: Molekularbiologische Datenbanken, Vorlesung, SoSe

11 Widersprüchliche Daten Sehr häufig Rohdaten: Verschiedene Experimente - Verschieden Ergebnisse Ergebnisdaten: Verschiedene Datenquellen verschiedene Meinungen Entscheidung über Wahrheit nicht möglich Repräsentation der Widersprüche 1:n Beziehungen Keine Single Value Attribute mehr Metadaten wichtig Abschätzung der Datenqualität Vergleichbarkeit der Ergebnisse Ulf Leser: Molekularbiologische Datenbanken, Vorlesung, SoSe

12 Repräsentation Datenintegration Datenquelle Wer, Version, Warum Objekt Attribut Experimentelle Daten Experiment: Wer, wann, wie, wo Untersuchtes Objekt Untersuchungsergebnis Ulf Leser: Molekularbiologische Datenbanken, Vorlesung, SoSe

13 Inhalt dieser Vorlesung Was ist Kartierung (Mapping)? Genomkarten Kartierungsalgorithmen Integrierte Karten Datenmodelle Datenbanken Ulf Leser: Molekularbiologische Datenbanken, Vorlesung, SoSe

14 Teil I. Ziel des HGP 1. A 2. C 3. G 4. G 5. C 6. C 7. T 8. G 9. G 10. A 11. G 12. G A C G G T Ulf Leser: Molekularbiologische Datenbanken, Vorlesung, SoSe

15 Sequenzierung Problem Chromosome sind nicht direkt sequenzierbar DNA Stücke nur bis ca bp sequenzierbar Finde eine Menge von Bruchstücken so dass: Die Bruchstücke sind kurz (sequenzierbar) Das Verfahren ist kostengünstig Ihre Reihenfolge der Stücke ist berechenbar Mapping von Chromosomen Schwierig, weil Chromosomen recht unhandlich sind... Ulf Leser: Molekularbiologische Datenbanken, Vorlesung, SoSe

16 Grundidee Chromosom isolieren Zufällig in Stücke brechen (Clone) Minimal Tiling Path ermitteln Stücke sequenzieren Fertig Mapping (Kartierung) Problem der Bestimmung einer minimalen Menge und ihrer Ordnung von Clonen so dass ihre Sequenz zusammengenommen ein Chromosom überdeckt Ulf Leser: Molekularbiologische Datenbanken, Vorlesung, SoSe

17 Teil II. Genomkarten und Kartierungsverfahren Cytogenetische Karten Genetische Karten Physikalische Karten Clone-Karten Marker-Karten Ulf Leser: Molekularbiologische Datenbanken, Vorlesung, SoSe

18 II.1 Cytogenetische Karten Beobachtung charakteristischer Färbungen Chromosome Bands Bedingt durch Konformation der DNA Grobe Orientierung Ulf Leser: Molekularbiologische Datenbanken, Vorlesung, SoSe

19 Elemente eines Chromosomes Telomer p der kurze Arm Centromere q der lange Arm Telomer Ulf Leser: Molekularbiologische Datenbanken, Vorlesung, SoSe

20 II.2 Genetische Karten Mendelsche Vererbungsgesetzte Folgerung Vererbung beinhaltet Rekombinationsereignisse Eigenschaften liegen in Kopien vor, von denen eine dominiert Aber: Keine Kenntnis der Orte der Vererbungseinheiten Wie kann man Vererbungseinheiten lokalisieren? Ulf Leser: Molekularbiologische Datenbanken, Vorlesung, SoSe

21 Rekombination Frage: Vererben sich bestimmte Ereignisse häufig zusammen? Haben Menschen mit blaue Augen oftmals blonde Haare? Haben Pflanzen mit großen Blüten auch lange Stengel? Beobachtung Bestimmte Phänotypen vererben sich öfter gemeinsam als andere Ulf Leser: Molekularbiologische Datenbanken, Vorlesung, SoSe

22 Genetische Karten Rekombination ist Regel, nicht die Ausnahme Kann an allen Stellen eines Chromosoms passieren Wahrscheinlichkeit der gemeinsamen Vererbung zweier Merkmale hängt vom Abstand ab Großer Abstand: viel Platz für Rekombination, häufige Trennung der Merkmale Kleiner Abstand: kaum Platz für Rekombination, häufiges gemeinsame Vererbung der Merkmale Auf verschiedenen Chromosomen: statistische Unabhängigkeit einer gemeinsamen Vererbung Einheit: CentiMorgan Wahrscheinlichkeit 1% für Trennung von M 1 und M 2 : 1 cm Wahrscheinlichkeit 2% für Trennung von M 1 und M 2 : 2 cm... Ulf Leser: Molekularbiologische Datenbanken, Vorlesung, SoSe

23 Erstellung genetischer Karten Tiere: Züchtung Menschen: Grosse Stammbäume (CEPH) Verfahren Bestimmung der Merkmale bei allen Individuen Beobachtung der Wahrscheinlichkeiten der gemeinsamen Vererbung Berechnung der Ordnung und Abstände der Marker Algorithmus Prinzipiell: O(n!) mögliche Ordnungen Siehe Literatur Ulf Leser: Molekularbiologische Datenbanken, Vorlesung, SoSe

24 Fazit Historisch ältestes Verfahren Keinerlei Biotechnologie notwendig Zuverlässig Aber Rekombination ist nicht gleichverteilt Maximale Auflösung ca. 1 cm Bei Menschen schwierig (Große Stammbäume) Keine Hilfe zur Sequenzierung Ulf Leser: Molekularbiologische Datenbanken, Vorlesung, SoSe

25 II.3 Physikalische Karten - Übersicht Zwei Arten von Objekten Clone: YAC, PAC, BAC, Cosmids,... mit Ausdehnung Marker: Loci, STS, EST,... ohne Ausdehnung Hybridisierung und PCR Kartierungsverfahren Clone Hybridisierung STS Content Mapping Ulf Leser: Molekularbiologische Datenbanken, Vorlesung, SoSe

26 Restriktionsenzyme Proteine, die DNA an spezifischen Stellen schneiden Notwendig in Zelle als Müllabfuhr Viele bekannt (kommerziell) Partieller Verdau möglich Beispiel: Enzym EcoRI schneidet GAATTC GAATTC G AATTC CCAGAATTCTCG CCAG AATTCTCG GGTCTTAAGAGC GGTCTTAA GAGC Ulf Leser: Molekularbiologische Datenbanken, Vorlesung, SoSe

27 Clonieren: Erstellen der Bruchstücke Schneiden mit Restriktionsenzymen Bruchstücke unterschiedlicher Länge Auftrennen nach Länge Gelelektrophorese Clonierung in Bakterien Vervielfältigung Ergebnis: Ulf Leser: Molekularbiologische Datenbanken, Vorlesung, SoSe

28 Clonetypen YAC: Yeast Artificial Chromosome Größe zw. 150KB und 1.8MB Schnell zur großen Abdeckung Hohen Anteil an Chimerismen (40-60%) BAC: Bacterial Artificial Chromosome Größe zwischen 150 und 300 KB Sehr stabile Vervielfältigung Arbeitspferd des Human Genome Projects Cosmids Größe zwischen 35 und 45 KB Kann direkt sequenziert werden Ulf Leser: Molekularbiologische Datenbanken, Vorlesung, SoSe

29 Minimal benötigte Menge von Clonen Cosmids (40KB) BAC (250 KB) YAC (1000 KB) Drosophila 180 MB Homo Sapiens MB Theoretischer Wert Clone sind gleichverteilt Hohe Überdeckung notwendig (6-10) Ulf Leser: Molekularbiologische Datenbanken, Vorlesung, SoSe

30 Clonelibraries Mapping erfordert viele Versuche Identität der Clone muss gleich bleiben Libraries Mengen von Clonen, einmal hergestellt Internationale Verwendung Identifikation: Koordinaten ICRFy900F18, CEPH44G, 128_H_44 Eigenschaften Coverage Redundanz Clonetyp und länge Ulf Leser: Molekularbiologische Datenbanken, Vorlesung, SoSe

31 Clonelibraries kann man kaufen Ulf Leser: Molekularbiologische Datenbanken, Vorlesung, SoSe

32 DNA Marker Eindeutig im Genom lokalisierbare Punkte Bei allen Individuen gleich STS EST Sequence-tagged Sites Eindeutige Sequenzen Länge Basenpaare Expressed Sequence Tags STS aus kodierenden Abschnitten ESTs machen 80% der Genbank Sequenzen aus! Nachweis: PCR oder Hybridisierung Ulf Leser: Molekularbiologische Datenbanken, Vorlesung, SoSe

33 Kartierungstechniken Ziel ist der Minimum Tiling Path Was kann man über Clone/Marker herausbekommen? Clone überlappen Hybridisierung Clone enthalten Marker PCR Ulf Leser: Molekularbiologische Datenbanken, Vorlesung, SoSe

34 Hybridisierung (Sketch) Ein Clone (Probe, Sonde) wird markiert (Radioaktiv, fluoreszierend) Probe wird mit Library auf Filter zusammengebracht DNA hybridisiert, wenn komplementär Nicht hybridisierte Clone werden abgewaschen Ulf Leser: Molekularbiologische Datenbanken, Vorlesung, SoSe

35 Ergebnis Manuelle Auswertung Imageanalyse Spot- Strategien Cloneüberlappungen Quelle: Choi, Wing, Caltech Ulf Leser: Molekularbiologische Datenbanken, Vorlesung, SoSe

36 Abstraktes Ergebnis Gegeben Library Menge von Proben Hybridisierungsergebnisse Folgerungen Clone-Überlappungen Clone-Nicht Überlappungen Mapping - Aufgabe Konsistente Reihenfolge der Clone finden Algorithmen später Ulf Leser: Molekularbiologische Datenbanken, Vorlesung, SoSe

37 Beispiel für Mapping-Strategie KurzeClone vielehybridisierungen notwendig Lange Clone nicht sequenzierbar Mehrstufige Verfahren Beispiel 1. Stufe: YAC YAC Hybridisierung YAC Minimum Tiling Path, Y 1,...Y n 2. Stufe: YAC Cosmid Hybridisierung Alle Cosmids zu Y i, picken und neue Library machen 3. Stufe: Cosmid Cosmid Hybridisierung Cosmid Minimum Tiling Path pro Yac 4. Stufe: YAC Übergangszonen klären Cosmid Minimum Tiling Path Ulf Leser: Molekularbiologische Datenbanken, Vorlesung, SoSe

38 Einschub: In Situ Hybridisation Clone kann man direkt mit Chromsomen hybridisieren Zuordnung von Clonen zu Chromosomen Zuordnung von Clonen zu Chromosomenbändern Ulf Leser: Molekularbiologische Datenbanken, Vorlesung, SoSe

39 PCR (Sketch) Polymerase Chain Reaction Methode zur Vervielfältigung von DNA Bruchstücken Zusammen mit Gelektrophorese hochempfindliches Nachweisverfahren Nachzuweisende Sequenz muss bekannt sein Ulf Leser: Molekularbiologische Datenbanken, Vorlesung, SoSe

40 PCR Illustration Gegeben: Doppelsträngige DNA D Probe S mit bekannter Sequenz Frage: S D? Primer I Enthalten? 3 Primer II 5 3 Ulf Leser: Molekularbiologische Datenbanken, Vorlesung, SoSe

41 PCR Illustration Heat Heat Cool Cool Zugabe von Primern und Polymerase Polymerase verlängert Primer an Template Heat Cool Heat etc. Ulf Leser: Molekularbiologische Datenbanken, Vorlesung, SoSe

42 PCR - Nachweis Ergebnis: S D: Lösung enthält sehr viel S S D: Lösung enthält fast kein S Nachweis: Auftrennung im Gel Ulf Leser: Molekularbiologische Datenbanken, Vorlesung, SoSe

43 STS Content Mapping Gegeben Menge von Clonen Menge von STS Gesucht Welcher der Clone enthält welche STS? Verfahren PCR mir jedem STS Ergebnis Anchoring der Clone Algorithmen später Ulf Leser: Molekularbiologische Datenbanken, Vorlesung, SoSe

44 Fazit Physikalische Kartierung Voraussetzung für Sequenzierung Traditionell versus Whole Genome Shotgun Vielzahl von etablierten Methoden verfügbar Aber Aufwändige und komplexe Hochdurchsatzverfahren notwendig Keine Bevorzugung interessanter Regionen : Transscript Mapping Fehleranfällige Verfahren und komplexe Algorithmen Keine Informationen über Orientierung und Abstände in Contigs Keine Infos über Lage von Contigs zueinander und im Genom Ulf Leser: Molekularbiologische Datenbanken, Vorlesung, SoSe

45 Zusammenfassung Sinn der Kartierung Sequenzieren mit wenig Aufwand Finden relevanter Abschnitte (Transscript Mapping) Verschiedenste Arten von Karten Physikalisch, genetisch, cytogenetisch, integriert Weitere: Fingerprinting, Radiation Hybrid,... Alle Methoden fehlerträchtig Clone Chimerism Selbsthybridisierungen Notwendigkeit toleranter Algorithmen Notwendigkeit zur Integration von Karten Ulf Leser: Molekularbiologische Datenbanken, Vorlesung, SoSe

46 Teil III. Algorithmen Das Problem Matrixdarstellung Algorithmen für STS Content Mapping PQ Trees Hamming TSP Ulf Leser: Molekularbiologische Datenbanken, Vorlesung, SoSe

47 Abstrakte Problemdarstellung Clone-Mapping Problem Geg.: Menge C von Clonen, Menge P von Proben, Menge S von Überlappung (P C) (c i,c j ) S: c i Cund c j P überlappen (Hybridisierung) (c i,c j ) S: c i und c j überlappen nicht Gesucht: Ordnung von c C, die mit S konsistent ist STS Content-Mapping Problem Geg.: Menge C von Clonen, Menge P von Markern, Menge S von Treffern (p i,c j ) S: p i ist in c j enthalten (PCR) (p i,c j ) S: p i ist nicht in c j enthalten Gesucht: Ordnung von p M, die mit S konsistent ist Ulf Leser: Molekularbiologische Datenbanken, Vorlesung, SoSe

48 Matrixdarstellung Darstellung der experimentellen Ergebnisse in einer Matrix M Zeilen: Clone aus C Spalten: Clone aus P / Marker aus P Zellen 1: p i ist in c j / c i überlappt mit c j 0: sonst Ulf Leser: Molekularbiologische Datenbanken, Vorlesung, SoSe

49 Beispiel: Marker-Mapping C1 C2 C3 P1 P2 P3 Nicht möglich, wenn Clone gleiche Länge haben Cosmids, Oder BACs? C1 C2 C1 C2 P1 P2 P3 C3 C3 P1 P2 P3 Oder? P2 P1 P3 C1 C2 C3 Ulf Leser: Molekularbiologische Datenbanken, Vorlesung, SoSe

50 C1 C2 C3 Beispiel: Clone-Mapping C1 C2 C3 C1 C2 C3 Oder? C1 C2 C3 Oder? C1 C2 C3 Ulf Leser: Molekularbiologische Datenbanken, Vorlesung, SoSe

51 C1 C2 C3 P1 Beispiel: Marker-Mapping 2 P2 P3 Oder? P1 P2 P3 C1 C2 C3 P3 P2 P1 C1 C2 C3 Richtung nicht bestimmbar Ulf Leser: Molekularbiologische Datenbanken, Vorlesung, SoSe

52 Beispiel: Clone-Mapping mit Fehler C1 C2 C3 C4 C1 C2 C3 C4 C1, C2, C3 C1 C2 C3 Matrix muss Fehler enthalten! False Negative (C1-C4)? False Positive (C3-C4)? C1, C2, C3, C4 C2, C3, C4 C1 C2 C3 C2 C3 C4 C4 Ulf Leser: Molekularbiologische Datenbanken, Vorlesung, SoSe

53 Beispiel: Marker-Mapping mit Fehler Clone mit gleicher Länge C1 C2 C3 C4 P1 P2 P3 C1, C2, C3 C1 P1 P2 P3 C2 C3 C1, C2, C3, C4 C2, C3, C4 C1 P1 P2 P3 C2 C3 C2 P1 C3 P3 P2 C4 C4 Ulf Leser: Molekularbiologische Datenbanken, Vorlesung, SoSe

54 A1 A2 A3 A4 C1 C2 C3 C4 Beispiel: Marker-Mapping mit Fehler P1 P2 P3 Lösung für Clone unterschiedlicher Länge? C2 C4 C1 P1 P3 P2 C3 Ulf Leser: Molekularbiologische Datenbanken, Vorlesung, SoSe

55 Formalisierung Gegeben Menge C von Clones (Länge egal) Menge P von Probes Matrix M = 1 0 C i matches P otherwise j Def: M hat consecutive ones property (C1P), gdw es eine Permutation π der Spalten von M gibt, so daß in M =π(m) in jeder Zeile 1 er nur hintereinander vorkommen Ulf Leser: Molekularbiologische Datenbanken, Vorlesung, SoSe

56 C1P - Ordnung Theorem: Eine Matrix M ist C1P gdw es eine mit M konsistente Ordnung der Clone und Proben gibt Beweis: Literatur C1 C2 C3 C4 P1 P2 P3 C2 P1 P3 C1 C3 C4 P2 Ulf Leser: Molekularbiologische Datenbanken, Vorlesung, SoSe

57 C1 C2 C1 C2 C3 Weitere Beispiele P1 P2 P3 P4 C1 P3 P2 P1 P4 C2 P1 P2 P3 P4 C1 C2 P1 P2 P3 C3 P4? Ulf Leser: Molekularbiologische Datenbanken, Vorlesung, SoSe

58 Eigenschaften Nicht jede Matrix ist C1P False negatives, false positives, chimerism,... Wenn eine Matrix C1P ist, kann es viele Permutationen geben Viele Lösungen möglich, Experiment ist unterdeterminiert Feststellen der C1P Eigenschaft? Linearer Algorithmus (Booth & Luecker) PQ-Tree Ulf Leser: Molekularbiologische Datenbanken, Vorlesung, SoSe

59 III.1 PQ - Tree Ziemlich kompliziertes Biest Grundidee: Kompakte Repräsentation von Permutationen PQ Tree Blätter: Die Proben des Problems P-Knoten: Enthält mind. 2 Kinder: PQ-Baum oder Blätter Kinder können in beliebiger Reihenfolge vorkommen Q-Knoten: Enthält mind. 3 Kinder: PQ-Baum oder Blätter Kinder können in geg. Ordnung oder revers vorkommen Ulf Leser: Molekularbiologische Datenbanken, Vorlesung, SoSe

60 PQ-Tree 2- P-Knoten Q Knoten Ulf Leser: Molekularbiologische Datenbanken, Vorlesung, SoSe

61 PQ Tree 3- Definition von 9 Transformationen Überführen PQ-Baum in äquivalenten PQ-Baum Äquivalenz: Reihenfolge der Blätter von links nach rechts kann gleich sein (Frontier) Verfahren Geht nicht immer! Starte mit T aus P-Knoten und Blättern Betrachte nacheinander Clone C i mit pos. Probes P 1,..., P n Transformiere T zu äquivalentem T so, dass P 1,..., P n in der Frontier von T in dieser Reihenfolge sein können Theorem: Matrix ist C1P gdw es einen entsprechenden PQ Baum gibt Das o.g. Verfahren findet einen PQ Baum, wenn es ihn gibt Das Verfahren ist O(n+m) (Anz. Clone / Anz. Proben) Ulf Leser: Molekularbiologische Datenbanken, Vorlesung, SoSe

62 C1 C2 C3 C4 C1 C2 C3 C4 P1 P1 Beispiel P2 P3 P4 P2 P3 P4 Ulf Leser: Molekularbiologische Datenbanken, Vorlesung, SoSe

63 C1 C2 C3 C4 C1 C2 C3 C4 P1 P1 Beispiel 2- P2 P3 P4 P2 P3 P4 Ulf Leser: Molekularbiologische Datenbanken, Vorlesung, SoSe

64 C1 C2 C3 C4 P1 Beispiel 3- P2 P3 P4 Ulf Leser: Molekularbiologische Datenbanken, Vorlesung, SoSe

65 Ergebnis 4- P1 C1 C2 C3 C4 P3 P4 P2 Weitere Möglichkeiten C1 C2 C3 C4 P1 P3 P2 P4 C1 C2 C3 C4 P2 P4 P3 Siehe auch: Ulf Leser: Molekularbiologische Datenbanken, Vorlesung, SoSe P1

66 PQ-Tree Zusammenfassung Finden der entsprechenden Transformationen nicht trivial, aber linear Keine Erweiterung bekannt für noisy data Keine Verwendung als Mapping Algorithmus für real life data Ulf Leser: Molekularbiologische Datenbanken, Vorlesung, SoSe

67 Back to real life Echte Daten sind nicht so hübsch Falsche positive Signale Falsche negative Signale Chimeric Clones Matrix nicht C1P Problem: Finde die wahrscheinlichste Lösung Möglichst wenig 1 einfügen (false negatives) Möglichst wenig 1 löschen (false positives) Möglichst wenig Clone entfernen/auftrennen (chimerism) Möglichst wenig Proben entfernen (Non-Unique) Ulf Leser: Molekularbiologische Datenbanken, Vorlesung, SoSe

68 Verfahren Diverse Verfahren sind veröffentlicht Maximum Likelyhood Berechnung Bayes sche Wahrscheinlichkeiten... Alle sehr teuer, deshalb Näherungsverfahren Simulated Annealing Heuristiken Greedy... Ulf Leser: Molekularbiologische Datenbanken, Vorlesung, SoSe

69 III.2 Behandlung Falsch Positiver Geg. Hybridisierungsmatrix M Ges. Matrix M mit M ist C1P DEL ist eine Funktion, die aus M beliebige 1 löscht (also falsch positive entfernt) M =DEL(M) M ist die Matrix, bei der DEL am wenigsten 1 löscht (also am wenigsten falsch positive braucht ) Ulf Leser: Molekularbiologische Datenbanken, Vorlesung, SoSe

70 Voraussetzung Hamming-Abstand zweier Spalte Anzahl ungleicher Werte Traveling Salesman Problem Geg.: Graph mit gewichteten Kanten Finde Weg so, dass jeder Knoten genau einmal besucht wird und die Summe der Kantengewichte minimal ist Ulf Leser: Molekularbiologische Datenbanken, Vorlesung, SoSe

71 Hamming-TSP [AKNW95] Theorem Löse das H-TSP Problem für folgenden Graphen Jede Probe ein Knoten w(p 1,P 2 ) = hamming(p 1,P 2 ) Der Pfad der Lösung induziert M Problem TSP ist NP vollständig... und der Graph ist vollständig Ulf Leser: Molekularbiologische Datenbanken, Vorlesung, SoSe

72 War nicht lösbar A B C1 C2 C3 C4 C D Beispiel C 3 2 A 3 D B A B C D A B C1 C1 C2 C2 C3 C4 C3 C4 D C C1 C2 C3 C4 D A B Ulf Leser: Molekularbiologische Datenbanken, Vorlesung, SoSe C

73 Zusammenfassung Diverse Algorithmen veröffentlicht Graphbasiert, PQ-Trees, statistisch Alle Algorithmen berechnen bestmögliche Anordnungen Interessante Probleme exponentiell Näherungstechniken und Heuristiken Lösungen i.d.r. nicht eindeutig Mehrstufige Verfahren Kleine Fehler große Wirkung (Chimeric Clones) Real life Kombination von Daten aus unterschiedlichen Quellen / Verfahren Crossvalidierung Manuelle Nachbearbeitung Ulf Leser: Molekularbiologische Datenbanken, Vorlesung, SoSe

74 Teil IV. Integrierte Karten Alle Mapping-Verfahren haben ihre Schwächen Integration von Karten Auflösen von Konflikten Ergänzung fehlender Informationen Verifikation durch Redundanz Höhere Robustheit durch Einsatz unterschiedlicher Techniken Beispiele Orientierung und Abstand von STS-Markern durch genetische Karten Positionierung von Contigs durch genetische Marker Zuordnung von Clonen zu Chromosome durch FISH Ulf Leser: Molekularbiologische Datenbanken, Vorlesung, SoSe

75 Integration von Karten Zwei Bedeutungen Ergänzung fehlender Daten zwischen Karten gleichen Typs Vergleich zweier BAC Karten Ergänzung fehlender Informationen durch Karten anderen Typs Kombination genetischer und physikalischer Karten Voraussetzungen Karten müssen identische Objekte teilen Marker mit genetischer und physikalischer Position: EST Identische Objekte müssen als solche erkannt werden Entscheidungsfindung bei widersprüchlichen Daten (oft ohne ausreichende oder vergleichbare Evidenz) Integration unterschiedlicher mathematischer Verfahren Ulf Leser: Molekularbiologische Datenbanken, Vorlesung, SoSe

76 Einschub: Was ist ein Locus? Prinzipiell: ein Ort auf einem Chromosome DNA Marker (bei allen Individuen gleich) Polymorphismus (Unterschiedliche Allele vorhanden) Gen (welches Stück?) Ort häufiger Rekombinationen Eine Probe (Sonde) etwas, was man nachweisen kann Ein Clone... Loci haben keine Eigenschaften, nur Namen Ulf Leser: Molekularbiologische Datenbanken, Vorlesung, SoSe

77 Vielfältige Probleme Objektnamen Identifizieren gleicher Objekte sehr schwierig Clone/Marker mit >20 Synonymen keine Seltenheit Klassennamen Marker, Locus, Gene alle nicht klar definiert Ein Gen auf Karten kann alles mögliche sein: Gen selber (aber: Gennamen nicht standardisiert) ESTs und cdnas SNPs, Mutationen, Polymorphismen Splicevarianten Proteinname... Bereich zwischen Basen bis 2 MB Ulf Leser: Molekularbiologische Datenbanken, Vorlesung, SoSe

78 Probleme 2- Typische Integrationsmethode sehr anfällig Eigentlich: Rohdaten (Überlappungen) integrieren Karte neu berechnen Aber: Rohdaten nicht verfügbar Unterschiedliche Protokolle Komplexität der Algorithmen zu groß Also Manuelle Integration der (veröffentlichten) Ergebniskarten Keine Einschätzung der Güte mehr möglich Umrechnung zwischen Koordinatensystemen schwierig 1cM 1MB nur Durchschnittswert Confidence der Koordinaten beachten Physikalische Karten haben keine exakten Koordinaten Ulf Leser: Molekularbiologische Datenbanken, Vorlesung, SoSe

79 Beispiel Quelle: Ulf Leser: Molekularbiologische Datenbanken, Vorlesung, SoSe

80 Divergenzen Quelle: Ulf Leser: Molekularbiologische Datenbanken, Vorlesung, SoSe

81 Fazit (Nahezu) alle Karten sind integrierte Karten Kriterien der Integration oft nicht oder nur auf Papier (Veröffentlichung) bekannt Aussagen zur Güte der Daten gehen verloren Vorsicht Manuelle und subjektive Entscheidungen bei Widersprüchen Statistische Signifikanz unklar Verschiedene Karten benutzen oft dieselben Quellen Ist WI-9922 nach 10-mal kopieren noch WI-9922? Ulf Leser: Molekularbiologische Datenbanken, Vorlesung, SoSe

82 Teil V. Datenmodelle Modellierung von experimentellen Daten Modellierung von Karten (OMG Standard) Integrierte Karten Ulf Leser: Molekularbiologische Datenbanken, Vorlesung, SoSe

83 Experimentelle Daten Rohdaten der Kartierung sind Experimente Metadaten Durchführender, Datum, Roboter/Geräte, angewandtes Protokoll (Temperaturen, Farbstoffe, Enzyme,...) Experimentdaten (physikalische Karten) Library Clone mit Koordinaten Probe Ergebnisdaten Clone-Mapping: Überlappungen Marker-Mapping: Part_of Ulf Leser: Molekularbiologische Datenbanken, Vorlesung, SoSe

84 Beispielhaftes Modell Protocoll -operates_on 1 * Experiment -Date -Experimentor uses Probe 1 -uses 1 * * * -results_in 1 Library -Location -Origin -Librarytype -Last_Replication has ** Clone -Coordinates 1 -combines Result -Confidence * -combines 1 * Hybridization Positive_PCR Library clone: m:n Probe kann wiederum Clone sein Ulf Leser: Molekularbiologische Datenbanken, Vorlesung, SoSe

85 Modellierung von Genomkarten Genomkarte: Experimente + Auswertung Abstraktion von technischen Details der Experimente Elemente von Genomkarten Kartentyp Genetisch, physikalisch, cytogenetisch,... Kartierte Objekte Clone, Marker, Unterkarten, Contigs,... Beziehungen zwischen kartierten Objekten Enthalten, Überlappt, liegt_vor, liegt_nach, linkes_ende,... Koordinaten Ordnung, Halbordnung, ungeordnet Numerische Koordinaten oder nicht Hierarchische Beziehungen: Karten enthalten Karten Ulf Leser: Molekularbiologische Datenbanken, Vorlesung, SoSe

86 OMG Standard Genome Maps [BLL+99] mappedobj 1..1 Ma ppable species chromosome type getmaps() 0..* MapObject database name id crossreferences 1..1 Point Segment length unit Marke r Ma p Clo ne 1..1 MapEle m e nt positionprecision 1..* onmap 1..1 getnrofelements() getallelements() getrangebetweenobjects() getelementsinsegment() IntervalPosition PointPosition Range Position leftend rightend OrderedPosition rank frameworkelement position Vag ue Po s itio n leftflankingobj rightflankingobj Lin e a rma p maxcoordinate mincoordinate getscalarrange() getaround() Bin CytogeneticElement rank getsuperelement() getsubelements() getsiblings() Ulf Leser: Molekularbiologische Datenbanken, Vorlesung, SoSe

87 Mappable Ma ppable species chromosome type getmaps() MapObje ct database name id Point Segment length unit Mappable: Alle Objekte, die man auf einer Karte platzieren kann Segments: Haben Ausdehnung: Clone, Chrombands, Karten,... Points: Keine Ausdehnung: Marker, EST, STS,... Ulf Leser: Molekularbiologische Datenbanken, Vorlesung, SoSe

88 Map Maps: Sind selber Segmente Karten können Karten enthalten Zwei Arten von Karten Linear maps: Mit Koordinatensystem: Physikalische Karten Genetische Karten Bin maps: Geordnete/ halbgeordnete/ ungeordnete Kollektionen Radiation-hybrid Karten Chromsomenbänder 1 Lin e a rma p maxcoordinate mincoordinate getscalarrange() getaround() Segment length unit Ma p getnrofelements() getallelements() getrangebetweenobjects() getelementsinsegment() Bin Ulf Leser: Molekularbiologische Datenbanken, Vorlesung, SoSe

89 MapElement MapEle m e nt positionprecision IntervalPosition PointPosition Range Pos ition leftend rightend frameworkelement position leftflankingobj rightflankingobj Orde re dposition rank Vag ue Po s itio n MapElement: Zuweisung eines Mappable zu einer Map mit einer Position in einem Coordinatesystem Position: vor, nach, zwischen, in,... n:m Relationship zwischen Map und Mappable Ulf Leser: Molekularbiologische Datenbanken, Vorlesung, SoSe

90 Bewertung Sehr mächtiges und generisches Modell Orientierung an veröffentlichten Karten Keine Rohdaten (Überlappungen etc.) Übersetzung in Koordinaten erwartet Koordinaten nicht überbewerten Best. Constraints nicht repräsentiert Points dürfen keine IntervalPosition haben BinMaps dürfen keine Koordinaten-Positions haben Humane Karten können keine Mausclone enthalten... Keine Behandlung von Synonymen, Homonymen, etc. OMG Philosophie Ulf Leser: Molekularbiologische Datenbanken, Vorlesung, SoSe

91 Integrierte Karten Modellierung von Karten Objekte auf Karten Topologische Beziehungen von Objekten Widersprüchliche Positionen i.o. Integrierte Karten Integration der Rohdaten Logische Beziehungen von Objekten Identität und Namen: Synonyme, Homonyme Herkunft: vervielfältigter Clone, STS vom Ende eines Clone, EST vom 3 einer cdna,... Widersprüchliche Beschreibungen i.o. Ulf Leser: Molekularbiologische Datenbanken, Vorlesung, SoSe

92 Beispielhaftes Modell Das Ende des einwertigen Attributs... Jedes Eigenschaft mit Evidenz und Ursprung Namen als Eigenschaften Evidence Origin * Relationship * * Clone * * * * * * * Has_Length -Length -Origin -Evidence Has_Name -Name -Origin Is_Chimeric -Chimeric -Origin -Evidence Right_end Left_end Probe_for end_5p Same_origin end_3p Ulf Leser: Molekularbiologische Datenbanken, Vorlesung, SoSe

93 Teil VI. Datenbanken The Genome Database (GDB) egenome LocusLink Ulf Leser: Molekularbiologische Datenbanken, Vorlesung, SoSe

94 GDB [ Jahrelang Standarddatenbank für HGP Mapping Daten Anzahl Objekte Clone (BAC und PAC) Gene mit Position Marker Verfahren der Integration Submission based (CTL Format) Idee der Community Curation GDB Consensus Maps: heuristisches Verfahren, ohne Rohdaten ( Chromosome Editors Technische Implementierung OPM, Sybase OPM-Modell mit ca. 75 Klassen, ca. 140 Tabellen Ulf Leser: Molekularbiologische Datenbanken, Vorlesung, SoSe

95 GDB Ulf Leser: Molekularbiologische Datenbanken, Vorlesung, SoSe

96 GDB Bewertung Sehr technisch orientiert Modell ähnlich zu OMG Standard Maps on Maps Coordinate Systems Object Mapping Map Komplizierte Search-Forms kaum benutzt Community Curation kaum benutzt Relativ langsam Ulf Leser: Molekularbiologische Datenbanken, Vorlesung, SoSe

97 egenome [ Projekt, org. Chromosom 1 Z.Z. ca Marker Clones Ein Marker alle 45 KB Integrationsverfahren Konservatives Verfahren CEPH Genetic maps Radiation Hybrid maps - UniGene Cluster - Benutzung der Konfidenzvalues I.d.R: Berechnung von Bins (Bundels), nicht Koordinaten Technische Realisierung 4Dimension (3GL Datenbank + Entwicklungsumgebung) Export als Flatfiles verfügbar Ulf Leser: Molekularbiologische Datenbanken, Vorlesung, SoSe

98 egenome Einfache Textsuche & Region Search Ulf Leser: Molekularbiologische Datenbanken, Vorlesung, SoSe

99 LocusLink [ Repository von Genen und some non Genes Vielfältige Informationen über Mapposition hinaus Proteine, Funktionen, RNA, Phenotypes, ESTs, Genes Integrationsverfahren Wöchentliches Update Enge Verzahnung mit RefSeq Technische Implementierung NCBI: Entrez Search Interface Tab-del Files Ulf Leser: Molekularbiologische Datenbanken, Vorlesung, SoSe

100 LocusLink Integrationsworkflow Quelle: Mischung aus manueller und automatischer Bearbeitung Objektstatus: Provisional - Reviewed Kein Releasekonzept, keine Versionierung Ulf Leser: Molekularbiologische Datenbanken, Vorlesung, SoSe

101 Weitere Human Genome Browser Chromosomenspezifische Jedem Chromosom seine Datenbank Die grossen Mappingprojekte Whitehead, Washington, Ceph,... Die grossen Sequenzierprojekte Sanger, Celera,... Übersicht z.b. in [BO01], Kap. 6 Ulf Leser: Molekularbiologische Datenbanken, Vorlesung, SoSe

102 Zusammenfassung Mapping, Kartierung Objekte Clone, STS, Clonierung Experimente Hybridisierung, PCR Algorithmen C1P, Real-Life Probleme, Näherungsverfahren Modelle Experimentdaten, Karten, integrierte Datenbanken Datenbanken GDB, egenome, Locuslink Ulf Leser: Molekularbiologische Datenbanken, Vorlesung, SoSe

103 Literatur [BO01] Baxevanis, A. D. and Ouellette, B. F. F., Eds. (2001). "Bioinformatics. A Practical Guide to the Analysis of Genes and Proteins", John Wiley & Sons. Kapitel 6 [Sen02] Sensen, C., Ed. (2002). "Essentials of Genomics and Bioinformatics", Wiley-VCH, Weinheim., Kapitel 2, 6 [Pri96] Primrose, S. B. (1996). "Genomanalyse". Heidelberg, Spectrum; Akademischer Verlag. [GI95] Greenberg, D. S. and Istrail, S. (1995). "Physical Mapping by STS Hybridisation: Algorithmic Strategies and the Challenge od Software Evaluation." Journal of Computational Biology 2(2): [AKNW95] Alizadeh, F., Karp, R. M., Newberg, L. A. and Weissner, D. K. (1995). "Physical Mapping of Chromosomes: A Combinatorial Problem in Molecular Biology." Algorithmica 13(1/2): [BLL+99] Barillot, E., Leser, U., et al. (1999) A Proposal for a Standard CORBA Interface for Genome Maps, Bioinformatics 15(2): Ulf Leser: Molekularbiologische Datenbanken, Vorlesung, SoSe

Bioinformatik. Zeichenketten und Stringalgorithmen. Ulf Leser Wissensmanagement in der. Bioinformatik

Bioinformatik. Zeichenketten und Stringalgorithmen. Ulf Leser Wissensmanagement in der. Bioinformatik Bioinformatik Zeichenketten und Stringalgorithmen Ulf Leser Wissensmanagement in der Bioinformatik Inhalt dieser Vorlesung Warum Stringmatching? Strings und Matching Naiver Algorithmus Ulf Leser: Bioinformatik

Mehr

Molekularbiologische Datenbanken

Molekularbiologische Datenbanken Molekularbiologische Datenbanken Sequenzierung Ulf Leser Wissensmanagement in der Bioinformatik Formalisierung Gegeben Menge C von Clones (Länge egal) Menge P von Probes Matrix M 1 Ci matches Pj = 0 otherwise

Mehr

Genomsequenzierung für Anfänger

Genomsequenzierung für Anfänger Genomsequenzierung für Anfänger Philipp Pagel 8. November 2005 1 DNA Sequenzierung Heute wird DNA üblicherweise mit der sogenannten Sanger (oder chain-terminationoder Didesoxy-) Methode sequenziert dessen

Mehr

Bioinformatik. Zeichenketten und Stringalgorithmen. Ulf Leser Wissensmanagement in der. Bioinformatik

Bioinformatik. Zeichenketten und Stringalgorithmen. Ulf Leser Wissensmanagement in der. Bioinformatik Bioinformatik Zeichenketten und Stringalgorithmen Ulf Leser Wissensmanagement in der Bioinformatik Inhalt dieser Vorlesung Warum Stringmatching? Strings und Matching Naiver Algorithmus Ulf Leser: Algorithmische

Mehr

Bioinformatik. Suche nach mehreren Mustern. Ulf Leser Wissensmanagement in der. Bioinformatik

Bioinformatik. Suche nach mehreren Mustern. Ulf Leser Wissensmanagement in der. Bioinformatik Bioinformatik Suche nach mehreren Mustern Ulf Leser Wissensmanagement in der Bioinformatik Grundidee Knuth-Morris-Pratt Erinnerung an den naiven Algorithmus ctgagatcgcgta gagatc gagatc gagatc gagatc gagatc

Mehr

AUFGABENSAMMLUNG. Restriktionsenzyme. Füllen Sie den Lückentext aus. Gentechnik Schroedel, Braunschweig

AUFGABENSAMMLUNG. Restriktionsenzyme. Füllen Sie den Lückentext aus. Gentechnik Schroedel, Braunschweig Restriktionsenzyme Füllen Sie den Lückentext aus. PCR 1a Mit dem folgenden Quiz können Sie Ihr Wissen zum Thema PCR überprüfen. Klicken Sie jeweils die richtige Antwort an. PCR 1b Mit dem folgenden Quiz

Mehr

Algorithmische Bioinformatik

Algorithmische Bioinformatik Algorithmische Bioinformatik Biologische Daten als Strings Ulf Leser Wissensmanagement in der Bioinformatik Ziele für heute Wert von Reduktionismus: Genome als Strings Reinschmecken in Stringmatching Erster

Mehr

Proseminar Online Algorithmen, Prof. Dr. Rolf Klein

Proseminar Online Algorithmen, Prof. Dr. Rolf Klein Proseminar Online Algorithmen, Prof. Dr. Rolf Klein Vortrag von Michael Daumen am 13.12.2000 Thema : Minimum Spanning Tree und 2-Approximation der TSP-Tour Inhalt des Vortrags : 1. genaue Vorstellung des

Mehr

Threading - Algorithmen

Threading - Algorithmen Threading - Algorithmen Florian Lindemann 22.11.2007 Florian Lindemann () Threading - Algorithmen 22.11.2007 1 / 25 Gliederung 1 Prospect Scoring Function Algorithmus Weitere Eigenschaften Komplexität

Mehr

2.) Wie lautet in der Genomforschung das Fachwort für Vielgestaltigkeit? a) Polytheismus b) Polymerisation c) Polymorphismus d) Polygamismus

2.) Wie lautet in der Genomforschung das Fachwort für Vielgestaltigkeit? a) Polytheismus b) Polymerisation c) Polymorphismus d) Polygamismus Lernkontrolle M o d u l 2 A w i e... A n k r e u z e n! 1.) Welche gentechnischen Verfahren bildeten die Grundlage für das Humangenomprojekt (Mehrfachnennungen möglich)? a) Polymerase-Kettenreaktion b)

Mehr

MOF Meta Object Facility. Veranstaltungsvortrag im Rahmen der Projektgruppe ComponentTools

MOF Meta Object Facility. Veranstaltungsvortrag im Rahmen der Projektgruppe ComponentTools MOF Meta Object Facility Veranstaltungsvortrag im Rahmen der Projektgruppe ComponentTools Überblick Object Management Group (OMG) Model Driven Architecture (MDA) Exkurs: Modelle, Metamodelle MOF Architektur

Mehr

Bioinformatik. Lokale Alignierung Gapkosten. Silke Trißl / Ulf Leser Wissensmanagement in der. Bioinformatik

Bioinformatik. Lokale Alignierung Gapkosten. Silke Trißl / Ulf Leser Wissensmanagement in der. Bioinformatik Bioinformatik Lokale Alignierung Gapkosten Silke Trißl / Ulf Leser Wissensmanagement in der Bioinformatik Inhalt dieser Vorlesung Ähnlichkeit Lokales und globales Alignment Gapped Alignment Silke Trißl:

Mehr

Algorithmische Bioinformatik

Algorithmische Bioinformatik Algorithmische Bioinformatik Effiziente Berechnung des Editabstands Dynamische Programmierung Ulf Leser Wissensmanagement in der Bioinformatik Inhalt dieser Vorlesung Rekursive Definition des Editabstands

Mehr

Monitoring Database: Grundlagen, Workflow, Hinweise

Monitoring Database: Grundlagen, Workflow, Hinweise Monitoring Database: Grundlagen, Workflow, Hinweise 1: Öffnen der Datenbank \\qlb-fs01\zlq\institut ZLQ\Genbank\Enders\Monitoring_DB\Stable_Version Unter diesem Verzeichnis sind 2 Versionen der Datenbank

Mehr

Eclipse und EclipseLink

Eclipse und EclipseLink Eclipse und EclipseLink Johannes Michler Johannes.Michler@promatis.de PROMATIS, Ettlingen Zugriff auf Oracle Datenbanken aus Eclipse RCP Anwendungen via EclipseLink 18.09.2009 1 Gliederung Eclipse als

Mehr

Molekularbiologische Datenbanken

Molekularbiologische Datenbanken Molekularbiologische Datenbanken Übungen Aufgabe 2 Silke Trißl Ulf Leser Wissensmanagement in der Bioinformatik Microarray oder Expressionsanalyse Gleiche Erbinformation in der Zelle (Genom), aber viele

Mehr

10. Datenbank Design 1

10. Datenbank Design 1 1 Die Hauptaufgabe einer Datenbank besteht darin, Daten so lange zu speichern bis diese explizit überschrieben oder gelöscht werden. Also auch über das Ende (ev. sogar der Lebenszeit) einer Applikation

Mehr

Kapitel 12: Schnelles Bestimmen der Frequent Itemsets

Kapitel 12: Schnelles Bestimmen der Frequent Itemsets Einleitung In welchen Situationen ist Apriori teuer, und warum? Kapitel 12: Schnelles Bestimmen der Frequent Itemsets Data Warehousing und Mining 1 Data Warehousing und Mining 2 Schnelles Identifizieren

Mehr

ASSEMBLY ALGORITHMS FOR NEXT-GENERATION SEQUENCING DATA

ASSEMBLY ALGORITHMS FOR NEXT-GENERATION SEQUENCING DATA ASSEMBLY ALGORITHMS FOR NEXT-GENERATION SEQUENCING DATA Jason R. Miller*, Sergey Koren, Granger Sutton Ein Vortrag von Sergej Tschernyschkow Friedrich-Schiller-Universität Jena 03. Mai 2010 SERGEJ TSCHERNYSCHKOW

Mehr

Molekularbiologische Datenbanken

Molekularbiologische Datenbanken Molekularbiologische Datenbanken Datenmodelle Ulf Leser Wissensmanagement in der Bioinformatik Motivation Warum gibt es öffentlich zugängliche molekularbiologische Datenbanken (MDB)? Data Submission =

Mehr

Genisolierung in 2 Stunden : Die Polymerase-Ketten-Reaktion (PCR)

Genisolierung in 2 Stunden : Die Polymerase-Ketten-Reaktion (PCR) PCR Genisolierung in 2 Stunden : Die Polymerase-Ketten-Reaktion (PCR) von Kary B. Mullis entwickelt (1985) eigentlich im Mai 1983 bei einer nächtlichen Autofahrt erstes erfolgreiches Experiment am 16.12.1983

Mehr

Molekularbiologische Datenbanken

Molekularbiologische Datenbanken Molekularbiologische Datenbanken Übungen Sommersemester 2004 Silke Trißl Prof. Ulf Leser Wissensmanagement in der Bioinformatik Organisatorisches Mittwoch 11 13 Uhr, RUD26 0'313 Mi, 05. Mai 2004 entfällt

Mehr

Konzeptueller Entwurf

Konzeptueller Entwurf Konzeptueller Entwurf UML Klassendiagrame UML Assoziationen Entspricht Beziehungen Optional: Assoziationsnamen Leserichtung ( oder ), sonst bidirektional Rollennamen Kardinalitätsrestriktionen UML Kardinalitätsrestriktionen

Mehr

AGES-Webribo. Systematik in Clostridium difficile PCR-Ribotyping. Alexander Indra

AGES-Webribo. Systematik in Clostridium difficile PCR-Ribotyping. Alexander Indra AGES-Webribo Systematik in Clostridium difficile PCR-Ribotyping Alexander Indra AGES-Institut für medizinische Mikrobiologie und Hygiene Wien Nationale Referenzzentrale für Clostridium difficile Clostridium

Mehr

SQL structured query language

SQL structured query language Umfangreiche Datenmengen werden üblicherweise in relationalen Datenbank-Systemen (RDBMS) gespeichert Logische Struktur der Datenbank wird mittels Entity/Realtionship-Diagrammen dargestellt structured query

Mehr

Biologie I/B: Klassische und molekulare Genetik, molekulare Grundlagen der Entwicklung Theoretische Übungen SS 2016

Biologie I/B: Klassische und molekulare Genetik, molekulare Grundlagen der Entwicklung Theoretische Übungen SS 2016 Biologie I/B: Klassische und molekulare Genetik, molekulare Grundlagen der Entwicklung Theoretische Übungen SS 2016 Fragen für die Übungsstunde 7 (11.07-15.07.) Methoden und Techniken II 1. Sie bekommen

Mehr

Oracle JDeveloper 10 g

Oracle JDeveloper 10 g Oracle JDeveloper 10 g Modellierung Evgenia Rosa Business Unit Application Server ORACLE Deutschland GmbH Agenda Warum Modellierung? UML Modellierung Anwendungsfall (Use Case)-Modellierung Aktivitätenmodellierung

Mehr

Wichtige Themen aus der Vorlesung Bioinformatik I WS 2013/2014

Wichtige Themen aus der Vorlesung Bioinformatik I WS 2013/2014 Universität des Saarlandes FR 6.2 Informatik Prof. Dr. Hans-Peter Lenhof Daniel Stöckel, M. Sc. Patrick Trampert, M. Sc. Lara Schneider, M. Sc. I Wichtige Themen aus der Vorlesung Bioinformatik I WS 2013/2014

Mehr

Überblick. TSP Vergleich der Lösungen. Das Travelling Salesman Problem. Nearest-Neighbor Heuristik für TSP

Überblick. TSP Vergleich der Lösungen. Das Travelling Salesman Problem. Nearest-Neighbor Heuristik für TSP Kap..1 Heuristiken Kap.. Approximative Algorithmen und Gütegarantien Professor Dr. Lehrstuhl für Algorithm Engineering, LS11 Fakultät für Informatik, TU Dortmund 3. VO DAP SS 008 14. Juli 009 Überblick

Mehr

UML-Basics: Einführung in Objekt- Orientierte Modellierung mit der Unified Modeling Language

UML-Basics: Einführung in Objekt- Orientierte Modellierung mit der Unified Modeling Language UML-Basics: Einführung in Objekt- Orientierte Modellierung mit der Unified Modeling Language ADV-Seminar Leiter: Ziel dieses Seminars Verständnis von Objekt-Orientierung Was sind Klassen? Was ist Vererbung?

Mehr

WS 2009/10. Diskrete Strukturen

WS 2009/10. Diskrete Strukturen WS 2009/10 Diskrete Strukturen Prof. Dr. J. Esparza Lehrstuhl für Grundlagen der Softwarezuverlässigkeit und theoretische Informatik Fakultät für Informatik Technische Universität München http://www7.in.tum.de/um/courses/ds/ws0910

Mehr

Einführung in Heuristische Suche

Einführung in Heuristische Suche Einführung in Heuristische Suche Beispiele 2 Überblick Intelligente Suche Rundenbasierte Spiele 3 Grundlagen Es muss ein Rätsel / Puzzle / Problem gelöst werden Wie kann ein Computer diese Aufgabe lösen?

Mehr

Algorithmische Bioinformatik 1

Algorithmische Bioinformatik 1 Algorithmische Bioinformatik 1 Dr. Hanjo Täubig Lehrstuhl für Effiziente Algorithmen (Prof. Dr. Ernst W. Mayr) Institut für Informatik Technische Universität München Sommersemester 2009 Übersicht Paarweises

Mehr

Data Warehousing. DWH Projekte. Ulf Leser Wissensmanagement in der Bioinformatik

Data Warehousing. DWH Projekte. Ulf Leser Wissensmanagement in der Bioinformatik Data Warehousing DWH Projekte Ulf Leser Wissensmanagement in der Bioinformatik Inhalt DWH Projekte Spezifika Die kritischen Punkte Warum scheitern DWH Projekte? Ulf Leser: Data Warehousing, Vorlesung,

Mehr

1. Einführung. Datenbanken Grundlagen

1. Einführung. Datenbanken Grundlagen 1. Einführung Datenbanken Grundlagen Wo finden wir Datenbanken? Was sind Datenbanken/ Datenbankensysteme(DBS)? A collection of related data items mit folgenden Eigenschaften: Eine Datebank repräsentiert

Mehr

Diskrete Strukturen Kapitel 1: Einleitung

Diskrete Strukturen Kapitel 1: Einleitung WS 2015/16 Diskrete Strukturen Kapitel 1: Einleitung Hans-Joachim Bungartz Lehrstuhl für wissenschaftliches Rechnen Fakultät für Informatik Technische Universität München http://www5.in.tum.de/wiki/index.php/diskrete_strukturen_-_winter_15

Mehr

DATENQUALITÄT IN GENOMDATENBANKEN

DATENQUALITÄT IN GENOMDATENBANKEN DATENQUALITÄT IN GENOMDATENBANKEN Alexander Fehr 28. Januar 2004 Gliederung Motivation Biologische Grundkonzepte Genomdaten Datenproduktion und Fehler Data Cleansing 2 Motivation (1) Genomdatenbanken enthalten

Mehr

ISU 1. Ue_08/02_Datenbanken/SQL. 08 Datenbanken. Übung. SQL Einführung. Eckbert Jankowski. www.iit.tu-cottbus.de

ISU 1. Ue_08/02_Datenbanken/SQL. 08 Datenbanken. Übung. SQL Einführung. Eckbert Jankowski. www.iit.tu-cottbus.de 08 Datenbanken Übung SQL Einführung Eckbert Jankowski www.iit.tu-cottbus.de Datenmodell (Wiederholung, Zusammenfassung) Objekte und deren Eigenschaften definieren Beziehungen zwischen den Objekten erkennen/definieren

Mehr

Datenstrukturen & Algorithmen

Datenstrukturen & Algorithmen Datenstrukturen & Algorithmen Matthias Zwicker Universität Bern Frühling 2010 Übersicht Dynamische Programmierung Einführung Ablaufkoordination von Montagebändern Längste gemeinsame Teilsequenz Optimale

Mehr

Einleitung. Komplexe Anfragen. Suche ist teuer. VA-File Verfeinerungen. A0-Algo. GeVAS. Schluß. Folie 2. Einleitung. Suche ist teuer.

Einleitung. Komplexe Anfragen. Suche ist teuer. VA-File Verfeinerungen. A0-Algo. GeVAS. Schluß. Folie 2. Einleitung. Suche ist teuer. Anwendung Input: Query-Bild, Ergebnis: Menge ähnlicher Bilder. Kapitel 8: Ähnlichkeitsanfragen und ihre effiziente Evaluierung Wie zu finden? Corbis, NASA: EOS Bilddatenbank Folie Folie 2 Ähnlichkeitssuche

Mehr

Notationen zur Prozessmodellierung

Notationen zur Prozessmodellierung Notationen zur Prozessmodellierung August 2014 Inhalt (erweiterte) ereignisgesteuerte Prozesskette (eepk) 3 Wertschöpfungskettendiagramm (WKD) 5 Business Process Model and Notation (BPMN) 7 Unified Modeling

Mehr

Datenvorverarbeitung von nominalen Daten für Data Mining

Datenvorverarbeitung von nominalen Daten für Data Mining Datenvorverarbeitung von nominalen Daten für Data Mining Entstanden 2004/2005 bei der T-Systems International GmbH unter Betreuung von Prof. Dr. J. Fürnkranz Seite 1 Gliederung Datenvorverarbeitung Prepared

Mehr

Evolution & Genetik (Beispiel Hämoglobin) Prof. Dr. Antje Krause FH Bingen 06721 / 409 253 akrause@fh-bingen.de

Evolution & Genetik (Beispiel Hämoglobin) Prof. Dr. Antje Krause FH Bingen 06721 / 409 253 akrause@fh-bingen.de Evolution & Genetik (Beispiel Hämoglobin) Prof. Dr. Antje Krause FH Bingen 06721 / 409 253 akrause@fh-bingen.de DNA (Desoxyribonukleinsäure) 5 3 CGATGTACATCG GCTACATGTAGC 3 5 Doppelhelix Basen: Adenin,

Mehr

Algorithmische Bioinformatik

Algorithmische Bioinformatik Algorithmische Bioinformatik Zeichenketten und Stringalgorithmen Ulf Leser Wissensmanagement in der Bioinformatik Inhalt dieser Vorlesung Warum Stringmatching? Von DNA zu Strings Genomsequenzierung Funktionale

Mehr

Java Einführung Objektorientierte Grundkonzepte

Java Einführung Objektorientierte Grundkonzepte Java Einführung Objektorientierte Grundkonzepte Inhalt Verständnis der grundlegenden Konzepte der Objektorientierung: Objekte Nachrichten Kapselung Klassen und Instanzen Vererbung Polymorphismus Darstellung

Mehr

abgeschlossen unter,,,, R,

abgeschlossen unter,,,, R, Was bisher geschah Turing-Maschinen können Sprachen L X akzeptieren entscheiden Funktionen berechnen f : X X (partiell) Menge aller Turing-akzeptierbaren Sprachen genau die Menge aller Chomsky-Typ-0-Sprachen

Mehr

MDRE die nächste Generation des Requirements Engineerings

MDRE die nächste Generation des Requirements Engineerings MDRE die nächste Generation des Requirements Engineerings Tom Krauß, GEBIT Solutions GmbH Copyright 2007 GEBIT Solutions Agenda Requirements Engineering heute eine Bestandsaufnahme Modell-Driven Requirements

Mehr

ADS: Algorithmen und Datenstrukturen 2

ADS: Algorithmen und Datenstrukturen 2 ADS: Algorithmen und Datenstrukturen 2 Teil 5 Prof. Peter F. Stadler & Dr. Christian Höner zu Siederdissen Bioinformatik/IZBI Institut für Informatik & Interdisziplinäres Zentrum für Bioinformatik Universität

Mehr

Vorlesung 4 BETWEENNESS CENTRALITY

Vorlesung 4 BETWEENNESS CENTRALITY Vorlesung 4 BETWEENNESS CENTRALITY 101 Aufgabe! Szenario: Sie arbeiten bei einem sozialen Online-Netzwerk. Aus der Netzwerk-Struktur Ihrer Benutzer sollen Sie wichtige Eigenschaften extrahieren. [http://www.fahrschule-vatterodt.de/

Mehr

Molekulare Mechanismen der Signaltransduktion. 06 - Kartierung des AXR1 Gens + early auxin-induced genes Folien: http://tinyurl.

Molekulare Mechanismen der Signaltransduktion. 06 - Kartierung des AXR1 Gens + early auxin-induced genes Folien: http://tinyurl. Molekulare Mechanismen der Signaltransduktion 06 - Kartierung des AXR1 Gens + early auxin-induced genes Folien: http://tinyurl.com/modul-mms bisheriges Modell auxin auxin AXR1 auxin response AXR1 potentieller

Mehr

Curriculum des Wahlfaches Informatik für das Gymnasium Dialog

Curriculum des Wahlfaches Informatik für das Gymnasium Dialog 10.Klasse: Themenschwerpunkt I: Datenbanken Datenbanken o Einsatzbereiche von Datenbanken o Verwaltung von großen Datenmengen o Probleme aus dem Alltag in Datenbanken abbilden o Relationale Datenbanksysteme

Mehr

Lernmodul 2 Geometr.-topol. Datenstrukturen. Lernmodul 2: Geoobjekte und ihre Modellierung - Geometr.-topol. Datenstrukturen

Lernmodul 2 Geometr.-topol. Datenstrukturen. Lernmodul 2: Geoobjekte und ihre Modellierung - Geometr.-topol. Datenstrukturen Folie 1 von 27 Lernmodul 2 Geometr.-topol. Datenstrukturen Folie 2 von 27 Geometr.-topol. Datenstrukturen Übersicht Überblick/Motivation Fokus Geometrisch-topologische Datenstrukturen Spaghetti Spaghetti

Mehr

Oracle SQL Developer Data Modeling

Oracle SQL Developer Data Modeling Oracle SQL Developer Data Modeling DOAG Regio Rhein-Neckar Oracle Deutschland GmbH The following is intended to outline our general product direction. It is intended for information

Mehr

Übungen Softwaretechnik I

Übungen Softwaretechnik I Universität Stuttgart Institut für Automatisierungstechnik und Softwaresysteme Prof. Dr.-Ing. M. Weyrich Übungen Softwaretechnik I Übung 5: Objektorientierte Analyse Einführung Objektorientierung in der

Mehr

Cornel Mülhardt. Genomics. 6. Auflaqe. Spektrum k - / l AKADEMISCHER VERLAG

Cornel Mülhardt. Genomics. 6. Auflaqe. Spektrum k - / l AKADEMISCHER VERLAG I Cornel Mülhardt Genomics 6. Auflaqe Spektrum k - / l AKADEMISCHER VERLAG Inhalt 1 Was ist denn "Molekularbiologie", bitteschön? 1 1.1 Das Substrat der Molekularbiologie, oder: Molli-World für Anfänger...

Mehr

Jens Kupferschmidt Universitätsrechenzentrum

Jens Kupferschmidt Universitätsrechenzentrum Einordnung der Metadaten im MyCoRe Projekt Connection to other databases Data presentations MyCoResearch over instances Classifications Metadate and search Derivate User and access rights GUI Workflow

Mehr

DATENBANKEN SQL UND SQLITE VON MELANIE SCHLIEBENER

DATENBANKEN SQL UND SQLITE VON MELANIE SCHLIEBENER DATENBANKEN SQL UND SQLITE VON MELANIE SCHLIEBENER INHALTSVERZEICHNIS 1. Datenbanken 2. SQL 1.1 Sinn und Zweck 1.2 Definition 1.3 Modelle 1.4 Relationales Datenbankmodell 2.1 Definition 2.2 Befehle 3.

Mehr

MOL.504 Analyse von DNA- und Proteinsequenzen. Datenbanken & Informationssysteme

MOL.504 Analyse von DNA- und Proteinsequenzen. Datenbanken & Informationssysteme MOL.504 Analyse von DNA- und Proteinsequenzen Datenbanken & Informationssysteme Inhaltsübersicht Informationsysteme National Center for Biotechnology Information (NCBI) The European Bioinformatics Institute

Mehr

Verwandt, logisch kohärent, zweckspezifisch, an reale Welt orientiert. Entität kann in einer oder mehreren Unterklassen sein

Verwandt, logisch kohärent, zweckspezifisch, an reale Welt orientiert. Entität kann in einer oder mehreren Unterklassen sein 1 Definitionen 1.1 Datenbank Verwandt, logisch kohärent, zweckspezifisch, an reale Welt orientiert Integriert, selbstbeschreibend, verwandt 1.2 Intension/Extension Intension: Menge der Attribute Extension:

Mehr

Bäume. 2006 Jiri Spale, Algorithmen und Datenstrukturen - Bäume 1

Bäume. 2006 Jiri Spale, Algorithmen und Datenstrukturen - Bäume 1 Bäume 2006 Jiri Spale, Algorithmen und Datenstrukturen - Bäume 1 Inhalt Grundbegriffe: Baum, Binärbaum Binäre Suchbäume (Definition) Typische Aufgaben Suchaufwand Löschen allgemein, Methode Schlüsseltransfer

Mehr

XML in der Oracle Datenbank

XML in der Oracle Datenbank XML in der Oracle Datenbank Oracle XML DB Eine kurze Einführung Gruppe A Michaela Geierhos Galina Hinova Maximilian Schöfmann AGENDA Warum XML in einer Datenbank? Was bietet die Oracle XML DB? Unterschiedliche

Mehr

Vorlesung Datenbank-Entwurf Klausur

Vorlesung Datenbank-Entwurf Klausur Dr. Stefan Brass 3. Juli 2002 Institut für Informatik Universität Giessen Vorlesung Datenbank-Entwurf Klausur Name: Geburtsdatum: Geburtsort: (Diese Daten werden zur Ausstellung des Leistungsnachweises

Mehr

Präsentation zum Thema XML Datenaustausch und Integration

Präsentation zum Thema XML Datenaustausch und Integration Sebastian Land Präsentation zum Thema XML Datenaustausch und Integration oder Warum eigentlich XML? Gliederung der Präsentation 1. Erläuterung des Themas 2. Anwendungsbeispiel 3. Situation 1: Homogene

Mehr

PCR basierte- Detektionstechniken

PCR basierte- Detektionstechniken PCR basierte- Detektionstechniken Warum überhaupt? Forensische Analysen: Vaterschaftstests, Kriminalistik Mikrobielle Gemeinschaften: Biofilme, medizinische Mikrobiologie 2 Warum überhaupt? minimale Mengen

Mehr

Studiengang Informatik der FH Gießen-Friedberg. Sequenz-Alignment. Jan Schäfer. WS 2006/07 Betreuer: Prof. Dr. Klaus Quibeldey-Cirkel

Studiengang Informatik der FH Gießen-Friedberg. Sequenz-Alignment. Jan Schäfer. WS 2006/07 Betreuer: Prof. Dr. Klaus Quibeldey-Cirkel Studiengang Informatik der FH Gießen-Friedberg Sequenz-Alignment Jan Schäfer WS 2006/07 Betreuer: Prof. Dr. Klaus Quibeldey-Cirkel Überblick Einführung Grundlagen Wann ist das Merkmal der Ähnlichkeit erfüllt?

Mehr

Datenstrukturen & Algorithmen

Datenstrukturen & Algorithmen Datenstrukturen & Algorithmen Matthias Zwicker Universität Bern Frühling 2010 Übersicht Binäre Suchbäume Einführung und Begriffe Binäre Suchbäume 2 Binäre Suchbäume Datenstruktur für dynamische Mengen

Mehr

Rückblick: Entity-Relationship-Modell

Rückblick: Entity-Relationship-Modell Rückblick: Entity-Relationship-Modell Entity-Relationship-Modell für konzeptuellen Entwurf Entitytypen (entity types) (z.b. Studenten) Beziehungstypen (relationships) (z.b. hören) Attribute beschreiben

Mehr

Übersicht. Vorstellung des OO-Paradigmas

Übersicht. Vorstellung des OO-Paradigmas Java, OO und UML Vorstellung des OO-Paradigmas Übersicht Umsetzung des OO-Paradigmas in Java Einführung (seeeeeehr rudimenter) in UML zur graphischen Darstellung von OO Grammatik und Semantik von Java

Mehr

BERUFSPRAKTIKUM UND -VORBEREITUNG

BERUFSPRAKTIKUM UND -VORBEREITUNG Department für Geographie Marco Brey BERUFSPRAKTIKUM UND -VORBEREITUNG Crashkurs IT-Methoden ein anwendungsorientierter Einstieg in Datenbanksysteme, Programmierung und fortgeschrittene Excel-Funktionen

Mehr

Ausarbeitung zum Modulabschluss. Graphentheorie. spannende Bäume, bewertete Graphen, optimale Bäume, Verbindungsprobleme

Ausarbeitung zum Modulabschluss. Graphentheorie. spannende Bäume, bewertete Graphen, optimale Bäume, Verbindungsprobleme Universität Hamburg Fachbereich Mathematik Seminar: Proseminar Graphentheorie Dozentin: Haibo Ruan Sommersemester 2011 Ausarbeitung zum Modulabschluss Graphentheorie spannende Bäume, bewertete Graphen,

Mehr

Was ist EMF? Wie wird EMF eingesetzt? Was ist ecore? Das Generatormodell Fazit

Was ist EMF? Wie wird EMF eingesetzt? Was ist ecore? Das Generatormodell Fazit Was ist EMF? Wie wird EMF eingesetzt? Was ist ecore? Das Generatormodell Fazit EMF ist ein eigenständiges Eclipse-Projekt (Eclipse Modeling Framework Project) EMF ist ein Modellierungsframework und Tool

Mehr

Molekularbiologische Grundlagen

Molekularbiologische Grundlagen Molekularbiologische Grundlagen Ulf Leser, Sommersemester 2008 Silke Trißl Überblick Biologie Organismen Aufbau von Zellen Prokaryoten und Eukaryoten Genom und DNA Transkription DNA RNA Protein Proteine

Mehr

Übung zur Vorlesung Berechenbarkeit und Komplexität

Übung zur Vorlesung Berechenbarkeit und Komplexität RWTH Aachen Lehrgebiet Theoretische Informatik Reidl Ries Rossmanith Sanchez Tönnis WS 2012/13 Übungsblatt 9 10.12.2012 Übung zur Vorlesung Berechenbarkeit und Komplexität Aufgabe T20 Beweisen Sie die

Mehr

Methoden der Gentechnik

Methoden der Gentechnik Methoden der Gentechnik *** DNA-Rekombination und Klonierung *** 1. Allgemeine Grundprinzipien 1.1. Wesen der Gentechnik 1.2. Allgemeine Ziele der Gentechnik 1.3. Molekulare Voraussetzungen 1.4. Wichtige

Mehr

Lernumgebung für das Travelling Salesman Problem. Bedienungsanleitung. Projekt im Sommersemester 2016 Betreuer: Prof. Dr.

Lernumgebung für das Travelling Salesman Problem. Bedienungsanleitung. Projekt im Sommersemester 2016 Betreuer: Prof. Dr. Lernumgebung für das Travelling Salesman Problem Bedienungsanleitung Projekt im Sommersemester 2016 Betreuer: Prof. Dr. Peter Klutke Alexander Kirijatov (286925), Andreas Peter (266601), Benjamin Heckel

Mehr

Genetik - The Human Genome Project. Überblick über die Genetik. Die gesamte Erbinformation eines Menschen befindet sich in jedem Zellkern

Genetik - The Human Genome Project. Überblick über die Genetik. Die gesamte Erbinformation eines Menschen befindet sich in jedem Zellkern Genetik - The Human Genome Project Überblick über die Genetik Die gesamte Erbinformation eines Menschen befindet sich in jedem Zellkern seines Körpers. 1 2 Im Organismus müsssen nun ständig Enzyme u. a.

Mehr

Transcriptomics: Analysis of Microarrays

Transcriptomics: Analysis of Microarrays Transcriptomics: Analysis of Microarrays Dion Whitehead dion@uni-muenster.de Division of Bioinformatics, Westfälische Wilhelms Universität Münster Microarrays Vorlesungsüberblick : 1. Überblick von Microarray

Mehr

Anwendungen des Fréchet-Abstandes Das Constrained Free Space Diagram zur Analyse von Körperbewegungen

Anwendungen des Fréchet-Abstandes Das Constrained Free Space Diagram zur Analyse von Körperbewegungen Anwendungen des Fréchet-Abstandes Das Constrained Free Space Diagram zur Analyse von Körperbewegungen David Knötel Freie Universität Berlin, Institut für Informatik Seminar über Algorithmen Leitfaden Wiederholung

Mehr

Molekularbiologie/ Genomics

Molekularbiologie/ Genomics Cornel Mülhardt Molekularbiologie/ Genomics 5. Auflage ELSEVIER SPEKTRUM AKADEMISCHER VERLAG Spektrum k-zlakademischer VERLAG Inhalt 1 Was ist denn "Molekularbiologie", bitteschön? 1 1.1 Das Substrat der

Mehr

GIS Einführungsschulung

GIS Einführungsschulung Datentypen 1. Rasterdaten Datenquellen: Gescannte analoge Karten und Pläne Digitale Kameras Framegrabber Satellitenaufnahmen (Scanner und optische Sensoren) Datentypen: binär (Synonyme: 1-Bit, Schwarz-weiß)

Mehr

Objektorientierte Modellierung (1)

Objektorientierte Modellierung (1) Objektorientierte Modellierung (1) Die objektorientierte Modellierung verwendet: Klassen und deren Objekte Beziehungen zwischen Objekten bzw. Klassen Klassen und Objekte Definition Klasse Eine Klasse ist

Mehr

Datenstrukturen und Algorithmen. Christian Sohler FG Algorithmen & Komplexität

Datenstrukturen und Algorithmen. Christian Sohler FG Algorithmen & Komplexität Datenstrukturen und Algorithmen Christian Sohler FG Algorithmen & Komplexität 1 Clustering: Partitioniere Objektmenge in Gruppen(Cluster), so dass sich Objekte in einer Gruppe ähnlich sind und Objekte

Mehr

Was bisher geschah. 1. Zerlegung in monotone Polygone 2. Triangulierung der monotonen Teilpolygone

Was bisher geschah. 1. Zerlegung in monotone Polygone 2. Triangulierung der monotonen Teilpolygone Was bisher geschah Motivation, Beispiele geometrische Objekte im R 2 : Punkt, Gerade, Halbebene, Strecke, Polygon, ebene Zerlegung in Regionen (planare Graphen) maschinelle Repräsentation geometrischer

Mehr

Molekularbiologische Datenbanken

Molekularbiologische Datenbanken Molekularbiologische Datenbanken ESTs und cdnas Microarrays Ulf Leser Wissensmanagement in der Bioinformatik Sequenzierung Methode nach Sanger Verarbeitungsschritte Base Calling Assembly Finishing Ulf

Mehr

Data Warehousing. Sommersemester 2005. Ulf Leser Wissensmanagement in der Bioinformatik

Data Warehousing. Sommersemester 2005. Ulf Leser Wissensmanagement in der Bioinformatik Data Warehousing Sommersemester 2005 Ulf Leser Wissensmanagement in der Bioinformatik ... Der typische Walmart Kaufagent verwendet täglich mächtige Data Mining Werkzeuge, um die Daten der 300 Terabyte

Mehr

Grundbegriffe der Informatik

Grundbegriffe der Informatik Grundbegriffe der Informatik Kapitel 15: Graphen Thomas Worsch KIT, Institut für Theoretische Informatik Wintersemester 2015/2016 GBI Grundbegriffe der Informatik KIT, Institut für Theoretische Informatik

Mehr

Entwurf eines normalisierten Datenmodells und einer einheitlichen Auswerte-Schnittstelle

Entwurf eines normalisierten Datenmodells und einer einheitlichen Auswerte-Schnittstelle Entwurf eines normalisierten Datenmodells und einer einheitlichen Auswerte-Schnittstelle Folie 1 Übersicht Motivation Hintergrund Problemstellung Zielsetzung Stand der Technik Analyse Ausblick Folie 2

Mehr

Kapitel DB:IV (Fortsetzung)

Kapitel DB:IV (Fortsetzung) Kapitel DB:IV (Fortsetzung) IV. Logischer Datenbankentwurf mit dem relationalen Modell Das relationale Modell Integritätsbedingungen Umsetzung ER-Schema in relationales Schema DB:IV-45 Relational Design

Mehr

2. Repräsentationen von Graphen in Computern

2. Repräsentationen von Graphen in Computern 2. Repräsentationen von Graphen in Computern Kapitelinhalt 2. Repräsentationen von Graphen in Computern Matrizen- und Listendarstellung von Graphen Berechnung der Anzahl der verschiedenen Kantenzüge zwischen

Mehr

Genetik Praktikumsklausur SS2005

Genetik Praktikumsklausur SS2005 Genetik Praktikumsklausur SS2005 1. Aufgabe: Der Genotyp AbaB wird geselbstet, dabei werden 256 Nachkommen gebildet. Davon erhalten 16 Pflanzen den Genotyp ABAB a) gekoppelt b) nicht gekoppelt c) teilweise

Mehr

Bei Einbeziehung von neun Allelen in den Vergleich ergibt sich eine Mutation in 38 Generationen (350:9); das entspricht ca. 770 Jahren.

Bei Einbeziehung von neun Allelen in den Vergleich ergibt sich eine Mutation in 38 Generationen (350:9); das entspricht ca. 770 Jahren. 336 DNA Genealogie Das Muster genetischer Variationen im Erbgut einer Person - zu gleichen Teilen von Mutter und Vater ererbt - definiert seine genetische Identität unveränderlich. Neben seiner Identität

Mehr

Datenmodellierung im Zeitalter agiler Softwareentwicklung

Datenmodellierung im Zeitalter agiler Softwareentwicklung Datenmodellierung im Zeitalter agiler Softwareentwicklung Sebastian Graf, PROMATIS software GmbH DOAG 2013, Nürnberg, 1 Agenda u Über den Referenten u Datenmodellierung Begriffsdefinition und Abgrenzung

Mehr

DATENSTRUKTUREN UND ALGORITHMEN

DATENSTRUKTUREN UND ALGORITHMEN DATENSTRUKTUREN UND ALGORITHMEN 2 Ist die Datenstruktur so wichtig??? Wahl der Datenstruktur wichtiger Schritt beim Entwurf und der Implementierung von Algorithmen Dünn besetzte Graphen und Matrizen bilden

Mehr

Abstrakt zum Vortrag im Oberseminar. Graphdatenbanken. Gero Kraus HTWK Leipzig 14. Juli 2015

Abstrakt zum Vortrag im Oberseminar. Graphdatenbanken. Gero Kraus HTWK Leipzig 14. Juli 2015 Abstrakt zum Vortrag im Oberseminar Graphdatenbanken Gero Kraus HTWK Leipzig 14. Juli 2015 1 Motivation Zur Darstellung komplexer Beziehungen bzw. Graphen sind sowohl relationale als auch NoSQL-Datenbanken

Mehr

Datenbankanwendung. Prof. Dr.-Ing. Sebastian Michel TU Kaiserslautern. Wintersemester 2014/15. smichel@cs.uni-kl.de

Datenbankanwendung. Prof. Dr.-Ing. Sebastian Michel TU Kaiserslautern. Wintersemester 2014/15. smichel@cs.uni-kl.de Datenbankanwendung Wintersemester 2014/15 Prof. Dr.-Ing. Sebastian Michel TU Kaiserslautern smichel@cs.uni-kl.de Wiederholung: Anfragegraph Anfragen dieses Typs können als Graph dargestellt werden: Der

Mehr

Systemtheorie 1. Einführung Systemtheorie 1 Formale Systeme 1 # WS 2006/2007 Armin Biere JKU Linz Revision: 1.4

Systemtheorie 1. Einführung Systemtheorie 1 Formale Systeme 1 # WS 2006/2007 Armin Biere JKU Linz Revision: 1.4 Einführung intro 1 Grobklassifizierung r Methoden in der Informatik intro 2 Systemtheorie 1 Systeme 1 #342234 http://fmv.jku.at/fs1 WS 2006/2007 Johannes Kepler Universität Linz, Österreich Univ. Prof.

Mehr

Prof. Dr. Uwe Schmidt. 12. August Aufgaben zur Klausur Softwaredesign im SS 2014 (BInf v310, BMInf v300, BWInf v310, BWInf- 23)

Prof. Dr. Uwe Schmidt. 12. August Aufgaben zur Klausur Softwaredesign im SS 2014 (BInf v310, BMInf v300, BWInf v310, BWInf- 23) Prof. Dr. Uwe Schmidt 12. August 2014 Aufgaben zur Klausur Softwaredesign im SS 2014 (BInf v310, BMInf v300, BWInf v310, BWInf- 23) Zeit: 90 Minuten erlaubte Hilfsmittel: keine Bitte tragen Sie Ihre Antworten

Mehr

Sequenzanalysen in der Molekularpathologie: Grundlagen des Sequenzierens

Sequenzanalysen in der Molekularpathologie: Grundlagen des Sequenzierens Sequenzanalysen in der Molekularpathologie: Grundlagen des Sequenzierens Wolfgang Hulla KFJ-Sital / SMZ-Süd, Wien Grundlagen Historischer Ausgangspunkt Anwendungen und klinische Relevanz Methodik Auswertung

Mehr

Speicherung von XML in (objekt-)relationalen Datenbanken. Burkhard Schäfer

Speicherung von XML in (objekt-)relationalen Datenbanken. Burkhard Schäfer Speicherung von XML in (objekt-)relationalen Datenbanken Burkhard Schäfer Übersicht Motivation Anforderungen Ansätze modellorientiert strukturorientiert Zusammenfassung Motivation Warum XML in Datenbanken

Mehr

Seminar. Visual Computing. Poisson Surface Reconstruction. Peter Hagemann Andreas Meyer. Peter Eisert: Visual Computing SS 11.

Seminar. Visual Computing. Poisson Surface Reconstruction. Peter Hagemann Andreas Meyer. Peter Eisert: Visual Computing SS 11. Poisson Surface Reconstruction Peter Hagemann Andreas Meyer Seminar 1 Peter Eisert: SS 11 Motivation Zur 3D Darstellung von Objekten werden meist Scan-Daten erstellt Erstellung eines Dreieckmodells aus

Mehr