Daten, Datensammlung, Datenbank



Ähnliche Dokumente
Darstellung von Molekülen

Stuart Chalk Evan Bolton

EEX Kundeninformation

Seeking for n! Derivatives

Benign by Design as an Important Building Block of Green and Sustainable Chemistry-The Example of Small Molecules

Verzeichnisdienste in heterogenen Systemen

Mash-Up Personal Learning Environments. Dr. Hendrik Drachsler

DKRZ Datenhierarchie Von der Antragstellung bis zur Archivierung

The Landolt-Börnstein Database

Moderne Screening Lösungen Waters Corporation 1

Literatur. Dominating Set (DS) Dominating Sets in Sensornetzen. Problem Minimum Dominating Set (MDS)

Anhang A - Weitere Bibliotheken. Die Bibliothek Mail_02.lib ermöglicht das Versenden von s mit dem Ethernet-Controller

Systemvoraussetzungen CustomX. Customer Relationship Management

B Datenblätter der verfügbaren Werkzeugmaschinen Data sheets of the available machine tools

Chemieinformation LVA

Landschaftsvisualisierung für interaktive Anwendungen. Oliver Deussen, Universität Konstanz

Platzhalter für Funktions-Garantie- Zeichen. für alle HOPPE Tür- und Fenstergriffe! Export Catalogue 20/202

LANDOLT- BÖRNSTEIN ZAHLENWERTE UND FUNKTIONEN AUS NATURWISSENSCHAFTEN UND TECHNIK NEUE SERIE GESAMTHERAUSGABE K.-H. HELLWEGE

Version smart.finder SDI. What's New?

DSpace 5 und Linked (Open) Data. Pascal-Nicolas Becker Technische Universität Berlin German DSpace User Group Meeting 2014 Berlin, 28.

CARL HANSER VERLAG. Erika Horn, Thomas Reinke. Softwarearchitektur und Softwarebauelemente Eine Einführung für Softwarearchitekten

Smart Import for supplier projects

Highlights versiondog 3.1

Referenzielle Integrität SQL


Quelle: (1) Brixner, Physik. Blätter, Kohärente Kontrolle von chemischen Reaktionen mittels Lasern

Mit Legacy-Systemen in die Zukunft. adviion. in die Zukunft. Dr. Roland Schätzle

TSM 5.2 Experiences Lothar Wollschläger Zentralinstitut für Angewandte Mathematik Forschungszentrum Jülich

Introduction FEM, 1D-Example

Microsoft Azure Fundamentals MOC 10979

Einführung in die Literatursuche

IR-Spektroskopie organischer Moleküle

Stefan Engelberg (IDS Mannheim), Workshop Corpora in Lexical Research, Bucharest, Nov [Folie 1] DWDS-Kernkorpus / DWDS corpus analysis

H. Enke, Sprecher des AK Forschungsdaten der WGL

Title. Power-to-Design circuits. HyDraw CAD 600 What s New 1 of 29

ROOT Tutorial für D. Liko

Algorithms for graph visualization

Multimedia im Netz. Übung zur Vorlesung. Ludwig-Maximilians-Universität Wintersemester 2010/2011

Parameter-Updatesoftware PF-12 Plus

arlanis Software AG SOA Architektonische und technische Grundlagen Andreas Holubek

Introduction FEM, 1D-Example

AutoSPARQL. Let Users Query Your Knowledge Base

Kombinatorische Chemie und drug design

... Chair of Mobile Business & Multilateral Security. Lecture 14 Business Informatics 2 (PWIN) FAQ WS 2015/16

AS Path-Prepending in the Internet And Its Impact on Routing Decisions

Problemstellung. Keine Chance! Ich brauche eine genaue Spezifikation und dann vielleicht in 3-4 Wochen können Sie einen erstes Beispiel haben!

FK12 fortyforty (GRAUER MARMOR / GREY MARBLE)

Management Information System SuperX status quo and perspectives

Technologiebeobachtung in der Unternehmenspraxis. Ein Ansatz zur Integration funktionsübergreifender Informationsbedürfnisse

Anzahl der Kreditabschlüsse. Jahr (Mittel. Monat. Number of loan agreements. Year (mean value of monthly figures) Month

Unit 9. Prototype-Based Clustering. Knowledge-Based Methods in Image Processing and Pattern Recognition; Ulrich Bodenhofer 176

Tube Analyzer LogViewer 2.3

HIR Method & Tools for Fit Gap analysis

Bes 10 Für ios und Android

IBM Netezza Data Warehouse Appliances - schnelle Analysen mit hohen Datenmengen

Gegeben sind die folgenden Werte kovalenter Bindungsenthalpien:

Theoretisch-chemische Übungen Quantenchemischer Teil

Big Data Projekte richtig managen!

Optimierung. Optimierung. Vorlesung 9 Lineare Programmierung & Kombinatorische Optimierung Fabian Kuhn

Detecting Near Duplicates for Web Crawling

SARA 1. Project Meeting

Seminar Map/Reduce Algorithms on Hadoop. Topics. Alex, Christoph

FEM Isoparametric Concept

TalkIT: Internet Communities Tiroler Zukunftsstiftung Donnerstag,

Network-Aligned content delivery through collaborative optimization

Konferenz SIGNO-Strategieförderung

Softwareanforderungen für Microsoft Dynamics CRM Server 2015

Praktikum Anorganische Chemie Pseudopotentiale

Semantic Web Technologies II SS Semantic Web Übung

Seminar Parametrisierte Algorithmen für N P-schwere Probleme

Recherche-Seminar Im Rahmen des F-Praktikum für Synthesechemie WiSe 2013/2014

LEAD MANAGEMENT SYSTEMS

Praktikum Einführung

UPU / CEN / ETSI. E-Zustellung in Europa & weltweit

Seminar XML und Datenbanken. Thema: Workflow

Anwendung einer Monokularen Kamera als Bewegungs-Sensor für Mobile Roboter p.1

Kurzanleitung um Transponder mit einem scemtec TT Reader und der Software UniDemo zu lesen

Duplikation einer Aktie. Plusposition in Aktie. Long Call Short Put Risikofreie Geldanlage. Duplikation einer Aktie S T - X. (S 0 C+P)(1+r) t =X S T

Einführung in die Computerlinguistik

Bioinformatik I (Einführung)

7/15/2014. Stratus everrun Enterprise. Ist die Audio Qualität OK? Fragen bitte per Chat, diese werden im Anschluss beantwortet.

Algorithm Theory 3 Fast Fourier Transformation Christian Schindelhauer

Abb. 1: Screen-Shot des Menüs der CSD-Datenbank.

Eclipse User Interface Guidelines

UM ALLE DATEN ZU KOPIEREN. ZUNÄCHST die Daten des alten Telefons auf einen Computer kopieren

Bringing sense and simplicity to life

Batterie-Identifikations-Modul EL-BIM

Weiterentwicklung digitaler Bibliothekssysteme zu OpenArchives-Systemen

Distributed Computing Group

Konfigurationsbeispiel

Deep Web Suchen wir was man finden könnte?

Reform der Verrechnungspreisregularien. 4. Februar 2015

Naked-FHIR. Code-Generierung auf Basis von HL7 FHIR Andreas Schuler, MSc. Textmasterformate durch Klicken bearbeiten

105.3 SQL-Datenverwaltung

ORM & OLAP. Object-oriented Enterprise Application Programming Model for In-Memory Databases. Sebastian Oergel

All Motorola Europe, Middle East & Africa Approved Channel Partners

Open Archives Initiative - Protocol for Metadata Harvesting (OAI-PMH)

Transkript:

Daten, Datensammlung, Datenbank Inhalte Molekülstrukturen Spektren Patentinformation Moleküleigenschaften Fachliteratur Verweise Anbieterinformation Preise Implementierung Flatfile Lokale Datenbank www-zugriff

Definition einer Datenbank Datenbank = Verwaltungskomponente + Speicherungskomponente für persistente Daten, die einem bestimmten Zweck dienen.

Chemische Datenbanken Raw data User User interface Source file Application software Filtering Index file Library file Data Data 2 Data 3

Datenbanken Database ACD a CMC a MDDR a MedChem d SPRESI d WDI e No. of molecules > 25, Beilstein b > 7,, Covers organic chemistry from 779 CSD c > 2, Cambridge Structural Database; experimentally determined threedimensional structures of small molecules > 7, > 85, > 35, > 3,4, > 5, Description Available Chemicals Directory; catalogue of commercially available specialty and bulk chemicals from over 225 international suppliers Comprehensive Medicinal Chemistry database; structures and activities of drugs having generic names (on the market) MACCS-II Drug Data Report; structures and activity data of compounds in the early stages of drug development Medicinal Chemistry database; pharmaceutical compounds Substances and bibliographic data abstracted from the world s chemical literature World Drug Index; pharmaceutical compounds from all stages of development

Datenformate Moleküle MDL SDF SMILES Molfile, Mol2 PDB Reaktionen RXN RDF SMIRKS Reaction SMILES 44 Alchemy Cactvs/Ascii Cactvs/Scan Cactvs/Binary CAR Cerius II Charmm CIF CML Compass Cosmo CTX FIG Gaussian Archives Gaussian Cube Gaussian Input GIF itlist yperchem Index JCAMP JME M3D Molconn-Z MDL Molfile MDL SDF Molgen Mopac NETCDF PDB RDF RXN SCF Sharc Shel-X SLN SMD 4 SMD 5 SMILES STF Sybyl Sybyl II Vamp VRML XBSA Xtelplot XYZ XYZR

Molekülcodierung: SE-Code () SE ierarchically rdered Spherical description of Environment gehört zu den Fragmentcodierungen Konzept: Molekülzentrum und. bis 4. Sphäre um das Zentrum

Molekülcodierung: SE-Code (2) Cl Cl Zentrum. Sphäre 2. Sphäre 3. Sphäre

Molekülcodierung: SE-Code (3) Symbol Bedeutung R Ring % Dreifachbindung = Doppelbindung * Aromatische Bindung C C N N S S X Cl Y Br & Ringschluss, Trennzeichen (//) Sphärengenerator

Molekülcodierung: SE-Code (4) Cl Cl Zentrum *C*CC( *C,*C,=C/. Sphäre 2. Sphäre

Kleinste Pfade: Flood-fill N S N Weitere Möglichkeiten: Viele! z.b. Dijkstra s Algorithmus A B Molekülgraph d AB = 8 Bindungen

Adjacency Matrix & Connection Table 2 3 4 C Cl Cl Phosgen = C Cl Cl C 2 2 = A Canonische Atomnummerierung, z.b. mittels. Morgan s Algorithmus 2. Jochum-Gasteiger Algorithmus

Distanzmatrix & Zentrum des Moleküls D d = K d A 2,, d,2 K d i A,2 K L d A,3 d, A d2, A K j atom eccentricity η = max i j ( d ) ij vertex distance degree σ = A i d ij j= Achtung! Geometrisches Molekülzentrum x = A A i= x i,analog y und z Zentrum des Graphen ) Minimal atom eccentricity 2) Minimal vertex distance degree A = Atomnummer

SMILES (Simplified Molecular Input Line Entry Specification ) http://www.daylight.com http://www.daylight.com/smiles/ ausaufgabe SMILES-Tutorial

SSMILES (Simple SMILES) Rules Atoms are represented by atomic symbols: B, C, N,, F, P, S, Cl, Br, and I. Double bonds are =, triple bonds are #. Branching is indicated by parentheses. Ring closures are indicated by pairs of matching digits. C CC C= C#N CC(C)(C)C CCCCCC N=CC=CC=C S2C=CC=C2 CC(=)

SMARTS extended SMILES for search definitions general [ ], ; : &! atom primitives * DX Rr Aa h v# bond primitives ~ - = # @ : Examples: [N;D][#6;!R]

Reaction SMILES CC(=).CC>[+].[Cl-].CC>CC(=)CC

Atom Mapping: SMARTS [C2:]=[C:2][C:3]=[C:4][C2:5][:6]>>[:6][C2:][C:2]=[C:3][C:4]=[C2:5]

Atom Mapping: SMARTS [*:][N:2](=[:3])=[:4]>>[*:][N+:2](=[:3])[-:4]

Markush-Stukturen Eugene A. Markush, 923 (USA Patent) Cl R R 2 R 2 R R = phenyl, naphtyl R 2 = [Cl, Br, I] Patente! Beschreibungen von Sets! Kombinatorische Chemie!

Markush-Stukturen: CombiChem R R2 N R3 N R4 N R R3 N R2 R R3 N R4 R2 Imidazole Diketopiperazine Pyrrolidine R2 N R R2 Ar R4 N 2 R N R3 Isoquinolinone,4-Dihydropyridine

Das Structure-Data-Format (SDF) ausaufgabe: SDF-Tutorial L-Alanin http://www.mdli.com/downloads/literature/ctfile.pdf

3D-Features

Indexierung von Strukturen: Daylight Fingerprints The fingerprinting algorithm examines the molecule and generates the following: a pattern for each atom a pattern representing each atom and its nearest neighbors (plus the bonds that join them) a pattern representing each group of atoms and bonds connected by paths up to 2 bonds long... atoms and bonds connected by paths up to 3 bonds long... continuing, with paths up to 4, 5, 6, and 7 bonds long. Structure: C=CN Fingerprint -bond paths: -bond paths: 2-bond paths: 3-bond paths: C C C=C C=CN C=C C=CN N CN... R Exhaustive!