Datenaustausch und Datenintegration zur Modellierung und Analyse metabolischer Netzwerke am Beispiel von Kulturpflanzen



Ähnliche Dokumente
Suche schlecht beschriftete Bilder mit Eigenen Abfragen

Task: Nmap Skripte ausführen

Übungsblatt: Protein interaction networks. Ulf Leser and Samira Jaeger

Um ein solches Dokument zu erzeugen, muss eine Serienbriefvorlage in Word erstellt werden, das auf die von BüroWARE erstellte Datei zugreift.

ICS-Addin. Benutzerhandbuch. Version: 1.0

Handbuch ECDL 2003 Basic Modul 5: Datenbank Grundlagen von relationalen Datenbanken

Nokia Karten für S40 Bedienungsanleitung

How-to: Webserver NAT. Securepoint Security System Version 2007nx

Mediumwechsel - VR-NetWorld Software

Datenübernahme von HKO 5.9 zur. Advolux Kanzleisoftware

Anleitung zum Extranet-Portal des BBZ Solothurn-Grenchen

Mediumwechsel - VR-NetWorld Software

Leitfaden #1a. "zanox Publisher-Statistik" (next generation)

BASIS Karten, WEA-Katalog, Projektierung, Objekte etc.

Überprüfung der digital signierten E-Rechnung

GDPdU Export. Modulbeschreibung. GDPdU Export. Software-Lösungen. Stand: Seite 1

Inkrementelles Backup

INSTALLATIONSANLEITUNG

AZK 1- Freistil. Der Dialog "Arbeitszeitkonten" Grundsätzliches zum Dialog "Arbeitszeitkonten"

DOS-Sympas Scope Dateien in Excel einlesen

Die Beschreibung bezieht sich auf die Version Dreamweaver 4.0. In der Version MX ist die Sitedefinition leicht geändert worden.

ACDSee Pro 2. ACDSee Pro 2 Tutorials: Übertragung von Fotos (+ Datenbank) auf einen anderen Computer. Über Metadaten und die Datenbank

Fachbericht zum Thema: Anforderungen an ein Datenbanksystem

Powermanager Server- Client- Installation

SharePoint Demonstration

Kommunikations-Management

In diesem Tutorial lernen Sie, wie Sie einen Termin erfassen und verschiedene Einstellungen zu einem Termin vornehmen können.

Datenaustausch mit dem BVK Data Room

Benutzeranleitung Superadmin Tool

Ist Excel das richtige Tool für FMEA? Steve Murphy, Marc Schaeffers

Welche Unterschiede gibt es zwischen einem CAPAund einem Audiometrie- Test?

Arbeiten mit den Mastercam Werkzeug-Managern

ISA Server 2004 Protokollierung - Von Marc Grote. Die Informationen in diesem Artikel beziehen sich auf:

Die Online-Bestandserhebung im LSB Niedersachsen

Zeichen bei Zahlen entschlüsseln

impact ordering Info Produktkonfigurator

Delegieren von Terminen, Jobs oder Notizen aus dem Kalenderlayout auf Seite 111

Anleitung Lernobjekt-Depot (LOD)

ECO-Manager - Funktionsbeschreibung

Beschreibung und Bedienungsanleitung. Inhaltsverzeichnis: Abbildungsverzeichnis: Werkzeug für verschlüsselte bpks. Dipl.-Ing.

TechNote: Exchange Journaling aktivieren

Grundlagen der Technischen Informatik. Sequenzielle Netzwerke. Institut für Kommunikationsnetze und Rechnersysteme. Paul J. Kühn, Matthias Meyer

WordPress. Dokumentation

C++11 C++14 Kapitel Doppelseite Übungen Musterlösungen Anhang

personal.net Neue Quellensteuertarifcodes ab dem

TYPO3 CMS 6.2 LTS. Die neue TYPO3- Version mit Langzeit- Support

AGROPLUS Buchhaltung. Daten-Server und Sicherheitskopie. Version vom b

Internet Explorer Version 6

Auto-Provisionierung tiptel 30x0 mit Yeastar MyPBX

ISA Server 2004 Erstellen eines neuen Netzwerkes - Von Marc Grote

Agentur für Werbung & Internet. Schritt für Schritt: Newsletter mit WebEdition versenden

Diese Ansicht erhalten Sie nach der erfolgreichen Anmeldung bei Wordpress.

Hinweise zum Update des KPP Auswahltools (Netzwerkinstallation) auf Version 7.2

Internet online Update (Internet Explorer)

Vorlesung Einführung in die Bioinformatik

Fotos in Tobii Communicator verwenden

How to do? Projekte - Zeiterfassung

INSTALLATIONSANLEITUNG

Installationsanleitung. triomis vat calculator for Dynamics CRM 2011

1 Einleitung. Lernziele. Symbolleiste für den Schnellzugriff anpassen. Notizenseiten drucken. eine Präsentation abwärtskompatibel speichern

Route Ein Programm besteht aus mehreren Routen (Teilstrecken). Jede Route hat eigene Einstellungen für

Look Inside: desite. modellorientiertes Arbeiten im Bauwesen. B.I.M.

Klausur WS 2006/07 Programmiersprache Java Objektorientierte Programmierung II 15. März 2007

Schnittstelle IWM FinanzOffice -> VOKIS

Etikettendruck mit Works 7.0

Wichtige Hinweise zu den neuen Orientierungshilfen der Architekten-/Objektplanerverträge

Übernahme von DXF-Daten in AutoCAD. Erläuterungen

WinWerk. Prozess 4 Akonto. KMU Ratgeber AG. Inhaltsverzeichnis. Im Ifang Effretikon

Leitfaden zur Nutzung von binder CryptShare

Netzwerkeinstellungen unter Mac OS X

Installation / Aktualisierung von Druckertreibern unter Windows 7

1 Einleitung. Lernziele. Diagramme zur Visualisierung von Daten erstellen. Diagramme formatieren Lerndauer. 4 Minuten.

Übung - Datensicherung und Wiederherstellung in Windows Vista

Anwendungsbeispiele Buchhaltung

White Paper. Konfiguration und Verwendung des Auditlogs Winter Release

Wiederkehrende Bestellungen. Tipps & Tricks

IAWWeb PDFManager. - Kurzanleitung -

Eigenen WSUS Server mit dem UNI WSUS Server Synchronisieren

Synchronisations- Assistent

5.12. Variable Temperaturgradienten über dem Scheibenzwischenraum

Datenaustausch mit dem BVK Data Room

Erstellen eines Formulars

LAS PROGRAMM- ANPASSUNGEN

Optimal vorbereitet. Fit fürs Studium mit den Vorbereitungskursen der OHN. Fragen? Jetzt anmelden!

Anleitung öffentlicher Zugang einrichten

Dynamisch generierte grafische Übersichtsseiten für Learning-Content-Management-Systeme. Unterstützung von Grafiken für Prüfungsauswahl.

Wenn Sie das T-Online WebBanking das erste Mal nutzen, müssen Sie sich zunächst für den Dienst Mobiles Banking frei schalten lassen.

GeoPilot (Android) die App

INFORMATION MONITOR HSM SOFTWARE GMBH CLIENT-INSTALLATION

1. Einschränkung für Mac-User ohne Office Dokumente hochladen, teilen und bearbeiten

MORE Profile. Pass- und Lizenzverwaltungssystem. Stand: MORE Projects GmbH

INSTALLATIONSANLEITUNG

Projektmanagement in Outlook integriert

Duonix Service Software Bedienungsanleitung. Bitte beachten Sie folgende Hinweise vor der Inbetriebnahmen der Service Software.

Lastenheft. Inhaltsverzeichnis. Gruppe: swp09-5. Projektleiterin: Anne Vogler am: 28. April Zielbestimmungen 2. 2 Produkteinsatz 2

PeDaS Personal Data Safe. - Bedienungsanleitung -

Anleitung Administration Alterssiedlungen Basel. So aktualisieren Sie Ihre Daten. Version:

Text-Bild-Link-Editor

Transkript:

Datenaustausch und Datenintegration zur Modellierung und Analyse metabolischer Netzwerke am Beispiel von Kulturpflanzen Stephan Weise, Christian Colmsee, Eva Grafahrend-Belau, Björn Junker, Christian Klukas, Matthias Lange, Uwe Scholz und Falk Schreiber Leibniz Institut für Pflanzengenetik und Kulturpflanzenforschung (IPK), Corrensstr. 3, 06466 Gatersleben, Germany {weise,colmsee,grafahr,junker,klukas,lange, scholz,schreibe}@ipk-gatersleben.de Abstract: Die Rekonstruktion und Analyse detaillierter metabolischer Modelle bildet eine wichtige Grundlage für das Verständnis komplexer biologischer Prozesse in Organismen. Um dieses Ziel zu erreichen, wurde eine Pipeline etabliert, die Software- Werkzeuge miteinander verbindet um (1) metabolische Netzwerkdaten zu speichern und metabolische Modelle zu rekonstruieren, (2) stöchiometrische und kinetische Modelle zu simulieren und zu analysieren und (3) die von den Modellen generierten Daten zu visualisieren. Die Anwendbarkeit dieses Ansatzes wird anhand einer Fallstudie zum Metabolismus von Kulturpflanzen gezeigt. 1 Einleitung Mathematische Modellierung ermöglicht die Analyse der Struktur, der Dynamik und des Verhaltens metabolischer Netzwerke. Mithilfe solcher Modelle kann das Wissen über komplexe biologische Vorgänge überprüft und erweitert werden. Die Generierung neuer Hypothesen wird ebenso ermöglicht wie die Identifikation geeigneter Ziele für das Metabolic Engineering. Für die Verwendung solcher Modelle müssen verschiedene Aspekte berücksichtigt werden: Repräsentation von Modellen, Modellaustausch, Modellanalyse und Visualisierung von Modellen. Daten zu biologischen Prozessen stammen aus verschiedenen, oftmals widersprüchlichen Quellen und müssen in einem zentralen, gut strukturierten Repository integriert und persistent gespeichert werden. Um hohe Datenqualität sicherzustellen, sollte eine manuelle Kuration der integrierten Daten erfolgen. Die aufbereiteten Daten können mit verschiedenen Werkzeugen zur Visualisierung, Simulation und Analyse verwendet werden. Dafür sollten standardisierte Austauschformate wie die Systems Biology Markup Language (SBML) oder die Biological Pathways Exchange Language (BioPax) eingesetzt werden. In Abhängigkeit von der Zielstellung und den zur Modellrekonstruktion verwendeten Daten können verschiedene Analysetechniken auf die jeweiligen Modelle angewandt werden.

Das Spektrum reicht dabei von der reinen stöchiometrischen Analyse bis hin zu kinetischen Ansätzen. Jeder dieser Ansätze ist mit Vor- und Nachteilen verbunden. Daher ist eine Analyse-Pipeline erforderlich, die verschiedene Techniken sowohl zur nutzerfreundlichen als auch flexiblen Modellsimulation und -analyse zur Verfügung stellt. Dieser Artikel beschreibt eine Pipeline zur Unterstützung der Forschung auf dem Gebiet metabolischer Modelle. Sie umfasst die Schritte: (1) Datenmanagement und individuelle, nutzerspezifische Modellrekonstruktion, (2) stöchiometrische und kinetische Modellanalyse sowie (3) Modell- und Fluss-Visualisierung. Jeder dieser Schritte wird anhand von Werkzeugen und Methoden beschrieben. Die Anwendbarkeit der Pipeline wird anhand einer Fallstudie über den Speichermetabolismus der Kulturpflanze Gerste demonstriert. 2 Modellspeicherung und -rekonstruktion Die Rekonstruktion von Modellen des Stoffwechsels ist ein wichtiger Schritt auf dem Weg zu einem besseren Verständnis biologischer Prozesse. Dazu müssen detaillierte metabolische Informationen bis auf Kompartimentebene erfasst und wohl strukturiert verwaltet werden. Hierfür wurde Meta-All (http://meta-all.ipk-gatersleben.de) [W + 06] als Repository für Stoffwechselprozesse und für Kulturpflanzen das abgeleitete System MetaCrop (http://metacrop.ipk-gatersleben.de) [GB + 08] entwickelt. Dabei handelt es sich um ein manuell kuriertes Repository für qualitativ hochwertige Daten über sieben Kulturpflanzen mit hoher Bedeutung: Hordeum vulgare (Gerste), Triticum aestivum (Weizen), Oryza sativa (Reis), Zea mays (Mais), Beta vulgaris (Rübe), Solanum tuberosum (Kartoffel) und Brassica napus (Raps) und zwei Modellpflanzen: Arabidopsis thaliana (Acker- Schmalwand) und Medicago truncatula (Schneckenklee). Zu jedem biochemischen Umwandlungsprozess (Reaktionen, Translokationen) können in MetaCrop feingranulare Informationen, beispielsweise der Reaktions- oder Translokationstyp, die Reaktionsformel, Synonyme, EC-Nummern, Literaturreferenzen und auch kinetische Daten wie V max -Werte, Affinitäts- oder Inhibitorkonstanten abgespeichert werden. Weiterhin sind all diese Informationen dem Kompartiment zugeordnet, in dem der jeweilige Prozess stattfindet. Netzwerke können als verschiedene parallele Versionen abgespeichert und die einzelnen Elemente können darüber hinaus mit verschiedenen Qualitäts- Tags versehen werden. Da bisher nur sehr wenige Modelle für Kulturpflanzen existieren, ist der zeitintensive Prozess der manuellen Datenkuration unabdingbar. Daten, die im standardisierten SBML- Format [H + 03] vorliegen, können in MetaCrop importiert werden; andere Daten müssen manuell erfasst werden. Zur Kuration steht eine Web-Schnittstelle zur Verfügung. Um in MetaCrop integrierte Daten zu visualisieren oder zu analysieren, können Daten im SBML- Format exportiert werden. Anwender des Systems können individuelle Netzwerkmodelle erstellen, indem Elemente (Reaktionen, Translokationen oder auch ganze Pathways) in einem Shopping Cart abgelegt werden. Wizard-gestützt können anschließend Exporteinstellungen vorgenommen werden, wie beispielsweise die Verwendung bestimmter Kinetiken oder die Einschränkung, ausschließlich Daten einer bestimmten Spezies zu verwenden.

3 Modellanalyse und -simulation Stöchiometrische Modellanalyse oder constraintbasierte Modellierung basiert auf dem Wissen über topologische Strukturen metabolischer Netzwerke. Da hierbei kein Wissen über die Enzymkinetik erforderlich ist, sind constraintbasierte Modellierungsmethoden wie beispielsweise Flux-Balance-Analysis (FBA) zu einem wichtigen Ansatz geworden, um die Möglichkeiten und Eigenschaften metabolischer Netzwerke zu verstehen. Als Werkzeug für die constraintbasierte Analyse metabolischer Modelle wurde FBA-Sim- Vis (http://fbasimvis.ipk-gatersleben.de) entwickelt. Dabei handelt es sich um ein VAN- TED-Plug-in ( [JKS06], vgl. Abschnitt 4) für integrierte constraintbasierte Modellanalyse und -visualisierung. Das Plug-in stellt verschiedene constraintbasierte Analysetechniken (Flux-Balance-Analysis, Knock-out-Analysis, Robustness-Analysis und Flux-Variability- Analysis) und interaktive Visualisierungsroutinen zur Verfügung, um die quantitative Analyse von stöchiometrischen Modellen des Metabolismus zu unterstützen. FBA-SimVis ermöglicht ein umfassendes Verständnis constraintbasierter metabolischer Modelle. Zur Durchführung einer constraintbasierten Analyse eines aus MetaCrop exportierten Modells wird dieses im SBML-Format geladen. Kinetische Modellanalyse Kinetische Modelle sind sehr detailliert und ermöglichen feingranulare Vorhersagen über metabolisches Verhalten. Jedoch erfordern diese Modelle detaillierte kinetische Kenntnisse über die modellierten Enzyme und Berechnungen erreichen schnell die Grenzen der bezahlbaren Rechenleistung. Weiterhin ist die Etablierung kinetischer Modelle ein langwieriger Prozess, welcher die Erfassung verschiedener Typen von detaillierten Informationen erforderlich macht. Die aus MetaCrop exportierten SBML-Dateien enthalten alle erforderlichen Informationen zur Erstellung eines kinetischen Modells und zur Verwendung mit verschiedenen Simulationswerkzeugen. Beispielhaft sei COPASI [H + 06] genannt, ein GUI-basiertes Werkzeug, welches die einfache Bearbeitung und Simulation eines Modells ermöglicht. Ein importiertes Modell kann vom Benutzer bearbeitet und weiterentwickelt werden, sodass auch Daten hinzugefügt werden können, die nicht in MetaCrop enthalten sind. COPASI ermöglicht es dann, das Modell als Zeitverlauf zu simulieren, ein Flussgleichgewicht zu berechnen und dessen Stabilität zu analysieren, auf experimentellen Daten beruhende Parameterschätzungen durchzuführen, metabolische Kontrollanalysen auszuführen usw. Die berechneten Resultate werden in Textdateien gespeichert, welche in Tabellenkalkulationsprogrammen geöffnet und, wie im nachfolgenden Abschnitt beschrieben, an Visualisierungswerkzeuge übermittelt werden können. Weiterhin können Daten in das SBML-Format exportiert und in MetaCrop zum Update verwendet werden. 4 Modellvisualisierung VANTED [JKS06] ist eine plattformunabhängige Open-Source-Software, die es ermöglicht, sowohl experimentelle Daten mehrerer -omics-gebiete (Transcriptomics, Proteo-

mics, Metabolomics) als auch Resultate aus Simulationsstudien umfassend zu evaluieren. Zur Analyse und Visualisierung metabolischer Flux-Daten wird die Daten-Mapping- Methode verwendet. Diese wurde ursprünglich dafür entwickelt, experimentelle Daten Netzwerkelementen zuzuordnen. Flexible Visualisierungstechniken können zur Darstellung von Daten verwendet werden, die mit den Netzwerkknoten oder -kanten verbunden sind. Die verfügbaren Methoden umfassen Linien-, Balken- und Kreisdiagramme ebenso wie Umwandlungsfunktionen, die Daten auf visuelle Eigenschaften, beispielsweise Knotengröße, Kantenbreite oder Graphenelementfarben, abbilden. Zum flexiblen Austausch von Modellen mit verschiedenen Softwarewerkzeugen und Datenquellen werden verschiedene Datenformate wie GML, GraphML, DOT, KGML und SBML unterstützt. 5 Fallstudie Um ein systematisches Verständnis des Speichermetabolismus in Getreidekörnern zu entwickeln, wurde ein stöchiometrisches Modell des zentralen Metabolismus im sich entwickelnden Endosperm der Gerste (Hordeum vulgare) rekonstruiert. Dazu wurden biochemische, physiologische und proteomische Daten, die aus der Literatur und aus öffentlichen Datenbanken abgeleitet wurden, in MetaCrop integriert. Das daraus resultierende kompartimentierte stöchiometrische Modell beinhaltet 257 Umwandlungsprozesse (193 Reaktionen, 64 Transportprozesse) und 234 Metabolite in den intrazellulären Kompartimenten Cytosol, Mitochondrium und Plastid. Um Kornertrag und metabolische Fluss-Verteilungen unter sich ändernden Wachstumsbedingen zu studieren, wurde das Modell mit FBA-SimVis untersucht. Die zur FBA erforderlichen Paramter (z. B. maximale Aufnahme- und Absonderungsraten) wurden aus der Literatur extrahiert und das Modell wurde durch den Vergleich der Simulationsresultate mit literaturbasierten Resultaten validiert. Im Allgemeinen zeigte sich bei den Simulationsergebnissen eine gute Übereinstimmung mit den wichtigsten qualitativen physiologischen Eigenschaften des Speichermetabolismus. Beispielsweise stimmten die vom Modell vorhergesagte Wachstumsrate und die metabolische Netzwerkstruktur unter vollständigen aeroben Wachstumsbedingungen mit publizierten experimentellen Resultaten überein (siehe Abbildung 1 für ein Beispiel). Dieses Modell kann in zukünftigen In-silico-Studien verwendet werden, um Hypothesen zur Verbesserung der Korn- und Ertragsqualität aufzustellen und zu testen. 6 Zusammenfassung In diesem Artikel wurde eine Pipeline zur Integration und Analyse von Daten über Stoffwechselwege an einem Beispiel aus der Kulturpflanzenforschung vorgestellt. Diese umfasst die Schritte der Modellspeicherung und -rekonstruktion, Modellanalyse sowie Modellvisualisierung durch die Verwendung von MetaCrop, FBA-SimVis, COPASI und VAN- TED. Alle eingesetzten Werkzeuge sind öffentlich verfügbar und die vorgestellte Metho-

Abbildung 1: Carbon-Flux-Map des Sucrose-to-Starch-Pathways eines Getreidekorns unter vollständig aeroben Wachstumsbedingungen (visualisiert mit VANTED) dik lässt sich auch auf Stoffwechselmodelle aus der Medizin anwenden. Literatur [GB + 08] E. Grafahrend-Belau et al. MetaCrop: a detailed database of crop plant metabolism. NAR, 36(DB issue):d954 D958, 2008. [H + 03] M. Hucka et al. The systems biology markup language (SBML): a medium for representation and exchange of biochemical network models. Bioinf., 19(4):524 531, 2003. [H + 06] S. Hoops et al. COPASI a COmplex PAthway SImulator. Bioinf., 22(24):3067 3074, 2006. [JKS06] B. Junker, C. Klukas und F. Schreiber. VANTED: A system for advanced data analysis and visualization in the context of biological networks. BMC Bioinf., 7(1):e109.1 13, 2006. [W + 06] S. Weise et al. Meta-All: a system for managing metabolic pathway information. BMC Bioinf., 7(1):e465.1 9, 2006.