Datenbank-Spektrum Zeitschrift für Datenbanktechnologien und Information Retrieval

Größe: px
Ab Seite anzeigen:

Download "Datenbank-Spektrum Zeitschrift für Datenbanktechnologien und Information Retrieval"

Transkript

1

2 Datenbank-Spektrum Zeitschrift für Datenbanktechnologien und Information Retrieval Band 12 Heft 3 November 2012 Schwerpunkt: Scientific Data Management Gastherausgeber: Michael Gertz EDITORIAL Editorial M. Gertz W. Müller 157 SCHWERPUNKTBEITRÄGE Data Management Challenges in Next Generation Sequencing S. Wandelt A. Rheinländer M. Bux L. Thalheim B. Haldemann U. Leser 161 Handling Big Data in Astronomy and Astrophysics: Rich Structured Queries on Replicated Cloud Data with XtreemFS H. Enke A. Partl A. Reinefeld F. Schintke 173 Towards Large-Scale Meteorological Data Services: A Case Study D. Misev P. Baumann J. Seib 183 Scientific Workflows and Provenance: Introduction and Research Opportunities V. Cuevas-Vicenttín S. Dey S. Köhler S. Riddle B. Ludäscher 193 DISSERTATIONEN Dissertationen 219 COMMUNITY Der 175. Datenbankstammtisch an der HTW Dresden U. Wloka G. Gräfe 223 Bericht über den 24. GI-Workshop Grundlagen von Datenbanken I. Schmitt H. Höpfner 227 News 229 NACHRUF Die deutsche DB-Community trauert um Hagen Höpfner ( ) 233 FACHBEITRÄGE XPath and XQuery Full Text Standard and Its Support in RDBMSs D. Petković 205 CityPlot: Colored ER Diagrams to Visualize Structure and Contents of Databases M. Dugas G. Vossen 215 Weitere Artikel finden Sie auf Abstracts publiziert/indexiert in Google Scholar, DBLP, io-port.net, OCLC, Summon by Serial Solutions. Hinweise für Autoren für die Zeitschrift Datenbank Spektrum finden Sie auf

3 Datenbank Spektrum (2012) 12: DOI /s EDITORIAL Editorial Michael Gertz Wolfgang Müller Online publiziert: 5. Oktober 2012 Springer-Verlag Berlin Heidelberg Schwerpunktthema: Scientific Data Management Spricht man heutzutage von Herausforderungen an die Verwaltung und Analyse großer Datenmengen, so bezieht man sich dabei meist auf Anwendungen im Bereich des ecommerce sowie neuerdings insbesondere auf Analysen sozialer Netzwerke. Dieser Fokus ist sicherlich gut begründet, da hier typischerweise große internationale Firmen wie Facebook, Twitter, ebay oder Amazon mit Geschäftsmodellen im Vordergrund stehen, bei denen der Verkauf von Produkten sowie die Pflege und Analyse von Kunden- und Verkaufsdaten die Geschäftsgrundlage bilden. Ähnliches gilt für die Telekommunikationsindustrie, bei der in großen Data Warehouses Informationen zu Anwendern und deren Nutzung von Services verwaltet und zur Verbesserung jener Services analysiert werden. Schwerpunkte traditioneller Forschung und Entwicklung im Bereich Datenbanken lassen sich generell in den oben genannten Bereichen der Verwaltung und Analyse von Geschäftsdaten ansiedeln. Der Menge an geschäftsorientierten Daten steht aber eine noch größere Menge an wissenschaftlichen Daten gegenüber, der bisher weniger Aufmerksamkeit im Rahmen der Mainstream-Datenbankforschung und -entwicklung gewidmet wurde. Gerade in den letzten Jahren haben die Naturwissenschaften immense Fortschritte in der Instrumentierung von Experimenten, Simulationen und Beobachtungen erfahren. Dies betrifft nahezu alle Bereiche in den Natur- M. Gertz ( ) Heidelberg University, Heidelberg, Deutschland W. Müller HITS ggmbh, Heidelberg, Deutschland wissenschaften. Hierzu gehören u.a. die Physik, insbesondere die Astrophysik, Kosmologie und Teilchenphysik, die Biologie mit Schwerpunkten in der Genetik und Molekularbiologie sowie die in den Geowissenschaften angesiedelten Umweltwissenschaften und die Klimaforschung. In der Biologie nimmt zum Beispiel die Fähigkeit, mit Experimenten Daten zu generieren, schneller zu als die Rechenleistung zur Verarbeitung der Daten, was insbesondere bei der Gensequenzierung ein großes Bottleneck darstellt. Aus Datensicht handelt es sich bei wissenschaftlichen Daten nicht um einfache transaktionale Daten, sondern um Daten, die typischerweise sehr heterogen und komplex sind und multiple Skalen beschreiben. Traditionelle Datenbanktechniken sind hierdurch teilweise nicht einfach auf diese Anwendungsbereiche zu übertragen. Die Datenintegration ist ein wichtiges Thema, das beispielsweise durch Scientific Workflows angegangen wird. Gleichzeitig ergeben sich neue Optimierungsmöglichkeiten durch die gegenüber universellen Datenbanken veränderte Domäne, denn neue Zugriffsmuster und andere vorherrschende konzeptuelle Datenstrukturen ermöglichen neue Optimierungen. Die effiziente Verwaltung, Speicherung, Suche und Analyse wissenschaftlicher Daten stellt eine immense Herausforderung an diese und verwandte Bereiche der Naturwissenschaften dar. Wie kann man effektiv neues Wissen aus den Daten ableiten? Wo stoßen aktuelle Systeme an ihre Grenzen? Wo bieten sich neue und interessante Themen für die Datenbankforschung? In unserem Themenheft werden in vier Artikeln interessante Themenstellungen angegangen, die einen Eindruck von der Vielfältigkeit der obigen Herausforderungen geben. Der erste Beitrag Data Management Challenges in Next Generation Sequencing von Sebastian Wandelt, Astrid Rheinländer, Marc Bux, Lisa Thalheim, Berit Haldemann und Ulf Leser widmet sich dem Next Generation Sequen-

4 158 Datenbank Spektrum (2012) 12: cing, dem Big Data -Thema in der Biologie überhaupt. Häufig ist zu hören, dass wir uns auf einen Zustand zubewegen, in dem die Datenverarbeitung von Gensequenzen (technisch gesehen sind dies lange Strings) teurer wird als ihre eigentliche Gewinnung. Der Artikel gibt einen Überblick über die Herausforderungen sowie die wichtigsten Lösungsansätze. Der zweite Beitrag Handling Big Data in Astronomy and Astrophysics: Rich Structured Queries on Replicated Cloud Data with XtreemFS von Harry Enke, Adrian Partl, Alexander Reinefeld und Florian Schintke befasst sich mit der Anfragebearbeitung in verteilt vorliegenden Datensammlungen. Das Anwendungsgebiet sind hier virtuelle Observatorien und deren astronomische Daten, die entweder experimentell oder durch Simulation gewonnen worden sind. Hier werden durch die Kombination eines verteilten Dateisystems und eines Anfrageoptimierers und -verteilers erhebliche Vorteile erzielt. In dem dritten Artikel dieses Heftes befassen sich Dimitar Misev, Peter Baumann und Jürgen Seib unter dem Titel Towards Large-Scale Meteorological Data Services: A Case Study mit Daten, die im Rahmen von Wettersimulationen verwendet werden. Diese umfassen u.a. verschiedenste Formen von Echtzeit-Sensordaten, Satellitendaten sowie historische Daten, die in vieldimensionalen Arrays integriert werden. Gegenstand ist hier rasdaman, eine Datenbank, die zwar auf relationalen Datenbanken aufsetzt, aber auf dieser Basis für die Verwaltung von und Anfrage an meteorologischen Daten effiziente und praktisch relevante Anfragemöglichkeiten bereitstellt. Schließlich beschäftigt sich der Artikel Scientific Workflows and Provenance: Introduction and Research Opportunities von Víctor Cuevas Vicenttín, Saumen Dey, Sven Köhler, Sean Riddle und Bertram Ludäscher mit wissenschaftlichen Workflows. Wie eingangs erwähnt werden diese für die Verarbeitung wissenschaftlicher Daten immer wichtiger. Bei der Verarbeitung und Analyse wissenschaftlicher Daten stehen solche Workflows als komplexe Arbeitsabläufe im Hintergrund, die Daten auf verschiedenste Arten vorverarbeiten, integrieren und umstrukturieren, um sie beispielsweise einer Analyse zugänglich zu machen. Die Bedeutung von Workflows liegt darin, dass sie eine Perspektive bieten, auf einfachere Art und Weise Domänenwissen einzubringen. Im Bereich der wissenschaftlichen Datenbanken spielt das jeweilige Domänenwissen eine sehr große Rolle. Häufig arbeiten Domänenexperten und Entwickler zusammen, um konkrete Probleme zu lösen. Den Domänenexperten interessiert im Wesentlichen das Resultat, der Informatiker ist häufig an der Durchführung, der Flexibilität, Generalität und Wiederverwendbarkeit interessiert. Während oben die Unterschiede zwischen wissenschaftlichen und normalen Datenbanken betont wurden, sollte man aber auch darauf hinweisen, dass eine Vielzahl von Entwicklungen aus dem Datenbankbereich bei der Verarbeitung und Analyse wissenschaftlicher Daten erfolgreich eingesetzt werden. Hierzu gehören z.b. eine Vielfalt von Indexstrukturen für räumliche und zeitlich veränderliche Daten, Verfahren zur Analyse von Datenströmen, effiziente Data-Mining- Methoden zum Clustering hochdimensionaler Daten oder Techniken zur Analyse von Graphstrukturen (wie sie beispielsweise gerade in der Molekularbiologie von Interesse sind). Nichtsdestotrotz bietet der Bereich Scientific Data Management noch eine Vielzahl von interessanten Möglichkeiten, Methoden und Techniken aus der Datenbanktechnologie geeignet in den oben genannten und weiteren Anwendungsbereichen einzubringen und somit diesen Wissenschaften bei ihren Problemen mit der Datenflut ( Data Deluge ) zu helfen. Ein guter Wegweiser hierzu war und ist immer noch der Artikel von Jim Gray et al. Scientific data management in the coming decade (SIGMOD Record 34(4): 34 41, 2005). Diese Schwerpunktbeiträge werden ergänzt durch zwei Fachbeiträge XPath and XQuery Full Text Standard and Its Support in RDBMSs von Du san Petković und CityPlot: Colored ER Diagrams to Visualize Structure and Contents of Databases von Martin Dugas und Gottfried Vossen. Die Rubrik Dissertationen enthält in diesem Heft sechs Kurzfassungen von Dissertationen. In der Rubrik Community berichten Uwe Wloka und Gunter Gräfe von einer in der deutschen Datenbankgemeinde einmaligen und sehr lebendigen Wissenschaftseinrichtung, die seit fast 20 Jahren vom Fachinteresse der Dresdener Datenbankkollegen zeugt. In ihrem Beitrag Der 175. Datenbankstammtisch an der HTW Dresden beschreiben sie das Konzept und die Historie dieser Veranstaltungsreihe und untermauern deren Erfolg mit verschiedenen statistischen Daten. Weiterhin enthält diese Rubrik einen Bericht über den 24. GI-Workshop Grundlagen von Datenbanken von Ingo Schmitt und Hagen Höffner sowie aktuelle Informationen. 2 Künftige Schwerpunktthemen 2.1 MapReduce Programming Model MapReduce (MR) is a programming model which facilitates parallel processing of large, distributed, and even heterogeneous data sets. To accelerate the development of specific MR applications, an MR implementation provides a framework dealing with data distribution and and scheduling of parallel tasks. The user only has to complement this framework by specifying a map function processing key/value pairs to generate intermediate key/value pairs and a reduce function which groups all records with the same intermediate key and merges all values of such groups.

5 Datenbank Spektrum (2012) 12: Using this approach, programs written in such a functional style can automatically exploit large degrees of parallelism and thereby perfectly scale. As a consequence, the MR model had tremendous success in recent years covering many areas of Big Data processing. For this reason, the Datenbank-Spektrum wants to publish research contributions especially of the German database community providing an overview over ongoing work in this particular area. Submissions covering topics from the following nonexclusive list are encouraged: Applications of the MR paradigm Optimization of the MR framework and its applications MR-conform compilation of DB languages Schema flexibility (key/value stores) and MapReduce Comparison of applications running under MapReduce/Hadoop and parallel DBMSs Cooperation of NoSQL and SQL when processing XXL data Paper format: 8 10 pages, double column. Notice of intent for a contribution: July 15th, Guest editor: Theo Härder, University of Kaiserslautern, Deadline for submissions: October 1st, RDF Data Management Nowadays, more and more data is modeled and managed by means of the W3C Resource Description Framework (RDF) and queried by the W3C SPARQL Protocol and RDF Query Language (SPARQL). RDF is commonly known as a conceptual data model for structured information that was standardized to become a key enabler of the Semantic Web to express metadata on the Web. It supports relationships between resources as first-class citizens, provides modeling flexibility towards any kind of schema, and is even usable without a schema at all. Furthermore, RDF allows to collect data starting with very little schema information and refining the schema later, as required. This flexibility led to a wide adoption in many other application domains including life sciences, multifaceted data integration, as well as community-based data collection, and large knowledge bases like DBpedia. This special issue of the Datenbank-Spektrum aims to provide an overview of recent developments, challenges, and future directions in the field of RDF technologies and applications. Topics of interest include (but are not limited to): RDF data management RDF access over the Web Querying and query optimization over RDF data especially when accessed over the Web Applications and usage scenarios Case studies and experience reports Paper format: 8 10 pages, double column. Notice of intent for a contribution: Nov. 15th, Guest editors: Johann-Christoph Freytag, Humboldt-Universität zu Berlin, Bernhard Mitschang, University of Stuttgart, Deadline for submissions: February 1st, Best Workshop Papers of BTW 2013 This special issue of the Datenbank-Spektrum is dedicated to the Best Papers of the Workshops running at the BTW 2013 at the TU Magdeburg. The selected Workshop contributions should be extended to match the format of regular DASP papers. Paper format: 8 10 pages, double column. Selection of the Best Papers by the Workshop chairs and the guest editor: April 15th, Guest editor: Theo Härder, University of Kaiserslautern, Deadline for submissions: June 1st, 2013.

6 Datenbank Spektrum (2012) 12: DOI /s SCHWERPUNKTBEITRAG Handling Big Data in Astronomy and Astrophysics: Rich Structured Queries on Replicated Cloud Data with XtreemFS Harry Enke Adrian Partl Alexander Reinefeld Florian Schintke Received: 2 July 2012 / Accepted: 28 July 2012 / Published online: 10 August 2012 Springer-Verlag 2012 Abstract With recent observational instruments and survey campaigns in astrophysics, efficient analysis of big structured data becomes more and more relevant. While providing good query expressiveness and data analysis capabilities through SQL, off-the-shelf RDBMS are yet not well prepared to handle high volume scientific data distributed across several nodes, neither for fast data ingest nor for fast spatial queries. Our SQL query parser and job manager performs query reformulation to spread queries to data nodes, gathering outputs on a head node and providing them again to the shards for subsequent processing steps. We combine this data analysis architecture with the cloud data storage component XtreemFS for automatic data replication to improve the availability and access latency. With our solution we perform rich structured data analysis expressed using SQL on large amounts of structured astrophysical data distributed across numerous storage nodes in parallel. The cloud storage virtualization with XtreemFS provides elasticity and reproducibility of scientific analysis tasks through its snapshot capability. H. Enke A. Partl Astrophysical Institute in Potsdam (AIP), Berlin, Germany H. Enke A. Partl A. Reinefeld ( ) F. Schintke Zuse Institute Berlin (ZIB), Berlin, Germany F. Schintke 1 Introduction In astronomy and astrophysics, immense amounts of scientific data are produced by the ever growing capabilities of observational instruments, surveys covering substantial parts of the whole sky in various frequency ranges, and computational simulations. For instance, the LOw Frequency ARray (LOFAR), a European radio telescope based on distributed antennae fields located in the Netherlands, Germany, France, UK, and Denmark produces up to five Petabyte of raw data for a mean observation time of only four hours [1]. Even the subsequently processed and correlated data from the various stations still amounts to several tens of Terabytes for such an observation. The general characteristic of this raw, first stage data is that it is huge in size and uniform in structure. Additionally, the data format is usually well known and any infrastructural problems in managing these data can be resolved by improving the hardware setup hosting the data. If we plot the size of individual data sets against the number of such data sets in astronomy and astrophysics (see Fig. 1), the first stage data can be found in area I. Any further data processing steps such as removing instrument characteristics or correlating the station data in the case of LOFAR yield intermediate data (area II in Fig. 1), which is often referred to as science ready data. 1 The resulting datasets are already smaller in size and their structure and formats are diverse. As a whole, science ready data still accumulate to large storage needs. In the case of LO- FAR it is expected that several Petabytes of science ready data are produced per year. Today, organizing access to and enabling further processing of science ready data usually requires dedicated data 1 This process is also called pipelining or data reduction.

7 174 Datenbank Spektrum (2012) 12: Fig. 1 Schematic view of the number of data sets as a function of the size of an individual data set. Area I refers to the raw data or first stage data, area II marks the second stage data known as science ready data, and area III the third stage data (see text for further discussion). The real interesting challenges for scientific data management in astronomy arise in the second area: huge and highly structured data centers. It is no longer feasible to store such large quantities at the scientist s workstation. Because the data is generally used by other scientists than the producers, it also has to be curated, validated, checked for consistency, and enriched by metadata. Thus, any tool handling and analyzing such amounts of science ready data has to be co-located with the data. Then only a small fraction of the data (i.e. results) needs to be transferred to the individual scientist for publication. This highly structured and individual data is what we refer to as third stage data in Fig. 1. Formerly, only such condensed results were publicly available and regarded as scientifically interesting, and second stage data was located at the scientist s workstation. This view has considerably changed and more focus is laid on the publication of the underlying science ready data. Observation Data Most of the published observational data in astronomy is now available in digital form. 2 Many data archives also feature databases of their objects with core properties and provide access through web based services. The most successful examples are the Sloan Digital Sky Survey (SDSS), 3 the Centre des Données Astronomiques de Strasbourg (CDS) with a huge collection of small archives, 4 2 A common file format in astronomy, the Flexible Image Transfer System (FITS) was created in 1979 and is approved as a standard by the IAU [2] and all the archives published using the Virtual Observatory protocols. In observations, highly structured science ready data such as images, table data, graphs, and others pose new problems when various sources of information or archives need to be integrated for a compound view. Such a multifrequency view of an object from infrared, microwave, radio, and gamma ray catalogs demand standardized calibrations and uniformly accessible data structures. The need for a multi-wavelength view of the Universe gave rise to the International Virtual Observatory Alliance (IVOA) with its goal of a distributed search and retrieval engine for astronomical data [4]. The application of data mining concepts and the multifrequency approach moves the scientific focus to the second stage data. It is therefore essential that in the production and operation of science ready data collections the whole process of data curation and validation is applied. Formerly, this was used only for scientific papers and the few data tables summarizing scientific results. For observational data, the organization of key properties in database tables is already one of the ubiquitous features of the data preparation, where Table 1 provides a brief overview. Simulation Data To study the validity of theoretical models, simulations are an essential tool. Especially in the field of cosmology, simulations are needed to interpret observational results. Despite their importance in cosmology, data archives of large simulations were established only in the recent years with the Millennium Simulation 5 [12] and the MultiDark databases 6 [17]. The Millennium database introduced this archiving based on relational database management systems (RDBMS) to the simulation community as a valuable tool in obtaining scientific results. Using a simulation data archive, more scientists can work on the data and ask questions far beyond the focus of the scientists who generated the simulation. Formerly, scientific work on simulations required direct access to the raw data. However, because of its large sizes and difficulties in transferring the data, this was only feasible for small groups. The results of this limitation were nonpublicly available data mining tools and a large amount of bespoke data formats and access procedures for simulation data. This proved to be an obstacle for efficient scientific work in larger collaborations. As is the case with observational data, a collaborative access to the simulations requires the collection of this data in one location with the provision of a collaborative data analysis environment. Furthermore, tools for simulation analysis require compute facilities tuned 5 6

8 Datenbank Spektrum (2012) 12: Table 1 Selection of digital astronomical archives with observational data [3] Year Survey Data size Content 1994 Digitized Sky Survey (DSS) 73 GB Digitized photo plates 2001 Catalog of DSS 16 GB Digitized 89 Mio. objects Micron All Sky Survey (2MASS) 200 GB 300 Mio. point sources, 1 Mio. extended sources 2006 Sloan Digital Sky Survey (SDSS) 6 TB Catalog 70 TB images and spectra <200 Mio. objects, 1 Mio. spectra 2011 ff LOw Frequency ARray (LOFAR) 2 TB/day Radio data (images, spectra) 2013 ff GAIA (satellite) 50 GB/day 1 Billion objects 2014 ff Large Synoptic Survey Telescope (LSST) 30 TB/day 60 PB, 20 Billion objects Table 2 Selection of astrophysical simulations [3] Year Simulation N particles Data size (raw) CPUh 1990 Collision of two galaxies MB Collision of two galaxies TB Star dynamo 50 GB Black Hole Collision 5 TB ff Large Scale Structures PB > to the individual analysis workflows as opposed to number crunching in the generation of the first stage data. 7 Piloted by the Millennium Simulation database and later followed by the MultiDark database, the organization of simulation data in databases focused on providing second stage products such as halo catalogs, merger tree analysis and other information extracted from the raw data through RDBMS. However, it turned out that for various scientific questions the full 6D information of the phase space is required. For instance, full phase space information is required, when halos and especially subhalos need to be redetermined with different algorithms than the ones that produced the provided halo catalogues. Additionally, the gravitational potential of a simulated object can only be determined from the full phase space information, which is an important quantity in the study of gravitational lenses. A snapshot of a modern cosmological N-body simulation has around particles (see Table 2) and consists of multiple ( 100) snapshots. Available SQL database implementations show performance issues for this kind of data. One of the problems is connected to the spatial nature of the queries. Additionally, huge chunks of the data have to be returned and processed for scientifically useful queries. Until today, only simulation data sets were large enough to pose problems for available RDBMS. However, the challenges faced in the simulation community start to appear in 7 A Millennium like simulation requires for the production of raw data (aka. snapshots) several Million CPU hours (see Table 2). observational data management as well. Only recently, the observational community started to explore various roads to deal with the upcoming large observational datasets. For instance, GAIA, a satellite mission to be launched in 2013, will produce large data sets that are highly complex and require data mining facilities with efficient access to the whole data. One concept currently explored by the GAIA consortium is storing the data (>1 PB) in a Hadoop file system, so that MapReduce algorithms can be applied. With this approach a constant performance for most types of queries can be achieved. However, since lots of known information about the data structure is neglected in this approach, RDMBS using this information perform much better for certain types of queries, whereas for other cases the Hadoop approach provides better performance. Thus there will be different types of GAIA archives and tools for their exploitation. 2 Challenges for Current Relational Database Systems Overcoming the problems posed by large datasets is a task where various approaches such as Hadoop, column based databases (such as SciDB), NoSQL, or sharded relational databases are currently considered in science data centers [14]. One very important consideration besides performance when choosing a big data management system is usability. From the perspective of scientists it is important that a system provides a standardized and easy to use interface to the data, which is flexible enough for the implementation of complex data mining and analysis algorithms.

9 176 Datenbank Spektrum (2012) 12: Data Access Since observational astronomers started to slowly adopt SQL based query interfaces thanks to the success of the SDSS survey, it is important to continue and promote this development. One key aspect of this development is, that by using SQL it is possible to standardize various science questions and thus use similar SQL queries on different datasets. It is also easier to publish in a paper the SQL query used in an analysis than a documentation of the specialized data format used in storing the data and the associated analysis tools. This greatly improves on the aspect of reproducibility of the scientific results. The IVOA even develops and maintains an extension to SQL named ADQL (Astronomical Data Query Language [7]) enabling additional query possibilities such as geometrical functions on spheres. Having a standardized data query language is therefore very important. Even though new NoSQL developments such as SciDB or Hadoop may provide sometimes better suited data management and processing facilities for scientific data, the main problem about NoSQL is, that each solutions provides its own query language. Any use of these new and thus not established access methods would only alienate the user base and thus render a data service less valuable. Therefore, solutions that enable the use of SQL are to be preferred and relational databases are a natural choice. Performance A major challenge for any data store solution is performance. One crucial point for any solution is to provide competitive data analysis and retrieval performance to the scientists FORTRAN or C tools. Any data service that is significantly slower than these bespoke tools will not be accepted. Unfortunately, this cannot be easily achieved with available RDBM systems. They are usually designed with completely different use cases and requirements in mind than scientific data analysis requires. Until recently, RDBMS running on single instances were sufficient for the amount of data that scientists needed to handle. The large increase in the amount of data produced by simulations (Table 2) or by large scale surveys with new instruments (Table 1) start to conflict with the limitations of these systems. A single instance is no longer sufficient and parallel solutions are needed. Only with the various developments in business intelligence and data warehousing solutions, distributed commercial (and open source) tools start to cope with the requirements of these scientific data sets. It is therefore crucial on the one hand, that new optimized indexing methods and algorithms are developed for the scientific data. On the other hand, large sharded RDBM systems need to be built, which allow for efficient aggregation and data mining algorithms and fast retrieval of large amounts of data (multiple million or billions of rows at a time) at affordable expenses. The huge datasets require considerable preparatory work (curation, ingestion, management) when using a database system. Many RDBMS are not designed to handle large binary datasets and customized ingestion tools need to be written. Even worse, many RDBMS systems provide only bulk ingest facilities through ASCII files. A solid and performant API is therefore desirable and should provide fast bulk ingestion facilities. In our experience, available ODBC data connectors do not generally meet all these requirements (for instance, no fast open source implementation of TDS, the MS SQL Server protocol, is available) and even APIs such as the MySQL C API provide only limited performance. The MySQL C API e.g. implements prepared statements and binding of variables with too many string parsing operations. 3 Rich Structured Queries on Replicated Cloud Data Storage We therefore developed an open source solution for a parallel sharded RDBMS by customizing MySQL setups. We are building a package for scientific data centers that allows easy maintenance of a MySQL cluster with head and data nodes, and features a facility for exploiting the sharded architecture through parallel queries. We chose MySQL over other open source RDBMS such as Postgres mainly because MySQL allows custom implementation of storage engines. We plan to directly access the raw simulation result files through custom storage engines in the future. Since we only require read access to the data, this approach will greatly facilitate the ingestion process of the raw simulation files. Postgres on the other hand would provide the Generalized Search Tree (GiST) which would be a natural choice for implementing an optimized algorithm for spatial queries (see below Sect. 3.3). Our development of a MySQL cluster hosting scientific data focuses on the needs of computational cosmologists. The main goal is to provide fast access to all the raw simulation data such as the full particle data ( rows per time step, see Table 2) and its derived products such as halo catalogues, merger trees and mock galaxy catalogues [17]. The system should be able to handle complex spatial queries such as object queries in arbitrary geometries and nearest neighbor searches. At the moment, no emphasis is laid on optimizing cross products between large distributed tables, but this will be a priority for future development. The main tasks in the setup of our MySQL cluster involve two distinct stages. The first stage is the setup of the MySQL cluster itself with the development of administrative tools, replication and backup solutions, data partitioning strategies and a parallel SQL query facility. The second stage involves the development and optimization of customized data access strategies (such as indexing).

Einsatz einer Dokumentenverwaltungslösung zur Optimierung der unternehmensübergreifenden Kommunikation

Einsatz einer Dokumentenverwaltungslösung zur Optimierung der unternehmensübergreifenden Kommunikation Einsatz einer Dokumentenverwaltungslösung zur Optimierung der unternehmensübergreifenden Kommunikation Eine Betrachtung im Kontext der Ausgliederung von Chrysler Daniel Rheinbay Abstract Betriebliche Informationssysteme

Mehr

Introducing PAThWay. Structured and methodical performance engineering. Isaías A. Comprés Ureña Ventsislav Petkov Michael Firbach Michael Gerndt

Introducing PAThWay. Structured and methodical performance engineering. Isaías A. Comprés Ureña Ventsislav Petkov Michael Firbach Michael Gerndt Introducing PAThWay Structured and methodical performance engineering Isaías A. Comprés Ureña Ventsislav Petkov Michael Firbach Michael Gerndt Technical University of Munich Overview Tuning Challenges

Mehr

eurex rundschreiben 094/10

eurex rundschreiben 094/10 eurex rundschreiben 094/10 Datum: Frankfurt, 21. Mai 2010 Empfänger: Alle Handelsteilnehmer der Eurex Deutschland und Eurex Zürich sowie Vendoren Autorisiert von: Jürg Spillmann Weitere Informationen zur

Mehr

p^db=`oj===pìééçêíáåñçêã~íáçå=

p^db=`oj===pìééçêíáåñçêã~íáçå= p^db=`oj===pìééçêíáåñçêã~íáçå= Error: "Could not connect to the SQL Server Instance" or "Failed to open a connection to the database." When you attempt to launch ACT! by Sage or ACT by Sage Premium for

Mehr

Titelbild1 ANSYS. Customer Portal LogIn

Titelbild1 ANSYS. Customer Portal LogIn Titelbild1 ANSYS Customer Portal LogIn 1 Neuanmeldung Neuanmeldung: Bitte Not yet a member anklicken Adressen-Check Adressdaten eintragen Customer No. ist hier bereits erforderlich HERE - Button Hier nochmal

Mehr

A central repository for gridded data in the MeteoSwiss Data Warehouse

A central repository for gridded data in the MeteoSwiss Data Warehouse A central repository for gridded data in the MeteoSwiss Data Warehouse, Zürich M2: Data Rescue management, quality and homogenization September 16th, 2010 Data Coordination, MeteoSwiss 1 Agenda Short introduction

Mehr

1. General information... 2 2. Login... 2 3. Home... 3 4. Current applications... 3

1. General information... 2 2. Login... 2 3. Home... 3 4. Current applications... 3 User Manual for Marketing Authorisation and Lifecycle Management of Medicines Inhalt: User Manual for Marketing Authorisation and Lifecycle Management of Medicines... 1 1. General information... 2 2. Login...

Mehr

Ingenics Project Portal

Ingenics Project Portal Version: 00; Status: E Seite: 1/6 This document is drawn to show the functions of the project portal developed by Ingenics AG. To use the portal enter the following URL in your Browser: https://projectportal.ingenics.de

Mehr

Customer-specific software for autonomous driving and driver assistance (ADAS)

Customer-specific software for autonomous driving and driver assistance (ADAS) This press release is approved for publication. Press Release Chemnitz, February 6 th, 2014 Customer-specific software for autonomous driving and driver assistance (ADAS) With the new product line Baselabs

Mehr

Prediction Market, 28th July 2012 Information and Instructions. Prognosemärkte Lehrstuhl für Betriebswirtschaftslehre insbes.

Prediction Market, 28th July 2012 Information and Instructions. Prognosemärkte Lehrstuhl für Betriebswirtschaftslehre insbes. Prediction Market, 28th July 2012 Information and Instructions S. 1 Welcome, and thanks for your participation Sensational prices are waiting for you 1000 Euro in amazon vouchers: The winner has the chance

Mehr

Algorithms for graph visualization

Algorithms for graph visualization Algorithms for graph visualization Project - Orthogonal Grid Layout with Small Area W INTER SEMESTER 2013/2014 Martin No llenburg KIT Universita t des Landes Baden-Wu rttemberg und nationales Forschungszentrum

Mehr

H. Enke, Sprecher des AK Forschungsdaten der WGL

H. Enke, Sprecher des AK Forschungsdaten der WGL https://escience.aip.de/ak-forschungsdaten H. Enke, Sprecher des AK Forschungsdaten der WGL 20.01.2015 / Forschungsdaten - DataCite Workshop 1 AK Forschungsdaten der WGL 2009 gegründet - Arbeit für die

Mehr

Bayerisches Landesamt für Statistik und Datenverarbeitung Rechenzentrum Süd. z/os Requirements 95. z/os Guide in Lahnstein 13.

Bayerisches Landesamt für Statistik und Datenverarbeitung Rechenzentrum Süd. z/os Requirements 95. z/os Guide in Lahnstein 13. z/os Requirements 95. z/os Guide in Lahnstein 13. März 2009 0 1) LOGROTATE in z/os USS 2) KERBEROS (KRB5) in DFS/SMB 3) GSE Requirements System 1 Requirement Details Description Benefit Time Limit Impact

Mehr

3D City Model Berlin Spatial Data Infrastructure Berlin: The 3D City Model ERDF Project Strategic Goal 3D City Model Berlin Strategic Goal Use of 3D City Model for: City and Urban Planning, Political Issues

Mehr

Group and Session Management for Collaborative Applications

Group and Session Management for Collaborative Applications Diss. ETH No. 12075 Group and Session Management for Collaborative Applications A dissertation submitted to the SWISS FEDERAL INSTITUTE OF TECHNOLOGY ZÜRICH for the degree of Doctor of Technical Seiences

Mehr

Exercise (Part XI) Anastasia Mochalova, Lehrstuhl für ABWL und Wirtschaftsinformatik, Kath. Universität Eichstätt-Ingolstadt 1

Exercise (Part XI) Anastasia Mochalova, Lehrstuhl für ABWL und Wirtschaftsinformatik, Kath. Universität Eichstätt-Ingolstadt 1 Exercise (Part XI) Notes: The exercise is based on Microsoft Dynamics CRM Online. For all screenshots: Copyright Microsoft Corporation. The sign ## is you personal number to be used in all exercises. All

Mehr

ReadMe zur Installation der BRICKware for Windows, Version 6.1.2. ReadMe on Installing BRICKware for Windows, Version 6.1.2

ReadMe zur Installation der BRICKware for Windows, Version 6.1.2. ReadMe on Installing BRICKware for Windows, Version 6.1.2 ReadMe zur Installation der BRICKware for Windows, Version 6.1.2 Seiten 2-4 ReadMe on Installing BRICKware for Windows, Version 6.1.2 Pages 5/6 BRICKware for Windows ReadMe 1 1 BRICKware for Windows, Version

Mehr

Organisatorisches. Unit1: Intro and Basics. Bewertung. About Me.. Datenorientierte Systemanalyse. Gerhard Wohlgenannt

Organisatorisches. Unit1: Intro and Basics. Bewertung. About Me.. Datenorientierte Systemanalyse. Gerhard Wohlgenannt Organisatorisches Datenorientierte Systemanalyse Unit1: Intro and Basics Gerhard Wohlgenannt Inhalt: Datenorientierte Systemanalyse Umfang: 5 units XX.10.2013 XX.11.2013 09:00-13:30 Uhr Room XXX Infos,

Mehr

Klausur Verteilte Systeme

Klausur Verteilte Systeme Klausur Verteilte Systeme SS 2005 by Prof. Walter Kriha Klausur Verteilte Systeme: SS 2005 by Prof. Walter Kriha Note Bitte ausfüllen (Fill in please): Vorname: Nachname: Matrikelnummer: Studiengang: Table

Mehr

Software development with continuous integration

Software development with continuous integration Software development with continuous integration (FESG/MPIfR) ettl@fs.wettzell.de (FESG) neidhardt@fs.wettzell.de 1 A critical view on scientific software Tendency to become complex and unstructured Highly

Mehr

Cloud und Big Data als Sprungbrett in die vernetzte Zukunft am Beispiel Viessmann

Cloud und Big Data als Sprungbrett in die vernetzte Zukunft am Beispiel Viessmann Cloud und Big Data als Sprungbrett in die vernetzte Zukunft am Beispiel Viessmann Adam Stambulski Project Manager Viessmann R&D Center Wroclaw Dr. Moritz Gomm Business Development Manager Zühlke Engineering

Mehr

Infrastructure as a Service (IaaS) Solutions for Online Game Service Provision

Infrastructure as a Service (IaaS) Solutions for Online Game Service Provision Infrastructure as a Service (IaaS) Solutions for Online Game Service Provision Zielsetzung: System Verwendung von Cloud-Systemen für das Hosting von online Spielen (IaaS) Reservieren/Buchen von Resources

Mehr

ISO 15504 Reference Model

ISO 15504 Reference Model Prozess Dimension von SPICE/ISO 15504 Process flow Remarks Role Documents, data, tools input, output Start Define purpose and scope Define process overview Define process details Define roles no Define

Mehr

CHAMPIONS Communication and Dissemination

CHAMPIONS Communication and Dissemination CHAMPIONS Communication and Dissemination Europa Programm Center Im Freistaat Thüringen In Trägerschaft des TIAW e. V. 1 CENTRAL EUROPE PROGRAMME CENTRAL EUROPE PROGRAMME -ist als größtes Aufbauprogramm

Mehr

Exercise (Part II) Anastasia Mochalova, Lehrstuhl für ABWL und Wirtschaftsinformatik, Kath. Universität Eichstätt-Ingolstadt 1

Exercise (Part II) Anastasia Mochalova, Lehrstuhl für ABWL und Wirtschaftsinformatik, Kath. Universität Eichstätt-Ingolstadt 1 Exercise (Part II) Notes: The exercise is based on Microsoft Dynamics CRM Online. For all screenshots: Copyright Microsoft Corporation. The sign ## is you personal number to be used in all exercises. All

Mehr

Browser- gestützte Visualisierung komplexer Datensätze: Das ROAD System

Browser- gestützte Visualisierung komplexer Datensätze: Das ROAD System AG Computeranwendungen und QuanLtaLve Methoden in der Archäologie 5. Workshop Tübingen 14. 15. Februar 2014 Browser- gestützte Visualisierung komplexer Datensätze: Das ROAD System Volker Hochschild, Michael

Mehr

XML Template Transfer Transfer project templates easily between systems

XML Template Transfer Transfer project templates easily between systems Transfer project templates easily between systems A PLM Consulting Solution Public The consulting solution XML Template Transfer enables you to easily reuse existing project templates in different PPM

Mehr

EEX Kundeninformation 2002-08-30

EEX Kundeninformation 2002-08-30 EEX Kundeninformation 2002-08-30 Terminmarkt - Eurex Release 6.0; Versand der Simulations-Kits Kit-Versand: Am Freitag, 30. August 2002, versendet Eurex nach Handelsschluss die Simulations -Kits für Eurex

Mehr

IDS Lizenzierung für IDS und HDR. Primärserver IDS Lizenz HDR Lizenz

IDS Lizenzierung für IDS und HDR. Primärserver IDS Lizenz HDR Lizenz IDS Lizenzierung für IDS und HDR Primärserver IDS Lizenz HDR Lizenz Workgroup V7.3x oder V9.x Required Not Available Primärserver Express V10.0 Workgroup V10.0 Enterprise V7.3x, V9.x or V10.0 IDS Lizenz

Mehr

Fluid-Particle Multiphase Flow Simulations for the Study of Sand Infiltration into Immobile Gravel-Beds

Fluid-Particle Multiphase Flow Simulations for the Study of Sand Infiltration into Immobile Gravel-Beds 3rd JUQUEEN Porting and Tuning Workshop Jülich, 2-4 February 2015 Fluid-Particle Multiphase Flow Simulations for the Study of Sand Infiltration into Immobile Gravel-Beds Tobias Schruff, Roy M. Frings,

Mehr

AS Path-Prepending in the Internet And Its Impact on Routing Decisions

AS Path-Prepending in the Internet And Its Impact on Routing Decisions (SEP) Its Impact on Routing Decisions Zhi Qi ytqz@mytum.de Advisor: Wolfgang Mühlbauer Lehrstuhl für Netzwerkarchitekturen Background Motivation BGP -> core routing protocol BGP relies on policy routing

Mehr

Frequently asked Questions for Kaercher Citrix (apps.kaercher.com)

Frequently asked Questions for Kaercher Citrix (apps.kaercher.com) Frequently asked Questions for Kaercher Citrix (apps.kaercher.com) Inhalt Content Citrix-Anmeldung Login to Citrix Was bedeutet PIN und Token (bei Anmeldungen aus dem Internet)? What does PIN and Token

Mehr

TMF projects on IT infrastructure for clinical research

TMF projects on IT infrastructure for clinical research Welcome! TMF projects on IT infrastructure for clinical research R. Speer Telematikplattform für Medizinische Forschungsnetze (TMF) e.v. Berlin Telematikplattform für Medizinische Forschungsnetze (TMF)

Mehr

Mash-Up Personal Learning Environments. Dr. Hendrik Drachsler

Mash-Up Personal Learning Environments. Dr. Hendrik Drachsler Decision Support for Learners in Mash-Up Personal Learning Environments Dr. Hendrik Drachsler Personal Nowadays Environments Blog Reader More Information Providers Social Bookmarking Various Communities

Mehr

SARA 1. Project Meeting

SARA 1. Project Meeting SARA 1. Project Meeting Energy Concepts, BMS and Monitoring Integration of Simulation Assisted Control Systems for Innovative Energy Devices Prof. Dr. Ursula Eicker Dr. Jürgen Schumacher Dirk Pietruschka,

Mehr

JONATHAN JONA WISLER WHD.global

JONATHAN JONA WISLER WHD.global JONATHAN WISLER JONATHAN WISLER WHD.global CLOUD IS THE FUTURE By 2014, the personal cloud will replace the personal computer at the center of users' digital lives Gartner CLOUD TYPES SaaS IaaS PaaS

Mehr

Abteilung Internationales CampusCenter

Abteilung Internationales CampusCenter Abteilung Internationales CampusCenter Instructions for the STiNE Online Enrollment Application for Exchange Students 1. Please go to www.uni-hamburg.de/online-bewerbung and click on Bewerberaccount anlegen

Mehr

Distributed testing. Demo Video

Distributed testing. Demo Video distributed testing Das intunify Team An der Entwicklung der Testsystem-Software arbeiten wir als Team von Software-Spezialisten und Designern der soft2tec GmbH in Kooperation mit der Universität Osnabrück.

Mehr

Prof. Dr. Margit Scholl, Mr. RD Guldner Mr. Coskun, Mr. Yigitbas. Mr. Niemczik, Mr. Koppatz (SuDiLe GbR)

Prof. Dr. Margit Scholl, Mr. RD Guldner Mr. Coskun, Mr. Yigitbas. Mr. Niemczik, Mr. Koppatz (SuDiLe GbR) Prof. Dr. Margit Scholl, Mr. RD Guldner Mr. Coskun, Mr. Yigitbas in cooperation with Mr. Niemczik, Mr. Koppatz (SuDiLe GbR) Our idea: Fachbereich Wirtschaft, Verwaltung und Recht Simple strategies of lifelong

Mehr

RailMaster New Version 7.00.p26.01 / 01.08.2014

RailMaster New Version 7.00.p26.01 / 01.08.2014 RailMaster New Version 7.00.p26.01 / 01.08.2014 English Version Bahnbuchungen so einfach und effizient wie noch nie! Copyright Copyright 2014 Travelport und/oder Tochtergesellschaften. Alle Rechte vorbehalten.

Mehr

KURZANLEITUNG. Firmware-Upgrade: Wie geht das eigentlich?

KURZANLEITUNG. Firmware-Upgrade: Wie geht das eigentlich? KURZANLEITUNG Firmware-Upgrade: Wie geht das eigentlich? Die Firmware ist eine Software, die auf der IP-Kamera installiert ist und alle Funktionen des Gerätes steuert. Nach dem Firmware-Update stehen Ihnen

Mehr

Employment and Salary Verification in the Internet (PA-PA-US)

Employment and Salary Verification in the Internet (PA-PA-US) Employment and Salary Verification in the Internet (PA-PA-US) HELP.PYUS Release 4.6C Employment and Salary Verification in the Internet (PA-PA-US SAP AG Copyright Copyright 2001 SAP AG. Alle Rechte vorbehalten.

Mehr

Exploring the knowledge in Semi Structured Data Sets with Rich Queries

Exploring the knowledge in Semi Structured Data Sets with Rich Queries Exploring the knowledge in Semi Structured Data Sets with Rich Queries Jürgen Umbrich Sebastian Blohm Institut AIFB, Universität Karlsruhe (TH) Forschungsuniversität gegründet 1825 www.kit.ed Overview

Mehr

SAP PPM Enhanced Field and Tab Control

SAP PPM Enhanced Field and Tab Control SAP PPM Enhanced Field and Tab Control A PPM Consulting Solution Public Enhanced Field and Tab Control Enhanced Field and Tab Control gives you the opportunity to control your fields of items and decision

Mehr

Instruktionen Mozilla Thunderbird Seite 1

Instruktionen Mozilla Thunderbird Seite 1 Instruktionen Mozilla Thunderbird Seite 1 Instruktionen Mozilla Thunderbird Dieses Handbuch wird für Benutzer geschrieben, die bereits ein E-Mail-Konto zusammenbauen lassen im Mozilla Thunderbird und wird

Mehr

MANAGEMENT AND FEDERATION OF STREAM PROCESSING APPLICATIONS

MANAGEMENT AND FEDERATION OF STREAM PROCESSING APPLICATIONS DISS. ETH NO. 20172 MANAGEMENT AND FEDERATION OF STREAM PROCESSING APPLICATIONS A dissertation submitted to ETH ZURICH for the degree of Doctor of Sciences presented by MICHAEL ALEXANDER DULLER Master

Mehr

Universität Dortmund Integrating Knowledge Discovery into Knowledge Management

Universität Dortmund Integrating Knowledge Discovery into Knowledge Management Integrating Knowledge Discovery into Knowledge Management Katharina Morik, Christian Hüppe, Klaus Unterstein Univ. Dortmund LS8 www-ai.cs.uni-dortmund.de Overview Integrating given data into a knowledge

Mehr

Role Play I: Ms Minor Role Card. Ms Minor, accountant at BIGBOSS Inc.

Role Play I: Ms Minor Role Card. Ms Minor, accountant at BIGBOSS Inc. Role Play I: Ms Minor Role Card Conversation between Ms Boss, CEO of BIGBOSS Inc. and Ms Minor, accountant at BIGBOSS Inc. Ms Boss: Guten Morgen, Frau Minor! Guten Morgen, Herr Boss! Frau Minor, bald steht

Mehr

Praktikum Entwicklung Mediensysteme (für Master)

Praktikum Entwicklung Mediensysteme (für Master) Praktikum Entwicklung Mediensysteme (für Master) Organisatorisches Today Schedule Organizational Stuff Introduction to Android Exercise 1 2 Schedule Phase 1 Individual Phase: Introduction to basics about

Mehr

Medical Image Processing MediGRID. GRID-Computing für Medizin und Lebenswissenschaften

Medical Image Processing MediGRID. GRID-Computing für Medizin und Lebenswissenschaften Medical Image Processing in Medical Image Processing Image Processing is of high importantance for medical research, diagnosis and therapy High storage capacity Volume data, high resolution images, screening

Mehr

Inequality Utilitarian and Capabilities Perspectives (and what they may imply for public health)

Inequality Utilitarian and Capabilities Perspectives (and what they may imply for public health) Inequality Utilitarian and Capabilities Perspectives (and what they may imply for public health) 1 Utilitarian Perspectives on Inequality 2 Inequalities matter most in terms of their impact onthelivesthatpeopleseektoliveandthethings,

Mehr

Windream Objektspeicher 6.0.2.0

Windream Objektspeicher 6.0.2.0 Windream Objektspeicher 6.0.2.0 Directory Pools und Filestream Pools verfügen über neue Optionen zur Integration von NetApp. Das Leistungsmerkmal wird über die Lizenz des windream Objektspeichers freigeschaltet.

Mehr

Lesen Sie die Bedienungs-, Wartungs- und Sicherheitsanleitungen des mit REMUC zu steuernden Gerätes

Lesen Sie die Bedienungs-, Wartungs- und Sicherheitsanleitungen des mit REMUC zu steuernden Gerätes KURZANLEITUNG VORAUSSETZUNGEN Lesen Sie die Bedienungs-, Wartungs- und Sicherheitsanleitungen des mit REMUC zu steuernden Gerätes Überprüfen Sie, dass eine funktionsfähige SIM-Karte mit Datenpaket im REMUC-

Mehr

ein verteiltes und repliziertes Dateisystem XtreemOS IP project is funded by the European Commission under contract IST-FP6-033576

ein verteiltes und repliziertes Dateisystem XtreemOS IP project is funded by the European Commission under contract IST-FP6-033576 ein verteiltes und repliziertes Dateisystem is funded by the European Commission XtreemOS IPunder project contract IST-FP6-033576 1 Das XtreemOS Projekt Europäisches Forschungsprojekt gefördert von der

Mehr

Verzeichnisdienste in heterogenen Systemen

Verzeichnisdienste in heterogenen Systemen Verzeichnisdienste in heterogenen Systemen Zielsetzungen Implementierung Aufbau: Active Directory (AD) auf Basis von Windows Server 008 R mit Windows Client(s), Linux Client(s) und einem Linux Server (Dateiserver).

Mehr

Business-centric Storage How appliances make complete backup solutions simple to build and to sell

Business-centric Storage How appliances make complete backup solutions simple to build and to sell Business-centric Storage How appliances make complete backup solutions simple to build and to sell Frank Reichart Sen. Dir. Prod. Marketing Storage Solutions 0 The three horrors of data protection 50%

Mehr

DKRZ Datenhierarchie Von der Antragstellung bis zur Archivierung

DKRZ Datenhierarchie Von der Antragstellung bis zur Archivierung DKRZ Datenhierarchie Von der Antragstellung bis zur Archivierung 07-May-2014 Hannes Thiemann Deutsches Klimarechenzentrum (DKRZ) Datenmanagement Antrag Ressourcen Archivierung + Zugriff Support LiveDemo

Mehr

Lehrstuhl für Allgemeine BWL Strategisches und Internationales Management Prof. Dr. Mike Geppert Carl-Zeiß-Str. 3 07743 Jena

Lehrstuhl für Allgemeine BWL Strategisches und Internationales Management Prof. Dr. Mike Geppert Carl-Zeiß-Str. 3 07743 Jena Lehrstuhl für Allgemeine BWL Strategisches und Internationales Management Prof. Dr. Mike Geppert Carl-Zeiß-Str. 3 07743 Jena http://www.im.uni-jena.de Contents I. Learning Objectives II. III. IV. Recap

Mehr

Understanding and Improving Collaboration in Distributed Software Development

Understanding and Improving Collaboration in Distributed Software Development Diss. ETH No. 22473 Understanding and Improving Collaboration in Distributed Software Development A thesis submitted to attain the degree of DOCTOR OF SCIENCES of ETH ZURICH (Dr. sc. ETH Zurich) presented

Mehr

In vier Schritten zum Titel. erfolgreichen Messeauftritt. Four steps to a successful trade fair. Hier beginnt Zukunft! The future starts here!

In vier Schritten zum Titel. erfolgreichen Messeauftritt. Four steps to a successful trade fair. Hier beginnt Zukunft! The future starts here! In vier Schritten zum Titel erfolgreichen Messeauftritt. Four steps to a successful trade fair. Hier beginnt Zukunft! The future starts here! Einleitung Intro Um Sie dabei zu unterstützen, Ihren Messeauftritt

Mehr

Dynamische Erweiterung lokaler Batch Systeme durch Cloud Resourcen

Dynamische Erweiterung lokaler Batch Systeme durch Cloud Resourcen Dynamische Erweiterung lokaler Batch Systeme durch Cloud Resourcen, Thomas Hauth, Armin Scheurer, Oliver Oberst, Günter Quast, Marcel Kunze INSTITUT FÜR EXPERIMENTELLE KERNPHYSIK (EKP) FAKULTÄT FÜR PHYSIK

Mehr

Field Librarianship in den USA

Field Librarianship in den USA Field Librarianship in den USA Bestandsaufnahme und Zukunftsperspektiven Vorschau subject librarians field librarians in den USA embedded librarians das amerikanische Hochschulwesen Zukunftsperspektiven

Mehr

A Practical Approach for Reliable Pre-Project Effort Estimation

A Practical Approach for Reliable Pre-Project Effort Estimation A Practical Approach for Reliable Pre-Project Effort Estimation Carl Friedrich Kreß 1, Oliver Hummel 2, Mahmudul Huq 1 1 Cost Xpert AG, Augsburg, Germany {Carl.Friedrich.Kress,Mahmudul.Huq}@CostXpert.de

Mehr

XV1100K(C)/XV1100SK(C)

XV1100K(C)/XV1100SK(C) Lexware Financial Office Premium Handwerk XV1100K(C)/XV1100SK(C) All rights reserverd. Any reprinting or unauthorized use wihout the written permission of Lexware Financial Office Premium Handwerk Corporation,

Mehr

Aber genau deshalb möchte ich Ihre Aufmehrsamkeit darauf lenken und Sie dazu animieren, der Eventualität durch geeignete Gegenmaßnahmen zu begegnen.

Aber genau deshalb möchte ich Ihre Aufmehrsamkeit darauf lenken und Sie dazu animieren, der Eventualität durch geeignete Gegenmaßnahmen zu begegnen. NetWorker - Allgemein Tip 618, Seite 1/5 Das Desaster Recovery (mmrecov) ist evtl. nicht mehr möglich, wenn der Boostrap Save Set auf einem AFTD Volume auf einem (Data Domain) CIFS Share gespeichert ist!

Mehr

Optimizing Request for Quotation Processes at the Volkswagen Pre-Series Center

Optimizing Request for Quotation Processes at the Volkswagen Pre-Series Center Optimizing Request for Quotation Processes at the Volkswagen Pre-Series Center 28 April 2010 / Agenda 1 Pre-series center 2 Project target 3 Process description 4 Realization 5 Review 6 Forecast 28. April

Mehr

Extended Ordered Paired Comparison Models An Application to the Data from Bundesliga Season 2013/14

Extended Ordered Paired Comparison Models An Application to the Data from Bundesliga Season 2013/14 Etended Ordered Paired Comparison Models An Application to the Data from Bundesliga Season 2013/14 Gerhard Tutz & Gunther Schauberger Ludwig-Maimilians-Universität München Akademiestraße 1, 80799 München

Mehr

EEX Kundeninformation 2002-09-11

EEX Kundeninformation 2002-09-11 EEX Kundeninformation 2002-09-11 Terminmarkt Bereitstellung eines Simulations-Hotfixes für Eurex Release 6.0 Aufgrund eines Fehlers in den Release 6.0 Simulations-Kits lässt sich die neue Broadcast-Split-

Mehr

Support Technologies based on Bi-Modal Network Analysis. H. Ulrich Hoppe. Virtuelles Arbeiten und Lernen in projektartigen Netzwerken

Support Technologies based on Bi-Modal Network Analysis. H. Ulrich Hoppe. Virtuelles Arbeiten und Lernen in projektartigen Netzwerken Support Technologies based on Bi-Modal Network Analysis H. Agenda 1. Network analysis short introduction 2. Supporting the development of virtual organizations 3. Supporting the development of compentences

Mehr

Wie agil kann Business Analyse sein?

Wie agil kann Business Analyse sein? Wie agil kann Business Analyse sein? Chapter Meeting Michael Leber 2012-01-24 ANECON Software Design und Beratung G.m.b.H. Alser Str. 4/Hof 1 A-1090 Wien Tel.: +43 1 409 58 90 www.anecon.com office@anecon.com

Mehr

Operational Excellence with Bilfinger Advanced Services Plant management safe and efficient

Operational Excellence with Bilfinger Advanced Services Plant management safe and efficient Bilfinger GreyLogix GmbH Operational Excellence with Bilfinger Advanced Services Plant management safe and efficient Michael Kaiser ACHEMA 2015, Frankfurt am Main 15-19 June 2015 The future manufacturingplant

Mehr

Possible Solutions for Development of Multilevel Pension System in the Republic of Azerbaijan

Possible Solutions for Development of Multilevel Pension System in the Republic of Azerbaijan Possible Solutions for Development of Multilevel Pension System in the Republic of Azerbaijan by Prof. Dr. Heinz-Dietrich Steinmeyer Introduction Multi-level pension systems Different approaches Different

Mehr

Labour law and Consumer protection principles usage in non-state pension system

Labour law and Consumer protection principles usage in non-state pension system Labour law and Consumer protection principles usage in non-state pension system by Prof. Dr. Heinz-Dietrich Steinmeyer General Remarks In private non state pensions systems usually three actors Employer

Mehr

Product Lifecycle Manager

Product Lifecycle Manager Product Lifecycle Manager ATLAS9000 GmbH Landauer Str. - 1 D-68766 Hockenheim +49(0)6205 / 202730 Product Lifecycle Management ATLAS PLM is powerful, economical and based on standard technologies. Directory

Mehr

Disclaimer & Legal Notice. Haftungsausschluss & Impressum

Disclaimer & Legal Notice. Haftungsausschluss & Impressum Disclaimer & Legal Notice Haftungsausschluss & Impressum 1. Disclaimer Limitation of liability for internal content The content of our website has been compiled with meticulous care and to the best of

Mehr

Physics Analysis in ATLAS with PROOF

Physics Analysis in ATLAS with PROOF DPG 2008 Physics Analysis in ATLAS with PROOF Overview 1) Introduction 2) The PROOF Framework 3) Performance Matthias.Schott@cern.ch Johannes.Ebke@physik.uni muenchen.de ATLAS Experiment LMU Munich, Germany

Mehr

MySQL Replikation. Erkan Yanar erkan.yanar@linsenraum.de linsenraum.de 19.11.2013. linsenraum.de

MySQL Replikation. Erkan Yanar erkan.yanar@linsenraum.de linsenraum.de 19.11.2013. linsenraum.de MySQL Replikation Erkan Yanar erkan.yanar@linsenraum.de linsenraum.de linsenraum.de 19.11.2013 Erkan Yanar erkan.yanar@linsenraum.de linsenraum.de (linsenraum.de) MySQL Replikation 19.11.2013 1 / 37 Who

Mehr

Softwareprojekt Mobilkommunikation Abschlusspräsentation. SP Mobilkommunikation (SS09) - Abschlusspräsentation 16.7.2009 1

Softwareprojekt Mobilkommunikation Abschlusspräsentation. SP Mobilkommunikation (SS09) - Abschlusspräsentation 16.7.2009 1 Softwareprojekt Mobilkommunikation Abschlusspräsentation SP Mobilkommunikation (SS09) - Abschlusspräsentation 16.7.2009 1 Overview Introduction / Background (by L. AiQuan) Mobile Phones, Android, Use Cases,...

Mehr

SmartClass Firmware-Update Vorgehensweise

SmartClass Firmware-Update Vorgehensweise Benutzeranweisungen SmartClass Firmware-Update Vorgehensweise 2008.01 (V 1.x.x) Deutsch Please direct all enquiries to your local JDSU sales company. The addresses can be found at: www.jdsu.com/tm-contacts

Mehr

Big-Data and Data-driven Business KMUs und Big Data Imagine bits of tomorrow 2015

Big-Data and Data-driven Business KMUs und Big Data Imagine bits of tomorrow 2015 Big-Data and Data-driven Business KMUs und Big Data Imagine bits of tomorrow 2015 b Wien 08. Juni 2015 Stefanie Lindstaedt, b Know-Center www.know-center.at Know-Center GmbH Know-Center Research Center

Mehr

Open Source Data Center Virtualisierung mit OpenNebula. 05.03.2013 CeBIT 2013. Bernd Erk www.netways.de

Open Source Data Center Virtualisierung mit OpenNebula. 05.03.2013 CeBIT 2013. Bernd Erk www.netways.de Open Source Data Center Virtualisierung mit OpenNebula 05.03.2013 CeBIT 2013 Bernd Erk VORSTELLUNG NETWAYS NETWAYS! Firmengründung 1995! GmbH seit 2001! Open Source seit 1997! 35 Mitarbeiter! Spezialisierung

Mehr

Open Source Data Center Virtualisierung mit OpenNebula. 22.05.2013 LinuxTag Berlin. Bernd Erk www.netways.de

Open Source Data Center Virtualisierung mit OpenNebula. 22.05.2013 LinuxTag Berlin. Bernd Erk www.netways.de Open Source Data Center Virtualisierung mit OpenNebula 22.05.2013 LinuxTag Berlin Bernd Erk VORSTELLUNG NETWAYS NETWAYS! Firmengründung 1995! GmbH seit 2001! Open Source seit 1997! 38 Mitarbeiter! Spezialisierung

Mehr

Mit Legacy-Systemen in die Zukunft. adviion. in die Zukunft. Dr. Roland Schätzle

Mit Legacy-Systemen in die Zukunft. adviion. in die Zukunft. Dr. Roland Schätzle Mit Legacy-Systemen in die Zukunft Dr. Roland Schätzle Der Weg zur Entscheidung 2 Situation Geschäftliche und softwaretechnische Qualität der aktuellen Lösung? Lohnen sich weitere Investitionen? Migration??

Mehr

(Prüfungs-)Aufgaben zum Thema Scheduling

(Prüfungs-)Aufgaben zum Thema Scheduling (Prüfungs-)Aufgaben zum Thema Scheduling 1) Geben Sie die beiden wichtigsten Kriterien bei der Wahl der Größe des Quantums beim Round-Robin-Scheduling an. 2) In welchen Situationen und von welchen (Betriebssystem-)Routinen

Mehr

Supplier Status Report (SSR)

Supplier Status Report (SSR) Supplier Status Report (SSR) Introduction for BOS suppliers BOS GmbH & Co. KG International Headquarters Stuttgart Ernst-Heinkel-Str. 2 D-73760 Ostfildern Management Letter 2 Supplier Status Report sheet

Mehr

Dynamische Programmiersprachen. David Schneider david.schneider@hhu.de STUPS - 25.12.02.50

Dynamische Programmiersprachen. David Schneider david.schneider@hhu.de STUPS - 25.12.02.50 Dynamische Programmiersprachen David Schneider david.schneider@hhu.de STUPS - 25.12.02.50 Organisatorisches Aufbau: Vorlesung 2 SWS Übung Kurzreferat Projekt Prüfung Übung wöchentliches Aufgabenblatt in

Mehr

SONAS Projekt OwnCloud Speicher

SONAS Projekt OwnCloud Speicher SONAS Projekt OwnCloud Speicher ITEK-September 2012 Project Timeline Month August September October November December January February March Year 2012 2012 2012 2012 2012 2013 2013 2013 SONAS General

Mehr

Data Analysis and Simulation of Auto-ID enabled Food Supply Chains based on EPCIS Standard

Data Analysis and Simulation of Auto-ID enabled Food Supply Chains based on EPCIS Standard Data Analysis and Simulation of Auto-ID enabled Food Supply Chains based on EPCIS Standard Rui Wang Technical University of Munich 15. Aug. 2011 fml Lehrstuhl für Fördertechnik Materialfluss Logistik Prof.

Mehr

Perinorm Systemvoraussetzungen ab Version Release 2010

Perinorm Systemvoraussetzungen ab Version Release 2010 Perinorm Systemvoraussetzungen ab Version Release 2010 1. DVD Version - Einzelplatzversion Betriebssystem Unterstützte Betriebssysteme Windows XP, Windows Vista Windows 7 (falls bereits verfügbar) Auf

Mehr

LABOr: Europäisches Knowledge Centre zur beruflichen Ausbildung und Beschäftigung von Menschen mit Lernbehinderungen

LABOr: Europäisches Knowledge Centre zur beruflichen Ausbildung und Beschäftigung von Menschen mit Lernbehinderungen Beschäftigung von Menschen mit Lernbehinderungen EUR/01/C/F/RF-84801 1 Projektinformationen Titel: Projektnummer: LABOr: Europäisches Knowledge Centre zur beruflichen Ausbildung und Beschäftigung von Menschen

Mehr

Challenges and solutions for field device integration in design and maintenance tools

Challenges and solutions for field device integration in design and maintenance tools Integrated Engineering Workshop 1 Challenges and solutions for field device integration in design and maintenance tools Christian Kleindienst, Productmanager Processinstrumentation, Siemens Karlsruhe Wartungstools

Mehr

PART 3: MODELLING BUSINESS PROCESSES EVENT-DRIVEN PROCESS CHAINS (EPC)

PART 3: MODELLING BUSINESS PROCESSES EVENT-DRIVEN PROCESS CHAINS (EPC) Information Management II / ERP: Microsoft Dynamics NAV 2009 Page 1 of 5 PART 3: MODELLING BUSINESS PROCESSES EVENT-DRIVEN PROCESS CHAINS (EPC) Event-driven Process Chains are, in simple terms, some kind

Mehr

Scrum @FH Biel. Scrum Einführung mit «Electronical Newsletter» FH Biel, 12. Januar 2012. Folie 1 12. Januar 2012. Frank Buchli

Scrum @FH Biel. Scrum Einführung mit «Electronical Newsletter» FH Biel, 12. Januar 2012. Folie 1 12. Januar 2012. Frank Buchli Scrum @FH Biel Scrum Einführung mit «Electronical Newsletter» FH Biel, 12. Januar 2012 Folie 1 12. Januar 2012 Frank Buchli Zu meiner Person Frank Buchli MS in Computer Science, Uni Bern 2003 3 Jahre IT

Mehr

Chemical heat storage using Na-leach

Chemical heat storage using Na-leach Hilfe2 Materials Science & Technology Chemical heat storage using Na-leach Robert Weber Empa, Material Science and Technology Building Technologies Laboratory CH 8600 Dübendorf Folie 1 Hilfe2 Diese Folie

Mehr

Andreas Bechter, Regional Product Manager EMEA IMG, Symantec

Andreas Bechter, Regional Product Manager EMEA IMG, Symantec Symantecs Appliance Strategie Andreas Bechter, Regional Product Manager EMEA IMG, Symantec Storage Trends 2011 Symantec Press University 2011 Appliance Strategie 2 Symantecs Appliance Strategie IMG SAMG:

Mehr

Markus BöhmB Account Technology Architect Microsoft Schweiz GmbH

Markus BöhmB Account Technology Architect Microsoft Schweiz GmbH Markus BöhmB Account Technology Architect Microsoft Schweiz GmbH What is a GEVER??? Office Strategy OXBA How we used SharePoint Geschäft Verwaltung Case Management Manage Dossiers Create and Manage Activities

Mehr