Microbenchmarking XQuery

Ähnliche Dokumente
Operator-Kostenmodelle für Fortschrittsschätzung und Opt. Datenbanksystemen

Projektseminar Texttechnologische Informationsmodellierung

Implementierung der XPath-Anfragesprache für XML-Daten in RDBMS unter Ausnutzung des Nummerierungsschemas DLN

Oracle OLAP 11g: Performance für das Oracle Data Warehouse

check_cisco_voice Dokumentation

Tuning von PostGIS mit Read- Only-Daten von OpenStreetMap

Webinar zum Thema Synology DSM 5.2 Features. Referent: Thomas Niedermeier, Web Operations & Knowledge Transfer

AutoSPARQL. Let Users Query Your Knowledge Base

elearning-module Project planning Bestell.Nr.: Kurzbeschreibung Inhaltsverzeichnis des Moduls Project planning

theguard! ApplicationManager (Version 2.4)

Datenbanken und XML Passt das?

Speicherung von XML in (objekt-)relationalen Datenbanken. Burkhard Schäfer

Datenbanksysteme. XML und Datenbanken. Burkhardt Renz. Sommersemester Fachbereich MNI Technische Hochschule Mittelhessen

die wichtigsten Caches (SGA) sind on-the-fly änderbar.

COPPER Best Practices

Website-Suche mit OpenText Web Site Management. Frank Steffen - Senior Product Manager

Performanceanalyse der Artikeldarstellung

Bild Nummer 1: Bild Nummer 2: Seite B 1

PHP Usergroup Berlin. 6. April Ein Leben mit und ohne Magento

XQuery Implementation in a Relational Database System

Query Transformation based on XSLT

Fabian Grimme und Tino Krüger 1 INDREX. Evaluierung von H2O. Enterprise Data Management Beuth Hochschule für Technik

Wie profitiert SAP MaxDB von SSD Technologie?

SQLdetective - Ein günstiges Tool unter die Lupe genommen

Objektorientierte Datenbanken

Suchen und Finden mit Lucene und Solr. Florian Hopf

SQL und MySQL. Kristian Köhntopp

Leistungsanalyse von Rechnersystemen

5. Programmierschnittstellen für XML

Transaction Validation for XML Documents based on XPath

Vorlesung Suchmaschinen Semesterklausur Wintersemester 2013/14

Jens Kupferschmidt Universitätsrechenzentrum

SQL. Fortgeschrittene Konzepte Auszug

GDI-Forum Nordrhein-Westfalen Technischer Workshop 2 - Geodienste INSPIRE-konforme Download-Dienste. Inhalt

Performance Tuning & Scale-Out mit MySQL

Avira AntiVir WebGate 3.2 Release Informationen

Checkliste Systemvoraussetzungen. Systemvoraussetzungen für den Datenbank-Server von MKS Goliath

Datenbanken. 5 Tabellen. Karl Meier karl.meier@kasec.ch Inhalt. Domänen verwenden Tabellen anzeigen, ändern, löschen Übung

KVM Performance Optimierungen auf Hypervisor / Linux Eben

theguard! ApplicationManager Version 3.0

Objekt-relationales Mapping und Performance-Tuning

PostgreSQL im praktischen Einsatz. Stefan Schumacher

Ausgangspunkt. Datenintegration. Ziel. Konflikte. Architekturen. Transparenz

Expose zur Studienarbeit Indizierung von XML-Daten mittels GRIPP

Verzeichnisdienste in heterogenen Systemen

PacketWise Update mit zeitgesteuerter Reset Funktion created by: Rainer Bemsel Version 1.0 Dated: Nov/08/2008

SemTalk Services. SemTalk UserMeeting

Google Spanner. Proseminar Ein-/Ausgabe Stand der Wissenschaft. Hanno Harte. Betreuer: Julian Kunkel

Teil 2-7. Vorlesung. Modul: Programmierung B-PRG Grundlagen der Programmierung II

Uni Duisburg-Essen Fachgebiet Informationssysteme Prof. Dr. N. Fuhr

It's time to rethink Datenbank-Design in der schönen neuen Welt

Java Application 1 Java Application 2. JDBC DriverManager. JDBC-ODBC Br idge. ODBC Driver Manager. Dr iver C. Dr iver D.

Kapitel 33. Der xml-datentyp. In diesem Kapitel: Der xml-datentyp 996 Abfragen aus xml-datentypen 1001 XML-Indizierung 1017 Zusammenfassung 1023

Nachtrag: Farben. Farbblindheit. (Light und Bartlein 2004)

Oracle 10g und SQL Server 2005 ein Vergleich. Thomas Wächtler 39221

Performance Probleme aufspüren

MySQL Performance Tuning für Entwickler

NoSQL & Big Data. NoSQL Databases and Big Data. NoSQL vs SQL DBs. NoSQL DBs - Überblick. Datenorientierte Systemanalyse. Gerhard Wohlgenannt

NoSQL Databases and Big Data

Aggregierungsanfragen in Sensornetzwerken

ArchiveUsers 3. Handbuch NETSEC. 24. Juni NETsec GmbH & Co.KG Schillingsstrasse 117 DE Düren

5. Programmierschnittstellen für XML

Es können nur Werte ausgelesen werden, Es kann -NICHT- geschaltet werden!!

Protokollbeschreibung Modbus TCP für EMU TCP/IP Modul

11 XML Programmierung

Professionelle betriebswirtschaftliche Software. Sage New Classic (5.1) Systemvoraussetzungen

Professionelle betriebswirtschaftliche Software. Sage New Classic (5.0) Systemvoraussetzungen

Daten DeDuplizierung Technik und Nutzen. Kurzübersicht, 12/2008

XML in der Oracle Datenbank "relational and beyond"

PostgreSQL Wartungsstrategien

Download:.../~rieche. gehalten am 2. Februar Stephan Rieche. Vortrag. Thema: Index Selection. von. Seminar Advanced Data Warehouse

PVFS (Parallel Virtual File System)

Allgemeines. veröffentlicht unter lizensiert unter. Creative Commons BY-SA 3.0. XQuery in MS SQL Server 2005

Architektur von Cassandra

Tuning des Weblogic /Oracle Fusion Middleware 11g. Jan-Peter Timmermann Principal Consultant PITSS

Scaling Rails. Jonathan Weiss, Peritor GmbH

Neuerungen in FME Ein Überblick

IKEv1 vs. v2. Wie verändert die Version 2 von IKE das Verhalten? Netzwerksicherheit - Monika Roßmanith CNB, Simon Rich CN

Benchmarking Intel Pentium III-S vs. Intel Pentium 4

Auszug aus Axis2 Übungen

Professionelle betriebswirtschaftliche Software. Sage New Classic 2014 (5.3) Systemvoraussetzungen

Sun StarOffice 9 Deluxe

Java Persistence API 2.x. crud + relationships + jp-ql

Seminar in der Seminarreihe Business Intelligence 1. OLAP und Datawarehousing

Grundlagen der Rechnerarchitektur

Data-Warehouse-Technologien

s in einem lokalen Netzwerk senden mit einem WAGO Controller Anwendungshinweis

Multimedia im Netz Wintersemester 2011/12

Web Data Management Systeme

tf/idf computation Florian Thomas, Christian Reß Map/Reduce Algorithms on Hadoop 6. Juli 2009

Geoproxy Freistaat Thüringen. Dokumentation zur Einbindung des Web Feature Service in GIS-Anwendungen. - ArcGIS von ESRI - Stand:

Hardware- und Softwareanforderungen für die Installation von California.pro

Binäre lineare Optimierung mit K*BMDs p.1/42

INEX. INitiative for the Evaluation of XML Retrieval. Sebastian Rassmann, Christian Michele

Florian Hopf elasticsearch. Bern

Jeffrey Bohn For Your Eyes Only PPI Roadshow 2015

Anleitung für die Installation der advoware Einzelplatzversion

AJAX Implementierung mit Joomla!

Modul Datenbanksysteme 2 Prüfung skizzenhaft SS Aug Name: Note:

CAViT - Kurzvorstellung

Transkript:

Microbenchmarking XQuery DBSeminar HWS 2006 Daniel Rihm <drihm@rumms.uni-mannheim.de> 10. November 2006

Microbenchmarks Ziel ist das Überprüfen der Features: Zeit für das Vorbereiten der Query Zeit für das Ausführen der Query Resourcenverbrauch Korrektheit Vollständigkeit

Featurebasiertes Benchmarking Testet Features des Anfrageauswerters isoliert voneinander Helfen die Feature-Implementation zu testen Unterschiede werden sichtbar die bei Applicationsbenchmarks evtl. verloren gehen

Präzision: Anforderungen Parameter müssen justierbar sein Parameter einzeln untersuchen Ein Feature pro Anfrage Vollständigkeit: Parameter (und deren Einfluss) beschreiben Eine Anfrage pro Feature

Einflussparameter Daten-Parameter Dokumentengröße (Vorsicht!) Dokumenten-Baumtiefe Fan-out Schema und Constraints Query-Parameter Selektivität Anfrageformulierung Ressourcen-Parameter Arbeitsspeicher Prozessorleistung

Struktur des Repository Kategorien Micro-benchmarks Ergebnisse Daten und Datengeneratoren Querygeneratoren

Der Michigan Benchmark

Daten (1) Dokumentengröße = 500MB * SF (für SF {0.1, 1, 10, 100} ) 2 Knotentypen: enest, eoccasional Level Fanout # der Knoten % der Knoten 1 2 1 0.0 2 2 2 0.0 3 2 4 0.0 4 2 8 0.0 5 13 16 0.0 6 13 208 0.0 7 13 2,704 0.4 8 1/13 35,152 4.8 9 2 2,704 0.4 10 2 5,408 0.7 11 2 10,816 1.5 12 2 21,632 3.0 13 2 43,264 6.0 14 2 86,528 11.9 15 2 173,056 23.8 16 0 346,112 47.6

Daten (2) Attribute: aunique1 aunique2 alevel Nummer des Knotens im Baum (breadthfirst) zufälliges (deterministisches) Integer Tiefe des Knoten afour aunique2 mod 4 asixteen aunique1 + aunique2 mod 16 asixtyfour aunique2 mod 64 astring String mit durchschnittlicher Länge von 32 Bytes Inhalt der Knoten besteht aus generiertem Text welcher sich an der englischen Sprache orientiert. Wahrscheinlichkeit für eoccasional Sohn: 1/64

Anfragen 46 Anfragen 4 Returned Structure (QR1-QR4) 12 Simple Selection (QS1-QS12) 21 Structural Selection (QS15-QS35) 2 Value-Based Join (QJ1, QJ2) 2 Pointer-Based Join (QJ3, QJ4) 5 Aggregation (QA1, QA2, QA4-QA6)

Ausführung System AMD Athlon XP 2600+ 515940 kb of RAM Linux version 2.6.15. Engines Galax Version 0.5 MonetDB/XQuery Server-Version 4.16, XQuery-Version 0.12 SaxonB Version 8.8 Laufzeit 52:06:00 (hh:mm:ss)

Übersicht Alle Queries 100000 XCheck output (data analysis phase), Experiment: mbench, Document: d0.1 (46.69 MB) Galax MonetDB SaxonB Log Total execution time (sec) 10000 1000 100 10 QR1 QS1 QS15 Query QJ1 QA1

Anfrage QS12 for $e in doc()//enest where contains(string($e), "oneb4") return <enest aunique1="{$e/@aunique1}"></enest> 100 80 XCheck output (data analysis phase), Experiment: mbench, Query: QS12 Galax MonetDB SaxonB Total execution time (sec) 60 40 20 0 d0.1 46.69 MB Document

Anfrage QA4 <maxfanout aunique1 = "{ for $e in doc()//enest[@alevel = 11] return for $p in doc()//enest[@alevel = 11] where count($e/enest) = max(count($p/enest)) return $e/@aunique1 }"></maxfanout> XCheck output (data analysis phase), Experiment: mbench, Query: QA4 4000 Galax SaxonB 3500 3000 Total execution time (sec) 2500 2000 1500 1000 500 0 d0.1 46.69 MB Document

Anfrage QA4b <maxfanout aunique1 = "{ for $e in doc()//enest[@alevel = 11] let $maxfan := fn:max( for $p in doc()//enest[@alevel = 11] return count($p/enest) ) where count($e/enest) = $maxfan return $e/@aunique1 }"></maxfanout> XCheck output (data analysis phase), Experiment: qa4, Document: d0.1 (46.69 MB) 90 Galax SaxonB 80 70 Total execution time (sec) 60 50 40 30 20 10 0 QA4b Query

+ Sehr ausführlich für einige Aspekte + Dokumentstruktur gut gewählt + Selektivitäten wurden angegeben - Viele XQuery Features werden nicht getestet - Stellenweise fehlerhaft