1. Einleitung. 1 1Exabyte=10 18 Bytes = Bytes
|
|
- Karlheinz Beutel
- vor 6 Jahren
- Abrufe
Transkript
1 1. Einleitung Das aktuelle Jahrzehnt wird als Zeitalter der Daten bezeichnet [Whi09, S. 1]. Die Menge der weltweit existierenden Daten ist in den letzten Jahren stark angewachsen. Eine Studie des amerikanischen Marktforschungsunternehmens IDC (International Data Corporation) prognostiziert, dass das Digitale Universum in der Zeit von 2005 bis 2020 von 130 Exabytes 1 auf Exabytes anwachsen wird [GR12]. Pro Kopf würden im Jahr 2020 somit ca Gigabyte Daten gespeichert. Diese Menge an Daten stellt eine große Herausforderung für Datenbankmanagementsysteme (DBMS) und Hardware dar. Um die wachsenden Datenmengen verwalten zu können, entstanden in den letzten Jahren neue, auf den Umgang mit großen Datenmengen spezialisierte, DBMS. Diese Systeme werden umgangssprachlich als Big-Data Systems bezeichnet. Sie brechen bewusst mit den Strukturen klassischer DBMS und verzichten auf Funktionen wie Transaktionsmanagement oder SQL als Abfragesprache. DBMS, welche auf SQL verzichten, werden als NoSQL-Datenbanken bezeichnet. Durch den Funktionsverzicht skalieren Big-Data Systems oft besser als traditionelle DBMS. Auch ist die ständige Integrität der Daten nicht oberstes Gebot. Um Skalierbarkeit und Verfügbarkeit zu bieten, werden meist die Dienste von mehreren physikalischen Systemen in Anspruch genommen. Es handelt sich somit um verteilte Systeme. Viele gängige NoSQL-Datenbanken stellen sich dem Anwender gegenüber als Key-Value-Store dar. Daten werden mit Hilfe eines Schlüssels (Key) identifiziert; als Werte (Value) können meist beliebige Daten abgelegt werden. Vorgefertigte Funktionen und Algorithmen um Daten auszuwerten, existieren in der Regel nicht. Funktionen wie Selektionen oder Joins müssen wiederholt durch Programmierer realisiert werden. Das wiederholte Implementieren von Funktionen für die Datenauswertung macht die Arbeit mit Key-Value-Stores umständlich. Im Gegensatz zu Key-Value-Stores besitzen traditionelle DBMS (relationale DBMS) mit SQL eine mächtige Abfragesprache. Diese erlaubt die 1 1Exabyte=10 18 Bytes = Bytes J. K. Nidzwetzki, Entwicklung eines skalierbaren und verteilten Datenbanksystems, BestMasters, DOI / _1, Springer Fachmedien Wiesbaden 2016
2 2 1. Einleitung Auswertung eines Datenbestandes mittels vordefinierter Funktionen. Für den Anwender sind diese DBMS deutlich einfacher zu benutzen. In SQL muss er nur formulieren, wie ein Ergebnis aussehen soll. Wie dieses berechnet wird, bleibt verborgen. Nach einer anfänglichen Euphorie über die Einfachheit von Key-Value-Stores, kommt verstärkt der Wunsch auf, Funktionen für die Auswertung von Daten direkt vom DBMS bereitstellen zu lassen. So setzt die Firma Google Inc. für viele Neuentwicklungen wieder DBMS ein, welche sich mit einer Abfragesprache ansprechen lassen (wie z. B. Google F1 [SVS + 13]). Das wiederholte Implementieren von Funktionen für die Datenauswertung entfällt somit. Auch relationale DBMS können über mehrere Systeme verteilt werden. Aufgrund ihres Aufbaus ist Skalierbarkeit und ständige Verfügbarkeit nur schwer zu erreichen. Wünschenswert ist ein System, welches die Skalierbarkeit und Verfügbarkeit von NoSQL-Datenbanken mit den Möglichkeiten zur einfachen Datenauswertung von relationalen DBMS kombiniert Ziele dieser Arbeit Die vorliegende Arbeit behandelt drei Themen aus dem Bereich der Big- Data Systems: (i) Verarbeitung von Datenströmen, (ii) hochverfügbare und skalierbare Datenhaltung und (iii) verteilte Abfrageauswertung. Das Zusammenspiel dieser drei Komponenten ist in Abbildung 1.1 aufgezeigt. Datenstrom Loadbalancer Secondo 1-1 Secondo 1-2 E A B Secondo 2-1 Secondo 2-2 Secondo 1-N D C Secondo 2-N Teil 1: Verarbeitung von Datenströmen Cassandra Teil 2: Hochverfügbare und skalierbare Datenhaltung Teil 3: Verteilte Abfrageauswertung Abbildung 1.1.: Zusammenspiel der in dieser Arbeit behandelten Komponenten.
3 1.2. Aufbau dieser Arbeit 3 Der erste Teil der Arbeit geht der Frage nach, wie sich große Datenströme verarbeiten lassen. Ein besonderes Augenmerk liegt hierbei auf der Verteilung von Datenströmen über mehrere Systeme mit Hilfe eines Loadbalancers. Jedes System muss durch die Aufteilung des Datenstroms nur einen Teil der gesamten Daten verarbeiten. Der Loadbalancer besitzt verschiedene Strategien, einen Datenstrom zu verteilen und mit Ausfällen von Systemen umzugehen. Das an der FernUniversität in Hagen entwickelte DBMS Secondo wurde um die Möglichkeit erweitert, Datenströme von einem Netzwerksocket zu lesen und in einen Tupelstrom umzuwandeln. Hierzu wurde der bereits vorhandene Operator csvimport angepasst. Im zweiten Teil der Arbeit wird beschrieben, wie sich eine relationale Datenbank und eine NoSQL-Datenbank zu einem Datenbank-Hybriden kombinieren lassen. Ziel hierbei ist es, die Skalierbarkeit und die Hochverfügbarkeit einer NoSQL-Datenbank auf die relationale Datenbank zu übertragen und weiterhin die mächtigen Operatoren der relationalen Datenbank nutzen zu können. Die NoSQL-Datenbank übernimmt dabei die Speicherung der Daten; die relationale Datenbank ist für die Auswertung der Daten zuständig. Als NoSQL- Datenbank wird Apache Cassandra eingesetzt. Secondo nimmt die Rolle der relationalen Datenbank ein. Zur Kopplung von Secondo mit Apache Cassandra wurde eine Algebra entwickelt. Diese Algebra stellt Operatoren wie cspread, ccollect, clist und cdelete für den Datenaustausch mit Cassandra bereit. Der dritte Teil der Arbeit untersucht, wie sich eine verteilte und robuste Abfrageauswertung mit dem Datenbank-Hybriden realisieren lässt. Hierzu wurde ein System mit dem Namen Distributed Secondo entwickelt. Dieses erlaubt es, Datenbankabfragen über mehrere Systeme hinweg zu verteilen und die Ausführung zu überwachen. Zudem besitzt Distributed Secondo die Fähigkeit, mit dem Ausfall von Systemen umzugehen Aufbau dieser Arbeit Diese Arbeit ist in acht Kapitel gegliedert. Im folgenden Kapitel werden die Grundlagen von verteilten DBMS und deren Technologien beschrie-
4 4 1. Einleitung ben. In Kapitel drei wird die Verarbeitung von Datenströmen behandelt. In den Kapiteln vier bis sieben wird das entwickelte System zur Kopplung von Secondo mit Apache Cassandra vorgestellt und experimentell untersucht. Das letzte Kapitel enthält eine Zusammenfassung sowie einen Ausblick auf mögliche Erweiterungen dieser Arbeit. Abgeschlossen wird die Arbeit durch einen Anhang, in welchem neben Quellcode und Mitschriften von Experimenten auch eine Einführung in Cassandra enthalten ist. Kapitel 2: Dieses Kapitel gibt eine Übersicht über die Funktionsweise verteilter DBMS. Ebenso werden Technologien wie Map-Reduce, Parallel Secondo und Systeme zur Stromverarbeitung vorgestellt. Zudem werden in diesem Kapitel Begriffe wie Scaleup und Speedup definiert und erläutert. Kapitel 3: Welche Möglichkeiten die im Rahmen dieser Arbeit entwickelten Komponenten bereitstellen, um Tupelströme zu verteilen und zu verarbeiten, wird in diesem Kapitel vorgestellt. Dabei wird auf einen Loadbalancer, einen Lastgenerator sowie den Operator csvimport eingegangen. Kapitel 4: In diesem Kapitel wird eine Algebra vorgestellt, welche Secondo um die Möglichkeiten erweitert, mit Cassandra zu interagieren. Zudem werden in diesem Kapitel einige Konzepte der Implementation dieser Algebra beschrieben. Auch wird auf zwei Hilfsoperatoren (delay und statistics) eingegangen. Diese Operatoren werden für die in Kapitel 7 durchgeführten Experimente benötigt. Kapitel 5: Die verteilte Auswertung von Abfragen wird in diesem Kapitel behandelt. Es wird zunächst an einem einfachen Beispiel gezeigt, wie Abfragen parallel verarbeitet werden können und welche Probleme dabei gelöst werden müssen. Anschließend wird der Aufbau von Distributed Secondo vorgestellt und es wird beschrieben, wie die ermittelten Probleme von diesem System gelöst werden. Kapitel 6: Dieser Abschnitt stellt exemplarisch drei Anwendungsmöglichkeiten für die entwickelten Komponenten vor. Es wird darauf eingegangen, wie sich Datenströme verschiedener Anwendungsfälle aufzeichnen und durch Distributed Secondo auswerten lassen. Zudem wird der Algorithmus»Partition based spatial merge join«parallelisiert.
5 1.2. Aufbau dieser Arbeit 5 Kapitel 7: In diesem Kapitel sind verschiedene Experimente beschrieben, welche die Leistungsfähigkeit der entwickelten Komponenten untersuchen. Es wurden zudem Experimente durchgeführt, um das Verhalten von Cassandra und der verwendeten Hardware zu untersuchen. Auch ein experimenteller Vergleich mit Parallel Secondo ist in diesem Kapitel enthalten. Kapitel 8: Das letzte Kapitel beinhaltet eine Zusammenfassung der Arbeit. Zudem wird ein Ausblick auf mögliche Erweiterungen und Verbesserungen gegeben. Anhang: Im Anhang finden sich Quellcodes sowie Scripte zu den vorgestellten Programmen. Hinzu kommen Mitschriften von Experimenten sowie Anleitungen die vorgestellte Software zu installieren. Zudem findet sich im Abschnitt F eine Seminararbeit, welche die Grundlagen der Software Apache Cassandra vorstellt. Auf den letzten Seiten der Arbeit befinden sich das Listing- und das Literaturverzeichnis. Hinweis: Sollten dem Leser die Grundlagen von Cassandra nicht geläufig sein, so wird empfohlen, die in Abschnitt F enthaltene Seminararbeit vor dem Lesen von Abschnitt 2.7 durchzusehen. Ab Abschnitt 2.7 werden einige der dort beschriebenen Konzepte als bekannt vorausgesetzt.
6
ISBN: 978-3-8428-0679-5 Herstellung: Diplomica Verlag GmbH, Hamburg, 2011
Nils Petersohn Vergleich und Evaluation zwischen modernen und traditionellen Datenbankkonzepten unter den Gesichtspunkten Skalierung, Abfragemöglichkeit und Konsistenz Diplomica Verlag Nils Petersohn Vergleich
MehrFachpraktikum Erweiterbare Datenbanksysteme im WS 2015/16. Aufgabe 4 der Phase 2. Anfrageoptimierung für verteilte Datenbanken
Fachpraktiku Erweiterbare Datenbanksystee i WS 2015/16 Aufgabe 4 der Phase 2 Anfrageoptiierung für verteilte Datenbanken auf Basis der Distributed Algebra Ralf Hartut Güting, Thoas Behr, Fabio Valdés,
MehrNeue Studie zum digitalen Universum entdeckt Big Data Gap
13. Dezember 2012 Neue Studie zum digitalen Universum entdeckt Big Data Gap Big Data Gap 23 Prozent (643 Exabyte) des digitalen Universums könnten nützliche Erkenntnisse bringen. Derzeit sind nur drei
MehrANALYTICS, RISK MANAGEMENT & FINANCE ARCHITECTURE. NoSQL Datenbanksysteme Übersicht, Abgrenzung & Charakteristik
ARFA ANALYTICS, RISK MANAGEMENT & FINANCE ARCHITECTURE NoSQL Datenbanksysteme Übersicht, Abgrenzung & Charakteristik Ralf Leipner Domain Architect Analytics, Risk Management & Finance 33. Berner Architekten
MehrBig Data Informationen neu gelebt
Seminarunterlage Version: 1.01 Copyright Version 1.01 vom 21. Mai 2015 Dieses Dokument wird durch die veröffentlicht. Copyright. Alle Rechte vorbehalten. Alle Produkt- und Dienstleistungs-Bezeichnungen
MehrWide Column Stores. Felix Bruckner Mannheim, 15.06.2012
Wide Column Stores Felix Bruckner Mannheim, 15.06.2012 Agenda Einführung Motivation Grundlagen NoSQL Grundlagen Wide Column Stores Anwendungsfälle Datenmodell Technik Wide Column Stores & Cloud Computing
MehrNoSQL & Big Data. NoSQL Databases and Big Data. NoSQL vs SQL DBs. NoSQL DBs - Überblick. Datenorientierte Systemanalyse. Gerhard Wohlgenannt
NoSQL & Big Data Datenorientierte Systemanalyse NoSQL Databases and Big Data Gerhard Wohlgenannt Die besprochenen Systeme haben nicht den Anspruch und das Ziel DBS zu ersetzen, sondern für gewisse Anwendungsfälle
MehrNoSQL Databases and Big Data
Datenorientierte Systemanalyse NoSQL Databases and Big Data Gerhard Wohlgenannt NoSQL & Big Data Die besprochenen Systeme haben nicht den Anspruch und das Ziel DBS zu ersetzen, sondern für gewisse Anwendungsfälle
MehrGrundlagen relationaler Datenbanken... 2. Access 2010 - Grundlagenseminar... 3. Access 2010 - Aufbauseminar... 4. Von Excel 2010 zu Access 2010...
Inhalt Grundlagen relationaler Datenbanken... 2 Access 2010 - Grundlagenseminar... 3 Access 2010 - Aufbauseminar... 4 Von Excel 2010 zu Access 2010... 5 Access 2010 - Programmierung Teil 1... 6 Access
MehrIndustrie 4.0 und Smart Data
Industrie 4.0 und Smart Data Herausforderungen für die IT-Infrastruktur bei der Auswertung großer heterogener Datenmengen Richard Göbel Inhalt Industrie 4.0 - Was ist das? Was ist neu? Herausforderungen
Mehranwendungen programmieren Datenbank entwerfen & Implementierung Analyse bis zur SQL- NoSQL-Datenbanken Uwe Klug Mit einer Einführung in 2.
Uwe Klug Datenbank anwendungen entwerfen & programmieren Von der objektorientierten Analyse bis zur SQL- Implementierung Mit einer Einführung in NoSQL-Datenbanken 2. Auflage W3L-Verlag Herdecke Witten
MehrBig Data und Oracle bringen die Logistik in Bewegung
OPITZ CONSULTING Deutschland GmbH Dortmund, 07.05.2014 Bild-Quelle: Web-Seite von Pasta ZARA, Big Artikel Data So und entstehen Oracle bringen unsere die Nudeln Logistik in Bewegung http://de.pastazara.com/so-entstehen-unsere-nudeln
MehrOracle Big Data Technologien Ein Überblick
Oracle Big Data Technologien Ein Überblick Jürgen Vester Oracle Deutschland B.V. & Co KG Um was geht es bei Big Data? Bei Big Data sprechen wir eine Klasse von Daten an, die in der
MehrOracle Fusion Middleware Überwachung mit Oracle BAM
Oracle Fusion Middleware Überwachung mit Oracle BAM Schlüsselworte Monitoring, BAM, Fusion Middleware Einleitung Markus Lohn esentri AG Ettlingen Oracle BAM wird vor allem für das fachliche Überwachen
MehrProf. Dr.-Ing. Rainer Schmidt 1
Prof. Dr.-Ing. Rainer Schmidt 1 Business Analytics und Big Data sind Thema vieler Veröffentlichungen. Big Data wird immer häufiger bei Google als Suchbegriff verwendet. Prof. Dr.-Ing. Rainer Schmidt 2
MehrAdministering Microsoft SQL Server Databases
Administering Microsoft SQL Server Databases Dauer: 5 Tage Kursnummer: M20462 Überblick: Im Rahmen dieses fünftägigen Kurses vermitteln wir Ihnen das nötige Know-How und die notwendigen Fertigkeiten, um
MehrIn diesem Abschnitt wollen wir uns mit der Architektur von Datenbank Managements Systemen beschäftigen.
1 In diesem Abschnitt wollen wir uns mit der Architektur von Datenbank Managements Systemen beschäftigen. Zunächst stellt sich die Frage: Warum soll ich mich mit der Architektur eines DBMS beschäftigen?
MehrMapReduce und Datenbanken Thema 15: Strom bzw. Onlineverarbeitung mit MapReduce
MapReduce Jan Kristof Nidzwetzki MapReduce 1 / 17 Übersicht 1 Begriffe 2 Verschiedene Arbeiten 3 Ziele 4 DEDUCE: at the intersection of MapReduce and stream processing Beispiel 5 Beyond online aggregation:
MehrHadoop. Eine Open-Source-Implementierung von MapReduce und BigTable. von Philipp Kemkes
Hadoop Eine Open-Source-Implementierung von MapReduce und BigTable von Philipp Kemkes Hadoop Framework für skalierbare, verteilt arbeitende Software Zur Verarbeitung großer Datenmengen (Terra- bis Petabyte)
MehrEinführung. Kapitel 1 2 / 508
Kapitel 1 Einführung 2 / 508 Einführung Was ist ein Datenbanksystem (DBS)? Ein System zum Speichern und Verwalten von Daten. Warum kein herkömmliches Dateisystem verwenden? Ausfallsicherheit und Skalierbarkeit
MehrSystemanforderungen Manufacturing Execution System fabmes
Manufacturing Execution System fabmes Das Manufacturing Execution System fabmes bemüht sich trotz hoher Anforderungen an die Datenverarbeitung möglichst geringe Anforderungen an die Hardware zu stellen.
MehrSQL on Hadoop für praktikables BI auf Big Data.! Hans-Peter Zorn und Dr. Dominik Benz, Inovex Gmbh
SQL on Hadoop für praktikables BI auf Big Data! Hans-Peter Zorn und Dr. Dominik Benz, Inovex Gmbh War nicht BigData das gleiche NoSQL? 2 Wie viele SQL Lösungen für Hadoop gibt es mittlerweile? 3 ! No SQL!?
MehrVon Big Data zu Deep Insights
Von Big Data zu Deep Insights Prof. Dr. Dirk Nowotka Christian-Albrechts-Universität zu Kiel Maritime IT 2013 Big Data = Überwachung + Marketing? Kommunikations- und Kundendaten XKeyScore, Google Ads,
MehrBig Data in der Forschung
Big Data in der Forschung Dominik Friedrich RWTH Aachen Rechen- und Kommunikationszentrum (RZ) Gartner Hype Cycle July 2011 Folie 2 Was ist Big Data? Was wird unter Big Data verstanden Datensätze, die
MehrFachPraktikum 1590 Erweiterbare Datenbanksysteme. Aufgaben Phase 1
FachPraktikum 1590 Erweiterbare Datenbanksysteme Aufgaben Phase 1 Wintersemester 2004/2005 Ralf Hartmut Güting, Dirk Ansorge, Thomas Behr, Markus Spiekermann Praktische Informatik IV, Fernuniversität Hagen
MehrDatenbanksysteme Kapitel 6: Neue Konzepte der Datenbanktechnologie
Datenbanksysteme Kapitel 6: Neue Konzepte der Datenbanktechnologie Prof. Dr. Peter Chamoni Mercator School of Management Lehrstuhl für Wirtschaftsinformatik, insb. Business Intelligence Prof. Dr. Peter
MehrMicrosoft ISA Server 2004
Microsoft ISA Server 2004 Marcel Zehner Leitfaden für Installation, Einrichtung und Wartung ISBN 3-446-40597-6 Leseprobe Weitere Informationen oder Bestellungen unter http://www.hanser.de/3-446-40597-6
Mehr2.1 Definition und Aufgaben. 2.2 Datenbank-Grundsätze
2 Allgemeines über Datenbanken Dieses Kapitel dient als Einstieg in die Datenbanken. Es wird beschrieben, welche Funktionen zu einer Datenbank gehören und welche Werkzeuge eine Datenbank aufweisen sollte.
MehrFull Text Search in Databases
Full Text Search in Databases Verfasser: Stefan Kainrath (0651066) h0651066@wu-wien.ac.at 0664/1327136 Betreuer: Dipl.-Ing. Mag. Dr. Albert Weichselbraun Inhaltsverzeichnis 1 Motivation... 3 2 Anforderungen...
MehrBIG DATA HYPE ODER CHANCE
BIG DATA HYPE ODER CHANCE 1 Fuchs Dominik 16.05.2014 Fahrplan 2 Begriff Big Data Die 3 V s Fallbeispiel Google Was? Wie? Womit? Fazit & Ausblick in die Zukunft Der Begriff Big Data 3 Datenmengen, die zu
MehrMOC 2195 Windows Server 2003: Planen, Implementieren und Warten einer Active Directory- Infrastruktur
MOC 2195 Windows Server 2003: Planen, Implementieren und Warten einer Active Directory- Infrastruktur Unterrichtseinheit 1: Einführung in die Infrastruktur von Active Directory Diese Unterrichtseinheit
MehrApache HBase. A BigTable Column Store on top of Hadoop
Apache HBase A BigTable Column Store on top of Hadoop Ich bin... Mitch Köhler Selbstständig seit 2010 Tätig als Softwareentwickler Softwarearchitekt Student an der OVGU seit Oktober 2011 Schwerpunkte Client/Server,
MehrA Big Data Change Detection System. Carsten Lanquillon und Sigurd Schacht
A Big Data Change Detection System Carsten Lanquillon und Sigurd Schacht Digitale Transformation in Unternehmen u Umfassende Erfassung, Speicherung und Verfügbarkeit von Daten à Big Data Quelle: Rolland
MehrIBM SPSS Data Access Pack Installationsanweisungen für Linux
IBM SPSS Data Access Pack Installationsanweisungen für Linux Inhaltsverzeichnis Kapitel 1. Übersicht.......... 1 Einführung............... 1 Einsetzen einer Datenzugriffstechnologie..... 1 ODBC-Datenquelle...........
MehrDatenbankbasierte Lösungen
Technologische Beiträge für verteilte GIS - Anforderungen an verteilte GIS und Lösungsansätze Datenbankbasierte Lösungen Johannes Kebeck Senior Systemberater ORACLE Deutschland GmbH Agenda TOP Thema 1
MehrMöglichkeiten für bestehende Systeme
Möglichkeiten für bestehende Systeme Marko Filler Bitterfeld, 27.08.2015 2015 GISA GmbH Leipziger Chaussee 191 a 06112 Halle (Saale) www.gisa.de Agenda Gegenüberstellung Data Warehouse Big Data Einsatz-
MehrLehrveranstaltung DB "Datenmodellierung und Datenbanksysteme" im Wintersemester 2013/2014
HTW Berlin Prof. Dr. Zschockelt Datenmodellierung/Datenbanken (01)Einführung DMDB.ppt Folie 1 Lehrveranstaltung DB "Datenmodellierung und Datenbanksysteme" im Wintersemester 2013/2014 Die Lehrveranstaltung
MehrDatenbanken 16.1.2008. Die Entwicklung der Datenbanksysteme ist eng an die der Hardware gekoppelt und wird wie jene in Generationen eingeteilt:
Datenbanksysteme Entwicklung der Datenbanksysteme Die Entwicklung der Datenbanksysteme ist eng an die der Hardware gekoppelt und wird wie jene in Generationen eingeteilt: 1. Generation: In den fünfziger
MehrBig & Smart Data. bernard.bekavac@htwchur.ch
Big & Smart Data Prof. Dr. Bernard Bekavac Schweizerisches Institut für Informationswissenschaft SII Studienleiter Bachelor of Science in Information Science bernard.bekavac@htwchur.ch Quiz An welchem
MehrIm Fall einer Personaldatenbank würde eine Relation beispielsweise wie folgt aussehen:
Grundwissen zu relationalen Datenbanken Die Funktion einer relationalen Dankbank besteht in der elektronischen Verwaltung von Daten in Computersystemen. Die Basis für relationale Datenbanken bildet das
Mehr1. Einführung. Datenbanken Grundlagen
1. Einführung Datenbanken Grundlagen Wo finden wir Datenbanken? Was sind Datenbanken/ Datenbankensysteme(DBS)? A collection of related data items mit folgenden Eigenschaften: Eine Datebank repräsentiert
MehrBIG UNIVERSITÄTSRECHENZENTRUM
UNIVERSITÄTS RECHENZENTRUM LEIPZIG BIG DATA @ UNIVERSITÄTSRECHENZENTRUM Forschung und Entwicklung Entwicklung eines E-Science-Angebots für die Forschenden an der Universität Leipzig Stefan Kühne Axel Ngonga
MehrData Mining und Machine Learning
Data Mining und Machine Learning Teil 7: Verteiltes Rechnen mit Map Reduce Dr. Harald König, FHDW Hannover 30. November 2015 Inhalt 1 Verteiltes Rechnen 2 Map Reduce 3 Anwendungen 4 Map Reduce: Weiterführende
MehrDatenbanken und SQL. Springer Vieweg. Eine praxisorientierte Einführung mit Anwendungen in Oracle, SQL Server und MySQL.
Edwin Schicker Datenbanken und SQL Eine praxisorientierte Einführung mit Anwendungen in Oracle, SQL Server und MySQL 4., überarbeitete Auflage Springer Vieweg Inhaltsverzeichnis 1 Übersicht über Datenbanken
Mehr"FlexRIO hat sich als ideale Basis für den Test schneller Kommunikationsschnittstellen erwiesen." - Michael Rost, IRS Systementwicklung GmbH
Test von Glasfaserkommunikation bis zu 2,5 Gbit/s auf Basis von NI FlexRIO "FlexRIO hat sich als ideale Basis für den Test schneller Kommunikationsschnittstellen erwiesen." - Michael Rost, IRS Systementwicklung
MehrOracle Big Data Technologien Ein Überblick
Oracle Big Data Technologien Ein Überblick Ralf Lange Global ISV & OEM Sales NoSQL: Eine kurze Geschichte Internet-Boom: Erste Ansätze selbstgebauter "Datenbanken" Google stellt "MapReduce"
MehrKapitel 33. Der xml-datentyp. In diesem Kapitel: Der xml-datentyp 996 Abfragen aus xml-datentypen 1001 XML-Indizierung 1017 Zusammenfassung 1023
Kapitel 33 Der xml-datentyp In diesem Kapitel: Der xml-datentyp 996 Abfragen aus xml-datentypen 1001 XML-Indizierung 1017 Zusammenfassung 1023 995 996 Kapitel 33: Der xml-datentyp Eine der wichtigsten
MehrOra Education GmbH. Lehrgang: Oracle Application Server 10g R2: Administration II
Ora Education GmbH www.oraeducation.de info@oraeducation.de Lehrgang: Oracle Application Server 10g R2: Administration II Beschreibung: Die Teilnehmer lernen verschiedene Topologien des Oracle Application
MehrBig Data Mythen und Fakten
Big Data Mythen und Fakten Mario Meir-Huber Research Analyst, IDC Copyright IDC. Reproduction is forbidden unless authorized. All rights reserved. About me Research Analyst @ IDC Author verschiedener IT-Fachbücher
MehrAnalyse und Auswertung großer heterogener Datenmengen
Analyse und Auswertung großer heterogener Datenmengen Herausforderungen für die IT-Infrastruktur Richard Göbel Inhalt Big Data Was ist das eigentlich? Was nützt mir das? Wie lassen sich solche großen Datenmengen
MehrBig Data und SQL - das passt! Philipp Loer ORDIX AG Paderborn
Schlüsselworte Hadoop, Hive, Sqoop, SQL Big Data und SQL - das passt! Philipp Loer ORDIX AG Paderborn Einleitung In diesem Vortrag werden, nach einer kurzen Einführung in Apache Hadoop, die beiden Werkzeuge
MehrApache Hadoop. Distribute your data and your application. Bernd Fondermann freier Software Architekt bernd.fondermann@brainlounge.de berndf@apache.
Apache Hadoop Distribute your data and your application Bernd Fondermann freier Software Architekt bernd.fondermann@brainlounge.de berndf@apache.org Apache The Apache Software Foundation Community und
MehrDie Technologie- Landschaft für Big-Data-Analyse
Die Technologie- Landschaft für Big-Data-Analyse Die Verwaltung großer Datenmengen wird durch neue Technologien einfacher und vor allem preiswerter. Dadurch ergeben sich nicht nur eine bessere Kosteneffizienz,
MehrWeb Technologien NoSQL Datenbanken
Web Technologien NoSQL Datenbanken Univ.-Prof. Dr.-Ing. Wolfgang Maass Chair in Information and Service Systems Department of Law and Economics WS 2011/2012 Wednesdays, 8:00 10:00 a.m. Room HS 021, B4
MehrNoSQL. Einblick in die Welt nicht-relationaler Datenbanken. Christoph Föhrdes. UnFUG, SS10 17.06.2010
NoSQL Einblick in die Welt nicht-relationaler Datenbanken Christoph Föhrdes UnFUG, SS10 17.06.2010 About me Christoph Föhrdes AIB Semester 7 IRC: cfo #unfug@irc.ghb.fh-furtwangen.de netblox GbR (http://netblox.de)
MehrIUG DRESDEN ERSTELLUNG VON ROBUSTEN NATURAL SERVICES Software AG. All rights reserved. For internal use only
IUG DRESDEN ERSTELLUNG VON ROBUSTEN NATURAL SERVICES 2016 Software AG. All rights reserved. For internal use only DIGITAL BUSINESS APPLICATIONS DRIVE THE DIGITAL BUSINESS Partner Lieferanten Kunden SaaS
MehrDefinition Informationssystem
Definition Informationssystem Informationssysteme (IS) sind soziotechnische Systeme, die menschliche und maschinelle Komponenten umfassen. Sie unterstützen die Sammlung, Verarbeitung, Bereitstellung, Kommunikation
MehrEntwurf und Verarbeitung relationaler Datenbanken
Entwurf und Verarbeitung relationaler Datenbanken Eine durchgängige und praxisorientierte Vorgehens weise von Prof. Dr. Nikolai Preiß Berufsakademie Stuttgart R. Oldenbourg Verlag München Wien Inhalt Abbildungsverzeichnis
MehrOperational Big Data effektiv nutzen TIBCO LogLogic. Martin Ulmer, Tibco LogLogic Deutschland
Operational Big Data effektiv nutzen TIBCO LogLogic Martin Ulmer, Tibco LogLogic Deutschland LOGS HINTERLASSEN SPUREN? Wer hat wann was gemacht Halten wir interne und externe IT Richtlinien ein Ist die
MehrVorwort zur 5. Auflage... 15 Über den Autor... 16
Vorwort zur 5. Auflage...................................... 15 Über den Autor............................................ 16 Teil I Grundlagen.............................................. 17 1 Einführung
MehrSimpleVOC-Yetanother. Bausteine für eine Key/Value- Datenbank
SimpleVOC-Yetanother Memcached? Bausteine für eine Key/Value- Datenbank SimpleVOC Yet another memcached? Bausteine für eine Key/Value Datenbank. Theorie (Martin Schönert) Praxis (Frank Celler) Eine Weisheit
MehrAPEX: verteiltes und mobiles Arbeiten
APEX: verteiltes und mobiles Arbeiten von Thomas Hernando ww w. syn t egris.de Unternehmen und Referent REFERENT Thomas Hernando IT-Berater und Anwendungsentwickler Seit 2012 im Unternehmen Schwerpunkte
MehrNoSQL-Databases. Präsentation für Advanced Seminar "Computer Engineering", Matthias Hauck, matthias.hauck@stud.uni-heidelberg.de
NoSQL-Databases Präsentation für Advanced Seminar "Computer Engineering", Matthias Hauck, matthias.hauck@stud.uni-heidelberg.de Klassische SQL-Datenbanken Anwendungsgebiet: Geschäftsanwendungen Behördenanwendungen
MehrModul. Lehrveranstaltung. Betriebssysteme, Rechnerarchitekturen. EDV-Nr: 00000 Prüfungsvorl.: PA Prüfungsleist.: K90 Dozent: ra,ri,pt ECTS 10
IT1 Informationstechnik 1 Prüfungsvorl.: PA Prüfungsleist.: K90 ra,ri,pt Modul ECTS 10 9 Betriebssysteme, Rechnerarchitekturen bl Kenntnis aktueller Betriebssysteme und Rechnerarchitekturen. Befähigung
MehrArchivierung in DBMS
Archivierung in DBMS Marcus Brisgen 9. März 2004 Gliederung Gliederung Motivation Archivierung Grundlagen Anwendungsorientiertes Archivieren Architekturen Erweiterungen ASQL XML-Archivierungsoperator Beispiele
MehrFachbericht zum Thema: Anforderungen an ein Datenbanksystem
Fachbericht zum Thema: Anforderungen an ein Datenbanksystem von André Franken 1 Inhaltsverzeichnis 1 Inhaltsverzeichnis 1 2 Einführung 2 2.1 Gründe für den Einsatz von DB-Systemen 2 2.2 Definition: Datenbank
MehrInhaltsverzeichnis. Vorwort Kapitel 1 Einleitung... 15
Vorwort..................................................... 13 Kapitel 1 Einleitung.......................................... 15 Kapitel 2 SQL der Standard relationaler Datenbanken... 19 2.1 Die Geschichte................................
MehrBig Data Neue Erkenntnisse aus Daten gewinnen
Big Data Neue Erkenntnisse aus Daten gewinnen Thomas Klughardt Senior Systems Consultant 0 Software Dell Software Lösungsbereiche Transform Inform Connect Data center and cloud management Foglight APM,
Mehr7. XML-Datenbanksysteme und SQL/XML
7. XML-Datenbanksysteme und SQL/XML Native XML-DBS vs. XML-Erweiterungen von ORDBS Speicherung von XML-Dokumenten Speicherung von XML-Dokumenten als Ganzes Generische Dekomposition von XML-Dokumenten Schemabasierte
MehrDATENBANK LÖSUNGEN. mit Azure. Peter Schneider Trainer und Consultant. Lernen und Entwickeln. www.egos.co.at
DATENBANK LÖSUNGEN mit Azure Peter Schneider Trainer und Consultant Agenda Cloud Services, Data Platform, Azure Portal Datenbanken in Virtuelle Maschinen Azure SQL Datenbanken und Elastic Database Pools
MehrBig Data Management Thema 14: Cassandra
Thema 14: Cassandra Jan Kristof Nidzwetzki Thema 14: Cassandra 1 / 25 Übersicht 1 Grundlagen Überblick Geschichte Datenmodel 2 Architektur Der logische Ring Persistenz der Daten Tunable Consistency Read
MehrHandbuch ECDL 2003 Basic Modul 5: Datenbank Grundlagen von relationalen Datenbanken
Handbuch ECDL 2003 Basic Modul 5: Datenbank Grundlagen von relationalen Datenbanken Dateiname: ecdl5_01_00_documentation_standard.doc Speicherdatum: 14.02.2005 ECDL 2003 Basic Modul 5 Datenbank - Grundlagen
MehrXINDICE. The Apache XML Project 3.12.09. Name: J acqueline Langhorst E-Mail: blackyuriko@hotmail.de
Name: J acqueline Langhorst E-Mail: blackyuriko@hotmail.de 3.12.09 HKInformationsverarbeitung Kurs: Datenbanken vs. MarkUp WS 09/10 Dozent: Prof. Dr. M. Thaller XINDICE The Apache XML Project Inhalt Native
MehrR.I.P. Oracle-Datenbank Markus Lohn esentri AG Ettlingen
Schlüsselworte Datenbanken, NoSQL, Open Source, Cloud R.I.P. Oracle-Datenbank Markus Lohn esentri AG Ettlingen Abstrakt Relationale Datenbanken implementieren ein auf der Mengenlehre basiertes Modell.
MehrSQL/Datenbanken Klausur: Basics
SQL/Datenbanken Klausur: Basics Kapitel 1: Einführung in Datenbanken 1.1 Historische Entwicklung Dateisysteme Nach und nach wurde in Unternehmen immer mehr EDV eingesetzt, diese gewachsenen EDV-Systeme
MehrInhaltsverzeichnis Vorwort zur vierten Auflage Vorwort zur dritten Auflage Vorwort zur zweiten Auflage Vorwort zur ersten Auflage Hinweise zur CD
Vorwort zur vierten Auflage 11 Vorwort zur dritten Auflage 13 Vorwort zur zweiten Auflage 15 Vorwort zur ersten Auflage 17 Hinweise zur CD 19 1 Datenbanken und Datenbanksysteme 21 1.1 Zentralisierung der
MehrContent Management. Systeme. 15.05.2002 Irina Fröse
Content Management Systeme 15.05.2002 Irina Fröse Was ist ein Content Management-System? Content Management ist ein Prozess, der von der Erstellung bis zur Präsentation der Inhalte reicht. Content Management-System
MehrÜberblick und Vergleich von NoSQL. Datenbanksystemen
Fakultät Informatik Hauptseminar Technische Informationssysteme Überblick und Vergleich von NoSQL Christian Oelsner Dresden, 20. Mai 2011 1 1. Einführung 2. Historisches & Definition 3. Kategorien von
MehrAnfrageoptimierung Logische Optimierung
Institute for Web Science & Technologies WeST Grundlagen der Datenbanken Logische Optimierung Dr. Thomas Gottron Wintersemester 2012/13 Ablauf der Deklarative Anfrage Scanner Parser Sichtenauflösung Algebraischer
MehrDataport IT Bildungs- und Beratungszentrum. Access Grundlagenseminar Access Aufbauseminar... 3
Inhalt Access 2010 - Grundlagenseminar... 2 Access 2010 - Aufbauseminar... 3 Access 2010 - Von Excel zu Access... 4 Access 2010 - Programmierung Teil 1... 5 Access 2010 - Programmierung Teil 2... 6 Grundlagen
MehrEinführung in SQL Datenbanken bearbeiten
Einführung in SQL Datenbanken bearbeiten Jürgen Thomas Entstanden als Wiki-Buch Bibliografische Information Diese Publikation ist bei der Deutschen Nationalbibliothek registriert. Detaillierte Angaben
MehrBig-Data-Technologien - Überblick - Prof. Dr. Jens Albrecht
Big-Data-Technologien - Überblick - Quelle: http://www.ingenieur.de/panorama/fussball-wm-in-brasilien/elektronischer-fussball-smartphone-app-helfen-training Big-Data-Anwendungen im Unternehmen Logistik
MehrSoftware as a Service, Cloud Computing und aktuelle Entwicklungen Seminarvorbesprechung
Software as a Service, Cloud Computing und aktuelle Entwicklungen Seminarvorbesprechung A. Göbel, Prof. K. Küspert Friedrich-Schiller-Universität Fakultät für Mathematik und Informatik Lehrstuhl für Datenbanken
MehrData. Guido Oswald Solution Architect @SAS Switzerland. make connections share ideas be inspired
make connections share ideas be inspired Data Guido Oswald Solution Architect @SAS Switzerland BIG Data.. Wer? BIG Data.. Wer? Wikipedia sagt: Als Big Data werden besonders große Datenmengen bezeichnet,
MehrDataSpace 2.0 Die sichere Kommunikations-Plattform für Unternehmen und Organisationen. Your Data. Your Control
DataSpace 2.0 Die sichere Kommunikations-Plattform für Unternehmen und Organisationen Your Data. Your Control WebGUI CMIS GW (JSON) GDS2 API (JSON) WebDAV GDS core Moderne Software Architektur Object-Store
MehrSODA. Die Datenbank als Document Store. Rainer Willems. Master Principal Sales Consultant Oracle Deutschland B.V. & Co. KG
SODA Die Datenbank als Document Store Rainer Willems Master Principal Sales Consultant Oracle Deutschland B.V. & Co. KG vs No Anforderungskonflikte Agile Entwicklung Häufige Schema-Änderungen Relationales
MehrNoSQL. Was Architekten beachten sollten. Dr. Halil-Cem Gürsoy adesso AG. Architekturtag @ SEACON 2012 Hamburg
NoSQL Was Architekten beachten sollten Dr. Halil-Cem Gürsoy adesso AG Architekturtag @ SEACON 2012 Hamburg 06.06.2012 Agenda Ein Blick in die Welt der RDBMS Klassifizierung von NoSQL-Datenbanken Gemeinsamkeiten
MehrBig Data in Azure. Ein Beispiel mit HD Insight. Ralf Stemmer
Big in Azure Ein Beispiel mit HD Insight Ralf Stemmer Agenda owas ist Big? Was ist HD Insight? owelche Probleme kann man damit lösen? odemo Was ist Big? Was ist HD Insight? Datenexplosion - Rasanter Zuwachs
MehrEntwurf und Prototypische Implementierung einer Data Mashup Plattform. Abschlussvortrag Projekt-INF
Entwurf und Prototypische Implementierung einer Data Mashup Plattform Abschlussvortrag Projekt-INF Daniel Del Gaudio, Johannes Bohn, Nikolas Paparoditis Gliederung Data Mashups Einführung Motivationsszenario
MehrMessage Oriented Middleware am Beispiel von XMLBlaster
Message Oriented Middleware am Beispiel von XMLBlaster Vortrag im Seminar XML und intelligente Systeme an der Universität Bielefeld WS 2005/2006 Vortragender: Frederic Siepmann fsiepman@techfak.uni bielefeld.de
MehrSeminar Cloud Data Management WS09/10. Tabelle1 Tabelle2
Seminar Cloud Data Management WS09/10 Tabelle1 Tabelle2 1 Einführung DBMS in der Cloud Vergleich verschiedener DBMS Beispiele Microsoft Azure Amazon RDS Amazon EC2 Relational Databases AMIs Was gibt es
MehrRaumbezogene Datenbanken (Spatial Databases)
Raumbezogene Datenbanken (Spatial Databases) Ein Vortrag von Dominik Trinter Alexander Christian 1 Inhalte Was ist ein raumbezogenes DBMS? Modellierung Abfragen Werkzeuge zur Implementierung Systemarchitektur
MehrErstellen von Business Intelligence mit Office XP und SQL 2000 Analysis Services
Erstellen von Business Intelligence mit Office XP und SQL 2000 Analysis Services (Engl. Originaltitel: Building Business Intelligence with Office XP and SQL 2000 Analysis Services) In diesem Artikel wird
Mehr4. Objektrelationales Typsystem Kollektionstypen. Nested Table
Nested Table Bei einer Nested Table handelt es sich um eine Tabelle als Attributwert. Im Gegensatz zu Varray gibt es keine Beschränkung bei der Größe. Definition erfolgt auf einem Basistyp, als Basistypen
MehrComplex Hosting. Whitepaper. Autor.: Monika Olschewski. Version: 1.0 Erstellt am: 14.07.2010. ADACOR Hosting GmbH
Complex Hosting Autor.: Monika Olschewski Whitepaper Version: 1.0 Erstellt am: 14.07.2010 ADACOR Hosting GmbH Kaiserleistrasse 51 63067 Offenbach am Main info@adacor.com www.adacor.com Complex Hosting
MehrTask-Based Learning und Aufgabenorientierung im Fremdsprachenunterricht als Antwort auf die Bildungstandards?
Sprachen Alexej Schlotfeldt Task-Based Learning und Aufgabenorientierung im Fremdsprachenunterricht als Antwort auf die Bildungstandards? Eine theoretische und praxisorientierte Betrachtung der Konjunktur
MehrNoSQL-Datenbanken. Kapitel 1: Einführung. Lars Kolb Sommersemester 2014. Universität Leipzig http://dbs.uni-leipzig.de 1-1
NoSQL-Datenbanken Kapitel 1: Einführung Lars Kolb Sommersemester 2014 Universität Leipzig http://dbs.uni-leipzig.de 1-1 Inhaltsverzeichnis NoSQL-Datenbanken Motivation und Definition Kategorisierung, Eigenschaften
MehrEntwicklung der Datenbanksysteme
Entwicklung der Datenbanksysteme Die Entwicklung der Datenbanksysteme ist eng an die der Hardware gekoppelt und wird wie jene in Generationen eingeteilt: 1. Generation: In den fünfziger Jahren waren die
Mehr