NoSQL & Big Data. NoSQL Databases and Big Data. NoSQL vs SQL DBs. NoSQL DBs - Überblick. Datenorientierte Systemanalyse. Gerhard Wohlgenannt



Ähnliche Dokumente
NoSQL Databases and Big Data

Datenbanksysteme. Alternative Konzepte. Gerhard Wohlgenannt

Überblick und Vergleich von NoSQL. Datenbanksystemen

ANALYTICS, RISK MANAGEMENT & FINANCE ARCHITECTURE. NoSQL Datenbanksysteme Übersicht, Abgrenzung & Charakteristik

XINDICE. The Apache XML Project Name: J acqueline Langhorst blackyuriko@hotmail.de

Fachbericht zum Thema: Anforderungen an ein Datenbanksystem

Apache HBase. A BigTable Column Store on top of Hadoop

Big Data Mythen und Fakten

Datenbanksysteme. Gerhard Wohlgenannt. 14. September 2015

NoSQL mit Postgres 15. Juni 2015

NoSQL HANSER. Einstieg in die Web 2.0 Datenbanken. Stefan Edlich Achim Friedland Jens Hampe Benjamin Brauer Markus Brückner

XAMPP-Systeme. Teil 3: My SQL. PGP II/05 MySQL

SimpleVOC-Yetanother. Bausteine für eine Key/Value- Datenbank

ISBN: Herstellung: Diplomica Verlag GmbH, Hamburg, 2011

Internet online Update (Internet Explorer)

Arbeiten mit einem lokalen PostgreSQL-Server

organice CRM 2012 Die Neuerungen für den Entscheider

7. Übung - Datenbanken

Allgemeines zu Datenbanken

ORM & OLAP. Object-oriented Enterprise Application Programming Model for In-Memory Databases. Sebastian Oergel

Handbuch ECDL 2003 Basic Modul 5: Datenbank Grundlagen von relationalen Datenbanken

Zeit bedeutet eine Abwägung von Skalierbarkeit und Konsistenz

Nachtrag: Farben. Farbblindheit. (Light und Bartlein 2004)

Informatik 12 Datenbanken SQL-Einführung

EXASOL Anwendertreffen 2012

Grundzüge und Vorteile von XML-Datenbanken am Beispiel der Oracle XML DB

Stefan Edlich Achim Friedland Jens Rampe Benjamin Brauer. NoSQL. Einstieg in die Welt nichtrelationaler Web 2.0 Datenbanken HANSER

5. Programmierschnittstellen für XML

Datenbanktechnologie mit praktischen Übungen in MySQL und PHP

5. Programmierschnittstellen für XML

Refactoring relationaler Datenbank. Shaoke Wu

In diesem Thema lernen wir die Grundlagen der Datenbanken kennen und werden diese lernen einzusetzen. Access. Die Grundlagen der Datenbanken.

mysql - Clients MySQL - Abfragen eine serverbasierenden Datenbank

Wie Google Webseiten bewertet. François Bry

WS 2002/03. Prof. Dr. Rainer Manthey. Institut für Informatik III Universität Bonn. Informationssysteme. Kapitel 1. Informationssysteme

Internet online Update (Mozilla Firefox)

Objektrelationale Datenbanken

Suche schlecht beschriftete Bilder mit Eigenen Abfragen

4. Hierarchische und netzwerkartige Datenbankmodelle

Kapitel 4 Die Datenbank Kuchenbestellung Seite 1

Einfache und effiziente Zusammenarbeit in der Cloud. EASY-PM APPs und Add-Ins

Kurzanweisung für Google Analytics

à la Carte KMU - Lösungen im Alltag für Filemaker und das Web

Oracle: Abstrakte Datentypen:

teischl.com Software Design & Services e.u. office@teischl.com

Möglichkeiten für bestehende Systeme

Datenstrukturen & Algorithmen

Big Data Projekte richtig managen!

Konzept zur Push Notification/GCM für das LP System (vormals BDS System)

Handbuch zur Anlage von Turnieren auf der NÖEV-Homepage

Was ist LDAP. Aufbau einer LDAP-Injection. Sicherheitsmaßnahmen. Agenda. LDAP-Injection. ITSB2006 WS 09/10 Netzwerkkonfiguration und Security

SharePoint Demonstration

June Automic Hadoop Agent. Data Automation - Hadoop Integration

Datenbank-Verschlüsselung mit DbDefence und Webanwendungen.

Artenkataster. Hinweise zur Datenbereitstellung. Freie und Hansestadt Hamburg. IT Solutions GmbH. V e r s i o n

IV. Datenbankmanagement

Ein Beispiel. Ein Unternehmen will Internettechnologien im Rahmen des E- Business nutzen Welche Geschäftsprozesse?

NoSQL. Was Architekten beachten sollten. Dr. Halil-Cem Gürsoy adesso AG. SEACON 2012 Hamburg

Der Begriff Cloud. Eine Spurensuche. Patric Hafner geops

Carl-Engler-Schule Karlsruhe Datenbank 1 (5)

3 Richtlinienbasierte Verwaltung und Multi-Server- Administration

Inhalt. 1 Einleitung AUTOMATISCHE DATENSICHERUNG AUF EINEN CLOUDSPEICHER

Systemvoraussetzungen winvs office winvs advisor

Preisvergleich ProfitBricks - Amazon Web Services M3 Instanz

Property-Graph-Databases. 20 Jahre praktische Erfahrung

Tag 4 Inhaltsverzeichnis

Sichern der persönlichen Daten auf einem Windows Computer

Kurzanleitung um Transponder mit einem scemtec TT Reader und der Software UniDemo zu lesen

Konfiguration von Fabasoft Mindbreeze Enterprise für IBM Lotus

Anleitung zur Erstellung und Bearbeitung von Seiten in Typo3. Typo3. Anleitung. Wenpas Informatik

Whitepaper. Produkt: combit Relationship Manager. Einbindung externer FiBu-/Warenwirtschaftsdaten. combit GmbH Untere Laube Konstanz

DATENBANKEN SQL UND SQLITE VON MELANIE SCHLIEBENER

Vermeiden Sie es sich bei einer deutlich erfahreneren Person "dranzuhängen", Sie sind persönlich verantwortlich für Ihren Lernerfolg.

Die technischen Aspekte von Mapping-Lösungen

MS SQL Server: Index Management. Stephan Arenswald 10. Juli 2008

mywms Vorlage Seite 1/5 mywms Datenhaltung von Haug Bürger

SQL- & NoSQL-Datenbanken - Speichern und Analysen von großen Datenmengen

BI in der Cloud eine valide Alternative Überblick zum Leistungsspektrum und erste Erfahrungen

Relationale Datenbanken Datenbankgrundlagen

Web Services stellen eine Integrationsarchitektur dar, die die Kommunikation zwischen verschiedenen Anwendungen

Keine Disketteneinreichung ab 1. Februar 2014

Zur Einrichtung der orgamax Cloud auf Ihrem ipad beschreiben wir hier die Vorgehensweise.

How-to: Webserver NAT. Securepoint Security System Version 2007nx

White Paper. Konfiguration und Verwendung des Auditlogs Winter Release

Prof. Dr.-Ing. Rainer Schmidt 1

Schlüssel bei temporalen Daten im relationalen Modell

Mengenvergleiche: Alle Konten außer das, mit dem größten Saldo.

Look Inside: desite. modellorientiertes Arbeiten im Bauwesen. B.I.M.

SQL für Trolle. mag.e. Dienstag, Qt-Seminar

Technische Analyse der Zukunft

Echtzeitanomalieerkennung für Internetdienste (Abschlussvortrag)

Wie man Registrationen und Styles von Style/Registration Floppy Disketten auf die TYROS-Festplatte kopieren kann.

POP -Konto auf iphone mit ios 6 einrichten

SOA im Zeitalter von Industrie 4.0

Kopplung von Datenbanken

Urlaubsregel in David

Windows 7: Neue Funktionen im praktischen Einsatz - Die neue Taskleiste nutzen

Reporting Services und SharePoint 2010 Teil 1

PostgreSQL in großen Installationen

Entwicklung des Dentalmarktes in 2010 und Papier versus Plastik.

Transkript:

NoSQL & Big Data Datenorientierte Systemanalyse NoSQL Databases and Big Data Gerhard Wohlgenannt Die besprochenen Systeme haben nicht den Anspruch und das Ziel DBS zu ersetzen, sondern für gewisse Anwendungsfälle andere / spezifische Lösungen zu bieten. Agenda 1. NoSQL (what is it?) 2. NoSQL: Document stores 3. NoSQL: GraphDBs 4. NoSQL: ObjectDBs 5. Big Data DATENORIENTIERTE SYSTEMANALYSE - 1-17. JUNI 2013 NoSQL DBs - Überblick Not only SQL!! Sammelbegriff für verschiedene Ansätze Gemeinsamkeit: weniger Anforderungen an strenge DB- Grundsätze und Mächtigkeit des DB-Systems Daten oft nicht in Form von klassischen Tabellen gespeichert Oft keine mächtige Abfragesprache wie SQL NoSQL vs SQL DBs SQL DBs ursprünglich verbreitet in Banken und Versicherungen Fokus auf Konsistenz und Transaktionssicherheit Schon besprochen: Transaktionen Mächtige Abfragesprachen zur Erstellung von Reports, etwa Kontoauszug Konsistenz, die Mächtigkeit des Systems, Integritätsbedingungen, JOINs, etc führt zu Kompromissen bei der Abfrage-Performanz Beispiel: Einfügen von neuem Datensatz führt zu Constraint-Checks (Datentyp, FK), zu index-updates, event. Funktionsaufrufen über Trigger... DATENORIENTIERTE SYSTEMANALYSE - 2-17. JUNI 2013 DATENORIENTIERTE SYSTEMANALYSE - 3-17. JUNI 2013

Neue Entwicklungen wie Cloud SQL um NoSQL ähnliche Anforderungen erfüllen http://www.youtube.com/watch?v=rroy6i4gkwu NoSQL Oft optimiert für simple Abfragen und sehr grosse Datenmengen Simple Abfragen, Beispiel: key-value store Keine komplexen Operationen, etwa Joins Weiteres Ziel: Skalierbarkeit inbes. durch Verteilung Nur eventual consistency: changes propagated after sufficiently long period Wichtiger Aspekt: distributed und fault-tolerant (via redundancy) passt gut zusammen mit cloud-computing - Scalability einfach durch Hinzufügen neuer Rechner DATENORIENTIERTE SYSTEMANALYSE - 4-17. JUNI 2013 DATENORIENTIERTE SYSTEMANALYSE - 5-17. JUNI 2013 Types of NoSQL DBs Key-value stores: selbsterklärend :-) BigTable: entwickelt von Google, mehrdimensionale Map, soll auf Petabytes skalieren Document store: Für effiziente Speicherung / Retrieval von semistrukturierten Daten ( Dokument ) Graph-Stores: siehe unten ObjectDBs: siehe unten Key-Value stores Huge collection of key-value pairs (distributed) Values können wiederum zusammengesetzt sein Grundlage: Amazon s paper über Dynamo Implementations: Voldemort (linkedin), Riak, Tokyo DATENORIENTIERTE SYSTEMANALYSE - 6-17. JUNI 2013 DATENORIENTIERTE SYSTEMANALYSE - 7-17. JUNI 2013

Document DB Example NoSQL Document stores Document-oriented DBs haben überlicherweise einen unique key um auf records zuzugreifen Inspired by Lotus Notes Retrieval: (RESTful)-API or Simple Query Language, eg. all docs with field topic= football Organization of documents: Tags, non-visible metadata, hierarchy structures, collections,... Implementations: CouchDB, MongoDB, and many others DATENORIENTIERTE SYSTEMANALYSE - 8-17. JUNI 2013 DATENORIENTIERTE SYSTEMANALYSE - 9-17. JUNI 2013 ObjektDBs - Überblick Objekte aus OO Programmiersprachen selbst in der DB gehalten Einfache Form Persistenz zu erreichen Beispiel: in einer Java-GUI werden neue Mitarbeiter eingefügt. - Diese Mitarbeiter werden im Programm als Objekte der Klasse Mitarbeiter verwendet. - Anstatt nun die relevanten Attribute der Mitarbeiterobjekte in eine relationales DB zu speichern Objekte werden einfach as is in die Objekt-DB gespeichert. - Objekte können natürlich auch wieder aus der O-DB geladen/verändert werden. ObjektDBs (Details) Wie gesagt: Direktes persistentes Speichern von Objekten macht ORM (mapping Objekte Relationen überflüssig Besonderer Vorteil bei komplexen Objekten die schwer ins relationale Schema abbildbar sind Beispiel db4o, First Steps http://community.versant.com/documentation/ Reference/db4o-8.0/java/tutorial/ Pilot pilot1 = new Pilot("Michael Schumacher", 100); db.store(pilot1); DATENORIENTIERTE SYSTEMANALYSE - 10-17. JUNI 2013 DATENORIENTIERTE SYSTEMANALYSE - 11-17. JUNI 2013

Graphendatenbanken Graph Example Benutzt Graphen um Informationen darzustellen Knoten (Objekte) - Kanten gerichtete Graphen, gewichtete Graphen (zb Bandbreite bei Netzwerken) GraphDB kann: - Spezielle Queries: shortest path -... Noch keine einheitliche Abfragesprachen Implementations: AllegroGraph, Sones, Neo4j DATENORIENTIERTE SYSTEMANALYSE - 12-17. JUNI 2013 DATENORIENTIERTE SYSTEMANALYSE - 13-17. JUNI 2013 NoSQL Details NoSQL Vergleich Geschichte - Entstand primär aus den Anforderung von Internet-Konzernen wie Google, Facebook, etc. Anforderungen: riesige Datenmengen schnell ändern und ausliefern - aber: Auch zb Twitter und Facebook verwenden für vieles MySQL Datenbanken - je nach Anforderung. Ansatz: Lightweight, einfaches Datenmodell, Konsistenz und Datensicherheit nicht sooo wichtig (Twitter) Dafür andere Anforderungen im Fokus, etwa performance. Key-Value: For huge data size, low complexity (semistructured, connected) of data Big Tables: For less big data size, a bit more of complexity of data Document DBs: For less big data size, a bit more of complexity of data Graph DBs: For less big data size, a bit more of complexity of data >: The more connected, the harder to scale DATENORIENTIERTE SYSTEMANALYSE - 14-17. JUNI 2013 DATENORIENTIERTE SYSTEMANALYSE - 15-17. JUNI 2013

In-Memory DBs Traditional: Disk optimized In Memory: Fast response time, predicatable DB & transaction log persisted to disk Very good overview: http://www.youtube.com/watch?v=moifpzhliw Big data Big Data Eines der Hype-Keywords 2012 Big Data = Transactions + Interactions + Observations Datenmenge so gross dass mit konventionellen (DB-)tools schwer handhabbar Grosse Datenmenge entsteht auch durch den Wunsch nach Integration und Finden von Beziehunge zwischen kleineren data sets Bzw auch durch mobile devices, Sensordaten, software logs,... Beispiele: Wettermodelle, Webanalyse, LHC, Bioinformatik DATENORIENTIERTE SYSTEMANALYSE - 16-17. JUNI 2013 DATENORIENTIERTE SYSTEMANALYSE - 17-17. JUNI 2013 Big data (2) Wie gesagt is difficult to work with using relational databases and desktop statistics and visualization packages requiring instead massively parallel software running on tens, hundreds, or even thousands of servers (wikipedia) http://www.youtube.com/watch?v= avp5d16wep0 DATENORIENTIERTE SYSTEMANALYSE - 18-17. JUNI 2013 DATENORIENTIERTE SYSTEMANALYSE - 19-17. JUNI 2013