NoSQL-Databases. Präsentation für Advanced Seminar "Computer Engineering", Matthias Hauck, matthias.hauck@stud.uni-heidelberg.de



Ähnliche Dokumente
Überblick und Vergleich von NoSQL. Datenbanksystemen

NoSQL-Datenbanken. Kapitel 1: Einführung. Lars Kolb Sommersemester Universität Leipzig 1-1

ANALYTICS, RISK MANAGEMENT & FINANCE ARCHITECTURE. NoSQL Datenbanksysteme Übersicht, Abgrenzung & Charakteristik

SimpleVOC-Yetanother. Bausteine für eine Key/Value- Datenbank

Big Data Mythen und Fakten

NoSQL. Was Architekten beachten sollten. Dr. Halil-Cem Gürsoy adesso AG. SEACON 2012 Hamburg

PostgreSQL in großen Installationen

SQL- & NoSQL-Datenbanken. Speichern und Analysen von großen Datenmengen

Konsistenzproblematik bei der Cloud-Datenspeicherung

Stefan Edlich Achim Friedland Jens Rampe Benjamin Brauer. NoSQL. Einstieg in die Welt nichtrelationaler Web 2.0 Datenbanken HANSER

Neues aus der nicht-, semi- und relationalen Welt

NoSQL Datenbanken am Beispiel von CouchDB

Apache HBase. A BigTable Column Store on top of Hadoop

Zeit bedeutet eine Abwägung von Skalierbarkeit und Konsistenz

NoSQL Datenbanken EIN ÜBERBLICK ÜBER NICHT-RELATIONALE DATENBANKEN UND DEREN POTENTIALE IM ALLGEMEINEN UND IN DER INDUSTRIE

Einführung in CouchDB

Prof. Dr.-Ing. Rainer Schmidt 1

Datenbanken und Datenbanktypen Tag 1 : Kapitel 1. Christian Inauen. Lernziele. Entwicklung der Datenbanken.

Soziotechnische Informationssysteme

Solaris Cluster. Dipl. Inform. Torsten Kasch Bielefeld.DE> 8. Januar 2008

Oracle Big Data Technologien Ein Überblick

Search-Driven Applications. Florian Hopf, freiberuflicher Softwareentwickler Tobias Kraft, exensio GmbH

Architektur von Cassandra

Aktuelle SE Praktiken für das WWW

SQL- & NoSQL-Datenbanken - Speichern und Analysen von großen Datenmengen

SEMINAR Modifikation für die Nutzung des Community Builders

Big Data Informationen neu gelebt

Der Neue Weg zur Verschlüsselung von Datenbankinhalten

Big Data Management Thema 14: Cassandra

Fragenkatalog zum Kurs 1666 (Datenbanken in Rechnernetzen) Kurstext von SS 96

Referenzielle Integrität SQL

BigTable Else

MySQL High Availability. DOAG 2013 Datenbank. 14. Mai 2013, Düsseldorf. Oli Sennhauser

XAMPP-Systeme. Teil 3: My SQL. PGP II/05 MySQL

Daten: Gründungsjahr 1995 Schwerpunkte Oracle, VMware, Microsoft, Linux und Novell Ausschließlich zertifizierte Techniker:

Einteilung von Datenbanken

5. Programmierschnittstellen für XML

5. Programmierschnittstellen für XML

Hadoop. Eine Open-Source-Implementierung von MapReduce und BigTable. von Philipp Kemkes

Thin versus Fat Clients

NoSQL HANSER. Einstieg in die Web 2.0 Datenbanken. Stefan Edlich Achim Friedland Jens Hampe Benjamin Brauer Markus Brückner

WINDOWS AZURE IM ÜBERBLICK GANZ NEUE MÖGLICHKEITEN

Notes / Domino New Features & Was bringt die Eclipse Plattfrom von Lotus Notes für mein Unternehmen. Dipl.-Ing.

NoSQL mit Postgres 15. Juni 2015

NoSQL & Big Data. NoSQL Databases and Big Data. NoSQL vs SQL DBs. NoSQL DBs - Überblick. Datenorientierte Systemanalyse. Gerhard Wohlgenannt

NoSQL Databases and Big Data

ISBN: Herstellung: Diplomica Verlag GmbH, Hamburg, 2011

DATENBANKEN SQL UND SQLITE VON MELANIE SCHLIEBENER

Analyse von unstrukturierten Daten. Peter Jeitschko, Nikolaus Schemel Oracle Austria

Disaster Recovery/Daily Backup auf Basis der Netapp-SnapManager. interface:systems

Java Forum Stuttgart 2013 twitter.com/kspichale spichale.blogspot.de

Reaktive Programmierung Vorlesung 16 vom : Theorie der Nebenläufigkeit

Möglichkeiten für bestehende Systeme

Workstations. Server. Recovery Log. Database. SQL Queries. Query Processing Object Mgmt. Transaction Mgmt. Buffer Mgmt. I/O Layer

Institut für Verteilte Systeme

ETL in den Zeiten von Big Data

Datenbanken (WS 2015/2016)

IV. Datenbankmanagement

Wie Amazon mit Hilfe von Technologie und Daten erfolgreich ist Startup Firmen in Deutschland und weltweit haben Agilität, Innovation und globale

RavenDB, schnell und skalierbar

BI in der Cloud eine valide Alternative Überblick zum Leistungsspektrum und erste Erfahrungen

SQL für Trolle. mag.e. Dienstag, Qt-Seminar

Zend PHP Cloud Application Platform

Datenbanksysteme für Business, Technologie und Web. Nutzerdefinierte Replikation zur Realisierung neuer mobiler Datenbankanwendungen DB I S

SQL. strukturierte Datenbankabfragesprache eine Datenbanksprache zur. Structured Query Language:

Profilbezogene informatische Bildung in den Klassenstufen 9 und 10. Schwerpunktthema Daten und Datenbanken

Was ist Windows Azure? (Stand Juni 2012)

Eignet sich Eclipse RCP als Enterprise Plattform? 2. Mai 2006 Lars Stucki & Edwin Steiner

Datenbanken SQL Einführung Datenbank in MySQL einrichten mit PhpMyAdmin

Datenbank-Service. RZ-Angebot zur Sicherstellung von Datenpersistenz. Thomas Eifert. Rechen- und Kommunikationszentrum (RZ)

Algorithmen. Consistent Hashing Bloom Filter MapReduce. Distributed Hash Tables. Einführung 1

Sie haben keine Lust mehr auf teure und komplexe Projekte?

Tag 4 Inhaltsverzeichnis

Datenbanksysteme. Gerhard Wohlgenannt. 14. September 2015

Mengenvergleiche: Alle Konten außer das, mit dem größten Saldo.

Database Change Management für Continuous Delivery. Diana Lander und Andreas Falk NovaTec Consulting GmbH

Wissenschaftliches Arbeiten , SE 2.0

Dokumentenorientierte Datenbanken - MongoDB

PRESman. Presentation Manager. Reduzieren Sie nachhaltig die Kosten für das. Erstellen, Verwalten und Verteilen Ihrer

Das diesem Dokument zugrundeliegende Vorhaben wurde mit Mitteln des Bundesministeriums für Bildung und Forschung unter dem Förderkennzeichen

MySQL Installation. AnPr

Sicht eines Technikbegeisterten

Das SQL-Schlüsselwort ALL entspricht dem Allquantor der Prädikatenlogik

Möglichkeiten der Maßschneiderung von DBMS

Allgemeines zu Datenbanken

Storage-Trends am LRZ. Dr. Christoph Biardzki

Oracle Big Data Technologien Ein Überblick

NoSQL. Prof. Dr. Ingo Claßen. Einführung. Kategorisierung von NoSQL-Systemen. Verteilung. Konsistenz. Literatur

Datenbanksysteme Kapitel 6: Neue Konzepte der Datenbanktechnologie

SOA im Zeitalter von Industrie 4.0

Large-scale Incremental Processing Using Distributed Transactions and Notifications

Albert HAYR Linux, IT and Open Source Expert and Solution Architect. Open Source professionell einsetzen

Dipl. Inf. Dipl. Math. Y. Orkunoglu Datum:

Wide Column Stores. Felix Bruckner Mannheim,

Informatik 12 Datenbanken SQL-Einführung

RAC auf Sun Cluster 3.0

Ora Education GmbH. Lehrgang: Oracle Application Server 10g R3: Administration

SOAP SchnittstelleSchnittstelle

Application Performance Management. Auch eine Frage des Netzwerkes?

OERA OpenEdge Reference Architecture. Mike Fechner PUG Infotag 19. Mai 05 Frankfurt

Transkript:

NoSQL-Databases Präsentation für Advanced Seminar "Computer Engineering", Matthias Hauck, matthias.hauck@stud.uni-heidelberg.de

Klassische SQL-Datenbanken Anwendungsgebiet: Geschäftsanwendungen Behördenanwendungen Anwendungsklassen Online Transaction Processing(OLTP) Online Analytic Processing(OLAP)

Klassische SQL-Datenbanken Focus auf Robustheit ACID Relationales Datenmodel Star(Performanz) Zeilen Orientiert(Daten anhängen) Ausgereift Ursprung in den 70er Teuer Oracle Database Enterprise Edition(pur) 47.500 $/Prozessor 3/25

Relationales Datenmodel Primärschlüssel (Primary key) Attribut Schema Relation ID Vorname Name 11 David Bowman 9 Thomas Anderson 4 Samantha Carter 21 Dennis Nedry 32 John Connor Eintrag (Record) Beispiel Abfrage: select LV.Name from Stud, Belegungen, LV where Name=Nedry, Stud.ID = Belegungen.ID, Belegungen.ID=LV.ID 4/25

Neue Anforderungsprofile Webanwendungen interaktive Datenzugriff Verfügbarkeit wichtiger als Konsistenz Anforderungen der Daten variiert Big Data Mobile Anwendungen Synchronisation Wenig Leistungsfähige Hardware 5/25

Anforderungen Extreme Skalierbarkeit Viele Anfragen Viele (stark wachsende) Daten Hohe Verfügbarkeit Schnell ändernde Software Niedrige Kosten Geringer administrativer Aufwand Standard Hardware 6/25

Lösungen (Evolution) Cache Layer für SQL Datenbank Memcached Middelware Gizzard NoSQL 7/25

Lösung: NoSQL Ausrichtung auf Cluster Teilweiser Verzicht auf Abstraktion Flexible Schemas Verzicht auf Features Ein Interface das nicht SQL verwendet 8/25

Fokus der Entwicklung Anpassung an die Aufgabenfelder Unterstützung verteilter Systeme Replikation Verteilung von Daten Optimierung der Performanz/Durchsatz 9/25

Arten von NoSQL-Datenbanken Key-Value Store MemcacheDB, Amazon Dynamo Document Store Lotus Notes, couchdb Spalten-orientierte Datenbanken Bigtable, Cassandra Graph Datenbanken Neo4j Weitere Klassifikationen möglich! 10/25

Key/Value Store Einfacher Aufbau Einfache Abfragen Key Bunsen Value Value wird nicht ausgewertet Buchteln Winter 11/25

Document Store Strukturierte Daten Gruppierung von gemeinsam genutzten Daten Flexibles Schema "oname":"the Silence of the Lambs" "name : { "en":"the Silence of the Lambs" "de":"das Schweigen der Lämmer" "fi": "Uhrilampaat" } "regie":"jonathan Demme" "schauspieler":{"jodie Foster", "Anthony Hopkins"} "laufzeit":"113 min" 12/25

Spalten-orientierte Datenbanken oder: Wide Column Store / Column Families Tabelle mit Zeilen und Spalten Zeilen besitzen unbegrenzte Anzahl an Spalten Spalten gehören zu einer Spalten Familie Die Anzahl der Spalten Familien ist begrenzt Bild: Google: Bigtable: A Distributed Storage System for Structured Data 13/25

Graph Datenbanken Modellierung der Daten als Graph Unterstützung von Graphen Verarbeitung Paul Alter: 33 verheiratet mit verheiratet mit Julia Alter: 32 kennt Gesa Alter:31 Vater von Anton Alter: 1 Mutter von 14/25

Verteilte Systeme: CAP-Theorem Consistency Availability Partition-tolerance 15/25

Verteilte Systeme: BASE Basically available, Soft-state, Eventual consistency Updates nicht sofort im ganzen System sichtbar Varianten möglich Nicht alle Knoten müssen gleichzeitig Commiten Applikation muss Inkonsistenzen tolerieren 16/25

Verteilte Systeme: BASE vs. ACID ACID Strong consistency Isolation Focus on commit Nested transactions Availability? Conservative (pessimistic) Difficult evolution (e. g. schema) BASE Weak consistency stale data OK Availability first Best effort Approximate ACID answers BASE OK Aggressive (optimistic) Simpler! Faster Easier evolution Quelle: Brewer, Eric A.: Towards Robust Distributed Systems. Portland, Oregon, July 2000. Keynote at the ACM Symposium on Principles of Distributed Computing (PODC) on 2000-07-19., Folie 13 17/25

Verteilte Systeme: Sharding Automatische Verwaltung Load Balancing Daten Verteilung/Redistribution Lookup Mechanismus Statisch/Dynamisch Hash, Lookup Server Membership Managment 18/25

Performanz: Elimination von Overhead Kommunikation Frontend/Backend Logging Locking Latching Buffermangment 19/25

Performanz: Elimination von Overhead Kommunikation Frontend/Backend Verlagerung von Logik in Client Lib Komplexe Operationen auf dem Server(Stored procedures) MapReduce Integration Logging Locking Latching Buffermangment 20/25

Performanz: Elimination von Overhead Kommunikation Frontend/Backend Logging Verzicht auf Logs Replikation/GEO distribution Locking Latching Buffermangment 21/25

Performanz: Elimination von Overhead Kommunikation Frontend/Backend Logging Locking Verzicht auf Transaktionen(über mehr als einen Eintrag) Latching Buffermangment 22/25

Weitere Optimierungen In Memory DB Performanz Einfacheres Zugriffsmanagement Überarbeitung des Storage Layouts Kompression 23/25

Kritik an NoSQL NoSQL hat nichts mit SQL zu tun Nichts neues Nicht standardisiert Kein kommerzieller Support / Lizenzprobleme Evatual Consistency ist kompliziert 24/25

Fazit & Ausblick SQL Datenbanken sind relevant NoSQL Datenbanken sind relevant NoSQL wird reifen Neue Technologien kommen NewSQL 25/25