NoSQL-Datenbanken. Kapitel 1: Einführung. Dr. Anika Groß Sommersemester Universität Leipzig 1-1
|
|
- Karoline Dieter
- vor 6 Jahren
- Abrufe
Transkript
1 NoSQL-Datenbanken Kapitel 1: Einführung Dr. Anika Groß Sommersemester 2017 Universität Leipzig 1-1
2 Inhaltsverzeichnis NoSQL-Datenbanken Motivation und Definition Kategorisierung, Eigenschaften CAP-Theorem ACID-Eigenschaften BASE-Ansatz 1-2
3 Massives Datenwachstum Schätzung von IBM Quelle: Pro Tag werden 2,5 Exabytes an Daten generiert 90% aller Daten weltweit wurden in den letzten 2 Jahren erzeugt Quelle (05 Feb 2013): 1-3
4 Datenproduzenten Quelle: Einführungsveranstaltung Seminar New Trends in Big Data WS 2013/14 1-4
5 Big Data Challenges Quelle: 1-5
6 Parallele DBS? Anforderung: Effiziente Verarbeitung großer Datenmengen in einer preiswerten, verteilten (heterogenen) Infrastruktur mit konkurrierenden Schreib- und Lesezugriffen unter Berücksichtigung von Knoten- bzw. Netzwerkausfällen für beliebige Daten (unstrukturiert, semi-strukturiert, strukturiert) Parallele Datenbanksysteme ungeeignet... teure, homogene Infrastruktur geringe Fehlertoleranz (z.b. Query-Restart) nur für strukturierte Daten (statisches Schema) begrenzte Skalierbarkeit (ca. 100 Knoten)... dafür mächtige, einfache Anfragesprache ACID-Eigenschaften Datenunabhängigkeit 1-6
7 NoSQL-Datenbanken Not only SQL Nicht relationale Ansätze Verschiedene Anwendungen erfordern versch. Typen von Datenbanken Keine standardisierte Definition Datenbanksystem, das eines oder mehrere der folgenden Kriterien aufweist Kein relationales Datenmodell Schemafrei oder schwache Schemarestriktionen Keine Joins / keine Normalisierung Verteiltes, auf horizontale Skalierbarkeit ausgelegtes System Commodity Hardware Kein SQL Zugriff mit einfacher API statt SQL Keine Transaktionen Konsistenzmodell BASE statt ACID 1-7
8 Rückblick - History ( repeats itself ) Early Database Management Systems Flat File Data Management Systems Oft Daten zu einem Entity in einem record (meist ineffiziente Suche) Datenduplizierung / Redundanz Inkonsistenzen Keine Implementierung von Zugriffsrechten Keine Datenunabhängigkeit Änderungen in Anwendungsprogrammen Hierarchical Data Management Systems Parent-child relationships (1:N), etwas weniger Redundanz Keine N:M Beziehungen Effizientere Suche Network Data Management Systems Knoten und gerichtete Kanten ( N:M / mehrere parent records erlaubt), keine Zyklen Schemas zur Definition der Knotentypen und Beziehungen Schwieriges Design und Verwaltung Retrieval: Programm muss ggf. hohe Anzahl an Kanten traversieren Nachteile adressiert von relationalen DBMS 1-8
9 Motivation NoSQL-Datenbanken Relationales Schema zu starr für viele Webanwendungen Evolution: Änderung der Webanwendung führt meist zu Schemaänderung Datenstruktur: Heterogene Informationsarten führen zu großen, unübersichtlichen Schemas (u.a. einfache mengenwertige Attribute z.b. Tags) Impedance Mismatch Anfrage: Wartbarkeit komplexer SQL-Anfragen (viele Joins) Vorteile relationaler Modellierung spielen geringere Rolle Data Store meist nur für eine Anwendung, daher Datenunabhängigkeit kein Ziel Effiziente SQL-Ausführung (Optimierung) durch komplexe Anfragen begrenzt Fokus: Performanz und Verfügbarkeit begrenzte Skalierbarkeit paralleler Datenbanksysteme geringe Fehlertoleranz (z.b. Query-Restart) 1-9
10 NoSQL Data Stores * multi-model Key-Value Stores (Kap.2) Kollektion von Key/Value-Paaren: 1 Wert (z.b. BLOB) je Schlüssel Zugriff über Schlüssel: get(key), put(key, value) Document Stores (Kap.3) * Speicherung semistrukturierter Daten als Dokument (z.b. JSON) Zugriff über Schlüssel oder einfache Anfragesprache Wide Column Stores / Record Stores (Kap.5) Tables with records with (many) dynamic columns Zugriff über Schlüssel oder SQL-ähnliche Anfragesprache Graph Databases (Kap.6) Repräsentation der Daten als Knoten und Kanten mit Properties Datenbankabfragen inkl. Graphalgorithmen * + Skalierbare Relationale Datenbanken (Kap. 5) MySQL Cluster, MegaStore, VoltDB, Clustrix, ScaleDB, ScaleBase, NimbusDB,... NoSQL Data Stores for Big Data 10
11 Größe vs. Komplexität data size Key-Value Stores Column Stores Document Databases Graph Databases 90 % of use cases data complexity 1-11
12 NoSQL Datenmodelle
13 DB Engines Ranking (Ausschnitt) NoSQL Data Stores for Big Data 13
14 Inhaltsverzeichnis NoSQL-Datenbanken Definition und Motivation Kategorisierung, Eigenschaften CAP-Theorem ACID-Eigenschaften BASE-Ansatz 1-14
15 Performantes, verteiltes Datenmanagement Annahmen ( Irrtümer ) der verteilten Datenverarbeitung Das Netzwerk ist ausfallsicher, sicher und homogen Die Latenzzeit ist gleich Null, der Datendurchsatz unendlich und die Kosten des Datentransports können mit Null angesetzt werden Die Netzwerktopologie ist unveränderlich Verteilte Datenverarbeitung erfordert Kommunikation zwischen Knoten u.a. Synchronisation und Replikation Robust gegen Knotenausfälle, Nachrichtenverlust,... Trade-off: Performanz vs. Datenkonsistenz Warten bis alle (relevanten) Knoten synchronisiert sind Vermeidung (oder Auflösung) von Mischkonflikten 1-15
16 CAP-Theorem [Bre00] [GL02] CAP = Consistency, Availability, Partitioning Tolerance Consistency (Konsistenz) System funktioniert entweder voll oder gar nicht ( ACID-Atomarität) Alternativ: Updates werden bei allen relevanten Knoten zur gleichen logischen Zeit durchgeführt, d.h. alle Knoten/Clients sehen zur selben Zeit die selben Daten Availability (Verfügbarkeit) Jede Lese/Schreib-Anfrage an einen non-failing Knoten wird beantwortet, d.h. alle Clients können stets lesen und schreiben. Knotenausfälle beeinflussen nicht die Verfügbarkeit lebender Knoten Partitioning tolerance (Partitionstoleranz) Availability System funktioniert bei Netzwerkpartitionierung trotz Verlust von Nachrichten zwischen Knoten weiter Consistency Partition Tolerance Netzwerk-Partitionierung = Knoten aus einer Partition können nicht mehr mit Knoten aus anderer Partition kommunizieren Theorem: Ein verteiltes System kann maximal 2 der 3 Eigenschaften gleichzeitig erfüllen. 1-16
17 CP AP CAP Theorem - Fälle (CA) Konsistent aber nicht verfügbar bei Netzwerkpartitionierung Transaktionen werden blockiert Vermeidung möglicher Konflikte bei Merge zur Sicherstellung der Konsistenz Verfügbar aber nicht konsistent bei Netzwerkpartitionierung Writes stets möglich auch wenn keine Kommunikation mit anderen Knoten möglich (z.b. Synchronisation) Availability Consistency Partition Tolerance Notwendigkeit der Konfliktauflösung für inkonsistente Daten (verschiedene Versionen des selben Datums an verschiedenen Knoten) AP CP Dynamo/S3 Cassandra MongoDB BigTable HBase Kontroverse: 2 of 3 irreführend, CA gibt es nicht (CAP gilt für verteilte Systemen): CAP Twelve Years Later: How the "Rules" Have Changed Klassifikation der Systeme teilweise schwierig! Please stop calling databases CP or AP NoSQL Data Stores for Big Data Source: Misconceptions about the CAP Theorem 17
18 ACID RDBMS gewährleistet für Transaktionen ACID-Eigenschaften Atomicity Alles oder Nichts -Eigenschaft (Fehlerisolierung) Consistency eine erfolgreiche Transaktion erhält die DB-Konsistenz (Gewährleistung der definierten Integritätsbedingungen) Isolation alle Aktionen innerhalb einer Transaktion müssen vor parallel ablaufenden Transaktionen verborgen werden ( logischer Einbenutzerbetrieb ) Durability Überleben von Änderungen erfolgreich beendeter Transaktionen trotz beliebiger (erwarteter) Fehler garantieren (Persistenz) 1-18 DBS1 VL Prof. Rahm, Uni Leipzig
19 BASE BA - Basically Available Partieller Ausfall einiger Teile des verteilten Systems Rest läuft weiter Ohne Replikation: Bsp. 1 von 10 Servern fällt aus 10 % der Queries schlagen fehl NoSQL DBs mit Replikation (replication level=3, 1 Knotenausfall): Queries können noch beantwortet werden S - Soft State Daten werden letztlich mit aktuelleren Daten überschrieben Überlappung mit E E - Eventually Consistent DB kann in inkonsistenten Zustand kommen Mehrere Kopien (Replika) der Daten auf versch. Servern können für kurzen Zeitraum inkonsistent sein z.b. Nutzer aktualisiert Daten in einer Kopie, aber andere Kopie behält alten Stand Letztendlich aktualisiert der Replikationsmechanismus der NoSQL DB alle Replika Verschiedene Typen: casual consistency, read-your-writes consistency, monotonic read consistency, monotonic write consistency,
20 Konsistenzmodelle Strong Consistency update(x,v2) r(x)=v2 r(x)=v1 r(x)=v2 r(x)=v2 Eventual Consistency t update(x,v2) r(x)=v1 r(x)=v1 r(x)=v2 r(x)=v1 r(x)=v2 r(x)=v1 inconsistency window t 1-20
21 Konsistenzmodelle Read-your-writes Consistency update(x,v2) r(x)=v2 r(x)=v1 r(x)=v1 r(x)=v2 r(x)=v1 Monotonic Read Consistency t update(x,v2) r(x)=v1 r(x)=v1 r(x)=v2 r(x)=v2 r(x)=v2 r(x)=v1 t 1-21
22 ACID vs. BASE [Bre00] Aufgeben der (strengen) Konsistenz und des logischen Einbenutzerbetriebs für Verfügbarkeit und Performanz Konsistenz Verfügbarkeit Prinzip Priorität Evolution ACID streng (stets aktuelle Daten pro Knoten) eingeschränkt (z.b. bei Ausfall des Koordinatorknotens bei 2PC) pessimistisch / konservativ Anwendung kann sich auf Datenqualität verlassen Transaktionen im logischen Einbenutzerbetrieb aufwändig (Schema) BASE 1-22
23 Inhalt der Vorlesung Techniken zum effizienten Management großer un-/semi-strukturierter Datenmengen Verteilte Architekturen zum Storage (Speicherung) Retrieval/Querying (Anfrageverarbeitung) Algorithmen zur Synchronisation (z.b. für Replikation) Realisierung von Transaktionen 1-23
24 Inhaltsverzeichnis (vorläufig) 1. Einführung NoSQL-Datenbanken CAP-Theorem 2. Key-Value Stores Dynamo/Amazon S3 Redis Microsoft Azure Storage 3. Document Stores CouchDB MongoDB 5. Record Stores & RDBMS in der Cloud BigTable/HBase, Cassandra Megastore H-Store/VoltDB Synchronisation Transaktionen 6. Graphdatenmanagement Graphmodell & -algorithmen Graphdatenbanken Parallele Graph-Algorithmen 4. Search Engines Lucene Apache Solr ElasticSearch 1-24
25 Literatur [Bre00] Brewer. Towards robust distributed systems. Proceedings of the Annual ACM Symposium on Principles of Distributed Computing (2000) [GL02] Gilbert and Lynch. Brewer's conjecture and the feasibility of consistent, available, partition-tolerant web services. ACM SIGACT News (2002) 1-25
NoSQL-Datenbanken. Kapitel 1: Einführung. Lars Kolb Sommersemester 2014. Universität Leipzig http://dbs.uni-leipzig.de 1-1
NoSQL-Datenbanken Kapitel 1: Einführung Lars Kolb Sommersemester 2014 Universität Leipzig http://dbs.uni-leipzig.de 1-1 Inhaltsverzeichnis NoSQL-Datenbanken Motivation und Definition Kategorisierung, Eigenschaften
MehrNoSQL. Prof. Dr. Ingo Claßen. Einführung. Kategorisierung von NoSQL-Systemen. Verteilung. Konsistenz. Literatur
NoSQL Prof. Dr. Ingo Claßen Hochschule für Technik und Wirtschaft Berlin Einführung Kategorisierung von NoSQL-Systemen Verteilung Konsistenz Literatur Einführung Warum NoSQL Unterstützung großer Datenmengen
MehrInhaltsverzeichnis. Organisation. Motivation. Übersicht zur Vorlesung. Verteilte Datenbanksysteme. Relationale Datenbanken NoSQL-Datenbanken
Inhaltsverzeichnis Organisation Motivation Relationale Datenbanken -Datenbanken Übersicht zur Vorlesung Verteilte Datenbanksysteme Verfügbarkeit und Serialisierbarkeit Eventual Consistency, Sitzungsgarantien
MehrNoSQL Datenbanken EIN ÜBERBLICK ÜBER NICHT-RELATIONALE DATENBANKEN UND DEREN POTENTIALE IM ALLGEMEINEN UND IN DER INDUSTRIE
NoSQL Datenbanken EIN ÜBERBLICK ÜBER NICHT-RELATIONALE DATENBANKEN UND DEREN POTENTIALE IM ALLGEMEINEN UND IN DER INDUSTRIE Was bedeutet NoSQL? Ein Sammelbegriff für alternative Datenbanklösungen, die
MehrDatenbanksysteme Kapitel 6: Neue Konzepte der Datenbanktechnologie
Datenbanksysteme Kapitel 6: Neue Konzepte der Datenbanktechnologie Prof. Dr. Peter Chamoni Mercator School of Management Lehrstuhl für Wirtschaftsinformatik, insb. Business Intelligence Prof. Dr. Peter
MehrDatenbanksysteme Kapitel 6: Neue Konzepte der Datenbanktechnologie
Datenbanksysteme Kapitel 6: Neue Konzepte der Datenbanktechnologie Prof. Dr. Peter Chamoni Mercator School of Management Lehrstuhl für Wirtschaftsinformatik, insb. Business Intelligence Prof. Dr. Peter
MehrSoziotechnische Informationssysteme
Soziotechnische Informationssysteme 8. NoSQL Relationale Datenbank NoSQL Datenbank Relationale Datenbank? NoSQL Datenbank RDBM 2 Warum? Skalierbarkeit Riesige Datenmengen Performanz und Elastizität Auslastung
MehrÜberblick und Vergleich von NoSQL. Datenbanksystemen
Fakultät Informatik Hauptseminar Technische Informationssysteme Überblick und Vergleich von NoSQL Christian Oelsner Dresden, 20. Mai 2011 1 1. Einführung 2. Historisches & Definition 3. Kategorien von
MehrBig Data & Analytics Nationaler Akademietag, Fulda Referent: Meinhard Lingo
Big Data & Analytics Nationaler Akademietag, Fulda 20.04.2018 Referent: Meinhard Lingo E-Mail: meinhard.lingo@bs1in.de Big Data & Analytics Big Data-Anwendungen: Ein Paradigmenwechsel. Kompetenzen? mögliche
MehrRavenDB, schnell und skalierbar
RavenDB, schnell und skalierbar Big Data & NoSQL, Aydin Mir Mohammadi bluehands GmbH & Co.mmunication KG am@bluehands.de Immer mehr Mehr Performance Mehr Menge Mehr Verfügbarkeit Skalierung http://www.flickr.com/photos/39901968@n04/4864698533/
MehrDatenbanksysteme. Prof. Dr.-Ing. Sebastian Michel TU Kaiserslautern. Wintersemester 2015/16.
Datenbanksysteme Wintersemester 2015/16 Prof. Dr.-Ing. Sebastian Michel TU Kaiserslautern smichel@cs.uni-kl.de MapReduce, Prof. Dr.-Ing. S. Michel TU Kaiserslautern Datenbanksysteme, WS 15/16 2 / 35 MapReduce,
MehrNoSQL-Databases. Präsentation für Advanced Seminar "Computer Engineering", Matthias Hauck, matthias.hauck@stud.uni-heidelberg.de
NoSQL-Databases Präsentation für Advanced Seminar "Computer Engineering", Matthias Hauck, matthias.hauck@stud.uni-heidelberg.de Klassische SQL-Datenbanken Anwendungsgebiet: Geschäftsanwendungen Behördenanwendungen
MehrNoSQL Andere Wege in der Speicherung von Geodaten?
NoSQL Andere Wege in der Speicherung von Geodaten? Holger Baumann, Agenda Status Quo Speicherung von Geodaten in SQL-Datenbanken Datenbanken im Web Umfeld Verteilte Datenbanken Begriff und Klassifizierung
MehrSoziotechnische Systeme Sommer Soziotechnische Informationssysteme. 8. SQL und NoSQL. Die gute alte Zeit. (c) Peter Sturm, Universität Trier 1
Soziotechnische Informationssysteme 8. SQL und NoSQL Die gute alte Zeit (c) Peter Sturm, Universität Trier 1 Relationale Datenbank (c) Peter Sturm, Universität Trier 2 RDBMs 1970, IBM Edgar Codd Persistente
MehrDatenbanken und Datenbanktypen Tag 1 : Kapitel 1. Christian Inauen. Lernziele. Entwicklung der Datenbanken.
Tag 1 : und 10.08.2015 Jede/r Lernende... kann in eigenen Worten die Entstehung von erläutern kennt die verschiedenen Arten von mit entsprechenden Eigenschaften kann die Abkürzungen ACID, BASE und CAP
MehrKapitel 4 Teil 2 NoSQL-Datenbanksysteme
Kapitel 4 Teil 2 NoSQL-Datenbanksysteme Inhalt: CAP (Consistency/Availability/Partition-Tolerance); BASE (Basically Available, Soft State, Eventually Consistent); Datenmodelle: Key-Value-Stores, Spaltenbasierte
MehrStefan Edlich, Achim Friedland, Jens Hampe, Benjamin Brauer. NoSQL. Einstieg in die Welt nichtrelationaler Web 2.0 Datenbanken ISBN:
sverzeichnis Stefan Edlich, Achim Friedland, Jens Hampe, Benjamin Brauer NoSQL Einstieg in die Welt nichtrelationaler Web 2.0 Datenbanken ISBN: 978-3-446-42355-8 Weitere Informationen oder Bestellungen
MehrSkalierbare Webanwendungen
Skalierbare Webanwendungen Thomas Bachmann Lead Software Architect & CIO Mambu GmbH Twitter: @thobach Anwendungsbeispiel Hohe Nichtfunktionale Anforderungen Sicherheit Vertraulichkeit Integrität Verfügbarkeit
MehrAnforderungen von Cloud-Anwendungen an Datenbanksysteme
Anforderungen von Cloud-Anwendungen an Datenbanksysteme Andreas Göbel Friedrich-Schiller-Universität Jena Lehrstuhl für Datenbanken und Informationssysteme 06.05.2010 AGENDA 1. Einleitung 2. Anforderungen
MehrNoSQL. Was Architekten beachten sollten. Dr. Halil-Cem Gürsoy adesso AG. Architekturtag @ SEACON 2012 Hamburg
NoSQL Was Architekten beachten sollten Dr. Halil-Cem Gürsoy adesso AG Architekturtag @ SEACON 2012 Hamburg 06.06.2012 Agenda Ein Blick in die Welt der RDBMS Klassifizierung von NoSQL-Datenbanken Gemeinsamkeiten
MehrANALYTICS, RISK MANAGEMENT & FINANCE ARCHITECTURE. NoSQL Datenbanksysteme Übersicht, Abgrenzung & Charakteristik
ARFA ANALYTICS, RISK MANAGEMENT & FINANCE ARCHITECTURE NoSQL Datenbanksysteme Übersicht, Abgrenzung & Charakteristik Ralf Leipner Domain Architect Analytics, Risk Management & Finance 33. Berner Architekten
MehrNeues aus der nicht-, semi- und relationalen Welt
Neues aus der nicht-, semi- und relationalen Welt Information Management Thomas Klughardt Senior System Consultant Das Big Data Problem Was bedeutet Big Data? Performancekritisch Echtzeit Cold Storage
MehrOracle Big Data Technologien Ein Überblick
Oracle Big Data Technologien Ein Überblick Ralf Lange Global ISV & OEM Sales NoSQL: Eine kurze Geschichte Internet-Boom: Erste Ansätze selbstgebauter "Datenbanken" Google stellt "MapReduce"
MehrNon-Standard-Datenbanken Von NoSQL zu NewSQL
Non-Standard-Datenbanken Von NoSQL zu NewSQL Prof. Dr. Ralf Möller Universität zu Lübeck Institut für Informationssysteme Dennis Heinrich (Übungen) Big Data 2 NoSQL: Not Only SQL? Datenmengen werden groß
MehrNoSQL. Hintergründe und Anwendungen. Andreas Winschu
NoSQL Hintergründe und Anwendungen Andreas Winschu 1 Inhalt 1. Motivation 2. RDBMS 3. CAP Theorem 4. NoSQL 5. NoSql Overview 6. NoSQl Praxis 7. Zusammenfassung und Ausblick 2 1.Motivation Datenbanken Permanente
MehrBrewer s Conjecture and the Feasibility of Consistent, Available, Partition-Tolerant Web Services Sigact News, 33(2), June 2002
Brewer s Conjecture and the Feasibility of Consistent, Available, Partition-Tolerant Web Services Sigact News, 33(2), June 2002 Seth Gilbert Nancy Lynch Brewer s Conjecture and the Feasibility of Consistent,
MehrDas diesem Dokument zugrundeliegende Vorhaben wurde mit Mitteln des Bundesministeriums für Bildung und Forschung unter dem Förderkennzeichen
Das diesem Dokument zugrundeliegende Vorhaben wurde mit Mitteln des Bundesministeriums für Bildung und Forschung unter dem Förderkennzeichen 16OH21005 gefördert. Die Verantwortung für den Inhalt dieser
MehrInhaltsverzeichnis. Stefan Edlich, Achim Friedland, Jens Hampe, Benjamin Brauer, Markus Brückner. NoSQL
sverzeichnis Stefan Edlich, Achim Friedland, Jens Hampe, Benjamin Brauer, Markus Brückner NoSQL Einstieg in die Welt nichtrelationaler Web 2.0 Datenbanken ISBN: 978-3-446-42753-2 Weitere Informationen
MehrFakultät für Informatik & Wirtschaftsinformatik DB & IS II SS 2015. NoSQL. http://www.w3resource.com/mongodb/nosql.php. Dr. Christian Senger.
NoSQL http://www.w3resource.com/mongodb/nosql.php NoSQL 1 Short History of Databases 1960s - Navigational DBs CODEASYL (COBOL) IMS (IBM) 1980s to 1990s - Object Oriented DBs Object DB's Object-Relational-
MehrTransaktionsverwaltung
Kapitel l2 Transaktionsverwaltung Skript 2009 Matthias Schubert Dieses Skript basiert auf dem Skript zur Vorlesung Datenbanksysteme II von Prof. Dr. Christian Böhm gehalten im Sommersemester 2007 an der
MehrNoSQL Datenbanken. Seminar:Software as a Service, Cloud-Computing und aktuelle Entwicklungen Dozent: Dipl. Inf. Andreas Göbel
NoSQL Datenbanken Seminar:Software as a Service, Cloud-Computing und aktuelle Entwicklungen Dozent: Dipl. Inf. Andreas Göbel 17. Juni 2010 Gliederung Der Begriff NoSQL Wichtige Konzepte NoSQL-Arten Cassandra
MehrEine Einführung in Apache CouchDB. Java-Forum Stuttgart 2011
Eine Einführung in Apache CouchDB Java-Forum Stuttgart 2011 Johannes Schneider, cedarsoft GmbH js@cedarsoft.com http://blog.cedarsoft.com http://cedarsoft.com Vielen Dank CouchDB The VERY Basics Vorerfahrung?
MehrWeb Technologien NoSQL Datenbanken
Web Technologien NoSQL Datenbanken Univ.-Prof. Dr.-Ing. Wolfgang Maass Chair in Information and Service Systems Department of Law and Economics WS 2011/2012 Wednesdays, 8:00 10:00 a.m. Room HS 021, B4
MehrSQL- & NoSQL-Datenbanken. Speichern und Analysen von großen Datenmengen
SQL- & NoSQL-Datenbanken Speichern und Analysen von großen Datenmengen 1 04.07.14 Zitat von Eric Schmidt (Google CEO): There was 5 exabytes of information created between the dawn of civilization through
MehrPolyglot Persistence und NoSQL
Polyglot Persistence und NoSQL Mehr Flexibilität, mehr Komplexität!? Stefan Kühnlein Solution Architekt OPITZ CONSULTING GmbH Nürnberg, 18.11.2014 OPITZ CONSULTING GmbH 2014 Seite 1 Agenda 1. Rückblick
MehrInformationssysteme für Ingenieure
Informationssysteme für Ingenieure Vorlesung Herbstsemester 2016 Überblick und Organisation R. Marti Organisation Web Site: http://isi.inf.ethz.ch Dozent: Robert Marti, martir ethz.ch Assistenz:??
Mehr2. Architektur verteilter Datenbanksysteme
2. Architektur verteilter Datenbanksysteme Verteilte Datenbank, kurz DDB (engl. distributed database): eine Sammlung logisch zusammengehöriger Datenbanken, welche über Rechnerknoten ( Sites ) verteilt
MehrBig Data und Oracle bringen die Logistik in Bewegung
OPITZ CONSULTING Deutschland GmbH Dortmund, 07.05.2014 Bild-Quelle: Web-Seite von Pasta ZARA, Big Artikel Data So und entstehen Oracle bringen unsere die Nudeln Logistik in Bewegung http://de.pastazara.com/so-entstehen-unsere-nudeln
MehrStefan Edlich Achim Friedland Jens Rampe Benjamin Brauer. NoSQL. Einstieg in die Welt nichtrelationaler Web 2.0 Datenbanken HANSER
Stefan Edlich Achim Friedland Jens Rampe Benjamin Brauer NoSQL Einstieg in die Welt nichtrelationaler Web 2.0 Datenbanken HANSER Geleitwort 1 Vorwort 1 1 Einführung 1 1.1 Historie 1 1.2 Definition und
MehrAufbau eines Clusters mit der NoSQL- Datenbank MongoDB auf Basis von Einplatinencomputern
Fachbereich 2 Informatik und Ingenieurwissenschaften Im Studiengang Informatik Aufbau eines Clusters mit der NoSQL- Datenbank MongoDB auf Basis von Einplatinencomputern Kolloquium zur Bachelorthesis Danijel
MehrHochverfügbare Webanwendungen mit Apache Cassandra. msg systems ag, 26. November 2014
R8 Hochverfügbare Webanwendungen mit Apache Cassandra 1 Forschung zu Wirtschaft 2 Name R8 Name R8 3 Applikations-Framework Big-Data-Framework für besonders anspruchsvolle Kunden 4 derzeitige Architekturen
MehrEigenschaften von TAs: ACID-Prinzip
Transaktionsparadigma Definition: Transaktion ununterbrechbare Folge von DML-/DDL-Befehlen begin transaction --- end transaction begin: meist implizit mit ersten Datenbankzugriff end: commit (work) oder
MehrKapitel 2 Transaktionsverwaltung. Skript 2009 Matthias Schubert
Kapitel 2 Transaktionsverwaltung Skript 2009 Matthias Schubert Dieses Skript basiert auf dem Skript zur Vorlesung Datenbanksysteme II von Prof. Dr. Christian Böhm gehalten im Sommersemester 2007 an der
MehrDatenmodellierung VU Einführung SS 2015
184.685 Datenmodellierung VU, Einführung SS 2015 184.685 Datenmodellierung VU Einführung SS 2015 Dr. Sebastian Skritek Institut für Informationssysteme Technische Universität Wien Dr. Sebastian Skritek
MehrSchneller als Hadoop?
Schneller als Hadoop? Einführung in Spark Cluster Computing 19.11.2013 Dirk Reinemann 1 Agenda 1. Einführung 2. Motivation 3. Infrastruktur 4. Performance 5. Ausblick 19.11.2013 Dirk Reinemann 2 EINFÜHRUNG
MehrDatenmodellierung VU Einführung SS 2016
184.685 Datenmodellierung VU Einführung SS 2016 Nysret Musliu, Sebastian Skritek Institut für Informationssysteme Technische Universität Wien Nysret Musliu, Sebastian Skritek Seite 1 1. Motivation Motivation
MehrSODA. Die Datenbank als Document Store. Rainer Willems. Master Principal Sales Consultant Oracle Deutschland B.V. & Co. KG
SODA Die Datenbank als Document Store Rainer Willems Master Principal Sales Consultant Oracle Deutschland B.V. & Co. KG vs No Anforderungskonflikte Agile Entwicklung Häufige Schema-Änderungen Relationales
MehrP2P DATENBANKEN. Anwendungen 1 WS 2009/2010. Julissa Cusi Juarez. Department Informatik
P2P DATENBANKEN Anwendungen 1 WS 2009/2010 Julissa Cusi Juarez Department Informatik HAW Hamburg 02.12.2009 1 Agenda 1. Motivation 2. Klassische Datenbanksysteme 3. Verteilte Datenbanksysteme 4. Peer to
MehrNoSQL HANSER. Einstieg in die Web 2.0 Datenbanken. Stefan Edlich Achim Friedland Jens Hampe Benjamin Brauer Markus Brückner
Stefan Edlich Achim Friedland Jens Hampe Benjamin Brauer Markus Brückner NoSQL Einstieg in die Web 2.0 Datenbanken 2., akutalisierte und erweiterte Auflage HANSER Geleitwort Vorwort Vorwort zur 2. Auflage
MehrDatenbanksysteme Kapitel 6: Neue Konzepte der Datenbanktechnologie
Datenbanksysteme Kapitel 6: Neue Konzepte der Datenbanktechnologie Prof. Dr. Peter Chamoni Mercator School of Management Lehrstuhl für Wirtschaftsinformatik, insb. Business Intelligence Prof. Dr. Peter
MehrNoSQL & Big Data. NoSQL Databases and Big Data. NoSQL vs SQL DBs. NoSQL DBs - Überblick. Datenorientierte Systemanalyse. Gerhard Wohlgenannt
NoSQL & Big Data Datenorientierte Systemanalyse NoSQL Databases and Big Data Gerhard Wohlgenannt Die besprochenen Systeme haben nicht den Anspruch und das Ziel DBS zu ersetzen, sondern für gewisse Anwendungsfälle
MehrNoSQL Databases and Big Data
Datenorientierte Systemanalyse NoSQL Databases and Big Data Gerhard Wohlgenannt NoSQL & Big Data Die besprochenen Systeme haben nicht den Anspruch und das Ziel DBS zu ersetzen, sondern für gewisse Anwendungsfälle
MehrPostgreSQL im Cluster. Hans-Jürgen Schönig Hans-Jürgen Schönig
PostgreSQL im Cluster Über uns PostgreSQL Dienstleistungen Cybertec bietet Ihnen... 24x7 Support für PostgreSQL PostgreSQL Consulting Performance Tuning PostgreSQL Training Cloud & Clustering PostgreSQL
MehrNoSQL. Einblick in die Welt nicht-relationaler Datenbanken. Christoph Föhrdes. UnFUG, SS10 17.06.2010
NoSQL Einblick in die Welt nicht-relationaler Datenbanken Christoph Föhrdes UnFUG, SS10 17.06.2010 About me Christoph Föhrdes AIB Semester 7 IRC: cfo #unfug@irc.ghb.fh-furtwangen.de netblox GbR (http://netblox.de)
MehrDRYING UP THE DATA SWAMP. Vernetzung von Daten mittels iqser GIN Server
DRYING UP THE DATA SWAMP Vernetzung von Daten mittels iqser GIN Server Florian Pfleiderer Solution Engineer bei dibuco SchwerpunkteBig Data und Cloud Architekturen Erfahrungen in der Produktentwicklung
MehrRein relationale DB in Prod? Datenbanken in produktiven Einsatz? SQL + NoSQL DB in Prod? (MongoDB, Redis, CouchDB, Cassandra)
1 Rein relationale DB in Prod? Datenbanken in produktiven Einsatz? 2 SQL + NoSQL DB in Prod? (MongoDB, Redis, CouchDB, Cassandra) 3 DB-Cluster in der Cloud? NoSQL?!? SQL Normalformen Come as you are Warum
MehrThe R(E)volution of Data Stores
The R(E)volution of Data Stores Willkommen Schön, dass sie in diese Session kommen, ich bin Dominik Wagenknecht NoSQL Initiative Lead Technology Architect Accenture Wien Mobil: +43 676 8720 33921 dominik.wagenknecht@accenture.com
MehrBig Data Mythen und Fakten
Big Data Mythen und Fakten Mario Meir-Huber Research Analyst, IDC Copyright IDC. Reproduction is forbidden unless authorized. All rights reserved. About me Research Analyst @ IDC Author verschiedener IT-Fachbücher
Mehr6.4 Nicht-Relationale Datenbanksysteme
6.4 Nicht-Relationale Datenbanksysteme In den letzten 10+ Jahren ist eine Vielzahl verschiedenartiger nicht-relationaler Datenbanksysteme entstanden Einen Überblick über die verschiedenen entstandenen
Mehranwendungen programmieren Datenbank entwerfen & Implementierung Analyse bis zur SQL- NoSQL-Datenbanken Uwe Klug Mit einer Einführung in 2.
Uwe Klug Datenbank anwendungen entwerfen & programmieren Von der objektorientierten Analyse bis zur SQL- Implementierung Mit einer Einführung in NoSQL-Datenbanken 2. Auflage W3L-Verlag Herdecke Witten
Mehrdaniel.kreuzhofer@microsoft.com Image source http://commons.wikimedia.org/wiki/file:modern_warehouse_with_pallet_rack_storage_system.jpg Definitionen Azure Region Eine Ansammlung von Rechenzentren, die
MehrNoSQL Datenbanken PI Datenorientierte Systemanalyse, WS 2014/15. LV Datenorientierte Systemanalyse, WS 2014/15
NoSQL Datenbanken LV Datenorientierte Systemanalyse, WS 2014/15 Dr. Walter Ebner, Institut für Informationswirtschaft Wirtschaftsuniversität Wien Überblick Abgrenzung zu relationalen
MehrAktuelle SE Praktiken für das WWW
Aktuelle SE Praktiken für das WWW SQL vs. NoSQL W. Mark Kubacki 23.06.2010 Gliederung Zusammenfassung Entstehungsgeschichte SQL vs. NoSQL Systemarchitekturen und Wachstumsmuster SQL NoSQL Überblick und
MehrThomas Matzner Berater für Systemanalyse Couchbase. Java User Group München
Thomas Matzner Berater für Systemanalyse www.tamatzner.de Couchbase Java User Group München 18. 1. 2016 Überblick Warum Couchbase bei der Einkaufszettel- App? Eigenschaften von Couchbase Entwicklung mit
MehrBig Data Management Thema 14: Cassandra
Thema 14: Cassandra Jan Kristof Nidzwetzki Thema 14: Cassandra 1 / 25 Übersicht 1 Grundlagen Überblick Geschichte Datenmodel 2 Architektur Der logische Ring Persistenz der Daten Tunable Consistency Read
MehrDarko Križić. NoSQL Datenbanken
Darko Križić NoSQL Datenbanken Ihr Referent Darko Križić Chief Technical Officer Enterprise Architecture Java Enterprise EdiCon High Availability ESB (Talend ESB) NoSQL (MongoDB, CouchDB) NoSQL Datenbanken
MehrKonsistenzproblematik bei der Cloud-Datenspeicherung
Konsistenzproblematik bei der Cloud-Datenspeicherung ISE Seminar 2012 Adrian Zylla 1 Cloud Bereitstellung von Speicher- und Rechenkapazität Die Cloud ist für den Anwender eine Blackbox Besitzt drei Servicemodelle
MehrDatenbanken. Grundlagen
Datenbanken Grundlagen Dozent: Diana Troancă E-mail: dianat [at] cs.ubbcluj.ro Website: www.cs.ubbcluj.ro/~dianat/ Fragen und Feedback sind immer erwünscht: per e-mail oder per persönlichem Gespräch Anonymes
MehrVerteilte Systeme. Replikation & Konsistenz I. Prof. Dr. Oliver Haase
Verteilte Systeme Replikation & Konsistenz I Prof. Dr. Oliver Haase 1 Überblick Replikation & Konsistenz I Ziele von Replikation Replikationsmodelle datenzentriert Client-zentriert Replikation & Konsistenz
MehrGlossar. Springer Fachmedien Wiesbaden 2016 D. Fasel, A. Meier (Hrsg.), Big Data, Edition HMD, DOI /
Glossar Abfragesprache Eine Abfragesprache erlaubt, Datenbanken durch die Anga be von Selektionsbedingungen, eventuell mengenorientiert, auszuwerten. ACID Die Abkürzung ACID steht für Atomicity, Consistency,
MehrSchema-Management ohne Schema? Schema-Verwaltung in NoSQL- Datenbanksystemen
Schema-Management ohne Schema? - Schema-Verwaltung in NoSQL- Datenbanksystemen Einführung Schema-Flexibilität Keine (Vorab-) Definition eines Schemas Schema-Management ohne Schema??? Implizites Schema
MehrWide column-stores für Architekten
Wide column-stores für Architekten Andreas Buckenhofer Daimler TSS GmbH Ulm Schlüsselworte Big Data, Hadoop, HBase, Cassandra, Use Cases, Row Key, Hash Table NoSQL Datenbanken In den letzten Jahren wurden
MehrWiederholung VU Datenmodellierung
Wiederholung VU Datenmodellierung VL Datenbanksysteme Reinhard Pichler Arbeitsbereich Datenbanken und Artificial Intelligence Institut für Informationssysteme Technische Universität Wien Wintersemester
MehrDatenbanken und SQL. Kapitel 1. Übersicht über Datenbanken. Edwin Schicker: Datenbanken und SQL (1)
Datenbanken und SQL Kapitel 1 Übersicht über Datenbanken Übersicht über Datenbanken Vergleich: Datenorganisation versus Datenbank Definition einer Datenbank Bierdepot: Eine Mini-Beispiel-Datenbank Anforderungen
MehrDatenbanken als Grundlage für Informationssysteme
Datenbanken als Grundlage für Informationssysteme Datenmodellierung und Datenbanksysteme Prof. Dr. Ingo Claßen Peter Morcinek Prof. Dr. Martin Kempa Hochschule für Technik und Wirtschaft Berlin Informationssysteme
MehrWiederholung VU Datenmodellierung
Wiederholung VU Datenmodellierung VU Datenbanksysteme Reinhard Pichler Arbeitsbereich Datenbanken und Artificial Intelligence Institut für Informationssysteme Technische Universität Wien Wintersemester
MehrFast Analytics on Fast Data
Fast Analytics on Fast Data Kudu als Storage Layer für Banking Applikationen Problem Klassischer Kreditprozess Beantragung in der Filiale Aufwendiger Prozess Nachweis durch Dokumente Manuelle Bewilligung
MehrKapitel 1: Wiederholungsfragen Grundlagen DBS
Grundlagen DBS 1. Welche zentralen Anforderungen an ein DBS definierte Edgar Codd? 2. Was ist eine Transaktion? 3. Welche Eigenschaften muss das DBMS bei der Transaktionsverarbeitung sicherstellen? 4.
MehrDatabaseHypervisor einansatz für relationale Datenbanken in der Cloud
DatabaseHypervisor einansatz für relationale Datenbanken in der Cloud Benjamin Schmidt Zimory GmbH Stralauer Platz 33-34 10243 Berlin schmidt@zimory.com Abstract: Aktuelle Cloud-Produkte und Infrastrukturen
MehrVerteilte Systeme. Diffusionsalgorithmen. Secure Identity Research Group
Verteilte Systeme Diffusionsalgorithmen Diffusionsalgorithmen Definition: Ein verteilter Diffusionsalgorithmus auf einem Beliebigen Graphen startet in einem Zustand, in dem alle Knoten des Graphen idle
Mehr1. Einleitung. 1 1Exabyte=10 18 Bytes = Bytes
1. Einleitung Das aktuelle Jahrzehnt wird als Zeitalter der Daten bezeichnet [Whi09, S. 1]. Die Menge der weltweit existierenden Daten ist in den letzten Jahren stark angewachsen. Eine Studie des amerikanischen
MehrNoSQL & MongoDB Avision GmbH Dr. Gernot Pfanner
NoSQL & MongoDB Inhalt Grundlagen Datenbanken Wozu Datenbanken? Relationales Datenbankmodell NoSQL Grundlagen Grundlegende Einteilung CAP-Theorem SQL vs. NoSQL Der Weg zur richtigen DB MongoDB Zusammenfassung
MehrDatenbanken Grundlagen und Design
Frank Geisler Datenbanken Grundlagen und Design 3., aktualisierte und erweiterte Auflage mitp Vorwort 15 Teil I Grundlagen 19 i Einführung in das Thema Datenbanken 21 i.i Warum ist Datenbankdesign wichtig?
MehrBibliothekssysteme / Verbundsysteme / Netze
Bibliothekssysteme / Verbundsysteme / Netze Teil 2: Systemkonzeptionen / Neue Tendenzen Kaderkurs für Diplombibliothekarinnen und Diplombibliothekare 2002-03-27 Programm 2002-03-27 1105-1120 Systemarchitektur
MehrMehrrechner-Datenbanksysteme (Verteilte und Parallele DBS)
Mehrrechner-Datenbanksysteme (Verteilte und Parallele DBS) Prof. Dr. E. Rahm Wintersemester 2017/2018 Universität Leipzig Institut für Informatik http://dbs.uni-leipzig.de WS17/18, Prof. Dr. E. Rahm 0-1
Mehr1. Einführung. Datenbanken Grundlagen
1. Einführung Datenbanken Grundlagen Wo finden wir Datenbanken? Was sind Datenbanken/ Datenbankensysteme(DBS)? A collection of related data items mit folgenden Eigenschaften: Eine Datebank repräsentiert
MehrKapitel 1 Grundlagen. Skript zur Vorlesung: Datenbanksysteme II Sommersemester Vorlesung: PD Dr. Peer Kröger
LUDWIG- MAXIMILIANS- UNIVERSITY MUNICH DEPARTMENT INSTITUTE FOR INFORMATICS DATABASE Skript zur Vorlesung: Datenbanksysteme II Sommersemester 2016 Kapitel 1 Grundlagen Vorlesung: PD Dr. Peer Kröger http://www.dbs.ifi.lmu.de/cms/datenbanksysteme_ii
MehrZusammenfassung. Vorlesung Webbasierte Informationssysteme (CS4130) Zusammenfassung
/ Vorlesung Webbasierte Informationssysteme (CS4130) Privatdozent Dr. rer. nat. habil. Sven Groppe https://www.ifis.uni-luebeck.de/index.php?id=groppe / 2 / 15 Chronologische Übersicht über die Themen
Mehr25.09.2014. Zeit bedeutet eine Abwägung von Skalierbarkeit und Konsistenz
1 2 Dies ist ein Vortrag über Zeit in verteilten Anwendungen Wir betrachten die diskrete "Anwendungszeit" in der nebenläufige Aktivitäten auftreten Aktivitäten in einer hochgradig skalierbaren (verteilten)
MehrOracle Big Data Technologien Ein Überblick
Oracle Big Data Technologien Ein Überblick Jürgen Vester Oracle Deutschland B.V. & Co KG Um was geht es bei Big Data? Bei Big Data sprechen wir eine Klasse von Daten an, die in der
MehrWirtschaftsinformatik 7a: Datenbanken. Hochschule für Wirtschaft und Recht SS 16 Dozent: R. Witte
Wirtschaftsinformatik 7a: Datenbanken Hochschule für Wirtschaft und Recht SS 16 Dozent: R. Witte Drei Gäste bezahlen nach einem gemeinsamen Abendessen eine Rechnung von 30 Euro, so dass jeder 10 Euro gibt.
MehrEinführung in Hauptspeicherdatenbanken
Einführung in Hauptspeicherdatenbanken Harald Zankl Probevorlesung 13. 01., 13:15 14:00, HS C Inhaltsverzeichnis Organisation Überblick Konklusion Harald Zankl (LFU) Hauptspeicherdatenbanken 2/16 Organisation
MehrISBN: Herstellung: Diplomica Verlag GmbH, Hamburg, 2011
Nils Petersohn Vergleich und Evaluation zwischen modernen und traditionellen Datenbankkonzepten unter den Gesichtspunkten Skalierung, Abfragemöglichkeit und Konsistenz Diplomica Verlag Nils Petersohn Vergleich
MehrR.I.P Oracle-Datenbank. ggg
R.I.P Oracle-Datenbank ggg DOAG Konferenz + Ausstellung - Nürnberg 16. November 2016 Jedes IT-Projekt benötigt eine Datenbank 2 Große Websites, aber... 3 Gartner Studie 4 DB-Engines Ranking 5 Anwendungsfall
MehrBig Data Neue Erkenntnisse aus Daten gewinnen
Big Data Neue Erkenntnisse aus Daten gewinnen Thomas Klughardt Senior Systems Consultant 0 Software Dell Software Lösungsbereiche Transform Inform Connect Data center and cloud management Foglight APM,
MehrSinn (und Unsinn) für Informix Benutzer
NoSQL : Sinn (und Unsinn) für Informix Benutzer Martin Fürderer IBM Informix Entwicklung München Agenda Was bedeutet NoSQL für Informix Benutzer? Was bedeutet NoSQL? Fragen? Welche NoSQL Funktionalität
MehrTeam: Felix Gessert, Florian Bücklers, Hannes Kuhlmann, Malte Lauenroth, Michael Schaarschmidt. 19. August 2014
Team: Felix Gessert, Florian Bücklers, Hannes Kuhlmann, Malte Lauenroth, Michael Schaarschmidt 19. August 2014 Presentation is loading Das Ladezeit-Problem Loading Durchschnitt: 9,3s -20% Traffic -9% Besucher
Mehr