Datenbanksysteme Kapitel 6: Neue Konzepte der Datenbanktechnologie
|
|
- Reinhold Adenauer
- vor 5 Jahren
- Abrufe
Transkript
1 Datenbanksysteme Kapitel 6: Neue Konzepte der Datenbanktechnologie Prof. Dr. Peter Chamoni Mercator School of Management Lehrstuhl für Wirtschaftsinformatik, insb. Business Intelligence Prof. Dr. Peter Chamoni - Prof. Datenbanksysteme Dr. Peter Chamoni - Wintersemester 2014/2015 1
2 Gliederung 1 Grundlagen - Datenbanksysteme 2 SQL Data Definition Language 3 Datenorganisation 4 Datenintegrität und Transaktionsverwaltung 5 SQL Data Manipulation Language 6 Neue Konzepte der Datenbanktechnologie Prof. Dr. Peter Chamoni Datenbanksysteme 2
3 Gliederung 6 Neue Konzepte der Datenbanktechnologie 6.1 Business Intelligence Infrastruktur 6.2 In Memory Computing 6.3 NoSQL Datenbanksysteme Grenzen relationaler Datenbanksysteme NoSQL Ausgewählte Grundlagen Klassifikation von NoSQL-Systemen Prof. Dr. Peter Chamoni Datenbanksysteme 3
4 6.1 Business Intelligence Infrastruktur Eine moderne BI-Infrastruktur verfügt über eine Vielzahl von Tools, um unternehmensrelevante Daten - sowohl in strukturierter, semistrukturierter wie auch unstrukturierter Form aus zahlreichen, unterschiedlichen Datenquellen zu erheben, aufzubereiten, zu speichern und auf diese Weise für Analysen nutzbar zu machen. Zu diesen Werkzeugen gehören u.a. Data Warehouses und Data Marts, In Memory Computing, Hadoop, Analytics Plattformen u.v.m. Laudon,K., Laudon,J.,Schoder D: Wirtschaftsinformtik (2016). Prof. Dr. Peter Chamoni Datenbanksysteme 4
5 6.1 Business Intelligence Infrastruktur Unternehmensanwendungen werden traditionell in operative Systeme: OLTP (Online Transactional Processing) und analytische Systeme: OLAP (Online Analytical Processing) aus Performance-Gründen unterteilt. OLTP zur Unterstützung von Geschäftsprozessen im Tagesgeschäft OLAP zur Unterstützung der Auswertung von Geschäftsdaten Prof. Dr. Peter Chamoni Datenbanksysteme 5
6 6.1 Business Intelligence Infrastruktur OLTP versus OLAP Prof. Dr. Peter Chamoni Datenbanksysteme 6
7 Gliederung 6 Neue Konzepte der Datenbanktechnologie 6.1 Business Intelligence Infrastruktur 6.2 In Memory Computing 6.3 NoSQL Datenbanksysteme Grenzen relationaler Datenbanksysteme NoSQL Ausgewählte Grundlagen Klassifikation von NoSQL-Systemen Prof. Dr. Peter Chamoni Datenbanksysteme 7
8 6.2 In Memory Computing In Memory Computing (I) Eine Möglichkeit, die Analyse von großen Datenvolumina performanter zu gestalten, besteht im Einsatz des In Memory Computing, bei dem primär der Arbeitsspeicher des Computers (RAM) zum Speichern der Daten verwendet wird. Die Nutzer greifen direkt auf die Daten im Arbeitsspeicher zu, der deshalb auch als Direktzugriffsspeicher bezeichnet wird. Bei der In-Memory-Verarbeitung können sehr große Datenmengen, die den Umfang eines Data Mart oder eines kleinen Data Warehouse haben, gänzlich im Speicher gehalten werden (Hauptspeicherdatenbanken). Durch den Einsatz von In Memory Computing können Unternehmen die Nutzung des Arbeitsspeichers optimieren und die Rechenleistung bei gleichzeitiger Senkung der Kosten beschleunigen. nicht-flüchtig Prof. Dr. Peter Chamoni Datenbanksysteme 8
9 6.2 In Memory Computing In Memory Computing (II) Technologische Konzepte Neue Techniken sind notwendig: um verschiedene Arten von Mehraufwand zu vermeiden, ABER: gleichzeitig die ACID-Eigenschaften der Transaktionsverarbeitung zu gewährleisten. Technologisch liegen Hauptspeicherdatenbanken die folgenden Konzepte zugrunde: Datenhaltung im Hauptspeicher Um die Zugriffszeiten niedrigerer Ebenen zu eliminieren, werden beim Start alle benötigten Daten in den Hauptspeicher geladen. Zur Gewährleistung der ACID-Eigenschaften - besonders im Falle nicht vermeidbarer Fehler und Ausfälle - werden die Log-Dateien im nicht-flüchtigen Speicher gehalten. Auf diesen Daten können dann Transaktionskontroll- und Wiederherstellungsmechanismen aufsetzen. nicht-flüchtig Prof. Dr. Peter Chamoni Datenbanksysteme 9
10 6.2 In Memory Computing In Memory Computing (III) Technologische Konzepte Zeilen- und spaltenweise Speicherung von Datensätzen Während spaltenorientierte Datenbanken tendenziell für analytische Systeme geeigneter sind, zeilenorientierte Datenbanken dagegen für operative Systeme, erscheint für kombinierte Systeme eine hybride Technik sinnvoll. Tabelle Row Store Column Store Prof. Dr. Peter Chamoni Datenbanksysteme 10
11 6.2 In Memory Computing In Memory Computing (IV) Technologische Konzepte Spaltenorientierte Datenorganisation Das Lesen und Einfügen eines vollständigen Datensatzes erfordert relativ aufwendige Zugriffe auf sämtliche, unabhängig gespeicherte Spalten. Column Store Bei einer Anfrageverarbeitung werden jetzt nur wirklich benötigte Attribute in den Hauptspeicher transferiert. Attributwerte einzelner Spalten sind oft so homogen, dass leichtgewichtige Kompressionsverfahren wie z.b. Dictionary-Encoding zu signifikanten Kompressionsraten führen. Standardrepertoire spaltenorientierter Datenbanken: Komprimierte Datenhaltung in Verbindung mit Anfrageverarbeitungstechniken, die auf komprimierten Daten operieren können. Die Vorteile spaltenorientierter Datenhaltung sind so groß, dass viele relationale Datenbanken sie heutzutage zumindest als Option anbieten. Prof. Dr. Peter Chamoni Datenbanksysteme 11
12 6.2 In Memory Computing In Memory Computing (V) Technologische Konzepte Zeilen- und Spaltenorientierte Speicherung von Datensätzen Beispiel (1) Verkauf Monat Land Produkt Betrag DE P DE P AF P DE P Prof. Dr. Peter Chamoni - Datenbanksysteme 12
13 6.2 In Memory Computing In Memory Computing (VI) Technologische Konzepte Zeilen- und Spaltenorientierte Speicherung von Datensätzen Beispiel (2) Verkauf zeilenorientiert SELECT SUM(Betrag) FROM Verkauf WHERE Monat > ; Ausgabe: 350 Verkauf spaltenorientiert Prof. Dr. Peter Chamoni - Datenbanksysteme 13
14 6.2 In Memory Computing In Memory Computing (VII) Technologische Konzepte Zeilen- und Spaltenorientierte Speicherung von Datensätzen Beispiel (3) Verkauf zeilenorientiert SELECT * FROM Verkauf WHERE Monat > ; Verkauf spaltenorientiert Ausgabe: Monat Land Produkt Betrag DE P AF P DE P Prof. Dr. Peter Chamoni - Datenbanksysteme 14
15 6.2 In Memory Computing In Memory Computing (VIII) Technologische Konzepte Nur Einfügeoperationen in der Datenbank Insert-Only-Datenbanken definieren eine Kategorie von DBMS, bei der neue Datensätze grundsätzlich nur hinzugefügt werden. Modifizierende Operationen (ändern, löschen) werden in technisches Anfügen umgesetzt, wobei ein Zeitstempel mitgeschrieben wird und Gültigkeitsflags gesetzt werden. Eingefügte Datensätze sind so nur für einen Zeitraum gültig und Werte daher zeitabhängig. Auf diese Weise wird die komplette Historie aller Datenmodifikationen persistiert. Gründe sind zum einen das Speichern der kompletten Historie aller Unternehmensdaten (in vielen Ländern gesetzlich vorgeschrieben), zum anderen aber auch die Nebenläufigkeitskontrolle. Der Vorteil dabei ist, dass Lesetransaktionen nicht Ressourcen sperren müssen und daher nicht andere Transaktionen blockieren. Prof. Dr. Peter Chamoni Datenbanksysteme 15
16 6.2 In Memory Computing In Memory Computing (IX) Technologische Konzepte Insert-Only-Datenbanken Deltamechanismus komprimiert INSERT Schreiboperationen Haupt-Speicher Delta-Speicher MERGE Leseoperationen Prof. Dr. Peter Chamoni - Datenbanksysteme 16
17 6.2 In Memory Computing In Memory Computing (X) Technologische Konzepte Insert-Only-Datenbanken Beispiel (1) UPDATE, INSERT INSERT MERGE :00 Prof. Dr. Peter Chamoni - Datenbanksysteme 17
18 6.2 In Memory Computing In Memory Computing (XI) Technologische Konzepte Insert-Only-Datenbanken Beispiel (2) Delete INSERT MERGE :00 Prof. Dr. Peter Chamoni - Datenbanksysteme 18
19 6.2 In Memory Computing In Memory Computing (XII) Technologische Konzepte Multicore-CPUs und Multiprozessoren Eine Multicore-CPU hat viele Rechnerkerne auf einem Chip. Zur Realisierung dieser Konzepte werden verschiedene Techniken eingesetzt: Verarbeitungslogik nahe der Datenbank Klassische Client-Server-Architektur: möglichst viel Verarbeitungslogik wird von den Applikationsservern übernommen Hauptspeicherdatenbank: viel Anwendungslogik wird in die Datenbank integriert. Datenkompression Einsatz unterschiedlicher Formen von Datenkompression Verzicht auf Aggregate Aggregate werden nicht gesondert gespeichert (Speicherersparnis), sondern performant im Hauptspeicher on the fly berechnet. Prof. Dr. Peter Chamoni Datenbanksysteme 19
20 6.2 In Memory Computing In Memory Computing (XIII) Technologische Konzepte In Memory Computing - Datenkompression (Dictionary Compressed) Prof. Dr. Peter Chamoni - Datenbanksysteme 20
21 6.2 In Memory Computing Ein Blick in die Zukunft Hybrid Transactional/Analytical Processing (HTAP) is a term used to describe the capability of a single database that can perform both OLTP and OLAP for the purpose of real-time operational intelligence processing. [ Prof. Dr. Peter Chamoni Datenbanksysteme 21
22 Gliederung 6 Neue Konzepte der Datenbanktechnologie 6.1 Business Intelligence Infrastruktur 6.2 In Memory Computing 6.3 NoSQL Datenbanksysteme Grenzen relationaler Datenbanksysteme NoSQL Ausgewählte Grundlagen Klassifikation von NoSQL-Systemen Prof. Dr. Peter Chamoni Datenbanksysteme 22
23 6.3.1 Grenzen relationaler Datenbanksysteme Relationale Datenbanksysteme (I) Ausgerichtet auf komplexe Datenbankanwendungen - Große Datenmodelle - Transaktionen: strenge Einhaltung des ACID-Prinzips zur Sicherstellung der Datenintegrität, d.h. Datenkonsistenz, Datensicherheit und des Datenschutzes DBS ist von Anbeginn nicht auf Skalierbarkeit ausgerichtet, vielmehr wird ein Server auf mehr Leistungsfähigkeit technisch aufgerüstet. Skalierung: vertikal ( Scale Up ) bezeichnet die vertikale Vergrößerung von Ressourcen eines Datenbanksystems in Form von Speicher und/oder CPU. - führt zu Groß-Systemen - verlangt extrem zuverlässige Hardware - verursacht überproportionale Kosten - erzeugt single point of failure Scale Up Prof. Dr. Peter Chamoni Datenbanksysteme 23
24 6.3.1 Grenzen relationaler Datenbanksysteme Relationale Datenbanksysteme (II) Zunehmende Performance-Probleme entstanden bei RDBS durch fortwährend steigende Anforderungen im Verlauf der Entwicklung Beispiel: Systemaufrufe Prof. Dr. Peter Chamoni Datenbanksysteme 24
25 Gliederung 6 Neue Konzepte der Datenbanktechnologie 6.1 Business Intelligence Infrastruktur 6.2 In Memory Computing 6.3 NoSQL Datenbanksysteme Grenzen relationaler Datenbanksysteme NoSQL Ausgewählte Grundlagen Klassifikation von NoSQL-Systemen Prof. Dr. Peter Chamoni Datenbanksysteme 25
26 6.3.2 NoSQL Ausgewählte Grundlagen NoSQL Datenbanksysteme (I) NoSQL (not only SQL) (1) Die neuen Systeme sind unabhängig voneinander - aus praktischen Anforderungen heraus - entstanden, z.b. - aus Performance-Anforderungen beim Umgang mit großen Datenmengen (Web 2.0), - Speichern unstrukturierter Daten etc. Diese unabhängigen Wurzeln spiegeln sich auch in einer gewissen Vielfalt von Konzepten wieder. Antwort auf die Anforderungen großer Internet-Sites (Facebook, Google, Amazon ) Seit ca steht NoSQL (not only SQL) für eine Familie von sehr gut skalierbaren Datenbanksystemen, die einen nicht-relationalen Ansatz verfolgen. Prof. Dr. Peter Chamoni Datenbanksysteme 26
27 6.3.2 NoSQL Ausgewählte Grundlagen NoSQL Datenbanksysteme (II) NoSQL (not only SQL) (2) Zahlreiche NoSQL-Konzepte lehnen sich an folgende Definition an: Unter NoSQL wird eine neue Generation von Datenbanksystemen verstanden, die meistens einige der nachfolgenden Punkte berücksichtigen: Das zugrundeliegende Datenmodell ist nicht relational. Die Systeme sind von Anbeginn an auf eine verteilte und horizontale Skalierbarkeit ausgerichtet. Das NoSQL-System ist Open Source. Fortsetzung der Definition nächste Folie [ Prof. Dr. Peter Chamoni Datenbanksysteme 27
28 6.3.2 NoSQL Ausgewählte Grundlagen NoSQL Datenbanksysteme (III) NoSQL (not only SQL) (3) Ergänzt wird die Definition mit folgenden Merkmalen: Das System ist schemafrei oder hat nur schwache Schemarestriktionen. Aufgrund der verteilten Architektur unterstützt das System eine einfache Datenreplikation. Das System bietet eine einfache API. Dem System liegt meistens auch als Konsistenzmodell zugrunde: eventually consistent / BASE, aber nicht ACID. [ Prof. Dr. Peter Chamoni Datenbanksysteme 28
29 6.3.2 NoSQL Ausgewählte Grundlagen NoSQL Datenbanksysteme (IV) NoSQL Datenbanksysteme (4) Ausgerichtet auf Internet-Anwendungen - Rasantes Daten-Wachstum - Stabile Zugriffszeiten - Hohe Verfügbarkeit NoSQL-Systemen sind i.d.r. von Anbeginn auf Skalierbarkeit ausgerichtet, d.h. es können Rechnerknoten dynamisch eingebunden werden, die einen Teil der Last/Daten tragen können. Skalierung: horizontal ( Scale Out )... bezeichnet die Erweiterung des Systems durch Einfügen zusätzlicher Computerressourcen Scale Out - führt zu verteilten Systemen, - erzeugt many points of failure Prof. Dr. Peter Chamoni Datenbanksysteme 29
30 6.3.2 NoSQL Ausgewählte Grundlagen NoSQL Datenbanksysteme (V) NoSQL Datenbanksysteme (5) Skalierung: horizontal ( Scale Out ) Erweiterung des Systems durch Einfügen zusätzlicher Computerressourcen. Verteilte Systeme sind nicht einfach zu betreiben bzgl. - Homogenität, Heterogenität - Sicherheit - Administration - Kommunikation, Bandbreite, Transportkosten u.v.m Konsistenzmodell in verteilten Datenbanksystemen: Ist es möglich, ein Datenbanksystem zu entwickeln, - ausgehend vom Konsistenzprinzip wie bei dem Entwurf relationaler Datenbanksysteme, - ABER: es gleichzeitig bzgl. der horizontalen Skalierbarkeit einfacher und performanter zu gestalten? Prof. Dr. Peter Chamoni Datenbanksysteme 30
31 6.3.2 NoSQL Ausgewählte Grundlagen NoSQL Datenbanksystem (VI) CAP-Theorem (1) (Eric Brewer, PODC 2000) In einem verteilten System können jeweils höchstens zwei der Eigenschaften gleichzeitig erfüllt sein: Konsistenz (Consistency) Die verteilte Datenbank erreicht nach Abschluss einer Transaktion einen konsistenten Zustand. Consistency Verfügbarkeit (Availability) Das System muss für einen konkreten Anwendungsfall eine akzeptable Reaktionszeit aufweisen, die bis zu einer vordefinierten Last eingehalten werden muss. Availability Partition Tolerance Ausfalltoleranz (Partition Tolerance) Das System kann weiterarbeiten trotz Ausfall eines Knotens oder einer Kommunikationsverbindung zwischen den Knoten. Prof. Dr. Peter Chamoni Datenbanksysteme 31
32 6.3.2 NoSQL Ausgewählte Grundlagen NoSQL Datenbanksystem (VII) CAP-Theorem (2) In der Praxis steht ein Unternehmen gemäß des CAP-Theorems somit vor der Entscheidung: Lockerung der Forderung nach strikter Einhaltung der Konsistenz im System oder Consistency das Risiko zu tragen, dass das System bei einem Ausfall der Verbindungen gar nicht oder nicht mit einer akzeptablen Reaktionszeit antwortet. Availability Partition Tolerance Für ein Webunternehmen, dessen Profit von der Erreichbarkeit seines Dienstes abhängt, ist dieses Risiko wohl eher nicht tragbar! Prof. Dr. Peter Chamoni Datenbanksysteme 32
33 6.3.2 NoSQL Ausgewählte Grundlagen NoSQL Datenbanksystem (VIII) Alternatives Konsistenzmodell: BASE ist ein Gegenkonzept zu ACID, basierend auf der Annahme, dass ein Verzicht auf Strong Consistency und dafür eine höhere Achtsamkeit auf Verfügbarkeit des Systems eine Steigerung der Skalierbarkeit ermöglicht. wird zur Lösung des Konflikts des CAP-Theorems herangezogen. BASE Eine NoSQL-Datenbank sollte über folgende Eigenschaften verfügen: grundsätzlich verfügbar (Basically Available) loser Zustand Konsistenz (Soft State) schlussendlich konsistent (Eventually Consistent) (schwache Konsistenz) Prof. Dr. Peter Chamoni Datenbanksysteme 33
34 6.3.2 NoSQL Ausgewählte Grundlagen NoSQL Datenbanksystem (IX) Map/Reduce Framework (1) spielt eine zentrale Rolle im Kontext von NoSQL-Datenbanken. Das Verfahren ist geeignet, große verteilte Datenmengen bei paralleler Ausführung effizient zu durchsuchen. Die Ursprünge des Verfahrens liegen in der funktionalen Programmierung: LISP erlaubt Entwicklern die Nutzung der Map/Reduce-Routinen, um parallele Programme zu erstellen, ohne dass der Entwickler sich um die Programmierung - der Kommunikation innerhalb des Rechner-Clusters - des Aufgaben-Monitorings oder - der Fehlerbehandlung kümmern muss. Prof. Dr. Peter Chamoni Datenbanksysteme 34
35 6.3.2 NoSQL Ausgewählte Grundlagen NoSQL Datenbanksystem (X) Map/Reduce Framework (2) Das Framework nutzt zwei Algorithmen, die jeweils nebenläufig auf verschiedenen Rechnerknoten in zwei Phasen hintereinander ausgeführt werden: Map verteilt Aufgaben an die verschiedenen Knoten im Netzwerk; Die Funktion map() wendet eine Funktion sukzessive auf alle Elemente einer Liste an und gibt eine durch die Funktion modifizierte Liste zurück. Reduce sortiert die Aufgaben; Eingabe Die Funktion reduce() akkumuliert einzelne Funktionsergebnisse der Listenpaare und reduziert sie damit auf einen Ausgabewert. Zwischenergebnisse Ausgabe Prof. Dr. Peter Chamoni Datenbanksysteme 35
36 6.3.2 NoSQL Ausgewählte Grundlagen NoSQL Datenbanksystem (XI) Map/Reduce Framework (3) Beispiel: durchschnittl. erreichte Punktzahl im letzten Semester auf Jahresebene MatrikelnummerDatumPunktzahl Eingabe MAP Combine Reduce (2014,25) (2014, [25, 47]) (2014,36) (2015,57) (2015,57) (2015,57) (2014,47) Prof. Dr. Peter Chamoni Datenbanksysteme 36
37 6.3.2 NoSQL Ausgewählte Grundlagen NoSQL Datenbanksystem (XII) Map/Reduce Framework (4) wird zur Lösung einer Vielzahl von Aufgaben genutzt, die eine Berechnung großer Datenmengen in einem Verbund von Rechnern erfordern. Beispielhaft sollen folgende Anwendungsbereiche genannt werden - Zählen von Zugriffen auf eine URL Map: verarbeitet die Zugriffe auf Webseiten aus vorhandenen Aufzeichnungen und gibt die Key/Value-Paare (URL, 1 ) aus. Reduce: addiert die Zwischenergebnisse pro URL und liefert als Ergebnisse die Zugriffe pro URL. - Wortindex Erstellung - Suchen in verteilten Datenbeständen (Grep) oder Sortieren - Erstellung des Link-Graphen über die Verlinkung von Webseiten zu einem Ziel Prof. Dr. Peter Chamoni Datenbanksysteme 37
38 6.3.2 NoSQL Ausgewählte Grundlagen NoSQL Datenbanksystem (XIII) Map/Reduce Framework (5) ist für viele Einsatzbereiche effizient anwendbar. Aus diesem Grunde wurden seit der ersten Vorstellung zahlreiche Implementierungen erzeugt, z.b. Implementierungen - Google Map/Reduce Framework ist in C ++ implementiert und bietet APIs für Python und Java. - Hadoop ist ein Apache Open Source-Java-Framework für skalierbare, verteilte Software. - CouchDB nutzt ein Map/Reduce Framework zur Definition von Views über verteite Dokumente. - u.v.m (z.b. Prof. Dr. Peter Chamoni Datenbanksysteme 38
39 6.3.2 NoSQL Ausgewählte Grundlagen SQL- vs. NoSQL-Datenbanksystem (I) Relationales Datenbanksystem (1) Modell Das Datenmodell ist relational, d.h. alle Daten werden in Tabellen abgelegt. Funktionale Abhängigkeiten bilden die Grundlage der Normalformen. Mit der Einhaltung dieser Normalformen werden konsistente und nicht-redundante Datenbankentwürfe garantiert. Architektur Das System gewährleistet Datenunabhängigkeit. Schema Die Definition von Tabellen werden im relationalen Datenbankschema abgelegt. Dieses enthält zudem die Definition der Primärschlüssel sowie Integritätsbedingungen. [Meier (2016), HMD H.310] Prof. Dr. Peter Chamoni - Datenbanksysteme 39
40 6.3.2 NoSQL Ausgewählte Grundlagen SQL- vs. NoSQL-Datenbanksystem (II) Relationales Datenbanksystem (2) Sprache Das Datenbanksystem verwendet SQL zur Datendefinition, -selektion und manipulation. Mehrbenutzerbetrieb Das System unterstützt den Mehrbenutzerbetrieb. Es können also gleichzeitig mehrere Benutzer die Datenbank abfragen oder bearbeiten. Konsistenz Ein relationales Datenbanksystem garantiert jederzeit Konsistenzerhaltung (strong consistency). Zudem bestehen Funktionen für die fehlerfreie und korrekte Speicherung der Daten sowie ihren Schutz vor Zerstörung, vor Verlust, vor unbefugtem Zugriff und Missbrauch. [Meier (2016), HMD H.310] Prof. Dr. Peter Chamoni - Datenbanksysteme 40
41 6.3.2 NoSQL Ausgewählte Grundlagen SQL- vs. NoSQL-Datenbanksystem (III) NoSQL Datenbanksystem (1) Modell Das zugrundeliegende Datenmodell ist nicht relational. Architektur Die Datenarchitektur unterstützt massiv verteilte Webanwendungen und horizontale Skalierung. Mindestens 3V Das Datenbanksystem erfüllt die Anforderungen für umfangreiche Datenbestände (volume), flexible Datenstrukturen (variety) und Echtzeitverarbeitung (velocity). Schema Das Datenbanksystem unterliegt keinem fixen Datenbankschema. [Meier (2016), HMD H.310] Prof. Dr. Peter Chamoni - Datenbanksysteme 41
42 6.3.2 NoSQL Ausgewählte Grundlagen SQL- vs. NoSQL-Datenbanksystem (IV) NoSQL Datenbanksystem (2) Replikation Das Datenbanksystem unterstützt die Datenreplikation. Mehrbenutzerbetrieb Das System unterstützt den Mehrbenutzerbetrieb, wobei differenzierte Konsistenzeinstellungen gewählt werden können. Konsistenz Aufgrund des CAP-Theorems ist die Konsistenz nur verzögert gewährleistet, falls hohe Verfügbarkeit und Ausfalltoleranz angestrebt werden. (weak consistency) [Meier (2016), HMD H.310] Prof. Dr. Peter Chamoni - Datenbanksysteme 42
43 Gliederung 6 Neue Konzepte der Datenbanktechnologie 6.1 Business Intelligence Infrastruktur 6.2 In Memory Computing 6.3 NoSQL Datenbanksysteme Grenzen relationaler Datenbanksysteme NoSQL Ausgewählte Grundlagen Klassifikation von NoSQL-Systemen Prof. Dr. Peter Chamoni Datenbanksysteme 43
44 6.3.3 Klassifikation von NoSQL Systemen Aufgrund der weit gefassten Definition zählen zu NoSQL eine Vielzahl verschiedener Konzepte, wobei die derzeit wichtigsten sind: Key / Value Stores Document Stores Column resp. Column Family Stores (In-Memory-Datenbanken) Graph-Datenbanken u.v.m. Prof. Dr. Peter Chamoni - Datenbanksysteme 44
45 6.3.3 Klassifikation von NoSQL Systemen Key / Value Store (I) Grundprinzip sämtliche Daten werden in Form von Schlüssel-Wertpaaren gespeichert, d.h. die gespeicherten Daten (value) werden über einen eindeutigen Schlüssel (key), der aus einer strukturierten oder willkürlichen Zeichenkette bestehen kann, identifiziert. Beschreibung einfach-strukturierte NoSQL-DB prädestiniert, Parallelität in der Verarbeitung auszunutzen (Map/Reduce-Verfahren) Mengenoperationen und Aggregationen benötigen wenig Rechenzeit. Prof. Dr. Peter Chamoni - Datenbanksysteme 45
46 6.3.3 Klassifikation von NoSQL Systemen Key / Value Store (II) Abfragen Einfache Suchabfragen werden unterstützt (Beschränkung auf Keys). Komplexe Auswertungen sind aufwendig zu realisieren. Einsatzbereiche Anwendungen, die hochverfügbar sind und gleichzeitig sehr geringe Reaktionszeit aufweisen müssen Web-Anwendungen für Warenkörbe bei Online-Shops oder für die Speicherung von Session-Daten Posteingangssuche von Facebook (Cassandra) Anbieter z.b. Membase (Couchbase), Redis (Vmware), Azure Table Storage (Microsoft), Berkeley DB (Oracle) Prof. Dr. Peter Chamoni - Datenbanksysteme 46
47 6.3.3 Klassifikation von NoSQL Systemen Document Store Dokumentorientierte Datenbank (I) Grundprinzip Ähnlich zu Key/Value Stores Daten sind jedoch Dokumente, die untereinander keine Beziehung haben, sondern nur eine strukturierte Sammlung von unterschiedlichen Daten aufweisen. (Sammlung von semi-strukturierten Dokumenten) Diese Dokumente werden nach einem bestimmten Format (XML, JSON, etc.) ausgetauscht und gespeichert. Document Store Versicherungsagentur Beschreibung einfach-strukturierte NoSQL-DB Horizontale Skalierung und Replikation werden auf einfache Weise unterstützt. verlangt kein Schema und ist offen für Änderungen. Prof. Dr. Peter Chamoni - Datenbanksysteme 47
48 6.3.3 Klassifikation von NoSQL Systemen Document Store Dokumentorientierte Datenbank (II) Abfragen Dynamische Abfragen sind ein guter Ersatz für SQL, da oft umfangreiche Filteroperatoren zur Verfügung stehen. Einsatzbereiche Viele webbasierte Anwendungen lassen sich als Kollektion von Dokumenten realisieren. Anbieter MongoDB (JSON), CouchDB (Apache, JSON), Lotus Notes (IBM, Domino XML) Prof. Dr. Peter Chamoni - Datenbanksysteme 48
49 6.3.3 Klassifikation von NoSQL Systemen Column Store bzw. Column Familiy Store (I) Grundprinzip: Column Store Spaltenorientierte Datenbanken speichern die Attribute einer Tabelle spalten- und nicht zeilenweise. Beschreibung unterstützt die kostengünstige Speicherung großer Datenbestände. Die Skalierung der Daten kann rasch und effizient erfolgen. Spaltenweise Aggregationen können in kurzer Zeit durchgeführt werden. Abfragen SQL-ähnliche Abfragen sind möglich. Prof. Dr. Peter Chamoni - Datenbanksysteme 49
50 6.3.3 Klassifikation von NoSQL Systemen Column Store bzw. Column Familiy Store (II) Grundprinzip: Column Family Store (Wide Column Stores) Die spaltenorientierte Speicherung wird mit zeilenorientierten Ansätzen kombiniert. Column Families werden gelegentlich mit relationalen Tabellen verglichen, bei denen Zeilen eine dynamische Anzahl an Attributen haben. Sie ordnen Daten nach einem Zeilenschlüssel, der mit beliebig vielen Spalten verknüpft ist. Dabei wurden sie für eine verteilte Architektur entwickelt, damit sie hochverfügbar und skalierbar sind. Prof. Dr. Peter Chamoni - Datenbanksysteme 50
51 6.3.3 Klassifikation von NoSQL Systemen Column Store bzw. Column Familiy Store (III) Grundprinzip: Column Family Store (Wide Column Stores) Grundsätzlich besteht das Modell aus Spaltenfamilien (Column Families), Zeilen-Schlüssel und den Spalten (Columns). Die kleinste Einheit dieses Systems ist eine Spalte. Sie besteht aus: einem Namen mit einem Wert (Key-Value-Paar) und einem Zeitstempel, der zur Versionsverwaltung dient. Spalten, die als zusammenhängend betrachtet werden sollen und auf die gemeinsam zugegriffen werden soll, lassen sich als Sammlung zu Spaltenfamilien aggregieren (ähnlich den relationalen Tabellen). Prof. Dr. Peter Chamoni - Datenbanksysteme 51
52 6.3.3 Klassifikation von NoSQL Systemen Column Store bzw. Column Familiy Store (IV) Grundprinzip: Column Family Store (Wide Column Stores) Die Sortierung und das Referenzieren der Spaltenfamilien erfolgt über die Zeilen-Schlüssel. Diese Zeilen können beliebig viele Attribute/Spalten besitzen. Sie sind an kein Schema gebunden, d.h. jede Zeile kann einen anderen Aufbau haben als die nächste. Prof. Dr. Peter Chamoni - Datenbanksysteme 52
53 6.3.3 Klassifikation von NoSQL Systemen Column Store bzw. Column Familiy Store (V) Beschreibung Ursprung des Systems (Googles BigTable) war das Bedürfnis nach einem flexiblen System mit hoher Performanz und Verfügbarkeit beim Umgang mit Daten im Petabyte-Bereich, verstreut auf tausenden Cluster-Knoten. Einsatzbereiche Content-Management-Systeme Soziale Netzwerke und Blog-Plattformen BigTable kommt intern in vielen Google-Diensten zum Einsatz, z.b. in Google Maps, Google Earth oder YouTube. Anbieter Cassandra (Apache), Hadoop / HBase (Apache), BigTable (Google), Dynamo (Amazon) Prof. Dr. Peter Chamoni - Datenbanksysteme 53
54 6.3.3 Klassifikation von NoSQL Systemen Graph-Datenbank (I) Grundprinzip Eine graphenorientierte Datenbank benutzt Graphen, um stark vernetzte Informationen darzustellen und abzuspeichern. Sie verwaltet Graph- oder Baumstrukturen, in denen die Elemente miteinander verknüpft sind. Knoten des Graphen = Daten Kanten des Graphen = Beziehungen zwischen den Daten Knoten und Kanten des Graphen können mit properties, also Eigenschaften versehen oder gewichtet werden. Die Daten werden über ihre (relative) Position im Graphen identifiziert (traversieren), somit wird kein Schlüssel benötigt. Prof. Dr. Peter Chamoni - Datenbanksysteme 54
55 6.3.3 Klassifikation von NoSQL Systemen Graph-Datenbank (II) Einsatzbereiche Graph-Datenbanken erfreuen sich großer Beliebtheit, da sie für unterschiedliche Anwendungen eingesetzt werden können: Analyse von sozialen Netzwerken Aufbau von Empfehlungssystemen Web 3.0 Semantisches Web Fahrplanoptimierung geographische Systeme Anbieter Neo4J, sones GraphDB, Trinity (Microsoft), AllegroGraph Prof. Dr. Peter Chamoni - Datenbanksysteme 55
56 6.3.3 Klassifikation von NoSQL Systemen Koexistenz von SQL- und NoSQL-Datenbanktechnologien Viele webbasierte Anwendungen setzen für die unterschiedlichen Dienste adäquate Datenhaltungssysteme ein. Die vielfältigen Anforderungen an Konsistenz, Verfügbarkeit, Auswertungsgeschwindigkeit oder Ausfalltoleranz verlangen oft nach einer Kombination von Datenhaltungssystemen [Meier (2016), HMD H.310] Prof. Dr. Peter Chamoni - Datenbanksysteme 56
Datenbanksysteme Kapitel 6: Neue Konzepte der Datenbanktechnologie
Datenbanksysteme Kapitel 6: Neue Konzepte der Datenbanktechnologie Prof. Dr. Peter Chamoni Mercator School of Management Lehrstuhl für Wirtschaftsinformatik, insb. Business Intelligence Prof. Dr. Peter
MehrDatenbanksysteme Kapitel 6: Neue Konzepte der Datenbanktechnologie
Datenbanksysteme Kapitel 6: Neue Konzepte der Datenbanktechnologie Prof. Dr. Peter Chamoni Mercator School of Management Lehrstuhl für Wirtschaftsinformatik, insb. Business Intelligence Prof. Dr. Peter
MehrStefan Edlich, Achim Friedland, Jens Hampe, Benjamin Brauer. NoSQL. Einstieg in die Welt nichtrelationaler Web 2.0 Datenbanken ISBN:
sverzeichnis Stefan Edlich, Achim Friedland, Jens Hampe, Benjamin Brauer NoSQL Einstieg in die Welt nichtrelationaler Web 2.0 Datenbanken ISBN: 978-3-446-42355-8 Weitere Informationen oder Bestellungen
MehrNoSQL Datenbanken EIN ÜBERBLICK ÜBER NICHT-RELATIONALE DATENBANKEN UND DEREN POTENTIALE IM ALLGEMEINEN UND IN DER INDUSTRIE
NoSQL Datenbanken EIN ÜBERBLICK ÜBER NICHT-RELATIONALE DATENBANKEN UND DEREN POTENTIALE IM ALLGEMEINEN UND IN DER INDUSTRIE Was bedeutet NoSQL? Ein Sammelbegriff für alternative Datenbanklösungen, die
MehrInhaltsverzeichnis. Stefan Edlich, Achim Friedland, Jens Hampe, Benjamin Brauer, Markus Brückner. NoSQL
sverzeichnis Stefan Edlich, Achim Friedland, Jens Hampe, Benjamin Brauer, Markus Brückner NoSQL Einstieg in die Welt nichtrelationaler Web 2.0 Datenbanken ISBN: 978-3-446-42753-2 Weitere Informationen
MehrNeues aus der nicht-, semi- und relationalen Welt
Neues aus der nicht-, semi- und relationalen Welt Information Management Thomas Klughardt Senior System Consultant Das Big Data Problem Was bedeutet Big Data? Performancekritisch Echtzeit Cold Storage
MehrÜberblick und Vergleich von NoSQL. Datenbanksystemen
Fakultät Informatik Hauptseminar Technische Informationssysteme Überblick und Vergleich von NoSQL Christian Oelsner Dresden, 20. Mai 2011 1 1. Einführung 2. Historisches & Definition 3. Kategorien von
MehrNoSQL. Prof. Dr. Ingo Claßen. Einführung. Kategorisierung von NoSQL-Systemen. Verteilung. Konsistenz. Literatur
NoSQL Prof. Dr. Ingo Claßen Hochschule für Technik und Wirtschaft Berlin Einführung Kategorisierung von NoSQL-Systemen Verteilung Konsistenz Literatur Einführung Warum NoSQL Unterstützung großer Datenmengen
MehrANALYTICS, RISK MANAGEMENT & FINANCE ARCHITECTURE. NoSQL Datenbanksysteme Übersicht, Abgrenzung & Charakteristik
ARFA ANALYTICS, RISK MANAGEMENT & FINANCE ARCHITECTURE NoSQL Datenbanksysteme Übersicht, Abgrenzung & Charakteristik Ralf Leipner Domain Architect Analytics, Risk Management & Finance 33. Berner Architekten
MehrNoSQL Andere Wege in der Speicherung von Geodaten?
NoSQL Andere Wege in der Speicherung von Geodaten? Holger Baumann, Agenda Status Quo Speicherung von Geodaten in SQL-Datenbanken Datenbanken im Web Umfeld Verteilte Datenbanken Begriff und Klassifizierung
MehrDatenbanken und Datenbanktypen Tag 1 : Kapitel 1. Christian Inauen. Lernziele. Entwicklung der Datenbanken.
Tag 1 : und 10.08.2015 Jede/r Lernende... kann in eigenen Worten die Entstehung von erläutern kennt die verschiedenen Arten von mit entsprechenden Eigenschaften kann die Abkürzungen ACID, BASE und CAP
MehrDas diesem Dokument zugrundeliegende Vorhaben wurde mit Mitteln des Bundesministeriums für Bildung und Forschung unter dem Förderkennzeichen
Das diesem Dokument zugrundeliegende Vorhaben wurde mit Mitteln des Bundesministeriums für Bildung und Forschung unter dem Förderkennzeichen 16OH21005 gefördert. Die Verantwortung für den Inhalt dieser
MehrBig Data & Analytics Nationaler Akademietag, Fulda Referent: Meinhard Lingo
Big Data & Analytics Nationaler Akademietag, Fulda 20.04.2018 Referent: Meinhard Lingo E-Mail: meinhard.lingo@bs1in.de Big Data & Analytics Big Data-Anwendungen: Ein Paradigmenwechsel. Kompetenzen? mögliche
MehrEinführung in Hauptspeicherdatenbanken
Einführung in Hauptspeicherdatenbanken Harald Zankl Probevorlesung 13. 01., 13:15 14:00, HS C Inhaltsverzeichnis Organisation Überblick Konklusion Harald Zankl (LFU) Hauptspeicherdatenbanken 2/16 Organisation
MehrNoSQL-Datenbanken. Kapitel 1: Einführung. Dr. Anika Groß Sommersemester Universität Leipzig 1-1
NoSQL-Datenbanken Kapitel 1: Einführung Dr. Anika Groß Sommersemester 2017 Universität Leipzig http://dbs.uni-leipzig.de 1-1 Inhaltsverzeichnis NoSQL-Datenbanken Motivation und Definition Kategorisierung,
MehrStefan Edlich Achim Friedland Jens Rampe Benjamin Brauer. NoSQL. Einstieg in die Welt nichtrelationaler Web 2.0 Datenbanken HANSER
Stefan Edlich Achim Friedland Jens Rampe Benjamin Brauer NoSQL Einstieg in die Welt nichtrelationaler Web 2.0 Datenbanken HANSER Geleitwort 1 Vorwort 1 1 Einführung 1 1.1 Historie 1 1.2 Definition und
MehrNoSQL-Databases. Präsentation für Advanced Seminar "Computer Engineering", Matthias Hauck, matthias.hauck@stud.uni-heidelberg.de
NoSQL-Databases Präsentation für Advanced Seminar "Computer Engineering", Matthias Hauck, matthias.hauck@stud.uni-heidelberg.de Klassische SQL-Datenbanken Anwendungsgebiet: Geschäftsanwendungen Behördenanwendungen
Mehranwendungen programmieren Datenbank entwerfen & Implementierung Analyse bis zur SQL- NoSQL-Datenbanken Uwe Klug Mit einer Einführung in 2.
Uwe Klug Datenbank anwendungen entwerfen & programmieren Von der objektorientierten Analyse bis zur SQL- Implementierung Mit einer Einführung in NoSQL-Datenbanken 2. Auflage W3L-Verlag Herdecke Witten
MehrNoSQL HANSER. Einstieg in die Web 2.0 Datenbanken. Stefan Edlich Achim Friedland Jens Hampe Benjamin Brauer Markus Brückner
Stefan Edlich Achim Friedland Jens Hampe Benjamin Brauer Markus Brückner NoSQL Einstieg in die Web 2.0 Datenbanken 2., akutalisierte und erweiterte Auflage HANSER Geleitwort Vorwort Vorwort zur 2. Auflage
Mehr1 Einführung Ziele der Vorlesung Die Idee Lernkarte Selbsttest-Frage 3 Literaturhinweise 3
1 Einführung 1 1.1 Ziele der Vorlesung 1 1.2 Die Idee 1 1.3 Lernkarte 2 1.4 Selbsttest-Frage 3 Literaturhinweise 3 Teilt Die Zukunft von Enterprise-Computing 5 2 Neue Anforderungen an Enterprise Computing
MehrSkalierbare Webanwendungen
Skalierbare Webanwendungen Thomas Bachmann Lead Software Architect & CIO Mambu GmbH Twitter: @thobach Anwendungsbeispiel Hohe Nichtfunktionale Anforderungen Sicherheit Vertraulichkeit Integrität Verfügbarkeit
MehrIn diesem Abschnitt wollen wir uns mit der Architektur von Datenbank Managements Systemen beschäftigen.
1 In diesem Abschnitt wollen wir uns mit der Architektur von Datenbank Managements Systemen beschäftigen. Zunächst stellt sich die Frage: Warum soll ich mich mit der Architektur eines DBMS beschäftigen?
MehrSODA. Die Datenbank als Document Store. Rainer Willems. Master Principal Sales Consultant Oracle Deutschland B.V. & Co. KG
SODA Die Datenbank als Document Store Rainer Willems Master Principal Sales Consultant Oracle Deutschland B.V. & Co. KG vs No Anforderungskonflikte Agile Entwicklung Häufige Schema-Änderungen Relationales
MehrRavenDB, schnell und skalierbar
RavenDB, schnell und skalierbar Big Data & NoSQL, Aydin Mir Mohammadi bluehands GmbH & Co.mmunication KG am@bluehands.de Immer mehr Mehr Performance Mehr Menge Mehr Verfügbarkeit Skalierung http://www.flickr.com/photos/39901968@n04/4864698533/
MehrBig Data Management Thema 14: Cassandra
Thema 14: Cassandra Jan Kristof Nidzwetzki Thema 14: Cassandra 1 / 25 Übersicht 1 Grundlagen Überblick Geschichte Datenmodel 2 Architektur Der logische Ring Persistenz der Daten Tunable Consistency Read
MehrNoSQL. Was Architekten beachten sollten. Dr. Halil-Cem Gürsoy adesso AG. Architekturtag @ SEACON 2012 Hamburg
NoSQL Was Architekten beachten sollten Dr. Halil-Cem Gürsoy adesso AG Architekturtag @ SEACON 2012 Hamburg 06.06.2012 Agenda Ein Blick in die Welt der RDBMS Klassifizierung von NoSQL-Datenbanken Gemeinsamkeiten
MehrFast Analytics on Fast Data
Fast Analytics on Fast Data Kudu als Storage Layer für Banking Applikationen Problem Klassischer Kreditprozess Beantragung in der Filiale Aufwendiger Prozess Nachweis durch Dokumente Manuelle Bewilligung
MehrInformationssysteme für Ingenieure
Informationssysteme für Ingenieure Vorlesung Herbstsemester 2016 Überblick und Organisation R. Marti Organisation Web Site: http://isi.inf.ethz.ch Dozent: Robert Marti, martir ethz.ch Assistenz:??
MehrNoSQL-Datenbanken. Kapitel 1: Einführung. Lars Kolb Sommersemester 2014. Universität Leipzig http://dbs.uni-leipzig.de 1-1
NoSQL-Datenbanken Kapitel 1: Einführung Lars Kolb Sommersemester 2014 Universität Leipzig http://dbs.uni-leipzig.de 1-1 Inhaltsverzeichnis NoSQL-Datenbanken Motivation und Definition Kategorisierung, Eigenschaften
MehrWeb Technologien NoSQL Datenbanken
Web Technologien NoSQL Datenbanken Univ.-Prof. Dr.-Ing. Wolfgang Maass Chair in Information and Service Systems Department of Law and Economics WS 2011/2012 Wednesdays, 8:00 10:00 a.m. Room HS 021, B4
MehrDatenbanken Unit 9: OLAP, OLTP und objektrelationale Datenbanken
Datenbanken Unit 9: OLAP, OLTP und objektrelationale Datenbanken 31. V. 2016 Outline 1 Organisatorisches 2 SQL 3 OLTP, OLAP, SAP, and Data Warehouse OLTP and OLAP SAP 4 Objekt-relationale Datenbanken Beispiel
MehrDatenbanksysteme. Donald Kossmann TU München
Datenbanksysteme Donald Kossmann TU München Übersicht Wie benutze ich ein Datenbanksystem? Datenmodellierung (ER, UML, Theorie) Datenbankprogrammierung (SQL) Wie baue ich ein Datenbanksystem? Anfrageoptimierung
MehrCharakteristika von Unternehmensanwendungen
Charakteristika von Unternehmensanwendungen Wozu werden Unternehmensanwendungen genutzt? Enterprise applications are about the display, manipulation, and storage of large amounts of often complex data
MehrAufbau eines Clusters mit der NoSQL- Datenbank MongoDB auf Basis von Einplatinencomputern
Fachbereich 2 Informatik und Ingenieurwissenschaften Im Studiengang Informatik Aufbau eines Clusters mit der NoSQL- Datenbank MongoDB auf Basis von Einplatinencomputern Kolloquium zur Bachelorthesis Danijel
MehrSoziotechnische Informationssysteme
Soziotechnische Informationssysteme 8. NoSQL Relationale Datenbank NoSQL Datenbank Relationale Datenbank? NoSQL Datenbank RDBM 2 Warum? Skalierbarkeit Riesige Datenmengen Performanz und Elastizität Auslastung
MehrDatenbanken Unit 9: OLAP, OLTP und objektrelationale Datenbanken
Datenbanken Unit 9: OLAP, OLTP und objektrelationale Datenbanken 17. V. 2017 Outline 1 Organisatorisches 2 SQL 3 OLTP, OLAP, SAP, and Data Warehouse OLTP and OLAP SAP 4 Objekt-relationale Datenbanken Beispiel
MehrBig Data. Professional IT Master. Prof. Dr. Ingo Claßen. Überblick. Verarbeitungsmodell. Verarbeitungsablauf. Verteilte Daten. Ressourcenmanagement
Big Data Professional IT Master Prof. Dr. Ingo Claßen Hochschule für Technik und Wirtschaft Berlin Überblick Verarbeitungsmodell Verarbeitungsablauf Verteilte Daten Ressourcenmanagement Koordination Überblick
MehrSQL- & NoSQL-Datenbanken. Speichern und Analysen von großen Datenmengen
SQL- & NoSQL-Datenbanken Speichern und Analysen von großen Datenmengen 1 04.07.14 Zitat von Eric Schmidt (Google CEO): There was 5 exabytes of information created between the dawn of civilization through
MehrOracle Big Data Technologien Ein Überblick
Oracle Big Data Technologien Ein Überblick Jürgen Vester Oracle Deutschland B.V. & Co KG Um was geht es bei Big Data? Bei Big Data sprechen wir eine Klasse von Daten an, die in der
MehrThomas Matzner Berater für Systemanalyse Couchbase. Java User Group München
Thomas Matzner Berater für Systemanalyse www.tamatzner.de Couchbase Java User Group München 18. 1. 2016 Überblick Warum Couchbase bei der Einkaufszettel- App? Eigenschaften von Couchbase Entwicklung mit
MehrEinführung in Hauptspeicherdatenbanken
Einführung in Hauptspeicherdatenbanken Harald Zankl Probevorlesung 13. 01., 13:15 14:00, HS C Inhaltsverzeichnis Organisation Überblick Konklusion Harald Zankl (LFU) Hauptspeicherdatenbanken 2/16 Organisation
MehrSchneller als Hadoop?
Schneller als Hadoop? Einführung in Spark Cluster Computing 19.11.2013 Dirk Reinemann 1 Agenda 1. Einführung 2. Motivation 3. Infrastruktur 4. Performance 5. Ausblick 19.11.2013 Dirk Reinemann 2 EINFÜHRUNG
MehrAnforderungen von Cloud-Anwendungen an Datenbanksysteme
Anforderungen von Cloud-Anwendungen an Datenbanksysteme Andreas Göbel Friedrich-Schiller-Universität Jena Lehrstuhl für Datenbanken und Informationssysteme 06.05.2010 AGENDA 1. Einleitung 2. Anforderungen
MehrDatenbanktechnologien für Big Data
Datenbanktechnologien für Big Data Oktober 2013 Prof. Dr. Uta Störl Hochschule Darmstadt Big Data Technologien Motivation Big Data Technologien NoSQL-Datenbanksysteme Spaltenorientierte Datenbanksysteme
Mehr1. Einleitung. 1 1Exabyte=10 18 Bytes = Bytes
1. Einleitung Das aktuelle Jahrzehnt wird als Zeitalter der Daten bezeichnet [Whi09, S. 1]. Die Menge der weltweit existierenden Daten ist in den letzten Jahren stark angewachsen. Eine Studie des amerikanischen
MehrNoSQL Datenbanken am Beispiel von HBase. Daniel Georg
NoSQL Datenbanken am Beispiel von HBase Daniel Georg No to SQL at all sondern Not only SQL Open- Source Community Erst im Jahr 2009 gestartet Community bietet verschiede Lösungen: Casandra, CouchDD, HBase,
MehrDatenbanksysteme Kapitel 5: SQL Data Manipulation Language
Datenbanksysteme Kapitel 5: SQL Data Manipulation Language Prof. Dr. Peter Chamoni Mercator School of Management Lehrstuhl für Wirtschaftsinformatik, insb. Business Intelligence Prof. Dr. Peter Chamoni
MehrPolyglot Persistence und NoSQL
Polyglot Persistence und NoSQL Mehr Flexibilität, mehr Komplexität!? Stefan Kühnlein Solution Architekt OPITZ CONSULTING GmbH Nürnberg, 18.11.2014 OPITZ CONSULTING GmbH 2014 Seite 1 Agenda 1. Rückblick
MehrDatenbanken als Grundlage für Informationssysteme
Datenbanken als Grundlage für Informationssysteme Datenmodellierung und Datenbanksysteme Prof. Dr. Ingo Claßen Peter Morcinek Prof. Dr. Martin Kempa Hochschule für Technik und Wirtschaft Berlin Informationssysteme
MehrBig Data Neue Erkenntnisse aus Daten gewinnen
Big Data Neue Erkenntnisse aus Daten gewinnen Thomas Klughardt Senior Systems Consultant 0 Software Dell Software Lösungsbereiche Transform Inform Connect Data center and cloud management Foglight APM,
MehrDatenbanksysteme. Prof. Dr.-Ing. Sebastian Michel TU Kaiserslautern. Wintersemester 2015/16.
Datenbanksysteme Wintersemester 2015/16 Prof. Dr.-Ing. Sebastian Michel TU Kaiserslautern smichel@cs.uni-kl.de MapReduce, Prof. Dr.-Ing. S. Michel TU Kaiserslautern Datenbanksysteme, WS 15/16 2 / 35 MapReduce,
MehrGlossar. Springer Fachmedien Wiesbaden 2016 D. Fasel, A. Meier (Hrsg.), Big Data, Edition HMD, DOI /
Glossar Abfragesprache Eine Abfragesprache erlaubt, Datenbanken durch die Anga be von Selektionsbedingungen, eventuell mengenorientiert, auszuwerten. ACID Die Abkürzung ACID steht für Atomicity, Consistency,
MehrInhaltsverzeichnis. Teil I Die Zukunft von Enterprise-Computing... 1 I I 2 3 3
Inhaltsverzeichnis 1 Einführung... 1.1 Ziele der Vorlesung. 1.2 Die Idee 1.3 Lemkarte... 1.4 Selbsttest-Frage. Literaturhinweise.. 1 I I 2 3 3 Teil I Die Zukunft von Enterprise-Computing... 2 Neue Anforderungen
MehrOracle Big Data Technologien Ein Überblick
Oracle Big Data Technologien Ein Überblick Ralf Lange Global ISV & OEM Sales NoSQL: Eine kurze Geschichte Internet-Boom: Erste Ansätze selbstgebauter "Datenbanken" Google stellt "MapReduce"
MehrISBN: Herstellung: Diplomica Verlag GmbH, Hamburg, 2011
Nils Petersohn Vergleich und Evaluation zwischen modernen und traditionellen Datenbankkonzepten unter den Gesichtspunkten Skalierung, Abfragemöglichkeit und Konsistenz Diplomica Verlag Nils Petersohn Vergleich
MehrBig Data und Oracle bringen die Logistik in Bewegung
OPITZ CONSULTING Deutschland GmbH Dortmund, 07.05.2014 Bild-Quelle: Web-Seite von Pasta ZARA, Big Artikel Data So und entstehen Oracle bringen unsere die Nudeln Logistik in Bewegung http://de.pastazara.com/so-entstehen-unsere-nudeln
MehrOptimierung der Datenbankstruktur einer Web-Anwendung zur Analyse von Fertigungsprozessen
Optimierung der Datenbankstruktur einer Web-Anwendung zur Analyse von Fertigungsprozessen Vortrag Seminararbeit Fabian Ripplinger Aachen, 22.01.2014 Agenda 1 2 3 4 5 Ziel der Arbeit Grundlagen Umsetzung
MehrSchneller als Hadoop? Einführung in Spark Cluster Computing
Schneller als Hadoop? Einführung in Spark Cluster Computing Dirk Reinemann Oracle Deutschland B.V. & Co. KG Potsdam Schlüsselworte Big Data, Cluster Computing, Spark, Shark, Resilient Distributed Datasets,
MehrSinn (und Unsinn) für Informix Benutzer
NoSQL : Sinn (und Unsinn) für Informix Benutzer Martin Fürderer IBM Informix Entwicklung München Agenda Was bedeutet NoSQL für Informix Benutzer? Was bedeutet NoSQL? Fragen? Welche NoSQL Funktionalität
Mehr2. Architektur verteilter Datenbanksysteme
2. Architektur verteilter Datenbanksysteme Verteilte Datenbank, kurz DDB (engl. distributed database): eine Sammlung logisch zusammengehöriger Datenbanken, welche über Rechnerknoten ( Sites ) verteilt
MehrKapitel 1: Wiederholungsfragen Grundlagen DBS
Grundlagen DBS 1. Welche zentralen Anforderungen an ein DBS definierte Edgar Codd? 2. Was ist eine Transaktion? 3. Welche Eigenschaften muss das DBMS bei der Transaktionsverarbeitung sicherstellen? 4.
Mehr7. Big Data und NoSQL-Datenbanken
7. Big Data und NoSQL-Datenbanken Motivation Big Data Herausforderungen Einsatzbereiche Systemarchitekturen für Big Data Analytics Analyse-Pipeline Hadoop, MapReduce, Spark/Flink NoSQL-Datenbanken Eigenschaften
MehrNoSQL. Einblick in die Welt nicht-relationaler Datenbanken. Christoph Föhrdes. UnFUG, SS10 17.06.2010
NoSQL Einblick in die Welt nicht-relationaler Datenbanken Christoph Föhrdes UnFUG, SS10 17.06.2010 About me Christoph Föhrdes AIB Semester 7 IRC: cfo #unfug@irc.ghb.fh-furtwangen.de netblox GbR (http://netblox.de)
MehrNoSQL & Big Data. NoSQL Databases and Big Data. NoSQL vs SQL DBs. NoSQL DBs - Überblick. Datenorientierte Systemanalyse. Gerhard Wohlgenannt
NoSQL & Big Data Datenorientierte Systemanalyse NoSQL Databases and Big Data Gerhard Wohlgenannt Die besprochenen Systeme haben nicht den Anspruch und das Ziel DBS zu ersetzen, sondern für gewisse Anwendungsfälle
MehrNoSQL Databases and Big Data
Datenorientierte Systemanalyse NoSQL Databases and Big Data Gerhard Wohlgenannt NoSQL & Big Data Die besprochenen Systeme haben nicht den Anspruch und das Ziel DBS zu ersetzen, sondern für gewisse Anwendungsfälle
MehrQUNIS 360 was war, was wird? BI, Big Data, Cloud, Predictive & Advanced Analytics, Streaming. Referent: Steffen Vierkorn
QUNIS 360 was war, was wird? BI, Big Data, Cloud, Predictive & Advanced Analytics, Streaming Referent: Steffen Vierkorn Agenda 10.00 10.30 Begrüßung & aktuelle Entwicklungen bei QUNIS 10.30 11.00 11.00
MehrBig Data Mythen und Fakten
Big Data Mythen und Fakten Mario Meir-Huber Research Analyst, IDC Copyright IDC. Reproduction is forbidden unless authorized. All rights reserved. About me Research Analyst @ IDC Author verschiedener IT-Fachbücher
MehrGoogle's BigTable: Ein verteiltes Speichersystem für strukturierte Daten. von Florian Eiteljörge
Google's BigTable: Ein verteiltes Speichersystem für strukturierte Daten von Florian Eiteljörge 1. Was ist Bigtable? 2. Datenmodell Übersicht 3. Implementierung/Architektur von Bigtable 4. Vergleich mit
MehrBig Data in der Praxis
Jonas Freiknecht Big Data in der Praxis Lösungen mit Hadoop, HBase und Hive Daten speichern, aufbereiten, visualisieren HANSER Vorwort XI 1 Einleitung 1 2 Big-Data 7 2.1 Historische Entstehung 8 2.2 Big-Data
MehrSQL oder NoSQL: Das ist die Frage! Oracle NoSQL Database
SQL oder NoSQL: Das ist die Frage! Oracle NoSQL Database Carsten Czarski Oracle Deutschland B.V. & Co KG Agenda NoSQL: Was ist das und wozu ist das gut? Anwendungsbereiche für NoSQL-Technologien,
MehrD1: Relationale Datenstrukturen (14)
D1: Relationale Datenstrukturen (14) Die Schüler entwickeln ein Verständnis dafür, dass zum Verwalten größerer Datenmengen die bisherigen Werkzeuge nicht ausreichen. Dabei erlernen sie die Grundbegriffe
MehrAlgorithmen. Consistent Hashing Bloom Filter MapReduce. Distributed Hash Tables. Einführung 1
Algorithmen Consistent Hashing Bloom Filter MapReduce Distributed Hash Tables Einführung 1 Consistent Hashing Problem: Wie finde ich den Speicherort für ein Objekt in einem verteilten System mit n Knoten?
MehrEinleitung 19. Teil I Einführung in Datenbanksysteme 25. Kapitel 1 Wozu Datenbanksysteme da sind 27
Inhaltsverzeichnis Einleitung 19 Über dieses Buch 19 Konventionen in diesem Buch 20 Was Sie nicht lesen müssen 21 Törichte Annahmen über den Leser 21 Wie dieses Buch aufgebaut ist 22 Teil I: Einführung
MehrKapitel 4 Teil 2 NoSQL-Datenbanksysteme
Kapitel 4 Teil 2 NoSQL-Datenbanksysteme Inhalt: CAP (Consistency/Availability/Partition-Tolerance); BASE (Basically Available, Soft State, Eventually Consistent); Datenmodelle: Key-Value-Stores, Spaltenbasierte
MehrVerteilte Systeme. Replikation & Konsistenz I. Prof. Dr. Oliver Haase
Verteilte Systeme Replikation & Konsistenz I Prof. Dr. Oliver Haase 1 Überblick Replikation & Konsistenz I Ziele von Replikation Replikationsmodelle datenzentriert Client-zentriert Replikation & Konsistenz
MehrExtreme Performance mit Oracle Times Ten
Extreme Performance mit Oracle Times Ten Agenda 1. Architektur und Übersicht 2. Details der Caching-Technologie 3. Skalierbarkeit, Antwortzeiten, Benchmarkergebnisse 4. Times Ten für die Oracle-Datenbank
MehrDatenbanksysteme Kapitel 5: SQL Data Manipulation Language
Datenbanksysteme Kapitel 5: SQL Data Manipulation Language Prof. Dr. Peter Chamoni Mercator School of Management Lehrstuhl für Wirtschaftsinformatik, insb. Business Intelligence Prof. Dr. Peter Chamoni
Mehr<Insert Picture Here> RAC Architektur und Installation
RAC Architektur und Installation Elmar Ströhmer Michael Künzner Oracle Server Technologies Competence Center Agenda Überblick und Architekturen von HA-Systemen Hardware Die Basis
MehrIndustrie 4.0 und Smart Data
Industrie 4.0 und Smart Data Herausforderungen für die IT-Infrastruktur bei der Auswertung großer heterogener Datenmengen Richard Göbel Inhalt Industrie 4.0 - Was ist das? Was ist neu? Herausforderungen
MehrMapReduce. Jens Dörre. Universität Passau Projekt MAPREDUCEFOUNDATION. Funktionale Programmierung
MapReduce Jens Dörre Universität Passau Projekt MAPREDUCEFOUNDATION Funktionale Programmierung Jens Dörre (Uni Passau) MapReduce Funktionale Programmierung 1 / 25 Gliederung 1 MapReduce allgemein 2 MapReduce
MehrDatenbanken Grundlagen und Design
Frank Geisler Datenbanken Grundlagen und Design 3., aktualisierte und erweiterte Auflage mitp Vorwort 15 Teil I Grundlagen 19 i Einführung in das Thema Datenbanken 21 i.i Warum ist Datenbankdesign wichtig?
MehrInhaltsverzeichnis. Lothar Piepmeyer. Grundkurs Datenbanksysteme. Von den Konzepten bis zur Anwendungsentwicklung ISBN:
Lothar Piepmeyer Grundkurs Datenbanksysteme Von den Konzepten bis zur Anwendungsentwicklung ISBN: 978-3-446-42354-1 Weitere Informationen oder Bestellungen unter http://www.hanser.de/978-3-446-42354-1
MehrDatenbanken und SQL. Kapitel 1. Übersicht über Datenbanken. Edwin Schicker: Datenbanken und SQL (1)
Datenbanken und SQL Kapitel 1 Übersicht über Datenbanken Übersicht über Datenbanken Vergleich: Datenorganisation versus Datenbank Definition einer Datenbank Bierdepot: Eine Mini-Beispiel-Datenbank Anforderungen
MehrWide Column Stores. Felix Bruckner Mannheim, 15.06.2012
Wide Column Stores Felix Bruckner Mannheim, 15.06.2012 Agenda Einführung Motivation Grundlagen NoSQL Grundlagen Wide Column Stores Anwendungsfälle Datenmodell Technik Wide Column Stores & Cloud Computing
MehrArbeiten im Arbeitsspeicher
IT-STRATegIen In-Memory-Technologie Arbeiten im Arbeitsspeicher In-Memory-Datenbanken fristeten über lange Zeit ein Nischendasein als Cache für traditionelle relationale Datenbanken oder als spezielle
MehrIN RAM we trust! In- Memory- Datenbanken SAP HANA. BI & Big Data Juli 2015 Seite 56
IN RAM we trust! In- Memory- Datenbanken In-Memory-Datenbanken fristeten über lange Zeit ein Nischendasein als Cache traditioneller relationaler Datenbanken oder als spezielle Data-Warehouse-Lösungen.
MehrWebbasierte Informationssysteme
SS 2004 Prof. Dr. Stefan Böttcher Universität Paderborn - SS 2004 - Prof. Dr. Stefan Böttcher Folie 1 Was ist eine relationale Datenbank? Menge von Relationen (=Tabellen) und Constraints (=Integritätsbedingungen)
MehrNoSQL mit XML. Einsatzmöglichkeiten und Vorteile eines dokumentorien<erten Repositories. MarkupForum Jochen Jörg, Senior Consultant, MarkLogic
NoSQL mit XML Einsatzmöglichkeiten und Vorteile eines dokumentorien
MehrAuf einen Blick. Abfrage und Bearbeitung. Erstellen einer Datenbank. Komplexe Abfragen. Vorwort... 13
Auf einen Blick Vorwort... 13 Teil 1 Vorbereitung Kapitel 1 Einleitung... 17 Kapitel 2 SQL der Standard relationaler Datenbanken... 21 Kapitel 3 Die Beispieldatenbanken... 39 Teil 2 Abfrage und Bearbeitung
MehrDie CONNECT Storage Engine für MySQL Zugriff auf verschiedenste Daten
Schlüsselworte Die CONNECT Storage Engine für MySQL Zugriff auf verschiedenste Daten Ralf Gebhardt SkySQL Ab Finnland - Esbo Storage Engine, CONNECT, MySQL, MariaDB, BI, Datenbank, SQL, Datei-Formate,
MehrObjektrelationale Datenbanken
Objektrelationale Datenbanken Ein Lehrbuch von Can Türker, Gunther Saake 1. Auflage Objektrelationale Datenbanken Türker / Saake schnell und portofrei erhältlich bei beck-shop.de DIE FACHBUCHHANDLUNG dpunkt.verlag
MehrDarko Križić. NoSQL Datenbanken
Darko Križić NoSQL Datenbanken Ihr Referent Darko Križić Chief Technical Officer Enterprise Architecture Java Enterprise EdiCon High Availability ESB (Talend ESB) NoSQL (MongoDB, CouchDB) NoSQL Datenbanken
MehrDatenbanken & Informationssysteme (WS 2016/2017)
Datenbanken & Informationssysteme (WS 2016/2017) Klaus Berberich (klaus.berberich@htwsaar.de) Wolfgang Braun (wolfgang.braun@htwsaar.de) 0. Organisatorisches Dozenten Klaus Berberich (klaus.berberich@htwsaar.de)
MehrDatenbanken Unit 9: OLAP, OLTP, Data Warehouse Ranking Algorithmen
Datenbanken Unit 9: OLAP, OLTP, Data Warehouse Ranking Algorithmen 28. V. 2018 Outline 1 Organisatorisches 2 OLTP, OLAP, SAP, and Data Warehouse OLTP and OLAP SAP 3 Ranking 4 SQL Organisatorisches Ergebnisse
MehrSoziotechnische Systeme Sommer Soziotechnische Informationssysteme. 8. SQL und NoSQL. Die gute alte Zeit. (c) Peter Sturm, Universität Trier 1
Soziotechnische Informationssysteme 8. SQL und NoSQL Die gute alte Zeit (c) Peter Sturm, Universität Trier 1 Relationale Datenbank (c) Peter Sturm, Universität Trier 2 RDBMs 1970, IBM Edgar Codd Persistente
MehrTabellenkalkulationssysteme Inf 9 / 1
Tabellenkalkulationssysteme Inf 9 / 1 1.1 Inhalte von Zellen Die Zellen von Rechenblättern können Werte (Daten) oder Formeln enthalten. Werte können mithilfe von Zellbezügen als Eingabe für Formeln verwendet
Mehr