Weniger ist mehr? Skalierbares Datenmanagement zwischen NoSQL und klassischen DBS
|
|
- Til Fleischer
- vor 8 Jahren
- Abrufe
Transkript
1 Weniger ist mehr? Skalierbares Datenmanagement zwischen NoSQL und klassischen DBS Herbsttreffen der FG DB, 17./ Kai-Uwe Sattler Ilmenau University of Technology, Germany
2 Stell dir vor GB Daten 1000 Nutzer/Tag 2
3 ... doch dann GB Daten Nutzer/Tag 3
4 Gliederung Skalierung von Datenmanagement Benchmarking für Skalierbarkeit Techniken für skalierbares Datenmanagement NoSQL als Alternative? Fazit 4
5 Scale up vs. Scale out Scale up: wenige, aber größere Server Scale out: viele, kleinere (Commodity-)Server Quelle: ibm.com Quelle: storagesystems1.com 5
6 Scale up Vorteil: transparent für DBMS Administrationsaufwand konstant Nachteil: 6
7 Scale out Vorteil: Nachteil: Verteilung von Last/Daten notwendig Maßnahmen zur Lastverteilung notwendig ggf. verteilte Protokolle (2PC, Replikation) 7
8 Benchmarking für Skalierbarkeit Ziele Bewertung/Vergleich des Systemverhaltens bei Zunahme von Last/Datenmenge Einfluss der Hinzunahme von Ressourcen (Server,...) Bewertungsmaße: Performanz, Preis/Performanz,... Benchmarks TPC-* Yahoo! Cloud Serving Benchmark Tractor Pulling... 8
9 TPC TPC-H: Decision Support, Data Warehousing einfaches, normalisiertes Schema mit wenigen Tabellen komplexe Ad-hoc-Anfragen Metriken: TPC-C: Order Entry Application (Bestellungen, Lieferungen, Warenbestand,...) einfaches Schema Updates, 5 Transaktionstypen (ACID) Metriken: tpmc, $/tpmc TPC-DS: potentieller TPC-H-Nachfolger komplexeres, realitätsnäheres Schema CH-BenCHmark (DBTest 2011): hybrider Lösung aus TPC-C und TPC-H Skalierung über DB-Größe Scale-Faktor bei TPC-H (LINEITEM) und TPC-C (WAREHOUSE) bei TPC-C auch über Nutzer/Requests 9
10 Yahoo! Cloud Serving Benchmark Yahoo! Research (SoCC 2010) eine Tabelle mit Records; verschiedene Datenverteilungen einfache Operationen: Lesen, Einfügen, Löschen von Records, Range Scans Metriken: Performanz: Latenz bei wachsendem Durchsatz Scaling: Scaleup konstante Performanz bei wachsender Datenmenge und Serveranzahl? Elastic Speedup: Performanzverbesserung beim Hinzufügen von Servern im laufenden Betrieb 10
11 Yahoo! Cloud Serving Benchmark Quelle: B. Cooper 11
12 Tractor Pulling (DBTest 2011) Ergebnis eines Dagstuhl-Seminars zu Robust Query Processing 2010 Ziel: Messen von Robustheit von DBMS 12
13 Tractor Pulling kontrollierte Zunahme von Last und/oder Datenvolumen Schrittweises Vorgehen; Schritt aus Änderungen am Katalog Daten laden, Indexe erzeugen Anfragen ausführen (konstante Anfragen, Anfragen mit zunehmender Komplexität, konkurrierend) Prinzip Uniform Zipf 13
14 0 Tractor Pulling: Tracks und Metriken Szenarien: Hills: langsam wachsende DB, komplexere Anfragen, konstante Nutzerzahl Meadows: konstante DB-Größe, zunehmende Anfragekomplexität Rockies: wachsende DB + Anfragekomplexität + Nutzer... Metriken (für Robustheit) Standardabweichung für Ladezeit, Speicherbedarf, Anfrageoptimierungs- und -ausführungszeit,... Step Zeit in s Meadows -CLIQUE 14
15 Techniken für skalierbares Datenmanagement Arbeit verteilen klassische Parallelisierungstechniken (Inter-Query- bzw. Intra-Query- Parallelität) Sharding Arbeit reduzieren IO als dominierenden Faktor reduzieren (Caching, Main Memory DBMS) Spezialisierung (Column Stores, OLTP- DBMS) Arbeit outsourcen Amazon RDS (5 GB..1 TB), SQL Azure (100 GB) 15
16 Partitionierung und Verteilung Voraussetzung: Problem (Last, Daten) ist partitionierbar Horizontale Partitionierung der Daten: pro Server = Partition transparent durch globales Verteilungsschema Sharding: explizit in der Applikation Kunden Brandenburg Kunden Thüringen Kunden Sachsen Kunden Bayern Vorteil: Aufteilung der Last Nachteile: Realisierung partitionsübergreifenden Operationen (Vereinigung, Join) Schemamanagement über viele Knoten ggf. Redistribution der Daten und Anpassung der Applikation notwendig 16
17 Partitionierung und Verteilung Denormalisierung Unterstützung von Sharding + Concurrency durch Normalisierung Probleme: Redundanz,... Consistent Hashing Schlüssel (Daten + Serveradressen) als Punkte auf einem Ring abbilden (über Hashfunktion) Server ist für Schlüsselbereich zuständig Vermeidet aufwendiges Remapping aller Schlüssel bei Hinzunahme/Entfernen von Serverknoten K49 K57 K40 K33 N42 N58 N32 K23 K31 K59 K5 N8 N21 K10 K15 17
18 IO-Aufwand reduzieren Disk-Zugriffe eliminieren Vorberechnung (Materialized Views) Caching: Memcached Cache-Server: Zwischenspeichern von serialisierten Objekten (Werte, Dokumente, Anfrageergebnisse) unter einem Schlüssel Beschleunigt nur Leseoperationen Main-Memory-DBMS: Vollständige Verwaltung der Datenbank im Hauptspeicher Beispiele: TimesTen, ParAccel, HANA, Membase, MonetDB,... Hauptspeichergrenze weiterhin vorhanden Spaltenorientierte Datenorganisation: Reduzierung der zu lesenden Daten auf den für die Anfrage notwendigen Teil Vektorisierte Verarbeitung statt Iterator-Prinzip MonetDB, Sybase IQ, VectorWise, Vertica,... Ergebnis: siehe aktuelletpc-h-rangliste 18
19 Grenzen: Hardware als limitierender Faktor Hauptspeicher: Adressierbarkeit, Kosten,... IO: Bandbreite von SATA (3/6 GBit), Fibre Channel,... CPU-Takt: 19
20 Grenzen: CAP-Theorem [Brewer 2000] Consistency: alle Clients (Anwendungen) haben die gleiche Sicht auf den Datenbestand auch im Fall von Updates Availability: es ist immer eine Kopie der Daten verfügbar, auch im Fehlerfall Partition Tolerance: Systemeigenschaften bleiben auch bei Partitionierung des Netzwerks erhalten Für verteilte Shared-Data-Systeme sind zu jeder Zeit nur maximal zwei dieser drei Eigenschaften erreichbar. 20
21 CAP-Theorem Im Partitionierungsfall: warten bis Daten wieder konsistent sind Sperrverfahren Consistency Keine Konsistenzgarantien Updates erfordern Konfliktbehandlung Availability Partition Tolerance Jeder Knoten ist mit jedem verbunden oder alle bilden eine atomare Einheit 2PC 21
22 Außerdem... Optimierung und Ausführung von Anfragen formuliert in SQL: SQL/XML über 1000 Knoten hinweg?? Umgang mit Ausfällen 1 Server 1 Ausfall alle 3 Jahre (1000 Tage) Server 10 Ausfälle pro Tag! Konsequenz: Einschränkung der Funktionalität AP, CA, (CP)-Systeme Transaktionssemantik (begrenzte Atomarität) Anfrageoperationen (Schlüsselzugriffe, keine Verbunde) 22
23 NoSQL eine Alternative? Klasse von Datenbanksystemen, die einen nicht-relationalen Ansatz verfolgen 23 im Datenmodell: Graphen, Dokumente,... in der Anfragesprache: kein SQL, keine Anfragesprache,... in Architektur und Features: massiv verteilt, eingeschränkte ACID- Eigenschaften (Konsistenz, Isolation) kein SQL, keine Transaktionen, kein Schema und keine Integritätsbedingungen
24 Markt & Beispiele Key-Value-Stores: Speicherung von Schlüssel-Wert-Paaren, Lookup-Operationen Beispiele: S3, Riak,... Dokumentenzentrierte Systeme: kein oder flexibles Schema (JSON-Dokumente) Beispiele: CouchDB, mongodb,... Graphenorientierte Systeme: Verwaltung von Graphstrukturen (z.b. für soziale Netze) Beispiele: Sones,... Row und Column Stores: klassische tupelstrukturierte Daten, SQL-ähnliche Anfragen Beispiele: BigTable, SimpleDB,... 24
25 Cassandra entwickelt von Facebook und 2008 als Open Source veröffentlicht seit 2010 Top-Level-Projekt bei Apache Kombination von Amazon Dynamo (massiv verteilt) und BigTable (ColumnFamily) Basis: DHT mit Consistent Hashing Replikate im Ring verteilt asynchrone und synchrone Replikation 25
26 Cassandra: Datenmodell Column = Tripel aus (Name, Wert, Zeitstempel) ColumnFamily (CF) = Tabelle aus Rows mit eindeutigem Schlüssel Immer sortiert nach Schlüssel (Index) Zusätzliche Sekundärindexe möglich Keyspace: Bestellsystem CF: CUSTOMER Key Column: Name Column: Address 42 Felix Potsdam 43 Alfons München CF: ORDERS... 26
27 Cassandra: Anfragen Thrift-API (RPC-Zugriffe) CQL einfachste Anfragen Selektion über indexierte Spalten Keine Joins Operationsspezifische Beeinflussung der Konsistenz ZERO (keine Garantien), ANY, ONE (Schreiben auf mind. 1 Knoten), QUORUM (Mindestanzahl von Knoten beim Schreiben), ALL (alle Knoten) Konflikterkennung über Zeitstempel Commit-Logs, nicht nur Replikation 27
28 VoltDB In-Memory OLTP-System basierend auf H-Store Beobachtungen Disk-IO als Bottleneck viele Anwendungen benutzen nur eine kleine (und bekannte) Anzahl verschiedener Transaktionen Datenplatzierung (Replikation, Partitionierung) mit großem Einfluss auf Performanz, jedoch abhängig von Schema und Workload Stripped-down-Systeme (Single threaded, Recovery durch Zustandskopieren,...) versprechen bessere Performanz Features Shared-Nothing-Cluster mit Main-memory-Datenbank automatische Partitionierung von Relationen ACID-Transaktionen Performanzziel: Durchsatz; nicht Latenz 28
29 VoltDB: Prinzip StoredProc(KUNDE) StoredProc(KUNDE) Tabelle KUNDE Tabelle BEST StoredProc(BEST) StoredProc(KUNDE Tabelle 1 1 ) Tabelle KUNDE 2 StoredProc(KUNDE Tabelle 3 3 ) StoredProc(BEST Tabelle 1 1 ) Tabelle BEST 2 Tabelle BEST 3 Knoten #1 Knoten #2 Knoten #3 29
30 VoltDB: Transaktionen Transaktion = Instanz einer Stored Procedure (Java + SQL-Anfrage) abgeleitet von einer vordefinierten Java-Klasse Annotation für Optimierungsmöglichkeiten Single Partition: kann auf einer einzelnen Partition (=ein Knoten) ausgeführt werden erlaubt Transfer der Ausführungskontrolle zu dem entsprechenden Knoten Partitionsinfo (Partitionierungsspalte, Parameter der Stored Procedure) 30
31 Amazon SimpleDB NoSQL-Cloud-Service von Amazon Alternative zu S3 (Storage) und RDS (MySQL-Instanzen) Hochverfügbar und hochskalierbar (AP-System) Pay-per-Use-Preismodell (Datentransfer, Anzahl Requests) Bsp. 1 Mill. Items a 25 Attribute (500 GB Speicher); 500 GB In/Out, Requests => $185/Monat Tools: AWS Toolkit for Eclipse Scratchpad (Javascript/HTML) SDK für Java, PHP,.NET,... 31
32 Amazon SimpleDB Datenmodell Tupelmodell: Domain = Kollektion von Items beschrieben über Key-Value-Paare; max. Größe10 GB Attribute können pro Item hinzugefügt werden (max. 256) API Storage Account Customer Order Customer #1 Customer #2 Domain Item Name: Wolfgang City: Dresden Attribute: Value Domain: CreateDomain, ListDomain,... Item: PutAttributes, DeleteAttributes bzw. GetAttributes 32
33 Amazon SimpleDB Anfragen Beschränkt auf einzelne Domain SFW-Syntax + count() + Multiattribut-Prädikate Stringwertige Daten: Vergleich nur lexikographisch Einschränkungen Standardfall: Eventually Consistent Reads Lesen garantiert nicht Ergebnisse des letzten Schreibens (erst nach Wiederholung, max. 1 Sekunde) Consistent Read für einzelne Leseanforderungen Atomares Schreiben nur pro Item Synchronisation von Hand über bedingte Put/Delete- Operationen möglich 33
34 Fazit & Take Home Message frischer Wind im Datenbankmarkt mit > 122 Einträgen NoSQL-Systeme zielen (nicht nur) auf Skalierbarkeit ab verschiedene (Optimierungs-)Ziele Durchsatz Datenvolumen flexible Schemata sind schon im produktiven Einsatz in kommerziellen Cloud-Angebote (Amazon SimpleDB, Google AppEngine,...) in Web2.0-Unternehmen (Facebook, Foursquare,...) auch von Oracle ;-) aber nicht immer dauerhaft (siehe Facebook: Cassandra HBase) 34
35 Fazit & Take Home Message TINSTAAFL There's no such thing as a free lunch Skalierbarkeit hat einen Preis: Kosten oder Funktionalität fehlende Funktionalität im DBMS (Anfragesprache, Verbunde, Transaktionsunterstützung,...) wird in Anwendung eventuell nicht vermisst oder muss in der Anwendung nachimplementiert werden daher: Bsp.: Joins in GQL für GAE, OCC in SimpleDB,... Skalierbarkeit welche Dimension? Anwendungsanforderungen Benchmarking We don't have Hadoop because we have large data; we have large data because we have Hadoop. Doug Buzzwords
Überblick und Vergleich von NoSQL. Datenbanksystemen
Fakultät Informatik Hauptseminar Technische Informationssysteme Überblick und Vergleich von NoSQL Christian Oelsner Dresden, 20. Mai 2011 1 1. Einführung 2. Historisches & Definition 3. Kategorien von
MehrOpen-Source-Datenbanksysteme: Von MySQL bis NoSQL oder gleich in die Cloud?
Open-Source-Datenbanksysteme: Von MySQL bis NoSQL oder gleich in die Cloud? GI-Regionalgruppentreffen, Jena 6.12.2011 Kai-Uwe Sattler Ilmenau University of Technology, Germany www.tu-ilmenau.de/dbis Überblick!
MehrANALYTICS, RISK MANAGEMENT & FINANCE ARCHITECTURE. NoSQL Datenbanksysteme Übersicht, Abgrenzung & Charakteristik
ARFA ANALYTICS, RISK MANAGEMENT & FINANCE ARCHITECTURE NoSQL Datenbanksysteme Übersicht, Abgrenzung & Charakteristik Ralf Leipner Domain Architect Analytics, Risk Management & Finance 33. Berner Architekten
MehrApache HBase. A BigTable Column Store on top of Hadoop
Apache HBase A BigTable Column Store on top of Hadoop Ich bin... Mitch Köhler Selbstständig seit 2010 Tätig als Softwareentwickler Softwarearchitekt Student an der OVGU seit Oktober 2011 Schwerpunkte Client/Server,
MehrFragenkatalog zum Kurs 1666 (Datenbanken in Rechnernetzen) Kurstext von SS 96
Fragenkatalog zum Kurs 1666 (Datenbanken in Rechnernetzen) Kurstext von SS 96 Dieser Fragenkatalog wurde aufgrund das Basistextes und zum Teil aus den Prüfungsprotokollen erstellt, um sich auf mögliche
MehrNoSQL. Einblick in die Welt nicht-relationaler Datenbanken. Christoph Föhrdes. UnFUG, SS10 17.06.2010
NoSQL Einblick in die Welt nicht-relationaler Datenbanken Christoph Föhrdes UnFUG, SS10 17.06.2010 About me Christoph Föhrdes AIB Semester 7 IRC: cfo #unfug@irc.ghb.fh-furtwangen.de netblox GbR (http://netblox.de)
Mehr25.09.2014. Zeit bedeutet eine Abwägung von Skalierbarkeit und Konsistenz
1 2 Dies ist ein Vortrag über Zeit in verteilten Anwendungen Wir betrachten die diskrete "Anwendungszeit" in der nebenläufige Aktivitäten auftreten Aktivitäten in einer hochgradig skalierbaren (verteilten)
MehrISBN: 978-3-8428-0679-5 Herstellung: Diplomica Verlag GmbH, Hamburg, 2011
Nils Petersohn Vergleich und Evaluation zwischen modernen und traditionellen Datenbankkonzepten unter den Gesichtspunkten Skalierung, Abfragemöglichkeit und Konsistenz Diplomica Verlag Nils Petersohn Vergleich
MehrKonsistenzproblematik bei der Cloud-Datenspeicherung
Konsistenzproblematik bei der Cloud-Datenspeicherung ISE Seminar 2012 Adrian Zylla 1 Cloud Bereitstellung von Speicher- und Rechenkapazität Die Cloud ist für den Anwender eine Blackbox Besitzt drei Servicemodelle
MehrSuche schlecht beschriftete Bilder mit Eigenen Abfragen
Suche schlecht beschriftete Bilder mit Eigenen Abfragen Ist die Bilderdatenbank über einen längeren Zeitraum in Benutzung, so steigt die Wahrscheinlichkeit für schlecht beschriftete Bilder 1. Insbesondere
MehrSimpleVOC-Yetanother. Bausteine für eine Key/Value- Datenbank
SimpleVOC-Yetanother Memcached? Bausteine für eine Key/Value- Datenbank SimpleVOC Yet another memcached? Bausteine für eine Key/Value Datenbank. Theorie (Martin Schönert) Praxis (Frank Celler) Eine Weisheit
MehrSeminar Cloud Data Management WS09/10. Tabelle1 Tabelle2
Seminar Cloud Data Management WS09/10 Tabelle1 Tabelle2 1 Einführung DBMS in der Cloud Vergleich verschiedener DBMS Beispiele Microsoft Azure Amazon RDS Amazon EC2 Relational Databases AMIs Was gibt es
MehrAlgorithmen. Consistent Hashing Bloom Filter MapReduce. Distributed Hash Tables. Einführung 1
Algorithmen Consistent Hashing Bloom Filter MapReduce Distributed Hash Tables Einführung 1 Consistent Hashing Problem: Wie finde ich den Speicherort für ein Objekt in einem verteilten System mit n Knoten?
Mehr7. Übung - Datenbanken
7. Übung - Datenbanken Informatik I für Verkehrsingenieure Aufgaben inkl. Beispiellösungen 1. Aufgabe: DBS a Was ist die Kernaufgabe von Datenbanksystemen? b Beschreiben Sie kurz die Abstraktionsebenen
MehrDokumentenorientierte Datenbanken - MongoDB
Dokumentenorientierte Datenbanken - MongoDB Jan Hentschel Ultra Tendency UG Übersicht Dokumente sind unabhängige Einheiten Bessere Performance (zusammengehörige Daten werden gemeinsam gelesen) Objektmodell
MehrÜberblick. Multi-Cloud Computing Motivation Redundant Array of Cloud Storage (RACS) Zusammenfassung. c td MWCC (WS14/15) Multi-Cloud Computing 13 1
Überblick Multi-Cloud Computing Motivation Redundant Array of Cloud Storage (RACS) Zusammenfassung c td MWCC (WS14/15) Multi-Cloud Computing 13 1 Vendor Lock-In -Problem Typische Vorgehensweise bei der
MehrXAMPP-Systeme. Teil 3: My SQL. PGP II/05 MySQL
XAMPP-Systeme Teil 3: My SQL Daten Eine Wesenseigenschaft von Menschen ist es, Informationen, in welcher Form sie auch immer auftreten, zu ordnen, zu klassifizieren und in strukturierter Form abzulegen.
MehrDatenbanken. Prof. Dr. Bernhard Schiefer. bernhard.schiefer@fh-kl.de http://www.fh-kl.de/~schiefer
Datenbanken Prof. Dr. Bernhard Schiefer bernhard.schiefer@fh-kl.de http://www.fh-kl.de/~schiefer Wesentliche Inhalte Begriff DBS Datenbankmodelle Datenbankentwurf konzeptionell, logisch und relational
MehrGesicherte Prozeduren
Gesicherte Prozeduren Wenn eine Anwendung auf einer Client-Maschine läuft, wird normalerweise jede SQL-Anweisung einzeln vom Client an den Server gesandt, und jedes Ergebnistupel wird einzeln zurückgeliefert.
MehrPersönlichkeiten bei bluehands
Persönlichkeiten bei Technologien bei Skalierbare Anwendungen mit Windows Azure GmbH & co.mmunication KG am@.de; posts..de/am 1 2 3 4 5 6 7 8 9 Immer mehr Mehr Performance Mehr Menge Mehr Verfügbarkeit
MehrAlbert HAYR Linux, IT and Open Source Expert and Solution Architect. Open Source professionell einsetzen
Open Source professionell einsetzen 1 Mein Background Ich bin überzeugt von Open Source. Ich verwende fast nur Open Source privat und beruflich. Ich arbeite seit mehr als 10 Jahren mit Linux und Open Source.
MehrPostgreSQL in großen Installationen
PostgreSQL in großen Installationen Cybertec Schönig & Schönig GmbH Hans-Jürgen Schönig Wieso PostgreSQL? - Die fortschrittlichste Open Source Database - Lizenzpolitik: wirkliche Freiheit - Stabilität,
MehrKapitel 14 Verteilte DBMS
Kapitel 14 Verteilte DBMS 14 Verteilte DBMS 14 Verteilte DBMS...1 14.1 Begriff, Architektur und Ziele verteilter Datenbanksysteme...2 14.2 Verteilungsarten...5 14.2.1 Verteilung der Daten...5 14.2.2 Verteilung
MehrRavenDB, schnell und skalierbar
RavenDB, schnell und skalierbar Big Data & NoSQL, Aydin Mir Mohammadi bluehands GmbH & Co.mmunication KG am@bluehands.de Immer mehr Mehr Performance Mehr Menge Mehr Verfügbarkeit Skalierung http://www.flickr.com/photos/39901968@n04/4864698533/
MehrNoSQL HANSER. Einstieg in die Web 2.0 Datenbanken. Stefan Edlich Achim Friedland Jens Hampe Benjamin Brauer Markus Brückner
Stefan Edlich Achim Friedland Jens Hampe Benjamin Brauer Markus Brückner NoSQL Einstieg in die Web 2.0 Datenbanken 2., akutalisierte und erweiterte Auflage HANSER Geleitwort Vorwort Vorwort zur 2. Auflage
MehrSeminar Informationsintegration und Informationsqualität. Dragan Sunjka. 30. Juni 2006
Seminar Informationsintegration und Informationsqualität TU Kaiserslautern 30. Juni 2006 Gliederung Autonomie Verteilung führt zu Autonomie... Intra-Organisation: historisch Inter-Organisation: Internet
MehrCharakteristika und Vergleich von SQL- und NoSQL- Datenbanken
Universität Leipzig Fakultät für Mathematik und Informatik Abteilung Datenbanken Dozent: Prof. Dr. Erhard Rahm Betreuer: Stefan Endrullis Problemseminar NoSQL-Datenbanken Semester: WS 11/12 Charakteristika
MehrBig Data Mythen und Fakten
Big Data Mythen und Fakten Mario Meir-Huber Research Analyst, IDC Copyright IDC. Reproduction is forbidden unless authorized. All rights reserved. About me Research Analyst @ IDC Author verschiedener IT-Fachbücher
Mehr3. Stored Procedures und PL/SQL
3. Stored Procedures und PL/SQL Wenn eine Anwendung auf einer Client-Maschine läuft, wird normalerweise jede SQL-Anweisung einzeln vom Client an den Server gesandt, und jedes Ergebnistupel wird einzeln
MehrAllgemeines zu Datenbanken
Allgemeines zu Datenbanken Was ist eine Datenbank? Datensatz Zusammenfassung von Datenelementen mit fester Struktur Z.B.: Kunde Alois Müller, Hegenheimerstr. 28, Basel Datenbank Sammlung von strukturierten,
Mehrpeer-to-peer Dateisystem Synchronisation
Ziel Realisierungen Coda Ideen Fazit Literatur peer-to-peer Dateisystem Synchronisation Studiendepartment Informatik Hochschule für Angewandte Wissenschaften Hamburg 30. November 2007 Ziel Realisierungen
MehrNoSQL-Datenbanken. Kapitel 1: Einführung. Lars Kolb Sommersemester 2014. Universität Leipzig http://dbs.uni-leipzig.de 1-1
NoSQL-Datenbanken Kapitel 1: Einführung Lars Kolb Sommersemester 2014 Universität Leipzig http://dbs.uni-leipzig.de 1-1 Inhaltsverzeichnis NoSQL-Datenbanken Motivation und Definition Kategorisierung, Eigenschaften
MehrTransaktionsverwaltung
Transaktionsverwaltung VU Datenbanksysteme vom 21.10. 2015 Reinhard Pichler Arbeitsbereich Datenbanken und Artificial Intelligence Institut für Informationssysteme Technische Universität Wien Transaktionsverwaltung
MehrStefan Edlich Achim Friedland Jens Rampe Benjamin Brauer. NoSQL. Einstieg in die Welt nichtrelationaler Web 2.0 Datenbanken HANSER
Stefan Edlich Achim Friedland Jens Rampe Benjamin Brauer NoSQL Einstieg in die Welt nichtrelationaler Web 2.0 Datenbanken HANSER Geleitwort 1 Vorwort 1 1 Einführung 1 1.1 Historie 1 1.2 Definition und
MehrEin Ausflug zu ACCESS
Ein Ausflug zu ACCESS Die folgenden Folien zeigen beispielhaft, wie man sein DB- Wissen auf ACCESS übertragen kann betrachtet wird ACCESS 2002, da gerade im Bereich der Nutzung von SQL hier einiges nachgearbeitet
MehrSoziotechnische Informationssysteme
Soziotechnische Informationssysteme 8. NoSQL Relationale Datenbank NoSQL Datenbank Relationale Datenbank? NoSQL Datenbank RDBM 2 Warum? Skalierbarkeit Riesige Datenmengen Performanz und Elastizität Auslastung
MehrWas ist Amazon RDS? Datenbank Typen DB Instanzen Features. Live Demo Fazit. Amazon RDS - Till Ganzert 15.06.2012 2
Was ist Amazon RDS? Datenbank Typen DB Instanzen Features Kosten Live Demo Fazit 15.06.2012 2 Web-Service von Amazon Erlaubt mieten von Datenbanken Einrichtung, Betrieb und Skalierung übernimmt Anbieter
MehrKapitel 6 Anfragebearbeitung
LUDWIG- MAXIMILIANS- UNIVERSITY MUNICH DEPARTMENT INSTITUTE FOR INFORMATICS DATABASE Skript zur Vorlesung: Datenbanksysteme II Sommersemester 2014 Kapitel 6 Anfragebearbeitung Vorlesung: PD Dr. Peer Kröger
MehrSE2-10-Entwurfsmuster-2 15
Architektur und Skalierbarkeit SE2-10-Entwurfsmuster-2 15 Skalierbarkeit Skalierbarkeit bedeutet die Anpassung einer Software an wachsende Last: Interaktionsfrequenz Nutzerzahl Anpassung durch Hinzufügen
MehrKURZANLEITUNG CLOUD OBJECT STORAGE
KURZANLEITUNG CLOUD OBJECT STORAGE Version 1.12 01.07.2014 SEITE _ 2 INHALTSVERZEICHNIS 1. Einleitung... Seite 03 2. Anmelden am Cloud&Heat Dashboard... Seite 04 3. Anlegen eines Containers... Seite 05
MehrDatenbanken 16.1.2008. Die Entwicklung der Datenbanksysteme ist eng an die der Hardware gekoppelt und wird wie jene in Generationen eingeteilt:
Datenbanksysteme Entwicklung der Datenbanksysteme Die Entwicklung der Datenbanksysteme ist eng an die der Hardware gekoppelt und wird wie jene in Generationen eingeteilt: 1. Generation: In den fünfziger
Mehrmywms Vorlage Seite 1/5 mywms Datenhaltung von Haug Bürger
mywms Vorlage Seite 1/5 mywms Datenhaltung von Haug Bürger Grundlegendes Oracle9i PostgreSQL Prevayler Memory mywms bietet umfangreiche Konfigurationsmöglichkeiten um die Daten dauerhaft zu speichern.
MehrEinführung in Hauptspeicherdatenbanken
Einführung in Hauptspeicherdatenbanken Harald Zankl Probevorlesung 13. 01., 13:15 14:00, HS C Inhaltsverzeichnis Organisation Überblick Konklusion Harald Zankl (LFU) Hauptspeicherdatenbanken 2/16 Organisation
MehrDatenbankstammtisch. Replikation in heterogenen Datenbankumgebungen am Beispiel des Sybase Replication Servers. 1. Februar 2006
Datenbankstammtisch Replikation in heterogenen Datenbankumgebungen am Beispiel des Sybase Replication Servers 1. Februar 2006 Autoren: Andreas Reis, Sebastian Mehl Dipl.-Phys. Thomas Richter Gliederung
MehrCloud-Provider im Vergleich. Markus Knittig @mknittig
Cloud-Provider im Vergleich Markus Knittig @mknittig As Amazon accumulated more and more services, the productivity levels in producing innovation and value were dropping primarily because the engineers
MehrKassel, 20. März 2013. FALSCHE RICHTUNG? Daten aus dem DWH in einen Key-Value-Store für ein OLTP System
Kassel, 20. März 2013 FALSCHE RICHTUNG? Daten aus dem DWH in einen Key-Value-Store für ein OLTP System INHALT A. Ausgangssituation B. Aktuelle Lösung C. Neuer Ansatz mit Oracle NoSQL Database D. Aussicht
MehrWorkstations. Server. Recovery Log. Database. SQL Queries. Query Processing Object Mgmt. Transaction Mgmt. Buffer Mgmt. I/O Layer
Client-Server Architekturen: Query Shipping Grundprinzip 1. Client schickt Anfrage zum Server 2. Server schickt Ergebnisse der Anfrage zuruck Workstations Application Interface Layer SQL Queries Query
MehrÜbungen zur Softwaretechnik
Technische Universität München Fakultät für Informatik Lehrstuhl IV: Software & Systems Engineering Markus Pister, Dr. Bernhard Rumpe WS 2002/2003 Lösungsblatt 9 17. Dezember 2002 www4.in.tum.de/~rumpe/se
MehrUpdate Information. Independence Pro Software Suite 3.0 & Sound Libraries
Update Information Independence Pro Software Suite 3.0 & Sound Libraries 2 Yellow Tools Update Information Lieber Kunde, vielen Dank, dass Du Dich für eines unserer Produkte entschieden hast! Falls Du
MehrNoSQL. Was Architekten beachten sollten. Dr. Halil-Cem Gürsoy adesso AG. Architekturtag @ SEACON 2012 Hamburg
NoSQL Was Architekten beachten sollten Dr. Halil-Cem Gürsoy adesso AG Architekturtag @ SEACON 2012 Hamburg 06.06.2012 Agenda Ein Blick in die Welt der RDBMS Klassifizierung von NoSQL-Datenbanken Gemeinsamkeiten
MehrAvira Management Console 2.6.1 Optimierung für großes Netzwerk. Kurzanleitung
Avira Management Console 2.6.1 Optimierung für großes Netzwerk Kurzanleitung Inhaltsverzeichnis 1. Einleitung... 3 2. Aktivieren des Pull-Modus für den AMC Agent... 3 3. Ereignisse des AMC Agent festlegen...
MehrSzenarien zu Hochverfügbarkeit und Skalierung mit und ohne Oracle RAC. Alexander Scholz
Hochverfügbar und Skalierung mit und ohne RAC Szenarien zu Hochverfügbarkeit und Skalierung mit und ohne Oracle RAC Alexander Scholz Copyright its-people Alexander Scholz 1 Einleitung Hochverfügbarkeit
MehrScaling Rails. Jonathan Weiss, 02.09.2009 Peritor GmbH
Scaling Rails Jonathan Weiss, 02.09.2009 Peritor GmbH Scaling Rails 2 Scaling Rails 3 Rails 4 Performance Wikipedia: Das Wort Leistung (engl. Performance) wird in der Informatik verwendet, um das Vermögen
MehrWindows Server 2012 R2 Essentials & Hyper-V
erklärt: Windows Server 2012 R2 Essentials & Hyper-V Windows Server 2012 R2 Essentials bietet gegenüber der Vorgängerversion die Möglichkeit, mit den Boardmitteln den Windows Server 2012 R2 Essentials
MehrÜbungen zur Vorlesung. Datenbanken I
Prof. Dr. S. Böttcher Adelhard Türling Übungen zur Vorlesung Datenbanken I WS 2002/2003 Blatt 6 Aufgabe 1: In der Vorlesung haben Sie für die Einbringstrategie Update in Place die Vorgehensweisen steal,
MehrPeter Dikant mgm technology partners GmbH. Echtzeitsuche mit Hadoop und Solr
Peter Dikant mgm technology partners GmbH Echtzeitsuche mit Hadoop und Solr ECHTZEITSUCHE MIT HADOOP UND SOLR PETER DIKANT MGM TECHNOLOGY PARTNERS GMBH WHOAMI peter.dikant@mgm-tp.com Java Entwickler seit
MehrPowermanager Server- Client- Installation
Client A Server Client B Die Server- Client- Funktion ermöglicht es ein zentrales Powermanager Projekt von verschiedenen Client Rechnern aus zu bedienen. 1.0 Benötigte Voraussetzungen 1.1 Sowohl am Server
MehrStorage as a Service im DataCenter
Storage as a Service im DataCenter Agenda Definition Storage as a Service Storage as a Service und IT-Sicherheit Anwendungsmöglichkeiten und Architektur einer Storage as a Service Lösung Datensicherung
MehrSAP Memory Tuning. Erfahrungsbericht Fritz Egger GmbH & Co OG. Datenbanken sind unsere Welt www.dbmasters.at
SAP Memory Tuning Erfahrungsbericht Fritz Egger GmbH & Co OG Wie alles begann Wir haben bei Egger schon öfter auch im SAP Bereich Analysen und Tuning durchgeführt. Im Jan 2014 hatten wir einen Workshop
MehrOP-LOG www.op-log.de
Verwendung von Microsoft SQL Server, Seite 1/18 OP-LOG www.op-log.de Anleitung: Verwendung von Microsoft SQL Server 2005 Stand Mai 2010 1 Ich-lese-keine-Anleitungen 'Verwendung von Microsoft SQL Server
MehrOPERATIONEN AUF EINER DATENBANK
Einführung 1 OPERATIONEN AUF EINER DATENBANK Ein Benutzer stellt eine Anfrage: Die Benutzer einer Datenbank können meist sowohl interaktiv als auch über Anwendungen Anfragen an eine Datenbank stellen:
MehrProzessarchitektur einer Oracle-Instanz
6. Juni 2008 Inhaltsverzeichnis Oracle Instanz 1 Oracle Instanz 2 3 Redo Log Buffer Shared Pool Java Pool & Large Pool Oracle Instanz Eine Oracle-Instanz ist Hauptbestandteil des Oracle Datenbank Management
MehrSAP NetWeaver Gateway. Connectivity@SNAP 2013
SAP NetWeaver Gateway Connectivity@SNAP 2013 Neue Wege im Unternehmen Neue Geräte und Usererfahrungen Technische Innovationen in Unternehmen Wachsende Gemeinschaft an Entwicklern Ausdehnung der Geschäftsdaten
MehrSolaris Cluster. Dipl. Inform. Torsten Kasch <tk@cebitec.uni Bielefeld.DE> 8. Januar 2008
Dipl. Inform. Torsten Kasch 8. Januar 2008 Agenda Übersicht Cluster Hardware Cluster Software Konzepte: Data Services, Resources, Quorum Solaris Cluster am CeBiTec: HA Datenbank
MehrData Quality Management: Abgleich großer, redundanter Datenmengen
Data Quality Management: Abgleich großer, redundanter Datenmengen Westendstr. 14 809 München Tel 089-5100 907 Fax 089-5100 9087 E-Mail Datras@Datras.de Redundanz und relationales Datenbankmodell Redundanz:
MehrDatenbanksysteme II SS 2010. Übungsblatt 9: Wiederholung
Ludwig-Maximilians-Universität München München, 02.07.2010 Department Institut für Informatik PD Dr. Peer Kröger Andreas Züfle Datenbanksysteme II SS 2010 Übungsblatt 9: Wiederholung Besprechung: 20.07.2010
MehrKommunikationsübersicht XIMA FORMCYCLE Inhaltsverzeichnis
Kommunikationsübersicht Inhaltsverzeichnis Kommunikation bei Einsatz eines MasterServer... 2 Installation im... 2 Installation in der... 3 Kommunikation bei Einsatz eines MasterServer und FrontendServer...
Mehr2. Einrichtung der ODBC-Schnittstelle aus orgamax (für 32-bit-Anwendungen)
1. Einführung: Über den ODBC-Zugriff können Sie bestimmte Daten aus Ihren orgamax-mandanten in anderen Anwendungen (beispielsweise Microsoft Excel oder Microsoft Access) einlesen. Dies bietet sich beispielsweise
MehrSkalierbare Webanwendungen
Skalierbare Webanwendungen Thomas Bachmann Lead Software Architect & CIO Mambu GmbH Twitter: @thobach Anwendungsbeispiel Hohe Nichtfunktionale Anforderungen Sicherheit Vertraulichkeit Integrität Verfügbarkeit
MehrNEWSLETTER // AUGUST 2015
NEWSLETTER // AUGUST 2015 Kürzlich ist eine neue Version von SoftwareCentral erschienen, die neue Version enthält eine Reihe von Verbesserungen und neuen Funktionen die das Arbeiten mit SCCM noch einfacher
MehrVorlesung 30.03.2009 1) Einführung
Vorlesung 30.03.2009 1) Einführung Was versteht man unter dem Begriff Datenbank? - Eine Datenbank ist eine Struktur zur Speicherung von Daten mit lesendem und schreibendem Zugriff - Allgemein meint man
MehrTransaktionsverwaltung
Transaktionsverwaltung Commit Eigenschaften von Transaktionen (ACID) Transaktionen in SQL Kapitel 9 1 Transaktionsverwaltung Beispiel einer typischen Transaktion in einer Bankanwendung: 1. Lese den Kontostand
MehrHyper-V Replica in Windows Server 2012 R2. Benedict Berger Microsoft MVP Virtual Machine
Hyper-V Replica in Windows Server 2012 R2 Benedict Berger Microsoft MVP Virtual Machine Ihr Referent bb@elanity.de http://blog.benedict-berger.de Hyper-V Replica VM Mobility Möglichkeiten Replica Flexibilität
MehrAktuelle SE Praktiken für das WWW
Aktuelle SE Praktiken für das WWW SQL vs. NoSQL W. Mark Kubacki 23.06.2010 Gliederung Zusammenfassung Entstehungsgeschichte SQL vs. NoSQL Systemarchitekturen und Wachstumsmuster SQL NoSQL Überblick und
MehrSQL- & NoSQL-Datenbanken - Speichern und Analysen von großen Datenmengen
SQL- & NoSQL-Datenbanken - Speichern und Analysen von großen Datenmengen Lennart Leist Inhaltsverzeichnis 1 Einführung 2 1.1 Aufgaben einer Datenbank...................... 2 1.2 Geschichtliche Entwicklung
Mehr3. Stud.IP-Entwickler-Workshop 2. Juni 2006 Workshop 3c: Stud.IP-Enterprise-Edition André Noack, Frank Elsner
3. Stud.IP-Entwickler-Workshop 2. Juni 2006 Workshop 3c: Stud.IP-Enterprise-Edition André Noack, Frank Elsner Gliederung Das Problem: Skalierbarkeit LAMP Tuning Mehr als ein Server Stud.IP und shared nothing
MehrHochverfügbare Virtualisierung mit Open Source
Hochverfügbare Virtualisierung mit Open Source Gliederung DRBD Ganeti Libvirt Virtualisierung und Hochverfügbarkeit Hochverfügbarkeit von besonderer Bedeutung Defekt an einem Server => Ausfall vieler VMs
MehrFachbericht zum Thema: Anforderungen an ein Datenbanksystem
Fachbericht zum Thema: Anforderungen an ein Datenbanksystem von André Franken 1 Inhaltsverzeichnis 1 Inhaltsverzeichnis 1 2 Einführung 2 2.1 Gründe für den Einsatz von DB-Systemen 2 2.2 Definition: Datenbank
MehrGrundlagen von Datenbanken
Grundlagen von Datenbanken Aufgabenzettel 1 Grundlagen Datenbanken: Kurzer historischer Überblick (1) Anwendung 1 Anwendung 2 Datei 1 Datei 2 Datei 3 Zugriff auf Dateien ohne spezielle Verwaltung 2 Exkurs:
MehrMan liest sich: POP3/IMAP
Man liest sich: POP3/IMAP Gliederung 1. Einführung 1.1 Allgemeiner Nachrichtenfluss beim Versenden von E-Mails 1.2 Client und Server 1.2.1 Client 1.2.2 Server 2. POP3 2.1 Definition 2.2 Geschichte und
MehrHighQSoft GmbH www.highqsoft.de 21.05.2015. AVALON Distributor. Skalierbarkeit und Ausfallsicherheit. Dieter Müller
Distributor Skalierbarkeit und Ausfallsicherheit Dieter Müller 1 Übersicht 1) Motivation zur Erstelllung des Distributors 2) Anforderungen für die Implementierung 3) Systemarchitektur Distributor 4) Konfiguration
MehrTechnische Beschreibung: EPOD Server
EPOD Encrypted Private Online Disc Technische Beschreibung: EPOD Server Fördergeber Förderprogramm Fördernehmer Projektleitung Projekt Metadaten Internet Foundation Austria netidee JKU Linz Institut für
Mehr7 SharePoint Online und Office Web Apps verwenden
7 SharePoint Online und Office Web Apps verwenden Wenn Sie in Ihrem Office 365-Paket auch die SharePoint-Dienste integriert haben, so können Sie auf die Standard-Teamsite, die automatisch eingerichtet
MehrSystemvoraussetzungen
Systemvoraussetzungen Gültig ab Stotax Update 2016.1 Stand 03 / 2015 1 Allgemeines... 2 2 Stotax Online Variante (ASP)... 2 3 Stotax Offline Variante (Inhouse)... 3 3.1 Einzelplatz... 3 3.1.1 Hardware...
MehrMöglichkeiten für bestehende Systeme
Möglichkeiten für bestehende Systeme Marko Filler Bitterfeld, 27.08.2015 2015 GISA GmbH Leipziger Chaussee 191 a 06112 Halle (Saale) www.gisa.de Agenda Gegenüberstellung Data Warehouse Big Data Einsatz-
MehrMySQL Cluster mit Galera
MySQL Cluster mit Galera DOAG Konferenz 2013 Nürnberg Oli Sennhauser Senior MySQL Consultant, FromDual GmbH oli.sennhauser@fromdual.com 1 / 19 Über FromDual GmbH FromDual bietet neutral und unabhängig:
MehrVirtueller Seminarordner Anleitung für die Dozentinnen und Dozenten
Virtueller Seminarordner Anleitung für die Dozentinnen und Dozenten In dem Virtuellen Seminarordner werden für die Teilnehmerinnen und Teilnehmer des Seminars alle für das Seminar wichtigen Informationen,
MehrWas ist Windows Azure? (Stand Juni 2012)
Was ist Windows Azure? (Stand Juni 2012) Windows Azure Microsofts Cloud Plattform zu Erstellung, Betrieb und Skalierung eigener Cloud-basierter Anwendungen Cloud Services Laufzeitumgebung, Speicher, Datenbank,
MehrSQL. Fortgeschrittene Konzepte Auszug
SQL Fortgeschrittene Konzepte Auszug Levels SQL92 Unterteilung in 3 Levels Entry Level (i.w. SQL89) wird von nahezu allen DBS Herstellern unterstützt Intermediate Level Full Level SQL DML 2-2 SQL92 behebt
MehrUmstieg auf Microsoft Exchange in der Fakultät 02
Umstieg auf Microsoft Exchange in der Fakultät 02 Der IT-Steuerkreis der Hochschule München hat am am 26.07.12 einstimmig beschlossen an der Hochschule München ein neues Groupware-System auf der Basis
MehrDatensicherheit und Hochverfügbarkeit
Datensicherheit und Hochverfügbarkeit 1. Instanzfehler Aussage: Instanzfehler werden durch Crash Recovery vom DBS automatisch behandelt. Recovery Zeiten? Ausfall von Speichersubsystem, Rechner,...? Ausfall
MehrP.A. Bernstein, V. Hadzilacos, N. Goodman
TRANSAKTIONEN UND DATENINTEGRITÄT Concurrency Control and Recovery in Database Systems P.A. Bernstein, V. Hadzilacos, N. Goodman Addison Wesley, 1987. Kapitel 1. und 6. Grundlagen der Datenbanksysteme
MehrVerteilte Systeme - 5. Übung
Verteilte Systeme - 5. Übung Dr. Jens Brandt Sommersemester 2011 Transaktionen a) Erläutere was Transaktionen sind und wofür diese benötigt werden. Folge von Operationen mit bestimmten Eigenschaften: Atomicity
MehrTeamSpeak3 Einrichten
TeamSpeak3 Einrichten Version 1.0.3 24. April 2012 StreamPlus UG Es ist untersagt dieses Dokument ohne eine schriftliche Genehmigung der StreamPlus UG vollständig oder auszugsweise zu reproduzieren, vervielfältigen
MehrBig Data Informationen neu gelebt
Seminarunterlage Version: 1.01 Copyright Version 1.01 vom 21. Mai 2015 Dieses Dokument wird durch die veröffentlicht. Copyright. Alle Rechte vorbehalten. Alle Produkt- und Dienstleistungs-Bezeichnungen
MehrBigTable. 11.12.2012 Else
BigTable 11.12.2012 Else Einführung Distributed Storage System im Einsatz bei Google (2006) speichert strukturierte Daten petabyte-scale, > 1000 Nodes nicht relational, NoSQL setzt auf GFS auf 11.12.2012
MehrSystemvoraussetzungen
Systemvoraussetzungen Gültig ab Stotax Update 2014.2 Stand 05 / 2014 1 Allgemeines... 2 2 Stotax Online Variante (ASP)... 2 3 Stotax Offline Variante (Inhouse)... 3 3.1 Einzelplatz... 3 3.1.1 Hardware...
MehrIn-Memory Technologie Hekaton
Einleitende Worte 11. Juli 2014 Inhaltsverzeichnis I Einleitende Worte 1 Einleitende Worte 2 3 4 5 6 Hekaton... I Einleitende Worte griech:hekaton 100 (Zahlwort) Einsatz für OLTP (Echtzeit-Transaktionsverarbeitung)
MehrEntwurf einer einfachen Datenbank zur Wunschzettel- Verwaltung
Entwurf einer einfachen Datenbank zur Wunschzettel- Verwaltung Prof. Dr. Alfred Holl, Georg Simon Ohm University of Applied Sciences, Nuremberg, Germany 29.03.2014/1 Entwurf einer einfachen Datenbank zur
MehrHadoop. Eine Open-Source-Implementierung von MapReduce und BigTable. von Philipp Kemkes
Hadoop Eine Open-Source-Implementierung von MapReduce und BigTable von Philipp Kemkes Hadoop Framework für skalierbare, verteilt arbeitende Software Zur Verarbeitung großer Datenmengen (Terra- bis Petabyte)
Mehr