2. Architektur verteilter Datenbanksysteme

Ähnliche Dokumente
Einführung Verteilte DBS Schemaarchitektur Katalogverwaltung Namensverwaltung

Verteilte Datenbanken

Kapitel 1 Grundlagen. Skript zur Vorlesung: Datenbanksysteme II Sommersemester Vorlesung: PD Dr. Peer Kröger

Verteilte Datenbanken

2. Klassifikation von Mehrrechner-DBS

Verteilte Datenbanksysteme. Hans-Dieter Ehrich Institut für Informationssysteme Technische Universität Braunschweig

Verteilte Datenbanken

Kapitel 14 Verteilte DBMS

Sommersemester Vorlesung: Dr. Matthias Schubert

NoSQL Datenbanken EIN ÜBERBLICK ÜBER NICHT-RELATIONALE DATENBANKEN UND DEREN POTENTIALE IM ALLGEMEINEN UND IN DER INDUSTRIE

Datenbanken Grundlagen und Design

Replikation in einem homogenen strukturierten Chord Peer-to-Peer Netz

Abschluss Einblick und Ausblick

Verteilte Systeme. SoSe Universität Siegen. Tel.: 0271/ , Büro: H-B Stand: 14. Mai Verteilte Systeme. SoSe

1. Einführung, Problemstellung und Überblick Rechnernetze

Verteilte Systeme. Replikation & Konsistenz I. Prof. Dr. Oliver Haase

Archivierung in DBMS

Datenmodellierung VU Einführung SS 2015

Informationsintegration

Datenbanken als Grundlage für Informationssysteme

Datenmodellierung VU Einführung SS 2016

Entwicklung der Datenbanksysteme

NoSQL. Prof. Dr. Ingo Claßen. Einführung. Kategorisierung von NoSQL-Systemen. Verteilung. Konsistenz. Literatur

In diesem Abschnitt wollen wir uns mit der Architektur von Datenbank Managements Systemen beschäftigen.

Methodik zur Optimierung in Datenbanken. Anja Rommel, 14-INM

Kompaktes Netzwerk-Wissen rund um das Optimieren von Windows-Server basierten Netzwerken

Kapitel 1: Wiederholungsfragen Grundlagen DBS

Manfred Precht Datenverarbeitungsstelle der TU München, Freising-Weihenstephan WARUM DATENBANKEN? 1. Einleitung

Fragenkatalog zum Kurs 1666 (Datenbanken in Rechnernetzen) Kurstext von SS 96

Verteilte Betriebssysteme

Datenbanksysteme. Donald Kossmann TU München

Active Directory. Aufbau Funktion - Objekte

Grundlagen von Datenbanken

Kap. 5.3: SAP-Datenmodell, Metadatenverwaltung

Mehrrechner-Datenbanksysteme (Verteilte und Parallele DBS)

RavenDB, schnell und skalierbar

Anwendungsentwicklung Datenbanken Datenbankentwurf. Stefan Goebel

Überblick Felix Naumann. Zugriffsrechte Zugriffsrechte erzeugen Zugriffsrechte prüfen Zugriffsrechte vergeben Zugriffsrechte entziehen

Überblick. Replikation Motivation Grundlagen Aktive Replikation Passive Replikation. c td VS (SS16) Replikation 6 1

DBMS für spezielle Anwendungen XML als Mittel der Datenbank-Interoperabilität

Vorlesung "Verteilte Systeme" Sommersemester Verteilte Systeme. Adreßraum. Rechner. Verteilte Systeme, Sommersemester 1999 Folie 19.

Datenbanken. Prof. Dr. Bernhard Schiefer.

Modul Datenbanksysteme. (auch Teil des Moduls Informationssysteme) TU Bergakademie Freiberg

1. Einführung Seite 1. Kapitel 1: Einführung

Kap.2 Befehlsschnittstelle. Prozessoren, externe Sicht

OpenBib Rechercheportal Open Digital Information/Image Archive (OpenDIA) Workflow-Konzept

Ein Beispiel. Ein Unternehmen will Internettechnologien im Rahmen des E- Business nutzen Welche Geschäftsprozesse?

Verteilte Systeme. Diffusionsalgorithmen. Secure Identity Research Group

Allgemeines zu Datenbanken

P2P DATENBANKEN. Anwendungen 1 WS 2009/2010. Julissa Cusi Juarez. Department Informatik

Verteiltes und Paralleles Datenmanagement

Netzwerk-transparente Persistenz

Zentral verwaltete Netzwerke. Grundlage:

Einführung in unstrukturierte p2p Systeme wie Gnutella. HamzaOuldBakar. Chair for Communication Technology (ComTec(

Ausgabe: Eine DBMS unabhängige high-level Repräsentation der Anforderungen, das "konzeptuelle Schema".

Integration von heterogenen Datenbanken mit Oracle

Definition Informationssystem

Die Vernetzung von Computern Ab 1985 Vernetzung von Computern

Informationssysteme und Datenbanken (O?)

1. Einführung, Problemstellung und Überblick

Erfahrungsbericht Eine Architektur für ausfallsichere Systeme in standortübergreifenden Multiserver-Umgebungen

Stackmaschine; Speicheradressierung

Windows-XP-Workshop Teil 5: Windows.Net Server - Directory und Systemmanagement

Kapitel 3: Eigenschaften von Integrationssystemen. Einordnung von Integrationssystemen bzgl. Kriterien zur Beschreibung von Integrationssystemen

2. Klassifikation von Mehrrechner-DBS

Connection Pooling. Was ist das?? Unter Connection Pooling versteht man generell die Wiederverwendung physischer Datenbankverbindungen.

Enterprise JavaBeans Überblick

3. Verteilte Datenbanksysteme - Schemaarchitektur und Katalogverwaltung

Architekturen für ein Collaborative Workspace

Verteilte Dateisysteme und mobile Clients

Lehrplan. Datenbanken. Höhere Berufsfachschule für Automatisierungstechnik. Ministerium für Bildung

Informationsintegration Beispiel

Datensicherheit. 8. Datensicherheit

Informatik Fokussierte Informationsadaption am Beispiel. Astrid Lubinski Universität Rostock

2. Klassifikation von Mehrrechner-DBS

Grundlagen verteilter Systeme

Prüfung Verwalten und Warten einer Microsoft Windows Server Umgebung

Datenbankentwicklung

Optimierung von Datenbanken

Data Dictionary for Oracle

5.1 Verteilung von Aktualisierungshinweisen

Folien zum Textbuch. Kapitel 2: Planung, Entwicklung und Betrieb von IS. Teil 3: Modellierung von betrieblichen Informationssystemen

Das Wichtigste aus der DSGVO für ECM-Lösungen. Dr. Helmut Szpott

Festplatte klonen: Tutorial

Das relationale Datenmodell

NoSQL Andere Wege in der Speicherung von Geodaten?

Anwendung DBS DBMS. Übungsblatt 1 Stephan Brumme 5. November 2001 Matrikelnr , 5.Semester. Aufgabe 1: Definition von Grundbegriffen

DARIAH-DE Repositorium

Leistungsbeschreibung

Proseminar Konzepte von Betriebssystem- Komponenten (KVBK) Vortrag zum Thema: Speicheraddressierung, Segmentierung, Paging

1 Die Active Directory

Fachpraktikum Erweiterbare Datenbanksysteme im WS 2015/16. Aufgabe 4 der Phase 2. Anfrageoptimierung für verteilte Datenbanken

Datenbanken und Datenbanktypen Tag 1 : Kapitel 1. Christian Inauen. Lernziele. Entwicklung der Datenbanken.

PD Dr.-Ing. F. Lobeck. Seite 6

Sicherheitsmechanismen für CANbasierte Dienstlokalisierung in Sensornetzen

Cloud Computing in SAP Umgebungen

Freispeicherverwaltung

Enterprise Content Management für Hochschulen

Transkript:

2. Architektur verteilter Datenbanksysteme Verteilte Datenbank, kurz DDB (engl. distributed database): eine Sammlung logisch zusammengehöriger Datenbanken, welche über Rechnerknoten ( Sites ) verteilt sind, die durch ein Kommunikations-Netzwerk verbunden sind; Site 1 Site 2 Verteiltes DBMS, kurz DDBMS (engl. distributed DBMS): die Software, die das Management einer verteilten Datenbank ermöglicht; wichtig dabei: Die Datenverteilung ist für Benutzer transparent Site 3 Kommunikations Netzwerk Site 4 2-1/15

Forderungen an verteilte DBMS Jede Site sollte lokal autonom, d.h. nicht von einer Master-Site abhängig sein Benutzer brauchen nicht zu wissen an welchen Orten im Netz Daten physisch gespeichert sind Orts-Transparenz wie Datenmengen zum Zwecke der Verteilung intern zerlegt sind Fragmentierungs-Transparenz ob und gegebenenfalls wie Datenobjekte an unterschiedlichen Orten repliziert sind Replikations-Transparenz wie Anfragen oder Transaktionen, welche auf Daten an mehreren Orten zugreifen, intern ausgeführt werden Implementierungs-Transparenz 2-2/15

Klassifikation (1) Homogen verteilte Systeme mit bzw. ohne Replikation (2) Heterogen verteilte Systeme Wir betrachten hier homogen verteilte Systeme ohne Replikation unter den Annahmen das zu Grunde liegende Netzwerk erlaubt eine Kommunikation zwischen beliebigen Paaren von Sites; jede ihm anvertraute Nachricht wird in endlicher Zeit und fehlerfrei übertragen. 2-3/15

Schemaarchitektur ES1 ES1 ESm Externe Schemata GKS Globales Konzeptionelles Schema GVS Globales Verteilungs- Schema LKS1 LKS2 LKSn Lokale Konzeptionelle Schemata LIS1 LIS2 LISn Lokale Interne Schemata 2-4/15

Katalog Enthält Metadaten: Schemainformationen Zugriffsberechtigungen Passwörter Statistiken Relationengrößen, Werteverteilungen, Zugriffshäufigkeiten,... 2-5/15

Lokale und globale Kataloge Lokale Kataloge: LKS und LIS jedes Knotens Globaler Katalog: GKS und GVS, unterstützt Verteilungstransparenz Abbildung logischer globaler Namen auf physische Adressen systemweite Verwaltung von Benutzern und Zugriffsrechten DB-Operationen, vor allem Anfrage-Optimierung Speicherung? Alternativen s.u. 2-6/15

Katalogverwaltung Alternativen zur Speicherung der globalen Katalogdaten Zentralisierter Katalog vollständiger Katalog an einem der Knoten Replizierter Katalog vollständiger Katalog an jedem Knoten Mehrfachkataloge Netz Cluster; je ein vollst. Katalog pro Cluster Partitionierter Katalog verteilte Speicherung des globalen Katalogs 2-7/15

Zentralisierter Katalog hoher Kommunikationsaufwand Engpass bzgl. Leistung und Verfügbarkeit inakzeptable Beeinträchtigung der Knotenautonomie Site 1 Site 2 Kommunikations Netzwerk Site 3 Site 4 2-8/15

Replizierter Katalog globaler Katalog an jedem Knoten lokales Lesen! effizient aufwändige Änderungen Probleme mit Datenschutz Site 1 Site 2 Kommunikations Netzwerk Site 3 Site 4 2-9/15

Mehrfachkataloge Partitionierung des Netzes in Cluster pro Cluster hat ein Knoten den vollständigen globalen Katalog reduzierter Änderungsaufwand kaum Engpässe ausreichende Knotenautonomie Änderungen immer noch aufwändig Site 1 Site 3 Kommunikations Netzwerk Site 2 Site 4 2-10/15

Partitionierter Katalog verteilte Speicherung des globalen Katalogs GKS implizit: LKS i keine explizite Speicherung erweiterte Objektbezeichnungen wo liegen Verteilungsinfo vor, um nicht-lokale Objekte zu finden? s. nä. Seiten hohes Maß von Knotenautonomie Kommunikationsaufwand bereits bei Zugriff auf Katalog! Caching nicht-lokaler Katalogdaten noch ein Replikationsproblem Kohärenzkontrolle Site 1 Site 2 Site 3 Kommunikations Netzwerk Site 4 2-11/15

Namen für DB-Objekte systemweit eindeutig möglichst stabil ortstransparent lokal generierbar ohne Kommunikation Objekte mit demselben(logischen) Namen 2-12/15

Namensverwaltung Es sind drei Arten von Knoten bei der Verwaltung und Speicherung von Objekten beteiligt: Geburtsknoten: wo das Objekt erzeugt wurde Katalogknoten: wo Katalogdaten zu dem Objekt verwaltet werden (i.a. mehrere) Speicherknoten: wo das Objekt gespeichert ist (i.a. mehrere: repliziert oder partitioniert) Es handelt sich um logische Sichten: derselbe Knoten kann mehrere dieser Rollen spielen. 2-13/15

Überblick Namensverwaltung Globale Objektnamen, z.b. [[<Knoten>.]<Benutzer>.]<Objekt> Globaler Name Geburtsknoten Katalogknoten Speicherknoten Speicherknoten Speicherknoten 2-14/15

Namensauflösung lokale Systemtabelle logischer Objektname globaler Objektname globale Katalogdaten (GVS) physische Objektadresse 2-15/15