BFO - Verteilte Datenbanksysteme



Ähnliche Dokumente
Verteilte Datenbank- und Informationssysteme

Etablierung serviceorientierter Architekturen mit Web Services

Verteilungsmechanismen in verschiedenen RDBMS

Fragenkatalog zum Kurs 1666 (Datenbanken in Rechnernetzen) Kurstext von SS 96

Ein Beispiel. Ein Unternehmen will Internettechnologien im Rahmen des E- Business nutzen Welche Geschäftsprozesse?

Datenbanken. Prof. Dr. Bernhard Schiefer.

XML und Datenbanken. Wintersemester 2003/2004. Vorlesung: Dienstag, 13:15-15:00 Uhr IFW A36. Übung: Dienstag, 15:15-16:00 Uhr IFW A36

IT-Management. Probestudium WS 15/16 Informatik und Wirtschaftsinformatik. Prof. Dr. Frederik Ahlemann Dr. Andreas Drechsler

Java Enterprise Architekturen Willkommen in der Realität

E-Business Architekturen

Sof o t f waretechn h o n l o og o i g en n f ü f r ü v e v rteilte S yst s eme Übung

Handbuch ECDL 2003 Basic Modul 5: Datenbank Grundlagen von relationalen Datenbanken

Workflow, Business Process Management, 4.Teil

DISKUSSIONSBEITRÄGE DER FAKULTÄT FÜR BETRIEBSWIRTSCHAFTSLEHRE MERCATOR SCHOOL OF MANAGEMENT UNIVERSITÄT DUISBURG-ESSEN. Nr. 374

SOA Serviceorientierte Architektur Definition, Marktpotenzial und Perspektiven

Carl-Christian Kanne. Einführung in Datenbanken p.1/513

1. Was bedeutet EAI? 2. Worin liegen die Vorteile? 3. Worin liegen die Nachteile? 4. EAI-Markt

E-Business Architekturen

WS 2002/03. Prof. Dr. Rainer Manthey. Institut für Informatik III Universität Bonn. Informationssysteme. Kapitel 1. Informationssysteme

.. für Ihre Business-Lösung

IT-Management. Probestudium WS 12/13 Informatik und Wirtschaftsinformatik. Prof. Dr. Heimo H. Adelsberger Dipl.-Wirt.-Inf.

Informationsblatt zu den Seminaren am Lehrstuhl. für Transportsysteme und -logistik

Web Services stellen eine Integrationsarchitektur dar, die die Kommunikation zwischen verschiedenen Anwendungen

Beraten? Begeistern!

Service Engineering. Ableitung der Servicekomposition aus BPMN-Modellen. Prof. Dr. Andreas Schmietendorf 1. SoSe Service Engineering

Datenbanksysteme 1. Organisation. Prof. Stefan F. Keller. Ausgabe Copyright 2005 HSR SS 2005

Allgemeines zu Datenbanken

Übung 6. Verwendung von Referenzdatenmodellen. Prof. Dr. Andreas Schmietendorf 1. Übung 6

Übungen zur Softwaretechnik

Content Management System mit INTREXX 2002.

Bundeskanzlei BK Programm GEVER Bund. als Basis für GEVER. 29. November 2012

Bedeutung und Nutzenpotentiale von Prozessen

Informationsmanagement

Architekturplanung und IS-Portfolio-

Prof. Dr.-Ing. Rainer Schmidt 1

Service Engineering. IVS Arbeitsgruppe Softwaretechnik. Abschnitt: Einführung zur Vorlesung

Wir fördern das Gute in NRW.

Research Note zum Thema: Laufzeit von Support-Leistungen für Server OS

Managementprozesse und Performance

Objektorientierter Software-Entwurf Grundlagen 1 1. Analyse Design Implementierung. Frühe Phasen durch Informationssystemanalyse abgedeckt

Abschnitt 16: Objektorientiertes Design

Andreas Heuer Gunter Saake Kai-Uwe Sattler. Datenbanken. kompakt

Titel BOAKdurch Klicken hinzufügen

Beratung, Projektmanagement und Coaching

Workshop 3. Excel, EDIFACT, ebxml- Was ist state. of the art und wo liegt die Zukunft. 16. September 2002

1. Mentorium Einführung, Organisation und Aufgaben zur Architektur von Informationssystemen

Individuelles Bachelorstudium. Software Engineering for Physics

Artenkataster. Hinweise zur Datenbereitstellung. Freie und Hansestadt Hamburg. IT Solutions GmbH. V e r s i o n

Hochschule Wismar. Fakultät für Wirtschaftswissenschaften. Arbeitskonzept zur Projektarbeit Softwarequalität und Softwarealterung

Analyse zum Thema: Laufzeit von Support-Leistungen für ausgewählte Server OS

Universität Passau. Betriebswirtschaftslehre mit Schwerpunkt Internationales Management Prof. Dr. Carola Jungwirth. Bachelorarbeit Netzwerkservices

Entwicklung und Dokumentation eines Klausurorganisationssystems mit Microsoft Access

(1) Mit dem Administrator Modul werden die Datenbank, Gruppen, Benutzer, Projekte und sonstige Aufgaben verwaltet.

Projektmanagement (Modelle, Methoden & Tools)

Prüfungsberatungs-Stunde Datenbanksysteme 1 (Dbs1)

Emergency Room für Projektleiter

Anforderungen an die HIS

Wirtschaftsinformatik 2 Modellierung betrieblicher Informationssysteme - MobIS

Beschreibung des MAP-Tools

Profilbezogene informatische Bildung in den Klassenstufen 9 und 10. Schwerpunktthema Daten und Datenbanken

BETTER.SECURITY AWARENESS FÜR INFORMATIONSSICHERHEIT

Definition Informationssystem

Seminare Softwaretechnik - Einführungsveranstaltung

Kursdemo zum Kurs Vertragsgestaltung und Vertragsmanagement. Prof. Dr. Inge Scherer

Geschäftsprozessmanagement

Einführung. Informationssystem als Abbild der realen Welt

IT-Governance und Social, Mobile und Cloud Computing: Ein Management Framework... Bachelorarbeit

Standardisierte Integration und Datenmigration in heterogenen Systemlandschaften am Beispiel von Customer Relationship Management

OUTSOURCING ADVISOR. Analyse von SW-Anwendungen und IT-Dienstleistungen auf ihre Global Sourcing Eignung. Bewertung von Dienstleistern und Standorten

Enterprise Content Management

Koordination Kommunikation Bahn. KoKoBahn. Projektpartner. Laufzeit. Travemünder Datenverbund GmbH, Lübeck. dbh Logistics IT AG, Bremen

Software Engineering. Bibliographisches Institut & F. A. Brockhaus AG, Mannheim; Spektrum Akademischer Verlag GmbH, Heidelberg, 2003

Kapitel 14 Verteilte DBMS

toolwear Die Verbindung aller Systemwelten

Prozessbewertung und -verbesserung nach ITIL im Kontext des betrieblichen Informationsmanagements. von Stephanie Wilke am

Einführung in die Informatik II

System Center Essentials 2010

Überblick Produkte. ORACLE AS 10g R3 JAVA Programming. (5 Tage)

7. Übung - Datenbanken

Agile Vorgehensmodelle in der Softwareentwicklung: Scrum

1 Einleitung. 1.1 Motivation und Zielsetzung der Untersuchung

Analyse und Toolevaluierung

360 - Der Weg zum gläsernen Unternehmen mit QlikView am Beispiel Einkauf

Fachbericht zum Thema: Anforderungen an ein Datenbanksystem

Hauptseminar am Fachgebiet für Quantitative Methoden der Wirtschaftswissenschaften

Neu als stellvertretendes Vorstandsmitglied/Verhinderungsvertreter

Spezialisierung Business Intelligence

Integration von ITIL in das V-Modell XT

W.WIINM32.11 (Datawarehousing) W.WIMAT03.13 (Statistik)

Uf&C Unternehmensführung & Controlling. Modulangebote Masterstudiengänge Sommersemester Unternehmensführung & Controlling. Stand: 25.

Entwicklung eines Konzeptes zur Spezifikation standardisierter Leistungsparameter im Rahmen einer industrialisierten Software-Bereitstellung

moveon Conference 2007 moveon im International Office einführen

IVS Arbeitsgruppe Softwaretechnik Abschnitt Management komplexer Integrationslösungen

Entwicklung einer Methode zur Bewertung der Transformierbarkeit von On-Premise Anwendungssystemen in Software as a Service Lösungen

Zuhörer muss mit Thema vertraut werden Zuhörer müssen inhaltlich und logisch folgen können

2.5.2 Primärschlüssel

arlanis Software AG SOA Architektonische und technische Grundlagen Andreas Holubek

Inhaltsverzeichnis. Daniel Liebhart, Guido Schmutz, Marcel Lattmann, Markus Heinisch, Michael Könings, Mischa Kölliker, Perry Pakull, Peter Welkenbach

Virtual Roundtable: Business Intelligence - Trends

Schlüssel bei temporalen Daten im relationalen Modell

Transkript:

BFO - Verteilte Datenbanksysteme - Studienanleitung - Hochschule Harz, Fachbereich Automatisierung und Informatik Prof. Dr.-Ing. habil. Andreas Schmietendorf Hochschule Harz Fachbereich Automatisierung und Informatik Friedrichstr. 57-59, D-38855 Wernigerode Web: http://userpage.fu-berlin.de/~schmiete/ Email: schmiete@ivs.cs.uni-magdeburg.de HS Harz SoSe11, A. Schmietendorf Seite 1

Inhaltsverzeichnis 1. Motivation...3 2. Zielstellungen...4 3. Inhalte der Vorlesung...4 3.1 Ausgewählte Aspekte von Datenbanken...4 3.1.1 Klassische Zielstellungen von Datenbanken...4 3.1.2 Architektur von Datenbankmanagementsystemen...4 3.1.3 Entwurf einer Datenbank...5 3.1.4 Operationen Relationale Datenbankmanagementsysteme...5 3.1.5 Der Transaktionsbegriff...5 3.2 Besonderheiten verteilter Datenbanksysteme...5 3.2.1 Anforderungen an verteilte Datenbanken...5 3.2.2 Architektur verteilter Datenbanken...5 3.2.3 Katalogverwaltung...5 3.2.4 Entwurf verteilter Datenbanken...5 3.2.5 Transaktionsverwaltung in verteilten DBS...6 3.2.6 Verteilte Datenbanken mit Oracle...6 3.3 Föderierte Datenbanksysteme...6 3.3.1 Zielstellungen föderierter Datenbanksysteme...6 3.3.2 Referenzarchitekturen für föderierte Datenbanken...6 3.3.3 Föderierter Datenbankentwurf...6 3.3.4 Transaktionen in föderierten Datenbanken...6 3.4 Informationsbereitstellung mittels Web Services...7 3.4.1 Überblick zu verteilten Informationssystemen...7 3.4.2 Enterprise Application Integration...7 3.4.3 Grundlegende Web Service Technologien...7 3.4.4 Verfügbare Web Services im Internet...7 3.5 Ausblick und Zusammenfassung...8 4. Übungen und Workshops im Rahmen der Vorlesung...8 5. Literaturhinweise...10 6. Informationen zum Dozenten...11 Anlage Plan der Vorlesungen/Übungen im SoSe 2011...12 Anlage Seminarthemen im SoSe 2011...13 Anlage Ausgewählte Beispiele für Seminarthemen...14 HS Harz SoSe11, A. Schmietendorf Seite 2

1. Motivation Die Verteilung von Daten und Funktionen ist aus den heute verwendeten Informationssystemen nicht mehr wegzudenken und wird durch verschiedenste Technologien (insbesondere Middleware) unterstützt. Bereits in den 80-iger Jahren wurde der Aspekt einer Datenverteilung im Kontext entsprechender Datenbanksysteme aufgegriffen. Dem entsprechend verbirgt sich hinter dem Begriff eines verteilten Datenbanksystems sowohl in der Theorie, als auch in der Praxis eine große Vielfalt an möglichen konzeptionellen und implementierungsseitigen Ansätzen. Klassische verteilte Datenbanksysteme, die auf der Basis nur eines globalen konzeptionellen Schemas arbeiten, sind in der Praxis verhältnismäßig selten anzutreffen. Die Ursachen dafür liegen insbesondere in der Schwierigkeit begründet ein einheitliches Unternehmensdatenmodell zu etablieren und konstant zu halten. Aus diesem Grund hat sich vor mehr als 10 Jahren der Begriff föderierter Datenbanksysteme etabliert. Föderierte Datenbanksysteme gehen von einer weitgehenden Autonomie der zu integrierenden (örtliche verteilten) Datenbanksysteme aus und berücksichtigen auch den Aspekt der Heterogenität (d.h. den Einsatz von Datenbankmanagementsystemen DBMS unterschiedlicher Hersteller bzw. die Berücksichtigung unterschiedlicher Datenmodelle). Die Implementierung von Verteilungsmechanismen auf Ebene der Datenbanksysteme stellte sich jedoch im industriellen Umfeld als nicht optimal heraus. Zwar können Verteilungsanforderungen auf der Grundlage DBMSeigener Techniken (wie z.b. Gateways, Datenbank-Links, Replikationsmechanismen) schnell und zumeist auch pragmatisch befriedigt werden, dennoch implizieren diese Lösungen häufig gravierende Nachteile. Diese liegen primär in den Aufwänden für die Wartung und Pflege, potentiellen Sicherheitsrisiken, der zumeist hohen Abhängigkeit von einem Hersteller, der Schwierigkeit auf neue Anforderungen schnell und abgegrenzt reagieren zu können und in der ungenügenden Berücksichtigung einer gewachsenen Systemlandschaft. In jüngster Zeit hat das Internet hat den Begriff der Verteilung massiv beeinflusst und klassische Techniken zur Entwicklung verteilter Systeme etwas in den Hintergrund gedrängt. Insbesondere die Entwicklung verteilter webbasierter Systeme steht heute im Vordergrund industrieller Aktivitäten und wird häufig unter dem Begriff des e-business subsumiert. Webbasierte Integrationsansätze bieten die Möglichkeit heterogene Informationssysteme (inkl. der genutzten Datenbanken) im Rahmen gemeinsamer Aufgabenstellungen zu integrieren. Insbesondere die Technologie der Web Services profitiert von diesem Lösungsansatz, weshalb diese Technik sowohl im Kontext unternehmensinterner, als auch unternehmensübergreifender Integrationsansätze zunehmend zum Einsatz kommt. Dennoch müssen klassische Probleme einer Integration, wie z.b. die Abbildung bzw. der Umgang mit ähnlichen Entitäten und Beziehungen aus verschiedenen Informationssystemen, auch in höherwertigen Integrationsansätzen gelöst werden. Dafür kann auf die Erkenntnisse und Konzepte aus dem Umfeld der verteilten Datenbanksysteme zurückgegriffen werden. Bei höherwertigen Integrationsansätzen verschiebt sich allerdings der Schwerpunkt benötigten Tätigkeiten. So steht heute die Modellierung und semantische Interpretation entsprechender Geschäftsobjektmodelle (geschäftsrelevante Funktionen & Daten) und daraus resultierender Modelle für die Softwareentwicklung im Vordergrund einer Integration. Vereinfacht hat sich hingegen der Umgang mit den für die Integration benötigten technologischen Lösungsansätzen. Insbesondere im Kontext einer webbasierten Integration unterliegen diese einem herstellerunabhängigen Standardisierungsgremium. Sofern die Anbieter entsprechender Softwareprodukte, wie z.b. Oracle, IBM oder Microsoft, sich an diesen Standards zur Systemintegration orientieren, kann auf proprietäre Integrationsansätze nur eines DBMS-Anbieters verzichtet werden kann. Auf dieser Grundlage können die weiter oben genannten Nachteile verteilter Datenbanksysteme weitgehend vermieden werden. HS Harz SoSe11, A. Schmietendorf Seite 3

2. Zielstellungen Die Vorlesung richtet sich an alle die einen grundlegenden Einblick zu verteilten Datenhaltungssystemen bekommen wollen. Dafür wird ausgehend von theoretischen und praktischen Ansätzen für verteilte Datenbanksysteme und deren implizierten Vor- und Nachteile, auf die zunehmende Bedeutung von höherwertigen Integrationsansätzen eingegangen. Höherwertige Integrationsansätze finden sich z.b. mit den modernen EAI- und SOA-Architekturen. Dennoch bleiben auch bei diesen Ansätzen grundlegende Probleme der semantischen Integration von Datenobjekten erhalten bzw. bedürfen entsprechender Lösungsansätze. Nach Besuch der Vorlesung sollten die folgenden Kenntnisse bei den Stundenten vorhanden sein: o Grundlegende Prinzipien und Lösungsansätze für verteilte Datenbanksysteme, o Überblick zu den angebotenen Verteilungsmechanismen eines RDBMS, o Lösungsansätze auf der Basis föderierter Datenbanksysteme, o Realisierung von Integrationsanforderungen in höheren Schichten, o Informationsbereitstellung in serviceorientierten Umgebungen, o Möglichkeiten der Transaktionsverarbeitung in verteilten Systemen, o Ausblick auf Entwicklungstendenzen Grundlage der Vorlesung sind die durch den Dozenten im praktischen Kontext gewonnenen Erfahrungen im Umgang mit industriell anstehenden Integrationsaufgaben. Durch die langjährige Verantwortung entsprechender Projekte innerhalb des Telekom-Konzerns können durch den Dozenten vielfältige Praxisproblemen im Rahmen der Vorlesung erörtert werden. Hinsichtlich der zur Vorlesung zu empfehlenden Literatur soll insbesondere auf [Rahm 1994], [Conrad 1997], [Knuth et al. 2003] und [Alonso et al. 2004] verwiesen werden. 3. Inhalte der Vorlesung 3.1 Ausgewählte Aspekte von Datenbanken Der 1. Teil der Vorlesung dient der Wiederholung ausgewählter Sachverhalte im Kontext von Datenbankmanagementsystemen. Ziel ist es für die folgenden Abschnitte eine gemeinsame Ausgangsbasis herzustellen, um so das Verständnis für verteilte Datenbanksysteme bzw. Systeme im Kontext einer verteilten Informationsbereitstellung zu ermöglichen. 3.1.1 Klassische Zielstellungen von Datenbanken o Dauerhafte (persistente) Speicherung von Informationen o Redundanzarme Speicherung von Daten o Gewährleistung von Integritätsbedingungen o Gewährleistung logischer und physischer Datenunabhängigkeit 3.1.2 Architektur von Datenbankmanagementsystemen o Basisfunktionalitäten eines Datenbankmanagementsystems o 3-Ebenen Architektur nach ANSI-SPARC o Schichten eines DBMS HS Harz SoSe11, A. Schmietendorf Seite 4

3.1.3 Entwurf einer Datenbank o Phasen des Datenbankentwurfs o ER-Modellierung und Normalisierung o Schlüsselkonzept (Primär- und Fremdschlüssel) 3.1.4 Operationen Relationale Datenbankmanagementsysteme o Selektion (Auswahl von Zeilen/Tupeln) o Projektion (Auswahl von Spalten) o Verbundoperation (Join) über zwei Relationen 3.1.5 Der Transaktionsbegriff o A Atomicity (Das alles oder nichts Prinzip) o C Consistency (Konsistenter Zustand der Datenbank) o I Isolation (Isolierter Ablauf paralleler Transaktionen) o D Durability (Dauerhafte Speicherung von Transaktionsergebnissen) 3.2 Besonderheiten verteilter Datenbanksysteme Im Rahmen des 2. Teils der Vorlesung wollen wir auf den klassischen Ansatz verteilter Datenbanksysteme eingehen. Neben der Vorstellung ausgewählter Aufgabenstellungen im Kontext des Einsatzes solcher Systeme, soll im abschließenden Teil auch die aktuell vorhandene Unterstützung für eine verteilte Verarbeitung innerhalb des Datenbankmanagementsystems Oracle vorgestellt werden. 3.2.1 Anforderungen an verteilte Datenbanken o Übersicht und Einführung o 12 Anforderungen für verteilte Datenbanken o Leistungstransparenz und grobe Definition 3.2.2 Architektur verteilter Datenbanken o 4-Ebenen Architektur o Globales konzeptuelles- und Verteilungs-Schema o Lokales konzeptuelles- und lokales internes Schema 3.2.3 Katalogverwaltung o Aufgaben der Katalogverwaltung o Lokaler vs. globaler Katalog o Arten der Katalogverwaltung und Bewertung 3.2.4 Entwurf verteilter Datenbanken o Aufgaben beim Entwurf eines verteilten DBS o Fragmentierung und Allokation HS Harz SoSe11, A. Schmietendorf Seite 5

o Arten der Fragmentierung (Horizontal, Vertikal, Gemischt) 3.2.5 Transaktionsverwaltung in verteilten DBS o Struktur verteilter Transaktionen o Sicherstellung der Transaktionsbedingungen 3.2.6 Verteilte Datenbanken mit Oracle o Datenbank- und Netzwerksunterstützung für verteilte Systeme o Verwendung von Oracle Datenbank-Links 3.3 Föderierte Datenbanksysteme In der Praxis ist es schwer den klassischen Ansatz (siehe Abschnitt 3.2) für ein verteiltes Datenbanksystem auch tatsächlich umzusetzen. Hier gilt es zumeist langjährig bestehende Systeme zu integrieren. Dabei ergibt sich häufig das Problem der Heterogenität, d.h. weder die eingesetzten Netzwerk- und Betriebssysteme, noch die verwendeten Datenbankmanagementsysteme sind von einem Hersteller. Föderierte Datenbanksysteme erlauben die Integration unterschiedlicher Systeme, die dabei auftretenden Besonderheiten sollen im 3. Teil der Vorlesung besprochen werden. 3.3.1 Zielstellungen föderierter Datenbanksysteme o Einsatzgebiete und Anwendungsszenarien o Integration existierender Datenbestände o Migration schrittweise Ablösung von Altsystemen 3.3.2 Referenzarchitekturen für föderierte Datenbanken o Import-/Export-Schema-Architektur o Multidatenbank-Architektur o 5-Ebenen-Schema-Architektur 3.3.3 Föderierter Datenbankentwurf o Erhaltung der Autonomie bestehender Datenbestände o Schematransformation und Schemaintegration o Integrationsstrategien & Integrationsprozess o Ausgewählte Integrationskonflikte 3.3.4 Transaktionen in föderierten Datenbanken o Heterogene Transaktionsverwaltung in föderierten Systemen o Geschachtelte Transaktionen in föderierten Systemen Wenngleich der Ansatz eines föderierten Datenbanksystems nicht mit einem industriellen Produkt gleichgesetzt werden kann, bietet sich mit den dabei herausgearbeiteten Konzepten eine ideale Grundlage für höherwertige Integrationsansätze. Dem entsprechend stellen diese eine fundierte Basis für z.b. webbasierte Systemintegrationen dar. Im Kontext dieses Abschnittes sei insbesondere auf die umfangreichen konzeptionellen Darstellungen in [Conrad 1997] verwiesen. HS Harz SoSe11, A. Schmietendorf Seite 6

3.4 Informationsbereitstellung mittels Web Services Moderne Lösungsansätze verlagern die Integration von vorhandenen Systemen und den dahinter liegenden Datenbeständen in höher gelagerte der Anwendung. In diesem Zusammenhang wird häufig von entsprechender Middleware gesprochen. Im Rahmen des 4. Teils der Vorlesung wollen wir auf derartige Ansätze eingehen. 3.4.1 Überblick zu verteilten Informationssystemen o Grundlagen und Merkmale verteilter Systeme o Design verteilter Informationssysteme o Potentielle Architekturansätze o Kommunikationsbeziehungen (synchron vs. asynchron) o Middleware (RPC, CORBA und MOM) o Grundlegende Web-Technologien (Protokolle und Generationen) o Application Server als Integrationsplattformen. 3.4.2 Enterprise Application Integration o Historische Entwicklung und Zielstellungen von EAI o Schichtenmodell der Applikationsintegration o Integrationslevel o Datenaustausch mit XML o Dienste von EAI-Lösungen o Produkte im EAI-Umfeld 3.4.3 Grundlegende Web Service Technologien o XML als Datenbeschreibungssprache o Schemadefinition als Grammatik von XML-Dokumenten o XML Frameworks (ebxml, XML/EDI) o XML Vokabulare (cxml, xcbl) o SOAP Simple Object Access Protocol o Aufbau und Struktur o RPC- und DOC-orientierte Arbeitsweise o WSDL Spezifikation von Web Services o Struktur und Elemente eines WSDL-Interfaces o Implikationen des WSDL-Modells o WSDL-Programmierungstechniken 3.4.4 Verfügbare Web Services im Internet o Überblick zu verfügbaren Web Service Verzeichnissen o Auffinden von Web Services HS Harz SoSe11, A. Schmietendorf Seite 7

o Art der derzeit im Internet angebotenen Web Services o Empirische Betrachtungen zu verfügbaren Web Services o Identifizierung über die Basistechnologien hinausgehender Ansätze. 3.5 Ausblick und Zusammenfassung o Datenbanken zur Verwaltung von XML-Dokumenten o XML-Anfragesprachen (XQuery und XPath) o Feedback zur Vorlesung 4. Übungen und Workshops im Rahmen der Vorlesung Vorlesungsbegleitende Übungen: Im Rahmen der Vorlesung werden die folgenden Übungen bearbeitet. Dabei handelt es sich um grundlegende Problemstellungen verteilter Datenbanksysteme bzw. die modelltechnische Erfassung von Integrationsaspekten. Die Verwendung von Referenzdatenmodellen stellt darüber hinaus einen möglichen Ansatz zur Standardisierung einer unternehmensinternen, aber auch unternehmensübergreifenden Datenmodellierung dar. - Anforderungen an verteilten Datenhaltungssysteme (Brainstorming/Metaplan) - Mögliche Verteilungsmechanismen in konkreten RDBMS-Produkten - Erstellung eines föderierten Datenbankschema (zusicherungsbasierte Integration) - Verwendung von Referenzdatenmodellen in serviceorientierten Umgebungen Seminararbeiten und Workshops Im Rahmen der letzten Vorlesungswochen (ggf. erfolgt hier noch eine zusätzliche Terminvereinbarung) werden entsprechende Workshops (jeweils 4 Vorträge) zu den bearbeiteten Seminararbeiten durchgeführt. Innerhalb der Workshops erfolgt die Präsentation (20 min) und anschließende Diskussion (10 min) der zu bearbeitenden Seminararbeiten durch jeden einzelnen Studenten. Das jeweilige Thema bezieht sich auf eine Vertiefung eines ausgewählten Sachverhaltes aus dem Lehrgebiet bzw. die prototypische Umsetzung einer entsprechenden Aufgabenstellung. Die Inhalte der Seminararbeiten sind mit dem Dozenten frühzeitig abzusprechen. Dabei kann sowohl ein eigener Themenvorschlag, als auch ein durch den Dozenten bereitgestelltes Thema (ausgewählte Beispiele siehe Anlage innerhalb dieser Studienanleitung) bearbeitet werden. Für die Bewertung der im Fach Verteilte Datenbanksysteme erbrachten Leistungen wird zu 50% die Präsentation und zu 50% die Seminararbeit herangezogen. Die Bewertung der Präsentation erfolgt anhand der folgenden Kriterien: - Inhalt Aufgabentreue und ggf. benötigte Abgrenzungen - Struktur Gewährleistung eines roten Faden durch die Themenstellung - Kritik Kritische Würdigung der bearbeiteten Themen - Präsentations-Stil Köpersprache & Begeisterung - Zeittreue Einhaltung des vorgegebenen Zeitlimits - Form grafische Aufbereitung der behandelten Themen - Fragen Umgang mit Fragen während bzw. nach der Präsentation HS Harz SoSe11, A. Schmietendorf Seite 8

Aus inhaltlicher Sicht bedarf es, unabhängig von der bearbeiteten Themenstellung, der Berücksichtigung der Dimensionen eines verteilten Datenbanksystems in Bezug auf Verteilung, Heterogenität und Autonomie. Grundsätzlich sollte die Seminararbeit eine wissenschaftliche Herangehensweise aufzeigen und den folgenden strukturellen Aufbau besitzen. Der Umfang sollte etwa 10 bis 15 Seiten betragen, ggf. können Anlagen für Untersuchungsergebnisse verwendet werden. - Zielstellung, - Grundlagen zum Thema, - durchgeführte Analysen, - ggf. erarbeitete konzeptionelle Aspekte, - ggf. realisierte prototypische Implementierungen, - Zusammenfassung & Ausblick - Quellenverzeichnis Die Abgabe der Arbeit erfolgt in elektronische Form (Präsentation und Seminararbeit) bis zum 05. September 2011 (strikt einzuhalten) über die folgende email-adresse an der Universität Magdeburg: schmiete@ivs.cs.uni-magdeburg.de HS Harz SoSe11, A. Schmietendorf Seite 9

5. Literaturhinweise Die im Folgenden kurz vorgestellten Literaturhinweise bieten eine Übersicht zu weiterführenden Information, zu den im Kontext der Vorlesung vermittelten Themengebieten. Die dabei gewählte Reihenfolge widerspiegelt die Stärke des Bezugs zur Vorlesung, d.h. auf die Inhalte der letzt genannten Bücher wird im Rahmen der Vorlesung nur geringer Bezug genommen. [Rahm 1994] Rahm, E.: Mehrrechner-Datenbanksysteme Grundlagen der verteilten und parallelen Datenverarbeitung, Addison-Wesley, Bonn, 1994 [Conrad 1997] Conrad, S.: Föderierte Datenbanksysteme Konzepte der Datenintegration, Springer-Verlag, Berlin, 1997 [Dostal 2005] Dostal, W.; Jeckle, M.; Melzer, I.; Zengler, B.: Service-orientierte Architekturen mit Web Services (Konzepte Standards Praxis), Spektrum Akademischer Verlag, München, 2005 [Knuth et al. 2003] Knuth, M. et al.: Web Services Einführung und Übersicht, Software Support Verlag, Frankfurt, 2003 [Alonso et al. 2004] Alonso, G.; Casati, F.; Kuno, H.; Machiraju, V.: Web Services, Springer- Verlag, Berlin 2004 [Seemann 2003] Seemann, M.: Native XML-Datenbanken im Praxiseinsatz, Software Support Verlag, Frankfurt, 2003 [Kemper/Eickler] Kemper, A.; Eickler, A: Datenbanksysteme Eine Einführung, Oldenbourg-Verlag, München Wien, 2004 [Sneed/Sneed] Sneed, H.; Sneed, S. H.: Web-basierte Systemintegration, Vieweg-Verlag, Braunschweig/Wiesbaden, 2003 [Chappell/Jewell] Chappell, D. A.; Jewell, T.: Java Web Services, O`Reilly-Verlag, Sebastopol/CA, 2002 [Chappell 2002] Chappell, D. A.: Enterprise Service Bus Theorie in Practice, O`Reilly- Verlag, Sebastopol/CA, 2002 HS Harz SoSe11, A. Schmietendorf Seite 10

6. Informationen zum Dozenten Im Jahr 2004 erhielt Andreas Schmietendorf einen Ruf auf die Professur für Datenbanken an der Hochschule Harz in Wernigerode. Nachdem er im Jahr 2005 einem Ruf auf eine Professur für Wirtschaftsinformatik an der Fachhochschule für Wirtschaft Berlin (ab April 2009: Hochschule für Wirtschaft und Recht Berlin) folgte, lehrt er jetzt nur noch im Rahmen einer nebenberuflichen Tätigkeit an der Hochschule Harz. Seine berufliche und wissenschaftliche Entwicklung im Bereich der Informationsverarbeitung ist eng mit seiner Tätigkeit bei der Deutschen Telekom verbunden, bei der er mehr als zwölf Jahre beschäftigt war. Zuletzt verantwortete er mehrere Jahre die Abteilung Integration Services im Entwicklungszentrum Berlin. Nach wie vor berät er große Industrieunternehmen (z.b. Deutsche Telekom, T-Systems, IBM, Toll Collect, ) auf dem Gebiet des IT-Service-Managements, des Managements von Software-Entwicklungsprojekten und ausgewählten Fragestellungen des Datenmanagements. Nach wie vor berät er Industrieunternehmen bzw. die öffentliche Verwaltung zu ausgewählten Problemstellungen wie z.b. dem Management komplexer Entwicklungs- und Integrationsprojekte oder auch zu Fragen des Geschäftsprozessmanagements. Ebenso ist er Mitglied des Vorstands der Central Europe Computer Measurement Group (CECMG), Sprecher des Arbeitskreises Bewertungsaspekte serviceorientierter Architekturen - BSOA innerhalb der Gesellschaft für Informatik (GI) und Partner der Deutschsprachigen Anwendergruppe für Software- Metrik und Aufwandschätzung (DASMA). Als Gutachter im Auftrag der ACQUIN wirkt er darüber hinaus bei der Akkreditierung von Studiengängen mit. HS Harz SoSe11, A. Schmietendorf Seite 11

Anlage Plan der Vorlesungen/Übungen im SoSe 2011 Raum: 5.301, Donnerstag 09:45 bis 13:00 Uhr (Ausnahme 16.06. ab 14:00 Uhr) Bachelor - Wirtschaftsinformatik (4. Semester) Vorlesung Termin Vorlesung Übung 01 17.03.2011 Einführung zur Vorlesung und Informationen zu Belegarbeiten 02 24.03.2011 Ausgewählte Aspekte von Datenbanken (Grenzen nicht verteilter Systeme) Übung 1: Metaplantechnik 03 31.03.2011 Besonderheiten verteilter Datenbanksysteme 04 07.04.2011 Besonderheiten verteilter Datenbanksysteme Übung: 2 Verteilungsmechanismen von DBMS 05 14.04.2011 Besonderheiten verteilter Datenbanksysteme 06 21.04.2011 Föderierte Datenbanksysteme Übung 3: Föderierter DB-Entwurf 07 28.04.2011 Föderierte Datenbanksysteme 08 05.05.2011 Föderierte Datenbanksysteme 09 12.05.2011 Föderierte Datenbanksysteme 10 19.05.2011 Serviceorientierte Datenbereitstellung und Entwicklungstendenzen Übung 4: Referenzdatenmodelle 11 09.06.2011 Serviceorientierte Datenbereitstellung und Entwicklungstendenzen 12 16.06.2011 Auswertung Referenzdatenmodelle 13/14 30.06.2011 Prüfungen durchgeführt im Block Seminarvorträge 15/16 01.07.2011 Prüfungen durchgeführt im Block Seminarvorträge Die terminliche Zuordnung der dargestellten Themen stellt nur eine grobe Orientierung dar, hier kann es je nach Lernfortschritt noch zu geringfügigen Verschiebungen kommen. Die Termine für die Seminarvorträge sind offizielle Prüfungen der HS Harz. Auf der Grundlage dieser Seminarvorträge (ca. 20 min) und einer entsprechenden Belegarbeit/Entwurfsarbeit (10-15 Seiten) wird das Fach durch jeden einzelnen Studenten abgeschlossen. HS Harz SoSe11, A. Schmietendorf Seite 12

Anlage Seminarthemen im SoSe 2011 Name Thema Präsentations- Termin N.N. HS Harz SoSe11, A. Schmietendorf Seite 13

Anlage Ausgewählte Beispiele für Seminarthemen Die vorgestellten Themen für Seminararbeiten geben eine Anregung zu potentiell lösbaren Aufgabenstellungen. Die dabei angegebenen Stichpunkte dienen der groben Orientierung inhaltlich zu bearbeitender Themengebiete, die Erarbeitung einer korrespondierenden Gliederung obliegt allerdings dem konkreten Bearbeiter. Dabei ist sowohl die Einordnung, aber auch die Abgrenzung zu nicht behandelten Themen zu berücksichtigen. In diesem Zusammenhang sollten die aufgezeigten Stichpunkte konkretisiert werden. Die Ausarbeitung sollte sich an der unter Abschnitt 4 vorgestellten Vorgehensweise orientieren. 1. Entwicklungsstand föderierter Datenbanksysteme - Verwendete Modelle (z.b. ER-Modelle, UML, ) - Vorgehensweisen zur Integration unabhängiger DB-Instanzen - Implementierungstechniken (DBMS-eigene, Middleware, ) 2. Optimierung von DB-Anfragen in verteilten Datenbanksystemen - Problemstellung der Anfrageoptimierung bei verteilten DBS - Umgang mit redundanten Daten und Inkonsistenzen - Möglichkeiten des Query-Optimizers 3. Analyse des Transparenzbegriffes im Rahmen einer SOA - Darstellung möglicher Sichten - Transparenz im Kontext abzubildender Geschäftsprozesse - Transparenz aus Sicht der Entwicklung & Wirkbetrieb 4. Aspekte der Normalisierung bei verteilten Datenbanksystemen - Zielstellungen der klassischen Normalisierung (1. NF, 2. NF, 3. NF) - Abbildung eines relationalen DB-Entwurfs auf ein verteiltes DBS - Denormalisierung (Zielstellungen und Umgang mit Redundanzen) 5. Notationen für die Modellierung verteilter Datenbanksysteme - Klärung des Begriffes einer Notation - Analyse verfügbarer Notationen (ER-Modellierung, UML, ) - Besonderheiten der Modellierung verteilter Datenbanksysteme 6. Durchgängigkeit von Funktions- und Datenmodellierung - Modellierung im Lebenszyklus eines Softwareproduktes - Analyse verfügbarer Notationen (BPMN, EPK, BPEL, ER-Modellierung, UML, ) - Business-Datenmodell, Business-Objektmodell, Business-Servicemodell 7. Partitionierung von Daten mit Hilfe einer Verteilungs- und Konfigurationsanalyse - Analyse genutzter Daten & Nutzerprofile - Kriterien zur Verteilung von Katalogdaten in einem VDBS - Monitoring der tatsächlichen Datennutzung HS Harz SoSe11, A. Schmietendorf Seite 14

8. Fragmentierungs- und Allokationstransparenz - Gebotene Werkzeugunterstützung (Verteilungsentwurf) - Gewährleistung der Redundanzfreiheit - Abbildung von Abfragen über verteilten Relationen 9. Transaktionsbehandlung in Web Service-basierten Systemen - Überblick zu Web Service-basierten Integrationslösungen - Transaktionsprotokolle für verteilte Systeme - WS Coordination & WS Transaction 10. Datenbankschnittstellen im Kontext von VDBS - Überblick zu existierenden Schnittstellen (JDBC, ODBC, XA, XA+, ) - Persistenzschichten Mapping zwischen Anwendung & Datenbank - Realisierung von verteilten DBS 11. XML-Datenbanken und verteilte DBS - Überblick zu XML-basierten DBS - Abbildung von Verteilungseigenschaften - Interoperabilität zu anderen DBS (z.b. ORDBMS, OODBMS) 12. Einsatz von Middlewaretechnologien im Kontext VDBS - Begriff der Middleware klären (Ziele, Gegenstand, Einsatzbereiche, ) - Beispiele konkreter Middlewareansätze (DCE, CORBA, RMI, ) - Einsatzmöglichkeiten bei der Realisierung föderierter DBS 13. Verteilte DBS im Bereich von Multimediaanwendungen - Besonderheiten multimedialer Daten (vgl. zu Daten eines klass. RDBMS) - Industrielle & akademische Beispiele für VDBS - Integrationsaspekte zu anderen DBS (Schwerpunkt: RDBMS) 14. Möglichkeiten zur Serialisierung von Objekten unter Java - Begriff der Serialisierung einordnen - Klassischer und fortgeschrittene Serialisierungsmechanismen unter Java - Serialisierung im Kontext eines verteilten DBS 15. Empirische Analyse zu verfügbaren Referenzdatenmodellen - Zielstellung von Referenzdatenmodellen - Verfügbare Ansätze in verschiedenen Branchen - Beispielhafte Darstellung des Einsatzes über entsprechende Tools 16. Schemaintegration und Schemamigration - Ziele der Schemaintegration und Schemaintegration - Analyse verfügbarer Integrationsmethoden - Darstellung eines konkreten Beispiels, wie z.b. XML-basierte Schemaintegration HS Harz SoSe11, A. Schmietendorf Seite 15

17. NoSQL-Datenbanken (not only SQL) im Internet - Eigenschaften von NoSQL-Darenbanken - Verteilte Datenverarbeitung im Kontext des CAP-Theorems - Einsatzgebiete für NoSQL-Datenbanken 18. Spaltenorientierte Datenbanksysteme - Besonderheiten spaltenorientierter Datenbanken (Bezug zu OLAP) - Spaltenorientierte Anfrage-Ausführung - Beispiele für konkrete Systeme HS Harz SoSe11, A. Schmietendorf Seite 16