Introduction to Data and Knowledge Engineering. 3. Übung. Funktionale Abhängigkeiten und Normalformen

Ähnliche Dokumente
Normalformen: Sinn und Zweck

Einführung in Datenbanken - Wiederholung Normalformen - Philipp Cimiano AG Semantische Datenbanken und Wissensverarbeitung

Relationale Entwurfstheorie. Kapitel / 510

2. Übungsblatt 3.0 VU Datenmodellierung

Kapitel 7: Formaler Datenbankentwurf

Tag 4 Inhaltsverzeichnis

Funktionale Abhängigkeiten

Tag 4 Inhaltsverzeichnis

Vorlesung Datenbanken II A Klausur

7. Übung - Datenbanken

Klausur zur Vorlesung Datenbanken I im Wintersemester 2011/12

Theoretische Grundlagen des Software Engineering

Software-Engineering Einführung

Design Theorie für relationale Datenbanken

Datenbankmodelle 1. Das Entity-Relationship-Modell. Prof. Dr. Bernhard Schiefer 2-1

Datenbanktechnologie mit praktischen Übungen in MySQL und PHP

Datenbankentwurf. 4.2 Logischer Entwurf. Kapitel 4. ER-Modell. Umsetzung. Entwurfsdokumentation. relationales Modell. Verbesserung

Integritätsbedingungen / Normalformen- Beispiel: Kontoführung

Kapitel 06 Normalisierung von Relationen. 6 Die Normalisierung von Relationen

Einführung Datenbanken: Normalisierung

Verwandt, logisch kohärent, zweckspezifisch, an reale Welt orientiert. Entität kann in einer oder mehreren Unterklassen sein

Fachbereich Wirtschaftswissenschaften Campus Sankt Augustin

Teil 7: Einführung in den logischen Entwurf

Daten Bank. 5. Vorlesung

Das SQL-Schlüsselwort ALL entspricht dem Allquantor der Prädikatenlogik

6. Formaler Datenbankentwurf 6.1. Rückblick. Datenbanken und Informationssysteme, WS 2012/ Januar 2013 Seite 1

Einführung in das Entity-Relationship-Modell

Datenbanken: ER-Modell

Kapitel DB:III. III. Konzeptueller Datenbankentwurf

Motivation. Formale Grundlagen der Informatik 1 Kapitel 5 Kontextfreie Sprachen. Informales Beispiel. Informales Beispiel.

Datum Wochen Band DVD Band eingelegt Protokoll kontr. Recovery kontr. Tag Nr. RW Sign. Sign. Sign.

1 Übungen zu Datenbank-Kategorien

Normalformen. Datenmodellierung, Datenbanksysteme. Ingo Claÿen, Martin Kempa, Peter Morcinek. Hochschule für Technik und Wirtschaft Berlin

Logische Modellierung von Data Warehouses

Vorwort zur 5. Auflage Über den Autor... 16

ER-Modellierung am Beispiel der Universitätsdatenbank aus der DBIS-Vorlesung

Datenbanken 1. Kapitel 3: Relationenmodell WURDE_VERKAUFT INTEGER PRODNR. <pk,fk1> <pk,fk2> PRODNR = PRODNR SHOPID = SHOPID SHOPID INTEGER INTEGER

Datenbanken. Sommersemester 2010 Probeklausur

Übungen Teil 1: Normalisierung. Dozent: Stefan Maihack Dipl. Ing. (FH)

Friihjahr. Erste Staatsprüfilrg für ein Lehramt an öffentlichen Schulen.Prüfurgsaufgaben- Prüfungsüeilnehmer Prüfungsüermin Einzelprüfungsnummer

Übungsblatt 4. Aufgabe 7: Datensicht Fachkonzept (Klausur SS 2002, 1. Termin)

Nicht Relationale Datenbanken. Nachteile des Relationenmodells

Klausur Datenbanksysteme

DV-Organisation und Anwendungsentwicklung. 4. Klausur

Entwurf von Datenbanken

Datenadminstrator, Datenbankdesigner, Systemanalytiker (für die logische Sicht zuständig)

IT-Studiengänge an der

Wirtschaftsinformatik - 1.Tutorium im WS 11/12

Präsenzlehrveranstaltungen des Verbundstudiengangs B.Sc. Wirtschaftsingenieurwesen im WS 2009/2010 Bachelor

Probabilistische Datenbanken

Datenbanksysteme I Relationaler Datenbankentwurf Felix Naumann

Kap 4: Abbildung des E/R Modells auf das relationale Modell. Entity steht in Bez. Anzahl der a A r b B

Informatikgrundlagen (WS 2015/2016)

Teil 5: Datenbankdesign, ER-Modell, Normalformen. Das Entity-Relationship (ER) Modell


Einführung in die Informatik

FRANZIS PROFESSIONAL SERIES. Daniel Warner. udienausgabe. SQL für Praxis und Studium. Mit 95 Abbildungen

Binäre Suchbäume (binary search trees, kurz: bst)

TECHNISCHE UNIVERSITÄT DRESDEN Fakultät Wirtschaftswissenschaften Prof. Dr. W. Esswein Lehrstuhl Wirtschaftsinformatik, insbesondere Systementwicklung

4. Relationen. Beschreibung einer binären Relation

DBS= DB + DBMS (Datenbank + Datenbankmanagementsystem)

Strukturierte Blutzucker- Selbstmessung bei Diabetes Typ 2

Montag Dienstag Mittwoch Donnerstag Freitag 8 10 P VL A&D 9 12 Chem A Ü RS 8 9 F 334/F Ü RS 9 10 F 334

Beispiele für Relationen

mit Musterlösungen Prof. Dr. Gerd Stumme, Dipl.-Inform. Christoph Schmitz 11. Juni 2007

SQL: statische Integrität

Objektrelationale Datenbanken

Dateiorganisation und Zugriffsstrukturen

Région Mullerthal Petite Suisse Luxembourgeoise. Foto: Pierre Weber

7. Formale Sprachen und Grammatiken

FACHHOCHSCHULE MANNHEIM. Hochschule für Technik und Gestaltung. Beispielklausur zur Vorlesung:

7 Projektarbeit Fahrradverleih

Übersicht über den Studiengang

Grundbegriffe der Informatik

Daten Bank. 2. Vorlesung. Dr. Karsten Tolle PRG2 SS 2015

Stand der Technik für HDI- Leiterplatten und -Baugruppen

3. Spezielle ER-Modelle und Tabellenableitung

Übung Datenbanken in der Praxis. Datenmodifikation mit SQL

Wirtschaftsinformatik (PWIN) Übung 5. Wirtschaftsinformatik (PWIN), SS 2010, Professur für Mobile Business & Multilateral Security 1

Klausur in Datenmanagement SS 2009

Kapitel 3: Datenbanksysteme

RUP Analyse und Design: Überblick

Grundlagen der Künstlichen Intelligenz

Grundlagen der Informatik II. Teil I: Formale Modelle der Informatik

Umsetzung der Anforderungen - analytisch

Kapitel 3. Relationales Modell (Relationenmodell) Transformation ER-Modell Relationenmodell. Prof. Dr. Wolfgang Weber, Vorlesung Datenbanken 1

Zentralisiertes Datenmanagement. 1. Grundlagen. Datenmanagement im Netzwerk. Verteiltes Datenmanagement

Refactoring relationaler Datenbank. Shaoke Wu

Unterstützt HL7 die interdisziplinäre Zusammenarbeit?

Kapitel 7 Dr. Jérôme Kunegis. Logische Kalküle. WeST Web Science & Technologies

Data Warehousing. Relationale Datenbanken. Ulf Leser Wissensmanagement in der Bioinformatik

Auswertung zur Veranstaltung Numerical Programming 2 CSE [MA3306]

O PHASE 2012: STUNDENPLANBESPRECHUNG WIRTSCHAFTSWISSENSCHAFTEN

Software-Engineering

Semantic Web Technologies I!

Semantische Integrität (auch: Konsistenz) der in einer Datenbank gespeicherten Daten als wichtige Anforderung

Innovation in der Raubtierdressur Neue Wege in der Risikominierung Wolfgang Platz, Founder & CPO

DV-Organisation und Anwendungsentwicklung. 4. Klausur

9. Einführung in Datenbanken

DBSP. Vorlesung. Prof. Dr. rer. nat. Nane Kratzke. Unit. Praktische Informatik und betriebliche Informationssysteme

Transkript:

Introduction to Data and Knowledge Engineering 3. Übung Funktionale Abhängigkeiten und Normalformen

Bemerkungen zu Normalformen 1NF 1NF: alle Attribute sind atomar. Bemerkungen: Nur teilweise formal überprüfbar: Solange Attribut-Typ nicht Bit ist, kann man immer Komponenten sehen. Klar ist, dass z.b. Listen nicht atomar sind. Aus dem Konzept atomare Werte entspringt sowohl die Stärke als auch die Schwäche von EDV-Systemen. 1NF liegt etwas quer zu anderen Normalformen: z.b wäre 3NF ohne 1NF denkbar, 3NF ohne 2NF eher nicht. FB Informatik DVS Arthur Herzog, LW 2

Bemerkungen zu Normalformen 2NF 2NF: 1NF + kein Extra-Attribut hängt nur von einem Teil der Schlüssel-Attribute ab. Ein Extra-Attribut ist eine Attribut, das nicht Teil des Primär-Schlüssels oder eines anderen Schlüsselkandidaten ist. Bemerkungen: Alternative Formulierung für 2NF: Alle Extra-Attribute ist vollständig vom Primär-Schlüssel abhängig. B ist vollständig abhängig von A1..An, wenn A1..An B gilt, dies aber nicht mehr gilt, wenn eines der Attribute Ai aus der linken Seite entfernt wird. Das Ausdruck 'Extra-Attribut' ist nicht üblich, stattdessen wird eher 'Nicht- Schlüssel-Attribut' o.ä. gesagt. FB Informatik DVS Arthur Herzog, LW 3

Bemerkungen zu Normalformen 3NF 3NF: 2NF + kein Extra-Attribut ist von anderen Extra-Attributen abhängig. Bemerkungen: Standard-Formulierung: Extra-Attribute sind nicht transitive vom Schlüssel abhängig. C ist transitiv abhängig von A1..An wenn es Attribute B1..Bn gibt, so dass A1..An B1..Bn und B1..Bn C gilt. Da alle Attribute vom Schlüssel abhängen, ist die einfachere Formulierung oben gleichbedeutend. Variante von transitiv abhängig: Attribut B statt Attribute B1..Bn. Das ist nicht gleichbedeutend, d.h. damit erhält man eine andere 3NF. FB Informatik DVS Arthur Herzog, LW 4

Bemerkungen zu Normalformen BCNF BCNF: 3NF + ist ein Attribute B vollständig von A1..An abhängig, dann ist A1..An ein Schlüsselkandidat. Bemerkungen: unter BCNF kann es nicht passieren, dass ein Schlüssel-Attribut von anderen Schlüssel-Attributen abhängig ist, und auch nicht, das ein Attribut von eine Menge aus Schlüssel- und Extra- Attributen abhängt FB Informatik DVS Arthur Herzog, LW 5

Bemerkungen zu Normalformen Allgemein Allgemeine Bemerkung: Manche alternative NF-Definition beziehen sich auf die FD-Menge und die Aufteilung der Attribute in Primär-Schlüssel-Attribute und Extra-Attribute. Andere Definition beziehen sich nur auf die FD-Menge. Das ist ein Grund, warum man häufig verschiedene Varianten der NFs findet. FB Informatik DVS Arthur Herzog, LW 6

Mehrwertige Abhängigkeiten Mehrwertige Abhängigkeiten A B: Jedem Wert für A kann eine Menge von Werten für B zugeordnet werden, welche für jeden Wert der anderen Attributen alle angenommen werden. Beispiel: In einer Schule, in der jeden Tag alle Fächer drankommen (8-20 Uhr), ist die Menge der zwei unbeliebtesten Fächer (B) einer Schülerin (A) unabhängig vom Tag. N A Tag B 3 Eva Dienstag Häckeln 4 Eva Freitag Singen 5 Eva Dienstag Singen 6 Eva Freitag Häckeln 7 Karl Dienstag Mathe 8 Karl Dienstag Turnen 8 Karl Donnertag Mathe 9 Karl Donnerstag Turnen FB Informatik DVS Arthur Herzog, LW 7

Aufgabe 3.1 FDs aus Beschreibung Gewinnen Beschreibung der Welt: Ein Professor kann mehrere Vorlesungen halten und eine Vorlesung kann von mehreren Professoren gehalten werden. Es gibt zu jeder Vorlesung ein Foliensatz, unabhängig davon, welcher Professor sie hält. Verschiedene Vorlesungen verwenden nicht den gleichen Foliensatz. Jeder Foliensatz hat einen Professor als Autor. Die Studenten bekommen zur Vorlesung eine Note. FB Informatik DVS Arthur Herzog, LW 8

Aufgabe 3.1 FDs aus Beschreibung Gewinnen Attribute: P: Professor V: Vorlesung F: Foliensatz S: Studenten N: Noten Schlüsselloses Schema U = (P,V,F,S,N) (statt Schema wird auch 'Relation' gesagt. Geschmackssache.) Erster Punkt ergibt keine FDs. Zweiter Punkt: V F, F V, F P, Dritter Punkt: VS N FB Informatik DVS Arthur Herzog, LW 9

Aufgabe 3.1 FDs aus Beschreibung Gewinnen Lassen wir S und N beiseite und betrachten nochmal die FDs auf den verbleibenden Attributen V, F und P. Das sind V F, F P und F V. Aus F P und F V folgt F PV. D.h., wenn man die Folien kennt, dann kennt man nicht nur die Vorlesung, sondern weiß auch welcher Professor sie hält? Das kann nicht sein, da es laut Text zu einer Vorlesung mehrere vortragende Professoren geben kann. Komisch. Die Rolle des Professors in F P ist die des Autors der Folien, oben haben wir in F PV das P aber als Vortragenden verstanden. Wir müssten ein weiteres Attribut D wie Dozent einführen, wenn diese Rolle auch behandelt werden soll. Die saubere Lösung ist, drei Attribute P wie Professor, D wie Dozent und A wie Autor zu verwenden. Die FDs dazu sind dann F A, D P und A P. Man erhält auch wieder F VA und damit F VP aber eben nicht F AD. FB Informatik DVS Arthur Herzog, LW 10

Aufgabe 3.2 FDs aus Daten Ableiten Die Interpretation des Schema leider verlorengegangen und die Namen der Attribute helfen auf nicht weiter. Dingsbums A B C D a 1 q r m 1 b 8 a 1 l r b 3 m 0 b 2 p 0 c 3 v r Welche FDs ergeben sich aus den vorhandenen Entities? FB Informatik DVS Arthur Herzog, LW 11

Aufgabe 3.2 FDs aus Daten Ableiten In C sind alle Werte verschieden. Also hängen alle anderen Attribute von C ab: C ABD ( und damit auch C AB... CA ABD etc. ) C ist auf der linken Seite erledigt. Was ist mit A? A D Und umgekehrt? Nein, D A gilt nicht. B X geht auch nicht. Was ist mit zwei Attributen auf der linken Seite? BD A Alle anderen gewinnt man durch Anwendung der Hüllen-Regeln aus diesen drei. FB Informatik DVS Arthur Herzog, LW 12

Aufgabe 3.3 FD-Äquivalenzklassen Bestimmen Sie die Äquivalenzklassen für die FD-Menge F F = {B C, A DE, B F, F GH, D I } Sei [X1..Xn] die Menge der Attribute die äquivalent zu X1..Xn sind. [B] = {B}, [A] = {A}, [F] = {F}, [D] = {D} Seien [[X1..Xn Y1..Ym]] die FDs, deren linke Seite äquivalent zu X1..Xn sind. Äquivalenzklassen Teilschemata Schlüsselkandidaten [[ B C ]] = {B C, B F } (BCF) {B} [[ A DE]] = { A DE } (ADE) {A} [[ F GH]] = { F GH } (FGH) {F} [[ D I ]] = { D I } (DI) {D} FB Informatik DVS Arthur Herzog, LW 13