Datenmodellierung mit dem Entity-Relationship-Modell

Ähnliche Dokumente
3. Prinzipien und Nutzung von relationalen Datenbanksystemen

In die Zeilen würden die Daten einer Adresse geschrieben werden. Das Ganze könnte in etwa folgendermaßen aussehen:

Datenbanken: Relationales Datenbankmodell RDM

Ein Schlüssel ist eine Menge von Attributen (also eines oder mehrere), die eine Datenzeile (Tupel) einer Tabelle eindeutig identifiziert

Kapitel 3: Datenbanksysteme

3. Spezielle ER-Modelle und Tabellenableitung. Transformation von ER-Diagrammen in Relationen

Christian-Weise-Gymnasium Zittau Fachbereich Informatik M. Hans. Datenmodellierung 1. Inhaltsverzeichnis

Datenbanken: ER-Modell

Übungsblatt 4. Aufgabe 7: Datensicht Fachkonzept (Klausur SS 2002, 1. Termin)

Als logisches Datenmodell wird hier das Relationenmodell vorgestellt, das heute den Standard für relationale Datenbanken darstellt.

Design Theorie für relationale Datenbanken

Einführung in Datenbanken

Einführung Datenbanken: Normalisierung

Wirtschaftsinformatik - 1.Tutorium im WS 11/12

Inhaltsverzeichnis. 1. Fragestellung

3. Das Relationale Datenmodell

IT-Kompaktkurs. Datenbanken Skript zur Folge 5. Prof. Dr. Georg Herde Fachhochschule Deggendorf

Semantische Integrität (auch: Konsistenz) der in einer Datenbank gespeicherten Daten als wichtige Anforderung

Einführung Datenbanken

Datenbankmodelle 2. Das relationale Modell

U8: SQL Datenbank Daniel Baron 1

Kapitel 06 Normalisierung von Relationen. 6 Die Normalisierung von Relationen

Datenbanksysteme. Semantische Modellierung mit dem Entity/Relationship-Modell. Burkhardt Renz. Fachbereich MNI Technische Hochschule Mittelhessen

Tag 4 Inhaltsverzeichnis

Entity-Relationship-Modell. Ein Studierender kann (oder muss) mehrere Vorlesungen hören. Eine Vorlesung wird i.a. von mehrerer Studierenden gehört.

Gestaltung einer Datenbank für ein Hotel

ICT Power-User und Supporter SIZ 2010 Modul 432: Datenbank mit Access Tanja Bossert, Andrea Weikert. 1. Ausgabe, November 2011

Normalformen. Datenmodellierung, Datenbanksysteme. Ingo Claÿen, Martin Kempa, Peter Morcinek. Hochschule für Technik und Wirtschaft Berlin

Datenbankanfragen und -operationen mittels SQL

SQL structured query language

9. Einführung in Datenbanken

Wirtschaftsinformatik (PWIN) Übung 5. Wirtschaftsinformatik (PWIN), SS 2010, Professur für Mobile Business & Multilateral Security 1

Tag 4 Inhaltsverzeichnis

7. Übung - Datenbanken

Entwurf von Datenbanken

Fachbereich Wirtschaftswissenschaften Campus Sankt Augustin

Relationale Entwurfstheorie. Kapitel / 510

Relationale Datenbanken Datenbankgrundlagen

Informations- und Wissensmanagement

Datenbanktechnologie mit praktischen Übungen in MySQL und PHP

2. Datenmodellierung mit ERM. Motivation für Datenmodellierung. Begriffsklärung. Kardinalität/Komplexität von Beziehungstypen

Teil 5: Datenbankdesign, ER-Modell, Normalformen. Das Entity-Relationship (ER) Modell

DBSP. Vorlesung. Prof. Dr. rer. nat. Nane Kratzke. Unit. Praktische Informatik und betriebliche Informationssysteme

Probeklausur im Modul Informationstechnik 1, WS 2003/04. Studiengang IWD 1. Semester Seite 1 von 5

Inf 12 Übungsarbeit Lösungen /pl

ER-Modellierung am Beispiel der Universitätsdatenbank aus der DBIS-Vorlesung

Integritätsbedingungen / Normalformen- Beispiel: Kontoführung

ABTEILUNGS- ABTEILUNGS- LEITER NAME

Informatik II Datenorganisation Datenbanken

1 Datenbank-Grundlagen

Kapitel 7: Formaler Datenbankentwurf

Inhaltsverzeichnis. Datenbanken 1

Datenbanken: Datenintegrität.

Mengenvergleiche: Alle Konten außer das, mit dem größten Saldo.

Datenbankentwurf. Entwicklungsprozess Anforderungsanalyse & Miniwelt

5. Mentorium. Wirtschaftsinformatik (PWIN) Lösungshinweise

Relationenmodell (RM)

1. Funktionen und Datenflüsse; Tabellenkalkulationssysteme

EDV-GESTÜTZTES ENTWERFEN, BERECHNEN UND KONSTRUIEREN IM BAUINGENIEURWESEN Prof. Dr.-Ing. Klaus Wassermann MODULPRÜFUNG

3. Übung. Einführung MS Access. TU Dresden - Institut für Bauinformatik Folie-Nr.: 1

Kapitel DB:III. III. Konzeptueller Datenbankentwurf

Software-Engineering Einführung

Inhalt. 2.1 Datenbankentwurf. 2.2 Relationales Modell. 2.3 Relationale Entwurfstheorie. 2.4 Relationale Algebra. 2.5 Structured Query Language (SQL)

DATENBANKEN SQL UND SQLITE VON MELANIE SCHLIEBENER

Einführung Datenbank

Übung Datenbanksysteme

Übungsblatt 4 Lösung

Datenbanksysteme Kapitel: SQL Data Definition Language

Kapitel 3. Relationales Modell (Relationenmodell) Transformation ER-Modell Relationenmodell. Prof. Dr. Wolfgang Weber, Vorlesung Datenbanken 1

Im Fall einer Personaldatenbank würde eine Relation beispielsweise wie folgt aussehen:

Definition Informationssystem

TimeSafe Leistungserfassung

Klausur Datenbanksysteme

Daten Bank. 5. Vorlesung

Teil 7: Einführung in den logischen Entwurf

In diesem Thema lernen wir die Grundlagen der Datenbanken kennen und werden diese lernen einzusetzen. Access. Die Grundlagen der Datenbanken.

DV-Organisation und Anwendungsentwicklung. 4. Klausur

Das relationale Datenmodell Verantwortliche Personen: Anca Dobre, Michael Schrattner, Susanne Bleisch

1 Übungen zu Datenbank-Kategorien

2 Datenbanksysteme. 2.1 Grundlegende Begriffe. Datenbank Management System. Schemata und Instanzen

Datenbanken Die Entwicklung der Datenbanksysteme ist eng an die der Hardware gekoppelt und wird wie jene in Generationen eingeteilt:

Übung Datenbanken in der Praxis. Relationale Algebra

Kapitel 8: Physischer Datenbankentwurf

Datenbanken. Einführung

SQL Tutorial. SQL - Tutorial SS 06. Hubert Baumgartner. INSO - Industrial Software

Das Entity-Relationship-Modell (ERM)

Fundamentals of Software Engineering 1

FRANZIS PROFESSIONAL SERIES. Daniel Warner. udienausgabe. SQL für Praxis und Studium. Mit 95 Abbildungen

Das Entity-Relationship-Modell

1 Architektur, Modellierung und Entwurf

Vorlesung Informatik II

Profilbezogene informatische Bildung in den Klassenstufen 9 und 10. Schwerpunktthema Daten und Datenbanken

1. DATENBANKDESIGN RELATIONALES DATENBANKMODELL

6. Datenintegrität. Integritätsbedingungen

Redundanz: Dieselben Informationen werden doppelt gespeichert.

Programmieren für mobile Endgeräte SS 2013/2014. Dozenten: Patrick Förster, Michael Hasseler

Konstante Relationen

Datenbankmodellierung

ER-Modell. Entity-Relationship-Model

Kap 4: Abbildung des E/R Modells auf das relationale Modell. Entity steht in Bez. Anzahl der a A r b B

Transkript:

Datenmodellierung mit dem Entity-Relationship-Modell Definition der mathematischen Relation Wertebereiche, Eigenschaften und Relationenformat Definition der Relation im Relationalen Datenmodell Entität, Entitätsmenge und Primärschlüssel Beispiele für Entitäten Tabellensicht der Relation Definition des Relationstyps 15

Tabellen als so genannte Relation Die mathematische Modellierung von Datenbanken und Zugriffsoperationen kann über das Relationale Datenmodell (Codd 1970) erfolgen. Es basiert auf dem mathematischen Relationenbegriff. Durch die Einfachheit (Tabellensicht) und klare mathematische Basis konnte sich das relationale Modell in der Entwicklung der Datenbanktechnologie seit 1970 durchsetzen. Entity-Relationship-Modell (Chen 1976) dient zur Datenmodellierung, d.h. zur Entscheidung wie Dinge und Beziehungen auf Tabellen abgebildet werden. 16

Definition der mathematischen Relation (1) Das Relationale Datenmodell (RM) basiert auf dem mathematischen Relationenbegriff. Durch die Einfachheit (Tabellensicht) und klare mathematische Basis konnte sich das RM in der Entwicklung der Datenbanktechnologie seit 1970 durchsetzen. (mathematische) Definition der Relation: Gegeben seien die nichtleeren Mengen W 1, W 2,... W n mit W 1 xw 2 x...xw n = {(w 1,w 2,...,w n ) w i є W i (i=1,2,...,n)} Dann ist jede nichtleere Teilmenge R W 1 xw 2 x...xw n eine n-stellige Relation über W 1, W 2,..., W n. Die W i müssen nicht alle paarweise verschieden sein. Ein Tupel (w 1,w 2,...,w n ) = (4989; Möbius; Wilhelm; Ja; 01.01.66; 80686; gesch; 2; DBADM; 4.360,50). könnte z.b. zu R gehören. Als Trennzeichen zwischen den Tupelwerten wurde das Semikolon verwendet, da das Komma in Dezimalzahlen vorkommen kann. 17

Definition der mathematischen Relation (2) (4989; Möbius; Wilhelm; Ja; 01.01.66; 80686; gesch; 2; DBADM; 4.360,50). Für das obige Beispiel wären die Mengen W i konkret festgelegt: W 1 ganze Zahl (int), W 2 Zeichenkette (varchar), W 4 Besonderes (bit), W 5 Datum und Zeit (datetime),, W 10 Währung (money). 18

Wertebereiche, Eigenschaften und Relationenformat (1) Wir deuten jetzt die Mengen W i als Wertebereiche (Domänen) und die w i є W i als Werte und verbinden die W i, genauer das Kreuzprodukt W 1 xw 2 x...xw n, mit einer Interpretation I E={E 1,E 2,...,E n } = I(W 1 xw 2 x...xw n ) für i=1,2,...,n Diese E i werden als Eigenschaften (Attribute) von Entitäten gedeutet. Für das obige Beispiel wären die Eigenschaften E i wie folgt gedeutet: E 1 MNR (Mitarbeiternummer), E 2 Name (Familienname), E 4 Geschlecht, E 5 Geburtsdatum,,E 10 Gehalt. Mit dieser Semantik würde das Tupel (4989; Möbius; Wilhelm; Ja; 01.01.66; 80686; gesch; 2; DBADM; 4.360,50) die Entität Herr Möbius eindeutig charakterisieren. 19

Wertebereiche, Eigenschaften und Relationenformat (2) E nennt man Relationenformat. Das Relationenformat bildet den Kern einer Relation im Sinne der Datenbanktheorie. Zusammen mit der Interpretation definiert das Relationenformat eine Relation im Sinne des Relationalen Datenmodells. Manche Autoren betrachten als Relationenformat gleich die Menge der Paare (E i,w i ) für i=1,2,...,n. An den Begriff Relation werden aber noch einige Forderungen gestellt. Es ist möglich, dass ein Eigenschaftswert fehlt, d.h. undefiniert ist. Dieser Fall wird durch den (Sonder-)Wert NULL angezeigt. 20

Definition der Relation im Relationalen Datenmodell Eine Relation R= R(E 1,E 2,...,E n ) ist eine Menge von Tupeln, wobei R der Name der Relation, E={E 1,E 2,...,E n } das Relationenformat und die E i (i=1,2,...,n) die Eigenschaften sind, deren Werte w i aus den zugeordneten Wertebereichen W i stammen müssen. Die E i, die zu einer Relation gehören, müssen paarweise verschieden sein. Ist r ein Tupel der Relation, bezeichnet w i = r.e i den Wert der i- ten Eigenschaft des Tupels r є R (W 1 xw 2 x...xw n ). n heißt Grad der Relation. 21

Charakteristische Eigenschaften der Relation Eine Relation hat folgende charakteristische Eigenschaften: 1. R ist eine Menge. Damit gibt keine paarweise identischen Tupel. R hat deshalb einen Primärschlüssel, der jedes Tupel eindeutig identifiziert. 2. R ist eine Menge. Deshalb ist die Reihenfolge der Tupel in R ohne Belang. 3. Die Reihenfolge der Eigenschaften E i in R ist ohne Belang. 4. Die Eigenschaftswerte w i = r.e i mit r є R müssen einfach sein, d.h. dürfen nicht mengenwertig oder nicht strukturiert sein. w i = NULL ist aber möglich. 22

Entität, Entitätsmenge und Primärschlüssel (1) Eine Relation R im RM beschreibt damit eine Entitätsmenge. Jedes Tupel r є R charakterisiert damit eindeutig eine Entität im zu modellierenden Diskursbereich. Eine Entität ist eine Person, Sache oder gedankliches Konstrukt, das im zu modellierenden Diskursbereich real existiert und eindeutig identifizierbar ist. Eine Entität ist Träger von Eigenschaften E 1,E 2,...,E n. Eine Entitätsmenge ist die Zusammenfassung aller Entitäten mit der gleichen Menge von Eigenschaften {E 1,E 2,...,E n }, die zu einer bestimmten Zeit im Diskursbereich existieren. Eine Relation R mit dem Relationenformat E eignet sich zur Beschreibung einer Entitätsmenge. Man beachte, dass damit eine Relation während der Lebensdauer einer Datenbank zeitabhängig ist. 23

Entität, Entitätsmenge und Primärschlüssel (2) PS heißt Primärschlüssel der Relation R=R(E 1,E 2,...,E n ), falls gilt: 1. PS E und 2. PS ist in E identifizierende Eigenschaft bzw. Eigenschaftskombination, d.h. jedes Tupel r є R hat einen eindeutigen PS-Wert ps r =r.ps und ps r NULL. Ein Primärschlüssel PS heißt minimal, falls es keine echte Teilmenge PS PS gibt, für die die obigen Beziehungen 1. und 2. gelten. 24

Ein Beispiel zum Entitätsbegriff (1) Beispiel eines Diskursbereiches Wetterdatenerfassung Wetterstation Ortsname Geografische Angaben 1 n>=0 Wettermeldung Erhoben von einer Wetterstation Datum, Uhrzeit Angaben zum Wetter Zusatzwissen: Eine Wetterstation wird typischerweise mehrere Wettermeldungen abgeben 25

Ein Beispiel zum Entitätsbegriff Beispiel eines Diskursbereiches Wetterdatenerfassung Wetterstation WS_ID Ortsname Geogr. Länge Geogr. Breite Höhe WS_ID dient für die Wetterstationen als Primärschlüssel Eine Wettermeldung wird durch Datum, Uhrzeit und WS_ID eindeutig identifiziert Wettermeldung WS_ID Datum, Uhrzeit Temperatur Luftdruck Windrichtung Windstärke Wettererscheinung 26

Ein Beispiel zum Entitätsbegriff (3) wetterstationen WS_ID Ortsname GeogrLaenge GeogrBreite Hoehe 1 Arkona 13.437 54.676 43 2 Brocken 10.615 51.799 1141 3 Fichtelberg 12.954 50.429 1214 4 Heiligendamm 11.843 54.142 10 meldungen WS_ ID Datum Uhrzeit Temp Druck Windr Windst Erscheinung 3 24-12-14 12:00-4 998 West 7 Schneefall 1 1-5-15 15:00 17 1011 Nordwest 4 3 12-5-15 8:00 12 978 Sued 5 Regen 27

Definition des Relationentyps Definition des Relationstyps Da eine Relation R im RM eine Entitätsmenge beschreibt und damit zeitabhängig ist, besteht die Notwendigkeit, eine zeitunabhängige Beschreibung von R vorzunehmen. Mit dem Begriff des Relationstyps wird diese zeitunabhängige, formale Beschreibung einer Relation im RM realisiert. Definition des Relationstyps: R( E IB ) heißt Relationstyp der Relation R wenn gilt: - R ist der Name der Relation - E = {E 1,E 2,...,E n } ist das Relationenformat von R -E i sind die Eigenschaften von R, deren Werte aus den zugeordneten Wertebereichen W i stammen müssen - IB ist eine Menge von semantischen Integritätsbedingungen (constraints) In der Datenbanktechnologie sind neben der semantischen Integrität noch die operationale und physische Integrität von Bedeutung. 28

Entwurf von Relationalen Datenbanken (1) In der Regel werden Diskursbereiche durch mehrere Relationen (Tabellen) abgebildet. Ziele: Vermeiden von Redundanz in Relationen Vermeiden von Inkonsistenzen Effizienzsteigerung, wenn nur wirklich benötigte Daten gelesen werden, bzw. Informationen nur in wenigen Tupeln aktualisiert werden müssen. Beispiel: eine Datenbank über Verkäufe Verkaufs-Nr. Produkt Einzelpreis Anzahl Käufer Käufer-Adresse 29

Entwurf von Relationalen Datenbanken (2) Gesamt Verk.-Nr. Produkt Einzelpreis Anzahl Käufer Käufer-Adresse 1 Tomate 0.20 4 Heidi 33333 Wiesenhain, Am Waldrand 1 2 Apfelsaft 1.40 2 Heidi 33333 Wiesenhain, Am Waldrand 1 3 Katzenfutter 2.30 1 Kurt 33221 Bachhagen, Hauptstr. 23 4 Apfelsaft 1.40 3 Kurt 33221 Bachhagen, Hauptstr. 23 5 Gurke 0.55 1 Peter 33200 Feldstadt Am Markt 5 6 Tomate 0.20 8 Peter 33200 Feldstadt Am Markt 5 7 Bier 0.78 4 Kurt 22331 Bachhagen, Hauptstr. 23 Redundanzen und Inkonsistenz 30

Entwurf von Relationalen Datenbanken (2) Verkaeufe Verk. - Nr. Produkt- ID Anzahl 1 T 4 42 2 A 2 42 3 K 1 20 4 A 3 20 Käufer-ID Produkte Produkt-ID Name Preis T Tomate 0.20 A Apfelsaft 1.40 K Katzenfutter 2.30 G Gurke 0.55 B Bier 0.78 5 G 1 17 6 T 8 17 7 B 4 20 Redundanz ist jetzt beseitigt Inkonsistenzen können jetzt nicht mehr auftreten Kunden Käufer-ID Name Adresse 17 Peter 33200 Feldstadt Am Markt 5 20 Kurt 33221 Bachhagen, Hauptstr. 23 42 Heidi 33333 Wiesenhain, Am Waldrand 1 31

Entwurfsregeln (1) Identifikation der Entitätsmengen und der Beziehungsmengen Regel 1: Jede Entitätsenge muss erst einmal als eigenständige Tabelle mit einem eindeutigen Primärschlüssel definiert werden. Merkmale gehen als Attribute in die Tabellen ein. Regel 2: Beziehungsmengen können als eigenständige Tabellen definiert werden. Die Merkmale der Beziehungen erscheinen in den Attributen der Tabelle. Der Verweis aus die Entitätsmengen geschieht durch die Aufnahme der Schlüssel in die Tabelle (Fremdschlüssel). 32

Entwurfsregeln (2) Entitäten Beziehungen Beispiel aus: 1 c Abteilung Mitarbeiter m Abteilungsleiter Unterstellung 1 mc A. Meier: Relationale Datenbanken Leitfaden für die Praxis. 5. Auflage, 2004 Springer Verlag Regel 1: Zugehörigkeit Projekt m Einzelne Tabellen für Entitäten Projekt Pnr Bezeichnung Abteilung Anr Bezeichnung Mitarbeiter Mnr Name Vorname 33

Entwurfsregeln (3) Entitäten Beziehungen 1 Abteilung m c Regel 2: Mitarbeiter Projekt 1 mc Abteilungsleiter Unterstellung Zugehörigkeit m Assoziationstypen: 1 genau ein c kein oder ein m ein oder mehrere mc kein, ein oder mehrere Tabellen oder Fremdschlüsselbeziehungen für Beziehungen 34

Entwurfsregeln (4) Beziehungs-Komplexität: Die Mächtigkeit der in Beziehung stehenden Mengen definiert verschiedene Klassen: von/zu 1 c m mc 1 (1,1) (1,c) (1,m) (1,mc) B1 c (c,1) (c,c) (c,m) (c,mc) m (m,1) (m,c) (m,m) (m,mc) B2 B2 B3 mc (mc,1) (mc,c) (mc,m) (mc,mc) B1: einfach-einfache Beziehungen B2: einfach-komplexe Beziehungen B3: komplex-komplexe Beziehungen 35

Entwurfsregeln (5) Regel 3: Komplex-komplexe Beziehungen (m zu m, m zu mc, mc zu m, mc zu mc) müssen als eigenständige Tabelle definiert werden. Mitarbeiter mc Zugehörigkeit Projekt m Mitarbeiter Projekt Mnr Name Vorname Mnr Pnr Prozent Pnr Bezeichnung Zugehoerigkeit 36

Entwurfsregeln (6) Regel 4: einfach-komplexe Beziehungen (m zu 1, 1 zu m und weitere) können ohne eigenständige Tabelle durch die beiden zugeordneten Tabellen der Entitätsmengen ausgedrückt werden. Abteilung m Unterstellung 1 Mitarbeiter Abteilung Anr Bezeichnung Fremdschlüssel-Beziehung Mitarbeiter Mnr Name Vorname Abt_Unterstell 37

Entwurfsregeln (7) Regel 5: einfach-einfache Beziehungen (1 zu 1, 1 zu c und weitere) können ohne eigenständige Tabelle durch die beiden zugeordneten Tabellen der Entitätsmengen ausgedrückt werden. Abteilung 1 c Abteilungsleiter Mitarbeiter Fremdschlüssel-Beziehung Abteilung Anr Bezeichnung Abtleiter Mitarbeiter Mnr Name Vorname Abt_Unterstell Fremdschlüssel-Beziehung 38

Entwurfsregeln (8) Regel 6: Generalisierung Eigenständige Tabellen für übergeordnete Entitätsmenge und für jede Spezialisierung Regel 7: Part-Of-Beziehung - Eigenständige Tabellen für Entität und Beziehungsmenge, falls Beziehungstyp komplex-komplex ist hier nur zur Vollständigkeit erwähnt. 39

Entwurfsregeln (9) Wie wäre ein regelbasierter Entwurf für das eingangs benutzte Beispiel ausgegangen? Verk.-Nr. Produkt Einzelpreis Anzahl Käufer Käufer-Adresse mc Produkt Attribut Einzelpreis wird gekauft Attribut Anzahl drei Tabellen, wie auf Folie 31 mc Käufer Attribut Adresse 40

Normalformen (1) Ziele: Vermeiden von Redundanz in Relationen bei ungünstiger Struktur der Tabellen würde gleiche Information u.u. mehrfach gespeichert. Eine Strukturierung entsprechend der dritten Normalform verhindert das. Vermeiden von Anomalien bei ungünstigen Entwurf können Informationen u.u. ungewollt verloren gehen. 41

Normalformen (2) Verk.-Nr. Produkt Einzelpreis Anzahl Käufer Käufer-Adresse Anomalien: Einfügeanomalie Neue Sachverhalte können nicht eingefügt werden. Im Beispiel oben kann keine neues Produkt mit einem Preis eingefügt werden, ohne einen Kaufvorgang zu beschreiben. Löschanomalie Das Löschen von Kaufvorgängen bedingt u.u. den Verlust von Produktinformationen und Käuferdaten. Änderungsanomalie Das Abändern eines Sachverhalts verlang oft das Ändern vieler Datensätze (bei Redundanz von z.b. Käufer-Adressen) 42

Zweck der Normalformen Ein Datenbankentwurf nach dem Entity-Relationship-Modell bringt die Tabellen automatisch in eine redundanzfreie und anomaliefreie Struktur. ER- Modell regelbasierter Entwurf Für existierende Datenbanken können Probleme behoben werden, indem das Vorhandensein der Normalformen geprüft wird und diese durch Umstrukturierung der Tabellenstruktur hergestellt werden. Redundanzfreie und anomaliefreie Datenbank Existierender Datenbestand Umstrukturierter Datenbestand Herstellung der Normalformen 43

Erste Normalform (1) Eine Tabelle ist in der ersten Normalform (1NF), falls die Wertebereiche der Merkmale atomar sind. 1NF verlangt, dass jedes Merkmal Werte aus einem unstrukturierten Wertebereich aufnimmt. Damit dürfen keine Mengen, Aufzählungstypen oder Wiederholungsgruppen in den einzelnen Merkmalen vorkommen. Beispiel für eine nicht erfüllte 1NF: Matrnr Name Vorname Studiengänge 11 Schmidt Robert {Mathematik, Physik} 47 Schulze Klaus {Sport, Erziehungswissenschaften} 78 Peters Karoline {Informatik} 44

Erste Normalform (2) Beispiel mit atomarem Wertebereich für Studiengang Matrnr Name Vorname Studiengang 11 Schmidt Robert Mathematik 11 Schmidt Robert Physik 47 Schulze Klaus Sport 47 Schulze Klaus Erziehungswissenschaften 78 Peters Karoline Informatik 45

Zweite Normalform (1) Eine Tabelle ist in der zweiten Normalform (2NF), wenn sie in der 1NF ist und wenn jedes Nichtschlüsselmerkmal von jedem Schlüssel voll funktional abhängig ist. Voll funktional abhängig bezieht sich aus zusammengesetzte Schlüssel (S1,S2) von denen alle Nichtschlüsselmerkmale abhängig sind: (S1,S2) -> N Sie dürfen dabei aber nicht funktional abhängig von einem Teilschlüssel sein, z.b. S1->N Im Beispiel sind Name und Vorname Nichtschlüsselmerkmale, der Schlüssel setzt sich aus Matrnr und Studiengang zusammen. (Matrnr, Studiengang) -> Name aber auch Matrnr -> Name damit keine 2NF 46

Zweite Normalform (2) Herstellung der zweiten Normalform (2NF): Tabellenteilung Alle Merkmale, die von einem Teilschlüssel abhängig sind werden in eine eigene Tabelle ausgegliedert. Matrnr Name Vorname 11 Schmidt Robert 47 Schulze Klaus 78 Peters Karoline Matrnr Studiengang 11 Mathematik 11 Physik 47 Sport 47 Erziehungswissenschaften 78 Informatik 47

Dritte Normalform (1) Eine Tabelle ist in der dritten Normalform (3NF), wenn sie in der 2NF ist und kein Nichtschlüsselmerkmal von irgendeinem Schlüssel transitiv abhängig ist. Ein Beispiel für eine nicht erfüllte 3NF: Matrnr Wohn- Wohnort PLZ 11 01217 Dresden 47 01219 Dresden 78 14197 Berlin 89 14197 Berlin 95 01217 Dresden Matr nr Wohn PLZ Wohnort tritt redundant auf. Wohn ort 48

Dritte Normalform (2) Überführung in dritte Normalform (3NF), indem ein transitiv abhängiges Merkmal in eine neue Tabelle ausgegliedert wird. Das Merkmal von dem die letzte Stufe der Abhängigkeit ausgegangen ist, wird als Fremdschlüssel in die neue Tabelle aufgenommen. Matrnr Wohn- PLZ 11 01217 47 01219 78 14197 89 14197 95 01217 PLZ Ort 01217 Dresden 14197 Berlin 01219 Dresden 49