Datenorganisation. Februar bis Mai Dipl.-Oek. Patrick Bartels Institut für Wirtschaftsinformatik Universität Hannover

Größe: px
Ab Seite anzeigen:

Download "Datenorganisation. Februar bis Mai Dipl.-Oek. Patrick Bartels Institut für Wirtschaftsinformatik Universität Hannover"

Transkript

1 Datenorganisation Februar bis Mai 2007 Dipl.-Oek. Patrick Bartels Institut für Wirtschaftsinformatik Universität Hannover Telefon: +49 (0) (0) Internet:

2 Nachtrag: Fremdschlüssel Ein Fremdschlüssel ist ein Primärschlüssel einer Relation, der in einer anderen Relation als Attributmenge auftaucht. Er dient als Verweis zwischen zwei Relationen, d. h. er zeigt an, welche Tupel der Relationen inhaltlich miteinander in Verbindung stehen. Beispiele für Fremdschlüssel sind die beiden Attribute Vorgesetzter und Untergebener aus der Beispielrelation Vgl. 2

3 3.2 Logisches Datenmodell 3

4 3.2 Logisches Datenmodell Logische Datenbankmodellierung ist der Prozess der Überführung eines konzeptionellen Datenmodells in ein logisches Datenbankmodell, das anschließend über ein DBMS implementiert werden kann. Beispiele für Datenbankmodelle: Hierarchisches Datenmodell Netzwerkmodell Relationales Datenmodell Objekt-orientiertes Datenmodell 4

5 3.2.1 Hierarchisches Datenmodell Hierarchisches Datenmodell ( ) Datensätze werden als Knoten, Beziehungen als Kanten dargestellt Es sind nur 1:n Beziehungen zugelassen, dadurch entsteht eine Baumstruktur Beim folgenden Beispiel muss eine Hierarchie für Kunden und eine für Artikel gebildet werden 5

6 3.2.1 Hierarchisches Datenmodell Hierarchisches Datenmodell ( ) Ein Knoten kann nur einen vorgelagerten Knoten besitzen. Einstieg in den Baum immer über die Wurzel. Existenzabhängigkeiten! Erstes logisches Datenmodell. Datensatzorientiert. Einsatz vor allem in Legacy-Systemen, insbes. in Großrechnersystemen. 6

7 3.2.1 Hierarchisches Datenmodell Hierarchisches Datenmodell ( ) 7

8 3.2.1 Hierarchisches Datenmodell ER-Diagramm Hierarchisches Datenmodell 8

9 3.2.1 Hierarchisches Datenmodell Hierarchisches Datenmodell ( ) 9

10 3.2.2 Netzwerkmodell Das Netzwerkmodell stellt Datenstrukturen als Netzwerke bestehend aus Knoten für Datensätze (Objekte) und Kanten für Beziehungen zwischen Datensätzen dar. Dabei werden üblicherweise 1:m- und n:m- Beziehungen zugelassen. Ein Datensatztyp kann mit einer beliebigen Anzahl verschiedener anderer Datensatztypen verbunden sein. 10

11 3.2.2 Netzwerkmodell Pfeile deuten 1:n-Beziehungen an. Datensatzorientiert. Das Netzwerkmodell wurde entwickelt, um die Limitierungen des hierarchischen Datenmodell zu beseitigen. Einsatz in Legacy-Systemen, insbes. in Großrechnersystemen. 11

12 3.2.2 Netzwerkmodell Beispiel: 12

13 3.2.2 Netzwerkmodell Beispiel 13

14 3.2.3 Relationales Datenmodell Das relationale Datenmodell Entwickelt von Dr. Edgar Frank Codd (1970) Erster systematischer Ansatz, Grundlage einer ersten Datenbanktheorie, Basis für viele Konzepte und Produkte 12 Grundregeln (später erweitert auf 48, dann auf 333) Grundlage für die meisten heutigen DB-Systeme Tabellen (Relationen) sind das universelle Strukturierungsmittel Alle Daten werden als Werte in zweidimensionalen Tabellen dargestellt 14

15 3.2.3 Relationales Datenmodell Relation = 2-dim. Tabelle Alle Daten werden in Tabellen gespeichert Abfrage-Ergebnisse sind Tabellen Abfragen sind Transformationen von Tabellen in Tabellen feste Anzahl von Spalten, beliebige Anzahl von Zeilen Die Reihenfolge der Zeilen spielt keine Rolle, ebenso die der Spalten Jede Zeile der Tabelle: ein Datensatz, ein Tupel Die Spalten (Felder) enthalten die Attribute des Datensatzes Die Zeilen müssen paarweise voneinander verschieden sein, d.h. es gibt keine zwei identischen Zeilen 15

16 3.2.3 Relationales Datenmodell Die 12 Grundregeln (0 bis 12=13) für relationale Datenbanken: 0. Ein relationales DBMS muss in der Lage sein, Datenbanken vollständig über seine relationalen Fähigkeiten zu verwalten. 1. Darstellung von Informationen: Alle Informationen in einer relationalen Datenbank (einschließlich Namen von Tabellen und Spalten) sind explizit als Werte in Tabellen darzustellen. 2. Zugriff auf Daten: Jeder Wert einer relationalen Datenbank muss durch eine Kombination von Tabellenname, Primärschlüssel und Spaltenname auffindbar sein. 16

17 3.2.3 Relationales Datenmodell Die 12 Grundregeln (0 bis 12=13) für relationale Datenbanken: 3. Systematische Behandlung von Nullwerten: Das DBMS behandelt Nullwerte durchgängig gleich als unbekannte oder fehlende Daten und unterscheidet diese von Standardwerten. 4. Struktur einer Datenbank: Die Datenbank und ihre Inhalte werden in einem so genannten Systemkatalog auf derselben logischen Ebene wie die Daten selbst - also in Tabellen beschrieben. Demzufolge lässt sich der Katalog mit Hilfe der Datenbanksprache abfragen. 5. Abfragesprache: Zu einem relationalen System gehört mindestens eine Abfragesprache mit einem vollständigen Befehlssatz für Datendefinition, Manipulation, Integritätsregeln, Autorisierung und Transaktionen. 17

18 3.2.3 Relationales Datenmodell Die 12 Grundregeln (0 bis 12=13) für relationale Datenbanken: 6. Aktualisieren von Sichten: Alle Sichten, die theoretisch aktualisiert werden können, lassen sich auch vom System aktualisieren. 7. Abfragen und Bearbeiten ganzer Tabellen: Das DBMS unterstützt nicht nur Abfragen, sondern auch die Operationen für Einfügen, Aktualisieren und Löschen in Form ganzer Tabellen. 8. Physikalische Datenunabhängigkeit: Der logische Zugriff auf die Daten durch Anwendungen und Ad-Hoc-Programme muss unabhängig von den physikalischen Zugriffsmethoden oder den Speicherstrukturen der Daten sein. 18

19 3.2.3 Relationales Datenmodell Die 12 Grundregeln (0 bis 12=13) für relationale Datenbanken: 9. Logische Datenunabhängigkeit: Änderungen der Tabellenstrukturen dürfen keinen Einfluss auf die Logik der Anwendungen und Ad-Hoc-Programme haben. 10.Unabhängigkeit der Integrität: Integritätsregeln müssen sich in der Datenbanksprache definieren lassen. Die Regeln müssen im Systemkatalog gespeichert werden. Es darf nicht möglich sein, die Regeln zu umgehen. 11.Verteilungsunabhängigkeit: Der logische Zugriff auf die Daten durch Anwendungen und Ad-Hoc-Programme darf sich beim Übergang von einer nicht verteilten zu einer verteilten Datenbank nicht ändern. 19

20 3.2.3 Relationales Datenmodell Die 12 Grundregeln (0 bis 12=13) für relationale Datenbanken: 12.Kein Unterlaufen der Abfragesprache: Integritätsregeln, die über die Datenbanksprache definiert sind, dürfen sich nicht mit Hilfe von Low-Level-Sprachen umgehen lassen. 20

21 3.2.3 Relationales Datenmodell Relationales Datenmodell Objekttypen und Beziehungstypen und deren Attribute werden mittels Relationen abgebildet, die anschaulich durch Tabellen dargestellt werden können. 1. Präzisiert wird eine Relation durch Angabe eines Namens und der Attribute des betreffenden Objekttyps. Primärschlüssel-Attribute werden unterstrichen 2. Schreibweise: [KONTO (Filiale; KontoNr; KontoInhaber; KontoStand)] 21

22 3.2.3 Relationales Datenmodell Relationales Datenmodell Mathematisch ist jede Relation eine Teilmenge des kartesischen Produkts von zwei oder mehr Mengen. Das kartesische Produkt M1 x M2 zweier Mengen M1 und M2 ist die Menge aller Paare (p, q) mit p aus M1 und q aus M2 Das kartesische Produkt ist die Menge aller möglichen Wertekombinationen Beispiel: Für M1 = {1,2,3} und M2 = {a,b,c} ist M1 x M2 = { (1,a), (1,b), (1,c), (2,a), (2,b), (2,c), (3,a), (3,b), (3, c) } Eine Relation ist eine Teilmenge des kartesischen Produkts, wobei alle Tupel (Datensätze) unter sich verschieden sind. 22

23 3.2.3 Relationales Datenmodell Relationales Datenmodell Beim relationalen Datenmodell sind diese Mengen die Wertebereiche der Attribute des betreffenden Objekttyps. z.b. Konto Aufbau und Struktur einer Relation bezeichnet man auch als Schema (Datenbank-Schema). 23

24 3.2.3 Relationales Datenmodell ER-Diagramm Relationales Datenmodell 24

25 3.2.3 Relationales Datenmodell Relationales Datenmodell Für eine Tabelle des Relationenmodells gilt: Die Zeilen der Tabelle sind gleich lang In den Feldern gibt es keine Attributwiederholungen Die Spalten der Tabelle sind elementar (in den Spalten gibt es keine zusammengesetzten Attribute) Tabellen können Anomalien aufweisen: Redundanz Änderungsanomalie Einfügeanomalie Löschanomalie 25

26 3.2.4 Normalisierung 26

27 3.2.4 Normalisierung Eine gut-strukturierte Relation enthält keine Redundanz und ermöglicht es Datensätze einzufügen, zu ändern oder zu löschen, ohne dass Inkonsistenzen entstehen. Vermeidung von Änderungsanomalien Einfügeanomalien Löschanomalien 27

28 3.2.4 Normalisierung Redundanz ist die mehrfache Speicherung derselben Daten. Diese Redundanz ist im Regelfall unerwünscht, da unnötig Speicherplatz beansprucht wird und die Aktualisierung von Daten durch Redundanz erheblich erschwert wird. Quelle: Schwarze 28

29 3.2.4 Normalisierung Änderungsanomalie (Updateanomalie): Eine Änderung von Daten muss in mehreren Datensätzen durchgeführt werden. Beispiel: Die Videostammdaten sind in der Leihtabelle enthalten. Bei Änderungen der Videostammdaten müssen alle Datensätze geändert werden, bei denen dieses Video ausgeliehen worden ist. Leihe(KNr, VINr, LDat, RDat, Titel, Leihgesellschaft,...) statt: Video(VINr, Titel, Leihgesellschaft,...) Leihe(KNr, VINr, LDat, RDat) 29

30 3.2.4 Normalisierung Einfügeanomalie: Beim Einfügen von neuen Objekten (z. B. Videos) müssen andere Daten auch erfasst werden. Beispiel: Ein neues Video kann erst angelegt werden, wenn es von einem Kunden ausgeliehen wurde, weil die Kundennummer der Primärschlüssel ist. Leihe(KNr, VINr, LDat, RDat, Titel, Leihgesellschaft,...) 30

31 3.2.4 Normalisierung Löschanomalie: Wird der letzte verbleibende Datensatz eines bestimmten Objektes (z. B. Leihvorgänge) gelöscht, verschwinden alle Daten des enthaltenen Objektes (z. B. Video) in der Datenbank. Beispiel: Wird der letzte Datensatz mit Leihdaten eines bestimmten Videos gelöscht, werden auch alle Videodaten (Titel, Leihgesellschaft,...) gelöscht. 31

32 3.2.4 Normalisierung Normalisierung: Unerwünschte Eigenschaften können beseitigt werden, indem die Relation (bzw. Tabelle) nach bestimmten Vorschriften in einfachere Relationen (bzw. Tabellen) zerlegt wird. Diese Zerlegung bezeichnet man als Normalisierung. Quelle: Schwarze 32

33 3.2.4 Normalisierung Eine Normalform ist ein Zustand einer Relation, der durch die Anwendung einfacher Regeln erreicht werden kann. Es gibt theoretisch 5 Stufen der Normalform, wobei nur die ersten drei tatsächliche Relevanz besitzen Normalform Boyce-Codd-Normalform Normalform Domain-Key Normalform 33

34 3.2.4 Normalisierung 1. Normalform Eine Tabelle des Relationenmodells, deren Zeilen gleich lang sind, ohne Attributswiederholungen, mehrfache und zusammengesetzte Attribute. Folgende Bedingungen müssen in der 1. Normalform erfüllt sein: Sie ist zweidimensional mit Reihen und Spalten Jede Reihe enthält Daten, die zu einem Objekt oder einem Teil eines Objektes gehören Jede Spalte enthält Daten für ein einziges Attribut des Objektes Jeden Datenzelle (Schnittstelle zwischen Reihe und Spalte) enthält einen einzigen Eintrag Jede Spalte muss einen (in der Tabelle) einmaligen Namen tragen Keine zwei Reihen dürfen identisch sein Die Reihenfolge der Spalten und Reihen ist bedeutungslos 34

35 3.2.4 Normalisierung 1. Normalform Beispiel für eine Relation, die NICHT in der 1. Normalform vorliegt! 35

36 3.2.4 Normalisierung 1. Normalform Beispiel für eine Relation, die in der 1. Normalform vorliegt! 36

37 3.2.4 Normalisierung 2. Normalform Eine Tabelle liegt in der ersten Normalform vor und außerdem sind alle Attribute voll funktional abhängig von einem Attribut oder einer Attributskombination. Eine Tabelle ist automatisch in 2. Normalform, wenn gilt: - Der Primärschlüssel besteht aus nur einem Attribut (künstliche Primärschlüssel: Autowert, Zähler!). - Jedes Nichtschlüsselattribut ist funktional abhängig von dem gesamten Primärschlüssel. 37

38 3.2.4 Normalisierung 2. Normalform Bestellungen Bestell_Nr Artikel_Nr Einzelpreis , ,80 Anzahl 3 7 Eine Relation Bestellungen, die NICHT der 2NF entspricht, weil - Einzelpreis sich nur auf Artikel_Nr und nicht auch auf Bestell_Nr bezieht. - Bestell_Nr und Artikel_Nr bilden den Primärschlüssel. - Jedes dieser Attribute stellt einen Teilschlüssel dar. 38

39 3.2.4 Normalisierung 3. Normalform Es liegt die 2. Normalform vor und es existieren außerdem keine transitiven Abhängigkeiten. 39

40 3.2.4 Normalisierung 3. Normalform Eine Relation Kunde, die NICHT der 3NF entspricht! 40

41 3.2.4 Normalisierung 3. Normalform Eine Relation Kunde, die der 3NF entspricht! 41

42 3.2.4 Normalisierung Weitere Normalformen: 4. und 5 Normalform: In der 4. Normalform werden mehrwertige Abhängigkeiten von Attributmengen zu einem so genannten Superschlüssel (übergeordnetem Schlüssel) eliminiert. Ist eine verlustfreie Zerlegung der Einzelabhängigkeiten in der 4. Normalform nicht möglich, werden in der 5. Normalform weitere Primärschlüssel hinzugefügt. Das geschieht so lange, bis nur noch Einzelabhängigkeiten der Attribute von einem oder mehreren Primärschlüsseln bestehen. 42

43 3.3 Physischer Datenbankentwurf 43

44 3.3 Physischer Datenbankentwurf statische Anforderungen Objekttypen Beziehungstypen Attribute Anforderungsanalyse dynamische Anforderungen Verarbeitungsprozeduren Zugriffsregelungen Sicherheitsanforderungen Konzeptionelle Datenmodellierung Logische Datenmodellierung Physischer Datenbankentwurf Implementierung Laufender Betrieb Quelle: in Anlehnung an Schwarze 44

45 Grundlagen der physischen DM Physische Datenbankmodellierung ist der Prozess der Überführung eines logischen Datenmodells in ein datenbankinternes Modell, unter Beachtung von: Logischen Datenstrukturen Anforderungen der Benutzer bezüglich Antwortzeiten, Sicherheit, Recovery usw. Besonderheiten des verwendeten DBMS und Betriebssystems 45

46 Grundlagen der physischen DM Z. B. Strategien zur Datenverteilung: 1. Zentrale Speicherung 2. Partitionierung: Die Datenbank wird in mehrere disjunkte (nicht-überlappende) Partitionen aufgeteilt. Jede Partition wird an unterschiedlicher Stelle (Abteilung, Filiale,...) gespeichert. 3. Replikation: Eine vollständige Kopie der Datenbank wird an einer anderen Stelle gespeichert. Synchronisationsprobleme! 4. Hybride Strategie: Nichtkritische Partitionen werden an einem Ort gespeichert; kritische Partitionen werden repliziert. 46

47 Grundlagen der physischen DM Im Rahmen der physischen DM müssen das erwartete Datenvolumen und die Datenverwendung analysiert werden: Datenvolumen: z. B. zur Auswahl geeigneter Speichermedien (Anzahl und Größe der Festplatten) und eines DBMS Datenverwendung: z. B. zur Auswahl einer geeigneten Dateiorganisation, von Zugriffsmethoden, zur Planung von Indexen, einer verteilten Datenspeicherung 47

48 Grundlagen der physischen DM Analyse des Datenvolumens: Angabe der durchschnittlichen Anzahl an Objekten eines Objekttyps in einem bestimmten Zeitraum Angabe der durchschnittlichen Anzahl verbundener Objekte in einer Beziehung in einem bestimmten Zeitraum 48

49 Grundlagen der physischen DM Informationen aus der Fachabteilung, z. B.: Einmal jährlich soll archiviert werden Voraussichtlicher Kundenbestand: CDs: 1000, Lieder/CD: ca. 14, Videos: 500 Pro Kunde + Jahr: 10 Leihvorgänge Im Schnitt 3 CDs + 1 Video je Leihvorgang Verlängerung einer Leihe: neue Rechnung (10 % der Leihen werden verlängert) 49

50 Grundlagen der physischen DM Analyse des Datenvolumens: 50

51 Grundlagen der physischen DM Analyse des Datenvolumens: CD Leihe Video Lieder je CD Kunde Rechnung Rechn.- position

52 Grundlagen der physischen DM Analyse der Datenverwendung: Identifikation der wichtigsten Vorgänge Zu jedem Vorgang werden die Zugriffspfade und -häufigkeiten bestimmt Zusammenführung der einzelnen Vorgänge in einem Verwendungs-Chart 52

53 Grundlagen der physischen DM Vorgang Ausleihe speichern : 1. Kunde suchen 2. CD oder Video suchen 3. Leihdaten speichern (inkl. LDat und RDat) 4. weitere CD oder Video suchen... 53

54 Grundlagen der physischen DM Zugriffe je Vorgang Ausleihe speichern : 4 Zugriffe/Leihe 3 3 Zugriffe/Leihe 2 CD Leihe Video Zugriffe/Leihe 1 1 Zugriffe/Leihe Kunde 5.000? Reihenfolge-Position im Vorgang 54

55 Grundlagen der physischen DM Max. Anzahl Zugriffe je Periode (Stunde) bei Vorgang Ausleihe speichern? (10 Kunden) 40 Zugriffe/Std 3 30 Zugriffe/Std 2 CD Leihe Video Zugriffe/Std Zugriffe/Std Kunde 5.000? Reihenfolge-Position im Vorgang 55

56 Grundlagen der physischen DM Max. Anzahl Zugriffe je Periode (Stunde) alle Vorgänge? 56

57 Grundlagen der physischen DM Unterscheidung der Art des Zugriffs: Lesen Einfügen Ändern Löschen 57

58 Dateiorganisation Dateiorganisation: Physische Organisation der Datenspeicherung Auch Datenbanken speichern die Relationen bzw. Tupel auf ein sekundäres Speichermedium, in der Regel in eine Datei auf einer Festplatte 58

59 Dateiorganisation Verarbeitungsformen von Daten Operationen zur Speicherung, Nutzung und Verwaltung von Daten 59

60 Dateiorganisation Kriterien: 1. Zugriffsgeschwindigkeit 2. Effiziente Verwendung des Speicherplatzes 3. Minimaler Reorganisationsaufwand 4. Eignung bei steigendem Datenvolumen 5. Schutz vor unautorisiertem Zugriff 60

61 Dateiorganisation Primärspeicher: Hauptspeicher, Arbeitsspeicher Enthält alle Programme des DBMS und gepufferte Daten. I. d. R. flüchtig (RAM) Direkt adressierbar Feine Granularität: Zugriffseinheit ist eine Speicherzelle Alle Datenbankoperationen werden direkt im Arbeitsspeicher durchgeführt Größe i.d.r. im Megabyte- bis Gigabyte-Bereich Zugriffszeit: einige Nanosekunden 61

62 Dateiorganisation Datenbankpuffer: Die Daten werden vor ihrer Verarbeitung in einen bestimmten Bereich des Arbeitsspeichers, den Datenbankpuffer, geladen Nach der Verarbeitung verbleiben die Daten im Datenbankpuffer Der Datenbankpuffer ist in Seiten, den Pufferrahmen, eingeteilt, die jeweils aus mehreren Festplatten-Blöcken bestehen Sind alle Seiten des Datenbankpuffers voll, werden bestehende Seiten ersetzt und evtl. auf Festplatte gesichert 62

63 Dateiorganisation Sekundäre Speichermedien: Sequentielle Speichermedien, z. B. Magnetbänder: die Daten werden sequentiell, d. h. nacheinander abgespeichert (meist Archivspeicher) Direkt adressierbare Speichermedien, z. B. Festplatten: eine Speichereinheit (z. B. Speicherblock mit 1024 Byte) besitzt eine eigene Adresse Kapazität im Gigabyte-Bereich Zugriffszeit: Einige Millisekunden 63

64 Dateiorganisation Verarbeitungszeit und kosten hängen ab von der Anzahl der gerätetechnischen Zugriffe, der Daten-Übertragungskapazität vom externen zum internen Speicher, der zu speichernden Datenmenge auf dem externen Speicher. 64

65 Dateiorganisation Speicherung von Relationen auf Festplatte: Relation = Datei Datei enthält viele Datenbankseiten Seite verteilt sich auf mehrere Blöcke Je Seite werden die Datensätze (Tupel) so abgespeichert, dass eine Seitengrenze nicht überschritten wird Seite enthält Datensatztabelle: Verweise auf die in der Seite enthaltenen Tupel 65

66 Dateiorganisation Zugriffsformen: Die für ein Speichermedium zulässigen Zugriffsformen sind von der Hardware abhängig: Direkter Zugriff: über die Adresse Indirekter Zugriff: die Adresse wird über einen Schlüssel bestimmt Sequentieller Zugriff: die Daten werden der Reihe nach gelesen, bis die gesuchten Daten gefunden wurden 66

67 Dateiorganisation Primäre Organisationsformen Primäre Organisationsformen: Sequentielle Organisationsform Index-Sequentielle Organisationsform Reine Index-Organisationsform Direkte Organisationsform 67

68 Dateiorganisation Primäre Organisationsformen Sequentielle Dateiorganisation 68

69 Dateiorganisation Primäre Organisationsformen Sequentielle Dateiorganisation 69

70 Dateiorganisation Primäre Organisationsformen Indizierte Dateiorganisation 70

71 Dateiorganisation Primäre Organisationsformen Sequentielle Organisationsform: - die Daten werden der Reihe nach gelesen, bis die gesuchten Daten gefunden wurden. - kein direkter Zugriff auf Sätze möglich - ausreichend für Batch-Verarbeitung (gleichzeitige Benötigung vieler Sätze) - völlig ungeeignet für Dialogverarbeitung (schneller gezielter Zugriff auf einzelne Sätze) 71

72 Dateiorganisation Primäre Organisationsformen Sequentielle Organisationsform: Von Bedeutung für Sicherungskopien Protokolldateien (Logfile) 72

73 Dateiorganisation Primäre Organisationsformen Index-Sequentielle Organisationsform: häufige Verwendung in DBMS einfache Struktur direkter Zugriff auf einzelne Datensätze über Datensätze innerhalb eines Blocks sind nach Schlüsseln geordnet Problem: nachträglich einzufügende Sätze 73

74 Dateiorganisation Primäre Organisationsformen Index-Sequentielle Organisationsform Viele DBMS verzichten auf sequentielle Komponente Satzschlüssel ist eine von System vorgegebene interne Satznummer Index gibt Auskunft: In welchen Block befindet sich ein Satz mit bestimmten Schüssel vollständiger Index 74

75 Dateiorganisation Primäre Organisationsformen Index-Sequentielle Organisationsform 75

76 Dateiorganisation Primäre Organisationsformen Direkte Organisationsform Zuordnung eines Schlüssels wird über einen Algorithmus (Schlüsseltransformation) gelöst Beschreibung über sog. Hash-Funktion sehr schnelle Methode, kann im internen Speicher erfolgen häufigste Funktion: Divisionsrestverfahren Block Adresse(s) = s modulo n mit n=anzahl der Blöcke, s=schlüssel 76

77 Dateiorganisation Primäre Organisationsformen Suchverfahren: Sukzessives oder sequentielles Suchen: der Reihe nach Binäres Suchen: Aufteilung der Datei in jeweils zwei Hälften, bis Datensatz gefunden n-wege-suchen: mehrstufiges Suchen, erst wird der Block gesucht, dann der Datensatz innerhalb des Blocks (beliebig erweiterbar) Indirektes Suchen: über eine Indexdatei Algorithmisches Suchen: Berechnung der Adresse über einen Hash- Algorithmus 77

78 Dateiorganisation Primäre Organisationsformen Indizierte Dateiorganisation: Bei indizierter Organisation einer Datei... werden die Datensätze sequentiell, im allgemeinen in chronologischer Reihenfolge, unter fortlaufenden Adressen gespeichert. Suchschlüssel und Adresse werden in einer Indexdatei (Index) gespeichert. Über diese Indexdatei wird dann indirekt gesucht. Quelle: Schwarze 78

79 Dateiorganisation Sekundäre Organisationsformen Arten der Sekundärorganisation Listenorganisation Invertierte Liste Indizes 79

80 Dateiorganisation Sekundäre Organisationsformen Listenorganisation Verkettung zusammengehöriger Sätze sortierte Listen unsortierte Listen Anfang der Liste steht in einem sog. Anker Hinter der Attributsausprägung steht nur die Adresse des ersten Satzes Information zum nächsten Satz in Form eines Zeigers mit den Daten in einem Zeigerfeld 80

81 Dateiorganisation Sekundäre Organisationsformen Listenorganisation 81

82 Dateiorganisation Sekundäre Organisationsformen Invertierte Listen: Ein Index für einen Sekundärschlüssel enthält nicht die Adresse des Datensatzes, sondern einen Verweis auf den Primärschlüssel Über den Primärschlüssel kann dann auf den Datensatz zugegriffen werden. Mehrstufiges Suchen 82

83 Dateiorganisation Sekundäre Organisationsformen Invertierte Listen:

84 Indexe Beschleunigung des Suchvorgangs durch einen Index: Indexdatei ist kleiner als Originaldatei Indexdatei ist sortiert (Relation nicht) Teile des Index können im Hauptspeicher gehalten werden (der Hauptspeicher ist um ein Vielfaches (Faktor: 10 5 ) schneller als eine Festplatte) 84

85 Indexe Indexformen: Physisch sortierter Index (Updates!) Logisch sortierter Index (Kette): die Reihenfolge der Indexeinträge wird über Zeiger (Pointer) realisiert (nur sequentielle Suche) Logisch sortierter Index (Baum): sehr schnell 85

86 Indexe Bäume: Bäume (trees) sind die am häufigsten eingesetzte Struktur für Indexdateien Wurzel (Level 0), Knoten, Blatt, Vater, Kind, Bruder Ein Knoten enthält Verweise (Pointer) auf jedes seiner Kinder 86

87 Indexe Erwünschte Eigenschaften von Bäumen: Einheitliche Zugriffszeit (z. B. durch einheitlichen Abstand aller Blätter von der Wurzel) Hoher Verzweigungsgrad (viele Kinder) Geringe Tiefe bzw. Höhe (wenige Levels) 87

88 Indexe B-Bäume (Balanced Trees oder Bayer-Baum): Häufigste Indexstruktur Alle Blätter haben den gleichen Abstand zur Wurzel Ein Knoten entspricht einer Datenbankseite Ein Knoten enthält den Schlüssel, den Datensatz, einen Verweis auf Knoten mit kleineren Schlüsseln und einen Verweis auf Knoten mit größeren Schlüsseln 88

89 Indexe B-Bäume (Balanced Trees): Quelle: Kemper/Eickler 89

90 Indexe Einfügen von Schlüsseln: Einfügen von Datensatz mit Schlüssel 17 Der Knoten ist voll, der mittlere Knoten wird nach oben geschoben, der volle Knoten wird geteilt 90

91 Indexe Einfügen von Schlüssel 17: Quelle: Kemper/Eickler 91

92 Indexe Einfügen von Schlüssel 17: Quelle: Kemper/Eickler 92

93 Indexe Löschen von Schlüsseln: Schlüssel in Blattknoten können einfach gelöscht werden Bei inneren Knoten: der nächstgrößere (nächstkleinere) Schlüssel wird an die Stelle des gelöschten Schlüssel verschoben Bei Unterbesetzung von Knoten: evtl. Ausgleich oder Verschmelzen 93

94 Indexe Löschen von Schlüssel 7: Quelle: Kemper/Eickler 94

95 Indexe Löschen von Schlüssel 7: Quelle: Kemper/Eickler 95

96 Indexe Verzweigungsgrad bei B-Bäumen: Je mehr Verzweigungen ein Baum hat, desto flacher ist er (weniger Seitenzugriffe!) Je größer die einzelnen Datensätze sind, desto weniger Verzweigungen sind möglich Reale B-Bäume: ca. 100 Verzweigungen 96

97 Indexe B + -Bäume: Bei B + -Bäumen werden die Datensätze nur noch in den Blättern gespeichert, d. h. außerhalb des Index (es sind viel mehr Verzweigungen möglich!) In den inneren Knoten werden Referenzschlüssel gespeichert Die Blattknoten enthalten Zeiger auf den vorhergehenden und nachfolgenden Datensatz (ermöglicht sequentielle Suche) 97

98 Indexe B + -Bäume: Effizientere Verwaltung der Struktur Es können mehrere B + -Bäume für eine Relation erzeugt werden Die Blattknoten sind sortiert Für Bereichsanfragen wird der erste passende Wert gesucht. Anschließend kann sequentiell gelesen werden, bis der Bereich verlassen wird 98

99 Indexe Einsatz von Indexen: Bewusste Auswahl der Attribute, für die ein Index erzeugt werden soll Höhere Performanz für Abfragen Reduzierte Performanz für Einfügen, Löschen und Änderungen von Datensätzen Data Warehouse: viele Indexe Operative Systeme: wenige Indexe 99

100 Indexe Einsatz von Indexen: Primärschlüsselindex: CREATE UNIQUE INDEX eindeutiger Index Sekundärschlüsselindex: CREATE INDEX nicht-eindeutiger Index 100

101 Indexe Einsatz von Indexen: Primärschlüssel sollte einen eindeutigen Index haben Fremdschlüssel sollten einen nicht-eindeutigen Index haben (beschleunigt Joins) Attribute, die häufig in Abfragen, Sortiervorgängen und Gruppierungen verwendet werden, sollten ebenfalls einen nichteindeutigen Index bekommen 101

Das relationale Datenmodell

Das relationale Datenmodell Das relationale Datenmodell Konzepte Attribute, Relationenschemata, Datenbank-Schemata Konsistenzbedingungen Beispiel-Datenbank Seite 1 Einführung Zweck datenmäßige Darstellung von Objekten und Beziehungen

Mehr

Datenorganisation. Februar bis Mai Dipl.-Oek. Patrick Bartels Institut für Wirtschaftsinformatik Universität Hannover

Datenorganisation. Februar bis Mai Dipl.-Oek. Patrick Bartels Institut für Wirtschaftsinformatik Universität Hannover Datenorganisation Februar bis Mai 2007 Dipl.-Oek. Patrick Bartels Institut für Wirtschaftsinformatik Universität Hannover Telefon: +49 (0) 511 762-4979 +49 (0) 170 342 84 95 Email: bartels@iwi.uni-hannover.de

Mehr

Datenstrukturen. Dortmund, Oktober 1998

Datenstrukturen. Dortmund, Oktober 1998 Datenstrukturen Dortmund, Oktober 1998 Prof. Dr. Heinz-Michael Winkels, Fachbereich Wirtschaft FH Dortmund Emil-Figge-Str. 44, D44227-Dortmund, TEL.: (0231)755-4966, FAX: (0231)755-4902 1 Inhalt Seite

Mehr

Anwendungsentwicklung Datenbanken Datenbankentwurf. Stefan Goebel

Anwendungsentwicklung Datenbanken Datenbankentwurf. Stefan Goebel Anwendungsentwicklung Datenbanken Datenbankentwurf Stefan Goebel Warum eine Datenbank? Nutzung von gleichen Daten durch viele Anwender auch an unterschiedliche Orten Daten können mit unterschiedlicher

Mehr

Datenbanken: Indexe. Motivation und Konzepte

Datenbanken: Indexe. Motivation und Konzepte Datenbanken: Indexe Motivation und Konzepte Motivation Warum sind Indexstrukturen überhaupt wünschenswert? Bei Anfrageverarbeitung werden Tupel aller beteiligter Relationen nacheinander in den Hauptspeicher

Mehr

Dieser Foliensatz darf frei verwendet werden unter der Bedingung, dass diese Titelfolie nicht entfernt wird.

Dieser Foliensatz darf frei verwendet werden unter der Bedingung, dass diese Titelfolie nicht entfernt wird. Thomas Studer Relationale Datenbanken: Von den theoretischen Grundlagen zu Anwendungen mit PostgreSQL Springer, 2016 ISBN 978-3-662-46570-7 Dieser Foliensatz darf frei verwendet werden unter der Bedingung,

Mehr

Folien zum Textbuch. Kapitel 2: Planung, Entwicklung und Betrieb von IS. Teil 3: Modellierung von betrieblichen Informationssystemen

Folien zum Textbuch. Kapitel 2: Planung, Entwicklung und Betrieb von IS. Teil 3: Modellierung von betrieblichen Informationssystemen Folien zum Textbuch Kapitel 2: Planung, Entwicklung und Betrieb von IS Teil 3: Modellierung von betrieblichen Informationssystemen Textbuch-Seiten 185-208 WI Planung, Entwicklung und Betrieb von IS IS-Modellierung

Mehr

Kapitel 1: Wiederholungsfragen Grundlagen DBS

Kapitel 1: Wiederholungsfragen Grundlagen DBS Grundlagen DBS 1. Welche zentralen Anforderungen an ein DBS definierte Edgar Codd? 2. Was ist eine Transaktion? 3. Welche Eigenschaften muss das DBMS bei der Transaktionsverarbeitung sicherstellen? 4.

Mehr

ER-Modell, Normalisierung

ER-Modell, Normalisierung ER-Modell Mit dem Entity-Relationship-Modell kann die grundlegende Tabellen- und Beziehungsstruktur einer Datenbank strukturiert entworfen und visualisiert werden. Das fertige ER-Modell kann dann ganz

Mehr

Als Datenbanksystem wird ein Datenbankverwaltungssystem zusammen mit einer oder mehrerer Datenbanken bezeichnet.

Als Datenbanksystem wird ein Datenbankverwaltungssystem zusammen mit einer oder mehrerer Datenbanken bezeichnet. Datenbankverwaltungssystem (DBVS/DBMS) Ein Datenbankverwaltungssystem (DBVS, data base management system : DBMS) ist die Gesamtheit aller Programme (Ressourcen) zur Erzeugung, Verwaltung (einschl. Daten-

Mehr

PD Dr.-Ing. F. Lobeck. Seite 6

PD Dr.-Ing. F. Lobeck. Seite 6 Seite 6 Datenbanken Datenbank: Eine geordnete Menge von Daten. Speicherung erfolgt unabhängig von speziellen Anwenderprogrammen. Ebenso sollte die Hardwareunabhängigkeit gesichert werden. Zu einem Datenbankmanagementsystem

Mehr

ADS: Algorithmen und Datenstrukturen

ADS: Algorithmen und Datenstrukturen ADS: Algorithmen und Datenstrukturen Teil X Peter F. Stadler & Konstantin Klemm Bioinformatics Group, Dept. of Computer Science & Interdisciplinary Center for Bioinformatics, University of Leipzig 13.

Mehr

5. Relationale Entwurfstheorie

5. Relationale Entwurfstheorie 5 Relationale Entwurfstheorie Motivation Konzeptuelles Modell (ERM) kann in ein relationales Schema mit möglichst wenigen Relationen übersetzt werden (vgl Kapitel 4) Welche Eigenschaften hat ein gutes

Mehr

Einführung in die Informatik II

Einführung in die Informatik II Einführung in die Informatik II Relationale Datenbanken und SQL Theorie und Anwendung Prof. Dr. Nikolaus Wulff Gründe für eine Datenbank Meist werden Daten nicht in XML-Dokumenten, sondern innerhalb einer

Mehr

Die Bestellungen eines Schreibwarengeschäftes sollen auf eine aktuelle Form mit Hilfe einer zeitgemäßen Datenbank umgestellt werden.

Die Bestellungen eines Schreibwarengeschäftes sollen auf eine aktuelle Form mit Hilfe einer zeitgemäßen Datenbank umgestellt werden. Die Bestellungen eines Schreibwarengeschäftes sollen auf eine aktuelle Form mit Hilfe einer zeitgemäßen Datenbank umgestellt werden. Die nachfolgende Tabellenform, eine sogenannte Nullform muss in eine

Mehr

Relationale Datenbanken

Relationale Datenbanken Ramon A. Mata-Toledo, Pauline K. Cushman Relationale Datenbanken Schaum's Repetitorien Übersetzung aus dem Amerikanischen von G&U Technische Dokumentation GmbH Z Die Autoren 9 Vorwort 9 1 Ein Überblick

Mehr

Zusatzskript Datenmanagement: physische Strukturen B+- und B*-Baum B+-Baum

Zusatzskript Datenmanagement: physische Strukturen B+- und B*-Baum B+-Baum Seite 1 Zusatzskript Datenmanagement: physische Strukturen B+- und B*-Baum B+-Baum Bild-1 Dargestellt ist die Speicherung der Personentabelle als B+-Baum anhand der Personen-Nummer (PersNr). Die Blattebene

Mehr

ARIS II - Modellierungsmethoden, Metamodelle und Anwendungen

ARIS II - Modellierungsmethoden, Metamodelle und Anwendungen ARIS II - Modellierungsmethoden, Metamodelle und Anwendungen C2: Relationenbildung und Normalisierung Lernziele: Nach der Bearbeitung dieser Lektion haben Sie folgende Kenntnisse erworben: Sie können den

Mehr

Informatik 10 Mar Datenbanken: RDM Normalisierung April 2014

Informatik 10 Mar Datenbanken: RDM Normalisierung April 2014 Normalisierung Eine Datenbank gilt als konsistent, wenn sie bestimmten Kriterien, den sog. Integritätsbedingungen genügt. Die Integritätsbedingungen sollen also dafür sorgen, dass keine unkorrekten Daten

Mehr

Rückblick: Relationales Modell

Rückblick: Relationales Modell Rückblick: Relationales Modell Relationales Modell als vorherrschendes Datenmodell Relationen (Tabellen) besitzen Attribute (Spalten) mit Wertebereichen und beinhalten Tupel (Zeilen) Umsetzung eines konzeptuellen

Mehr

Algorithmen und Datenstrukturen 1

Algorithmen und Datenstrukturen 1 Algorithmen und Datenstrukturen 1 10. Vorlesung Peter F. Stadler Universität Leipzig Institut für Informatik studla@bioinf.uni-leipzig.de Suchverfahren für große Datenmengen bisher betrachtete Datenstrukturen

Mehr

Mehrwegbäume Motivation

Mehrwegbäume Motivation Mehrwegbäume Motivation Wir haben gute Strukturen (AVL-Bäume) kennen gelernt, die die Anzahl der Operationen begrenzen Was ist, wenn der Baum zu groß für den Hauptspeicher ist? Externe Datenspeicherung

Mehr

D1: Relationale Datenstrukturen (14)

D1: Relationale Datenstrukturen (14) D1: Relationale Datenstrukturen (14) Die Schüler entwickeln ein Verständnis dafür, dass zum Verwalten größerer Datenmengen die bisherigen Werkzeuge nicht ausreichen. Dabei erlernen sie die Grundbegriffe

Mehr

3. Das Relationale Datenmodell

3. Das Relationale Datenmodell ! " # $ # $ % # $ 3. Das Relationale Datenmodell 1. Datenstruktur und Integritätsbedingungen 2. Abbildung zwischen ERM und RDM 3. Implementierung in SQL 4. Anomalien und Normalformen des RDM 5. Relationenalgebra

Mehr

Grundlagen von Datenbanken. B-Bäume, B*-Bäume Normalisierung

Grundlagen von Datenbanken. B-Bäume, B*-Bäume Normalisierung Grundlagen von Datenbanken B-Bäume, B*-Bäume Normalisierung B-Bäume Definition: Seien k, h ganze Zahlen, h > 0, k > 0. Ein B-Baum B der Klasse τ(k,h) ist entweder ein leerer Baum oder ein geordneter Suchbaum

Mehr

Eigenschaften von Datenbanken, insbesondere

Eigenschaften von Datenbanken, insbesondere Eigenschaften von Datenbanken In diesem Abschnitt beschreiben wir wünschenswerte Eigenschaften von Datenbanken, insbesondere Relationenschemata: Normalformen, die auf mathematischen Modellen beruhen und

Mehr

Datenbanken. Interne Datenorganisation:

Datenbanken. Interne Datenorganisation: Interne Datenorganisation: Bisher: Konzeptionelle Betrachtungen einer Datenbank aus Sicht der Anwendung: Modellierung, Normalisieren, Sprache zum Einfügen, Ändern, Löschen, Lesen Jetzt: Betrachtung der

Mehr

Rückblick: Pufferverwaltung

Rückblick: Pufferverwaltung Rückblick: Pufferverwaltung Datenbankpuffer zum Schließen der Zugriffslücke zwischen Primär- und Sekundärspeicher Ersetzungsstrategien berücksichtigen Zeitpunkte und/oder Anzahl der Zugriffe auf bestimmte

Mehr

Entwicklung der Datenbanksysteme

Entwicklung der Datenbanksysteme Entwicklung der Datenbanksysteme Die Entwicklung der Datenbanksysteme ist eng an die der Hardware gekoppelt und wird wie jene in Generationen eingeteilt: 1. Generation: In den fünfziger Jahren waren die

Mehr

Entwurf von Relationalen Datenbanken (1) (mit dem Entity-Relationship-Modell)

Entwurf von Relationalen Datenbanken (1) (mit dem Entity-Relationship-Modell) In der Regel werden Diskursbereiche durch mehrere Relationen (Tabellen) abgebildet. Ziele: Entwurf von Relationalen Datenbanken (1) (mit dem Entity-Relationship-Modell) Vermeiden von Redundanz in Relationen

Mehr

Organisationsformen der Speicherstrukturen

Organisationsformen der Speicherstrukturen Organisationsformen der Speicherstrukturen Bäume und Hashing 1 Motivation Ablage von Daten soll einfachen, schnellen und inhaltsbezogenen Zugriff ermöglichen (z.b. Zeige alle Schüler des Lehrers X am heutigen

Mehr

TU München, Fakultät für Informatik Lehrstuhl III: Datenbanksysteme Prof. Dr. Thomas Neumann

TU München, Fakultät für Informatik Lehrstuhl III: Datenbanksysteme Prof. Dr. Thomas Neumann TU München, Fakultät für Informatik Lehrstuhl III: Datenbanksysteme Prof. Dr. Thomas Neumann Blatt Nr. 9 Übung zur Vorlesung Grundlagen: Datenbanken im WS4/5 Harald Lang (harald.lang@in.tum.de) http://www-db.in.tum.de/teaching/ws45/grundlagen/

Mehr

Dynamische Datenstrukturen

Dynamische Datenstrukturen Dynamische Datenstrukturen B-Bäume größere Datenmengen verwalten Extern speichern Art der Speicherung berücksichtigen sonst kein optimaler Datenzugriff möglich Art der Speicherung großer Datenmengen Magnetplatten

Mehr

technische universität dortmund Fakultät für Informatik LS 8 Speichern von Daten Prof. Dr. Katharina Morik

technische universität dortmund Fakultät für Informatik LS 8 Speichern von Daten Prof. Dr. Katharina Morik Speichern von Daten Prof. Dr. Katharina Morik Unterschiede von DBMS und files! DBMS unterstützt viele Benutzer, die gleichzeitig auf dieselben Daten zugreifen concurrency control.! DBMS speichert mehr

Mehr

Kapitel DB:IV (Fortsetzung)

Kapitel DB:IV (Fortsetzung) Kapitel DB:IV (Fortsetzung) IV. Logischer Datenbankentwurf mit dem relationalen Modell Das relationale Modell Integritätsbedingungen Umsetzung ER-Schema in relationales Schema DB:IV-46 Relational Design

Mehr

3. Relationales Modell & Algebra

3. Relationales Modell & Algebra 3. Relationales Modell & Algebra Inhalt 3.1 Relationales Modell Wie können wir Daten mathematisch formal darstellen? 3.2 Übersetzung eines konzeptuellen Modells Wie können wir ein konzeptuelles Modell

Mehr

3. Grundlagen relationaler Datenbanksysteme

3. Grundlagen relationaler Datenbanksysteme 3. Grundlagen relationaler Datenbanksysteme Hier nur kurze Rekapitulation, bei Bedarf nachlesen 3.1 Basiskonzepte des Relationenmodells 1 Darstellung der Miniwelt in Tabellenform (DB = Menge von Relationen

Mehr

Medizininformatik Software Engineering

Medizininformatik Software Engineering Vorlesung Software Engineering Inhaltsverzeichnis 1. Einleitung 2. Software und Medizinprodukt 3. Vorgehensmodelle 4. Strukturierter Entwurf von Echtzeitsystemen 4.1 Echzeit, was ist das? 4.2 Einführung

Mehr

Dateiorganisation und Zugriffsstrukturen. Prof. Dr. T. Kudraß 1

Dateiorganisation und Zugriffsstrukturen. Prof. Dr. T. Kudraß 1 Dateiorganisation und Zugriffsstrukturen Prof. Dr. T. Kudraß 1 Mögliche Dateiorganisationen Viele Alternativen existieren, jede geeignet für bestimmte Situation (oder auch nicht) Heap-Dateien: Geeignet

Mehr

Normalisierung So wahr mir Codd helfe

Normalisierung So wahr mir Codd helfe Normalisierung So wahr mir Codd helfe 1999-09-22 Joachim Röhl 1999 1 Ziel der Normalisierung: Erstellung eines realitätsgetreuen und transparenten Datenmodells, das Abfrage-, Lösch- und Änderungsoperationen

Mehr

Indizes. Index. Datenfeld Normale Tabelle. Gesucht wird: Zugriff. 3. Zugriff 1. Zugriff.

Indizes. Index. Datenfeld Normale Tabelle. Gesucht wird: Zugriff. 3. Zugriff 1. Zugriff. Indizes Gesucht wird: 44791 Index Normale Tabelle 1. Zugriff 1 44789 2. Zugriff 2 44801 3. Zugriff 3 44797 4. Zugriff 4 44388 5. Zugriff 5 44746 6. Zugriff 6 44787 7. Zugriff 7 44793 8. Zugriff 8 44799

Mehr

Datenbanken Vertiefung Wintersemester 2013/ Matrikelnummer: Hinweise. Unterschrift

Datenbanken Vertiefung Wintersemester 2013/ Matrikelnummer: Hinweise. Unterschrift Fachbereich für Computerwissenschaften Prof. Dr. Nikolaus Augsten Jakob-Haringer-Str. 2 5020 Salzburg, Austria Telefon: +43 662 8044 6347 E-Mail: nikolaus.augsten@sbg.ac.at Datenbanken Vertiefung Prüfung

Mehr

d.h. zu Definitions-Stelle eindeutiger Funktionswert x X! y Y : (x,y) f umgekehrt: (x 1,y), (x 2,y) f ist o.k. X Y f(x) = y

d.h. zu Definitions-Stelle eindeutiger Funktionswert x X! y Y : (x,y) f umgekehrt: (x 1,y), (x 2,y) f ist o.k. X Y f(x) = y Kapitel 7 Normalformen und DB-Entwurf Kap. 7.1 Normalformen Theorie Funktionale Abhängigkeit: f X Y f als Relation, d.h. Menge von Paaren {(x,y)} x: Definitions-Stelle, y: Funktionswert f ist Funktion

Mehr

Relationale Datenbanken

Relationale Datenbanken Relationale Datenbanken Problemstellung: Dateninkonsistenz und -redundanz Datenredundanz Informationsduplikate verschwenden Platz Dateninkonsistenz Informationsduplikate verschwenden Platz Lösung: Zerlegung

Mehr

Wiederholung VU Datenmodellierung

Wiederholung VU Datenmodellierung Wiederholung VU Datenmodellierung VL Datenbanksysteme Reinhard Pichler Arbeitsbereich Datenbanken und Artificial Intelligence Institut für Informationssysteme Technische Universität Wien Wintersemester

Mehr

Suchbäume. Suchbäume. Einfügen in Binären Suchbäumen. Suchen in Binären Suchbäumen. Prinzip Suchbaum. Algorithmen und Datenstrukturen

Suchbäume. Suchbäume. Einfügen in Binären Suchbäumen. Suchen in Binären Suchbäumen. Prinzip Suchbaum. Algorithmen und Datenstrukturen Suchbäume Suchbäume Prinzip Suchbaum Der Wert eines Knotens wird als Schlüssel verstanden Knoten kann auch weitere Daten enthalten, die aber hier nicht weiter betrachtet werden Werte der Schlüssel müssen

Mehr

Matthias Schubert. Datenbanken. Theorie, Entwurf und Programmierung relationaler Datenbanken. 2., überarbeitete Auflage. Teubner

Matthias Schubert. Datenbanken. Theorie, Entwurf und Programmierung relationaler Datenbanken. 2., überarbeitete Auflage. Teubner Matthias Schubert Datenbanken Theorie, Entwurf und Programmierung relationaler Datenbanken 2., überarbeitete Auflage m Teubner Inhalt Wichtiger Hinweis 12 Vorwort 13 Wer sollte dieses Buch lesen? 13 Noch

Mehr

Wiederholung VU Datenmodellierung

Wiederholung VU Datenmodellierung Wiederholung VU Datenmodellierung VU Datenbanksysteme Reinhard Pichler Arbeitsbereich Datenbanken und Artificial Intelligence Institut für Informationssysteme Technische Universität Wien Wintersemester

Mehr

Datenbanken Grundlagen und Design

Datenbanken Grundlagen und Design Frank Geisler Datenbanken Grundlagen und Design 3., aktualisierte und erweiterte Auflage mitp Vorwort 15 Teil I Grundlagen 19 i Einführung in das Thema Datenbanken 21 i.i Warum ist Datenbankdesign wichtig?

Mehr

4. Normalisierung von Relationenschemata

4. Normalisierung von Relationenschemata 4. Normalisierung von Relationenschemata Ziel: Vermeidung von Anomalien in Relationenschemata wird erreicht durch systematische Vorgehensweise beim Datenentwurf vom eerm zum Relationalen Modell (s. voriges

Mehr

Abhängigkeiten und Normalisierung

Abhängigkeiten und Normalisierung Abhängigkeiten und Abhängigkeiten als Ursachen für Inkonsistenzen Der sprozess Normalformen (1NF, 2NF, 3NF) Seite 1 Abhängigkeiten Funktionale Abhängigkeit Ein Attribut bzw. eine Attributkombination A

Mehr

B / B* - Bäume. Guido Hildebrandt Seminar Datenbanksysteme

B / B* - Bäume. Guido Hildebrandt Seminar Datenbanksysteme B / B* - Bäume Guido Hildebrandt Seminar Datenbanksysteme 25.11.2010 Gliederung Einleitung Binärbaum B - Baum B* - Baum Varianten Zusammenfassung Quellen Gliederung Einleitung Binärbaum B - Baum B* - Baum

Mehr

GRUNDLAGEN VON INFORMATIONSSYSTEMEN INDEXSTRUKTUREN I: B-BÄUME UND IHRE VARIANTEN

GRUNDLAGEN VON INFORMATIONSSYSTEMEN INDEXSTRUKTUREN I: B-BÄUME UND IHRE VARIANTEN Informationssysteme - Indexstrukturen I: B-Bäume und ihre Varianten Seite 1 GRUNDLAGEN VON INFORMATIONSSYSTEMEN INDEXSTRUKTUREN I: B-BÄUME UND IHRE VARIANTEN Leiter des Proseminars: Dr.Thomas Bode Verfasser

Mehr

Wintersemester 2016/ Matrikelnummer: Hinweise. Unterschrift

Wintersemester 2016/ Matrikelnummer: Hinweise. Unterschrift Fachbereich für Computerwissenschaften Prof. Dr. Nikolaus Augsten Jakob-Haringer-Str. 2 5020 Salzburg, Austria Telefon: +43 662 8044 6347 E-Mail: nikolaus.augsten@sbg.ac.at Datenbanken II Prüfung Wintersemester

Mehr

Inhaltsverzeichnis Vorwort zur vierten Auflage Vorwort zur dritten Auflage Vorwort zur zweiten Auflage Vorwort zur ersten Auflage Hinweise zur CD

Inhaltsverzeichnis Vorwort zur vierten Auflage Vorwort zur dritten Auflage Vorwort zur zweiten Auflage Vorwort zur ersten Auflage Hinweise zur CD Vorwort zur vierten Auflage 11 Vorwort zur dritten Auflage 13 Vorwort zur zweiten Auflage 15 Vorwort zur ersten Auflage 17 Hinweise zur CD 19 1 Datenbanken und Datenbanksysteme 21 1.1 Zentralisierung der

Mehr

Datenorganisation. Aufgaben der Datenorganisation: Effizientes Verwalten von Daten, also

Datenorganisation. Aufgaben der Datenorganisation: Effizientes Verwalten von Daten, also Aufgaben der Datenorganisation: Effizientes Verwalten von Daten, also Datenorganisation Daten müssen sicher aufbewahrt werden Daten müssen wieder auffindbar sein Daten müssen schnell zugreifbar sein Problem:

Mehr

4. Normalformen. Qualitätsanforderungen an Tabellen. Klassische Normalformen (1,. 2., 3.) Spezielle Normalformen

4. Normalformen. Qualitätsanforderungen an Tabellen. Klassische Normalformen (1,. 2., 3.) Spezielle Normalformen 4. Normalformen Qualitätsanforderungen an Tabellen Klassische Normalformen (1,. 2., 3.) Spezielle Normalformen 79 Normalisierungsgründe Verständlicheres Datenmodell für Anwender und Entwickler Vermeidung

Mehr

Inhaltsverzeichnis. Lothar Piepmeyer. Grundkurs Datenbanksysteme. Von den Konzepten bis zur Anwendungsentwicklung ISBN:

Inhaltsverzeichnis. Lothar Piepmeyer. Grundkurs Datenbanksysteme. Von den Konzepten bis zur Anwendungsentwicklung ISBN: Lothar Piepmeyer Grundkurs Datenbanksysteme Von den Konzepten bis zur Anwendungsentwicklung ISBN: 978-3-446-42354-1 Weitere Informationen oder Bestellungen unter http://www.hanser.de/978-3-446-42354-1

Mehr

E-R-Modell zu Relationenschema

E-R-Modell zu Relationenschema Raum: LF 230 Nächste Sitzung: 27./30. Oktober 2003 Aktuelle Informationen unter: http://www.is.informatik.uni-duisburg.de/teaching/lectures/dbp_ws03/index.html E-R-Modell zu Relationenschema Als zweiter

Mehr

Das relationale Modell (Teil 1)

Das relationale Modell (Teil 1) Vorlesung #2 Das relationale Modell (Teil 1) Fahrplan WS 2010/11 Feedback Vorlesung#1 Das relationale Modell Einordnung (wir überspringen die Modellierung, das kommt im 4. Semester Datenmanagement ) Definition,

Mehr

Datenbanken. Seminararbeit. Einführung in das wissenschaftliche Arbeiten

Datenbanken. Seminararbeit. Einführung in das wissenschaftliche Arbeiten Seminararbeit vorgelegt von: Gutachter: Studienbereich: Christian Lechner Dr. Georg Moser Informatik Datum: 6. Juni 2013 Inhaltsverzeichnis Inhaltsverzeichnis 1 Einführung in Datenbanken 1 1.1 Motivation....................................

Mehr

Theorie zur Übung 8 Datenbanken

Theorie zur Übung 8 Datenbanken Theorie zur Übung 8 Datenbanken Relationale Datenbanksysteme Ein relationales Datenbanksystem (RDBS) liegt vor, wenn dem DBS ein relationales Datenmodell zugrunde liegt. RDBS speichern Daten in Tabellenform:

Mehr

Angewandte Informatik Datenbank/Datenmodell 1

Angewandte Informatik Datenbank/Datenmodell 1 Angewandte Informatik Datenbank/Datenmodell 1 Übersicht Standardsoftware Textverarbeitung - Informationen "gestalten" durch * sprachliche Mittel * Hervorhebung bzw. Unterdrückung von Inhalten * Kombination

Mehr

Kapitel 11. Normalisierung

Kapitel 11. Normalisierung Kapitel 11 Normalisierung Ziel: Ziel und Idee der Normalisierung Anpassen an die Erfordernisse des Relationenmodells (1. Normalform) Vermeidung von Redundanz (weitere Normalformen) Keine Fehler (Anomalien)

Mehr

B*-BÄUME. Ein Index ist seinerseits wieder nichts anderes als eine Datei mit unpinned Records.

B*-BÄUME. Ein Index ist seinerseits wieder nichts anderes als eine Datei mit unpinned Records. B*-Bäume 1 B*-BÄUME Beobachtung: Ein Index ist seinerseits wieder nichts anderes als eine Datei mit unpinned Records. Es gibt keinen Grund, warum man nicht einen Index über einem Index haben sollte, und

Mehr

Wirtschaftsinformatik 7a: Datenbanken. Hochschule für Wirtschaft und Recht SS 16 Dozent: R. Witte

Wirtschaftsinformatik 7a: Datenbanken. Hochschule für Wirtschaft und Recht SS 16 Dozent: R. Witte Wirtschaftsinformatik 7a: Datenbanken Hochschule für Wirtschaft und Recht SS 16 Dozent: R. Witte Drei Gäste bezahlen nach einem gemeinsamen Abendessen eine Rechnung von 30 Euro, so dass jeder 10 Euro gibt.

Mehr

Logische Datenstrukturen

Logische Datenstrukturen Lineare Listen Stapel, Warteschlangen Binärbäume Seite 1 Lineare Liste Begriffe first Funktion: sequentielle Verkettung von Datensätzen Ordnungsprinzip: Schlüssel Begriffe: first - Anker, Wurzel; Adresse

Mehr

Rückblick: Datenbankentwurf

Rückblick: Datenbankentwurf Rückblick: Datenbankentwurf Entity-Relationship-Modell für konzeptuellen Entwurf Entitytypen (entity types) (z.b. Studenten) Beziehungstypen (relationships) (z.b. hören) Attribute beschreiben Gegenstände

Mehr

Grundlagen zu Datenbanken zu Beginn der Jgst. 13

Grundlagen zu Datenbanken zu Beginn der Jgst. 13 Grundlagen zu Datenbanken zu Beginn der Jgst. 13 Bereits bei der Planung einer Datenbank muss der Datenbankentwickler darauf achten, Nachteile für das spätere System zu vermeiden. Die Strukturen müssen

Mehr

Datenbanksysteme Übungsblatt 1

Datenbanksysteme Übungsblatt 1 Datenbanksysteme Übungsblatt 1 Sommersemester 2003 AIFB Institut für Angewandte Informatik und Formale Beschreibungsverfahren 1 Aufgabe 1a (1/2) Änderungsanomalie: Wenn eine Änderung nicht überall ordnungsgemäß

Mehr

Günther Vinek - Paul Frederick Rennert - A Min Tjoa. Datenmodellierung: Theorie und Praxis des Datenbankentwurfs

Günther Vinek - Paul Frederick Rennert - A Min Tjoa. Datenmodellierung: Theorie und Praxis des Datenbankentwurfs Günther Vinek - Paul Frederick Rennert - A Min Tjoa Datenmodellierung: Theorie und Praxis des Datenbankentwurfs Technische ftedsseirsie Darmstodt FACH&cREiCH INFOftMATiK BIBLIOTHEK lovenlor-nr Sachgebiete

Mehr

- Gewinnung neuer Informationen durch Berechnungen - Einsatz graphischer Mittel zur Präsentation / Visualisierung von Datenreihen

- Gewinnung neuer Informationen durch Berechnungen - Einsatz graphischer Mittel zur Präsentation / Visualisierung von Datenreihen Informatik Datenbank/Datenmodell 1 Übersicht Standardsoftware Textverarbeitung - Informationen "gestalten/darstellen" durch * sprachliche Mittel * Hervorhebung bzw. Unterdrückung von Inhalten * Kombination

Mehr

Datenbanken und SQL. Kapitel 3. Datenbankdesign Teil 1: Normalformen. Edwin Schicker: Datenbanken und SQL

Datenbanken und SQL. Kapitel 3. Datenbankdesign Teil 1: Normalformen. Edwin Schicker: Datenbanken und SQL Datenbanken und SQL Kapitel 3 Datenbankdesign Teil 1: Normalformen Datenbankdesign Normalformen 1. Normalform Funktionale Abhängigkeit 2. Normalform 3. Normalform nach Boyce und Codd 3. Normalform nach

Mehr

Datenbanksysteme Teil 3 Indizes und Normalisierung. Stefan Maihack Dipl. Ing. (FH) Datum:

Datenbanksysteme Teil 3 Indizes und Normalisierung. Stefan Maihack Dipl. Ing. (FH) Datum: Datenbanksysteme Teil 3 Indizes und Normalisierung Stefan Maihack Dipl. Ing. (FH) Datum: 01.11.2005 1 MySQL - Normalisierung Durch die Normalisierung von Tabellen soll folgendes erreicht werden Redundanzfreie,

Mehr

Kapitel DB:IV (Fortsetzung)

Kapitel DB:IV (Fortsetzung) Kapitel DB:IV (Fortsetzung) IV. Logischer Datenbankentwurf mit dem relationalen Modell Das relationale Modell Integritätsbedingungen Umsetzung ER-Schema in relationales Schema DB:IV-45 Relational Design

Mehr

konzeptionelles DB-Design

konzeptionelles DB-Design konzeptionelles DB-Design was ist das? Systemunabhängige Darstellung des Datenmodells Was ist bei allen möglichen Datenbanksystemen gleich --> Systemtheorie Informationen über Objekte (Dinge) mit Attributen

Mehr

Baumbasierte Strukturen

Baumbasierte Strukturen Baumbasierte Strukturen Baumbasierte Struktur / Organisation als Binärbaum Haufendateien oder sortierte Dateien nützlich für statische Dateien Dateien organisiert als Binärbaum Effizientes Einfügen und

Mehr

Datenmanagement Übung 5

Datenmanagement Übung 5 Datenmanagement Übung 5 Normalisierung (1.-3. NF) AUFGABE 1 1 Definitionen 1. NF Eine Relation befindet sich in 1. NF, wenn jeder Attributwert atomar ist und alle Nicht-Schlüsselattribute funktional vom

Mehr

Fokus bisher lag bisher auf sinnvoller Abbildung eines Ausschnitts der realen Welt in einer relationalen Datenbank

Fokus bisher lag bisher auf sinnvoller Abbildung eines Ausschnitts der realen Welt in einer relationalen Datenbank 8. Datenbanktuning Motivation Fokus bisher lag bisher auf sinnvoller Abbildung eines Ausschnitts der realen Welt in einer relationalen Datenbank Beliebige SQL-Anfragen können auf den Daten ausgewertet

Mehr

Entwurf und Verarbeitung relationaler Datenbanken

Entwurf und Verarbeitung relationaler Datenbanken Entwurf und Verarbeitung relationaler Datenbanken Eine durchgängige und praxisorientierte Vorgehens weise von Prof. Dr. Nikolai Preiß Berufsakademie Stuttgart R. Oldenbourg Verlag München Wien Inhalt Abbildungsverzeichnis

Mehr

In diesem Abschnitt wollen wir uns mit der Architektur von Datenbank Managements Systemen beschäftigen.

In diesem Abschnitt wollen wir uns mit der Architektur von Datenbank Managements Systemen beschäftigen. 1 In diesem Abschnitt wollen wir uns mit der Architektur von Datenbank Managements Systemen beschäftigen. Zunächst stellt sich die Frage: Warum soll ich mich mit der Architektur eines DBMS beschäftigen?

Mehr

Optimierung von Datenbanken

Optimierung von Datenbanken Optimierung von Datenbanken Vortrag in Datenbanken II Bettina Keil 19. Juni 2008 Optimierung von Datenbanken 1/17 Gliederung Motivation Optimierung von Datenbanken 2/17 Motivation Performancesteigerung:

Mehr

Vorlesung Datenbankmanagementsysteme

Vorlesung Datenbankmanagementsysteme Vorlesung Datenbankmanagementsysteme Relationaler Datenbankentwurf II Vorlesung Datenbankmanagementsysteme Relationaler Datenbankentwurf II M. Lange, S. Weise Folie #6-1 Wiederholung Relationaler Datenbankentwurf

Mehr

Informations-, Daten- und Wissensmanagement

Informations-, Daten- und Wissensmanagement Informations-, Daten- und Wissensmanagement Lesen Sie den Artikel Schürfen in der Datenhalde und beantworten Sie folgende Fragen: Was ist Wissensmanagement? Forschungsgebiet / Managementthema, das sich

Mehr

Datenbanksysteme I. FB Automatisierung und Informatik: Datenbanksysteme I

Datenbanksysteme I. FB Automatisierung und Informatik: Datenbanksysteme I Datenbanksysteme I Dipl.-Inf., Dipl.-Ing. (FH) Michael Wilhelm Hochschule Harz FB Automatisierung und Informatik mwilhelm@hs-harz.de Raum.0 Tel. 09 / 659 8 Inhalt. Grundlegende Begriffe der Datenbanktechnologie.

Mehr

TU München, Fakultät für Informatik Lehrstuhl III: Datenbanksysteme Prof. Alfons Kemper, Ph.D.

TU München, Fakultät für Informatik Lehrstuhl III: Datenbanksysteme Prof. Alfons Kemper, Ph.D. TU München, Fakultät für Informatik Lehrstuhl III: Datenbanksysteme Prof. Alfons Kemper, Ph.D. Blatt Nr. 10 Übung zur Vorlesung Grundlagen: Datenbanken im WS15/16 Harald Lang, Linnea Passing (gdb@in.tum.de)

Mehr

Datenbankentwicklung

Datenbankentwicklung Datenbankentwicklung Berechnung und Präsentation von Daten Organisation der Daten in alleinstehende Tabellen Exklusiver Zugriff auf alle Informationen einer Tabelle Beschränkte Anzahl von Daten pro Tabellenblatt

Mehr

BG - Schwerpunkt Datenverarbeitungstechnik 13.1 Datenbanken Nr Normalisierung Einführung

BG - Schwerpunkt Datenverarbeitungstechnik 13.1 Datenbanken Nr Normalisierung Einführung Hinweis für alle folgenden Aufgaben Ist in den folgenden Tabellen ein Attribut unterstrichen, so handelt sich um den Primärschlüssel. Dieser Schlüssel kann auch aus mehreren Attributen bestehen. Wenn Sie

Mehr

Kapitel 1 Grundlagen. Skript zur Vorlesung: Datenbanksysteme II Sommersemester Vorlesung: PD Dr. Peer Kröger

Kapitel 1 Grundlagen. Skript zur Vorlesung: Datenbanksysteme II Sommersemester Vorlesung: PD Dr. Peer Kröger LUDWIG- MAXIMILIANS- UNIVERSITY MUNICH DEPARTMENT INSTITUTE FOR INFORMATICS DATABASE Skript zur Vorlesung: Datenbanksysteme II Sommersemester 2016 Kapitel 1 Grundlagen Vorlesung: PD Dr. Peer Kröger http://www.dbs.ifi.lmu.de/cms/datenbanksysteme_ii

Mehr

Aufbau Datenbanksysteme

Aufbau Datenbanksysteme Aufbau Datenbanksysteme Lehrveranstaltung Datenbanktechnologien Prof. Dr. Ingo Claßen Prof. Dr. Martin Kempa Hochschule für Technik und Wirtschaft Berlin Speichersystem c Ingo Claßen, Martin Kempa Softwarearchitektur

Mehr

Indizes B+Bäume in Oracle. Jörg Winkler

Indizes B+Bäume in Oracle. Jörg Winkler Indizes B+Bäume in Oracle Vortragende: Conrad Kobsch Jörg Winkler Inhalt Allgemeines Aufbau / Eigenschaften von B+Bäumen Vorteile / Nachteile B+Baum-Indexe Kriterien für Indizes Anlegen eines Indizes Anfrageoptimierung

Mehr

3. Relationales Modell & Algebra

3. Relationales Modell & Algebra 3. Relationales Modell & Algebra Inhalt 3.1 Relationales Modell Wie können wir Daten mathematisch formal darstellen? 3.2 Übersetzung eines konzeptuellen Modells Wie können wir ein konzeptuelles Modell

Mehr

Vorlesung DBIS I (WS 2005/2006) Teil 4

Vorlesung DBIS I (WS 2005/2006) Teil 4 otivation Das Relationenmodell Vorlesung Prof. Johann Christoph Freytag, Ph.D. Institut für Informatik Humboldt-Universität zu Berlin WS 2005/2006 Ziel des Relationenmodells Hoher Grad an Datenunabhängigkeit

Mehr

Datenbanken. Zusammenfassung. Datenbanksysteme

Datenbanken. Zusammenfassung. Datenbanksysteme Zusammenfassung Datenbanksysteme Christian Moser Seite 1 vom 7 12.09.2002 Wichtige Begriffe Attribut Assoziation API Atomares Attribut Datenbasis DBMS Datenunabhängigkeit Datenbankmodell DDL DML DCL ER-Diagramm

Mehr

Kapitel 9: Physische Datenorganisation

Kapitel 9: Physische Datenorganisation Ludwig Maximilians Universität München Institut für Informatik Lehr- und Forschungseinheit für Datenbanksysteme Skript zur Vorlesung Wintersemester 2006/2007 Kapitel 9: Physische Datenorganisation Vorlesung:

Mehr

Indexstrukturen für Zeichendaten und Texte

Indexstrukturen für Zeichendaten und Texte Indexstrukturen für Zeichendaten und Texte Felix Hain HTWK Leipzig 29.06.15 Gliederung 29.06.15 Felix Hain 2 1 B + -Baum 1.1 Präfix-B + -Baum 1.2 B + -Baum für BLOBs 2 Digitale Bäume 2.1 Trie 2.2 Patricia

Mehr