Datenorganisation. Februar bis Mai Dipl.-Oek. Patrick Bartels Institut für Wirtschaftsinformatik Universität Hannover
|
|
- Petra Schuler
- vor 7 Jahren
- Abrufe
Transkript
1 Datenorganisation Februar bis Mai 2007 Dipl.-Oek. Patrick Bartels Institut für Wirtschaftsinformatik Universität Hannover Telefon: +49 (0) (0) Internet:
2 Nachtrag: Fremdschlüssel Ein Fremdschlüssel ist ein Primärschlüssel einer Relation, der in einer anderen Relation als Attributmenge auftaucht. Er dient als Verweis zwischen zwei Relationen, d. h. er zeigt an, welche Tupel der Relationen inhaltlich miteinander in Verbindung stehen. Beispiele für Fremdschlüssel sind die beiden Attribute Vorgesetzter und Untergebener aus der Beispielrelation Vgl. 2
3 3.2 Logisches Datenmodell 3
4 3.2 Logisches Datenmodell Logische Datenbankmodellierung ist der Prozess der Überführung eines konzeptionellen Datenmodells in ein logisches Datenbankmodell, das anschließend über ein DBMS implementiert werden kann. Beispiele für Datenbankmodelle: Hierarchisches Datenmodell Netzwerkmodell Relationales Datenmodell Objekt-orientiertes Datenmodell 4
5 3.2.1 Hierarchisches Datenmodell Hierarchisches Datenmodell ( ) Datensätze werden als Knoten, Beziehungen als Kanten dargestellt Es sind nur 1:n Beziehungen zugelassen, dadurch entsteht eine Baumstruktur Beim folgenden Beispiel muss eine Hierarchie für Kunden und eine für Artikel gebildet werden 5
6 3.2.1 Hierarchisches Datenmodell Hierarchisches Datenmodell ( ) Ein Knoten kann nur einen vorgelagerten Knoten besitzen. Einstieg in den Baum immer über die Wurzel. Existenzabhängigkeiten! Erstes logisches Datenmodell. Datensatzorientiert. Einsatz vor allem in Legacy-Systemen, insbes. in Großrechnersystemen. 6
7 3.2.1 Hierarchisches Datenmodell Hierarchisches Datenmodell ( ) 7
8 3.2.1 Hierarchisches Datenmodell ER-Diagramm Hierarchisches Datenmodell 8
9 3.2.1 Hierarchisches Datenmodell Hierarchisches Datenmodell ( ) 9
10 3.2.2 Netzwerkmodell Das Netzwerkmodell stellt Datenstrukturen als Netzwerke bestehend aus Knoten für Datensätze (Objekte) und Kanten für Beziehungen zwischen Datensätzen dar. Dabei werden üblicherweise 1:m- und n:m- Beziehungen zugelassen. Ein Datensatztyp kann mit einer beliebigen Anzahl verschiedener anderer Datensatztypen verbunden sein. 10
11 3.2.2 Netzwerkmodell Pfeile deuten 1:n-Beziehungen an. Datensatzorientiert. Das Netzwerkmodell wurde entwickelt, um die Limitierungen des hierarchischen Datenmodell zu beseitigen. Einsatz in Legacy-Systemen, insbes. in Großrechnersystemen. 11
12 3.2.2 Netzwerkmodell Beispiel: 12
13 3.2.2 Netzwerkmodell Beispiel 13
14 3.2.3 Relationales Datenmodell Das relationale Datenmodell Entwickelt von Dr. Edgar Frank Codd (1970) Erster systematischer Ansatz, Grundlage einer ersten Datenbanktheorie, Basis für viele Konzepte und Produkte 12 Grundregeln (später erweitert auf 48, dann auf 333) Grundlage für die meisten heutigen DB-Systeme Tabellen (Relationen) sind das universelle Strukturierungsmittel Alle Daten werden als Werte in zweidimensionalen Tabellen dargestellt 14
15 3.2.3 Relationales Datenmodell Relation = 2-dim. Tabelle Alle Daten werden in Tabellen gespeichert Abfrage-Ergebnisse sind Tabellen Abfragen sind Transformationen von Tabellen in Tabellen feste Anzahl von Spalten, beliebige Anzahl von Zeilen Die Reihenfolge der Zeilen spielt keine Rolle, ebenso die der Spalten Jede Zeile der Tabelle: ein Datensatz, ein Tupel Die Spalten (Felder) enthalten die Attribute des Datensatzes Die Zeilen müssen paarweise voneinander verschieden sein, d.h. es gibt keine zwei identischen Zeilen 15
16 3.2.3 Relationales Datenmodell Die 12 Grundregeln (0 bis 12=13) für relationale Datenbanken: 0. Ein relationales DBMS muss in der Lage sein, Datenbanken vollständig über seine relationalen Fähigkeiten zu verwalten. 1. Darstellung von Informationen: Alle Informationen in einer relationalen Datenbank (einschließlich Namen von Tabellen und Spalten) sind explizit als Werte in Tabellen darzustellen. 2. Zugriff auf Daten: Jeder Wert einer relationalen Datenbank muss durch eine Kombination von Tabellenname, Primärschlüssel und Spaltenname auffindbar sein. 16
17 3.2.3 Relationales Datenmodell Die 12 Grundregeln (0 bis 12=13) für relationale Datenbanken: 3. Systematische Behandlung von Nullwerten: Das DBMS behandelt Nullwerte durchgängig gleich als unbekannte oder fehlende Daten und unterscheidet diese von Standardwerten. 4. Struktur einer Datenbank: Die Datenbank und ihre Inhalte werden in einem so genannten Systemkatalog auf derselben logischen Ebene wie die Daten selbst - also in Tabellen beschrieben. Demzufolge lässt sich der Katalog mit Hilfe der Datenbanksprache abfragen. 5. Abfragesprache: Zu einem relationalen System gehört mindestens eine Abfragesprache mit einem vollständigen Befehlssatz für Datendefinition, Manipulation, Integritätsregeln, Autorisierung und Transaktionen. 17
18 3.2.3 Relationales Datenmodell Die 12 Grundregeln (0 bis 12=13) für relationale Datenbanken: 6. Aktualisieren von Sichten: Alle Sichten, die theoretisch aktualisiert werden können, lassen sich auch vom System aktualisieren. 7. Abfragen und Bearbeiten ganzer Tabellen: Das DBMS unterstützt nicht nur Abfragen, sondern auch die Operationen für Einfügen, Aktualisieren und Löschen in Form ganzer Tabellen. 8. Physikalische Datenunabhängigkeit: Der logische Zugriff auf die Daten durch Anwendungen und Ad-Hoc-Programme muss unabhängig von den physikalischen Zugriffsmethoden oder den Speicherstrukturen der Daten sein. 18
19 3.2.3 Relationales Datenmodell Die 12 Grundregeln (0 bis 12=13) für relationale Datenbanken: 9. Logische Datenunabhängigkeit: Änderungen der Tabellenstrukturen dürfen keinen Einfluss auf die Logik der Anwendungen und Ad-Hoc-Programme haben. 10.Unabhängigkeit der Integrität: Integritätsregeln müssen sich in der Datenbanksprache definieren lassen. Die Regeln müssen im Systemkatalog gespeichert werden. Es darf nicht möglich sein, die Regeln zu umgehen. 11.Verteilungsunabhängigkeit: Der logische Zugriff auf die Daten durch Anwendungen und Ad-Hoc-Programme darf sich beim Übergang von einer nicht verteilten zu einer verteilten Datenbank nicht ändern. 19
20 3.2.3 Relationales Datenmodell Die 12 Grundregeln (0 bis 12=13) für relationale Datenbanken: 12.Kein Unterlaufen der Abfragesprache: Integritätsregeln, die über die Datenbanksprache definiert sind, dürfen sich nicht mit Hilfe von Low-Level-Sprachen umgehen lassen. 20
21 3.2.3 Relationales Datenmodell Relationales Datenmodell Objekttypen und Beziehungstypen und deren Attribute werden mittels Relationen abgebildet, die anschaulich durch Tabellen dargestellt werden können. 1. Präzisiert wird eine Relation durch Angabe eines Namens und der Attribute des betreffenden Objekttyps. Primärschlüssel-Attribute werden unterstrichen 2. Schreibweise: [KONTO (Filiale; KontoNr; KontoInhaber; KontoStand)] 21
22 3.2.3 Relationales Datenmodell Relationales Datenmodell Mathematisch ist jede Relation eine Teilmenge des kartesischen Produkts von zwei oder mehr Mengen. Das kartesische Produkt M1 x M2 zweier Mengen M1 und M2 ist die Menge aller Paare (p, q) mit p aus M1 und q aus M2 Das kartesische Produkt ist die Menge aller möglichen Wertekombinationen Beispiel: Für M1 = {1,2,3} und M2 = {a,b,c} ist M1 x M2 = { (1,a), (1,b), (1,c), (2,a), (2,b), (2,c), (3,a), (3,b), (3, c) } Eine Relation ist eine Teilmenge des kartesischen Produkts, wobei alle Tupel (Datensätze) unter sich verschieden sind. 22
23 3.2.3 Relationales Datenmodell Relationales Datenmodell Beim relationalen Datenmodell sind diese Mengen die Wertebereiche der Attribute des betreffenden Objekttyps. z.b. Konto Aufbau und Struktur einer Relation bezeichnet man auch als Schema (Datenbank-Schema). 23
24 3.2.3 Relationales Datenmodell ER-Diagramm Relationales Datenmodell 24
25 3.2.3 Relationales Datenmodell Relationales Datenmodell Für eine Tabelle des Relationenmodells gilt: Die Zeilen der Tabelle sind gleich lang In den Feldern gibt es keine Attributwiederholungen Die Spalten der Tabelle sind elementar (in den Spalten gibt es keine zusammengesetzten Attribute) Tabellen können Anomalien aufweisen: Redundanz Änderungsanomalie Einfügeanomalie Löschanomalie 25
26 3.2.4 Normalisierung 26
27 3.2.4 Normalisierung Eine gut-strukturierte Relation enthält keine Redundanz und ermöglicht es Datensätze einzufügen, zu ändern oder zu löschen, ohne dass Inkonsistenzen entstehen. Vermeidung von Änderungsanomalien Einfügeanomalien Löschanomalien 27
28 3.2.4 Normalisierung Redundanz ist die mehrfache Speicherung derselben Daten. Diese Redundanz ist im Regelfall unerwünscht, da unnötig Speicherplatz beansprucht wird und die Aktualisierung von Daten durch Redundanz erheblich erschwert wird. Quelle: Schwarze 28
29 3.2.4 Normalisierung Änderungsanomalie (Updateanomalie): Eine Änderung von Daten muss in mehreren Datensätzen durchgeführt werden. Beispiel: Die Videostammdaten sind in der Leihtabelle enthalten. Bei Änderungen der Videostammdaten müssen alle Datensätze geändert werden, bei denen dieses Video ausgeliehen worden ist. Leihe(KNr, VINr, LDat, RDat, Titel, Leihgesellschaft,...) statt: Video(VINr, Titel, Leihgesellschaft,...) Leihe(KNr, VINr, LDat, RDat) 29
30 3.2.4 Normalisierung Einfügeanomalie: Beim Einfügen von neuen Objekten (z. B. Videos) müssen andere Daten auch erfasst werden. Beispiel: Ein neues Video kann erst angelegt werden, wenn es von einem Kunden ausgeliehen wurde, weil die Kundennummer der Primärschlüssel ist. Leihe(KNr, VINr, LDat, RDat, Titel, Leihgesellschaft,...) 30
31 3.2.4 Normalisierung Löschanomalie: Wird der letzte verbleibende Datensatz eines bestimmten Objektes (z. B. Leihvorgänge) gelöscht, verschwinden alle Daten des enthaltenen Objektes (z. B. Video) in der Datenbank. Beispiel: Wird der letzte Datensatz mit Leihdaten eines bestimmten Videos gelöscht, werden auch alle Videodaten (Titel, Leihgesellschaft,...) gelöscht. 31
32 3.2.4 Normalisierung Normalisierung: Unerwünschte Eigenschaften können beseitigt werden, indem die Relation (bzw. Tabelle) nach bestimmten Vorschriften in einfachere Relationen (bzw. Tabellen) zerlegt wird. Diese Zerlegung bezeichnet man als Normalisierung. Quelle: Schwarze 32
33 3.2.4 Normalisierung Eine Normalform ist ein Zustand einer Relation, der durch die Anwendung einfacher Regeln erreicht werden kann. Es gibt theoretisch 5 Stufen der Normalform, wobei nur die ersten drei tatsächliche Relevanz besitzen Normalform Boyce-Codd-Normalform Normalform Domain-Key Normalform 33
34 3.2.4 Normalisierung 1. Normalform Eine Tabelle des Relationenmodells, deren Zeilen gleich lang sind, ohne Attributswiederholungen, mehrfache und zusammengesetzte Attribute. Folgende Bedingungen müssen in der 1. Normalform erfüllt sein: Sie ist zweidimensional mit Reihen und Spalten Jede Reihe enthält Daten, die zu einem Objekt oder einem Teil eines Objektes gehören Jede Spalte enthält Daten für ein einziges Attribut des Objektes Jeden Datenzelle (Schnittstelle zwischen Reihe und Spalte) enthält einen einzigen Eintrag Jede Spalte muss einen (in der Tabelle) einmaligen Namen tragen Keine zwei Reihen dürfen identisch sein Die Reihenfolge der Spalten und Reihen ist bedeutungslos 34
35 3.2.4 Normalisierung 1. Normalform Beispiel für eine Relation, die NICHT in der 1. Normalform vorliegt! 35
36 3.2.4 Normalisierung 1. Normalform Beispiel für eine Relation, die in der 1. Normalform vorliegt! 36
37 3.2.4 Normalisierung 2. Normalform Eine Tabelle liegt in der ersten Normalform vor und außerdem sind alle Attribute voll funktional abhängig von einem Attribut oder einer Attributskombination. Eine Tabelle ist automatisch in 2. Normalform, wenn gilt: - Der Primärschlüssel besteht aus nur einem Attribut (künstliche Primärschlüssel: Autowert, Zähler!). - Jedes Nichtschlüsselattribut ist funktional abhängig von dem gesamten Primärschlüssel. 37
38 3.2.4 Normalisierung 2. Normalform Bestellungen Bestell_Nr Artikel_Nr Einzelpreis , ,80 Anzahl 3 7 Eine Relation Bestellungen, die NICHT der 2NF entspricht, weil - Einzelpreis sich nur auf Artikel_Nr und nicht auch auf Bestell_Nr bezieht. - Bestell_Nr und Artikel_Nr bilden den Primärschlüssel. - Jedes dieser Attribute stellt einen Teilschlüssel dar. 38
39 3.2.4 Normalisierung 3. Normalform Es liegt die 2. Normalform vor und es existieren außerdem keine transitiven Abhängigkeiten. 39
40 3.2.4 Normalisierung 3. Normalform Eine Relation Kunde, die NICHT der 3NF entspricht! 40
41 3.2.4 Normalisierung 3. Normalform Eine Relation Kunde, die der 3NF entspricht! 41
42 3.2.4 Normalisierung Weitere Normalformen: 4. und 5 Normalform: In der 4. Normalform werden mehrwertige Abhängigkeiten von Attributmengen zu einem so genannten Superschlüssel (übergeordnetem Schlüssel) eliminiert. Ist eine verlustfreie Zerlegung der Einzelabhängigkeiten in der 4. Normalform nicht möglich, werden in der 5. Normalform weitere Primärschlüssel hinzugefügt. Das geschieht so lange, bis nur noch Einzelabhängigkeiten der Attribute von einem oder mehreren Primärschlüsseln bestehen. 42
43 3.3 Physischer Datenbankentwurf 43
44 3.3 Physischer Datenbankentwurf statische Anforderungen Objekttypen Beziehungstypen Attribute Anforderungsanalyse dynamische Anforderungen Verarbeitungsprozeduren Zugriffsregelungen Sicherheitsanforderungen Konzeptionelle Datenmodellierung Logische Datenmodellierung Physischer Datenbankentwurf Implementierung Laufender Betrieb Quelle: in Anlehnung an Schwarze 44
45 Grundlagen der physischen DM Physische Datenbankmodellierung ist der Prozess der Überführung eines logischen Datenmodells in ein datenbankinternes Modell, unter Beachtung von: Logischen Datenstrukturen Anforderungen der Benutzer bezüglich Antwortzeiten, Sicherheit, Recovery usw. Besonderheiten des verwendeten DBMS und Betriebssystems 45
46 Grundlagen der physischen DM Z. B. Strategien zur Datenverteilung: 1. Zentrale Speicherung 2. Partitionierung: Die Datenbank wird in mehrere disjunkte (nicht-überlappende) Partitionen aufgeteilt. Jede Partition wird an unterschiedlicher Stelle (Abteilung, Filiale,...) gespeichert. 3. Replikation: Eine vollständige Kopie der Datenbank wird an einer anderen Stelle gespeichert. Synchronisationsprobleme! 4. Hybride Strategie: Nichtkritische Partitionen werden an einem Ort gespeichert; kritische Partitionen werden repliziert. 46
47 Grundlagen der physischen DM Im Rahmen der physischen DM müssen das erwartete Datenvolumen und die Datenverwendung analysiert werden: Datenvolumen: z. B. zur Auswahl geeigneter Speichermedien (Anzahl und Größe der Festplatten) und eines DBMS Datenverwendung: z. B. zur Auswahl einer geeigneten Dateiorganisation, von Zugriffsmethoden, zur Planung von Indexen, einer verteilten Datenspeicherung 47
48 Grundlagen der physischen DM Analyse des Datenvolumens: Angabe der durchschnittlichen Anzahl an Objekten eines Objekttyps in einem bestimmten Zeitraum Angabe der durchschnittlichen Anzahl verbundener Objekte in einer Beziehung in einem bestimmten Zeitraum 48
49 Grundlagen der physischen DM Informationen aus der Fachabteilung, z. B.: Einmal jährlich soll archiviert werden Voraussichtlicher Kundenbestand: CDs: 1000, Lieder/CD: ca. 14, Videos: 500 Pro Kunde + Jahr: 10 Leihvorgänge Im Schnitt 3 CDs + 1 Video je Leihvorgang Verlängerung einer Leihe: neue Rechnung (10 % der Leihen werden verlängert) 49
50 Grundlagen der physischen DM Analyse des Datenvolumens: 50
51 Grundlagen der physischen DM Analyse des Datenvolumens: CD Leihe Video Lieder je CD Kunde Rechnung Rechn.- position
52 Grundlagen der physischen DM Analyse der Datenverwendung: Identifikation der wichtigsten Vorgänge Zu jedem Vorgang werden die Zugriffspfade und -häufigkeiten bestimmt Zusammenführung der einzelnen Vorgänge in einem Verwendungs-Chart 52
53 Grundlagen der physischen DM Vorgang Ausleihe speichern : 1. Kunde suchen 2. CD oder Video suchen 3. Leihdaten speichern (inkl. LDat und RDat) 4. weitere CD oder Video suchen... 53
54 Grundlagen der physischen DM Zugriffe je Vorgang Ausleihe speichern : 4 Zugriffe/Leihe 3 3 Zugriffe/Leihe 2 CD Leihe Video Zugriffe/Leihe 1 1 Zugriffe/Leihe Kunde 5.000? Reihenfolge-Position im Vorgang 54
55 Grundlagen der physischen DM Max. Anzahl Zugriffe je Periode (Stunde) bei Vorgang Ausleihe speichern? (10 Kunden) 40 Zugriffe/Std 3 30 Zugriffe/Std 2 CD Leihe Video Zugriffe/Std Zugriffe/Std Kunde 5.000? Reihenfolge-Position im Vorgang 55
56 Grundlagen der physischen DM Max. Anzahl Zugriffe je Periode (Stunde) alle Vorgänge? 56
57 Grundlagen der physischen DM Unterscheidung der Art des Zugriffs: Lesen Einfügen Ändern Löschen 57
58 Dateiorganisation Dateiorganisation: Physische Organisation der Datenspeicherung Auch Datenbanken speichern die Relationen bzw. Tupel auf ein sekundäres Speichermedium, in der Regel in eine Datei auf einer Festplatte 58
59 Dateiorganisation Verarbeitungsformen von Daten Operationen zur Speicherung, Nutzung und Verwaltung von Daten 59
60 Dateiorganisation Kriterien: 1. Zugriffsgeschwindigkeit 2. Effiziente Verwendung des Speicherplatzes 3. Minimaler Reorganisationsaufwand 4. Eignung bei steigendem Datenvolumen 5. Schutz vor unautorisiertem Zugriff 60
61 Dateiorganisation Primärspeicher: Hauptspeicher, Arbeitsspeicher Enthält alle Programme des DBMS und gepufferte Daten. I. d. R. flüchtig (RAM) Direkt adressierbar Feine Granularität: Zugriffseinheit ist eine Speicherzelle Alle Datenbankoperationen werden direkt im Arbeitsspeicher durchgeführt Größe i.d.r. im Megabyte- bis Gigabyte-Bereich Zugriffszeit: einige Nanosekunden 61
62 Dateiorganisation Datenbankpuffer: Die Daten werden vor ihrer Verarbeitung in einen bestimmten Bereich des Arbeitsspeichers, den Datenbankpuffer, geladen Nach der Verarbeitung verbleiben die Daten im Datenbankpuffer Der Datenbankpuffer ist in Seiten, den Pufferrahmen, eingeteilt, die jeweils aus mehreren Festplatten-Blöcken bestehen Sind alle Seiten des Datenbankpuffers voll, werden bestehende Seiten ersetzt und evtl. auf Festplatte gesichert 62
63 Dateiorganisation Sekundäre Speichermedien: Sequentielle Speichermedien, z. B. Magnetbänder: die Daten werden sequentiell, d. h. nacheinander abgespeichert (meist Archivspeicher) Direkt adressierbare Speichermedien, z. B. Festplatten: eine Speichereinheit (z. B. Speicherblock mit 1024 Byte) besitzt eine eigene Adresse Kapazität im Gigabyte-Bereich Zugriffszeit: Einige Millisekunden 63
64 Dateiorganisation Verarbeitungszeit und kosten hängen ab von der Anzahl der gerätetechnischen Zugriffe, der Daten-Übertragungskapazität vom externen zum internen Speicher, der zu speichernden Datenmenge auf dem externen Speicher. 64
65 Dateiorganisation Speicherung von Relationen auf Festplatte: Relation = Datei Datei enthält viele Datenbankseiten Seite verteilt sich auf mehrere Blöcke Je Seite werden die Datensätze (Tupel) so abgespeichert, dass eine Seitengrenze nicht überschritten wird Seite enthält Datensatztabelle: Verweise auf die in der Seite enthaltenen Tupel 65
66 Dateiorganisation Zugriffsformen: Die für ein Speichermedium zulässigen Zugriffsformen sind von der Hardware abhängig: Direkter Zugriff: über die Adresse Indirekter Zugriff: die Adresse wird über einen Schlüssel bestimmt Sequentieller Zugriff: die Daten werden der Reihe nach gelesen, bis die gesuchten Daten gefunden wurden 66
67 Dateiorganisation Primäre Organisationsformen Primäre Organisationsformen: Sequentielle Organisationsform Index-Sequentielle Organisationsform Reine Index-Organisationsform Direkte Organisationsform 67
68 Dateiorganisation Primäre Organisationsformen Sequentielle Dateiorganisation 68
69 Dateiorganisation Primäre Organisationsformen Sequentielle Dateiorganisation 69
70 Dateiorganisation Primäre Organisationsformen Indizierte Dateiorganisation 70
71 Dateiorganisation Primäre Organisationsformen Sequentielle Organisationsform: - die Daten werden der Reihe nach gelesen, bis die gesuchten Daten gefunden wurden. - kein direkter Zugriff auf Sätze möglich - ausreichend für Batch-Verarbeitung (gleichzeitige Benötigung vieler Sätze) - völlig ungeeignet für Dialogverarbeitung (schneller gezielter Zugriff auf einzelne Sätze) 71
72 Dateiorganisation Primäre Organisationsformen Sequentielle Organisationsform: Von Bedeutung für Sicherungskopien Protokolldateien (Logfile) 72
73 Dateiorganisation Primäre Organisationsformen Index-Sequentielle Organisationsform: häufige Verwendung in DBMS einfache Struktur direkter Zugriff auf einzelne Datensätze über Datensätze innerhalb eines Blocks sind nach Schlüsseln geordnet Problem: nachträglich einzufügende Sätze 73
74 Dateiorganisation Primäre Organisationsformen Index-Sequentielle Organisationsform Viele DBMS verzichten auf sequentielle Komponente Satzschlüssel ist eine von System vorgegebene interne Satznummer Index gibt Auskunft: In welchen Block befindet sich ein Satz mit bestimmten Schüssel vollständiger Index 74
75 Dateiorganisation Primäre Organisationsformen Index-Sequentielle Organisationsform 75
76 Dateiorganisation Primäre Organisationsformen Direkte Organisationsform Zuordnung eines Schlüssels wird über einen Algorithmus (Schlüsseltransformation) gelöst Beschreibung über sog. Hash-Funktion sehr schnelle Methode, kann im internen Speicher erfolgen häufigste Funktion: Divisionsrestverfahren Block Adresse(s) = s modulo n mit n=anzahl der Blöcke, s=schlüssel 76
77 Dateiorganisation Primäre Organisationsformen Suchverfahren: Sukzessives oder sequentielles Suchen: der Reihe nach Binäres Suchen: Aufteilung der Datei in jeweils zwei Hälften, bis Datensatz gefunden n-wege-suchen: mehrstufiges Suchen, erst wird der Block gesucht, dann der Datensatz innerhalb des Blocks (beliebig erweiterbar) Indirektes Suchen: über eine Indexdatei Algorithmisches Suchen: Berechnung der Adresse über einen Hash- Algorithmus 77
78 Dateiorganisation Primäre Organisationsformen Indizierte Dateiorganisation: Bei indizierter Organisation einer Datei... werden die Datensätze sequentiell, im allgemeinen in chronologischer Reihenfolge, unter fortlaufenden Adressen gespeichert. Suchschlüssel und Adresse werden in einer Indexdatei (Index) gespeichert. Über diese Indexdatei wird dann indirekt gesucht. Quelle: Schwarze 78
79 Dateiorganisation Sekundäre Organisationsformen Arten der Sekundärorganisation Listenorganisation Invertierte Liste Indizes 79
80 Dateiorganisation Sekundäre Organisationsformen Listenorganisation Verkettung zusammengehöriger Sätze sortierte Listen unsortierte Listen Anfang der Liste steht in einem sog. Anker Hinter der Attributsausprägung steht nur die Adresse des ersten Satzes Information zum nächsten Satz in Form eines Zeigers mit den Daten in einem Zeigerfeld 80
81 Dateiorganisation Sekundäre Organisationsformen Listenorganisation 81
82 Dateiorganisation Sekundäre Organisationsformen Invertierte Listen: Ein Index für einen Sekundärschlüssel enthält nicht die Adresse des Datensatzes, sondern einen Verweis auf den Primärschlüssel Über den Primärschlüssel kann dann auf den Datensatz zugegriffen werden. Mehrstufiges Suchen 82
83 Dateiorganisation Sekundäre Organisationsformen Invertierte Listen:
84 Indexe Beschleunigung des Suchvorgangs durch einen Index: Indexdatei ist kleiner als Originaldatei Indexdatei ist sortiert (Relation nicht) Teile des Index können im Hauptspeicher gehalten werden (der Hauptspeicher ist um ein Vielfaches (Faktor: 10 5 ) schneller als eine Festplatte) 84
85 Indexe Indexformen: Physisch sortierter Index (Updates!) Logisch sortierter Index (Kette): die Reihenfolge der Indexeinträge wird über Zeiger (Pointer) realisiert (nur sequentielle Suche) Logisch sortierter Index (Baum): sehr schnell 85
86 Indexe Bäume: Bäume (trees) sind die am häufigsten eingesetzte Struktur für Indexdateien Wurzel (Level 0), Knoten, Blatt, Vater, Kind, Bruder Ein Knoten enthält Verweise (Pointer) auf jedes seiner Kinder 86
87 Indexe Erwünschte Eigenschaften von Bäumen: Einheitliche Zugriffszeit (z. B. durch einheitlichen Abstand aller Blätter von der Wurzel) Hoher Verzweigungsgrad (viele Kinder) Geringe Tiefe bzw. Höhe (wenige Levels) 87
88 Indexe B-Bäume (Balanced Trees oder Bayer-Baum): Häufigste Indexstruktur Alle Blätter haben den gleichen Abstand zur Wurzel Ein Knoten entspricht einer Datenbankseite Ein Knoten enthält den Schlüssel, den Datensatz, einen Verweis auf Knoten mit kleineren Schlüsseln und einen Verweis auf Knoten mit größeren Schlüsseln 88
89 Indexe B-Bäume (Balanced Trees): Quelle: Kemper/Eickler 89
90 Indexe Einfügen von Schlüsseln: Einfügen von Datensatz mit Schlüssel 17 Der Knoten ist voll, der mittlere Knoten wird nach oben geschoben, der volle Knoten wird geteilt 90
91 Indexe Einfügen von Schlüssel 17: Quelle: Kemper/Eickler 91
92 Indexe Einfügen von Schlüssel 17: Quelle: Kemper/Eickler 92
93 Indexe Löschen von Schlüsseln: Schlüssel in Blattknoten können einfach gelöscht werden Bei inneren Knoten: der nächstgrößere (nächstkleinere) Schlüssel wird an die Stelle des gelöschten Schlüssel verschoben Bei Unterbesetzung von Knoten: evtl. Ausgleich oder Verschmelzen 93
94 Indexe Löschen von Schlüssel 7: Quelle: Kemper/Eickler 94
95 Indexe Löschen von Schlüssel 7: Quelle: Kemper/Eickler 95
96 Indexe Verzweigungsgrad bei B-Bäumen: Je mehr Verzweigungen ein Baum hat, desto flacher ist er (weniger Seitenzugriffe!) Je größer die einzelnen Datensätze sind, desto weniger Verzweigungen sind möglich Reale B-Bäume: ca. 100 Verzweigungen 96
97 Indexe B + -Bäume: Bei B + -Bäumen werden die Datensätze nur noch in den Blättern gespeichert, d. h. außerhalb des Index (es sind viel mehr Verzweigungen möglich!) In den inneren Knoten werden Referenzschlüssel gespeichert Die Blattknoten enthalten Zeiger auf den vorhergehenden und nachfolgenden Datensatz (ermöglicht sequentielle Suche) 97
98 Indexe B + -Bäume: Effizientere Verwaltung der Struktur Es können mehrere B + -Bäume für eine Relation erzeugt werden Die Blattknoten sind sortiert Für Bereichsanfragen wird der erste passende Wert gesucht. Anschließend kann sequentiell gelesen werden, bis der Bereich verlassen wird 98
99 Indexe Einsatz von Indexen: Bewusste Auswahl der Attribute, für die ein Index erzeugt werden soll Höhere Performanz für Abfragen Reduzierte Performanz für Einfügen, Löschen und Änderungen von Datensätzen Data Warehouse: viele Indexe Operative Systeme: wenige Indexe 99
100 Indexe Einsatz von Indexen: Primärschlüsselindex: CREATE UNIQUE INDEX eindeutiger Index Sekundärschlüsselindex: CREATE INDEX nicht-eindeutiger Index 100
101 Indexe Einsatz von Indexen: Primärschlüssel sollte einen eindeutigen Index haben Fremdschlüssel sollten einen nicht-eindeutigen Index haben (beschleunigt Joins) Attribute, die häufig in Abfragen, Sortiervorgängen und Gruppierungen verwendet werden, sollten ebenfalls einen nichteindeutigen Index bekommen 101
Das relationale Datenmodell
Das relationale Datenmodell Konzepte Attribute, Relationenschemata, Datenbank-Schemata Konsistenzbedingungen Beispiel-Datenbank Seite 1 Einführung Zweck datenmäßige Darstellung von Objekten und Beziehungen
MehrDatenorganisation. Februar bis Mai Dipl.-Oek. Patrick Bartels Institut für Wirtschaftsinformatik Universität Hannover
Datenorganisation Februar bis Mai 2007 Dipl.-Oek. Patrick Bartels Institut für Wirtschaftsinformatik Universität Hannover Telefon: +49 (0) 511 762-4979 +49 (0) 170 342 84 95 Email: bartels@iwi.uni-hannover.de
MehrDatenstrukturen. Dortmund, Oktober 1998
Datenstrukturen Dortmund, Oktober 1998 Prof. Dr. Heinz-Michael Winkels, Fachbereich Wirtschaft FH Dortmund Emil-Figge-Str. 44, D44227-Dortmund, TEL.: (0231)755-4966, FAX: (0231)755-4902 1 Inhalt Seite
MehrAnwendungsentwicklung Datenbanken Datenbankentwurf. Stefan Goebel
Anwendungsentwicklung Datenbanken Datenbankentwurf Stefan Goebel Warum eine Datenbank? Nutzung von gleichen Daten durch viele Anwender auch an unterschiedliche Orten Daten können mit unterschiedlicher
MehrDatenbanken: Indexe. Motivation und Konzepte
Datenbanken: Indexe Motivation und Konzepte Motivation Warum sind Indexstrukturen überhaupt wünschenswert? Bei Anfrageverarbeitung werden Tupel aller beteiligter Relationen nacheinander in den Hauptspeicher
MehrDieser Foliensatz darf frei verwendet werden unter der Bedingung, dass diese Titelfolie nicht entfernt wird.
Thomas Studer Relationale Datenbanken: Von den theoretischen Grundlagen zu Anwendungen mit PostgreSQL Springer, 2016 ISBN 978-3-662-46570-7 Dieser Foliensatz darf frei verwendet werden unter der Bedingung,
MehrFolien zum Textbuch. Kapitel 2: Planung, Entwicklung und Betrieb von IS. Teil 3: Modellierung von betrieblichen Informationssystemen
Folien zum Textbuch Kapitel 2: Planung, Entwicklung und Betrieb von IS Teil 3: Modellierung von betrieblichen Informationssystemen Textbuch-Seiten 185-208 WI Planung, Entwicklung und Betrieb von IS IS-Modellierung
MehrKapitel 1: Wiederholungsfragen Grundlagen DBS
Grundlagen DBS 1. Welche zentralen Anforderungen an ein DBS definierte Edgar Codd? 2. Was ist eine Transaktion? 3. Welche Eigenschaften muss das DBMS bei der Transaktionsverarbeitung sicherstellen? 4.
MehrER-Modell, Normalisierung
ER-Modell Mit dem Entity-Relationship-Modell kann die grundlegende Tabellen- und Beziehungsstruktur einer Datenbank strukturiert entworfen und visualisiert werden. Das fertige ER-Modell kann dann ganz
MehrAls Datenbanksystem wird ein Datenbankverwaltungssystem zusammen mit einer oder mehrerer Datenbanken bezeichnet.
Datenbankverwaltungssystem (DBVS/DBMS) Ein Datenbankverwaltungssystem (DBVS, data base management system : DBMS) ist die Gesamtheit aller Programme (Ressourcen) zur Erzeugung, Verwaltung (einschl. Daten-
MehrPD Dr.-Ing. F. Lobeck. Seite 6
Seite 6 Datenbanken Datenbank: Eine geordnete Menge von Daten. Speicherung erfolgt unabhängig von speziellen Anwenderprogrammen. Ebenso sollte die Hardwareunabhängigkeit gesichert werden. Zu einem Datenbankmanagementsystem
MehrADS: Algorithmen und Datenstrukturen
ADS: Algorithmen und Datenstrukturen Teil X Peter F. Stadler & Konstantin Klemm Bioinformatics Group, Dept. of Computer Science & Interdisciplinary Center for Bioinformatics, University of Leipzig 13.
Mehr5. Relationale Entwurfstheorie
5 Relationale Entwurfstheorie Motivation Konzeptuelles Modell (ERM) kann in ein relationales Schema mit möglichst wenigen Relationen übersetzt werden (vgl Kapitel 4) Welche Eigenschaften hat ein gutes
MehrEinführung in die Informatik II
Einführung in die Informatik II Relationale Datenbanken und SQL Theorie und Anwendung Prof. Dr. Nikolaus Wulff Gründe für eine Datenbank Meist werden Daten nicht in XML-Dokumenten, sondern innerhalb einer
MehrDie Bestellungen eines Schreibwarengeschäftes sollen auf eine aktuelle Form mit Hilfe einer zeitgemäßen Datenbank umgestellt werden.
Die Bestellungen eines Schreibwarengeschäftes sollen auf eine aktuelle Form mit Hilfe einer zeitgemäßen Datenbank umgestellt werden. Die nachfolgende Tabellenform, eine sogenannte Nullform muss in eine
MehrRelationale Datenbanken
Ramon A. Mata-Toledo, Pauline K. Cushman Relationale Datenbanken Schaum's Repetitorien Übersetzung aus dem Amerikanischen von G&U Technische Dokumentation GmbH Z Die Autoren 9 Vorwort 9 1 Ein Überblick
MehrZusatzskript Datenmanagement: physische Strukturen B+- und B*-Baum B+-Baum
Seite 1 Zusatzskript Datenmanagement: physische Strukturen B+- und B*-Baum B+-Baum Bild-1 Dargestellt ist die Speicherung der Personentabelle als B+-Baum anhand der Personen-Nummer (PersNr). Die Blattebene
MehrARIS II - Modellierungsmethoden, Metamodelle und Anwendungen
ARIS II - Modellierungsmethoden, Metamodelle und Anwendungen C2: Relationenbildung und Normalisierung Lernziele: Nach der Bearbeitung dieser Lektion haben Sie folgende Kenntnisse erworben: Sie können den
MehrInformatik 10 Mar Datenbanken: RDM Normalisierung April 2014
Normalisierung Eine Datenbank gilt als konsistent, wenn sie bestimmten Kriterien, den sog. Integritätsbedingungen genügt. Die Integritätsbedingungen sollen also dafür sorgen, dass keine unkorrekten Daten
MehrRückblick: Relationales Modell
Rückblick: Relationales Modell Relationales Modell als vorherrschendes Datenmodell Relationen (Tabellen) besitzen Attribute (Spalten) mit Wertebereichen und beinhalten Tupel (Zeilen) Umsetzung eines konzeptuellen
MehrAlgorithmen und Datenstrukturen 1
Algorithmen und Datenstrukturen 1 10. Vorlesung Peter F. Stadler Universität Leipzig Institut für Informatik studla@bioinf.uni-leipzig.de Suchverfahren für große Datenmengen bisher betrachtete Datenstrukturen
MehrMehrwegbäume Motivation
Mehrwegbäume Motivation Wir haben gute Strukturen (AVL-Bäume) kennen gelernt, die die Anzahl der Operationen begrenzen Was ist, wenn der Baum zu groß für den Hauptspeicher ist? Externe Datenspeicherung
MehrD1: Relationale Datenstrukturen (14)
D1: Relationale Datenstrukturen (14) Die Schüler entwickeln ein Verständnis dafür, dass zum Verwalten größerer Datenmengen die bisherigen Werkzeuge nicht ausreichen. Dabei erlernen sie die Grundbegriffe
Mehr3. Das Relationale Datenmodell
! " # $ # $ % # $ 3. Das Relationale Datenmodell 1. Datenstruktur und Integritätsbedingungen 2. Abbildung zwischen ERM und RDM 3. Implementierung in SQL 4. Anomalien und Normalformen des RDM 5. Relationenalgebra
MehrGrundlagen von Datenbanken. B-Bäume, B*-Bäume Normalisierung
Grundlagen von Datenbanken B-Bäume, B*-Bäume Normalisierung B-Bäume Definition: Seien k, h ganze Zahlen, h > 0, k > 0. Ein B-Baum B der Klasse τ(k,h) ist entweder ein leerer Baum oder ein geordneter Suchbaum
MehrEigenschaften von Datenbanken, insbesondere
Eigenschaften von Datenbanken In diesem Abschnitt beschreiben wir wünschenswerte Eigenschaften von Datenbanken, insbesondere Relationenschemata: Normalformen, die auf mathematischen Modellen beruhen und
MehrDatenbanken. Interne Datenorganisation:
Interne Datenorganisation: Bisher: Konzeptionelle Betrachtungen einer Datenbank aus Sicht der Anwendung: Modellierung, Normalisieren, Sprache zum Einfügen, Ändern, Löschen, Lesen Jetzt: Betrachtung der
MehrRückblick: Pufferverwaltung
Rückblick: Pufferverwaltung Datenbankpuffer zum Schließen der Zugriffslücke zwischen Primär- und Sekundärspeicher Ersetzungsstrategien berücksichtigen Zeitpunkte und/oder Anzahl der Zugriffe auf bestimmte
MehrEntwicklung der Datenbanksysteme
Entwicklung der Datenbanksysteme Die Entwicklung der Datenbanksysteme ist eng an die der Hardware gekoppelt und wird wie jene in Generationen eingeteilt: 1. Generation: In den fünfziger Jahren waren die
MehrEntwurf von Relationalen Datenbanken (1) (mit dem Entity-Relationship-Modell)
In der Regel werden Diskursbereiche durch mehrere Relationen (Tabellen) abgebildet. Ziele: Entwurf von Relationalen Datenbanken (1) (mit dem Entity-Relationship-Modell) Vermeiden von Redundanz in Relationen
MehrOrganisationsformen der Speicherstrukturen
Organisationsformen der Speicherstrukturen Bäume und Hashing 1 Motivation Ablage von Daten soll einfachen, schnellen und inhaltsbezogenen Zugriff ermöglichen (z.b. Zeige alle Schüler des Lehrers X am heutigen
MehrTU München, Fakultät für Informatik Lehrstuhl III: Datenbanksysteme Prof. Dr. Thomas Neumann
TU München, Fakultät für Informatik Lehrstuhl III: Datenbanksysteme Prof. Dr. Thomas Neumann Blatt Nr. 9 Übung zur Vorlesung Grundlagen: Datenbanken im WS4/5 Harald Lang (harald.lang@in.tum.de) http://www-db.in.tum.de/teaching/ws45/grundlagen/
MehrDynamische Datenstrukturen
Dynamische Datenstrukturen B-Bäume größere Datenmengen verwalten Extern speichern Art der Speicherung berücksichtigen sonst kein optimaler Datenzugriff möglich Art der Speicherung großer Datenmengen Magnetplatten
Mehrtechnische universität dortmund Fakultät für Informatik LS 8 Speichern von Daten Prof. Dr. Katharina Morik
Speichern von Daten Prof. Dr. Katharina Morik Unterschiede von DBMS und files! DBMS unterstützt viele Benutzer, die gleichzeitig auf dieselben Daten zugreifen concurrency control.! DBMS speichert mehr
MehrKapitel DB:IV (Fortsetzung)
Kapitel DB:IV (Fortsetzung) IV. Logischer Datenbankentwurf mit dem relationalen Modell Das relationale Modell Integritätsbedingungen Umsetzung ER-Schema in relationales Schema DB:IV-46 Relational Design
Mehr3. Relationales Modell & Algebra
3. Relationales Modell & Algebra Inhalt 3.1 Relationales Modell Wie können wir Daten mathematisch formal darstellen? 3.2 Übersetzung eines konzeptuellen Modells Wie können wir ein konzeptuelles Modell
Mehr3. Grundlagen relationaler Datenbanksysteme
3. Grundlagen relationaler Datenbanksysteme Hier nur kurze Rekapitulation, bei Bedarf nachlesen 3.1 Basiskonzepte des Relationenmodells 1 Darstellung der Miniwelt in Tabellenform (DB = Menge von Relationen
MehrMedizininformatik Software Engineering
Vorlesung Software Engineering Inhaltsverzeichnis 1. Einleitung 2. Software und Medizinprodukt 3. Vorgehensmodelle 4. Strukturierter Entwurf von Echtzeitsystemen 4.1 Echzeit, was ist das? 4.2 Einführung
MehrDateiorganisation und Zugriffsstrukturen. Prof. Dr. T. Kudraß 1
Dateiorganisation und Zugriffsstrukturen Prof. Dr. T. Kudraß 1 Mögliche Dateiorganisationen Viele Alternativen existieren, jede geeignet für bestimmte Situation (oder auch nicht) Heap-Dateien: Geeignet
MehrNormalisierung So wahr mir Codd helfe
Normalisierung So wahr mir Codd helfe 1999-09-22 Joachim Röhl 1999 1 Ziel der Normalisierung: Erstellung eines realitätsgetreuen und transparenten Datenmodells, das Abfrage-, Lösch- und Änderungsoperationen
MehrIndizes. Index. Datenfeld Normale Tabelle. Gesucht wird: Zugriff. 3. Zugriff 1. Zugriff.
Indizes Gesucht wird: 44791 Index Normale Tabelle 1. Zugriff 1 44789 2. Zugriff 2 44801 3. Zugriff 3 44797 4. Zugriff 4 44388 5. Zugriff 5 44746 6. Zugriff 6 44787 7. Zugriff 7 44793 8. Zugriff 8 44799
MehrDatenbanken Vertiefung Wintersemester 2013/ Matrikelnummer: Hinweise. Unterschrift
Fachbereich für Computerwissenschaften Prof. Dr. Nikolaus Augsten Jakob-Haringer-Str. 2 5020 Salzburg, Austria Telefon: +43 662 8044 6347 E-Mail: nikolaus.augsten@sbg.ac.at Datenbanken Vertiefung Prüfung
Mehrd.h. zu Definitions-Stelle eindeutiger Funktionswert x X! y Y : (x,y) f umgekehrt: (x 1,y), (x 2,y) f ist o.k. X Y f(x) = y
Kapitel 7 Normalformen und DB-Entwurf Kap. 7.1 Normalformen Theorie Funktionale Abhängigkeit: f X Y f als Relation, d.h. Menge von Paaren {(x,y)} x: Definitions-Stelle, y: Funktionswert f ist Funktion
MehrRelationale Datenbanken
Relationale Datenbanken Problemstellung: Dateninkonsistenz und -redundanz Datenredundanz Informationsduplikate verschwenden Platz Dateninkonsistenz Informationsduplikate verschwenden Platz Lösung: Zerlegung
MehrWiederholung VU Datenmodellierung
Wiederholung VU Datenmodellierung VL Datenbanksysteme Reinhard Pichler Arbeitsbereich Datenbanken und Artificial Intelligence Institut für Informationssysteme Technische Universität Wien Wintersemester
MehrSuchbäume. Suchbäume. Einfügen in Binären Suchbäumen. Suchen in Binären Suchbäumen. Prinzip Suchbaum. Algorithmen und Datenstrukturen
Suchbäume Suchbäume Prinzip Suchbaum Der Wert eines Knotens wird als Schlüssel verstanden Knoten kann auch weitere Daten enthalten, die aber hier nicht weiter betrachtet werden Werte der Schlüssel müssen
MehrMatthias Schubert. Datenbanken. Theorie, Entwurf und Programmierung relationaler Datenbanken. 2., überarbeitete Auflage. Teubner
Matthias Schubert Datenbanken Theorie, Entwurf und Programmierung relationaler Datenbanken 2., überarbeitete Auflage m Teubner Inhalt Wichtiger Hinweis 12 Vorwort 13 Wer sollte dieses Buch lesen? 13 Noch
MehrWiederholung VU Datenmodellierung
Wiederholung VU Datenmodellierung VU Datenbanksysteme Reinhard Pichler Arbeitsbereich Datenbanken und Artificial Intelligence Institut für Informationssysteme Technische Universität Wien Wintersemester
MehrDatenbanken Grundlagen und Design
Frank Geisler Datenbanken Grundlagen und Design 3., aktualisierte und erweiterte Auflage mitp Vorwort 15 Teil I Grundlagen 19 i Einführung in das Thema Datenbanken 21 i.i Warum ist Datenbankdesign wichtig?
Mehr4. Normalisierung von Relationenschemata
4. Normalisierung von Relationenschemata Ziel: Vermeidung von Anomalien in Relationenschemata wird erreicht durch systematische Vorgehensweise beim Datenentwurf vom eerm zum Relationalen Modell (s. voriges
MehrAbhängigkeiten und Normalisierung
Abhängigkeiten und Abhängigkeiten als Ursachen für Inkonsistenzen Der sprozess Normalformen (1NF, 2NF, 3NF) Seite 1 Abhängigkeiten Funktionale Abhängigkeit Ein Attribut bzw. eine Attributkombination A
MehrB / B* - Bäume. Guido Hildebrandt Seminar Datenbanksysteme
B / B* - Bäume Guido Hildebrandt Seminar Datenbanksysteme 25.11.2010 Gliederung Einleitung Binärbaum B - Baum B* - Baum Varianten Zusammenfassung Quellen Gliederung Einleitung Binärbaum B - Baum B* - Baum
MehrGRUNDLAGEN VON INFORMATIONSSYSTEMEN INDEXSTRUKTUREN I: B-BÄUME UND IHRE VARIANTEN
Informationssysteme - Indexstrukturen I: B-Bäume und ihre Varianten Seite 1 GRUNDLAGEN VON INFORMATIONSSYSTEMEN INDEXSTRUKTUREN I: B-BÄUME UND IHRE VARIANTEN Leiter des Proseminars: Dr.Thomas Bode Verfasser
MehrWintersemester 2016/ Matrikelnummer: Hinweise. Unterschrift
Fachbereich für Computerwissenschaften Prof. Dr. Nikolaus Augsten Jakob-Haringer-Str. 2 5020 Salzburg, Austria Telefon: +43 662 8044 6347 E-Mail: nikolaus.augsten@sbg.ac.at Datenbanken II Prüfung Wintersemester
MehrInhaltsverzeichnis Vorwort zur vierten Auflage Vorwort zur dritten Auflage Vorwort zur zweiten Auflage Vorwort zur ersten Auflage Hinweise zur CD
Vorwort zur vierten Auflage 11 Vorwort zur dritten Auflage 13 Vorwort zur zweiten Auflage 15 Vorwort zur ersten Auflage 17 Hinweise zur CD 19 1 Datenbanken und Datenbanksysteme 21 1.1 Zentralisierung der
MehrDatenorganisation. Aufgaben der Datenorganisation: Effizientes Verwalten von Daten, also
Aufgaben der Datenorganisation: Effizientes Verwalten von Daten, also Datenorganisation Daten müssen sicher aufbewahrt werden Daten müssen wieder auffindbar sein Daten müssen schnell zugreifbar sein Problem:
Mehr4. Normalformen. Qualitätsanforderungen an Tabellen. Klassische Normalformen (1,. 2., 3.) Spezielle Normalformen
4. Normalformen Qualitätsanforderungen an Tabellen Klassische Normalformen (1,. 2., 3.) Spezielle Normalformen 79 Normalisierungsgründe Verständlicheres Datenmodell für Anwender und Entwickler Vermeidung
MehrInhaltsverzeichnis. Lothar Piepmeyer. Grundkurs Datenbanksysteme. Von den Konzepten bis zur Anwendungsentwicklung ISBN:
Lothar Piepmeyer Grundkurs Datenbanksysteme Von den Konzepten bis zur Anwendungsentwicklung ISBN: 978-3-446-42354-1 Weitere Informationen oder Bestellungen unter http://www.hanser.de/978-3-446-42354-1
MehrE-R-Modell zu Relationenschema
Raum: LF 230 Nächste Sitzung: 27./30. Oktober 2003 Aktuelle Informationen unter: http://www.is.informatik.uni-duisburg.de/teaching/lectures/dbp_ws03/index.html E-R-Modell zu Relationenschema Als zweiter
MehrDas relationale Modell (Teil 1)
Vorlesung #2 Das relationale Modell (Teil 1) Fahrplan WS 2010/11 Feedback Vorlesung#1 Das relationale Modell Einordnung (wir überspringen die Modellierung, das kommt im 4. Semester Datenmanagement ) Definition,
MehrDatenbanken. Seminararbeit. Einführung in das wissenschaftliche Arbeiten
Seminararbeit vorgelegt von: Gutachter: Studienbereich: Christian Lechner Dr. Georg Moser Informatik Datum: 6. Juni 2013 Inhaltsverzeichnis Inhaltsverzeichnis 1 Einführung in Datenbanken 1 1.1 Motivation....................................
MehrTheorie zur Übung 8 Datenbanken
Theorie zur Übung 8 Datenbanken Relationale Datenbanksysteme Ein relationales Datenbanksystem (RDBS) liegt vor, wenn dem DBS ein relationales Datenmodell zugrunde liegt. RDBS speichern Daten in Tabellenform:
MehrAngewandte Informatik Datenbank/Datenmodell 1
Angewandte Informatik Datenbank/Datenmodell 1 Übersicht Standardsoftware Textverarbeitung - Informationen "gestalten" durch * sprachliche Mittel * Hervorhebung bzw. Unterdrückung von Inhalten * Kombination
MehrKapitel 11. Normalisierung
Kapitel 11 Normalisierung Ziel: Ziel und Idee der Normalisierung Anpassen an die Erfordernisse des Relationenmodells (1. Normalform) Vermeidung von Redundanz (weitere Normalformen) Keine Fehler (Anomalien)
MehrB*-BÄUME. Ein Index ist seinerseits wieder nichts anderes als eine Datei mit unpinned Records.
B*-Bäume 1 B*-BÄUME Beobachtung: Ein Index ist seinerseits wieder nichts anderes als eine Datei mit unpinned Records. Es gibt keinen Grund, warum man nicht einen Index über einem Index haben sollte, und
MehrWirtschaftsinformatik 7a: Datenbanken. Hochschule für Wirtschaft und Recht SS 16 Dozent: R. Witte
Wirtschaftsinformatik 7a: Datenbanken Hochschule für Wirtschaft und Recht SS 16 Dozent: R. Witte Drei Gäste bezahlen nach einem gemeinsamen Abendessen eine Rechnung von 30 Euro, so dass jeder 10 Euro gibt.
MehrLogische Datenstrukturen
Lineare Listen Stapel, Warteschlangen Binärbäume Seite 1 Lineare Liste Begriffe first Funktion: sequentielle Verkettung von Datensätzen Ordnungsprinzip: Schlüssel Begriffe: first - Anker, Wurzel; Adresse
MehrRückblick: Datenbankentwurf
Rückblick: Datenbankentwurf Entity-Relationship-Modell für konzeptuellen Entwurf Entitytypen (entity types) (z.b. Studenten) Beziehungstypen (relationships) (z.b. hören) Attribute beschreiben Gegenstände
MehrGrundlagen zu Datenbanken zu Beginn der Jgst. 13
Grundlagen zu Datenbanken zu Beginn der Jgst. 13 Bereits bei der Planung einer Datenbank muss der Datenbankentwickler darauf achten, Nachteile für das spätere System zu vermeiden. Die Strukturen müssen
MehrDatenbanksysteme Übungsblatt 1
Datenbanksysteme Übungsblatt 1 Sommersemester 2003 AIFB Institut für Angewandte Informatik und Formale Beschreibungsverfahren 1 Aufgabe 1a (1/2) Änderungsanomalie: Wenn eine Änderung nicht überall ordnungsgemäß
MehrGünther Vinek - Paul Frederick Rennert - A Min Tjoa. Datenmodellierung: Theorie und Praxis des Datenbankentwurfs
Günther Vinek - Paul Frederick Rennert - A Min Tjoa Datenmodellierung: Theorie und Praxis des Datenbankentwurfs Technische ftedsseirsie Darmstodt FACH&cREiCH INFOftMATiK BIBLIOTHEK lovenlor-nr Sachgebiete
Mehr- Gewinnung neuer Informationen durch Berechnungen - Einsatz graphischer Mittel zur Präsentation / Visualisierung von Datenreihen
Informatik Datenbank/Datenmodell 1 Übersicht Standardsoftware Textverarbeitung - Informationen "gestalten/darstellen" durch * sprachliche Mittel * Hervorhebung bzw. Unterdrückung von Inhalten * Kombination
MehrDatenbanken und SQL. Kapitel 3. Datenbankdesign Teil 1: Normalformen. Edwin Schicker: Datenbanken und SQL
Datenbanken und SQL Kapitel 3 Datenbankdesign Teil 1: Normalformen Datenbankdesign Normalformen 1. Normalform Funktionale Abhängigkeit 2. Normalform 3. Normalform nach Boyce und Codd 3. Normalform nach
MehrDatenbanksysteme Teil 3 Indizes und Normalisierung. Stefan Maihack Dipl. Ing. (FH) Datum:
Datenbanksysteme Teil 3 Indizes und Normalisierung Stefan Maihack Dipl. Ing. (FH) Datum: 01.11.2005 1 MySQL - Normalisierung Durch die Normalisierung von Tabellen soll folgendes erreicht werden Redundanzfreie,
MehrKapitel DB:IV (Fortsetzung)
Kapitel DB:IV (Fortsetzung) IV. Logischer Datenbankentwurf mit dem relationalen Modell Das relationale Modell Integritätsbedingungen Umsetzung ER-Schema in relationales Schema DB:IV-45 Relational Design
Mehrkonzeptionelles DB-Design
konzeptionelles DB-Design was ist das? Systemunabhängige Darstellung des Datenmodells Was ist bei allen möglichen Datenbanksystemen gleich --> Systemtheorie Informationen über Objekte (Dinge) mit Attributen
MehrBaumbasierte Strukturen
Baumbasierte Strukturen Baumbasierte Struktur / Organisation als Binärbaum Haufendateien oder sortierte Dateien nützlich für statische Dateien Dateien organisiert als Binärbaum Effizientes Einfügen und
MehrDatenmanagement Übung 5
Datenmanagement Übung 5 Normalisierung (1.-3. NF) AUFGABE 1 1 Definitionen 1. NF Eine Relation befindet sich in 1. NF, wenn jeder Attributwert atomar ist und alle Nicht-Schlüsselattribute funktional vom
MehrFokus bisher lag bisher auf sinnvoller Abbildung eines Ausschnitts der realen Welt in einer relationalen Datenbank
8. Datenbanktuning Motivation Fokus bisher lag bisher auf sinnvoller Abbildung eines Ausschnitts der realen Welt in einer relationalen Datenbank Beliebige SQL-Anfragen können auf den Daten ausgewertet
MehrEntwurf und Verarbeitung relationaler Datenbanken
Entwurf und Verarbeitung relationaler Datenbanken Eine durchgängige und praxisorientierte Vorgehens weise von Prof. Dr. Nikolai Preiß Berufsakademie Stuttgart R. Oldenbourg Verlag München Wien Inhalt Abbildungsverzeichnis
MehrIn diesem Abschnitt wollen wir uns mit der Architektur von Datenbank Managements Systemen beschäftigen.
1 In diesem Abschnitt wollen wir uns mit der Architektur von Datenbank Managements Systemen beschäftigen. Zunächst stellt sich die Frage: Warum soll ich mich mit der Architektur eines DBMS beschäftigen?
MehrOptimierung von Datenbanken
Optimierung von Datenbanken Vortrag in Datenbanken II Bettina Keil 19. Juni 2008 Optimierung von Datenbanken 1/17 Gliederung Motivation Optimierung von Datenbanken 2/17 Motivation Performancesteigerung:
MehrVorlesung Datenbankmanagementsysteme
Vorlesung Datenbankmanagementsysteme Relationaler Datenbankentwurf II Vorlesung Datenbankmanagementsysteme Relationaler Datenbankentwurf II M. Lange, S. Weise Folie #6-1 Wiederholung Relationaler Datenbankentwurf
MehrInformations-, Daten- und Wissensmanagement
Informations-, Daten- und Wissensmanagement Lesen Sie den Artikel Schürfen in der Datenhalde und beantworten Sie folgende Fragen: Was ist Wissensmanagement? Forschungsgebiet / Managementthema, das sich
MehrDatenbanksysteme I. FB Automatisierung und Informatik: Datenbanksysteme I
Datenbanksysteme I Dipl.-Inf., Dipl.-Ing. (FH) Michael Wilhelm Hochschule Harz FB Automatisierung und Informatik mwilhelm@hs-harz.de Raum.0 Tel. 09 / 659 8 Inhalt. Grundlegende Begriffe der Datenbanktechnologie.
MehrTU München, Fakultät für Informatik Lehrstuhl III: Datenbanksysteme Prof. Alfons Kemper, Ph.D.
TU München, Fakultät für Informatik Lehrstuhl III: Datenbanksysteme Prof. Alfons Kemper, Ph.D. Blatt Nr. 10 Übung zur Vorlesung Grundlagen: Datenbanken im WS15/16 Harald Lang, Linnea Passing (gdb@in.tum.de)
MehrDatenbankentwicklung
Datenbankentwicklung Berechnung und Präsentation von Daten Organisation der Daten in alleinstehende Tabellen Exklusiver Zugriff auf alle Informationen einer Tabelle Beschränkte Anzahl von Daten pro Tabellenblatt
MehrBG - Schwerpunkt Datenverarbeitungstechnik 13.1 Datenbanken Nr Normalisierung Einführung
Hinweis für alle folgenden Aufgaben Ist in den folgenden Tabellen ein Attribut unterstrichen, so handelt sich um den Primärschlüssel. Dieser Schlüssel kann auch aus mehreren Attributen bestehen. Wenn Sie
MehrKapitel 1 Grundlagen. Skript zur Vorlesung: Datenbanksysteme II Sommersemester Vorlesung: PD Dr. Peer Kröger
LUDWIG- MAXIMILIANS- UNIVERSITY MUNICH DEPARTMENT INSTITUTE FOR INFORMATICS DATABASE Skript zur Vorlesung: Datenbanksysteme II Sommersemester 2016 Kapitel 1 Grundlagen Vorlesung: PD Dr. Peer Kröger http://www.dbs.ifi.lmu.de/cms/datenbanksysteme_ii
MehrAufbau Datenbanksysteme
Aufbau Datenbanksysteme Lehrveranstaltung Datenbanktechnologien Prof. Dr. Ingo Claßen Prof. Dr. Martin Kempa Hochschule für Technik und Wirtschaft Berlin Speichersystem c Ingo Claßen, Martin Kempa Softwarearchitektur
MehrIndizes B+Bäume in Oracle. Jörg Winkler
Indizes B+Bäume in Oracle Vortragende: Conrad Kobsch Jörg Winkler Inhalt Allgemeines Aufbau / Eigenschaften von B+Bäumen Vorteile / Nachteile B+Baum-Indexe Kriterien für Indizes Anlegen eines Indizes Anfrageoptimierung
Mehr3. Relationales Modell & Algebra
3. Relationales Modell & Algebra Inhalt 3.1 Relationales Modell Wie können wir Daten mathematisch formal darstellen? 3.2 Übersetzung eines konzeptuellen Modells Wie können wir ein konzeptuelles Modell
MehrVorlesung DBIS I (WS 2005/2006) Teil 4
otivation Das Relationenmodell Vorlesung Prof. Johann Christoph Freytag, Ph.D. Institut für Informatik Humboldt-Universität zu Berlin WS 2005/2006 Ziel des Relationenmodells Hoher Grad an Datenunabhängigkeit
MehrDatenbanken. Zusammenfassung. Datenbanksysteme
Zusammenfassung Datenbanksysteme Christian Moser Seite 1 vom 7 12.09.2002 Wichtige Begriffe Attribut Assoziation API Atomares Attribut Datenbasis DBMS Datenunabhängigkeit Datenbankmodell DDL DML DCL ER-Diagramm
MehrKapitel 9: Physische Datenorganisation
Ludwig Maximilians Universität München Institut für Informatik Lehr- und Forschungseinheit für Datenbanksysteme Skript zur Vorlesung Wintersemester 2006/2007 Kapitel 9: Physische Datenorganisation Vorlesung:
MehrIndexstrukturen für Zeichendaten und Texte
Indexstrukturen für Zeichendaten und Texte Felix Hain HTWK Leipzig 29.06.15 Gliederung 29.06.15 Felix Hain 2 1 B + -Baum 1.1 Präfix-B + -Baum 1.2 B + -Baum für BLOBs 2 Digitale Bäume 2.1 Trie 2.2 Patricia
Mehr