FernUniversität in Hagen - Seminar 1912 im Sommersemester 2005
|
|
- Heinrich Klein
- vor 6 Jahren
- Abrufe
Transkript
1 FernUniversität in Hagen - Seminar 1912 im Sommersemester 2005 Neue Techniken der Anfragebearbeitung: Datenströme, kontinuierliche Anfragen und adaptive Auswertung Thema 4 Eddies: Kontinuierliche adaptive Anfrageverarbeitung Referent: Linus Stubert 30. Mai 2005
2 Linus Stubert, Thema 4: Eddies Folie 1 Übersicht Motivation: Wo liegen die Grenzen traditioneller Anfrageverarbeitungsverfahren? Eddies als Ansatz zur Überwindung der Nachteile traditioneller Verfahren: Vorstellung von Grundidee und Zielen des Einsatzes von Eddies Änderbarkeit von Anfrageplänen während der Laufzeit: Unter welchen Voraussetzungen lassen sich Anfragepläne effizient während der Laufzeit ändern? Eignung von Join-Algorithmen für den Einsatz mit Eddies: Wie gut arbeiten verschiedenen Join- Algorithmen aufgrund ihrer Eigenschaften mit Eddies zusammen? Ripple-Joins: Vorstellung eines effizienten, gut mit Eddies arbeitenden Join-Algorithmus River: Vorstellung der Programmierumgebung, in der Eddies implementiert sind Funktionsweise von Eddies: Wie werden Anfragen von Eddies verarbeitet? Mit welchen unterschiedlichen Strategien können Eddies arbeiten? Experimente zur Performance von Eddies: Vorstellung und Erläuterung der Ergebnisse diverser Performance-Tests
3 Linus Stubert, Thema 4: Eddies Folie 2 Motivation Ineffektivität traditioneller statischer Anfragebearbeitungstechniken bei großen verteilten Datenquellen hohe Bedeutung neuer Anfrageverarbeitungsmechanismen aufgrund steigender Komplexität der Daten und Unsicherheit über deren Eigenschaften Aspekte der Komplexität in großen Datensystemen: erhöhte Hardwarekomplexität und Belastung Datenkomplexität erhöhte Anforderungen an Benutzerschnittstelle Nachteile traditioneller Verarbeitungsverfahren: Erstellung eines statischen Plans zu Beginn der Anfrageverarbeitung häufig Validitätsverlust der Annahmen über Eigenschaften von Daten und Operatoren im Laufe der Bearbeitungsdauer bei Aggregationen keine Ergebnisse vor Abschluss der Anfragebearbeitung
4 Linus Stubert, Thema 4: Eddies Folie 3 Eddies: Ein Ansatz zur Überwindung der Nachteile traditioneller Verfahren Grundidee: kontinuierliche Umordnung von Operatoren auf Ebene einzelner Tupel während der Anfrageverarbeitung Ziel: Anpassung an Laufzeitfluktuationen wichtiger Variablen der Anfrageverarbeitung: Kosten von Operatoren Selektivitäten Rate, mit der Tupel aus Datenquellen ankommen
5 Linus Stubert, Thema 4: Eddies Folie 4 Änderbarkeit von Anfrageplänen während der Laufzeit Synchronisationsbarrieren: bewirken Reduktion möglicher Bearbeitungsreihenfolgen und infolgedessen auch von Nebenläufigkeit und Performance nachteilige Aspekte für Performance: Häufigkeit des Auftretens von Barrieren Differenz zwischen Ankunftszeiten der Eingangsrelationen an der Barriere symmetrische und asymmetrische Operatoren: symmetrische Operatoren: Unterscheidung der Eingangsrelationen nur aufgrund gelieferter Daten; Beispiel: Merge-Join asymmetrische Operatoren: unterschiedliche Behandlung der Eingangsrelationen; Beispiel: Nested-Loop-Join Symmetriemomente: Momente, in denen Eingangsrelationen eines Operators ohne Änderung von dessen Status umgeordnet werden können
6 Linus Stubert, Thema 4: Eddies Folie 5 Eignung von Join-Algorithmen für den Einsatz mit Eddies wünschenswerte Eigenschaften: häufige Symmetriemomente adaptive Barrieren minimale Umordnungseinschränkungen Standard-Nested-Loop-Joins: seltene Symmetriemomente unausgeglichene Barrieren Merge-Joins: Barrieren Umordnungseinschränkungen Index-Joins: vergleichbar mit Selektionen auf der nicht-indizierten Relation Ripple-Joins: hohe Effizienz häufige Symmetriemomente adaptive Synchronisationsbarrieren
7 Linus Stubert, Thema 4: Eddies Folie 6 Ripple-Joins Generalisierung traditioneller Nested-Loop-Joins kontinuierliche Vertauschung der Rollen der inneren und äußeren Relation während der Verarbeitung Bedeutung des Namens Ripple-Join : wellenartige Ausbreitung über kartesisches Produkt Abkürzung für rectangles of increasing perimeter length gute Zusammenarbeit mit Online-Aggregations-Mechanismen Ripple-Joins und Online-Aggregation: Online-Aggregation: Schätzung von Aggregaten anhand bisheriger Ergebnistupel laufende Aktualisierung der Schätzungen Anzeige der Genauigkeit durch Vertrauensintervalle Beispiel für ein Online-Aggregations-Interface Voraussetzung: zufällige Tupelreihenfolge Aktualisierung der Schätzungen extern steuerbar, z.b. durch Online-Aggregations-Interface Ripple-Joins erlauben dynamischen Tradeoff zwischen: Zeit zwischen aufeinander folgenden Aktualisierungen Betrag, um den sich der Vertrauensbereich bei jeder Aktualisierung verkleinert
8 Linus Stubert, Thema 4: Eddies Folie 7 Allgemeine Funktionsweise von Ripple-Joins Square -Ripple-Join: Auswahl je eines Tupels aus zwei Relationen R und S in jedem Schritt Join der Tupel miteinander und mit bereits vorher betrachteten Tupeln falls R S, werden nachdem alle Tupel einer Relation aufgebraucht sind nur noch Tupel aus der anderen Relation gezogen Rectangular -Ripple-Join: Auswahl von jeweils 1, 2,, K Tupeln aus den entsprechenden Relationen R 1, R 2,, R K in jedem Schritt Entartung zum Nested-Loop-Join bei K = 1, K 1 = R K 1,, 1 = R 1 bei der Online-Aggregation wird ausgehend von einer vorgegebenen unteren Geschwindigkeitsgrenze versucht, die Größe der Vertrauensintervalle durch geeignete Auswahl der Seitenverhältnisparameter zu minimieren zur schnellstmöglichen Reduktion der Vertrauensintervalle bei der Online-Aggregation ist es sinnvoll, aus variableren Relationen mehr Tupel pro Schritt zu ziehen im Allgemeinen existiert kein einzelnes Seitenverhältnis, welches die Vertrauensintervalle in jedem Schritt minimiert
9 Linus Stubert, Thema 4: Eddies Folie 8 Varianten des Ripple-Join Block-Ripple-Join: Lesen ganzer Blöcke vom Speichermedium statt einzelner Tupel in jedem Schritt Vergleich aller Tupel eines neuen Blocks mit allen bisherigen Tupeln der anderen Relation Einspar-Faktor proportional zu Blockgröße Index-Ripple-Join: schnelles Auffinden passender Tupel über Index Rollen der inneren und äußeren Relation nicht vertauschbar Seitenverhältnis nicht frei wählbar identisch mit Index-Nested-Loop-Join Hash-Ripple-Join: nur bei Equijoins anwendbar Aufbewarung der bisher betrachteten Tupel einer (oder beider) Relationen in einer Hash-Tabelle mit Join-Attribut als Hash-Wert Rückgriff auf Block-Ripple-Join sobald Hash-Tabelle nicht mehr in den Speicher passt
10 Linus Stubert, Thema 4: Eddies Folie 9 River Anfrageverarbeitungs-Engine, bei der Operatoren als unabhängige Iterator-Module realisiert sind Kommunikation der Module über festgelegten Datenfluss-Graph Module laufen als unabhängige Threads Kanten im Graph sind endliche Nachrichten-Warteschlangen wenn Erzeuger und Verbraucher mit unterschiedlichen Raten laufen, kann der schnellere Thread durch den langsameren aufgehalten werden River kann bei barrierefreie Algorithmen aus verschiedenen Eingaberelationen mit unabhängigen Raten lesen Beispiel für einen Datenflussgraphen in River
11 Linus Stubert, Thema 4: Eddies Folie 10 Funktionsweise von Eddies Eddy als Modul in River implementiert und enthält beliebig viele Eingangsrelationen einige beteiligte unäre und binäre Operatoren genau eine Ausgangsrelation Mit dem Eddy verbundene Operatoren: ein Eddy verkapselt die Ablaufplanung der mit ihm verbundenen Operatoren: im Eddy eingehende Tupel können die Beispiel für einen Eddy in River Operatoren in verschiedenen Reihenfolgen durchfließen jeder Operator hat 1 2 Eingänge, die mit Tupeln aus dem Tupelpuffer des Eddies gespeist werden Umordnung von Operatoren im Eddy insgesamt nicht auf Symmetriemomente einzelner Operatoren beschränkt Routing von Tupeln: Tupeldeskriptoren: Ready-Bits: Operatoren, die Tupel bereits bearbeitet haben Done-Bits: Operatoren, die Tupel bereits bearbeiten dürfen Tupelbuffer als Prioritätswarteschlange implementiert Effizienz des Systems durch Prioritätsschema bestimmt
12 Linus Stubert, Thema 4: Eddies Folie 11 Prioritätsschemata Simples Prioritätsschema ( naiver Eddy ): niedrige Priorität bei Betreten des Eddies hohe Priorität nach Verarbeitung durch Operator soll zügigen Durchlauf von Tupeln gewährleisten Lotterie-Prioritätsschema: Gutschrift eines Loses auf Konto des Operators bei Übergabe von Tupel an Operator Abzug eines Loses vom Konto des Operators bei Rückgabe von Tupel an Eddy Verlosung der Tupel unter allen zur Verfügung stehenden Operatoren, Gewinnchancen des Operators entsprechen der Anzahl seiner Tickets berücksichtigt neben Kosten auch Selektivitäten Fenster-Prioritätsschema: Abänderung des Lotterie-Schemas Ziel: Anpassung an Fluktuationen der Kosten/Selektivitäten Hinterlegung gutgeschriebener Tickets auf separatem Konto zu Beginn eines neuen Zeitfensters wird das Lotterie-Konto auf die Zahl der hinterlegten Tickets gesetzt und das Hinterlegungs-Konto wird auf 0 zurückgesetzt
13 Linus Stubert, Thema 4: Eddies Folie 12 Performance-Vergleich bei Selektionen Selektionen mit unterschiedlichen Kosten: Kosten von Selektion s1 variieren über Versuche von 1 bis 9 Kosten von Selektion s2 über alle Versuche = 5 Selektivitäten von s1 und s2 über alle Versuche = 50% Ergebnis: naiver Eddy fast genauso schnell wie die jeweils günstigere statische Reihenfolge Performance bei zwei 50%-Selektionen, s2 hat Kosten 5, s1 variiert über Anfragen
14 Linus Stubert, Thema 4: Eddies Folie 13 Selektionen mit unterschiedlichen Selektivitäten: Selektivität von s1 variiert über Versuche von 10% bis 50% Selektivität von s2 über alle Versuche = 50% Kosten von s1 und s2 über alle Versuche konstant Ergebnis: naiver Eddy erzielt Ergebnisse, die etwa mittig zwischen den beiden statischen Reihenfolgen liegen, der Lotterie-Eddy erzielt fast dieselben Ergebnisse wie die jeweils günstigere der beiden statischen Reihenfolgen Performance bei 2 Selektionen mit Kosten 5, s2 hat Selektivität 50%, s1 variiert über Anfragen
15 Linus Stubert, Thema 4: Eddies Folie 14 Performance-Vergleich bei Joins Vergleich bei konstanten Kosten über die Zeit: Anfrage auf 3 Tabellen: SELECT * FROM R, S, T WHERE R.a = S.a Hash-Ripple-Join AND S.b = T.b Index-Join Selektivität von R * S in Bezug auf S : prozentuelle Angabe der im Schnitt auf ein Tupel aus S passenden Tupel in R Selektivität von R S in Bezug auf S = 180% Selektivität von S T in Bezug auf S = 10% Ergebnis: Lotterie-Eddy fast so schnell wie optimaler Plan Performance bei einem Index- (Selektivität 10%) und einem Hash- Ripple-Join (Selektivität 180%)
16 Linus Stubert, Thema 4: Eddies Folie 15 Vergleich bei dynamischen Fluktuationen: Equijoin-Anfrage auf 3 Tabellen, davon zwei externen, auf denen jeweils ein Index besteht 2 Index-Joins, externe Tabellen als innere Relationen zu Beginn ist Index I_fs schnell und Index I_sf langsam Vertauschung der Geschwindigkeiten nach 30s beide Indices finden passendes Tupel in 1% der Fälle Ergebnis: Eddy mit Fenster-Schema erheblich schneller als beide statischen Pläne Performance bei 2 Index-Joins, deren Kosten sich nach 30s verändern
Physischer DB-Entwurf
Physischer DB-Entwurf Prof. Dr. T. Kudraß 1 Überblick Ausgangslage: Konzeptuelles und externes Schema sind erstellt: ER Modell, Schemaverfeinerung und Definition von Sichten Nächster Schritt: Physischer
Mehr6. Anfragebearbeitung
6. Anfragebearbeitung 6.1 Einleitung 6.2 Indexstrukturen 6.3 Grundlagen der Anfrageoptimierung 6.4 Logische Anfrageoptimierung 6.5 Kostenmodellbasierte Anfrageoptimierung 55 Fokus: Effiziente Berecnung
Mehr[W, T4, D, 15] [start_transaction, T3] [W, T3, C, 30] [W, T4, A, 20] [commit, T4] [W, T2, D, 25] System Crash
Übungen Aufgabe 1 Geben ist die folgende Logdatei: [start_transaction, T1] [W, T1, D, 20] [commit, T1] [checkpoint] [start_transaction, T2] [W, T2, B, 12] [start_transaction, T4] [W, T4, D, 15] [start_transaction,
MehrAnfragebearbeitung. Logische Optimierung Physische Optimierung (Kostenmodelle Tuning ) Kapitel 8 1
Anfragebearbeitung Logische Optimierung Physische Optimierung (Kostenmodelle Tuning ) Kapitel 8 1 Ablauf der Anfrageoptimierung Deklarative Anfrage (SQL) Scanner Parser Sichtenauflösung Algebraischer Ausdruck
MehrWintersemester 2016/ Matrikelnummer: Hinweise. Unterschrift
Fachbereich für Computerwissenschaften Prof. Dr. Nikolaus Augsten Jakob-Haringer-Str. 2 5020 Salzburg, Austria Telefon: +43 662 8044 6347 E-Mail: nikolaus.augsten@sbg.ac.at Datenbanken II Prüfung Wintersemester
MehrKapitel 10: Relationale Anfragebearbeitung
Ludwig Maimilians Universität München Institut für Informatik Lehr- und Forschungseinheit für Datenbanksysteme Skript zur Vorlesung Datenbanksysteme I Wintersemester 2017/2018 Kapitel 10: Relationale Anfragebearbeitung
MehrKapitel 10: Relationale Anfragebearbeitung
Ludwig Maimilians Universität München Institut für Informatik Lehr- und Forschungseinheit für Datenbanksysteme Skript zur Vorlesung Wintersemester 201/2016 Kapitel 10: Relationale Anfragebearbeitung Vorlesung:
MehrAnfrageoptimierung Physische Optimierung
Institute for Web Science & Technologies WeST Grundlagen der Datenbanken Physische Optimierung Dr. Thomas Gottron Wintersemester 01/1 Ziel der phyischen Optimierung Konkrete Implementation der Operatoren
MehrNeue Techniken der Anfragebearbeitung: Datenströme, kontinuierliche Anfragen und adaptive Auswertung. Thema 6: PSoup
FernUniversität in Hagen Seminar 01912 im Sommersemester 2005 Neue Techniken der Anfragebearbeitung: Datenströme, kontinuierliche Anfragen und adaptive Auswertung Thema 6: PSoup Carsten Wagels 1 Gliederung
MehrAufgabe 9.1: Lösung: Block-Nested-Loop-Verbund Index-Nested-Loop-Verbund Sort-Merge-Verbund Hash-Verbund
1 Aufgabe 9.1: Sei p die Größe einer Seite, hier p = 4 kb. Sei b die Größe eines Blocks in Anzahl Seiten, hier b = 100. Die Größe des Datenbankpuffers, d.h. die zur Ausführung des Verbundes im Internspeicher
MehrDatenbanken Vertiefung Wintersemester 2013/ Matrikelnummer: Hinweise. Unterschrift
Fachbereich für Computerwissenschaften Prof. Dr. Nikolaus Augsten Jakob-Haringer-Str. 2 5020 Salzburg, Austria Telefon: +43 662 8044 6347 E-Mail: nikolaus.augsten@sbg.ac.at Datenbanken Vertiefung Prüfung
MehrAnfrageverarbeitung. Einführung
Anfrageverarbeitung Prof. Dr. T. Kudraß 1 Einführung Wir betrachten die Implementierung der Operatoren der Relationenalgebra: Basis-Operationen: Selektion ( σ ) Auswahl einer Teilmenge von Tupeln aus der
MehrIndexstrukturen in SQL
Indestrukturen in SQL Anlegen eines Primärinde in SQL: Anlegen eines Sekundärinde in SQL: Bsp: create table Dozenten ( DNr integer primary key, Name varchar(0), Geburt date, ) create [Unique] inde indename
MehrAnfrageoptimierung Kostenabschätzung
Institute for Web Science & Technologies WeST Grundlagen der Datenbanken Kostenabschätzung Dr. Thomas Gottron Wintersemester 2012/13 Regel vs. Kostenbasierte Optimierung Bisher: Regeln, wie Optimierung
MehrData Cubes PG Wissensmangement Seminarphase
PG 402 - Wissensmangement Seminarphase 23.10.2001-25.10.2001 Hanna Köpcke Lehrstuhl für Künstliche Intelligenz Universität Dortmund Übersicht 1. Einführung 2. Aggregation in SQL, GROUP BY 3. Probleme mit
MehrFreispeicherverwaltung
Freispeicherverwaltung Allgemeine Techniken und Anwendung unter Linux Martin Wahl, 17.11.03 Freispeicherverwaltung 1 Überblick Allgemeines Suchstrategien Verwaltungsstrategien externer / interner Verschnitt
MehrGrundlagen von Datenbanken
Agenda: Grundlagen von Datenbanken SS 2010 3. Relationale Algebra Prof. Dr. Stefan Böttcher Universität Paderborn mit Material von Prof. Dr. Gregor Engels Grundlagen von Datenbanken - SS 2010 - Prof. Dr.
MehrPhysische Anfrageoptimierung
Web Science & Technologies University of Koblenz Landau, Germany Grundlagen der Datenbanken Dr. Jérôme Kunegis Wintersemester 201/14 Ziel der physischen Optimierung π[titel] Konkrete Implementation der
MehrAlgorithmen II Vorlesung am
Algorithmen II Vorlesung am 31.01.2013 Algorithmen für externen Speicher INSTITUT FÜR THEORETISCHE INFORMATIK PROF. DR. DOROTHEA WAGNER KIT Universität des Landes Baden-Württemberg und Algorithmen nationales
MehrAufgabe 1: Verschachtelte Anfragen
Aufgabe 1: Verschachtelte Anfragen (1 P.) (a) Betrachten Sie folgenden Ausschnitt des TPC-H Schemas: CREATE TABLE partsupp ( ps_ availqty INT, ps_ partkey INT ); CREATE TABLE lineitem ( l_ partkey INT,
Mehr9 Auswertung von Anfrageoperatoren 9.1 Selektion
9. Auswertung von Anfrageoperatoren 9.1. Selektion Seite 1 9 Auswertung von Anfrageoperatoren 9.1 Selektion Auswertung von σ[a op val]r. Index zu A, Sortierung zu A, Operator op. Auswertung von Formeln
MehrIR Seminar SoSe 2012 Martin Leinberger
IR Seminar SoSe 2012 Martin Leinberger Suchmaschinen stellen Ergebnisse häppchenweise dar Google: 10 Ergebnisse auf der ersten Seite Mehr Ergebnisse gibt es nur auf Nachfrage Nutzer geht selten auf zweite
MehrInhalt. Datenbanken 2. Literatur und Quellen. Inhalt. Anfrageoptimierung. Nikolaus Augsten. Wintersemester 2014/15
Inhalt Datenbanken 2 Anfrageoptimierung 1 Nikolaus Augsten 2 nikolaus.augsten@sbg.ac.at FB Computerwissenschaften Universität Salzburg Wintersemester 2014/15 3 4 Augsten (Univ. Salzburg) DB2 Anfrageoptimierung
MehrLiteratur: Jeffrey D. Ullman: Principles of Database Systems, 2 nd Edition 1982, Kapitel 2.2
Hashorganisation HASHORGANISATION Literatur: Jeffrey D. Ullman: Principles of Database Systems, 2 nd Edition 982, Kapitel 2.2 Die Sätze der Datei werden auf eine Menge von Buckets aufgeteilt. Jedes Bucket
MehrVorlesung Datenstrukturen
Vorlesung Datenstrukturen Graphdarstellungen Maike Buchin 0.6.017 Graphen Motivation: Graphen treten häufig als Abstraktion von Objekten (Knoten) und ihren Beziehungen (Kanten) auf. Beispiele: soziale
MehrDatenbanksysteme I Anfragebearbeitung und -optimierung Felix Naumann
Datenbanksysteme I Anfragebearbeitung und -optimierung 9.1.2008 Felix Naumann Anfragebearbeitung Grundproblem 2 Anfragen sind deklarativ. SQL, Relationale Algebra Anfragen müssen in ausführbare (prozedurale)
MehrAlgorithmen und Datenstrukturen 2-1. Seminar -
Algorithmen und Datenstrukturen 2-1. Seminar - Dominic Rose Bioinformatics Group, University of Leipzig Sommersemster 2010 Outline 1. Übungsserie: 3 Aufgaben, insgesamt 30 28 Punkte A1 Spannbäume (10 8
MehrDatenbanken. Schemaerweiterung zur Abbildung von Imperfekten Daten. Andreas Merkel
Seminar Impferfektion und Datenbanken Schemaerweiterung zur Abbildung von Imperfekten Daten Andreas Merkel Inhalt Einführung - Eigenschaften des relationalen Modells - Erweiterungsmöglichkeiten Zwei unterschiedliche
MehrAnfragebearbeitung 2. Vorlesung Datenbanksysteme vom
Vorlesung Datenbanksysteme vom 21.11.2016 Anfragebearbeitung 2 Architektur eines DBMS Logische Optimierung Physische Optimierung Kostenmodelle + Tuning Physische Optimierung Iterator: einheitliche Schnittstelle
MehrVorlesung Datenstrukturen
Vorlesung Datenstrukturen Graphen (1) Darstellung Traversierung Dr. Frank Seifert Vorlesung Datenstrukturen - Sommersemester 2016 Folie 441 Generalisierung von Bäumen Verallgemeinerung (von Listen zu Graphen)
MehrAnfrageoptimierung Kostenmodelle
Web Science & Technologies University of Koblenz Landau, Germany Grundlagen der Datenbanken Anfrageoptimierung Kostenmodelle Dr. Jérôme Kunegis Wintersemester 2013/14 Regel vs. Kostenbasierte Optimierung
MehrSchemamerging und -mapping
Schemamerging und -mapping Seminar Informationsqualität und -integration, 30.06.2006 Überblick Schemaintegration / Einleitung Ziele Integrationskonflikte Integrationstechniken Multidatenbankanfragesprachen
MehrDynamisches Huffman-Verfahren
Dynamisches Huffman-Verfahren - Adaptive Huffman Coding - von Michael Brückner 1. Einleitung 2. Der Huffman-Algorithmus 3. Übergang zu einem dynamischen Verfahren 4. Der FGK-Algorithmus 5. Überblick über
MehrMethodik zur Optimierung in Datenbanken. Anja Rommel, 14-INM
Methodik zur Optimierung in Datenbanken Anja Rommel, 14-INM 03.07.2015 Gliederung 1. Einleitung 2. Motivation und Ziele 3. Phasen der Optimierung 3.1. Phase 1: Optimierung des DB-Schemas und Anwendungsoptimierung
Mehrtechnische universität dortmund Fakultät für Informatik LS 8 Speichern von Daten Prof. Dr. Katharina Morik
Speichern von Daten Prof. Dr. Katharina Morik Unterschiede von DBMS und files! DBMS unterstützt viele Benutzer, die gleichzeitig auf dieselben Daten zugreifen concurrency control.! DBMS speichert mehr
MehrDatenbanken Vertiefung Wintersemester 2014/ Matrikelnummer: Hinweise. Unterschrift
Fachbereich für Computerwissenschaften Prof. Dr. Nikolaus Augsten Jakob-Haringer-Str. 2 5020 Salzburg, Austria Telefon: +43 662 8044 6347 E-Mail: nikolaus.augsten@sbg.ac.at Datenbanken II Prüfung Datenbanken
MehrRückblick: Datenorganisation & Indexstrukturen
Rückblick: Datenorganisation & Indexstrukturen Datenorganisation der Tupel einer Relation als Haufen, sequenzielle Datei oder indexsequenzielle Datei Indexstrukturen zum effizienteren Zugriff auf Datensätze
MehrKommunikation und Datenhaltung
Kommunikation und Datenhaltung Anfrageoptimierung Überblick über den Datenhaltungsteil Einleitung und Grundlagen Architektur von Datenbanksystemen Datenbankanfragen Relationenmodell und Relationenalgebra
MehrStar Join & Kostenbasierte Optimierung. Architektur von Datenbanksystemen II
Star Join & Kostenbasierte Optimierung Architektur von Datenbanksystemen II Star Join Übungsaufgabe zum 09.06.2015 JOIN-ALGORITHMUS für folgendes Scenario Große Faktentabelle F mit sehr vielen Einträgen
MehrVorlesung Datenstrukturen
Vorlesung Datenstrukturen Kürzeste Wege Maike Buchin 4. und 6.7.2017 Einführung Motivation: Bestimmung von kürzesten Wegen ist in vielen Anwendungen, z.b. Routenplanung, ein wichtiges Problem. Allgemeine
Mehr4. Relationenalgebra. Einleitung. Selektion und Projektion Mengenoperatoren. Verbundoperationen (Join) Division Beispielanfragen
Einleitung 4. Relationenalgebra Selektion und Projektion Mengenoperatoren Vereinigung, Durchschnitt, Differenz kartesisches Produkt Verbundoperationen (Join) Theta-Join natürlicher Verbund Semi-Join äußerer
MehrAlgorithmen auf Sequenzen
Algorithmen auf Sequenzen Vorlesung von Prof. Dr. Sven Rahmann im Sommersemester 2008 Kapitel 4 Reguläre Ausdrücke Webseite zur Vorlesung http://ls11-www.cs.tu-dortmund.de/people/rahmann/teaching/ss2008/algorithmenaufsequenzen
MehrFachPraktikum 1590 Erweiterbare Datenbanksysteme. Aufgaben Phase 1
FachPraktikum 1590 Erweiterbare Datenbanksysteme Aufgaben Phase 1 Wintersemester 2004/2005 Ralf Hartmut Güting, Dirk Ansorge, Thomas Behr, Markus Spiekermann Praktische Informatik IV, Fernuniversität Hagen
MehrVorlesung Datenstrukturen
Vorlesung Datenstrukturen Heaps Dr. Frank Seifert Vorlesung Datenstrukturen - Sommersemester 2016 Folie 469 Prioritätswarteschlange Problem Häufig ist das Prinzip einer einfachen Warteschlangen-Datenstruktur
MehrIMPLEMENTIERUNG VON OPERATIONEN AUF RELATIONEN
Joins 1 Literatur IMPLEMENTIERUNG VON OPERATIONEN AUF RELATIONEN A. Kemper, A. Eickler: Datenbanksysteme Eine Einführung, 8. Auflage Oldenburg Verlag, 2011, ISBN 978-3-486-59834-6 (als E-Book mit dem Übungsbuch
MehrInhalt. Datenbanken Vertiefung. Literatur und Quellen. Inhalt. Anfragebearbeitung. Nikolaus Augsten. Wintersemester 2013/14
Inhalt Datenbanken Vertiefung Anfragebearbeitung Nikolaus Augsten nikolaus.augsten@sbg.ac.at FB Computerwissenschaften Universität Salzburg 1 Einführung 2 Anfragekosten anschätzen 3 4 Wintersemester 2013/14
MehrRelationale Algebra Datenbanken I (Systemorientierte Informatik IV) Sommersemester Mengenoperationen
Concept Content.. Information Topic Relationale Algebra Datenbanken I (Systemorientierte Informatik IV) Sommersemester 2007 Gunar Fiedler (fiedler@is.informatik.uni-kiel.de) Institut für Informatik Arbeitsgruppe
MehrÜbung Datenbanksysteme II Anfrageausführung
Übung Datenbanksysteme II Anfrageausführung Leon Bornemann Folien basierend auf Maximilian Jenders, Thorsten Papenbrock Einleitung: Themen 2 Iterator-Operatoren Algorithmen-Klassen Sort-basierte Hash-basierte
MehrAggregatfunktionen in der Relationenalgebra?
Aggregatfunktionen in der Relationenalgebra? Dieter Sosna Aggregatfunktionen in der Relationenalgebra p.1/23 Gliederung Motivation Begriffe Definitionen Anwendungen Zusammenfassung Aggregatfunktionen in
MehrJoins / Implementierung von Joins
Join wichtigste Operation, insbesondere in relationalen DBS: komplexe Benutzeranfragen (Star-Joins) Normalisierung der Relationen (Snowflake-Schema) verschiedene Sichten ( views ) auf die Basisrelationen
MehrDatenbanken 2. Anfragebearbeitung. Nikolaus Augsten. FB Computerwissenschaften Universität Salzburg. Version 1.
Datenbanken 2 Anfragebearbeitung Nikolaus Augsten nikolaus.augsten@sbg.ac.at FB Computerwissenschaften Universität Salzburg Version 1. Juni 2017 Wintersemester 2017/18 Augsten (Univ. Salzburg) DB2 Anfragebearbeitung
MehrDatenstrukturen und Algorithmen (SS 2013)
Datenstrukturen und Algorithmen (SS 2013) Übungsblatt 10 Abgabe: Montag, 08.07.2013, 14:00 Uhr Die Übungen sollen in Gruppen von zwei bis drei Personen bearbeitet werden. Schreiben Sie die Namen jedes
MehrData Cube. 1. Einführung. 2. Aggregation in SQL, GROUP BY. 3. Probleme mit GROUP BY. 4. Der Cube-Operator. 5. Implementierung des Data Cube
Data Cube 1. Einführung 2. Aggregation in SQL, GROUP BY 3. Probleme mit GROUP BY 4. Der Cube-Operator 5. Implementierung des Data Cube 6. Zusammenfassung und Ausblick Dank an Hanna Köpcke! 1 On-line Analytical
MehrVorlesung Wissensentdeckung in Datenbanken
Vorlesung Wissensentdeckung in Datenbanken Data Cube Katharina Morik, Uwe Ligges Informatik LS 8 22.04.2010 1 von 26 Gliederung 1 Einführung 2 Aggregation in SQL, GROUP BY 3 Probleme mit GROUP BY 4 Der
MehrKapitel 6 Externes Sortieren
Kapitel 6 Externes Sortieren Überblick Two-Way Merge Sort External Merge Sort Kostenminimierung B+ Bäume zur Sortierung 1 Architektur und Implementierung von Datenbanksystemen WS 2009/10 Melanie Herschel
MehrAlgorithmen für Sortierung und relationale Operatoren
Algorithmen für Sortierung und relationale Operatoren In diesem Kapitel betrachten wir folgende Themen: 1. Relationale Operatoren und Sortieroperator 2. Grundlegende Operationen: Tabellen-Scan, Index-Scan,
MehrHallo Welt für Fortgeschrittene
Hallo Welt für Fortgeschrittene Geometrie II Benjamin Zenke Informatik 2 Programmiersysteme Martensstraße 3 91058 Erlangen Inhalt Closest Pair Divide & Conquer Bereichssuche Gitterverfahren k-d-tree Sweep-Line-Algorithmen
MehrDatenbanken Vertiefung
Datenbanken Vertiefung Anfrageoptimierung Nikolaus Augsten nikolaus.augsten@sbg.ac.at FB Computerwissenschaften Universität Salzburg Wintersemester 2013/14 Augsten (Univ. Salzburg) DBV / Anfrageoptimierung
MehrVorlesung Wissensentdeckung in Datenbanken
Gliederung Vorlesung Wissensentdeckung in Datenbanken Data Cube Katharina Morik, Claus Weihs 14.07.2009 1 Einführung 2 Aggregation in SQL, GROUP BY 3 Probleme mit GROUP BY 4 Der Cube-Operator 5 Implementierung
MehrAlgorithmen und Datenstrukturen
Technische Universität München SoSe 2017 Fakultät für Informatik, I-16 Lösungsblatt 4 Dr. Stefanie Demirci 31. Mai 2017 Rüdiger Göbl, Mai Bui Algorithmen und Datenstrukturen Aufgabe 1 Komplexität Berechnung
Mehr5 BINÄRE ENTSCHEIDUNGS- DIAGRAMME (BDDS)
5 BINÄRE ENTSCHEIDUNGS- DIAGRAMME (BDDS) Sommersemester 2009 Dr. Carsten Sinz, Universität Karlsruhe Datenstruktur BDD 2 1986 von R. Bryant vorgeschlagen zur Darstellung von aussagenlogischen Formeln (genauer:
MehrAnfrageverarbeitung. Prof. Dr. T. Kudraß 1
Anfrageverarbeitung Prof. Dr. T. Kudraß 1 Einführung Wir betrachten die Implementierung der Operatoren der Relationenalgebra: Basis-Operationen: Selektion ( s ) Auswahl einer Teilmenge von Tupeln aus der
MehrKap. 3 Relationenmodell mit relationaler Algebra
Kap. 3 Relationenmodell mit relationaler Algebra Kap. 3.1. Trägermenge Seien D 1, D 2,..., D k Domänen: (Typen, Arten, Sorten, Wertmengen) z.b. string integer real Boolean DateTime BLOB, TIFF-image, HTML-Doc,
Mehr7. Sortieren Lernziele. 7. Sortieren
7. Sortieren Lernziele 7. Sortieren Lernziele: Die wichtigsten Sortierverfahren kennen und einsetzen können, Aufwand und weitere Eigenschaften der Sortierverfahren kennen, das Problemlösungsparadigma Teile-und-herrsche
MehrDatenbanksysteme I Anfragebearbeitung und -optimierung Felix Naumann
Datenbanksysteme I Anfragebearbeitung und -optimierung 22.6.2009 Felix Naumann Anfragebearbeitung Grundproblem 2 Anfragen sind deklarativ. SQL, Relationale Algebra Anfragen müssen in ausführbare (prozedurale)
MehrAccess Path Selection in a Relational Database Management System. Access Path Selection Edgar Näther
Access Path Selection in a Relational Database Management System Gliederung 2 Einführung Zugriffswege für eine Relation Einsatz von Statistiken / Selektivitätsfaktoren Kostenformeln für eine Relation Auswahl
MehrBerechnung approximierter Voronoi-Zellen auf geometrischen Datenströmen
Definition Berechnung approximierter Voronoi-Zellen auf geometrischen Datenströmen Seminar über Algorithmen WS 2005/2006 Vorgetragen von Oliver Rieger und Patrick-Thomas Chmielewski basierend auf der Arbeit
MehrTheoretische Informatik. Exkurs: Komplexität von Optimierungsproblemen. Optimierungsprobleme. Optimierungsprobleme. Exkurs Optimierungsprobleme
Theoretische Informatik Exkurs Rainer Schrader Exkurs: Komplexität von n Institut für Informatik 13. Mai 2009 1 / 34 2 / 34 Gliederung Entscheidungs- und Approximationen und Gütegarantien zwei Greedy-Strategien
MehrDatenbanksysteme Kapitel 5: SQL - Grundlagen
Datenbanksysteme Kapitel 5: SQL - Grundlagen Prof. Dr. Peter Chamoni Mercator School of Management Lehrstuhl für Wirtschaftsinformatik, insb. Business Intelligence Prof. Dr. Prof. Peter Dr. Chamoni Peter
MehrDatenbanksysteme Kapitel 5: SQL Grundlagen Teil 1
Datenbanksysteme Kapitel 5: SQL Grundlagen Teil 1 Prof. Dr. Peter Chamoni Mercator School of Management Lehrstuhl für Wirtschaftsinformatik, insb. Business Intelligence Prof. Prof. Dr. Dr. Peter Peter
MehrGeoinformation Abbildung auf Tabellen
Folie 1 von 32 Geoinformation Abbildung auf Tabellen Folie 2 von 32 Abbildung auf Tabellen Übersicht Motivation des relationalen Datenmodells Von Objekten zu Tabellen Abbildung von Objekten Schlüssel Abbildung
MehrGrundlagen der Programmierung
Grundlagen der Programmierung Algorithmen und Datenstrukturen Die Inhalte der Vorlesung wurden primär auf Basis der angegebenen Literatur erstellt. Darüber hinaus sind viele Teile direkt aus der Vorlesung
MehrOperator-Kostenmodelle für Fortschrittsschätzung und Opt. Datenbanksystemen
Operator-Kostenmodelle für und Optimierung in Datenbanksystemen 23. Oktober 2012 Übersicht 1 Grundlagen Ziele der Arbeit Grundlagen Kostenmodelle Neues Framework Entwickelte Hilfsmittel 2 3 Ziele der Arbeit
MehrDATENSTRUKTUREN UND ALGORITHMEN
DATENSTRUKTUREN UND ALGORITHMEN 2 Ist die Datenstruktur so wichtig??? Wahl der Datenstruktur wichtiger Schritt beim Entwurf und der Implementierung von Algorithmen Dünn besetzte Graphen und Matrizen bilden
MehrTeil III. Komplexitätstheorie
Teil III Komplexitätstheorie 125 / 160 Übersicht Die Klassen P und NP Die Klasse P Die Klassen NP NP-Vollständigkeit NP-Vollständige Probleme Weitere NP-vollständige Probleme 127 / 160 Die Klasse P Ein
MehrGrundlagen: Algorithmen und Datenstrukturen
Grundlagen: Algorithmen und Datenstrukturen Prof. Dr. Hanjo Täubig Lehrstuhl für Effiziente Algorithmen (Prof. Dr. Ernst W. Mayr) Institut für Informatik Technische Universität München Sommersemester 2010
MehrSuchbäume. Suchbäume. Einfügen in Binären Suchbäumen. Suchen in Binären Suchbäumen. Prinzip Suchbaum. Algorithmen und Datenstrukturen
Suchbäume Suchbäume Prinzip Suchbaum Der Wert eines Knotens wird als Schlüssel verstanden Knoten kann auch weitere Daten enthalten, die aber hier nicht weiter betrachtet werden Werte der Schlüssel müssen
MehrEntwurf und Analyse von Datenstrukturen
Entwurf und Analyse von Datenstrukturen Sommersemester 2013 1. Termin: 17. April 2013 Jan-Henrik Haunert ehem. Mathebau, Raum E27 jan.haunert@uni-wuerzburg.de Alexander Wolff ehem. Mathebau, Raum E29 alexander.wolff@uni-wuerzburg.de
MehrInhalt. Datenbanken 2. Literatur und Quellen. Inhalt. Anfragebearbeitung. Nikolaus Augsten. Wintersemester 2017/18
Inhalt Datenbanken 2 Anfragebearbeitung 1 Einführung Nikolaus Augsten 2 Anfragekosten anschätzen nikolausaugsten@sbgacat FB Computerwissenschaften Universität Salzburg Version 1 Juni 2017 Wintersemester
MehrDownload:.../~rieche. gehalten am 2. Februar 2004. Stephan Rieche. Vortrag. Thema: Index Selection. von. Seminar Advanced Data Warehouse
Seminar Advanced Data Warehouse Thema: Index Selection Vortrag von Stephan Rieche gehalten am 2. Februar 2004 Download:.../~rieche Inhalt des Vortrages 1. Einleitung - Was ist das Index Selection Problem?
MehrRandomisierte Datenstrukturen
Seminar über Algorithmen DozentInnen: Helmut Alt, Claudia Klost Randomisierte Datenstrukturen Ralph Schäfermeier 13. 2. 2007 Das Verwalten von Mengen, so dass ein schneller Zugriff auf deren Elemente gewährleistet
MehrGraphdurchmusterung, Breiten- und Tiefensuche
Prof. Thomas Richter 18. Mai 2017 Institut für Analysis und Numerik Otto-von-Guericke-Universität Magdeburg thomas.richter@ovgu.de Material zur Vorlesung Algorithmische Mathematik II am 18.05.2017 Graphdurchmusterung,
MehrHash-Join Algorithmen
Hash-Join lgorithmen dvanced Topics in Databases Ws08/09 atthias ichly Einleitung 2 Grundlage ist das Paper: Join Processing in Database Systems With Large ain emories Quelle: C Transactions on Database
MehrInformatik II, SS 2014
Informatik II SS 2014 (Algorithmen & Datenstrukturen) Vorlesung 20 (23.7.2014) All Pairs Shortest Paths, String Matching (Textsuche) Algorithmen und Komplexität Vorlesungsevaluation Sie sollten alle eine
MehrDatenbanken: Indexe. Motivation und Konzepte
Datenbanken: Indexe Motivation und Konzepte Motivation Warum sind Indexstrukturen überhaupt wünschenswert? Bei Anfrageverarbeitung werden Tupel aller beteiligter Relationen nacheinander in den Hauptspeicher
MehrÜBUNGSKLAUSUR Studienhalbjahr: 2. Semester. Datum: 20. Juli 2016 Bearbeitungszeit: 90 Minuten. Modul: T2INF Dozent: Stephan Schulz
Matrikelnummer: Fakultät Studiengang: Jahrgang / Kurs : Technik Angewandte Informatik 01 B/C/K ÜBUNGSKLAUSUR Studienhalbjahr:. Semester Datum: 0. Juli 01 Bearbeitungszeit: 90 Minuten Modul: TINF100.1 Dozent:
MehrSRC SimTech: Global Sensor Grid Status
SRC SimTech: Global Sensor Grid Status 21. Juli 2009 Agenda Bisherige Kooperationsvorhaben IWS Simulation der Strömungsverhältnisse im Bodensee Status der laufenden Kooperationen IKE/WN Simulation von
MehrAusgewählte Kapitel eingebetteter Systeme
Ausgewählte Kapitel eingebetteter Systeme Echtzeitfähige Ereignisgetriebene Scheduling-Strategien Friedrich-Alexander-Universität Erlangen-Nürnberg 08.06.2005 Übersicht Problemdefinition Scheduling-Strategien
MehrOptimierung von Datenbanken
Optimierung von Datenbanken Vortrag in Datenbanken II Bettina Keil 19. Juni 2008 Optimierung von Datenbanken 1/17 Gliederung Motivation Optimierung von Datenbanken 2/17 Motivation Performancesteigerung:
MehrIndexe in Dateien. Thomas Behr. 19.November c 2015 FernUniversität in Hagen
Indexe in Dateien Fakultät für Mathematik und Informatik Datenbanksysteme für neue Anwendungen FernUniversität in Hagen 19.November 2015 c 2015 FernUniversität in Hagen Indexe ermöglichen schnellen Zugriff
MehrPackalgorithmen für quaderförmige Objekte. Ilia Belozerov
Packalgorithmen für quaderförmige Objekte Ilia Belozerov 1. Motivation 2. Definitionen und Sätze 3. Exakte Lösungsverfahren 4. Heuristische Methoden 5. Vergleich der Heuristiken Übersicht Bedeutung von
MehrVorlesung Wissensentdeckung in Datenbanken
Vorlesung Wissensentdeckung in Datenbanken Data Cube Katharina Morik, Claus Weihs 21.04.2015 1 von 40 Gliederung 1 Einführung 2 Aggregation in SQL, GROUP BY 3 Probleme mit GROUP BY 4 Der Cube-Operator
Mehr