Data Preprocessing II

Größe: px
Ab Seite anzeigen:

Download "Data Preprocessing II"

Transkript

1 Seminar Business Intelligence Data Preprocessing II Sabine Queckbörner DATA PREPROCESSING II Übersicht Reduktion Numerosity Reduction Diskretisierung von Datenwerten Kompression Kompression multidimensionaler Daten 1

2 Reduktion Numerosity Reduction Diskretisierung von Datenwerten Kompression Kompression multidimensionaler Daten Data Cubes verschiedene Abstraktionsebenen Jede Abstraktionsebene reduziert die Größe der resultierenden Daten Die höchste Abstraktionsebene und damit die größte Reduktion, wird mit der Aggregation aller Teilwürfel zu einem Gesamtwürfel erreicht. 2

3 Data Cubes - Beispiel Filiale 4 Filiale 3 Filiale 2 Filiale Ablufttrockner Kondenstrockner Spülmaschinen Waschmaschinen Wieviele Waschmaschinen wurden im ganzen Jahr in den Filialen verkauft? Waschmaschinen Quartal Filiale 4 Filiale 3 Filiale 2 Filiale 1 1 Data Cubes - Beispiel Filiale 4 Filiale 3 Filiale 2 Filiale Quartal Ablufttrockner Kondenstrockner Spülmaschinen Waschmaschinen Wieviele Waschmaschinen wurden im ganzen Jahr in den Filialen verkauft? Filiale 4 Filiale 3 Filiale 2 Filiale 1 1 Waschm. Waschmaschinen Filiale 4 Filiale 3 - Filiale 2 1 Filiale 1 3

4 Reduktion Numerosity Reduction Diskretisierung von Datenwerten Kompression Kompression multidimensionaler Daten Auswahlverfahren: Schrittweise Vorwärtsauswahl Start Lösungsmenge Ausgangsmenge y z x z Auswahl y x Ende y x z 4

5 Auswahlverfahren: Schrittweise Vorwärtsauswahl Schrittweise Rückwärtseliminierung Start Lösungsmenge Ausgangsmenge y z x y z x z y Eliminierung x Ende z y Auswahlverfahren: Schrittweise Vorwärtsauswahl Schrittweise Rückwärtseliminierung Kombination aus beiden Verfahren Start Lösungsmenge Ausgangsmenge z Auswahl x z y y Eliminierung x Ende z y 5

6 Numerosity Reduction Reduktion Numerosity Reduction Diskretisierung von Datenwerten Kompression Kompression multidimensionaler Daten Numerosity Reduktion Histogramme

7 Numerosity Reduktion Histogramme Clustering Numerosity Reduktion Histogramme Clustering Sampling Einfache zufällige Stichprobe ohne Ersetzung Einfache zufällige Stichprobe mit Ersetzung Cluster-Stichprobe Schichtenweise Stichproben

8 Diskretisierung Reduktion Numerosity Reduction Diskretisierung von Datenwerten Kompression Kompression multidimensionaler Daten Diskretisierung Numerische Daten Binning Histogramm - Analyse Cluster - Analyse Segmentierung durch natürliche Partitionierung Regel 8

9 Diskretisierung Regel 3, 6, oder 9 unterschiedliche Werte Bereich in 3 Intervalle (2-3-2 für sieben) aufteilen 2, 4 oder 8 unterschiedliche Werte Bereich in 4 gleichweite Intervalle aufteilen 1, 5 oder 10 unterschiedliche Werte Bereich in 5 gleichweite Intervalle aufteilen Diskretisierung Regel Beispiel:

10 Diskretisierung Regel Beispiel: verschiedene Werte Diskretisierung Regel Beispiel: verschiedene Werte verschiedene Werte

11 KOMPRESSION Reduktion Multidimensionale Daten Numerosity Reduction Diskretisierung von Datenwerten Kompression Kompression multidimensionaler Daten KOMPRESSION Multidimensionale Daten Transformationskodierung Prinzip: Transformation Daten anders darstellen Zum Beispiel Fourier-Transformation, Cosinus- Transformation, Wavelet-Transformation Quantisierung Wertebereich der Bildpunkte einschränken Kodierung Binärkodierung zum Beispiel durch Lauflängenkodierung 11

12 KOMPRESSION Multidimensionale Daten Wavelet-Transformation - Prinzip: 1. Tiefpassfilterung 2. Tiefpassfilterung Ursprungsbild 1.Transformation 2.Transformation Immer kleiner werdende Hochpassanteile und ein einziger Tiefpassanteil KOMPRESSION Multidimensionale Daten Wavelet-Transformation - Beispiel: H1 Dx1 H2 Dx1 Dy1 Dxy1 Dy1 Dxy1 12

13 KOMPRESSION Reduktion Numerosity Reduction Diskretisierung von Datenwerten Kompression Kompression multidimensionaler Daten KOMPRESSION Dictionary-basierte Algorithmen Statistische Kodierer Borrows-Wheeler-Transformation 13

14 KOMPRESSION Dictionary-basierte Algorithmen Statistische Kodierer Borrows-Wheeler-Transformation Zeichenkette umsortieren kodieren KOMPRESSION Dictionary-basierte Algorithmen Statistische Kodierer Borrows-Wheeler-Transformation Zeichenkette umsortieren quadratische Matrix erstellen Zeilen der Matrix alphabetisch sortieren Ausgabe: letzte Spalte Position der Ausgangszeichenkette in sortierter Matrix kodieren 14

15 KOMPRESSION Borrows-Wheeler-Transformation Beispiel: Ausgabe: oohbaallll, 1 KOMPRESSION Borrows-Wheeler-Transformation Beispiel: Eingabe: oohbaallll, 1 B B T F 0 3 B H 1 2 H a 2 4 a l 3 5 a l 4 6 l o 5 l B 6 8 l a 9 l l 8 0 o l 9 1 o o 1 15

16 DATA PREPROCESSING II Zusammenfassung Reduktion,, Numerosity Reduction, Diskretisierung Kompression Multidimensionale Daten und Zeichenketten Vielen Dank 16

Data Preprocessing II

Data Preprocessing II Seminar Business Intelligence OLAP & Data Warehousing Ausarbeitung zum Thema Data Preprocessing II Sabine Queckbörner s_queckb@informatik.uni-kl.de SS 2003 Data Preprocessing II Datenreduktion und Kompression

Mehr

Universität Trier. Fachbereich IV. Wintersemester 2004/2005. Wavelets made easy. Kapitel 2 Mehrdimensionale Wavelets und Anwendungen

Universität Trier. Fachbereich IV. Wintersemester 2004/2005. Wavelets made easy. Kapitel 2 Mehrdimensionale Wavelets und Anwendungen Universität Trier Fachbereich IV Wintersemester 2004/2005 Wavelets made easy Kapitel 2 Mehrdimensionale Wavelets und Anwendungen Thomas Queckbörner 16.11.2004 Übersicht des Kapitels: 1. Einführung 2. Zweidimensionale

Mehr

Seminar Business Intelligence Teil II. Data Mining & Knowledge Discovery

Seminar Business Intelligence Teil II. Data Mining & Knowledge Discovery Seminar Business Intelligence Teil II Data Mining & Knowledge Discovery Was ist Data Mining? Sabine Queckbörner Was ist Data Mining? Data Mining Was ist Data Mining? Nach welchen Mustern wird gesucht?

Mehr

Inhaltsverzeichnis. 4 Statistik Einleitung Wahrscheinlichkeit Verteilungen Grundbegriffe 98

Inhaltsverzeichnis. 4 Statistik Einleitung Wahrscheinlichkeit Verteilungen Grundbegriffe 98 Inhaltsverzeichnis 1 Datenbehandlung und Programmierung 11 1.1 Information 11 1.2 Codierung 13 1.3 Informationsübertragung 17 1.4 Analogsignale - Abtasttheorem 18 1.5 Repräsentation numerischer Daten 20

Mehr

1 Einführung. Bildformate Analyse der LSB-Ersetzung Weitere steganographische Algorithmen. Syndromkodierung in der Steganographie

1 Einführung. Bildformate Analyse der LSB-Ersetzung Weitere steganographische Algorithmen. Syndromkodierung in der Steganographie Gliederung Einführung 1 Einführung 2 3 4 WS 2012/2013 Steganographie und Multimedia-Forensik Folie 121 Farbwahrnehmung Blau: 435,8 nm Grün: 546,1 nm Rot: 700 nm (445 nm) (535 nm) (575 nm) Empfindlichkeit

Mehr

Theorie-Teil: Aufgaben 1-3: 30 Punkte Programmier-Teil: Aufgaben 4-9: 60 Punkte

Theorie-Teil: Aufgaben 1-3: 30 Punkte Programmier-Teil: Aufgaben 4-9: 60 Punkte Hochschule RheinMain WS 2018/19 Prof. Dr. D. Lehmann Probe-Klausur zur Vorlesung Ökonometrie Theorie-Teil: Aufgaben 1-3: 30 Punkte Programmier-Teil: Aufgaben 4-9: 60 Punkte (die eigentliche Klausur wird

Mehr

Unterschiede in Dateien mit diff

Unterschiede in Dateien mit diff Unterschiede in Dateien mit diff diff datei1 datei2 vergleicht die Inhalte der beiden Dateien zeilenweise (bei Verzeichnissen die enthaltenen Dateien) und gibt die sich unterscheidenen Zeilen auf stdout

Mehr

Datenkompression. Vortrag von Markus Durzinsky Student der Otto-von-Guericke-Universität Magdeburg

Datenkompression. Vortrag von Markus Durzinsky Student der Otto-von-Guericke-Universität Magdeburg Vortrag am 25. Januar 200 Werner von Siemens Gymnasium Magdeburg Zeitansatz: 5h (inklusive Programmieraufgaben) Datenkompression Vortrag von Markus Durzinsky Student der Otto-von-Guericke-Universität Magdeburg

Mehr

Data Mining 2-1. Kapitel 2: Finding Similar Items. Johannes Zschache Wintersemester 2018/19

Data Mining 2-1. Kapitel 2: Finding Similar Items. Johannes Zschache Wintersemester 2018/19 Data Mining Kapitel 2: Finding Similar Items Johannes Zschache Wintersemester 28/9 Abteilung Datenbanken, Universität Leipzig http://dbs.uni-leipzig.de Data Mining 2- WS 28/9 2-2 Data Mining WS 28/9 Übersicht

Mehr

Kompression. Kompression. Beseitigung der unnötigen Daten... Redundanz. Folie 2

Kompression. Kompression. Beseitigung der unnötigen Daten... Redundanz. Folie 2 Kompression Kompression Encoder Decoder Beseitigung der unnötigen Daten... Redundanz Folie 2 1 Inhalte Redundanz Channel Encoding Loss-less Compression Hufmann Coding Runlength Coding Lossy Compression

Mehr

Multimediatechnik / Video

Multimediatechnik / Video Multimediatechnik / Video Video-Kompression Zusammenfassung http://www.nanocosmos.de/lietz/mtv 2009 1 Motivation: Video-Kompression Unkomprimierte Datenmengen sind zu groß! TV: 20 MB/s = 72 GB/h (720x576x2x25)

Mehr

Vorlesung 7 GRAPHBASIERTE BILDSEGMENTIERUNG

Vorlesung 7 GRAPHBASIERTE BILDSEGMENTIERUNG Vorlesung 7 GRAPHBASIERTE BILDSEGMENTIERUNG 195 Bildsegmentierung! Aufgabe: Bestimme inhaltlich zusammenhängende, homogene Bereiche eines Bildes! Weit verbreitetes Problem in der Bildverarbeitung! Viele

Mehr

PG-402 Wissensmanagement: Zeitreihen in Datenbanken

PG-402 Wissensmanagement: Zeitreihen in Datenbanken PG-402 Wissensmanagement: Zeitreihen in Datenbanken 07.05.2002 Klaus Unterstein 07.05.02 PG402 Wissensmanagement Zeitreihen in Datenbanken 1 Übersicht Zeitreihen Schritte bei der Zeitreihenanalyse Anwendungsfallbeispiel:

Mehr

Algorithmen zur optimalen Quantisierung von Signalen

Algorithmen zur optimalen Quantisierung von Signalen Algorithmen zur optimalen Quantisierung von Signalen Flavius Guiaş Universität Dortmund Habilitationsvortrag, 7.02.2007 INHALT 1 Mathematische Grundlagen 2 Ein effizienter Algorithmus für die skalare Quantisierung

Mehr

Streaming Data: Das Modell

Streaming Data: Das Modell Streaming Data: Das Modell Berechnungen, bei fortlaufend einströmenden Daten (x t t 0), sind in Echtzeit zu erbringen. Beispiele sind: - Verkehrsmessungen im Internet, - Datenanalyse in der Abwehr einer

Mehr

1. Referenzpunkt Transformation

1. Referenzpunkt Transformation 2.3 Featurereduktion Idee: Anstatt Features einfach wegzulassen, generiere einen neuen niedrigdimensionalen Featureraum aus allen Features: Redundante Features können zusammengefasst werden Irrelevantere

Mehr

Kompression und Datenformate. Grundlagen der Bildspeicherung, Kompressionsverfahren, Datenformate

Kompression und Datenformate. Grundlagen der Bildspeicherung, Kompressionsverfahren, Datenformate Kompression und Datenformate Grundlagen der Bildspeicherung, Kompressionsverfahren, Datenformate AGENDA Digitale Speicherung von Bildern Digitalisierung Informationsgehalt Speicherbedarf Kompression von

Mehr

Statistics, Data Analysis, and Simulation SS 2017

Statistics, Data Analysis, and Simulation SS 2017 Statistics, Data Analysis, and Simulation SS 2017 08.128.730 Statistik, Datenanalyse und Simulation Dr. Michael O. Distler Mainz, 4. Mai 2017 Dr. Michael O. Distler

Mehr

Lernende Vektorquantisierung

Lernende Vektorquantisierung Lernende Vektorquantisierung (engl. Learning Vector Quantization) Rudolf Kruse Neuronale Netze 5 Motivation Bisher: festes Lernen, jetzt freies Lernen, d.h. es existieren keine festgelegten Klassenlabels

Mehr

Image Compression. Kompression. Beseitigung der unnötigen Daten... Redundanz. Vorlesung FH-Hagenberg SEM. Backfrieder-Hagenberg. Backfrieder-Hagenberg

Image Compression. Kompression. Beseitigung der unnötigen Daten... Redundanz. Vorlesung FH-Hagenberg SEM. Backfrieder-Hagenberg. Backfrieder-Hagenberg Image Compression Vorlesung FH-Hagenberg SEM Kompression Encoder Decoder Beseitigung der unnötigen Daten... Redundanz 1 Inhalte Redundanz Error-Free Compression Hufmann Coding Runlength Coding Lossy Compression

Mehr

J.P.E.G. Standard. J.P.E.G. Eigenschaften. J.P.E.G. System. JPEG Verschlüsselungsschritte. Farbmodell

J.P.E.G. Standard. J.P.E.G. Eigenschaften. J.P.E.G. System. JPEG Verschlüsselungsschritte. Farbmodell Inhaltsbasierte Bildsuche J.P.E.G = Joint Photographic Expert Group Informatica Feminale Universität Bremen, Aug. 2005 Maja Temerinac Albert-Ludwigs-Universität Freiburg J.P.E.G. Standard Standard zur

Mehr

Image Compression. Kompression. Beseitigung der unnötigen Daten... Redundanz. Vorlesung FH-Hagenberg SEM. Backfrieder-Hagenberg. Backfrieder-Hagenberg

Image Compression. Kompression. Beseitigung der unnötigen Daten... Redundanz. Vorlesung FH-Hagenberg SEM. Backfrieder-Hagenberg. Backfrieder-Hagenberg Image Compression Vorlesung FH-Hagenberg SEM Kompression Encoder Decoder Beseitigung der unnötigen Daten... Redundanz 1 Inhalte Redundanz Channel Encoding Error-Free Compression Hufmann Coding Runlength

Mehr

Optimierung. Vorlesung 08

Optimierung. Vorlesung 08 Optimierung Vorlesung 08 Heute Dualität Ganzzahligkeit Optimierung der Vorlesung durch Evaluierung 2 Das duale LP Das primale LP Maximiere c T x unter Ax b, x R d 0. wird zu dem dualen LP Minimiere b T

Mehr

Projektbericht. Evaluation und Ableitung von Ergebnissen anhand eines Fragebogens zur Studentensituation an der Hochschule Wismar

Projektbericht. Evaluation und Ableitung von Ergebnissen anhand eines Fragebogens zur Studentensituation an der Hochschule Wismar Business Intelligence Master Digitale Logistik und Management Projektbericht Evaluation und Ableitung von Ergebnissen anhand eines Fragebogens zur Studentensituation an der Hochschule Wismar Matthias Säger

Mehr

Hauptdiplomklausur Informatik Februar 2006: Multimedia Systems

Hauptdiplomklausur Informatik Februar 2006: Multimedia Systems Universität Mannheim Fakultät für Mathematik und Informatik Lehrstuhl für Praktische Informatik IV Prof. Dr.-Ing. W. Effelsberg Hauptdiplomklausur Informatik Februar 2006: Multimedia Systems Name: Matrikel-Nr.:

Mehr

Grafikformate: JPG - PNG

Grafikformate: JPG - PNG Grafikformate: JPG - PNG JPG JPG ist die Kurzform von JPEG (Joint Photographic Experts Group) Das Dateiformat nennt sich eigentlich JFIF (JPEG File Interchange Format) Spezifikation Bezeichnungen JPEG

Mehr

Ranking by Reordering Tobias Joppen

Ranking by Reordering Tobias Joppen Ranking by Reordering Tobias Joppen 09.07.2014 Fachbereich Informatik Knowledge Engineering Prof. Johannes Fürnkranz 1 Überblick Einleitung Rank-differential Methode Idee Problemdefinition Beispiel Vereinfachung

Mehr

Statistics, Data Analysis, and Simulation SS 2017

Statistics, Data Analysis, and Simulation SS 2017 Mainz, 8. Mai 2017 Statistics, Data Analysis, and Simulation SS 2017 08.128.730 Statistik, Datenanalyse und Simulation Dr. Michael O. Distler Dr. Michael O. Distler

Mehr

ffl Die Portable Bitmap Utilities (PBM) manipulieren monochrome Bilder. ffl Die Portable Greymap Utilities (PGM) manipulieren Grauwert-Bilder.

ffl Die Portable Bitmap Utilities (PBM) manipulieren monochrome Bilder. ffl Die Portable Greymap Utilities (PGM) manipulieren Grauwert-Bilder. Kapitel 9 Pixeldateiformate Es gibt diverse Formate, in denen die generierten Grafiken abgespeichert werden können Stellvertretend soll hier nur auf 2 Formate eingegangen werden; eines, bei dem die Pixel

Mehr

Kompression.pdf h. völz /17

Kompression.pdf h. völz /17 Kompression.pdf h. völz 23.5.02 1/17 Lauflängen-Codierung CCCCCCAABBBBAAAAEE _ 6C2A4B4A2E Pixel- und Zähl-Byte unterscheiden Pointer-Verfahren ABRABRIKADABRA Ab 4. Buchstaben ABR _ Verweis . total

Mehr

Data Cubes PG Wissensmangement Seminarphase

Data Cubes PG Wissensmangement Seminarphase PG 402 - Wissensmangement Seminarphase 23.10.2001-25.10.2001 Hanna Köpcke Lehrstuhl für Künstliche Intelligenz Universität Dortmund Übersicht 1. Einführung 2. Aggregation in SQL, GROUP BY 3. Probleme mit

Mehr

Image Compression. Vorlesung FH-Hagenberg DSB

Image Compression. Vorlesung FH-Hagenberg DSB Image Compression Vorlesung FH-Hagenberg DSB Kompression Encoder Decoder Beseitigung der unnötigen Daten... Redundanz Inhalte Redundanz Loss-less Compression Hufmann Coding Runlength Coding Lossy Compression

Mehr

Datenbanken: Datenkompression. Dr. Matthias Uflacker, Stefan Klauck 2. Mai 2018

Datenbanken: Datenkompression. Dr. Matthias Uflacker, Stefan Klauck 2. Mai 2018 Datenbanken: Datenkompression Dr. Matthias Uflacker, Stefan Klauck 2. Mai 2018 Vorlesungsinhalte/-aufbau Phase 1 Einführung zu Unternehmensanwendungen (2 Vorlesungen) Grundlagen von spaltenorientierten

Mehr

'LJLWDOH%LOGHUXQG'DWHLIRUPDWH

'LJLWDOH%LOGHUXQG'DWHLIRUPDWH 'LJLWDOH%LOGHUXQG'DWHLIRUPDWH Seminar: Simulation und Bildanalyse mit Java 07.07.2003 Seite 1 von 25 hehuvlfkw 1. Digitalisierung 2. Bilddateiformate 3. verlustfreie Datenkompression 4. JPEG Kompression

Mehr

Clustering. Ausarbeitung von Michael Speckner. Proseminar Data Mining

Clustering. Ausarbeitung von Michael Speckner. Proseminar Data Mining Clustering Ausarbeitung von Michael Speckner Proseminar Data Mining Einleitung Das Clustering wird verwendet, wenn man keine Klassen vorhersagen kann, aber die Instanzen in natürliche Gruppen einteilen

Mehr

Modul Digitale Bildverarbeitung SS16 Bestandteile der Lehrveranstaltung und Prüfung: Vorlesungen Übungsserien Praktika (ImageJ) bis Mai 2016 Projekt

Modul Digitale Bildverarbeitung SS16 Bestandteile der Lehrveranstaltung und Prüfung: Vorlesungen Übungsserien Praktika (ImageJ) bis Mai 2016 Projekt Modul Digitale Bildverarbeitung SS16 Bestandteile der Lehrveranstaltung und Prüfung: Vorlesungen Übungsserien Praktika (ImageJ) bis Mai 2016 Projekt im Juni 2016 Themen: Digitale Bilder, Eigenschaften

Mehr

Bilder im Zusammenhang mit Geoinformatik sind u.a.: Luftbilder, Satellitenbilder Synthetische Bilder (z.b. digitale Oberflächenmodelle)

Bilder im Zusammenhang mit Geoinformatik sind u.a.: Luftbilder, Satellitenbilder Synthetische Bilder (z.b. digitale Oberflächenmodelle) Grundlagen der digitalen Bildverarbeitung Bilder im Zusammenhang mit Geoinformatik sind u.a.: Luftbilder, Satellitenbilder Synthetische Bilder (z.b. digitale Oberflächenmodelle)... dagegen weniger Fotos

Mehr

INTELLIGENTE DATENANALYSE IN MATLAB. Datenselektion und Datenaufbereitung

INTELLIGENTE DATENANALYSE IN MATLAB. Datenselektion und Datenaufbereitung INTELLIGENTE DATENANALYSE IN MATLAB Datenselektion und Datenaufbereitung Überblick Schritte der Datenanalyse: Datenvorverarbeitung Problemanalyse Problemlösung Anwendung der Lösung Aggregation und Selektion

Mehr

Algorithmen zur lageinvarianten Merkmalsgewinnung für Draht gittermodelle

Algorithmen zur lageinvarianten Merkmalsgewinnung für Draht gittermodelle Vortrag zur Diplomarbeit Algorithmen zur lageinvarianten Merkmalsgewinnung für Draht gittermodelle Lehrstuhl für Mustererkennung und Bildverarbeitung Albert Ludwigs Universität Freiburg Marco Reisert Übersicht

Mehr

Algorithmen in Zellularautomaten

Algorithmen in Zellularautomaten Algorithmen in Zellularautomaten 1. Grundlegende Definitionen 2. Berechnungsmächtigkeit von ZA 3. Endliche Muster und Konfigurationen 4. Selbstreproduktion 5. Sortieren in eindimensionalen ZA 6. Einfache

Mehr

Repetition: Schreibweisen

Repetition: Schreibweisen : : Ausgeschrieben : Ausgeschrieben a 11 x 1 + a 12 x 2 +... + a 1n x n = b 1 a 21 x 1 + a 22 x 2 +... + a 2n x n = b 2... =... a m1 x 1 + a m2 x 2 +... + a mn x n = b m : Ausgeschrieben a 11 x 1 + a 12

Mehr

Einführung in die digitale Bildverarbeitung

Einführung in die digitale Bildverarbeitung FRANZIS EINFUHRUNG Dr. Hartmut Ernst Einführung in die digitale Bildverarbeitung Grundlagen und industrieller Einsatz mit zahlreichen Beispielen Mit 290 Abbildungen FRANZIS Inhalt 1 Einführung 13 1.1 Was

Mehr

INTELLIGENTE DATENANALYSE IN MATLAB

INTELLIGENTE DATENANALYSE IN MATLAB INTELLIGENTE DATENANALYSE IN MATLAB Datenselektion und Datenaufbereitung Literatur I. H. Witten, E. Frank: Data Mining i Practical Machine Learning Tools and Techniques. J. Han, M. Kamber: Data Mining

Mehr

Informatik II, SS 2016

Informatik II, SS 2016 Informatik II - SS 2014 (Algorithmen & Datenstrukturen) Vorlesung 2 (22.4.2016) Sortieren II Algorithmen und Komplexität SelectionSort: Programm Schreiben wir doch das gleich mal als Java/C++ - Programm

Mehr

Algorithmen und Datenstrukturen (für ET/IT)

Algorithmen und Datenstrukturen (für ET/IT) Algorithmen und Datenstrukturen (für ET/IT) Sommersemester 2015 Dr. Tobias Lasser Computer Aided Medical Procedures Technische Universität München Programm heute 7 Fortgeschrittene Datenstrukturen 8 Such-Algorithmen

Mehr

Bücher und Artikel zum Thema

Bücher und Artikel zum Thema Materialsammlung zur Implementierung von Information Retrieval Systemen Karin Haenelt 11.12.2005/11.12.2004/06.12.2003/10.11.2002 1 Bücher und Artikel zum Thema Frakes/Baeza-Yates, 1992 Baeza-Yates/Ribeiro-Neto,

Mehr

Materialsammlung zur Implementierung von Information Retrieval Systemen

Materialsammlung zur Implementierung von Information Retrieval Systemen Materialsammlung zur Implementierung von Information Retrieval Systemen Karin Haenelt 11.12.2005/11.12.2004/06.12.2003/10.11.2002 1 Bücher und Artikel zum Thema Frakes/Baeza-Yates, 1992 Baeza-Yates/Ribeiro-Neto,

Mehr

Statistik und Wahrscheinlichkeitsrechnung

Statistik und Wahrscheinlichkeitsrechnung Statistik und Wahrscheinlichkeitsrechnung Übung 3 1 Inhalt der heutigen Übung Vorrechnen der Hausübung B.7 Beschreibende Statistik Gemeinsames Lösen der Übungsaufgaben C.1: Häufigkeitsverteilung C.2: Tukey

Mehr

Dimensionen, Measures

Dimensionen, Measures ... Operationen und peicherung Multi-dimensionaler Daten Aggregate um RED WHITE BLUE Group By (with total) By Color um Cross Tab Chevy Ford By Color RED WHITE BLUE By Make um By Make & Year By Year FORD

Mehr

Themenblock: Data Warehousing II

Themenblock: Data Warehousing II Themenblock: Data Warehousing II Praktikum: Data Warehousing und Data Mining Agenda Wiederholung: multidimensionale Operatoren Cognos Cognos Report Studio Cognos Analysis Studio Hinweise zur Bearbeitung

Mehr

2 Darstellung von Zahlen und Zeichen

2 Darstellung von Zahlen und Zeichen 2.1 Analoge und digitale Darstellung von Werten 79 2 Darstellung von Zahlen und Zeichen Computer- bzw. Prozessorsysteme führen Transformationen durch, die Eingaben X auf Ausgaben Y abbilden, d.h. Y = f

Mehr

Übersicht der Vorlesung

Übersicht der Vorlesung Übersicht der Vorlesung 1. Einführung 2. Bildverarbeitung 3. orphologische Operationen 4. Bildsegmentierung 5. erkmale von Objekten 6. Klassifikation 7. Dreidimensionale Bildinterpretation 8. Bewegungsanalyse

Mehr

Kompressionsverfahren

Kompressionsverfahren Kompressionsverfahren Quelle: Steinmetz, Ralf: Multimedia-Technologie: Einführung und Grundlagen, Springer, Verlag Verlustlose Kompressionsalgorithmen RLC Huffman Adaptive Huffman Kodierung Arithmetische

Mehr

Inverse und implizite Funktionen

Inverse und implizite Funktionen Kapitel 8 Inverse und implizite Funktionen Josef Leydold Mathematik für VW WS 2017/18 8 Inverse und implizite Funktionen 1 / 21 Inverse Funktion Sei f : D f R n W f R m, x y = f(x). Eine Funktion f 1 :

Mehr

INTELLIGENTE DATENANALYSE IN MATLAB

INTELLIGENTE DATENANALYSE IN MATLAB INTELLIGENTE DATENANALYSE IN MATLAB Bildanalyse Literatur David A. Forsyth: Computer Vision i A Modern Approach. Mark S. Nixon und Alberto S. Aguado: Feature Extraction and Image Processing. Ulrich Schwanecke:

Mehr

Algorithmen und Datenstrukturen (für ET/IT)

Algorithmen und Datenstrukturen (für ET/IT) Algorithmen und Datenstrukturen (für ET/IT) Sommersemester 2017 Dr. Stefanie Demirci Computer Aided Medical Procedures Technische Universität München Programm heute 7 Fortgeschrittene Datenstrukturen 8

Mehr

Statistik und Wahrscheinlichkeitsrechnung

Statistik und Wahrscheinlichkeitsrechnung Statistik und Wahrscheinlichkeitsrechnung 3. Vorlesung Dr. Jochen Köhler 1 Inhalte der heutigen Vorlesung Ziel: Daten Modellbildung Probabilistisches Modell Wahrscheinlichkeit von Ereignissen Im ersten

Mehr

Algorithmische Methoden für schwere Optimierungsprobleme

Algorithmische Methoden für schwere Optimierungsprobleme Algorithmische Methoden für schwere Optimierungsprobleme Prof. Dr. Henning Meyerhenke Institut für Theoretische Informatik 1 KIT Henning Universität desmeyerhenke, Landes Baden-Württemberg Institutund

Mehr

Kategorie Nachschlagen & Verweisen

Kategorie Nachschlagen & Verweisen www.gmi.at, 2015 1 Kategorie Nachschlagen & Verweisen Als Matrix- oder Bezugsversion Wir behandeln vorerst nur die Matrixversion, die genau einen Zellinhalt zurückgibt Argumente Zellbereich Zeilenindex

Mehr

Konzeptbeschreibung Ziel: Methode: Vorgehen: Entfernen von Attributen Verallgemeinerung von Attributen Relevanzanalyse der restlichen Attribute

Konzeptbeschreibung Ziel: Methode: Vorgehen: Entfernen von Attributen Verallgemeinerung von Attributen Relevanzanalyse der restlichen Attribute Konzeptbeschreibung Ziel: Knappe Charakterisierung einer Datenmenge im Vergleich zu einer anderen Datenmenge (Kontrastmenge) Methode: Herausfinden charakteristischer Attribute auf angemessener Abstraktionsebene

Mehr

Basisinformationstechnologie II

Basisinformationstechnologie II Basisinformationstechnologie II Sommersemester 2015 13. Mai 2015 Algorithmen der Bildverarbeitung I: Kompression Universität zu Köln. Historisch-Kulturwissenschaftliche Informationsverarbeitung Dr. Jan

Mehr

Dateneingabe und Transformation Übersicht

Dateneingabe und Transformation Übersicht Dateneingabe und Transformation Übersicht 2.0 Allgemeine 2.1 Eingabe über die 2.2 2.3 Eingabe eines externen ASCII-Files 2.4 Varianten der INPUT-Anweisung, Formatierungselemente 2.5 Ein- und Ausgabe von

Mehr

Informatik II, SS 2018

Informatik II, SS 2018 Informatik II - SS 2018 (Algorithmen & Datenstrukturen) Vorlesung 2 (23.4.2018) Sortieren II, Asymptotische Analyse, O-Notation Algorithmen und Komplexität Laufzeit Zeitmessung SelectionSort n 2 Laufzeit/n

Mehr

3. Bestehende Dateien

3. Bestehende Dateien 3. Bestehende Dateien Zugriff auf Excel- u. Access-Tabellen Bilden neuer Variablen Auswahl/Untermengen Umkodieren bestehender Werte Einlesen externer Dateien Daten, die mit einem anderen Anwendungsprogramm

Mehr

Bitte am PC mit Windows anmelden!

Bitte am PC mit Windows anmelden! Einführung in SPSS Plan für heute: Grundlagen/ Vorwissen für SPSS Vergleich der Übungsaufgaben Einführung in SPSS http://weknowmemes.com/generator/uploads/generated/g1374774654830726655.jpg Standardnormalverteilung

Mehr

Informationsmaß. Konzeptbeschreibung. Beispiel für Konzept-Charakterisierung (1) Beispiel für Konzept-Charakterisierung (2)

Informationsmaß. Konzeptbeschreibung. Beispiel für Konzept-Charakterisierung (1) Beispiel für Konzept-Charakterisierung (2) Konzeptbeschreibung Ziel: Knappe Charakterisierung einer Datenmenge im Vergleich zu einer anderen Datenmenge (Kontrastmenge) Methode: Herausfinden charakteristischer Attribute auf angemessener Abstraktionsebene

Mehr

1 Einleitung. 2 Clustering

1 Einleitung. 2 Clustering Lernende Vektorquantisierung (LVQ) und K-Means-Clustering David Bouchain Proseminar Neuronale Netze Kurs-Nr.: CS4400 ISI WS 2004/05 david@bouchain.de 1 Einleitung Im Folgenden soll zum einen ein Überblick

Mehr

Einführung FEM 1D - Beispiel

Einführung FEM 1D - Beispiel p. 1/28 Einführung FEM 1D - Beispiel /home/lehre/vl-mhs-1/folien/vorlesung/4_fem_intro/deckblatt.tex Seite 1 von 28 p. 2/28 Inhaltsverzeichnis 1D Beispiel - Finite Elemente Methode 1. 1D Aufbau Geometrie

Mehr

Sampling. 7. Vorlesung

Sampling. 7. Vorlesung Sampling 7. Vorlesung Photorealistische Computergrafik Thorsten Grosch Einleitung Bisher Lösung der Rendering Equation durch das Radiosity Verfahren mit den Vereinfachungen Heute Diskretisierung der Geometrie

Mehr

Data Warehousing und Data Mining

Data Warehousing und Data Mining Data Warehousing und Data Mining Einführung in Data Mining Ulf Leser Wissensmanagement in der Bioinformatik Wo sind wir? Einleitung & Motivation Architektur Modellierung von Daten im DWH Umsetzung des

Mehr

Gierige Algorithmen. Seminar Hallo Welt! für Fortgeschrittene. Daniel Danner. 11. Juni Daniel Danner Gierige Algorithmen

Gierige Algorithmen. Seminar Hallo Welt! für Fortgeschrittene. Daniel Danner. 11. Juni Daniel Danner Gierige Algorithmen Gierige Algorithmen Seminar Hallo Welt! für Fortgeschrittene Daniel Danner 11. Juni 2010 Daniel Danner Gierige Algorithmen 11.06.2010 1 / 33 Überblick 1 Einführung Definition und Anwendung Abgrenzung zu

Mehr

Algorithmen und Datenstrukturen (für ET/IT)

Algorithmen und Datenstrukturen (für ET/IT) Algorithmen und Datenstrukturen (für ET/IT) Wintersemester / Dr. Tobias Lasser Computer Aided Medical Procedures Technische Universität München Programm heute 7 Fortgeschrittene Datenstrukturen Such-Algorithmen

Mehr

Bereichsabfragen II. Dr. Martin Nöllenburg Vorlesung Algorithmische Geometrie

Bereichsabfragen II. Dr. Martin Nöllenburg Vorlesung Algorithmische Geometrie Vorlesung Algorithmische Geometrie LEHRSTUHL FÜR ALGORITHMIK I INSTITUT FÜR THEORETISCHE INFORMATIK FAKULTÄT FÜR INFORMATIK Martin Nöllenburg 17.07.2012 Objekttypen in Bereichsabfragen y0 y0 y x x0 Bisher

Mehr

Kommentierte Musterlösung zur Klausur HM I für Naturwissenschaftler

Kommentierte Musterlösung zur Klausur HM I für Naturwissenschaftler Kommentierte Musterlösung zur Klausur HM I für Naturwissenschaftler Wintersemester 26/7 (2.3.27). (a) Bestimmen Sie die kartesische Form von z = 5i 2i und z 2 = ( ) 9 3 2 2 i. (b) Bestimmen Sie sämtliche

Mehr

Inhaltsverzeichnis. vii.

Inhaltsverzeichnis. vii. vii 1 Einführung in Data-Warehouse-Systeme 1 1.1 Anwendungsszenario Getränkemarkt 2 1.2 OLTP versus OLAP 4 1.2.1 OLAP-versus OLTP-Transaktionen 5 1.2.2 Vergleich von OLTP und OLAP 6 1.2.3 Abgrenzung: DBMS-Techniken

Mehr

Zeilenstufenform. Wir beweisen nun den schon früher angekündigten Satz.

Zeilenstufenform. Wir beweisen nun den schon früher angekündigten Satz. Zeilenstufenform Wir beweisen nun den schon früher angekündigten Satz. Satz. Jede m n-matrix A lässt sich durch elementare Zeilenumformungen auf Zeilenstufenform und analog durch elementare Spaltenumformungen

Mehr

Wiederholungsklausur Wirtschaftsmathematik Lösungshinweise

Wiederholungsklausur Wirtschaftsmathematik Lösungshinweise Wiederholungsklausur Wirtschaftsmathematik Lösungshinweise Prüfungsdatum: 9. September 205 Prüfer: Etschberger Studiengang: Wirtschaftsingenieurwesen Aufgabe 5 Punkte Karl möchte heute, am..205, ein Auto

Mehr

05. Lineare Gleichungssysteme

05. Lineare Gleichungssysteme 05 Lineare Gleichungssysteme Wir betrachten ein System von m Gleichungen in n Unbestimmten (Unbekannten) x 1,, x n von der Form a 11 x 1 + a 12 x 2 + a 13 x 3 + + a 1n x n = b 1 a 21 x 1 + a 22 x 2 + a

Mehr

a,b,c a,b,d a,d,e b,c,e c,d,e ( ) ( ) ( ) ( ) ( )

a,b,c a,b,d a,d,e b,c,e c,d,e ( ) ( ) ( ) ( ) ( ) Klausur, Mathematik, Juli 2012, A 1 [ 1 ] Bestimmen Sie Y und C in dem makroökonomischen Modell Y = C + Ī C = a + by mit a = 300, b = 0.7 und Ī = 600. Y = C = [ 2 ] Die folgenden Aussagen befassen sich

Mehr

Einsatz von Varianzreduktionstechniken II

Einsatz von Varianzreduktionstechniken II Einsatz von Varianzreduktionstechniken II Stratified Sampling und Common Random Numbers Bastian Bluhm Betreuer: Christiane Barz Ausgewählte technische, rechtliche und ökonomische Aspekte des Entwurfs von

Mehr

Komplexität von Algorithmen:

Komplexität von Algorithmen: Komplexität von Algorithmen: Ansatz: Beschreiben/erfassen der Komplexität über eine Funktion, zur Abschätzung des Rechenaufwandes abhängig von der Größe der Eingabe n Uns interessiert: (1) Wie sieht eine

Mehr

Bereichsabfragen II. Dr. Martin Nöllenburg Vorlesung Algorithmische Geometrie

Bereichsabfragen II. Dr. Martin Nöllenburg Vorlesung Algorithmische Geometrie Vorlesung Algorithmische Geometrie LEHRSTUHL FÜR ALGORITHMIK I INSTITUT FÜR THEORETISCHE INFORMATIK FAKULTÄT FÜR INFORMATIK Martin Nöllenburg 17.07.2012 Objekttypen in Bereichsabfragen y0 y x x0 Bisher

Mehr

Arbeiten mit der Shell Teil 2

Arbeiten mit der Shell Teil 2 Arbeiten mit der Shell Teil 2 Linux-Kurs der Unix-AG Zinching Dang 22. November 2016 Übersicht Ausgaben umleiten Wiederholung & Vertiefung Shellbefehle Befehle & Optionen Beispielanwendung zu Pipes Zusammenfassung

Mehr

Arbeiten mit Suchergebnissen

Arbeiten mit Suchergebnissen Arbeiten mit Suchergebnissen Inhalt 1. Gruppieren... 2 2. Filter... 5 3. Sortieren... 7 4. Feldauswahl... 8 4.1. neue Felder hinzufügen... 8 4.2. bestehende Felder entfernen... 9 5. Summen bilden... 10

Mehr

Systemnahe Software I (WS 2017/2018)

Systemnahe Software I (WS 2017/2018) Institut für Numerische Mathematik Dr. Andreas F. Borchert 24. November 2017 Fabian Berstecher Blatt 6 Systemnahe Software I (WS 2017/2018) Abgabe bis zum 1. Dezember 2017, 100 Uhr Lernziele: Einfache

Mehr

Einführung Medienforscher Aufgabe 3 - MPEG. Tobias Reinsch 2011

Einführung Medienforscher Aufgabe 3 - MPEG. Tobias Reinsch 2011 Einführung Medienforscher Tobias Reinsch 2011 Allgemeines Ziel der Aufgabe Kennenlernen der Bildkodierungsverfahren des MPEG Standards Praktische Umsetzung dieser Techniken mit Java Bearbeitungszeitraum:

Mehr

Arbeiten mit der Shell Teil 2

Arbeiten mit der Shell Teil 2 Arbeiten mit der Shell Teil 2 Linux-Kurs der Unix-AG Zinching Dang 22. November 2017 Übersicht Wiederholung & Vertiefung Shellbefehle Ausgaben umleiten Befehle & Optionen Beispielanwendung zu Pipes Zusammenfassung

Mehr

Arbeiten mit der Shell Teil 2

Arbeiten mit der Shell Teil 2 Arbeiten mit der Shell Teil 2 Linux-Kurs der Unix-AG Zinching Dang 9. Mai 2017 Übersicht Wiederholung & Vertiefung Ausgaben umleiten Shellbefehle Befehle & Optionen Zusammenfassung & Ausblick Beispielanwendung

Mehr

Grundlagen der Probabilistik

Grundlagen der Probabilistik Gliederung Einleitung Theoretische Grundlagen der Statistik Probabilistische Methoden Mögliche Ergebnisse von probabilistischen Untersuchungen Mögliche Fehlerquellen bei probabilistischen Untersuchungen

Mehr

Textkompression. Komprimierung von Daten. Runlength Komprimierung (2) Runlength Komprimierung (1) Herkömmliche Kodierung. Runlength Komprimierung (3)

Textkompression. Komprimierung von Daten. Runlength Komprimierung (2) Runlength Komprimierung (1) Herkömmliche Kodierung. Runlength Komprimierung (3) Komprimierung von Daten Textkompression Effiziente Algorithmen VU 2.0 WS 2008/09 Bin Hu Ziel: Platz und Zeit sparen Kompression durch - Effiziente Kodierung - Verminderung der Redundanzen (verlustfrei)

Mehr

Einleitung. ROLLUP, CUBE und GROUPING. Markus Jägle (markus.jaegle@trivadis.com) Art der Info Technische Background Info (April 2002)

Einleitung. ROLLUP, CUBE und GROUPING. Markus Jägle (markus.jaegle@trivadis.com) Art der Info Technische Background Info (April 2002) Betrifft Autör: GROUPING_ID Markus Jägle (markus.jaegle@trivadis.com) Art der Info Technische Background Info (April 2002) Quelle Aus dem Oracle9i Data Warehousing Guide und den Kursen New Features Oracle9i

Mehr

Klausur Wirtschaftsmathematik VO

Klausur Wirtschaftsmathematik VO Klausur Wirtschaftsmathematik VO 02. Februar 2019 Bitte leserlich in Druckbuchstaben ausfüllen! NACHNAME: VORNAME: MATRIKELNUMMER: ERLAUBT: nur die Formelsammlung des Instituts! VERBOTEN: Taschenrechner

Mehr

Algorithmen und Datenstrukturen (für ET/IT)

Algorithmen und Datenstrukturen (für ET/IT) Algorithmen und Datenstrukturen (für ET/IT) Wintersemester 2012/13 Dr. Tobias Lasser Computer Aided Medical Procedures Technische Universität München Informationen zur Klausur Termin: 21. Februar 2013,

Mehr

Numerische Methoden und Algorithmen in der Physik

Numerische Methoden und Algorithmen in der Physik Numerische Methoden und Algorithmen in der Physik Hartmut Stadie, Christian Autermann 08.01.2009 Numerische Methoden und Algorithmen in der Physik Hartmut Stadie 1/ 32 Einführung Wahrscheinlichkeit Verteilungen

Mehr

Prof. Dr. Hans-Dieter Sill, Universität Rostock

Prof. Dr. Hans-Dieter Sill, Universität Rostock Prof. Dr. Hans-Dieter Sill, Universität Rostock 1. Vortrag zu Elementen einer Prozessbetrachtung zufälliger Erscheinungen 2. Planung einer Befragung zu Kinogewohnheiten von Schülern 3. Auswertung einer

Mehr

Algorithmische Methoden zur Netzwerkanalyse Vorlesung 13, Henning Meyerhenke

Algorithmische Methoden zur Netzwerkanalyse Vorlesung 13, Henning Meyerhenke Algorithmische Methoden zur Netzwerkanalyse Vorlesung 13, 01.02.2012 Henning Meyerhenke 1 KIT Henning Universität desmeyerhenke: Landes Baden-Württemberg und nationales Algorithmische Forschungszentrum

Mehr

Data Mining und Maschinelles Lernen Wintersemester 2015/2016 Lösungsvorschlag für das 12. Übungsblatt

Data Mining und Maschinelles Lernen Wintersemester 2015/2016 Lösungsvorschlag für das 12. Übungsblatt Data Mining und Maschinelles Lernen Wintersemester 2015/2016 Lösungsvorschlag für das 12. Übungsblatt 9. Februar 2016 1 Aufgabe 1: RelieF (1) Gegeben sind folgende 12 Beispiele der Wetter-Daten: ID outlook

Mehr