Heuristische Verfahren zur Aggregation addierbarer Zeitreihen

Größe: px
Ab Seite anzeigen:

Download "Heuristische Verfahren zur Aggregation addierbarer Zeitreihen"

Transkript

1 KSFE 2003 Heuristische Verfahren zur Aggregation addierbarer Zeitreihen Abt. Data Mining Stefan Pohl Dr. S. Steinberg

2 Agenda Heinrich Bauer Verlag Typisches Problem des Vertriebs Lösungsansatz: Supervised Clustering Vergleich verschiedener Verfahren SAS/EM-Knoten: Cluster Comparison Vergleich von Clusterscorings oder Klassifikationen Zusammenfassung KSFE 2003 Potsdam 2

3 Heinrich Bauer Verlag Europas führender Zeitschriftenverlag weltweit: ca Mitarbeiter 120 auflagenstarke Erfolgstitel in Deutschland Marktführer in den Segmenten: Programmzeitschriften (55% = 9,8 Mio. Exemplare) Jugendzeitschriften (39% = 1,4 Mio. Exemplare) unterhaltende Frauenzeitschriften (35% = 4,0 Mio. Exemplare) Special Interest Magazine KSFE 2003 Potsdam 3

4 Heuristische Verfahren zur Aggregation addierbarer Zeitreihen VKG Vertriebsfirma der Verlagsgruppe Bauer 730 Mio. Umsatz 150 Mitarbeiter ca. 20 Mio. Hefte pro Erscheinungsintervall 3,8 Mio. Abonnenten jährlich ca neue Abonnenten HH Abdeckung durch VKG Logistik ca. 80% über 215 Mio. Liefertakte p.a. Logistik ca. 30% WBZ und Fremdtakte KSFE 2003 Potsdam 4

5 Typisches Problem des Vertriebs Problem: Wie können Auswirkungen von vertrieblichen Aktivitäten Bezugsänderungen Werbemaßnahmen nachgewiesen werden? Lösungsansatz Einteilung der Vertriebsgebiete in Test- & Referenzgebiete Test Nr. 1 Test Nr. 2 Referenzgebiet Zeitreihe von Verkaufsanteilen KSFE 2003 Potsdam 5

6 Konkretisierung Begriffe Verhalten = Verkäufe als einzige Rückmeldung im Einzelhandel Einflüsse = Inhalte der Zeitschrift, Titelbild (Hintergrundfarbe, Model,...), Regionalität (Ost/West, Groß-/Kleinstadt, Wetter,...) Vertriebsgebiete = logistisch bedingte Einteilung Deutschlands Probleme Titelthemen können regionale, zeitlich begrenzte Verkaufsschlager sein Verkäufe abhängig von Affinitäten der Kunden, beliebig geographisch verteilt Einfluß bisheriger Testaktivitäten verzerrt Historie KSFE 2003 Potsdam 6

7 Lösung Zusammenfassung von Vertriebsgebieten zu Clustern, die ein besseres Verhalten haben Verkaufsanteile KSFE 2003 Potsdam 7

8 Abbildung auf Verfahren des SAS/EM Zufallsauswahl keine Optimalität erwartbar, kann aber gut als Referenz dienen Clustering Probleme: Statik der Elementeigenschaften Elemente erhalten neue Eigenschaften bei jedem Iterationsschritt unabhängig von der aktuellen Clusterzusammenstellung unüberwacht Anlehnung an Variablenselektion teilt Variablen in die beiden Gruppen erklärend und redundant ein KSFE 2003 Potsdam 8

9 Anforderungen an Testumgebung: mehrere Tests unterschiedliche Aktivitäten (Bezugsänderung, Werbung,...) gleichzeitige Durchführbarkeit statistisch gesicherter Erkenntnisgewinn nicht nur: gab es Einfluß, sondern: wie hoch war der Einfluß an Zusammenstellung der Cluster: Regelwerk von Bedingungen an Vertriebsgebiete und Cluster KSFE 2003 Potsdam 9

10 Algorithmus Elemente G e n e r a Supervised Clustering ti o n E v al u ati o n Agglomeration Kombination (beste Cluster vereinigen) keine weiteren Beschränkung auf eine Untermenge der Möglichkeiten Abbildung der menschlichen Vorgehensweise: Inkrementelle, lokale Optimierung Ausgehend von Einzelelementen, Elemente zusammenführen, die dadurch eine Verbesserung bzgl. einer Zielfunktion erfahren Abbruchbed. erfüllt Cluster KSFE 2003 Potsdam 10

11 Komplexität Beispiel: maximal 5 Gruppen mit 50 Elementen Anzahl zu untersuchender Möglichkeiten: Gesamtkomplexität: > Pro Gruppe genau 10 Elemente: > Supervised Clustering: < Komplexität 1000 s * Kombinationen s 600 s 400 s 200 s Berechnungszeit Supervised Clustering Gesamtkomplexität Gesamtkomplexität beschränkt Anzahl Elemente 0 s * Ausführungszeit aufgenommen mit Pentium 800 MHz, nichtoptimierter Interpretercode KSFE 2003 Potsdam 11

12 Implementierung Prototyphaftigkeit aufgrund vorher unklarer Anforderungen, Bedingungen Umfang der Verbesserung unbekannt (generell und auf Basis spezieller Daten) Prototyp in Prolog (logische Programmierung) Datenbasis beliebige Daten assoziativ speicherbar Regelbasiert einfache nachträgliche Definition von einschränkenden Bedingungen bei jeder Aktion Stabile Version in SAS Nahtlose Integration in andere Untersuchungen SAS/Enterprise Miner KSFE 2003 Potsdam 12

13 Implementierung in SAS SAS ist insgesamt datengetrieben : Steps u. Procs kommunizieren über Datasets u. Macrovariablen Algorithmus fest in Data- Steps implementiert Extensive Nutzung von SAS/Macro zur funktionalen Wiederverwendung von Data-Steps Skalierbarkeit gesichert durch Nutzung externer Speicher (Datasets) optimierter Dataset-Operationen KSFE 2003 Potsdam 13

14 Ergebnis Fehler 4,50% 4,00% 3,50% 3,00% 2,50% 2,00% 1,50% 1,00% 0,50% 0,00% Vergleich der Vorhersagefehler deutliche Fehlerreduktion in allen Gruppen es gibt wenige sich gut für diese Zeitschrift ausgleichende Vertriebsgebiete Volatilität Gruppe Regionalität Supervised Clustering Zufallsauswahl KSFE 2003 Potsdam 14

15 Lösungsvergleich Frage: Wie unterscheiden sich verschiedene Gruppierungen? oder Auf welche Cluster einer anderen Gruppierung verteilen sich die Elemente eines Clusters? Cluster 2 Cluster 1 Cluster 3 Mittel: Kreuztabellen KSFE 2003 Potsdam 15

16 SAS/EM-Knoten: Cluster Comparison Beliebige Aggregatfunktionen über Elemente möglich: Anzahl, Summe, Min/Max, Clusterübereinstimmung beim Paar: KMEANS x SOM KSFE 2003 Potsdam 16

17 Zusammenfassung Supervised Clustering Testbarkeit bei auflagenschwachem Titel durch das Verfahren erst möglich geworden Agglomerationsverhalten gibt Auskunft über Eigenschaften der Daten zugrundeliegende Prozesse Cluster Comparison Vollständige Integration in Tools des SAS/EM Überlappungsgrad gibt Hinweis auf Stabilität einer Aggregation KSFE 2003 Potsdam 17

18 ? Fragen & Diskussion Stefan Pohl: Dr. Sergej Steinberg: KSFE 2003 Potsdam 18

Projektbericht. Evaluation und Ableitung von Ergebnissen anhand eines Fragebogens zur Studentensituation an der Hochschule Wismar

Projektbericht. Evaluation und Ableitung von Ergebnissen anhand eines Fragebogens zur Studentensituation an der Hochschule Wismar Business Intelligence Master Digitale Logistik und Management Projektbericht Evaluation und Ableitung von Ergebnissen anhand eines Fragebogens zur Studentensituation an der Hochschule Wismar Matthias Säger

Mehr

Clustering. Clustering:

Clustering. Clustering: Clustering Clustering: Gruppierung und Einteilung einer Datenmenge nach ähnlichen Merkmalen Unüberwachte Klassifizierung (Neuronale Netze- Terminologie) Distanzkriterium: Ein Datenvektor ist zu anderen

Mehr

Entwicklung einer Entscheidungssystematik für Data- Mining-Verfahren zur Erhöhung der Planungsgüte in der Produktion

Entwicklung einer Entscheidungssystematik für Data- Mining-Verfahren zur Erhöhung der Planungsgüte in der Produktion Entwicklung einer Entscheidungssystematik für Data- Mining-Verfahren zur Erhöhung der Planungsgüte in der Produktion Vortrag Seminararbeit David Pogorzelski Aachen, 22.01.2015 Agenda 1 2 3 4 5 Ziel der

Mehr

Data Mining in der Bauer Media Group Vorstellung eines Verfahrens zur Auswahl vergleichbarer Gebiete für regionale Tests

Data Mining in der Bauer Media Group Vorstellung eines Verfahrens zur Auswahl vergleichbarer Gebiete für regionale Tests Data Mining in der Bauer Media Group Vorstellung eines Verfahrens zur Auswahl vergleichbarer Gebiete für regionale Tests Hamburg, 12.03.2009 6. TDWI Roundtable - M. Westphal, N. Brauns, Dr. S. Steinberg

Mehr

Algorithmische Methoden zur Netzwerkanalyse Vorlesung 12, Henning Meyerhenke

Algorithmische Methoden zur Netzwerkanalyse Vorlesung 12, Henning Meyerhenke Algorithmische Methoden zur Netzwerkanalyse Vorlesung 12, 25.01.2012 Henning Meyerhenke 1 KIT Henning Universität desmeyerhenke: Landes Baden-Württemberg und nationales Algorithmische Forschungszentrum

Mehr

Projekt-INF Folie 1

Projekt-INF Folie 1 Folie 1 Projekt-INF Entwicklung eines Testbed für den empirischen Vergleich verschiedener Methoden des maschinellen Lernens im Bezug auf die Erlernung von Produktentwicklungswissen Folie 2 Inhalt Ziel

Mehr

Machine Learning. Dr. Bartholomäus Wissmath 3. Swiss Innovation Day

Machine Learning. Dr. Bartholomäus Wissmath 3. Swiss Innovation Day Machine Learning Dr. Bartholomäus Wissmath 3. Swiss Innovation Day Artificial Intelligence (AI) Teilgebiet der Informatik, welches sich mit der Automatisierung von intelligenten Verhalten und dem Maschinenlernen

Mehr

Grundlagen der Wirtschafts informatik

Grundlagen der Wirtschafts informatik Andreas Fink Gabriele Schneidereit Stefan Voß Grundlagen der Wirtschafts informatik Zweite, überarbeitete Auflage mit 78 Abbildungen und 16 Tabellen Physica-Verlag Ein Unternehmen von Springer Vorwort

Mehr

Standortübergreifende Programmplanung in flexiblen Produktionsnetzwerken der Automobilindustrie

Standortübergreifende Programmplanung in flexiblen Produktionsnetzwerken der Automobilindustrie Produktion und Logistik Standortübergreifende Programmplanung in flexiblen Produktionsnetzwerken der Automobilindustrie Bearbeitet von Dr. Kai Wittek 1. Auflage 2013. Taschenbuch. xxvii, 292 S. Paperback

Mehr

Data Cubes PG Wissensmangement Seminarphase

Data Cubes PG Wissensmangement Seminarphase PG 402 - Wissensmangement Seminarphase 23.10.2001-25.10.2001 Hanna Köpcke Lehrstuhl für Künstliche Intelligenz Universität Dortmund Übersicht 1. Einführung 2. Aggregation in SQL, GROUP BY 3. Probleme mit

Mehr

2. Architektur verteilter Datenbanksysteme

2. Architektur verteilter Datenbanksysteme 2. Architektur verteilter Datenbanksysteme Verteilte Datenbank, kurz DDB (engl. distributed database): eine Sammlung logisch zusammengehöriger Datenbanken, welche über Rechnerknoten ( Sites ) verteilt

Mehr

Regelbasiertes Tiling für Collaborative Filtering

Regelbasiertes Tiling für Collaborative Filtering Regelbasiertes Tiling für Collaborative Filtering Diplomarbeit Simone Daum 17.11.2005 Betreuer: Prof. Johannes Fürnkranz Überblick Einführung Algorithmus zum Regelbasierten Tiling Ergebnisse Überblick

Mehr

Mustererkennung. Übersicht. Unüberwachtes Lernen. (Un-) Überwachtes Lernen Clustering im Allgemeinen k-means-verfahren Gaussian-Mixture Modelle

Mustererkennung. Übersicht. Unüberwachtes Lernen. (Un-) Überwachtes Lernen Clustering im Allgemeinen k-means-verfahren Gaussian-Mixture Modelle Mustererkennung Unüberwachtes Lernen R. Neubecker, WS 01 / 01 Übersicht (Un-) Überwachtes Lernen Clustering im Allgemeinen k-means-verfahren 1 Lernen Überwachtes Lernen Zum Training des Klassifikators

Mehr

2. Datenvorverarbeitung

2. Datenvorverarbeitung Kurzreferat Das Ziel beim Clustering ist es möglichst gleich Datensätze zu finden und diese in Gruppen, sogenannte Cluster zu untergliedern. In dieser Dokumentation werden die Methoden k-means und Fuzzy

Mehr

Data Cube. 1. Einführung. 2. Aggregation in SQL, GROUP BY. 3. Probleme mit GROUP BY. 4. Der Cube-Operator. 5. Implementierung des Data Cube

Data Cube. 1. Einführung. 2. Aggregation in SQL, GROUP BY. 3. Probleme mit GROUP BY. 4. Der Cube-Operator. 5. Implementierung des Data Cube Data Cube 1. Einführung 2. Aggregation in SQL, GROUP BY 3. Probleme mit GROUP BY 4. Der Cube-Operator 5. Implementierung des Data Cube 6. Zusammenfassung und Ausblick Dank an Hanna Köpcke! 1 On-line Analytical

Mehr

Multiparadigmen- Programmiersprachen

Multiparadigmen- Programmiersprachen Multiparadigmen- Programmiersprachen Martin Grabmüller magr@cs.tu-berlin.de Fachgebiet Übersetzerbau und Programmiersprachen Fakultät IV Elektrotechnik und Informatik Technische Universität Berlin Multiparadigmen-Programmiersprachen

Mehr

Analyse eines zweistufigen, regionalen Clusteralgorithmus am Beispiel der Verbundenen Wohngebäudeversicherung

Analyse eines zweistufigen, regionalen Clusteralgorithmus am Beispiel der Verbundenen Wohngebäudeversicherung Analyse eines zweistufigen, regionalen Clusteralgorithmus am Beispiel der Verbundenen Wohngebäudeversicherung Zusammenfassung der Diplomarbeit an der Hochschule Zittau/Görlitz Maria Kiseleva Motivation

Mehr

Praxis der Regressionsanalyse

Praxis der Regressionsanalyse Praxis der Regressionsanalyse Von Samprit Chatterjee New York University und Bertram Price Price Associates, Inc., Washington, D. C. Aus dem Amerikanischen übertragen von Prof. Dr. Gunter Lorenzen Universität

Mehr

Clustering 2010/06/11 Sebastian Koch 1

Clustering 2010/06/11 Sebastian Koch 1 Clustering 2010/06/11 1 Motivation Quelle: http://www.ha-w.de/media/schulung01.jpg 2010/06/11 2 Was ist Clustering Idee: Gruppierung von Objekten so, dass: Innerhalb einer Gruppe sollen die Objekte möglichst

Mehr

Dynamische Programmierung. Problemlösungsstrategie der Informatik

Dynamische Programmierung. Problemlösungsstrategie der Informatik als Problemlösungsstrategie der Informatik und ihre Anwedung in der Diskreten Mathematik und Graphentheorie Fabian Cordt Enisa Metovic Wissenschaftliche Arbeiten und Präsentationen, WS 2010/2011 Gliederung

Mehr

Algorithmische Methoden für schwere Optimierungsprobleme

Algorithmische Methoden für schwere Optimierungsprobleme Algorithmische Methoden für schwere Optimierungsprobleme Prof. Dr. Henning Meyerhenke Institut für Theoretische Informatik 1 KIT Henning Universität desmeyerhenke, Landes Baden-Württemberg Institutund

Mehr

LDA-based Document Model for Adhoc-Retrieval

LDA-based Document Model for Adhoc-Retrieval Martin Luther Universität Halle-Wittenberg 30. März 2007 Inhaltsverzeichnis 1 2 plsi Clusterbasiertes Retrieval 3 Latent Dirichlet Allocation LDA-basiertes Retrieval Komplexität 4 Feineinstellung Parameter

Mehr

Algorithmische Geometrie: Arrangements und

Algorithmische Geometrie: Arrangements und Algorithmische Geometrie: Arrangements und Dualität Nico Düvelmeyer WS 2009/2010, 19.1.2010 Überblick 1 Strahlenverfolgung und Diskrepanz 2 Dualität Dualitäts-Abbildung Transformation des Problems zur

Mehr

Data Mining Anwendungen und Techniken

Data Mining Anwendungen und Techniken Data Mining Anwendungen und Techniken Knut Hinkelmann DFKI GmbH Entdecken von Wissen in banken Wissen Unternehmen sammeln ungeheure mengen enthalten wettbewerbsrelevantes Wissen Ziel: Entdecken dieses

Mehr

Kapitel ML: X (Fortsetzung)

Kapitel ML: X (Fortsetzung) Kapitel ML: X (Fortsetzung) X. Clusteranalyse Einordnung Data Mining Einführung in die Clusteranalyse Hierarchische Verfahren Iterative Verfahren Dichtebasierte Verfahren Cluster-Evaluierung ML: X-31 Cluster

Mehr

TUD Computer Poker Challenge

TUD Computer Poker Challenge TUD Computer Poker Challenge The Challenge of Poker Björn Heidenreich 31. März 2008 The Challenge of Poker Björn Heidenreich 1 Anforderungen an einen guten Poker-Spieler Hand Strength Hand Potential Bluffing

Mehr

Bayes-Netze. Claudio Fischer Text- und Datamining (AG Digital Humanities)

Bayes-Netze. Claudio Fischer Text- und Datamining (AG Digital Humanities) Bayes-Netze Claudio Fischer 20.06.2013 Text- und Datamining (AG Digital Humanities) Agenda Wiederholung Wahrscheinlichkeitstheorie Beispiel Motivation Bayes-Netze Inferenz exakt Inferenz annäherend Belief

Mehr

Optimierungsstrategien für selbstorganisierende Speicherstrukturen

Optimierungsstrategien für selbstorganisierende Speicherstrukturen Optimierungsstrategien für selbstorganisierende Speicherstrukturen Robert Schelkle Karlsruher Institut für Technologie (KIT) Institut für Technische Informatik (ITEC) Lehrstuhl für Rechnerarchitektur und

Mehr

Data Mining 7-1. Kapitel 7: Advertising on the Web. Johannes Zschache Wintersemester 2018/19

Data Mining 7-1. Kapitel 7: Advertising on the Web. Johannes Zschache Wintersemester 2018/19 Data Mining Kapitel 7: Advertising on the Web Johannes Zschache Wintersemester 2018/19 Abteilung Datenbanken, Universität Leipzig http://dbs.uni-leipzig.de Data Mining 7-1 7-2 Data Mining Übersicht Hochdimension.

Mehr

Lineare Gleichungssysteme

Lineare Gleichungssysteme Kapitel 6 Lineare Gleichungssysteme 6. Gaußalgorithmus Aufgabe 6. : Untersuchen Sie die folgenden linearen Gleichungssysteme mit dem Gaußalgorithmus auf Lösbarkeit und bestimmen Sie jeweils die Lösungsmenge.

Mehr

Reihe: Electronic Commerce Band 22

Reihe: Electronic Commerce Band 22 Reihe: Electronic Commerce Band 22 Herausgegeben von Prof. Dr. Dr. h. c. Norbert Szyperski, Köln, Prof. Dr. Beat F. Schmid, St. Gallen, Prof. Dr. Dr. h. c. mult. August-Wilhelm Scheer, Saarbrücken, Prof.

Mehr

Durch Usability spürbar produktiver werden. kirschwerk - Wir machen s einfach

Durch Usability spürbar produktiver werden. kirschwerk - Wir machen s einfach Durch Usability spürbar produktiver werden Inhalt Wer ist kirschwerk? Überblick über Referenzen Ausgewählte Referenzen kirschwerk kurz vorgestellt einfach machen seit 2010 Gegründet 2010 Geschäftsführerin:

Mehr

Jens Schmidt Senior Member Technical Staff

Jens Schmidt Senior Member Technical Staff Jens Schmidt Senior Member Technical Staff Oracle 9i Data Mining Connector 1.1 für mysap BW Agenda Data Mining Grundlagen Der Data Mining Prozess Oracle Data Mining Integration mit mysap BW Agenda Data

Mehr

3.3 Optimale binäre Suchbäume

3.3 Optimale binäre Suchbäume 3.3 Optimale binäre Suchbäume Problem 3.3.1. Sei S eine Menge von Schlüsseln aus einem endlichen, linear geordneten Universum U, S = {a 1,,...,a n } U und S = n N. Wir wollen S in einem binären Suchbaum

Mehr

WEKA A Machine Learning Interface for Data Mining

WEKA A Machine Learning Interface for Data Mining WEKA A Machine Learning Interface for Data Mining Frank Eibe, Mark Hall, Geoffrey Holmes, Richard Kirkby, Bernhard Pfahringer, Ian H. Witten Reinhard Klaus Losse Künstliche Intelligenz II WS 2009/2010

Mehr

Online Marketing Services. Attributionsmodelle. Theorie. Praxis. Herausforderungen.

Online Marketing Services. Attributionsmodelle. Theorie. Praxis. Herausforderungen. Online Marketing Services Attributionsmodelle Theorie. Praxis. Herausforderungen. Alexander Gut SEO und Affiliate- Marketing Inhouse AdWords Kampagnen- Betreuung Conversion Optimierung Zahlreiche erfolgreiche

Mehr

Business Model Canvas

Business Model Canvas Business Model Canvas Die Business Model Canvas (dt.: Leinwand) ist ein von Alexander Osterwalder und Yves Pigneur entwickeltes Werkzeug zur Entwicklung innovativer Geschäftsmodelle. Es besteht aus neun

Mehr

Sequenzgenerierung aus Klassifikationsbäumen

Sequenzgenerierung aus Klassifikationsbäumen Sequenzgenerierung aus Klassifikationsbäumen Peter M. Kruse, 24.01.2011 PMK, 24.01.2011 Inhalt Einleitung Stand von Wissenschaft und Technik Generierung von Testsequenzen mit der Klassifikationsbaum-Methode

Mehr

Vorlesung Wissensentdeckung in Datenbanken

Vorlesung Wissensentdeckung in Datenbanken Vorlesung Wissensentdeckung in Datenbanken Data Cube Katharina Morik, Uwe Ligges Informatik LS 8 22.04.2010 1 von 26 Gliederung 1 Einführung 2 Aggregation in SQL, GROUP BY 3 Probleme mit GROUP BY 4 Der

Mehr

4.Tutorium Multivariate Verfahren

4.Tutorium Multivariate Verfahren 4.Tutorium Multivariate Verfahren - Clusteranalyse - Hannah Busen: 01.06.2015 und 08.06.2015 Nicole Schüller: 02.06.2015 und 09.06.2015 Institut für Statistik, LMU München 1 / 17 Gliederung 1 Idee der

Mehr

Nicht nur das Los entscheidet - Anmeldeverfahren in Stud.IP Nicht nur das Los entscheidet - Anmeldeverfahren in Stud.IP

Nicht nur das Los entscheidet - Anmeldeverfahren in Stud.IP Nicht nur das Los entscheidet - Anmeldeverfahren in Stud.IP Universität Passau Universität Oldenburg 15.06.2010 1/18 Worum geht es? Redesign der, zentrale Anmeldemasken für Administratoren (Passauer-Lösung), flexiblere Definitionsmöglichkeit von Kontingenten, Performanceverbesserung

Mehr

Prüfungsrelevante Studienleistung Logische Programmierung (Sommer 2006) Magische Quadrate. Patricia Röschke (46016) Martin Grandrath (46375)

Prüfungsrelevante Studienleistung Logische Programmierung (Sommer 2006) Magische Quadrate. Patricia Röschke (46016) Martin Grandrath (46375) Prüfungsrelevante Studienleistung Logische Programmierung (Sommer 2006) Magische Quadrate Patricia Röschke (46016) Martin Grandrath (46375) 31. Oktober 2006 Inhalt 1 Aufgabenstellung 2 2 Erläuterung der

Mehr

Vorlesung Wissensentdeckung in Datenbanken

Vorlesung Wissensentdeckung in Datenbanken Gliederung Vorlesung Wissensentdeckung in Datenbanken Data Cube Katharina Morik, Claus Weihs 14.07.2009 1 Einführung 2 Aggregation in SQL, GROUP BY 3 Probleme mit GROUP BY 4 Der Cube-Operator 5 Implementierung

Mehr

2.3 Logikoptimierung. Überblick digitale Synthese. Logikoptimierung

2.3 Logikoptimierung. Überblick digitale Synthese. Logikoptimierung 2.3 Logikoptimierung Logikoptimierung Überblick digitale Synthese Logikoptimierung Begriffe Mehrstufige Logik Zweistufige Logik:..Exakte Verfahen..Heuristische Verfahren..Expansion/ Reduktion..Streichen

Mehr

Schätzverfahren ML vs. REML & Modellbeurteilung mittels Devianz, AIC und BIC. Referenten: Linda Gräfe & Konstantin Falk

Schätzverfahren ML vs. REML & Modellbeurteilung mittels Devianz, AIC und BIC. Referenten: Linda Gräfe & Konstantin Falk Schätzverfahren ML vs. REML & Modellbeurteilung mittels Devianz, AIC und BIC Referenten: Linda Gräfe & Konstantin Falk 1 Agenda Schätzverfahren ML REML Beispiel in SPSS Modellbeurteilung Devianz AIC BIC

Mehr

Daniel Fischer. ISI 2000, Best Student Paper Award

Daniel Fischer. ISI 2000, Best Student Paper Award Untersuchung von Synergieeffekten von Datenstruktur- und n zur Prozessoptimierung anhand des Projektes TDS der Firma Adtranz (Abstract) Daniel Fischer ISI 2000, Best Student Paper Award e rücken vor allem

Mehr

Bully-Algorithmus Krebs Florian, Kus Matthias, Pisselhoy Andreas, Schwab Benjamin, Heinrich Jörg

Bully-Algorithmus Krebs Florian, Kus Matthias, Pisselhoy Andreas, Schwab Benjamin, Heinrich Jörg Bully-Algorithmus Krebs Florian, Kus Matthias, Pisselhoy Andreas, Schwab Benjamin, Heinrich Jörg Programmierung verteilter Systeme Lab Institut für Informatik Universität Augsburg Universitätsstraße 14,

Mehr

Predictive Modeling Markup Language. Thomas Morandell

Predictive Modeling Markup Language. Thomas Morandell Predictive Modeling Markup Language Thomas Morandell Index Einführung PMML als Standard für den Austausch von Data Mining Ergebnissen/Prozessen Allgemeine Struktur eines PMML Dokuments Beispiel von PMML

Mehr

Datenstrukturen und Algorithmen. Christian Sohler FG Algorithmen & Komplexität

Datenstrukturen und Algorithmen. Christian Sohler FG Algorithmen & Komplexität Datenstrukturen und Algorithmen Christian Sohler FG Algorithmen & Komplexität 1 Clustering: Partitioniere Objektmenge in Gruppen(Cluster), so dass sich Objekte in einer Gruppe ähnlich sind und Objekte

Mehr

Versionsverwaltung. Seminar Softwareentwicklung in der Wissenschaft Robert Wiesner

Versionsverwaltung. Seminar Softwareentwicklung in der Wissenschaft Robert Wiesner Versionsverwaltung Seminar Softwareentwicklung in der Wissenschaft Robert Wiesner Gliederung Motivation Allgemeines Varianten der Versionsverwaltung Versionierungssysteme Git als Versionierungssystem-Beispiel

Mehr

Typologisierung von Jungunternehmen

Typologisierung von Jungunternehmen Jungunternehmen auf dem Weg zum konsolidierten Mittelstand Typologisierung von Jungunternehmen Dr. Anne Weber, Drs.. MIB Paul Flachskampf Institut für f r Unternehmenskybernetik e.v. Oliver Strauß Institut

Mehr

Clusteranalyse für Netzwerke

Clusteranalyse für Netzwerke Alexandra Rebecca Klages Clusteranalyse für Netzwerke PETER LANG Internationaler Verlag der Wissenschaften Inhaltsverzeichnis 1 Einleitung 1 2 Grundlagen 7 2.1 Netzwerktheorie 7 2.1.1 Definitionen 7 2.1.2

Mehr

Skalierbare Graph-basierte Analyse und Business Intelligence

Skalierbare Graph-basierte Analyse und Business Intelligence Skalierbare Graph-basierte Analyse und Business Intelligence André Petermann Universität Leipzig & ScaDS Dreden/Leipzig Graphs are everywhere GRADOOP Business Intelligence Zusammenfassung Skalierbare Graph-basierte

Mehr

Einführung in Support Vector Machines (SVMs)

Einführung in Support Vector Machines (SVMs) Einführung in (SVM) Januar 31, 2011 Einführung in (SVMs) Table of contents Motivation Einführung in (SVMs) Outline Motivation Vektorrepräsentation Klassifikation Motivation Einführung in (SVMs) Vektorrepräsentation

Mehr

Visualisierung von großen Musiksammlungen unter Berücksichtigung projektionsbedingter Verzerrungen

Visualisierung von großen Musiksammlungen unter Berücksichtigung projektionsbedingter Verzerrungen Data & Knowledge Engineering Group Visualisierung von großen Musiksammlungen unter Berücksichtigung projektionsbedingter Verzerrungen Sebastian Stober Überblick Problembeschreibung von Bergen, Tälern und

Mehr

Methoden zur Cluster - Analyse

Methoden zur Cluster - Analyse Kapitel 4 Spezialvorlesung Modul 10-202-2206 (Fortgeschrittene Methoden in der Bioinformatik) Jana Hertel Professur für Bioinformatik Institut für Informatik Universität Leipzig Machine learning in bioinformatics

Mehr

Das Projekt Automatische Sacherschließung an der ZBW

Das Projekt Automatische Sacherschließung an der ZBW Das Projekt Automatische Sacherschließung an der ZBW Martin Toepfer (Wissenschaftlicher Mitarbeiter, M. Sc. Informatik) ZBW Leibniz-Informationszentrum Wirtschaft Workshop Computerunterstützte Inhaltserschließung

Mehr

Multivariate Lineare Modelle SS Einführung. 1. Organisation. 2. Übersicht. 3. Arbeiten mit SAS

Multivariate Lineare Modelle SS Einführung. 1. Organisation. 2. Übersicht. 3. Arbeiten mit SAS Multivariate Lineare Modelle SS 2009 0 Einführung 1. Organisation 2. Übersicht 3. Arbeiten mit SAS 1 0.1 Organisation Lehrziele: Theorie von multivariaten linearen Modellen Praktische Anwendung mit SAS

Mehr

Analytic im Einsatz! Betrugserkennung auf Basis von Big Data. Karol Sobiech

Analytic im Einsatz! Betrugserkennung auf Basis von Big Data. Karol Sobiech Analytic im Einsatz! Betrugserkennung auf Basis von Big Data Karol Sobiech 2 ACCENTURE GLOBAL DELIVERY NETWORK 3 4 AGENDA 1 MOTIVATION & ZIEL 2 METHODEN FRAUD MANAGEMENT SYSTEM 4 ARCHITEKTUR & TOOLS 3

Mehr

Präferenzbasierte Segmentierung von Fondskäufern

Präferenzbasierte Segmentierung von Fondskäufern Reinhard Schmidt Präferenzbasierte Segmentierung von Fondskäufern Verbesserung der Kundenorientierung im Fondsvertrieb Mit Geleitworten von Prof. Dr. Volker Trommsdorff und Prof. Dr. Hans Hirth Deutscher

Mehr

MEHR KONTROLLE, MEHR SICHERHEIT. Business Suite

MEHR KONTROLLE, MEHR SICHERHEIT. Business Suite MEHR KONTROLLE, MEHR SICHERHEIT Business Suite 2 ENDGERÄTESCHUTZ - DAS HERZSTÜCK DER CYBER SECURITY Cyber-Angriffe treten immer häufiger auf und werden dabei stets ausgefeilter. Jedes Unternehmen kann

Mehr

Anpassung von Data-Warehouse-Techniken für den Einsatz unsicherer Verkehrsdaten

Anpassung von Data-Warehouse-Techniken für den Einsatz unsicherer Verkehrsdaten Diplomvortrag Anpassung von Data-Warehouse-Techniken für den entstanden im Rahmen des OVID-Projektes Institut für Programmstrukturen und Datenorganisation Verantwortlicher Betreuer: Prof. Dr.-Ing. Klemens

Mehr

Electronic Design Automation (EDA) Logikoptimierung

Electronic Design Automation (EDA) Logikoptimierung Electronic Design Automation (EDA) Logikoptimierung Überblick digitale Synthese Logikoptimierung Begriffe Mehrstufige Logik Zweistufige Logik: Exakte Verfahren... Heuristische Verfahren... Expansion/Reduktion...

Mehr

Inhaltsverzeichnis. Georg Stark. Robotik mit MATLAB ISBN: Weitere Informationen oder Bestellungen unter

Inhaltsverzeichnis. Georg Stark. Robotik mit MATLAB ISBN: Weitere Informationen oder Bestellungen unter Inhaltsverzeichnis Georg Stark Robotik mit MATLAB ISBN: 978-3-446-41962-9 Weitere Informationen oder Bestellungen unter http://www.hanser.de/978-3-446-41962-9 sowie im Buchhandel. Carl Hanser Verlag, München

Mehr

Überblick. Einführung in die automatische Mustererkennung Grundlagen der Wahrscheinlichkeitsrechnung

Überblick. Einführung in die automatische Mustererkennung Grundlagen der Wahrscheinlichkeitsrechnung Grundlagen Überblick Einführung in die automatische Mustererkennung Grundlagen der Wahrscheinlichkeitsrechnung Klassifikation bei bekannter Wahrscheinlichkeitsverteilung Entscheidungstheorie Bayes-Klassifikator

Mehr

Was können uns Zeitreihen von Baumzuwächsen über eine sich ändernde Umwelt erzählen?

Was können uns Zeitreihen von Baumzuwächsen über eine sich ändernde Umwelt erzählen? S. 1 Trendanalyse mit gemischten linearen Modellen: SAS-Lösungen und Anwendung in der Ökologie Thomas Riemer, Systematika GmbH Heidelberg Hanns Hubert Leuschner, Universität Göttingen Was können uns Zeitreihen

Mehr

10 Inhaltsverzeichnis

10 Inhaltsverzeichnis Georg Stark Robotik mit MATLAB Mit 101 Bildern, 33 Tabellen, 40 Beispielen, 55 Aufgaben und 37 Listings Fachbuchverlag Leipzig im Carl Hanser Verlag Inhaltsverzeichnis 1 Einführung in die Robotik 13 1.1

Mehr

Data Mining mit RapidMiner. Fakultät Informatik Lehrstuhl für Künstliche Intelligenz

Data Mining mit RapidMiner. Fakultät Informatik Lehrstuhl für Künstliche Intelligenz Data Mining mit RapidMiner Fakultät Informatik Motivation CRISP: DM-Prozess besteht aus unterschiedlichen Teilaufgaben Datenvorverarbeitung spielt wichtige Rolle im DM-Prozess Systematische Evaluationen

Mehr

wind up your energy vom Windpark zum Windkraftwerk Heiko Harms, Vorstand EWE AG Oldenburg,

wind up your energy vom Windpark zum Windkraftwerk Heiko Harms, Vorstand EWE AG Oldenburg, wind up your energy vom Windpark zum Windkraftwerk Heiko Harms, Vorstand EWE AG Oldenburg, 13.01.2010 0 Windenergie hat eine lange Tradition bei EWE Beginn des Aufbaus des Geschäftsfeldes Windenergie Inbetriebnahme

Mehr

Data Mining - Wiederholung

Data Mining - Wiederholung Data Mining - Wiederholung Norbert Fuhr 18. Januar 2006 Problemstellungen Problemstellungen Daten vs. Information Def. Data Mining Arten von strukturellen Beschreibungen Regeln (Klassifikation, Assoziations-)

Mehr

Mathematische Grundlagen III

Mathematische Grundlagen III Mathematische Grundlagen III Maschinelles Lernen III: Clustering Vera Demberg Universität des Saarlandes 7. Juli 202 Vera Demberg (UdS) Mathe III 7. Juli 202 / 35 Clustering vs. Klassifikation In den letzten

Mehr

Algorithmen und Datenstrukturen II

Algorithmen und Datenstrukturen II Algorithmen und Datenstrukturen II Algorithmen zur Textverarbeitung III: D. Rösner Institut für Wissens- und Sprachverarbeitung Fakultät für Informatik Otto-von-Guericke Universität Magdeburg Sommer 2009,

Mehr

Visualisierung von 1-, 2- und 3dimensionalen Zeitreihen

Visualisierung von 1-, 2- und 3dimensionalen Zeitreihen Visualisierung von 1-, 2- und 3dimensionalen Zeitreihen Diplomarbeit Diplomand: Ing. Thomas Panner Erstprüfer: Prof. Dr.-Ing. Jürgen Ruck Zweitprüfer: Dipl.-Ing. Dr. Thomas Grünberger präsentiert am 8.

Mehr

Clustern: Voraussetzungen

Clustern: Voraussetzungen Clustering Gruppen (Cluster) ähnlicher Elemente bilden Elemente in einem Cluster sollen sich möglichst ähnlich sein, u. den Elementen in anderen Clustern möglichst unähnlich im Gegensatz zu Kategorisierung

Mehr

Erfassung von Unternehmenszielen und Qualifizierungsbedarfen im Einzelhandel. Ihre generellen Unternehmensziele:

Erfassung von Unternehmenszielen und Qualifizierungsbedarfen im Einzelhandel. Ihre generellen Unternehmensziele: Ihre generellen Unternehmensziele: Erfassung von Unternehmenszielen und Qualifizierungsbedarfen im Einzelhandel Überlegen Sie, welche konkreten Ziele Sie in den nächsten Monaten für Ihr Unternehmen erreichen

Mehr

INTELLIGENTE DATENANALYSE IN MATLAB. Unüberwachtes Lernen: Clustern von Attributen

INTELLIGENTE DATENANALYSE IN MATLAB. Unüberwachtes Lernen: Clustern von Attributen INTELLIGENTE DATENANALYSE IN MATLAB Unüberwachtes Lernen: Clustern von Attributen Literatur J. Han, M. Kamber: Data Mining Concepts and Techniques. J. Han et. al: Mining Frequent Patterns without Candidate

Mehr

Konzepte der AI Neuronale Netze

Konzepte der AI Neuronale Netze Konzepte der AI Neuronale Netze Franz Wotawa Institut für Informationssysteme, Database and Artificial Intelligence Group, Technische Universität Wien Email: wotawa@dbai.tuwien.ac.at Was sind Neuronale

Mehr

Hierarchische Produktionsplanung

Hierarchische Produktionsplanung Marion Steven Hierarchische Produktionsplanung 2., überarbeitete und erweiterte Auflage Mit 48 Abbildungen Physica-Verlag Ein Unternehmen des Springer-Verlags Inhaltsverzeichnis 0. Einleitung und Übersicht

Mehr

Neuerungen im Enterprise Miner 5.2 & Text Miner 2.3

Neuerungen im Enterprise Miner 5.2 & Text Miner 2.3 Neuerungen im Enterprise Miner 5.2 & Text Miner 2.3 Copyright 2005, SAS Institute Inc. All rights reserved. Ulrich Reincke, SAS Deutschland Agenda Der Neue Enterprise Miner 5.2 Der Neue Text Miner 2.3

Mehr

Flächenaggregation LEHRSTUHL FÜR ALGORITHMIK I INSTITUT FÜR THEORETISCHE INFORMATIK FAKULTÄT FÜR INFORMATIK

Flächenaggregation LEHRSTUHL FÜR ALGORITHMIK I INSTITUT FÜR THEORETISCHE INFORMATIK FAKULTÄT FÜR INFORMATIK Vorlesung Algorithmische Kartografie Flächenaggregation LEHRSTUHL FÜR ALGORITHMIK I INSTITUT FÜR THEORETISCHE INFORMATIK FAKULTÄT FÜR INFORMATIK Martin Nöllenburg 09.07.2013 1 Flächenaggregation Flächennutzung

Mehr

Die Fleissarbeit dem PC: Umfragen auf Knopfdruck auswerten

Die Fleissarbeit dem PC: Umfragen auf Knopfdruck auswerten Die Fleissarbeit dem PC: Umfragen auf Knopfdruck auswerten Druckreife statistische Auswertungen von Umfragen in Rekordzeit Jonas Bieri Basel-Stadt jonas.bieri@bs.ch Agenda 1. Das Problem Bestehende Umfrageauswertungs-Tools:

Mehr

Titelmaster. Geodätische Woche. 3-D Phase Unwrapping Algorithmen zur Lösung der Phasenmehrdeutigkeiten in D-InSAR Stapeln

Titelmaster. Geodätische Woche. 3-D Phase Unwrapping Algorithmen zur Lösung der Phasenmehrdeutigkeiten in D-InSAR Stapeln Titelmaster Geodätische Woche 3-D Phase Unwrapping Algorithmen zur Lösung der Phasenmehrdeutigkeiten in D-InSAR Stapeln Sebastian Walzog, Ina Loth, Lutz Roese-Koerner, Wolf-Dieter Schuh Institut für Geodäsie

Mehr

ML Deployment. Vom Prototyp zur Produktion

ML Deployment. Vom Prototyp zur Produktion ML Deployment Vom Prototyp zur Produktion Marcel Spitzer Karlsruhe, 15.3.2018 Marcel Spitzer Big Data Scientist @ inovex Wi.-Mathematik (B.Sc.), Wi.-Informatik (M.Sc.) Data Science mit Python und R Deployment

Mehr

Künstliche Intelligenz

Künstliche Intelligenz George F. Luger 2008 AGI-Information Management Consultants May be used for personal purporses only or by libraries associated to dandelon.com network. Künstliche Intelligenz Strategien zur Lösung komplexer

Mehr

Grundlagen Drittnutzerfinanzierung

Grundlagen Drittnutzerfinanzierung Grundlagen Drittnutzerfinanzierung Workshop Neue Finanzierungsinstrumente zur Sicherung des ÖPNV Haus am Dom, Frankfurt, 21.06.2013 Stefan Groer Inhalt Warum Drittnutzerfinanzierung? Was ist Drittnutzerfinanzierung?

Mehr

Auswahl repräsentativer Netznutzungsfälle zur Bewertung zukünftiger Systemzustände in der Betriebsplanung elektrischer Übertragungsnetze

Auswahl repräsentativer Netznutzungsfälle zur Bewertung zukünftiger Systemzustände in der Betriebsplanung elektrischer Übertragungsnetze Auswahl repräsentativer Netznutzungsfälle zur Bewertung zukünftiger Systemzustände in der Betriebsplanung elektrischer Übertragungsnetze Oliver Scheufeld, Lukas Kalisch, Andreas Moormann, Simon Krahl,

Mehr

Modell-basierte Entwicklung mit der Timing Definition Language (TDL)

Modell-basierte Entwicklung mit der Timing Definition Language (TDL) Modell-basierte Entwicklung mit der Timing Definition Language (TDL) Prof. Dr. Wolfgang Pree Univ. Salzburg Inhalt Motivation für einen Paradigmenwechsel bisher: zuerst Plattform, dann Software => Software

Mehr

Einführung in die Computerlinguistik

Einführung in die Computerlinguistik Einführung in die Computerlinguistik Statistische Grundlagen Laura Kallmeyer Heinrich-Heine-Universität Düsseldorf Summer 2016 1 / 21 Diskrete Wahrscheinlichkeitsräume (1) Carstensen et al. (2010), Abschnitt

Mehr

1 Einleitung Hintergründe der Arbeit Zielsetzung und Aufbau der Arbeit 8. 2 Definitionen und Grundlagen 11

1 Einleitung Hintergründe der Arbeit Zielsetzung und Aufbau der Arbeit 8. 2 Definitionen und Grundlagen 11 Inhaltsverzeichnis 1 Einleitung 1 1.1 Hintergründe der Arbeit 1 1.2 Zielsetzung und Aufbau der Arbeit 8 2 Definitionen und Grundlagen 11 2.1 Überblick 12 2.2 Externe und bankinterne Stresstests 12 2.2.1

Mehr

Aufbau eines Clusters mit der NoSQL- Datenbank MongoDB auf Basis von Einplatinencomputern

Aufbau eines Clusters mit der NoSQL- Datenbank MongoDB auf Basis von Einplatinencomputern Fachbereich 2 Informatik und Ingenieurwissenschaften Im Studiengang Informatik Aufbau eines Clusters mit der NoSQL- Datenbank MongoDB auf Basis von Einplatinencomputern Kolloquium zur Bachelorthesis Danijel

Mehr

Künstliche Intelligenz

Künstliche Intelligenz Künstliche Intelligenz Bearbeitet von Uwe Lämmel, Jürgen Cleve 4., aktualisierte Auflage 2012. Buch. 336 S. ISBN 978 3 446 42758 7 Format (B x L): 18 x 24,5 cm Gewicht: 717 g Weitere Fachgebiete > EDV,

Mehr

Big Data in der Praxis

Big Data in der Praxis Jonas Freiknecht Big Data in der Praxis Lösungen mit Hadoop, HBase und Hive Daten speichern, aufbereiten, visualisieren HANSER Vorwort XI 1 Einleitung 1 2 Big-Data 7 2.1 Historische Entstehung 8 2.2 Big-Data

Mehr

Apriori-Algorithmus zur Entdeckung von Assoziationsregeln

Apriori-Algorithmus zur Entdeckung von Assoziationsregeln Apriori-Algorithmus zur Entdeckung von PG 42 Wissensmanagment Lehrstuhl für Künstliche Intelligenz 22. Oktober 21 Gliederung Motivation Formale Problemdarstellung Apriori-Algorithmus Beispiel Varianten

Mehr

Programmierpraktikum Algorithm Engineering (FPT-Algorithmen) Einführung

Programmierpraktikum Algorithm Engineering (FPT-Algorithmen) Einführung Programmierpraktikum Algorithm Engineering (FPT-Algorithmen) Einführung Martin Holzer Ignaz Rutter 31. Oktober 2008 Ansätze für NP-schwere Probleme 2/28 Approximative Lösungen Average-Case- statt Worst-Case-Analyse

Mehr

Modulempfehlungen über Vorgänger- und Nachfolgemodule. Patrick Bittner tubit IT Service Center INFORMATIK 2015 Workshop: Hochschule 2025

Modulempfehlungen über Vorgänger- und Nachfolgemodule. Patrick Bittner tubit IT Service Center INFORMATIK 2015 Workshop: Hochschule 2025 Modulempfehlungen über Vorgänger- und Nachfolgemodule Patrick Bittner tubit IT Service Center INFORMATIK 2015 Workshop: Hochschule 2025 Motivation Studierende wählen Module Welche Module könnten mich interessieren?

Mehr