Seminar im Sommersemester 2005 DATA WAREHOUSING. Data Mining. Christian Knappe. Fachrichtung Wirtschaftsinformatik Friedrich-Schiller-Universität Jena
|
|
- Stephan Förstner
- vor 8 Jahren
- Abrufe
Transkript
1 Seminar im Sommersemester 2005 DATA WAREHOUSING Data Mining Christian Knappe Fachrichtung Wirtschaftsinformatik Friedrich-Schiller-Universität Jena Fakultät für Mathematik und Informatik Lehrstuhl für Datenbanken und Informationssysteme Lehrstuhlinhaber Prof. Dr. Klaus Küspert Betreuung Dipl. Inf. Thomas Müller
2 Inhalt III. Einführung und Motivation 1. Daten und Technik 2. Was ist Data Mining? IV. Data Mining im Überblick 1. DM und Data Warehousing 2. DM vs. OLAP 3. Was leistet DM? 4. Anwendungsgebiete V. Prozessmodelle im DM 1. KDD als Ausgangspunkt? 2. DM - Teil des Ganzen 3. CRISP-DM als moderne Referenz 4. Weitere Vorgehensweisen VI. Anwendungsübergreifend dank PMML
3 I. Einführung und Motivation 1. Daten und Technik - Hohes Datenaufkommen Daten werden in riesigen Datenbanken gesammelt Manuelle Auswertung kaum noch möglich [
4 I. Einführung und Motivation 1. Daten und Technik - Leistungsfähige Hardware steigende Geschwindigkeit steigende Kapazität relativ kostengünstig [Grafik und mehr: Hans Moravec
5 I. Einführung und Motivation 1. Daten und Technik - Komplexe Strukturen Von Matt Loney ZDNet 31. Januar 2005, 09:37 Uhr Urs Hölzle, Google VP of Engineering Die Zahlen an sich sind schon überwältigend: - Über vier Milliarden Webseiten, jede mit durchschnittlich 10 KByte, alle komplett indiziert - Bis zu 2000 Rechner in einem Cluster - Über 30 Cluster - Ein Petabyte Daten pro Cluster -Oberfläche in 104 Sprachen, unter anderem in Klingonisch und Tagalogisch - Kontinuierlicher Durchsatz von 2 Gbit/s in einem Cluster - Die Erwartung, dass pro Tag in jedem der größeren Cluster zwei Rechner ausfallen ( )
6 I. Einführung und Motivation 1) Was ist Data Mining? - 2 Sichtweisen [HaKa2000] DM als Teil eines Gesamtprozesses (KDD) - Relativ begrenzte Sicht auf DM - Meist technisch DM als Gesamtprozess (moderne Definition) - DM synonym für KDD - CRISP-DM als Beispiel - DM als Synergie aus Verfahren, Methoden und Vorgehensweise
7 I. Einführung und Motivation 1) Was ist Data Mining? - Definitionsansätze Data mining is a problemsolving methodology that finds a logical or mathematical description, eventually of a complex nature, of patterns and regularities in a set of data. [DeFo95] Data mining is a multidisciplinary field, drawing work from areas including database technology, articial intelligence, machine learning, neural networks, statistics, pattern recognition, knowledge based systems, knowledge acquisition, information retrieval, high performance computing, and data visualization. [HaKa2000]
8 1) Data Mining im Überblick 1. DM und Data Warehousing - Datengrundlage aus Data Warehouse [TCC] Unt. Datenquellen werden im Data Warehouse integriert Teile des DW (logisch oder physisch) werden für das Data Mining genutzt
9 1) Data Mining im Überblick 1. DM und Data Warehousing - Data Mining auch ohne Data Warehouse [TCC] DW ist nicht zwangsläufig Voraussetzung für DM Unt. Datenquellen können auch direkt in einen Data Mart überführt werden Fazit: Wahl je nach Anwendungsproblem und -umgebung Aufwand Nutzen Fragestellung
10 1) Data Mining im Überblick 1) DM vs. OLAP - induktiv vs. deduktiv [TCC] OLAP Ausgehend von Hypothese Verifizierung der Hypothese durch Anfragen auf den Daten Problematisch bei vielen Variablen Data Mining Daten werden genutzt um Hypothesen aufzustellen Findet evtl. Ansätze die Analyst nicht bedacht hätte Fazit Beide Vorgehensweisen können sich ergänzen DM findet Hypothesen per OLAP können diese verifiziert werden
11 1) Data Mining im Überblick 1. Was leistet DM? - Most Common Data Mining Tasks 1 [Larose2005] Description (Beschreibung) - Beschreibung von Mustern und Trends in Daten - Transparenz der Muster (Einfachheit) - Intuitive Interpretation und Erklärung möglich Classification (Klassifikation) - Nominale Zielvariable (Kategorie) - Neues Objekt wird entsprechend klassifiziert (einer Kategorie zugeordnet) - Klassifikationsregel wird auf Trainingsdaten erlernt Estimation (Schätzungen) - Ähnlich Classification, jedoch ist Zielvariable numerisch - Punktschätzungen, Intervallschätzungen, lineare Regression, multiple Regression
12 1) Data Mining im Überblick 1. Was leistet DM? - Most Common Data Mining Tasks 2 [Larose2005] Prediction (Vorhersage) - Spezielle Ausprägung von Classification und Estimation - Ergebnisse liegen in der Zukunft Clustering (Gruppenbildung) - Gruppierung der Daten - Innerhalb der Gruppen kleinstmögliche Differenz - Zwischen den Gruppen größtmögliche Differenz (Abstand) Association (Verbindung/Kontakt/Zusammenarbeit) - Aufdecken von Beziehungen zwischen Attributen - Welche Attribute hängen zusammen
13 1) Data Mining im Überblick (i) Anwendungsgebiete [DF95] - Chemie und Pharmazie Entwicklungsprozess ist stark auf Suche ausgerichtet Feldforschung - Im Einzelhandel Marktsegmentierungen Kundenanalysen Marketingaktionen
14 1) Data Mining im Überblick (i) Anwendungsgebiete [DF95] - Finanzwesen Kundenmanagement Vorhersage von Finanzentwicklungen - Remotely sensed Data (Messtechnik) Größter Datenumfang Mustererkennung - Und weitere?
15 1. Prozessmodelle im DM 1. KDD als Ausgangspunkt - Knowledge Discovery in (large) Databases [Fayyad, Piatetsky-Shapiro & Smyth 1996] Knowledge Discovery in Databases (KDD) ist der Prozess der (semi-) automatischen Extraktion von Wissen aus Datenbanken, welches - gültig (im statistischen Sinn), - bisher unbekannt (nicht explizit, kein Allgemeinwissen ) und - potentiell nützlich ist. (für eine gegebene Anwendung)
16 1. Prozessmodelle im DM 1) DM als Teil des Ganzen Fokussieren: Beschaffung der Daten Verwaltung der Daten Selektion relevanter Daten Transformation: Ableitung neuer Merkmale Selektion relevanter Merkmale Evaluation: Bewertung der Interessantheit durch den Nutzer Statistische Prüfung der Modelle Vorverarbeitung: Datenintegration Konsistenzprüfung Data Mining: Suche nach Mustern bzw. Modellen (techn. Def.)
17 1. Prozessmodelle im DM 1. CRISP-DM als moderne Referenz - Ein einheitlicher Standard CRoss- Industrie Standart Process for Data Mining Seit 1997 Konsortium aus Data Mining Anbietern und Nutzern - DaimlerChrysler AG, Germany - OHRA Verzekering en Bankk Groep B.V., Netherlands - NCR Systems Engineering Copenhagen, Denmark - SPSS Inc. seit 1998 über Integral Solutions Limited, UK - Europäische Union im Rahmen des ESPRIT-Programms
18 1. Prozessmodelle im DM 1. CRISP-DM als moderne Referenz Data Mining Lebenszyklus Phasenorientiert Iteratives Vorgehen möglich Zielorientiert [
19 1. Prozessmodelle im DM (i) Weitere Vorgehensweisen SPSS bedient sich der 5 A s Assess Access Analyze Act Automate SAS benutzt SEMMA Sample Explore Modify Model Assess
20 (i) Anwendungsübergreifend dank PMML - Predictive Modelling Markup Language Modellbeschreibungssprache (Definition eines Modells) Bietet einheitlichen Standard Einfache Weitergabe und Nutzbarkeit der Modelle XML- Basiert [
21 Literatur [1] Daniel T. Larose Discovering Knowledge in Data, An Intoduction in Data Mining Verlag Wiley 2005 [2] J. Han, M. Kamber Data Mining: Concepts and Techniques Verlag Morgan Kaufmann Publishers 2000 [3] Two Crows Cooperation Introduction to Data Mining and Knowledge Discovery Third Edition 1999 [4] K. M. Decker, S. Focardi Technology Overview: A report on Data Mining CSCS-ETH 1995
Predictive Modeling Markup Language. Thomas Morandell
Predictive Modeling Markup Language Thomas Morandell Index Einführung PMML als Standard für den Austausch von Data Mining Ergebnissen/Prozessen Allgemeine Struktur eines PMML Dokuments Beispiel von PMML
MehrSeminar Business Intelligence Teil II. Data Mining & Knowledge Discovery
Seminar Business Intelligence Teil II Data Mining & Knowledge Discovery Was ist Data Mining? Sabine Queckbörner Was ist Data Mining? Data Mining Was ist Data Mining? Nach welchen Mustern wird gesucht?
MehrPPC und Data Mining. Seminar aus Informatik LV-911.039. Michael Brugger. Fachbereich der Angewandten Informatik Universität Salzburg. 28.
PPC und Data Mining Seminar aus Informatik LV-911.039 Michael Brugger Fachbereich der Angewandten Informatik Universität Salzburg 28. Mai 2010 M. Brugger () PPC und Data Mining 28. Mai 2010 1 / 14 Inhalt
MehrBusiness and Data Understanding. Business und Data Understanding
Business und Data Understanding Gliederung 1. Grundlagen 2. Von Data Warehouse zu Data Mining 3. Das CRISP-DM Referenzmodell 4. Die Phasen Business- und Data Understanding 5. Überblick der weiteren Phasen
MehrData Mining mit der SEMMA Methodik. Reinhard Strüby, SAS Institute Stephanie Freese, Herlitz PBS AG
Data Mining mit der SEMMA Methodik Reinhard Strüby, SAS Institute Stephanie Freese, Herlitz PBS AG Data Mining Data Mining: Prozeß der Selektion, Exploration und Modellierung großer Datenmengen, um Information
Mehr6. Bayes-Klassifikation. (Schukat-Talamazzini 2002)
6. Bayes-Klassifikation (Schukat-Talamazzini 2002) (Böhm 2003) (Klawonn 2004) Der Satz von Bayes: Beweis: Klassifikation mittels des Satzes von Bayes (Klawonn 2004) Allgemeine Definition: Davon zu unterscheiden
MehrWeb Information Retrieval. Zwischendiskussion. Überblick. Meta-Suchmaschinen und Fusion (auch Rank Aggregation) Fusion
Web Information Retrieval Hauptseminar Sommersemester 2003 Thomas Mandl Überblick Mehrsprachigkeit Multimedialität Heterogenität Qualität, semantisch, technisch Struktur Links HTML Struktur Technologische
MehrData/Information Quality Management
Data/Information Quality Management Seminar WI/Informationsmanagement im Sommersemester 2002 Markus Berberov, Roman Eder, Peter Gerstbach 11.6.2002 Inhalt! Daten und Datenqualität! Einführung und Definition!
MehrDISKUSSIONSBEITRÄGE DER FAKULTÄT FÜR BETRIEBSWIRTSCHAFTSLEHRE MERCATOR SCHOOL OF MANAGEMENT UNIVERSITÄT DUISBURG-ESSEN. Nr. 374
DISKUSSIONSBEITRÄGE DER FAKULTÄT FÜR BETRIEBSWIRTSCHAFTSLEHRE MERCATOR SCHOOL OF MANAGEMENT UNIVERSITÄT DUISBURG-ESSEN Nr. 374 Eignung von Verfahren der Mustererkennung im Process Mining Sabrina Kohne
MehrData Mining als Arbeitsprozess
Data Mining als Arbeitsprozess Hagen Knaf Studiengang Angewandte Mathematik Hochschule RheinMain 31. Dezember 2015 In Unternehmen werden umfangreichere Aktivitäten oder Projekte im Bereich des Data Mining
MehrTitel BOAKdurch Klicken hinzufügen
Titel BOAKdurch Klicken hinzufügen Business Objects Arbeitskreis 2015 Aufbau einer BI-Strategie Referent Stefan Weber, ZIS Verkehrsbetriebe Zürich 15.09.2015 Hotel UTO KULM Thema Um was geht es! C1: Aufbau
MehrGrundlagen der Datenanalyse am Beispiel von SPSS
Grundlagen der Datenanalyse am Beispiel von SPSS Einführung Dipl. - Psych. Fabian Hölzenbein hoelzenbein@psychologie.uni-freiburg.de Einführung Organisatorisches Was ist Empirie? Was ist Statistik? Dateneingabe
MehrPersonalisierung. Der Personalisierungsprozess Nutzerdaten erheben aufbereiten auswerten Personalisierung. Data Mining.
Personalisierung Personalisierung Thomas Mandl Der Personalisierungsprozess Nutzerdaten erheben aufbereiten auswerten Personalisierung Klassifikation Die Nutzer werden in vorab bestimmte Klassen/Nutzerprofilen
MehrData Lineage goes Traceability - oder was Requirements Engineering von Business Intelligence lernen kann
Data Lineage goes Traceability - oder was Requirements Engineering von Business Intelligence lernen kann Andreas Ditze MID GmbH Kressengartenstraße 10 90402 Nürnberg a.ditze@mid.de Abstract: Data Lineage
MehrData Mining Standards am Beispiel von PMML. Data Mining Standards am Beispiel von PMML
Data Mining Standards am Beispiel von PMML Allgemeine Definitionen im Data Mining Data Mining (DM) Ein Prozess, um interessante neue Muster, Korrelationen und Trends in großen Datenbeständen zu entdecken,
MehrSeminar Informationsintegration und Informationsqualität. Dragan Sunjka. 30. Juni 2006
Seminar Informationsintegration und Informationsqualität TU Kaiserslautern 30. Juni 2006 Gliederung Autonomie Verteilung führt zu Autonomie... Intra-Organisation: historisch Inter-Organisation: Internet
MehrMai 2006. Hauptseminar: Nichtrelationale Datenbanken Historisch-Kulturwissenschaftliche Informationsverarbeitung Universität zu Köln
Hauptseminar: Nichtrelationale Historisch-Kulturwissenschaftliche Informationsverarbeitung Universität zu Köln Mai 2006 Was ist eine Datenbank? Erweiterung relationaler um eine Deduktionskomponente Diese
Mehrarlanis Software AG SOA Architektonische und technische Grundlagen Andreas Holubek
arlanis Software AG SOA Architektonische und technische Grundlagen Andreas Holubek Speaker Andreas Holubek VP Engineering andreas.holubek@arlanis.com arlanis Software AG, D-14467 Potsdam 2009, arlanis
MehrC09: Einsatz SAP BW im Vergleich zur Best-of-Breed-Produktauswahl
C09: Einsatz SAP BW im Vergleich zur Best-of-Breed-Produktauswahl Ein Seminar der DWH academy Seminar C09 Einsatz SAP BW im Vergleich zur Best-of-Breed- Produktauswahl Befasst man sich im DWH mit der Auswahl
MehrData Mining-Modelle und -Algorithmen
Data Mining-Modelle und -Algorithmen Data Mining-Modelle und -Algorithmen Data Mining ist ein Prozess, bei dem mehrere Komponenten i n- teragieren. Sie greifen auf Datenquellen, um diese zum Training,
MehrUse Cases. Die Sicht des Nutzers. Fortgeschrittenenpraktikum SS 2004
Use Cases Die Sicht des Nutzers Fortgeschrittenenpraktikum SS 2004 Gunar Fiedler Lehrstuhl für Technologie der Informationssysteme Kontakt: fiedler@is.informatik.uni-kiel.de Use Cases 2 Was ist ein Use
MehrData Warehouse Definition (1) http://de.wikipedia.org/wiki/data-warehouse
Data Warehouse Definition (1) http://de.wikipedia.org/wiki/data-warehouse Ein Data-Warehouse bzw. Datenlager ist eine zentrale Datensammlung (meist eine Datenbank), deren Inhalt sich aus Daten unterschiedlicher
MehrData Mining-Projekte
Data Mining-Projekte Data Mining-Projekte Data Mining stellt normalerweise kein ei nmaliges Projekt dar, welches Erkenntnisse liefert, die dann nur einmal verwendet werden, sondern es soll gewöhnlich ein
MehrBig Data Projekte richtig managen!
Big Data Projekte richtig managen! Stuttgart, Oktober 2014 Praktische Herausforderungen eines Big Data Projektes Definition: Was ist Big Data? Big data is a collection of data sets so large and comple
MehrData Mining Anwendungen und Techniken
Data Mining Anwendungen und Techniken Knut Hinkelmann DFKI GmbH Entdecken von Wissen in banken Wissen Unternehmen sammeln ungeheure mengen enthalten wettbewerbsrelevantes Wissen Ziel: Entdecken dieses
MehrAufgaben zum Datenmanagement
Aufgaben zum Datenmanagement Johannes Hain Lehrstuhl für Mathematik VIII Statistik 1/10 Datentransformationen Berechnung neuer Variablen Berechne das Durchschnittsalter und die Durchschnittsgröße beider
MehrEducation Day 2012. Wissensgold aus Datenminen: wie die Analyse vorhandener Daten Ihre Performance verbessern kann! Education Day 2012 11.10.
Wissensgold aus Datenminen: wie die Analyse vorhandener Daten Ihre Performance verbessern kann! 11.10.2012 1 BI PLUS was wir tun Firma: BI plus GmbH Giefinggasse 6/2/7 A-1210 Wien Mail: office@biplus.at
MehrTiefgreifende Prozessverbesserung und Wissensmanagement durch Data Mining
Tiefgreifende Prozessverbesserung und Wissensmanagement durch Data Mining Ausgangssituation Kaizen Data Mining ISO 9001 Wenn andere Methoden an ihre Grenzen stoßen Es gibt unzählige Methoden, die Abläufe
MehrDatenbanken und Informationssysteme
Datenbanken und Informationssysteme Lehrangebot Stefan Conrad Heinrich-Heine-Universität Düsseldorf Institut für Informatik April 2012 Stefan Conrad (HHU) Datenbanken und Informationssysteme April 2012
MehrData Mining und maschinelles Lernen
Data Mining und maschinelles Lernen Einführung und Anwendung mit WEKA Caren Brinckmann 16. August 2000 http://www.coli.uni-sb.de/~cabr/vortraege/ml.pdf http://www.cs.waikato.ac.nz/ml/weka/ Inhalt Einführung:
MehrUmsetzung der Anforderungen - analytisch
Umsetzung der Anforderungen - analytisch Titel des Lernmoduls: Umsetzung der Anforderungen - analytisch Themengebiet: New Economy Gliederungspunkt im Curriculum: 4.2.5.5 Zum Inhalt: In diesem Modul wird
MehrÜbungen zur Softwaretechnik
Technische Universität München Fakultät für Informatik Lehrstuhl IV: Software & Systems Engineering Markus Pister, Dr. Bernhard Rumpe WS 2002/2003 Lösungsblatt 9 17. Dezember 2002 www4.in.tum.de/~rumpe/se
MehrTHEOBALD XTRACT PPS IXTO GMBH. Mathias Slawik, Linda Kallinich
THEOBALD XTRACT PPS IXTO GMBH Mathias Slawik, Linda Kallinich Projekt BWA: Analytische Anwendungen, WS 2010/2011 Agenda 2/14 Projektaufgabe Technologien / Xtract PPS Projektablauf Dashboard-Prototyp Bewertung
Mehr2. Psychologische Fragen. Nicht genannt.
Checkliste für die Beurteilung psychologischer Gutachten durch Fachfremde Gliederung eines Gutachtens 1. Nennung des Auftraggebers und Fragestellung des Auftraggebers. 2. Psychologische Fragen. Nicht genannt.
MehrLars Priebe Senior Systemberater. ORACLE Deutschland GmbH
Lars Priebe Senior Systemberater ORACLE Deutschland GmbH Data Mining als Anwendung des Data Warehouse Konzepte und Beispiele Agenda Data Warehouse Konzept und Data Mining Data Mining Prozesse Anwendungs-Beispiele
MehrSurvival Guide für Ihr Business Intelligence-Projekt
Survival Guide für Ihr Business Intelligence-Projekt Sven Bosinger Solution Architect BI Survival Guide für Ihr BI-Projekt 1 Agenda Was ist Business Intelligence? Leistungsumfang Prozesse Erfolgsfaktoren
MehrData-Mining in Unternehmen die rechtliche Sicht
Data-Mining in Unternehmen die rechtliche Sicht 15. Symposium on Privacy and Security, 31. August 2010 Dr. Alois Rimle, Ruoss Vögele Partner, Zürich Übersicht Begriff des Data-Mining 3 Anwendung und Auswirkungen
MehrExploration und Klassifikation von BigData
Exploration und Klassifikation von BigData Inhalt Einführung Daten Data Mining: Vorbereitungen Clustering Konvexe Hülle Fragen Google: Riesige Datenmengen (2009: Prozessieren von 24 Petabytes pro Tag)
MehrAnwendung der Predictive Analytics
TDWI Konferenz mit BARC@TDWI Track 2014 München, 23. 25. Juni 2014 Anwendung der Predictive Analytics Prof. Dr. Carsten Felden Dipl. Wirt. Inf. Claudia Koschtial Technische Universität Bergakademie Freiberg
MehrEducase. Release Notes 1.7: Neue Funktionen und Verbesserungen. Base-Net Informatik AG Wassergrabe 14 CH-6210 Sursee
Educase Release Notes 1.7: Neue Funktionen und Verbesserungen Version: 1.0 Datum: 01.12.2015 08:34 Ersteller: Andreas Renggli Status: Abgeschlossen Base-Net Informatik AG Wassergrabe 14 CH-6210 Sursee
MehrComputerlinguistische Textanalyse
Computerlinguistische Textanalyse 10. Sitzung 06.01.2014 Einführung in die Textklassifikation Franz Matthies Lehrstuhl für Computerlinguistik Institut für Germanistische Sprachwissenschaft Friedrich-Schiller
MehrKorrelation (II) Korrelation und Kausalität
Korrelation (II) Korrelation und Kausalität Situation: Seien X, Y zwei metrisch skalierte Merkmale mit Ausprägungen (x 1, x 2,..., x n ) bzw. (y 1, y 2,..., y n ). D.h. für jede i = 1, 2,..., n bezeichnen
MehrSeminar Wirtschaftsinformatik II B.Sc.
Seminar Wirtschaftsinformatik II B.Sc. Prof. Dr. Harald Ritz Sommersemester 2011 Organisatorisches Bewertungsgrundlage Seminar Wirtschaftsinformatik II (B.Sc.) (2 SWS): Vortragsdauer: eine Person, 60 min
MehrAlgorithmische Methoden zur Netzwerkanalyse Vorlesung für den Bereich Master Informatik
Algorithmische Methoden zur Netzwerkanalyse Vorlesung für den Bereich Master Informatik Dozent: Juniorprof. Dr. Henning Meyerhenke PARALLELES RECHNEN INSTITUT FÜR THEORETISCHE INFORMATIK, FAKULTÄT FÜR
MehrGIS 1 Kapitel 5: Bedeutung von Metadaten und Qualität t von Daten
GIS 1 Kapitel 5: und Qualität t von Daten Stephan Mäs Prof. Dr.-Ing. Wolfgang Reinhardt Arbeitsgemeinschaft GIS Universität der Bundeswehr München Wolfgang.Reinhardt@unibw.de www.agis.unibw.de - Definition
MehrFallbeispiel: Intelligente Steuerung von Geschäftsprozessen auf Basis von Big Data
Fallbeispiel: Intelligente Steuerung von Geschäftsprozessen auf Basis von Big Data Institut für Finanz- und Aktuarwissenschaften Lise-Meitner-Str. 14 89081 Ulm Oktober 2015 www.ifa-ulm.de Einführung Mit
MehrSeminar Textmining SS 2015 Grundlagen des Maschinellen Lernens
Seminar Textmining SS 2015 Grundlagen des Maschinellen Lernens Martin Hacker Richard Schaller Künstliche Intelligenz Department Informatik FAU Erlangen-Nürnberg 17.04.2015 Entscheidungsprobleme beim Textmining
MehrGrundlagen Statistik Angewandte Statistik 3. Semester
Angewandte Statistik 3. Semester Zur Person Constantin von Craushaar Consultant / Partner Innstat e.u. (www.innstat.com) info@innstat.com Grundlagen der Statistik Übersicht Semester 1 Einführung ins SPSS
MehrData Warehousing. Sommersemester 2005. Ulf Leser Wissensmanagement in der Bioinformatik
Data Warehousing Sommersemester 2005 Ulf Leser Wissensmanagement in der Bioinformatik ... Der typische Walmart Kaufagent verwendet täglich mächtige Data Mining Werkzeuge, um die Daten der 300 Terabyte
MehrMining High-Speed Data Streams
Mining High-Speed Data Streams Pedro Domingos & Geoff Hulten Departement of Computer Science & Engineering University of Washington Datum : 212006 Seminar: Maschinelles Lernen und symbolische Ansätze Vortragender:
MehrEinführung in Eclipse und Java
Universität Bayreuth Lehrstuhl für Angewandte Informatik IV Datenbanken und Informationssysteme Prof. Dr.-Ing. Jablonski Einführung in Eclipse und Java Dipl.Inf. Manuel Götz Lehrstuhl für Angewandte Informatik
MehrTerminologie zwischen normativer Referenz und deskriptiver Dokumentation. Dr. Birte Lönneker-Rodman, Across Systems GmbH
Terminologie zwischen normativer Referenz und deskriptiver Dokumentation Dr. Birte Lönneker-Rodman, Across Systems GmbH Überblick Normative Referenzterminologie - Beispiele - Unterstützende Funktionen
MehrTraceability-Modell als Erfolgsfaktor für Process Enactment. Paul-Roux Wentzel, SEE 2008
Traceability-Modell als Erfolgsfaktor für Process Enactment Einführung Referent Paul-Roux Wentzel Unternehmen method park Software AG 2008 method park Software AG Slide 2 Leistungsportfolio Training &
MehrInformationsflut bewältigen - Textmining in der Praxis
Informationsflut bewältigen - Textmining in der Praxis Christiane Theusinger Business Unit Data Mining & CRM Solutions SAS Deutschland Ulrich Reincke Manager Business Data Mining Solutions SAS Deutschland
MehrProjekte für reale Herausforderungen Projektarbeit: Einleitung und Gliederung. Projekte für reale Herausforderungen
Steinbeis-Hochschule Berlin Institut für Organisations-Management Handout zu den YouTube-Videos: Projekte für reale Herausforderungen Projektarbeit: Einleitung und Gliederung Prof. Dr. Andreas Aulinger
MehrWas ist Analyse? Hannover, CeBIT 2014 Patrick Keller
Was ist? Hannover, CeBIT 2014 Patrick Keller Business Application Research Center Historie 1994: Beginn der Untersuchung von Business-Intelligence-Software am Lehrstuhl Wirtschaftsinformatik der Universität
MehrText-Mining: Einführung
Text-Mining: Einführung Claes Neuefeind Fabian Steeg 22. April 2010 Organisatorisches Was ist Text-Mining? Definitionen Anwendungsbeispiele Textuelle Daten Aufgaben u. Teilbereiche Literatur Kontakt Sprechstunde:
MehrWas ist Data Mining... in der Fundraising Praxis?
Was ist Data Mining...... in der Fundraising Praxis? Erkennen von unbekannten Mustern in sehr grossen Datenbanken (> 1000 GB) wenige und leistungsfähige Verfahren Automatisierung Erkennen von unbekannten
MehrInhaltsverzeichnis. Fragestellungen und Methoden 11. Vorwort 15. Kapitel 1 Einführung 17. Kapitel 2 Statistische Grundbegriffe 23
Fragestellungen und Methoden 11 Vorwort 15 Kapitel 1 Einführung 17 1.1 KonzeptiondesBuchs... 18 1.2 AufbaudesBuchs... 19 1.3 Programmversionen von PASW bzw. SPSS..... 20 1.4 WiekanndiesesBuchverwendetwerden?...
Mehr9 Resümee. Resümee 216
Resümee 216 9 Resümee In der vorliegenden Arbeit werden verschiedene Methoden der Datenreduktion auf ihre Leistungsfähigkeit im sozialwissenschaftlichstatistischen Umfeld anhand eines konkreten Anwendungsfalls
MehrVirtual Roundtable: Business Intelligence - Trends
Virtueller Roundtable Aktuelle Trends im Business Intelligence in Kooperation mit BARC und dem Institut für Business Intelligence (IBI) Teilnehmer: Prof. Dr. Rainer Bischoff Organisation: Fachbereich Wirtschaftsinformatik,
MehrIhr Logo. Willkommen zur Schulung. Kundenorientierung. 2014 WEKA MEDIA GmbH & Co. KG. Folie 0/01
Willkommen zur Schulung Kundenorientierung 0/01 Einführung Was ist Kundenorientierung? Kundenorientierung ist die umfassende, kontinuierliche Ermittlung und Analyse der Kundenerwartungen sowie deren interne
MehrLook Inside: desite. modellorientiertes Arbeiten im Bauwesen. B.I.M.
Building Information Modeling Look Inside: desite modellorientiertes Arbeiten im Bauwesen. B.I.M. desite MD unterstützt Sie bei der täg lichen Arbeit mit Gebäudemodellen und ermöglicht den Zugang zu den
MehrSurvival of the Fittest Wie statistische Modelle an Daten angepasst werden
Tag der Mathematik 2009 Survival of the Fittest Wie statistische Modelle an Daten angepasst werden Thomas Kneib Fakultät für Mathematik und Naturwissenschaften Carl von Ossietzky Universität Oldenburg
MehrFortgeschrittene Statistik Logistische Regression
Fortgeschrittene Statistik Logistische Regression O D D S, O D D S - R A T I O, L O G I T T R A N S F O R M A T I O N, I N T E R P R E T A T I O N V O N K O E F F I Z I E N T E N, L O G I S T I S C H E
MehrSuchmaschinenoptimierung (SEO) für Ihren Shop. Mario Rieß Chief Technology Officer mriess@epages.com
Suchmaschinenoptimierung (SEO) für Ihren Shop Mario Rieß Chief Technology Officer mriess@epages.com Agenda 1. Allgemeine Vorbemerkungen 2. Technischer Teil was erledigt die Software 3. Inhaltlicher Teil
MehrEntscheidungsbaumverfahren
Entscheidungsbaumverfahren Allgemeine Beschreibung Der Entscheidungsbaum ist die Darstellung einer Entscheidungsregel, anhand derer Objekte in Klassen eingeteilt werden. Die Klassifizierung erfolgt durch
MehrOrganisationen neu sehen
Organisatione n neu sehen Organisationen neu sehen ~ Soziale Netzwerkanalyse für Unternehmen ~ The best way to understanding how work really gets done in organizations Rob Cross, IBM Research PZN Kooperationsberatung
MehrW.WIINM32.11 (Datawarehousing) W.WIMAT03.13 (Statistik)
Modulbeschrieb Business Intelligence and Analytics 16.10.2013 Seite 1/5 Modulcode Leitidee Art der Ausbildung Studiengang Modultyp W.WIINM42.13 Information ist eine derart wichtige Komponente bei der Entscheidungsfindung,
MehrKurzanweisung für Google Analytics
Kurzanweisung für Google Analytics 1. Neues Profil für eine zu trackende Webseite erstellen Nach dem Anmelden klicken Sie rechts oben auf den Button Verwaltung : Daraufhin erscheint die Kontoliste. Klicken
MehrSOL-IT wawicube. Berechnen. Lenken. Überblicken.
. Berechnen. Lenken. Überblicken. Mit dem wird Warenwirtschaft nicht zum undurchschaubaren Zahlenverwirrspiel. Ausgehend von Offerten über Aufträge bis hin zu Rechnungen behalten Sie den Überblick Alles
MehrTextmining Klassifikation von Texten Teil 1: Naive Bayes
Textmining Klassifikation von Texten Teil 1: Naive Bayes Dept. Informatik 8 (Künstliche Intelligenz) Friedrich-Alexander-Universität Erlangen-Nürnberg (Informatik 8) Klassifikation von Texten 1: Naive
MehrOhne Fehler geht es nicht Doch wie viele Fehler sind erlaubt?
Ohne Fehler geht es nicht Doch wie viele Fehler sind erlaubt? Behandelte Fragestellungen Was besagt eine Fehlerquote? Welche Bezugsgröße ist geeignet? Welche Fehlerquote ist gerade noch zulässig? Wie stellt
MehrMathematisch-algorithmische Grundlagen für Big Data
Mathematisch-algorithmische Grundlagen für Big Data Numerische Algorithmen für Datenanalyse und Optimierung Prof. Dr. Peter Becker Fachbereich Informatik Hochschule Bonn-Rhein-Sieg Sommersemester 2016
MehrMasterstudium Informatik CURRICULUM 2006 IN DER VERSION 2013 MICHAEL KRISPER, BASISGRUPPE INFORMATIK & SOFTWAREENTWICKLUNG
Masterstudium Informatik CURRICULUM 2006 IN DER VERSION 2013 MICHAEL KRISPER, BASISGRUPPE INFORMATIK & SOFTWAREENTWICKLUNG Infos für den Anfang Curriculum ist im Mitteilungsblatt veröffentlicht: http://www.mibla.tugraz.at/12_13/stk_16e/16e.html
MehrDie Naturwissenschaftlich-Technische Fakultät 6 der Universität des Saarlandes Fachrichtung Informatik
Die Naturwissenschaftlich-Technische Fakultät 6 der Universität des Saarlandes Fachrichtung Informatik Modulkatalog: Kernbereich des Schwerpunktfachs Informatik Fassung vom 17. September 2015 auf Grundlage
MehrWorkflow, Business Process Management, 4.Teil
Workflow, Business Process Management, 4.Teil 24. Januar 2004 Der vorliegende Text darf für Zwecke der Vorlesung Workflow, Business Process Management des Autors vervielfältigt werden. Eine weitere Nutzung
MehrBedienungsanleitung. Matthias Haasler. Version 0.4. für die Arbeit mit der Gemeinde-Homepage der Paulus-Kirchengemeinde Tempelhof
Bedienungsanleitung für die Arbeit mit der Gemeinde-Homepage der Paulus-Kirchengemeinde Tempelhof Matthias Haasler Version 0.4 Webadministrator, email: webadmin@rundkirche.de Inhaltsverzeichnis 1 Einführung
MehrAlgorithmische Methoden zur Netzwerkanalyse Vorlesung für den Bereich Master Informatik
Algorithmische Methoden zur Netzwerkanalyse Vorlesung für den Bereich Master Informatik Dozent: Prof. Dr. Henning Meyerhenke PARALLELES RECHNEN INSTITUT FÜR THEORETISCHE INFORMATIK, FAKULTÄT FÜR INFORMATIK
MehrVerborgene Schätze heben
Verborgene Schätze heben Data Mining mit dem Microsoft SQL Server Martin Oesterer Leiter Vertrieb HMS Analytical Software GmbH Data Mining. Was ist eigentlich wichtig? Data Mining ist: die Extraktion von
MehrEinführung in die Fuzzy Logic
Einführung in die Fuzzy Logic Entwickelt von L. Zadeh in den 60er Jahren Benutzt unscharfe (fuzzy) Begriffe und linguistische Variablen Im Gegensatz zur Booleschen Logik {0,} wird das ganze Intervall [0,]
MehrGI-Technologien zur Umsetzung der EU-Wasserrahmenrichtlinie (WRRL): Wissensbasen. Teil 1: Einführung: Wissensbasis und Ontologie.
GI-Technologien zur Umsetzung der EU-Wasserrahmenrichtlinie (WRRL): Wissensbasen Teil 1: Einführung: Wissensbasis und Ontologie Was ist eine Wissensbasis? Unterschied zur Datenbank: Datenbank: strukturiert
MehrWEKA A Machine Learning Interface for Data Mining
WEKA A Machine Learning Interface for Data Mining Frank Eibe, Mark Hall, Geoffrey Holmes, Richard Kirkby, Bernhard Pfahringer, Ian H. Witten Reinhard Klaus Losse Künstliche Intelligenz II WS 2009/2010
MehrVerpasst der Mittelstand den Zug?
Industrie 4.0: Verpasst der Mittelstand den Zug? SCHÜTTGUT Dortmund 2015 5.11.2015 Ergebnisse einer aktuellen Studie der Technischen Hochschule Mittelhessen 1 Industrie 4.0 im Mittelstand Ergebnisse einer
MehrBusiness Intelligence Praktikum 1
Hochschule Darmstadt Business Intelligence WS 2013-14 Fachbereich Informatik Praktikumsversuch 1 Prof. Dr. C. Wentzel Dipl. Inf. Dipl. Math. Y. Orkunoglu Datum: 14.10.2013 Business Intelligence Praktikum
MehrThesaurusvisualisierung mit ICE-Map und SEMTINEL
Thesaurusvisualisierung mit ICE-Map und SEMTINEL Universitätsbibliothek Universität Mannheim PETRUS-Workshop Deutsche Nationalbibliothek 21. März 2011 Frankfurt Forschungsschwerpunkte Effizienzsteigerung
MehrKnowledge Discovery In Databases. Data Mining - Der moderne Goldrausch?
Oberseminar Data Mining 07. April 2010 Methodik des Data Mining Knowledge Discovery In Databases oder auch Data Mining - Der moderne Goldrausch? Data Mining...? Hochleistungsrechnen Geoinformationssysteme
MehrUser Experience vs. Retrievaltests Wie lässt sich die Relevanz von Suchergebnissen bewerten?
User Experience vs. Retrievaltests Wie lässt sich die Relevanz von Suchergebnissen bewerten? Prof. Dr. Dirk Lewandowski Hochschule für Angewandte Wissenschaften Hamburg dirk.lewandowski@haw-hamburg.de
MehrSemantic Web Technologies I! Lehrveranstaltung im WS10/11! Dr. Andreas Harth! Dr. Sebastian Rudolph!
Semantic Web Technologies I! Lehrveranstaltung im WS10/11! Dr. Andreas Harth! Dr. Sebastian Rudolph! www.semantic-web-grundlagen.de Ontology Engineering! Dr. Sebastian Rudolph! Semantic Web Architecture
MehrTutorial: Homogenitätstest
Tutorial: Homogenitätstest Eine Bank möchte die Kreditwürdigkeit potenzieller Kreditnehmer abschätzen. Einerseits lebt die Bank ja von der Vergabe von Krediten, andererseits verursachen Problemkredite
MehrBig & Smart Data. bernard.bekavac@htwchur.ch
Big & Smart Data Prof. Dr. Bernard Bekavac Schweizerisches Institut für Informationswissenschaft SII Studienleiter Bachelor of Science in Information Science bernard.bekavac@htwchur.ch Quiz An welchem
MehrIdeation-Day Fit für Innovation
Your Partner in Change. Your Partner in Innovation. Ideation-Day Fit für Innovation Fotoprotokoll 12.07.2013 www.integratedconsulting.at 1 Einstieg www.integratedconsulting.at 2 Erwartungen und mögliche
MehrDer virtuelle Arbeitsmarkt in Deutschland Q2-2015
Der virtuelle Arbeitsmarkt in Deutschland Q2-2015 Diese Studie basiert auf den Zahlen aus Jobfeed, der Big Data Jobplattform von Textkernel. Einleitung Dieser Bericht basiert auf einer Analyse mit mehr
MehrStatistik II. Statistik II, SS 2001, Seite 1 von 5
Statistik II, SS 2001, Seite 1 von 5 Statistik II Hinweise zur Bearbeitung Hilfsmittel: - Taschenrechner (ohne Datenbank oder die Möglichkeit diesen zu programmieren) - Formelsammlung im Umfang von einer
MehrBewertung von Messdaten. am Beispiel der Durability Database DDB
Bewertung von Messdaten am Beispiel der Durability Database DDB Ansprechpartner Durability Database Christian Fuchs, Dipl. Ing. (FH) Durability Engineer Continental Automotive GmbH Siemensstrasse 12 93055
MehrEINFÜHRUNG 06.06.2013 IOZ AG 1
BPMN BPMN2.0 EINFÜHRUNG 06.06.2013 IOZ AG 1 EINFÜHRUNG GESCHÄFTSPROZESSMODELLIERUNG Was ist Geschäftsprozessmodellierung? Darstellung von geschäftlichen Abläufen und deren Interaktion Was wird inhaltlich
MehrLebenserwartung nach Sterbetafel 2003/2005
vollendetes Alter männlich weiblich 0 76,21 76,21 81,78 81,78 1 75,56 76,56 81,08 82,08 2 74,58 76,58 80,11 82,11 3 73,60 76,60 79,12 82,12 4 72,61 76,61 78,13 82,13 5 71,62 76,62 77,14 82,14 6 70,63 76,63
MehrMicrosoft Office Visio 2007 Infotag SemTalk Thema: Prozessmodellierung
Microsoft Office Visio 2007 Infotag SemTalk Thema: Prozessmodellierung Dr.-Ing. Frauke Weichhardt, Semtation GmbH Christian Fillies, Semtation GmbH Claus Quast, Microsoft Deutschland GmbH Prozessmodellierung
MehrKommunikation, Information und mobile verteilte Systeme (KIS)
Qualifikationsziele Heutzutage sind nahezu alle wichtigen Informationssysteme verteilt, d.h., fast immer erbringt nicht nur ein Computer alleine eine bestimmte Dienstleistung, sondern es sind mehrere Rechner,
MehrMessanlagen für die kontinuierliche und dynamische Messung von Mengen von Flüssigkeiten außer Wasser
243. PTB-Seminar Anwendung der MID bei Herstellern Messanlagen für die kontinuierliche und dynamische Messung von Mengen von Flüssigkeiten außer Wasser Michael Rinker Fachbereich Flüssigkeiten Arbeitsgruppe
Mehr