FRAUNHOFER-INSTITUT FÜR INTELLIGENTE ANALYSE- UND INFORMATIONSSYSTEME DATA SCIENTIST SCHULUNGEN UND COACHING IN UNTERNEHMEN KATALOG

Größe: px
Ab Seite anzeigen:

Download "FRAUNHOFER-INSTITUT FÜR INTELLIGENTE ANALYSE- UND INFORMATIONSSYSTEME DATA SCIENTIST SCHULUNGEN UND COACHING IN UNTERNEHMEN KATALOG"

Transkript

1 FRAUNHOFER-INSTITUT FÜR INTELLIGENTE ANALYSE- UND INFORMATIONSSYSTEME DATA SCIENTIST SCHULUNGEN UND COACHING IN UNTERNEHMEN KATALOG

2 Unser Data-Scientist-Schulungsprogramm macht Mitarbeiterinnen und Mitarbeiter ihres Unternehmens fit für die Arbeit mit Big-Data-Anwendungen. Dabei passen wir die Schulungen individuell an die Bedürfnisse ihres Unternehmens an und erarbeiten gemeinsam mit ihnen»ihr«individuelles Schulungs- oder Coaching-Programm. Die möglichen, frei kombinierbaren en sind in diesem Katalog beschrieben. (E) Big Data und Data Science Überblick und Potenziale... 3 (A) Big Data Architecture... 4 (BA) Basic Analytics... 6 (BDA) Big Data Analytics... 7 (SMA) Social Media Analytics... 8 (MMA) Multimedia Analytics (LED) Linked Enterprise Data Integration (TA) Text Analytics (VA) Visual Analytics Beispiel für eine Inhouse-Schulung von 5 Tagen Schulungsleiterin: Dr. Angelika Voss Schloss Birlinghoven Sankt Augustin Telefon Stand: April 2014 Data-Scientist-Schulungen und Coaching 2

3 (E) Big Data und Data Science Überblick und Potenziale Überblick und Potenziale Ziel: In diesem Executive Seminar erhalten Sie einen Überblick über Big-Data- Technologien, Architekturen, Analytik und Anwendungsbeispiele und damit über die wichtigsten Kompetenzen von Data-Science-Teams. Optional entwickeln wir mit Ihnen eine individuelle Roadmap für Ihr Unternehmen, um zukünftige Anwendungs- und Handlungsfelder im Kontext Big Data zu erarbeiten und zu strukturieren. Denn»Big Data«ist ein Management-Thema. Wer seine Daten richtig und schnell nutzen kann, gewinnt an Effizienz durch datengestützte Entscheidungen, vorausschauendes Handeln und beschleunigte Unternehmensprozesse oder überzeugt Kunden durch smarte Produkte, individualisierte Angebote oder Dienstleistungen. Um das Potenzial von Big Data zu erschließen, ist Wissen aus Analytik, IT und dem jeweiligen Fachbereich gefragt. Bislang gibt es nur wenige Fachkräfte, die diese Kompetenzen kombinieren. Solche»Data Scientists«werden jedoch dringend gesucht. In den USA gehören sie schon zu den meistgesuchten technisch-wissenschaftlichen IT- Fachleuten und McKinsey sagt eine Lücke von über 50 Prozent für die nächsten Jahre voraus. Data Scientists machen für Ihr Unternehmen mehr Daten schneller nutzbar. Sie analysieren sie mit wissenschaftlichen Verfahren und entwickeln prädiktive Modelle. Damit beobachten sie Datenströme und extrahieren auch aus unstrukturierten Daten wie Text, Bilder, Video, Audio geschäftsrelevante Informationen und Signale. Automatisierte Klassifikationen und Prognosen ermöglichen individualisierte Angebote an die Kunden in Sekundenbruchteilen, schnellere Reaktionen als der Wettbewerb, effizientere Geschäfts- und Produktionsprozesse, vorausschauendes Handeln und datengestützte Planungen. Zielgruppe: Projektleiter und Führungskräfte Voraussetzung: keine en: Deutsch Unterlagen: Deutsch Basis Dauer Mit Übungen E0 1,5 Einführung: Big Data, Data Science, Anwendungen, Potenziale E1 E0 1,5 Big Data Architektur E2 E0 1,5 Basic Analytics E3 E0 1,5 Text Analytics E4 E0 1,5 Visual Analytics in Raum und Zeit E5 E0 2x1,5 Entwicklung einer individuellen Roadmap Stand: April 2014 Data-Scientist-Schulungen und Coaching 3

4 (A) Big Data Architecture Ziel: Die Teilnehmer können anschließend die Einsatzmöglichkeiten von Big-Data- Technologien für verschiedene Einsatzszenarien fundiert bewerten und mit eigenen Experimenten beginnen. Die unter dem Begriff»Big Data«entstehenden Konzepte und Techniken eröffnen neue Fragestellungen und Anwendungsbereiche bei der Auswertung von Daten. Allerdings muss zur Auswertung eines Big-Data-Pools eine geeignete Infrastruktur vorhanden sein. Hier gibt es großen Handlungsbedarf, bestehende Infrastrukturen auf- oder umzurüsten oder sogar vollkommen neu aufzubauen. Der Markt ist unübersichtlich, die Anforderungen sind zu Beginn oft unklar. In kurzen Abständen erscheinen neue Produkte zur technischen Unterstützung von Big-Data-Anwendungen, andere geraten wieder in Vergessenheit. Der Entwurf von Architekturen für Big-Data-Anwendungen muss eine Vielzahl fachlicher, technischer und nicht funktionaler Anforderungen berücksichtigen. Typischerweise können die Anforderungen erst durch die geeignete Kombination unterschiedlicher technischer Komponenten erfüllt werden. Im Kontext von Big Data realisieren das Map Reduce Konzept sowie die Open-source- Projekt-Familie um Hadoop einen wichtigen, unverzichtbaren Aspekt bei der parallelen Aufbereitung umfangreicher Datenflüsse. Für eine fachlich vollständige Anwendung sind sie aber nicht unbedingt ausreichend und für manche Aspekte gar nicht geeignet. Ein Realtime-Einsatz erfordert den wahlfreien Lese/Schreib-Zugriff in großen Datenbeständen und begründet beispielsweise den Einsatz von NoSQL-Datenbanken. Das Schulungsmodul vermittelt einen qualifizierten und konzentrierten Überblick über die technischen Big-Data-Komponenten von Architekturentwürfen. Auf der Basis von Berechnungskonzepten wie Map Reduce, theoretischen Einsichten wie dem CAP- Theorem, sowie nicht funktionalen Anforderungen wie Echtzeitfähigkeit werden Big- Data-Produkte vorgestellt und klassifiziert. Die Konfiguration einer Beispielanwendung wird im fachlichen Zusammenhang begründet. Stand: April 2014 Data-Scientist-Schulungen und Coaching 4

5 Zielgruppe: Software-Architekten und Entwickler, die Big-Data-Anwendungen entwerfen, konfigurieren und den Betrieb steuern. Voraussetzung: Grundkenntnisse in Datenbank- und Softwaretechnik en: Deutsch oder Englisch Unterlagen: Englisch Basis Dauer A1 2 * 1,5 Einführung Big Data - Grundlagen, Begriffe Komponenten für Big-Data-Anwendungen CAP Theorem, eventual consistency Batch- und Echtzeitprozesse Lambda Architektur A2 A1 2 * 1,5 Batch-Verarbeitung Map Reduce Workflow Organisation No-SQL Key-Value-Stores A3 1,5 Übungen zu Batch-Verarbeitung A4 A1 2 * 1,5 Echtzeitdatenströme Message Passing Stream Processing No-SQL-Datenbank Cassandra A5 1,5 Übungen zu Echtzeitdatenströmen Stand: April 2014 Data-Scientist-Schulungen und Coaching 5

6 (BA) Basic Analytics Ziel: Nach der Schulung sind Sie in der Lage, erste eigene Analysefragestellungen zu bearbeiten. Dieses Modul vermittelt Fachleuten mit Grundkenntnissen im Bereich quantitativer Analytik und erster Programmiererfahrung wesentliche Grundlagen der modernen Datenanalyse. Dazu werden in einem ersten Teil Techniken aus dem Bereich Clustering, Regression und Klassifikation anhand einfacher und praktisch relevanter Fragestellungen erarbeitet und angewendet. Der zweite Teil beschäftigt sich mit der praktischen Umsetzung des Gelernten. Zum Einsatz kommen Open Source Werkzeuge, insbesondere die statistische Programmiersprache»R«sowie das Desktop Data-Mining-Tool»RapidMiner«. Die Techniken werden in einer Fallstudie exemplarisch an einer realen Problemstellung (Empfehlungssystem) demonstriert. Zielgruppe: Analysten, die ihre Fähigkeiten zur Auswertung von Datenbestände ausweiten wollen Softwareentwickler/-architekten, die Systeme mit analytischen Fragestellungen (mit-) entwickeln Interessierte aus der Forschung, die eine Orientierung im Bereich Data Science suchen Voraussetzungen: Grundkenntnisse in Statistik und Programmierung en: Deutsch oder Englisch Unterlagen: Englisch Basis Dauer BA1 1,5 Einführung: Überblick und Einordnung Projekt Management für Data Analytics BA2 3 * 1,5 Grundlegende Konzepte der Datenanalyse demonstriert mit Rapid Miner Datentypen Datenaufbereitung Explorative Datenanalyse Einfache statistische Modelle Validierung von Modellen BA3 BA2 2 * 1,5 Modellierungstechniken demonstriert mit Rapid Miner Clusteranalyse Decision Trees Support Vector Machines K-Nearest Neighbour BA4 1,5 Einführung in R BA5 BA4 1,5 R Übungen zu Modellierungstechniken Stand: April 2014 Data-Scientist-Schulungen und Coaching 6

7 (BDA) Big Data Analytics Ziel: Nach der Schulung verstehen Sie, wie Analysealgorithmen für eine skalierbare Big- Data-Architektur implementiert werden können und haben Beispiele für Batch- und Streaming-Verarbeitung kennen gelernt. Dieses Modul führt die Module "Big Data Architecture" und Basic Analytics" fort. Fachleute mit Programmiererfahrung und Grundkenntnissen in quantitativer Analytik lernen Methoden und Werkzeuge zur Analyse von Big Data kennen. Nach einer Einführung in Sampling Ansätze und ihre Übertragung auf große Datenmengen wird zunächst gezeigt, wie man mit konventionellen SQL-basierten Methoden in Big-Data Systemumgebungen arbeiten kann. Anschließend wird die Modellentwicklung und -anwendung in einer Big-Data Systemarchitektur mit Batch- und Stream Verarbeitung gezeigt. Es wird an einer beispielhaften Analyseanwendung (Online-Empfehlungssystem) gezeigt, wie mit Cascading und Hadoop ein Modell gebaut werden kann, das als Grundlage für Empfehlungen dient. Im letzten Teil geht es darum, das Beispielsystem mit Storm um die Analyse von Online-Datenströmen zu erweitern. Zielgruppe: Analysten, die ihre Fähigkeiten zur Auswertung von Datenbestände ausweiten wollen Softwareentwickler/-architekten, die Systeme mit analytischen Fragestellungen (mit-) entwickeln Voraussetzungen: Grundkenntnisse in Statistik und Programmierung. Die Teilnahme an den Modulen "Big Data Architecture" und "Data Scientist: Basic Analytics" wird empfohlen. en: Deutsch oder Englisch Unterlagen: Englisch Basis Dauer BDA1 1,5 Einführung Sampling als Ansatz zur Analyse großer Datenmengen BDA2 BDA1 1,5 Analyse großer Datenmengen in existierenden IT-Umgebungen Ansätze in existierenden IT-Landschaften Transport der Daten zwischen existierenden und Big-Data- Umgebungen Analysen mit SQL Integration verschiedener Quellen mit Lingual BDA3 BDA4 BDA2 (A2) BDA3 (A4) 1,5 Modellentwicklung und -anwendung in Big-Data-Umgebungen Batch-Workflows und Jobausführung mit Cascading Modellanwendung am Beispiel eines Online- Empfehlungssystems 1,5 Analyse von Datenströmen Datenstromverarbeitung mit Storm Ranking nach Popularität als Anwendungsbeispiel Stand: April 2014 Data-Scientist-Schulungen und Coaching 7

8 (SMA) Social Media Analytics Ziel: Sie verstehen die wichtigsten Verfahren der Social Media Analytics aus Anwendersicht, lernen exemplarische Workflows zur zielgerichteten Analyse von Social Media Texten kennen und erfahren Best Practices zur Analyse Sozialer Netzwerke. Social Media Analytics erlaubt es Unternehmen zu verstehen, welche Auswirkungen Soziale Netze auf ihre Produkte, Marken, Märkte, Mitarbeiter und Partner haben. Dabei werden Millionen von Beiträgen und Bewertungen in Social Media analysiert und in Hinblick auf die Unternehmensziele aggregiert und dargestellt. In diesem Schulungsmodul wird gezeigt, wie Texte aus Sozialen Netzen wie Twitter, Facebook und Nutzerforen untersucht werden können. Besonders wichtig ist es hierbei, die ausgedrückten Meinungen oder Emotionen von Internetnutzern in Hinblick auf bestimmte Themen, Produkte, Personen oder Firmen zu erkennen. Diese Erkenntnisse können in vielfältige Anwendungen einfließen, z.b. in die Begleitung politischer Kampagnen, in die Entwicklung von Produktverbesserungen, in Werbestrategien oder in die Reaktion auf Produktprobleme. Im Kurs werden Social Media e mit Hilfe aktueller Analyseverfahren exemplarisch untersucht und die Ergebnisse in Hinblick auf die Anwendung aufbereitet und visualisiert. Es werden zum Teil Open Source Werkzeuge (Gensim, CRFsuite, scikit-learn, Gephi) aber auch proprietäre Analysemethoden eingesetzt. Möchte man zusätzlich Techniken zur Analyse von Multimedia-e in Sozialen Netzen kennenlernen, so sollte man an dem Kurs "Data Scientists Multimedia Analytics" teilnehmen. Die Slots aus dem Modul Text Analytics überschneiden sich teilweise mit denen von Social Media Analytics und führen sie fort. Bei Interesse an beiden Modulen bitten wir um Rücksprache, um Ihre Interessen bestmöglich zu berücksichtigen. Zielgruppe: Sales- und Marketing-Manager, Product-Manager Analysten, Entwickler Voraussetzungen: Mathematische Kenntnisse auf Abiturniveau. Elementare Kenntnisse in Python sind von Vorteil, aber nicht Bedingung. en: Deutsch oder Englisch Unterlagen: Englisch Basis Dauer SMA1 1,5 Einführung Anwendungsszenarien: Mögliche Ergebnisse von Social Media Analytics Warum ist Social Media Analytics schwierig? Social Media Analytics: Definition und Teilaufgaben Überblick und Stand der Kunst Stand: April 2014 Data-Scientist-Schulungen und Coaching 8

9 SMA2 SMA1 1,5 Crawling und Monitoring Einfache Online-Analysen Crawling Monitoring SMA3 SMA1 1,5 Repositories und Vorverarbeitung Speicherung und Dokumentstrukturen Morphologische Vorverarbeitung Syntaktische Annotation: Tokenisierung SMA4 SMA3 1,5 Analyse von kompletten Social Media Beiträgen Klassifikation: Problemstellung Relevante Klassifikationsmethoden Praxisorientierte Bewertung der Eigenschaften und Performanz Anwendung zur Social Media Analyse und Opinion Mining SMA5 SMA3 1,5 Semantische Ähnlichkeit von Begriffen, z.b. Bewertungen Gruppierung von Meinungs- und Emotionsausdrücken Darstellung der Gruppierungsverfahren Graphische Exploration von Themen in großen Textsammlungen Praxisorientierte Bewertung der Eigenschaften und Performanz Anwendung zur Social Media Analyse und Sentiment Analyse SMA6 SMA4 1,5 Erkennung von Namen, Produkten und Firmen, usw. Einführung: maschinelle Annotation von relevanten Phrasen im Satz Darstellung der Erkennungsverfahren Praxisorientierte Bewertung der Eigenschaften und Performanz Anwendung zur Social Media Analyse SMA7 SMA5, SMA6 1,5 Beispiele für den praktischen Einsatz: Marketing im Automotive Bereich Professionelle Autotests o Wie verschaffe ich mir einen schnellen Überblick? o Wie identifiziere ich die wichtigen Textstellen? SMA8 SMA5, SMA6 1,5 Beispiele für den praktischen Einsatz: Forenanalyse Analyse von Emotionen im Automotive Forum Motortalk o Welche Emotionen sind relevant? o Welche Einsichten ergeben sich aus der Emotionsanalyse? Diskussion von Best Practices Stand: April 2014 Data-Scientist-Schulungen und Coaching 9

10 (MMA) Multimedia Analytics Ziel: Sie bekommen einen Technologie-Überblick zu Multimedia-Analyse Verfahren, die sich z.b. für Marktforschung und Medienbeobachtung einsetzen lassen. Für diese Technologien lernen sie einzuschätzen unter welchen Bedingungen und für welche Anwendungen sie nützlich sind und wie sich eine Umsetzung realisieren lässt. In diesem Schulungsmodul werden ausgewählte multimediale Verfahren (z.b. für Videos) gegenübergestellt. Dazu erfolgt jeweils ein theoretischer Einblick in die Verfahrensidee sowie die Vorstellung eines dazu passenden open-source Werkzeugs. Mit dem Schwerpunkt der Marktforschung wird dieses Werkzeug dann in der Praxis auf Vorund Nachteile untersucht und in einer begleitenden Übung von den Teilnehmern angewendet. Möchte man zusätzlich Techniken zur Analyse von Textbeiträgen in Sozialen Netzen kennenlernen, so sollte man an dem Modul "Social Media Analytics" teilnehmen. Zielgruppe: Analysten, Projektleiter, Entwickler Voraussetzungen: Um in diesem Modul einen guten Überblick über Theorie und Praxis zu erlangen, sind keine Vorkenntnisse notwendig. Je nach Schwerpunkt des praktischen Teils ist Vorerfahrung im Umgang mit (häufig konsolenbasierter) Software von Vorteil. Für die vertiefenden theoretischen Abschnitte ist mathematisches Wissen, insbesondere in der Stochastik, ebenfalls von Vorteil. en: Deutsch oder Englisch Unterlagen: Englisch Basis Dauer MMA1 1,5 Automatische Spracherkennung Einführung, Technologie-Überblick Audio-Merkmale Phoneme und Sprachmodelle Fehlerquellen und Best Practice Einsatzszenarien Praktischer Einsatz MMA2 1,5 Audio-Fingerprinting Einführung, Technologie-Überblick Audio-Merkmale, Fingerprints, Coding Robustheit und Invarianzeigenschaften Indexierung, Hashing und Matching Einsatzszenarien Praktischer Einsatz MMA3 1,5 Optische Zeichenerkennung in Videos Einführung, Technologie-Überblick Textlokalisation und Texterkennung Mischverteilungen, Markov-Modelle Einsatzszenarien Stand: April 2014 Data-Scientist-Schulungen und Coaching 10

11 Praktischer Einsatz MMA4 1,5 Logo-Erkennung Einführung, Technologie-Überblick Extraktion und Repräsentation durch Bildmerkmale Robustheit und Invarianzeigenschaften Indexierung, Hashing und Matching Einsatzszenarien Praktischer Einsatz Stand: April 2014 Data-Scientist-Schulungen und Coaching 11

12 (LED) Linked Enterprise Data Integration Ziel: Diese Schulung vermittelt Ihnen ein grundlegendes Verständnis von Linked Data Standards, Technologien und versetzt sie in die Lage, potentialträchtige Einsatzmöglichkeiten für Linked Data im Unternehmen zu identifizieren. Semantische Technologien und Linked Data haben sich mit Initiativen wie Schema.org, Google s Knowledge Graph oder DBpedia bereits fest im Web etabliert. Auch in den Intranets großer Organisationen und Unternehmen gibt es ähnlich wie im Web eine Vielzahl verschiedener, heterogener Informationssysteme, Portale und Datenbanken. Ähnlich wie im Web können Linked Data und semantische Technologien zur Vernetzung dieser verteilten heterogenen Datenbestände genutzt werden, um bessere Suchfunktionen anzubieten, Daten auszutauschen oder dynamisch und interaktiv zu integrieren. Linked Data ist dabei ein auf W3C Web Standards (HTTP, RDF, SPARQL) basierender, pragmatischer Datenintegrationsansatz, der sich gut mit Service-orientierten Architekturen und anderen Datenintegrationsparadigmen kombinieren lässt. Zielgruppe: Analysten, die ihre Fähigkeiten zur Integration von verteilten und heterogenen Datenbestände ausweiten wollen Softwareentwickler/-architekten, die datengetriebene, verteilte Systeme (mit-) entwickeln Interessierte aus der Forschung, die eine Orientierung im Bereich Data Science suchen Voraussetzungen: Grundkenntnisse in Web-Technologien und evtl. Datenbanken. en: Deutsch oder Englisch Unterlagen: Englisch Basis Dauer LED1 1,5 Linked Data Grundlagen Linked Data Paradigma RDF Datenmodell RDF Serialisierungen: N3/Turtle, RDF/XML, RDFa, JSON LD Einfache Vokabulare LED2 LED2 1,5 Semantic Web Wissensbasen und SPARQL Anfragesprache OWL Ontologien SPARQL Anfragesprache für RDF LED3 1,5 Mapping und Verlinkung von Daten Arten von Mappings und Verknüpfungen Mapping relationaler Daten auf RDF mit dem W3C R2RML Instanzmatching mit Link Discovery Werkzeugen LED4 1,5 Anwendungsfälle Semantische Suche Enterprise Data Integration Linked (Open) Data und DBpedia Semantische Suchmaschinenoptimierung mit Google Rich- Snippets, RDFa und schema.org Stand: April 2014 Data-Scientist-Schulungen und Coaching 12

13 (TA) Text Analytics Ziel: Im Rahmen dieses Kurses verstehen Sie die wichtigsten Text-Analytics- Algorithmen auf Anwenderniveau, lernen exemplarische Workflows zur zielgerichteten Analyse von Textkollektionen kennen und erfahren Best Practices zum Text-Mining. Unter Anwendung von Open-Source-Werkzeugen (NLTK, Gensim, CRFsuite, scikitlearn, Gephi, R) werden Textquellen beispielhaft analysiert. Der erste Block von Modulen (TA1-TA5) bietet eine Einführung in wichtige Text- Analytics-Techniken. Unter Verwendung von Open-Source-Python-Modulen werden realistische Analysen durchgeführt und die Ergebnisse interpretiert und bewertet. Der zweite Block von Modulen (TA6-TA8) beschäftigt sich mit Sequenzmodellen. Dieses Modul eignet sich als Vertiefung zu Social Media Analytics. Die Slots aus dem Modul Text Analytics überschneiden sich teilweise mit denen von Social Media Analytics und führen sie fort. Bei Interesse an beiden Modulen bitten wir um Rücksprache, um Ihre Interessen bestmöglich zu berücksichtigen. Zielgruppe: Analysten, Projektleiter, Entwickler Voraussetzung: Mathematische Kenntnisse auf Abiturniveau, elementare Kenntnisse in Python, elementare Kenntnisse in R sind von Vorteil, aber nicht Bedingung en: Deutsch oder Englisch Unterlagen: Deutsch Basis Dauer TA1 1,5 Einführung Anwendungs-Szenarien Warum ist Text Analytics schwierig Text Mining: Definition und Teilaufgaben Überblick und State-of-the Art TA2 TA1 1,5 Vorverarbeitung unstrukturierter Textdaten Vorverarbeitung: Tokenisierung, Sentence Splitting Normalisierung, Stemming, Lemmatisierung Übungen Einzelne Vorverarbeitungsschritte in Python und NLTK TA3 TA2 1,5 Klassifikation Problemstellung Methoden: Naïve Bayes, logistische Regression-Messung der Performanz: Precision, Recall, F-Wert Generalisierung, Überanpassung Modellbewertung, Kreuzvalidierung Übungen Anwendung mehrer Klassifikatoren in Python Beurteilung der Klassifikationsgüte Stand: April 2014 Data-Scientist-Schulungen und Coaching 13

14 TA4 TA3 1,5 Klassifikation Supportvektormaschine (SVM) Generalisierung, Überanpassung Einführung und Eigenschaften der SVM-Selektion von Merkmalen Praktische Hinweise zur Textklassifikation Übungen Anwendung der SVM in Python TA5 TA2 1,5 Text-Cluster und Topic Themen Clustern semantisch ähnlicher Worte zu Topics LDA: Training, Interpretation und Anwendung Semantische Ähnlichkeit und Disambiguierung Übungen Anwendung LDA in Python Interpretation Sequenzmodelle TA6 TA2, TA3 1,5 Sequenzmodelle Einführung, Chunking, Named Entity Recognition Klassifikation mit gleitendem Fenster Conditional Random Field theoretische und praktische Eigenschaften TA7 TA6 1,5 Übungen zu Sequenzmodellen Vorverarbeitung, Definition der Merkmale Verschiedene Anwendungen in Python Modellbewertung Stand: April 2014 Data-Scientist-Schulungen und Coaching 14

15 (VA) Visual Analytics Ziel: Visuelle Analytik bezeichnet Analyseprozesse, in denen Anwender und Computer synergetisch kooperieren und dazu mittels interaktiver Visualisierungen kommunizieren. In diesem Modul werden neben Kernidee und Vorteilen dieser Herangehensweise für die Exploration komplexer Datensätze auch die wesentlichen Grundlagen anschaulich vermittelt. Den thematischen Schwerpunkt stellt dabei die Analyse räumlicher Verteilungen und zeitlicher Muster in großen Datenmengen und deren Formalisierung für die weitere Verarbeitung dar. Je nach Teilnehmerinteressen werden anhand eines Twitter-Datensatzes aus Seattle bzw. Verkehrsdaten einer Großstadt konkrete Beispiele für Analysen und Modellierung (Ergebnisformalisierung) von raumzeitlichen Ereignissen, Zeitreihen und Trajektorien demonstriert. Zielgruppe: Analysten, Projektleiter, Entwickler Voraussetzung: Grundkenntnisse der Datenanalyse en: Deutsch oder Englisch Unterlagen: Englisch Basis Dauer VA1 1,5 Einführung in die visuelle Analytik (VA) Kernidee und Definition der visuellen-analytik-abgrenzung (Visual Analytics in Wissenschaft und Industrie) und Bezug zum CRISP-DM Einführende Beispiele VA2 VA1 1,5 Grundlagen I ( VA Fundamentals ) Data Fundamentals: Strukturen, Komponententypen, Attribute und Referenzen; prinzipielle Taxonomie raumzeitlicher Daten (Events, Zeitreihen, Trajektorien) Visualization Fundamentals: visuelle Variablen, visuelles Mapping, Standardvisualisierungen Interaction 101: koordinierte Ansichten, Abfragen, Filtern, Gruppieren Analysis Fundamentals: Typisierung von Analyseaufgaben, Ebenen der Analyse VA3 VA1 1,5 Grundlagen II Grundlegende Datentransformationen: Simplifikation, Generalisieren, Aggregation, Extraktion Transformation raumzeitlicher Daten: Events <-> Zeitreihen <-> Trajektorien Clustering in der visuellen Analyse: Arten des Clustering, interaktiv-visuelle Unterstützung des Clusterprozesses, progressivvisuelles Clustern Vorbereitung praktische Übungen Kurzeinführung in das Werkzeug V-Analytics Designphilosophie und Arbeitsprinzipien Stand: April 2014 Data-Scientist-Schulungen und Coaching 15

16 VA4 VA3 1,5 Anwendungsbeispiel I: Analyse von raumbezogenen Zeitreihen demonstriert an einer Verkehrsanalyse mit GPS-Daten von Mailand Datenkonvertierung: Trajektorien Events verortete Zeitreihen Iterativ-interaktives Clustern von Zeitreihen Ergebnisvisualisierung auf Karten und mittels Zeitgraphen Zeitreihenanalyse und Vorhersagemodelle Analyse und Prädiktion von Abhängigkeiten zwischen mehreren zeitabhängigen Variablen VA5 VA2 1,5 Anwendungsbeispiel II: Social-Media-Analyse in Raum und Zeit demonstriert an Twitter-Themen Strukturierung von Tweet-en: Kategorisieren nach Themen Räumliche Aggregation Clustern nach Themen in Raum und Zeit; Ergebnisinterpretation Von Tweets zu Trajektorien Verfahren und Anwendungsmöglichkeiten Stand: April 2014 Data-Scientist-Schulungen und Coaching 16

17 Beispiel für eine Inhouse-Schulung von 5 Tagen Programm Tag 1 Tag 2 Tag 3 Tag 4 Tag 5 30 min. Erwartungen Erwartungen Erwartungen Erwartungen Erwartungen 1. Slot A1 Big-Data- Architecture Einführung A4 Big-Data- Architecture Streaming BA2 Basic Analytics Konzepte mit Rapid Miner BDA2 Big Data Analytics Sampling SMA1 Social Media Analytics Einführung Kurze Pause BA3 2. Slot A1 Big-Data- Architecture Einführung A4 Big-Data- Architecture Streaming Basic Analytics Modellierungstechniken BDA2 Big Data Analytics In existierenden Umgebungen SMA2 Social Media Analytics Crawling & Vorverarbeitung Mittagspause 3. Slot A2 BA2 Basic Analytics Konzepte mit Rapid Miner BA3 Big-Data- Architecture Batch Basic Analytics Modellierungstechniken BDA3 Big Data Analytics Batch SMA3 Social Media Analytics Komplette Analyse Kurze Pause 4. Slot A2 Big-Data- Architecture Batch BA2 Basic Analytics Konzepte mit Rapid Miner BDA1 Big Data Analytics Sampling BDA4 Big Data Analytics Streaming SMA4 Social Media Analytics Namenserkennung 30 min. Feedback Feedback Feedback Feedback Feedback Gerne unterstützen wir Sie bei der Zusammenstellung Ihres individuellen Schulungsprogramms. Schulungsleiterin: Dr. Angelika Voss Schloss Birlinghoven Sankt Augustin Telefon Stand: April 2014 Data-Scientist-Schulungen und Coaching 17

WERDEN SIE FIT FÜR BIG DATA! Inhouse-Angebote für Unternehmen

WERDEN SIE FIT FÜR BIG DATA! Inhouse-Angebote für Unternehmen WERDEN SIE FIT FÜR BIG DATA! Inhouse-Angebote für Unternehmen GRUSSWORT Immer mehr Unternehmen realisieren das Potenzial der heute verfügbaren Datenmengen und beginnen, sich als»data-driven Company«neu

Mehr

Living Lab Big Data Konzeption einer Experimentierplattform

Living Lab Big Data Konzeption einer Experimentierplattform Living Lab Big Data Konzeption einer Experimentierplattform Dr. Michael May Berlin, 10.12.2012 Fraunhofer-Institut für Intelligente Analyseund Informationssysteme IAIS www.iais.fraunhofer.de Agenda n Ziele

Mehr

Information Workbench Linked Data-Anwendungen im Unternehmen. Leipziger Semantic Web Tag, 5.5.2011 Peter Haase, fluid Operations

Information Workbench Linked Data-Anwendungen im Unternehmen. Leipziger Semantic Web Tag, 5.5.2011 Peter Haase, fluid Operations Information Workbench Linked Data-Anwendungen im Unternehmen Leipziger Semantic Web Tag, 5.5.2011 Peter Haase, fluid Operations Agenda Linked Data im Unternehmen Herausforderungen Die Information Workbench

Mehr

2. Microsoft Innovationstag Nord Integrierte Lösungen in der Öffentlichen Verwaltung

2. Microsoft Innovationstag Nord Integrierte Lösungen in der Öffentlichen Verwaltung 2. Microsoft Innovationstag Nord Integrierte Lösungen in der Öffentlichen Verwaltung Reporting, Analyse und Data Mining André Henkel, initions AG 22. und 23. Oktober 2013 in Hamburg

Mehr

Big Data Vom Hype zum Geschäftsnutzen

Big Data Vom Hype zum Geschäftsnutzen Big Data Vom Hype zum Geschäftsnutzen IBM IM Forum, Berlin, 16.04.2013 Dr. Carsten Bange, Gründer und Geschäftsführer BARC Hype 15.04.2013 BARC 2013 2 1 Interesse an Big Data Nature 09-2008 Economist 03-2010

Mehr

Big Data: Nutzen und Anwendungsszenarien. CeBIT 2014 Dr. Carsten Bange, Gründer und Geschäftsführer BARC

Big Data: Nutzen und Anwendungsszenarien. CeBIT 2014 Dr. Carsten Bange, Gründer und Geschäftsführer BARC Big Data: Nutzen und Anwendungsszenarien CeBIT 2014 Dr. Carsten Bange, Gründer und Geschäftsführer BARC Big Data steht für den unaufhaltsamen Trend, dass immer mehr Daten in Unternehmen anfallen und von

Mehr

Proseminar - Data Mining

Proseminar - Data Mining Proseminar - Data Mining SCCS, Fakultät für Informatik Technische Universität München SS 2014, SS 2014 1 Data Mining: Beispiele (1) Hausnummererkennung (Klassifikation) Source: http://arxiv.org/abs/1312.6082,

Mehr

Lehrgebiet Informationssysteme

Lehrgebiet Informationssysteme Lehrgebiet AG Datenbanken und (Prof. Michel, Prof. Härder) AG Heterogene (Prof. Deßloch) http://wwwlgis.informatik.uni-kl.de/ Was sind? Computergestützte Programmsysteme, die Informationen erfassen, dauerhaft

Mehr

EXASOL Anwendertreffen 2012

EXASOL Anwendertreffen 2012 EXASOL Anwendertreffen 2012 EXAPowerlytics Feature-Architektur EXAPowerlytics In-Database Analytics Map / Reduce Algorithmen Skalare Fkt. Aggregats Fkt. Analytische Fkt. Hadoop Anbindung R LUA Python 2

Mehr

Big Data Herausforderungen und Chancen für Controller. ICV Jahrestagung, 19.05.2014 Dr. Carsten Bange, Gründer und Geschäftsführer BARC

Big Data Herausforderungen und Chancen für Controller. ICV Jahrestagung, 19.05.2014 Dr. Carsten Bange, Gründer und Geschäftsführer BARC Big Data Herausforderungen und Chancen für Controller ICV Jahrestagung, 19.05.2014 Dr. Carsten Bange, Gründer und Geschäftsführer BARC BARC: Expertise für datengetriebene Organisationen Beratung Strategie

Mehr

Von Big Data zu Executive Decision BI für den Fachanwender bis hin zu Advanced Analytics 10.45 11.15

Von Big Data zu Executive Decision BI für den Fachanwender bis hin zu Advanced Analytics 10.45 11.15 9.30 10.15 Kaffee & Registrierung 10.15 10.45 Begrüßung & aktuelle Entwicklungen bei QUNIS 10.45 11.15 11.15 11.45 Von Big Data zu Executive Decision BI für den Fachanwender bis hin zu Advanced Analytics

Mehr

Was ist Analyse? Hannover, CeBIT 2014 Patrick Keller

Was ist Analyse? Hannover, CeBIT 2014 Patrick Keller Was ist? Hannover, CeBIT 2014 Patrick Keller Business Application Research Center Historie 1994: Beginn der Untersuchung von Business-Intelligence-Software am Lehrstuhl Wirtschaftsinformatik der Universität

Mehr

Text Mining Praktikum. Durchführung: Andreas Niekler Email: aniekler@informatik.uni-leipzig.de Zimmer: Paulinum (P) 818

Text Mining Praktikum. Durchführung: Andreas Niekler Email: aniekler@informatik.uni-leipzig.de Zimmer: Paulinum (P) 818 Text Mining Praktikum Durchführung: Andreas Niekler Email: aniekler@informatik.uni-leipzig.de Zimmer: Paulinum (P) 818 Rahmenbedingungen Gruppen von 2- (max)4 Personen Jede Gruppe erhält eine Aufgabe Die

Mehr

Prof. Dr.-Ing. Rainer Schmidt 1

Prof. Dr.-Ing. Rainer Schmidt 1 Prof. Dr.-Ing. Rainer Schmidt 1 Business Analytics und Big Data sind Thema vieler Veröffentlichungen. Big Data wird immer häufiger bei Google als Suchbegriff verwendet. Prof. Dr.-Ing. Rainer Schmidt 2

Mehr

Rainer Klapper QS solutions GmbH

Rainer Klapper QS solutions GmbH Rainer Klapper QS solutions GmbH Der Handlungsbedarf Die CRM-Welt ist umgeben von Social Media Foren Communities Netzwerke CRM Blogs Fehlende Prozessintegration wird zunehmend zum Problem Wir bauen Brücken

Mehr

Executive Summary BIG DATA Future Chancen und Herausforderungen für die deutsche Industrie

Executive Summary BIG DATA Future Chancen und Herausforderungen für die deutsche Industrie Executive Summary BIG DATA Future Chancen und Herausforderungen für die deutsche Industrie BIG DATA Future Opportunities and Challanges in the German Industry Zusammenfassung Die Menge der verfügbaren

Mehr

Analyse von unstrukturierten Daten. Peter Jeitschko, Nikolaus Schemel Oracle Austria

Analyse von unstrukturierten Daten. Peter Jeitschko, Nikolaus Schemel Oracle Austria Analyse von unstrukturierten Daten Peter Jeitschko, Nikolaus Schemel Oracle Austria Evolution von Business Intelligence Manuelle Analyse Berichte Datenbanken (strukturiert) Manuelle Analyse Dashboards

Mehr

Fachgruppe Statistik, Risikoanalyse & Computing. STAT672 Data Mining. Sommersemester 2007. Prof. Dr. R. D. Reiß

Fachgruppe Statistik, Risikoanalyse & Computing. STAT672 Data Mining. Sommersemester 2007. Prof. Dr. R. D. Reiß Fachgruppe Statistik, Risikoanalyse & Computing STAT672 Data Mining Sommersemester 2007 Prof. Dr. R. D. Reiß Überblick Data Mining Begrifflichkeit Unter Data Mining versteht man die Computergestützte Suche

Mehr

Jubiläumsabo März / April 2012 Jubiläumsausgabe #1-12 Deutschland Euro 12,00 ISSN: 1864-8398 www.dokmagazin.de

Jubiläumsabo März / April 2012 Jubiläumsausgabe #1-12 Deutschland Euro 12,00 ISSN: 1864-8398 www.dokmagazin.de Nur jetzt! Jubiläumsabo März / April 2012 Jubiläumsausgabe #1-12 Deutschland Euro 12,00 ISSN: 1864-8398 www.dokmagazin.de Enterprise Search Strategien für Erfolg Dokumentenmanagement mit SharePoint: Neue

Mehr

Proseminar - Data Mining

Proseminar - Data Mining Proseminar - Data Mining SCCS, Fakultät für Informatik Technische Universität München SS 2012, SS 2012 1 Data Mining Pipeline Planung Aufbereitung Modellbildung Auswertung Wir wollen nützliches Wissen

Mehr

MythMiner. Ein Empfehlungssystem für Fernsehprogramme auf Basis von RapidMiner. Balázs Bárány. Linuxwochen Wien, 7. 5. 2011

MythMiner. Ein Empfehlungssystem für Fernsehprogramme auf Basis von RapidMiner. Balázs Bárány. Linuxwochen Wien, 7. 5. 2011 Voraussetzungen für Data Mining und Text Mining Schluÿ Ein Empfehlungssystem für Fernsehprogramme auf Basis von RapidMiner Linuxwochen Wien, 7. 5. 2011 Voraussetzungen für Data Mining und Text Mining Schluÿ

Mehr

Big-Data-Technologien - Überblick - Prof. Dr. Jens Albrecht

Big-Data-Technologien - Überblick - Prof. Dr. Jens Albrecht Big-Data-Technologien - Überblick - Quelle: http://www.ingenieur.de/panorama/fussball-wm-in-brasilien/elektronischer-fussball-smartphone-app-helfen-training Big-Data-Anwendungen im Unternehmen Logistik

Mehr

W.WIINM32.11 (Datawarehousing) W.WIMAT03.13 (Statistik)

W.WIINM32.11 (Datawarehousing) W.WIMAT03.13 (Statistik) Modulbeschrieb Business Intelligence and Analytics 16.10.2013 Seite 1/5 Modulcode Leitidee Art der Ausbildung Studiengang Modultyp W.WIINM42.13 Information ist eine derart wichtige Komponente bei der Entscheidungsfindung,

Mehr

Institut für angewandte Informationstechnologie (InIT)

Institut für angewandte Informationstechnologie (InIT) School of Engineering Institut für angewandte Informationstechnologie (InIT) We ride the information wave Zürcher Fachhochschule www.init.zhaw.ch Forschung & Entwicklung Institut für angewandte Informationstechnologie

Mehr

Logo MIA. Ein cloud basierter Marktplatz für Informationen und Analysen auf dem deutschsprachigen Web

Logo MIA. Ein cloud basierter Marktplatz für Informationen und Analysen auf dem deutschsprachigen Web Logo MIA Ein cloud basierter Marktplatz für Informationen und Analysen auf dem deutschsprachigen Web MIA Konsortium Ausgangslage Das deutschsprachige Web mit derzeit mehr als sechs Milliarden Webseiten

Mehr

Big Data Informationen neu gelebt

Big Data Informationen neu gelebt Seminarunterlage Version: 1.01 Copyright Version 1.01 vom 21. Mai 2015 Dieses Dokument wird durch die veröffentlicht. Copyright. Alle Rechte vorbehalten. Alle Produkt- und Dienstleistungs-Bezeichnungen

Mehr

Die Microsoft-Komplettlösung für Datawarehousing, Big Data und Business Intelligence im Überblick. Volker.Hinz@microsoft.com

Die Microsoft-Komplettlösung für Datawarehousing, Big Data und Business Intelligence im Überblick. Volker.Hinz@microsoft.com Die Microsoft-Komplettlösung für Datawarehousing, Big Data und Business Intelligence im Überblick Volker.Hinz@microsoft.com Was sagt der Markt? Fakten Meinung der Analysten zu Microsofts Angeboten Nutzen

Mehr

Studie Semantic Media Web. Dr. Joachim Quantz Wiebke Lang

Studie Semantic Media Web. Dr. Joachim Quantz Wiebke Lang Studie Semantic Media Web Dr. Joachim Quantz Wiebke Lang Gliederung Einleitung - Ziele der Studie - Hintergrund/Methodologie Semantic Media Web - SMW-Technologien - Medienbranche/Wissensarbeiter; Geschäftsmodelle

Mehr

Data Mining mit Rapidminer im Direktmarketing ein erster Versuch. Hasan Tercan und Hans-Peter Weih

Data Mining mit Rapidminer im Direktmarketing ein erster Versuch. Hasan Tercan und Hans-Peter Weih Data Mining mit Rapidminer im Direktmarketing ein erster Versuch Hasan Tercan und Hans-Peter Weih Motivation und Ziele des Projekts Anwendung von Data Mining im Versicherungssektor Unternehmen: Standard

Mehr

Textanalyse mit UIMA und Hadoop.!! Hans-Peter Zorn data2day, Karlsruhe, 27.11.2014

Textanalyse mit UIMA und Hadoop.!! Hans-Peter Zorn data2day, Karlsruhe, 27.11.2014 Textanalyse mit UIMA und Hadoop Hans-Peter Zorn data2day, Karlsruhe, 27.11.2014 Über mich seit 2014: Big Data Scientist @ Inovex 2011-2013: TU Darmstadt, UKP Lab Etablierung der Hadoop-Infrastruktur Unterstützung

Mehr

tfacet: Hierarchisch-facettierte Exploration semantischer Daten mit Hilfe bekannter Interaktionskonzepte

tfacet: Hierarchisch-facettierte Exploration semantischer Daten mit Hilfe bekannter Interaktionskonzepte IVDW-Workshop 2011, Berlin (6. Oktober) Institut für Visualisierung und Interaktive Systeme tfacet: Hierarchisch-facettierte Exploration semantischer Daten mit Hilfe bekannter Interaktionskonzepte Philipp

Mehr

DATEN - Das Gold des 21. Jahrhunderts? Dr. Oliver Riedel, AUDI AG

DATEN - Das Gold des 21. Jahrhunderts? Dr. Oliver Riedel, AUDI AG DATEN - Das Gold des 21. Jahrhunderts? Dr. Oliver Riedel, AUDI AG Inhalt Globale und unternehmensspezifische Herausforderungen Von Big Data zu Smart Data Herausforderungen und Mehrwert von Smart Data 2

Mehr

Das Knowledge Grid. Eine Architektur für verteiltes Data Mining

Das Knowledge Grid. Eine Architektur für verteiltes Data Mining Das Knowledge Grid Eine Architektur für verteiltes Data Mining 1 Gliederung 1. Motivation 2. KDD und PDKD Systeme 3. Knowledge Grid Services 4. TeraGrid Projekt 5. Das Semantic Web 2 Motivation Rapide

Mehr

Seminar Business Intelligence Teil II. Data Mining & Knowledge Discovery

Seminar Business Intelligence Teil II. Data Mining & Knowledge Discovery Seminar Business Intelligence Teil II Data Mining & Knowledge Discovery Was ist Data Mining? Sabine Queckbörner Was ist Data Mining? Data Mining Was ist Data Mining? Nach welchen Mustern wird gesucht?

Mehr

Big Data in der Forschung

Big Data in der Forschung Big Data in der Forschung Dominik Friedrich RWTH Aachen Rechen- und Kommunikationszentrum (RZ) Gartner Hype Cycle July 2011 Folie 2 Was ist Big Data? Was wird unter Big Data verstanden Datensätze, die

Mehr

Visual Business Intelligence Eine Forschungsperspektive

Visual Business Intelligence Eine Forschungsperspektive Visual Business Intelligence Eine Forschungsperspektive Dr. Jörn Kohlhammer Fraunhofer-Institut für Graphische Datenverarbeitung IGD Fraunhoferstraße 5 64283 Darmstadt Tel.: +49 6151 155 646 Fax.: +49

Mehr

Sentiment Analysis (SA) Robert Bärhold & Mario Sänger Text Analytics WS 2012/13 Prof. Leser

Sentiment Analysis (SA) Robert Bärhold & Mario Sänger Text Analytics WS 2012/13 Prof. Leser Sentiment Analysis (SA) Robert Bärhold & Mario Sänger Text Analytics WS 2012/13 Prof. Leser Gliederung Einleitung Problemstellungen Ansätze & Herangehensweisen Anwendungsbeispiele Zusammenfassung 2 Gliederung

Mehr

Proseminar - Data Mining

Proseminar - Data Mining Vorbesprechung Proseminar - Data Mining SCCS, Fakultät für Informatik Technische Universität München SS 2015 Vorbesprechung, SS 2015 1 Data Mining: Beispiele (1) Hausnummererkennung (Klassifikation) Source:

Mehr

Von Big Data zu Smart Data

Von Big Data zu Smart Data Von Big Data zu Smart Data mit Technologieförderung des BMWi Big Data Summit BITKOM-Konferenz; Bonn, 24.06.2013 Dr. Andreas Goerdeler Unterabteilungsleiter Informationsgesellschaft; Medien Bundesministerium

Mehr

Analysen sind nur so gut wie die Datenbasis

Analysen sind nur so gut wie die Datenbasis Analysen sind nur so gut wie die Datenbasis Datenaufbereitung und Sicherung der Datenqualität durch den kontextbasierten MIOsoft Ansatz. Daten gelten längst als wichtiger Produktionsfaktor in allen Industriebereichen.

Mehr

Spezialisierungskatalog

Spezialisierungskatalog Spezialisierungskatalog Inhaltsverzeichnis: 1. Friedrich Schiller Universität 2. TU Ilmenau 3. FH Erfurt 4. FH Jena 5. FH Nordhausen 6. FH Schmalkalden 7. BA Gera 8. BA Eisenach 1. Friedrich-Schiller-Universität

Mehr

Neuerungen im Enterprise Miner 5.2 & Text Miner 2.3

Neuerungen im Enterprise Miner 5.2 & Text Miner 2.3 Neuerungen im Enterprise Miner 5.2 & Text Miner 2.3 Copyright 2005, SAS Institute Inc. All rights reserved. Ulrich Reincke, SAS Deutschland Agenda Der Neue Enterprise Miner 5.2 Der Neue Text Miner 2.3

Mehr

Big Data Mythen und Fakten

Big Data Mythen und Fakten Big Data Mythen und Fakten Mario Meir-Huber Research Analyst, IDC Copyright IDC. Reproduction is forbidden unless authorized. All rights reserved. About me Research Analyst @ IDC Author verschiedener IT-Fachbücher

Mehr

Analyse und Auswertung großer heterogener Datenmengen

Analyse und Auswertung großer heterogener Datenmengen Analyse und Auswertung großer heterogener Datenmengen Herausforderungen für die IT-Infrastruktur Richard Göbel Inhalt Big Data Was ist das eigentlich? Was nützt mir das? Wie lassen sich solche großen Datenmengen

Mehr

Thementisch Anwendungsgebiete und

Thementisch Anwendungsgebiete und Thementisch Anwendungsgebiete und b Erfolgsgeschichten KMUs und Big Data Wien 08. Juni 2015 Hermann b Stern, Know-Center www.know-center.at Know-Center GmbH Know-Center Research Center for Data-driven

Mehr

Customer Co-Creation. Inhouse-Workshop: Kunden in die Entwicklung neuer Angebote integrieren. Auch als offenes Seminar!

Customer Co-Creation. Inhouse-Workshop: Kunden in die Entwicklung neuer Angebote integrieren. Auch als offenes Seminar! Customer Co-Creation Inhouse-Workshop: Kunden in die Entwicklung neuer Angebote integrieren Auch als offenes Seminar! 13./14. November 2014, Berlin Informationen: www.workshop-innovation.de Kunden in die

Mehr

Big Data, small Data und alles dazwischen!

Big Data, small Data und alles dazwischen! Technologische Entwicklung Governance & Compliance Entwicklung 15.05.2015 Big Data, small Data und alles dazwischen! Wien, 20.5.2015 Herbert Stauffer Geschichtliche Entwicklung der Weg zu Big Data 1970

Mehr

Predictive Analysis für eine intelligente Produktionsplanung Dr. Andreas Cardeneo, SAP Data Science 20. Mai 2014

Predictive Analysis für eine intelligente Produktionsplanung Dr. Andreas Cardeneo, SAP Data Science 20. Mai 2014 Predictive Analysis für eine intelligente Produktionsplanung Dr. Andreas Cardeneo, SAP Data Science 20. Mai 2014 Agenda Vorstellung Kundenbeispiel Absatzprognose SAP Predictive Analysis Anwendung SAP Predictive

Mehr

Web Data Mining. Alexander Hinneburg Sommersemester 2007

Web Data Mining. Alexander Hinneburg Sommersemester 2007 Web Data Mining Alexander Hinneburg Sommersemester 2007 Termine Vorlesung Mi. 10:00-11:30 Raum?? Übung Mi. 11:45-13:15 Raum?? Klausuren Mittwoch, 23. Mai Donnerstag, 12. Juli Buch Bing Liu: Web Data Mining

Mehr

WEBINAR@LUNCHTIME THEMA: WAS MACHT EIGENTLICH EIN DATA SCIENTIST?" BERNADETTE FABITS

WEBINAR@LUNCHTIME THEMA: WAS MACHT EIGENTLICH EIN DATA SCIENTIST? BERNADETTE FABITS WEBINAR@LUNCHTIME THEMA: WAS MACHT EIGENTLICH EIN DATA SCIENTIST?" BERNADETTE FABITS HINEIN GEHÖRT DATA SCIENTIST, STATISTIKER, DATA MINER, ANALYST,. Gibt es noch mehr von denen. die arbeiten mit Big Data

Mehr

Was tun mit Big Data? Workshop-Angebote der PROFI AG

Was tun mit Big Data? Workshop-Angebote der PROFI AG Was tun mit Big Data? Workshop-Angebote der PROFI AG Jetzt anmelden! Die Teilnehmerzahl ist begrenzt. Was ist Big Data? 3 Herzlich willkommen. Die PROFI AG bietet Kunden ein breites Spektrum an Software-Lösungen,

Mehr

Semantische Infomationsintegration à la carte?

Semantische Infomationsintegration à la carte? Semantische Infomationsintegration à la carte? Ziele und Herausforderungen der Anwendung des CIDOC CRM. Historisch-Kulturwiss. Informationsverarbeitung, Universität Köln 1. Oktober 2010 1 Ein User Scenario

Mehr

Motivation. Themenblock: Data Preprocessing. Einsatzgebiete für Data Mining I. Modell von Gianotti und Pedreschi

Motivation. Themenblock: Data Preprocessing. Einsatzgebiete für Data Mining I. Modell von Gianotti und Pedreschi Motivation Themenblock: Data Preprocessing We are drowning in information, but starving for knowledge! (John Naisbett) Was genau ist Datenanalyse? Praktikum: Data Warehousing und Data Mining Was ist Data

Mehr

Informationsflut bewältigen - Textmining in der Praxis

Informationsflut bewältigen - Textmining in der Praxis Informationsflut bewältigen - Textmining in der Praxis Christiane Theusinger Business Unit Data Mining & CRM Solutions SAS Deutschland Ulrich Reincke Manager Business Data Mining Solutions SAS Deutschland

Mehr

Projekt-/Praxisseminare Sommersemester 2014

Projekt-/Praxisseminare Sommersemester 2014 Lehrstuhl Dr. Max Mustermann Wirtschaftsinformatik I - Informationssysteme Referat Kommunika/on & Marke/ng FAKULTÄT Verwaltung FÜR WIRTSCHAFTSWISSENSCHAFTEN Projekt-/Praxisseminare Sommersemester 2014

Mehr

Industrie 4.0 und Smart Data

Industrie 4.0 und Smart Data Industrie 4.0 und Smart Data Herausforderungen für die IT-Infrastruktur bei der Auswertung großer heterogener Datenmengen Richard Göbel Inhalt Industrie 4.0 - Was ist das? Was ist neu? Herausforderungen

Mehr

Social Monitoring. HAW Hamburg Hochschule für Angewandte Wissenschaften University of Applied Sciences Master Informatik - Anwendungen 1 WS 2013/2014

Social Monitoring. HAW Hamburg Hochschule für Angewandte Wissenschaften University of Applied Sciences Master Informatik - Anwendungen 1 WS 2013/2014 HAW Hamburg Hochschule für Angewandte Wissenschaften University of Applied Sciences Master Informatik - Anwendungen 1 WS 2013/2014 Abdul-Wahed Haiderzadah abdul-wahed.haiderzadah@haw-hamburg.de Betreuer:

Mehr

Semantic Web: Resource Description Framework (RDF)

Semantic Web: Resource Description Framework (RDF) Big Data Semantic Web: RDF Information Retrieval Map Reduce: Massiv parallele Verarbeitung Datenströme Peer to Peer Informationssysteme No SQL Systeme Multi-Tenancy/Cloud-Datenbanken Semantic Web: Resource

Mehr

SAS TEXT ANALYTICS EVENT

SAS TEXT ANALYTICS EVENT SAS TEXT ANALYTICS EVENT DIENSTAG, 21. APRIL 2015 AGENDA Zeit Inhalt 16:00-16:30 Registrierung & Willkommenskaffee 16:30-16:45 16:45-17:15 17:15-17:45 Begrüssung und Einleitung ins Thema Text Analytics

Mehr

Kundenbindung optimieren mit Predictive Analytics und Text Mining

Kundenbindung optimieren mit Predictive Analytics und Text Mining Kundenbindung optimieren mit Predictive Analytics und Text Mining Ein Praxis-Beispiel mit der Analyse-Plattform STATISTICA CeBIT Hannover, 10. März 2014 www.statsoft.de StatSoft (Europe) GmbH 2014 Dr.

Mehr

25.09.2014. Zeit bedeutet eine Abwägung von Skalierbarkeit und Konsistenz

25.09.2014. Zeit bedeutet eine Abwägung von Skalierbarkeit und Konsistenz 1 2 Dies ist ein Vortrag über Zeit in verteilten Anwendungen Wir betrachten die diskrete "Anwendungszeit" in der nebenläufige Aktivitäten auftreten Aktivitäten in einer hochgradig skalierbaren (verteilten)

Mehr

School of Engineering Institut für Datenanalyse und Prozessdesign (IDP)

School of Engineering Institut für Datenanalyse und Prozessdesign (IDP) School of Engineering Institut für Datenanalyse und Prozessdesign (IDP) Zürcher Fachhochschule www.zhaw.ch/idp Forschung & Entwicklung Das Institut für Datenanalyse und Prozessdesign (IDP) Das Institut

Mehr

Workshop Predictive Analytics am Beispiel von ITSM

Workshop Predictive Analytics am Beispiel von ITSM SMART. PRAGMATIC. PREDICTABLE. Workshop Predictive Analytics am Beispiel von ITSM Hans Sieder Geschäftsführer Fabian Shirokov Manager Data Science Über SIEGER Ergebnisse zählen. Die SIEGER Consulting liefert

Mehr

Foto: violetkaipa - Fotolia

Foto: violetkaipa - Fotolia Die D kön Foto: violetkaipa - Fotolia 10 IT-Trend Big Data atenflut steigt wie nen wir sie nutzen? Ständig erhöht sich die Masse der uns umgebenden Daten, Informationen werden immer schneller generiert.

Mehr

Die On-line Präsenz des Tourismusverbands Innsbruck und seine Feriendörfer. Univ.-Prof. Dr. Dieter Fensel STI Innsbruck, University of Innsbruck

Die On-line Präsenz des Tourismusverbands Innsbruck und seine Feriendörfer. Univ.-Prof. Dr. Dieter Fensel STI Innsbruck, University of Innsbruck Die On-line Präsenz des Tourismusverbands Innsbruck und seine Feriendörfer Univ.-Prof. Dr. Dieter Fensel STI Innsbruck, University of Innsbruck Copyright 2008 STI INNSBRUCK www.sti-innsbruck.at 1 Der Hotelier

Mehr

Data Mining-Modelle und -Algorithmen

Data Mining-Modelle und -Algorithmen Data Mining-Modelle und -Algorithmen Data Mining-Modelle und -Algorithmen Data Mining ist ein Prozess, bei dem mehrere Komponenten i n- teragieren. Sie greifen auf Datenquellen, um diese zum Training,

Mehr

MS SQL Server 2012 (4)

MS SQL Server 2012 (4) MS SQL Server 2012 (4) Data Mining, Analyse und multivariate Verfahren Marco Skulschus Jan Tittel Marcus Wiederstein Webseite zum Buch: http://vvwvv.comelio-medien.com/buch-kataiog/ms sql_server/ms sql

Mehr

QUICK-START EVALUIERUNG

QUICK-START EVALUIERUNG Pentaho 30 für 30 Webinar QUICK-START EVALUIERUNG Ressourcen & Tipps Leo Cardinaals Sales Engineer 1 Mit Pentaho Business Analytics haben Sie eine moderne und umfassende Plattform für Datenintegration

Mehr

Big & Smart Data. bernard.bekavac@htwchur.ch

Big & Smart Data. bernard.bekavac@htwchur.ch Big & Smart Data Prof. Dr. Bernard Bekavac Schweizerisches Institut für Informationswissenschaft SII Studienleiter Bachelor of Science in Information Science bernard.bekavac@htwchur.ch Quiz An welchem

Mehr

Business Intelligence und Geovisualisierung in der Gesundheitswirtschaft

Business Intelligence und Geovisualisierung in der Gesundheitswirtschaft Business Intelligence und Geovisualisierung in der Gesundheitswirtschaft Prof. Dr. Anett Mehler-Bicher Fachhochschule Mainz, Fachbereich Wirtschaft Prof. Dr. Klaus Böhm health&media GmbH 2011 health&media

Mehr

Tiefgreifende Prozessverbesserung und Wissensmanagement durch Data Mining

Tiefgreifende Prozessverbesserung und Wissensmanagement durch Data Mining Tiefgreifende Prozessverbesserung und Wissensmanagement durch Data Mining Ausgangssituation Kaizen Data Mining ISO 9001 Wenn andere Methoden an ihre Grenzen stoßen Es gibt unzählige Methoden, die Abläufe

Mehr

In-Memory & Real-Time Hype vs. Realität: Maßgeschneiderte IBM Business Analytics Lösungen für SAP-Kunden

In-Memory & Real-Time Hype vs. Realität: Maßgeschneiderte IBM Business Analytics Lösungen für SAP-Kunden In-Memory & Real-Time Hype vs. Realität: Maßgeschneiderte IBM Business Analytics Lösungen für SAP-Kunden Jens Kaminski ERP Strategy Executive IBM Deutschland Ungebremstes Datenwachstum > 4,6 Millarden

Mehr

Apache HBase. A BigTable Column Store on top of Hadoop

Apache HBase. A BigTable Column Store on top of Hadoop Apache HBase A BigTable Column Store on top of Hadoop Ich bin... Mitch Köhler Selbstständig seit 2010 Tätig als Softwareentwickler Softwarearchitekt Student an der OVGU seit Oktober 2011 Schwerpunkte Client/Server,

Mehr

Grundlagen relationaler Datenbanken... 2. Access 2010 - Grundlagenseminar... 3. Access 2010 - Aufbauseminar... 4. Von Excel 2010 zu Access 2010...

Grundlagen relationaler Datenbanken... 2. Access 2010 - Grundlagenseminar... 3. Access 2010 - Aufbauseminar... 4. Von Excel 2010 zu Access 2010... Inhalt Grundlagen relationaler Datenbanken... 2 Access 2010 - Grundlagenseminar... 3 Access 2010 - Aufbauseminar... 4 Von Excel 2010 zu Access 2010... 5 Access 2010 - Programmierung Teil 1... 6 Access

Mehr

Text Mining und CRM. Hans Hermann Weber Univ. Erlangen IMMD 8, den 12.09.03

Text Mining und CRM. Hans Hermann Weber Univ. Erlangen IMMD 8, den 12.09.03 Text Mining und CRM Hans Hermann Weber Univ. Erlangen IMMD 8, den 12.09.03 Was ist Textmining Unstrukturierte Daten (Text) anreichern mit Strukturinformation: Metadaten hinzufügen Struktur (Segmentinformation)

Mehr

Maschinelles Lernen und Data Mining: Methoden und Anwendungen

Maschinelles Lernen und Data Mining: Methoden und Anwendungen Maschinelles Lernen und Data Mining: Methoden und Anwendungen Eyke Hüllermeier Knowledge Engineering & Bioinformatics Fachbereich Mathematik und Informatik GFFT-Jahrestagung, Wesel, 17. Januar 2008 Knowledge

Mehr

SOZIALES" BRANCHENGEFLÜSTER ANALYSIERT DER SOCIAL MEDIA-MONITOR FÜR BANKEN

SOZIALES BRANCHENGEFLÜSTER ANALYSIERT DER SOCIAL MEDIA-MONITOR FÜR BANKEN SOZIALES" BRANCHENGEFLÜSTER ANALYSIERT DER SOCIAL MEDIA-MONITOR FÜR BANKEN CHRISTIAN KÖNIG BUSINESS EXPERT COMPETENCE CENTER CUSTOMER INTELLIGENCE Copyr i g ht 2012, SAS Ins titut e Inc. All rights res

Mehr

Big Data: Definition, Einführung und Live Democase [C1] Arne Weitzel Uetliberg, 16.09.2014 www.boak.ch

Big Data: Definition, Einführung und Live Democase [C1] Arne Weitzel Uetliberg, 16.09.2014 www.boak.ch Big Data: Definition, Einführung und Live Democase [C1] Arne Weitzel Uetliberg, 16.09.2014 www.boak.ch Unstrukturierte Daten spielen eine immer bedeutender Rolle in Big Data-Projekten. Zunächst gilt es

Mehr

Advanced Analytics mit EXAPowerlytics. Technisches Whitepaper

Advanced Analytics mit EXAPowerlytics. Technisches Whitepaper Advanced Analytics mit EXAPowerlytics Technisches Whitepaper Inhalt 1. Zusammenfassung... 3 2. Einführung... 4 3. Fachliche Einführung... 5 4. Beispiel: Zeichen zählen... 7 5. Fazit... 9 6. Anhang... 10-2

Mehr

R-Akademie Kursangebot November 2012

R-Akademie Kursangebot November 2012 Kooperationspartner der R-Akademie Kursangebot November 2012 Was ist R? R ist eine Open Source Programmiersprache zur statistischen Datenanalyse und -visualisierung. Mittlerweile hat sich R, neben den

Mehr

SAP Customer Engagement Intelligence - Kundenanalysen der nächsten Generation

SAP Customer Engagement Intelligence - Kundenanalysen der nächsten Generation SAP Customer Engagement Intelligence - Kundenanalysen der nächsten Generation Alexander Schroeter, Head of Outbound PM MEE, CRM & Commerce, SAP AG Regensdorf, November 19, 2013 SAP Customer Engagement

Mehr

Visual Business Analytics Visueller Zugang zu Big Data

Visual Business Analytics Visueller Zugang zu Big Data Visual Business Analytics Visueller Zugang zu Big Data Dr.-Ing. Jörn Kohlhammer Fraunhofer-Institut für Graphische Datenverarbeitung (IGD) Fraunhoferstraße 5 64283 Darmstadt Tel.: +49 6151 155-646 Fax:

Mehr

Qualitative Aspekte Enterprise Search Volltextsuche & Text Mining. Franz Kögl Vorstand IntraFind Software AG

Qualitative Aspekte Enterprise Search Volltextsuche & Text Mining. Franz Kögl Vorstand IntraFind Software AG Qualitative Aspekte Enterprise Search Volltextsuche & Text Mining Franz Kögl Vorstand IntraFind Software AG Vorstellung IntraFind AG Qualitative Sucherweiterung: Search+ Wildcardsuche Einbindung von Synonymen

Mehr

Qualitätsberichte im MS Word-Format

Qualitätsberichte im MS Word-Format Qualitätsberichte im MS Word-Format StatSoft GmbH und STATISTICA 9.1 auf dem Forum der Control 2010 www.statsoft.de StatSoft (Europe) GmbH 2010 Michael Busch Inhalt StatSoft STATISTICA Anwendungen in der

Mehr

Modulhandbuch für das BA Kombinationsfach Angewandte Informatik Multimedia

Modulhandbuch für das BA Kombinationsfach Angewandte Informatik Multimedia Modulhandbuch für das BA Kombinationsfach Angewandte Informatik Multimedia Kenntnisse im Programmieren für das World Wide Web mit der Programmiersprache JAVA werden vermittelt, ebenso das Erstellen von

Mehr

SAS Education. Grow with us. Anmeldung bei SAS Education. Kurstermine Juli Dezember 2015 für Deutschland, Österreich und die Schweiz

SAS Education. Grow with us. Anmeldung bei SAS Education. Kurstermine Juli Dezember 2015 für Deutschland, Österreich und die Schweiz 2015 SAS Education Kurstermine Juli Dezember 2015 für Deutschland, Österreich und die Schweiz Anmeldung bei SAS Education Deutschland www.sas.de/education Tel. +49 6221 415-300 education@ger.sas.com Fax

Mehr

Large Scale Data Management

Large Scale Data Management Large Scale Data Management Beirat für Informationsgesellschaft / GOING LOCAL Wien, 21. November 2011 Prof. Dr. Wolrad Rommel FTW Forschungszentrum Telekommunikation Wien rommel@ftw.at Gartner's 2011 Hype

Mehr

9 Resümee. Resümee 216

9 Resümee. Resümee 216 Resümee 216 9 Resümee In der vorliegenden Arbeit werden verschiedene Methoden der Datenreduktion auf ihre Leistungsfähigkeit im sozialwissenschaftlichstatistischen Umfeld anhand eines konkreten Anwendungsfalls

Mehr

Direktmarketing im Zentrum digitaler Vertriebsstrategien

Direktmarketing im Zentrum digitaler Vertriebsstrategien Direktmarketing im Zentrum digitaler Vertriebsstrategien Standortbestimmung und Key Learnings für Verlage Hamburg, September 2014 Im Zentrum digitaler Vertriebsstrategien steht zunehmend die Analyse komplexer

Mehr

Copyr i g ht 2014, SAS Ins titut e Inc. All rights res er ve d. HERZLICH WILLKOMMEN ZUR VERANSTALTUNG HADOOP

Copyr i g ht 2014, SAS Ins titut e Inc. All rights res er ve d. HERZLICH WILLKOMMEN ZUR VERANSTALTUNG HADOOP HERZLICH WILLKOMMEN ZUR VERANSTALTUNG HADOOP AGENDA HADOOP 9:00 09:15 Das datengetriebene Unternehmen: Big Data Analytics mit SAS die digitale Transformation: Handlungsfelder für IT und Fachbereiche Big

Mehr

KURSE 2012. Praxisorientierte. Weiterbildung SPSS

KURSE 2012. Praxisorientierte. Weiterbildung SPSS KURSE 2012 Praxisorientierte Weiterbildung SPSS KURSE 2012 1 2 3 4 5 6 7 EINFÜHRUNGSKURS ARBEITEN MIT IBM SPSS STATISTICS IBM SPSS STATISTICS IN DER MEDIZIN PRAKTISCHE EINFÜHRUNG IN DIE QUANTITATIVE MARKTFORSCHUNG

Mehr

Exploration und Klassifikation von BigData

Exploration und Klassifikation von BigData Exploration und Klassifikation von BigData Inhalt Einführung Daten Data Mining: Vorbereitungen Clustering Konvexe Hülle Fragen Google: Riesige Datenmengen (2009: Prozessieren von 24 Petabytes pro Tag)

Mehr

Datenbanken-Themen im OS "Data Mining" SS 2010

Datenbanken-Themen im OS Data Mining SS 2010 Prof. Dr.-Ing. Thomas Kudraß HTWK Leipzig, FIMN Datenbanken-Themen im OS "Data Mining" SS 2010 Die Vorträge sollten eine Dauer von 60 Minuten (Einzelvortrag) bzw. 45 Minuten (Doppelvortrag) haben. Nachfolgend

Mehr

SELF-SERVICE ANALYTICS: SMART INTELLIGENCE MIT INFONEA IM KONTINUUM ZWISCHEN INTERAKTIVEN REPORTS, ANALYTICS FÜR FACHANWENDER UND DATA SCIENCE

SELF-SERVICE ANALYTICS: SMART INTELLIGENCE MIT INFONEA IM KONTINUUM ZWISCHEN INTERAKTIVEN REPORTS, ANALYTICS FÜR FACHANWENDER UND DATA SCIENCE SELF-SERVICE BUSINESS INTELLIGENCE / INFONEA FUNKTIONSÜBERSICHT / SELF-SERVICE ANALYTICS: SMART INTELLIGENCE MIT INFONEA IM KONTINUUM ZWISCHEN INTERAKTIVEN REPORTS, ANALYTICS FÜR FACHANWENDER UND DATA

Mehr

Einstieg in Text Analytics

Einstieg in Text Analytics , Einstieg in Text Analytics Einstieg in Text Analytics Von der Datenquelle zum Bericht und darüber hinaus... KSFE in Dresden, 09.03.2012 2012 GmbH ist IT Dienstleister für Business Intelligence und Datenanalyse

Mehr

Mit Transbase Hypercube Data Warehouse Anwendungen effizient betreiben. Die Hypercube-Technologie

Mit Transbase Hypercube Data Warehouse Anwendungen effizient betreiben. Die Hypercube-Technologie Mit Transbase Hypercube Data Warehouse Anwendungen effizient betreiben Transbase Hypercube ist eine Transbase -Option, die die innovative Hypercube-Technologie für komplexe analytische Anwendungen (OLAP)

Mehr

Prognosen via Datenanalyse Predictive Analytics: Darauf müssen Unternehmen achten

Prognosen via Datenanalyse Predictive Analytics: Darauf müssen Unternehmen achten Prognosen via Datenanalyse Predictive Analytics: Darauf müssen Unternehmen achten von Jürgen Mauerer Foto: Avantum Consult AG Seite 1 von 21 Inhalt Mehrwert aufzeigen nach Analyse des Geschäftsmodells...

Mehr

Weitere Decision-Support Anfrage- Typen

Weitere Decision-Support Anfrage- Typen Big Data Top-k / Ranking / Skyline Semantic Web: RDF Information Retrieval PageRank / HITS Map Reduce: Massiv parallele Verarbeitung Datenströme Peer to Peer Informationssysteme No SQL Systeme Multi-Tenancy/Cloud-Datenbanken

Mehr