Prof. Dr.-Ing. Rainer Schmidt 1
Business Analytics und Big Data sind Thema vieler Veröffentlichungen. Big Data wird immer häufiger bei Google als Suchbegriff verwendet. Prof. Dr.-Ing. Rainer Schmidt 2
Auch die Job-Chancen sind gut. Ein neues Berufsbild, der Data Scientist, ist entstanden. Er beherrscht die mathematischen Grundlagen, Datenbanken und hat Fachkenntnisse. Prof. Dr.-Ing. Rainer Schmidt 3
Business Analytics dient dazu, Entscheidungen in Geschäftsprozessen zu unterstützen. Bisher wurden vorwiegend strukturierte Daten verwendet, die in Data-Warehouses aggregiert und gespeichert wurden. Es gibt aber eine große Menge von semi- und unstrukturierten Daten, sowie Daten mit ungeklärter Semantik (heterogene Semantik). Ein Beispiel sind Twitter-Einträge von Kunden. Die Auswertung von semiund unstrukturierten Daten geschieht mit Big-Data, zu dem Technologien wie Hadoop oder NoSQL gehören. Prof. Dr.-Ing. Rainer Schmidt 4
Das erste Thema ist Hadoop 2.0. Hadoop dient zur verteilten Verarbeitung von Daten bis in den Peta-Byte-Bereich. War Hadoop früher in seinem Verarbeitungsmodell festgelegt, ist es mit Hadoop 2.0 möglich, verschiedene Verarbeitungsmodelle zu nutzen. Dazu wurde die Funktionalität von MapReduce aus Hadoop 1.0 auf eine Ressourcenverwaltung namens YARN und die eigentliche MapReduce Verarbeitung aufgeteilt. Ziel des Vortrages: Es sollen die Architektur und die Eigenschaften von Hadoop 2.0 dargestellt werden. Prof. Dr.-Ing. Rainer Schmidt 5
Der Aufbau eines Hadoop-Clusters ist nicht untrivial. Daher bieten immer mehr Cloud-Anbieter Hadoop als Cloud-Service an. Ein Beispiel ist Elastic MapReduce von Amazon. Ziel des Vortrages: Darstellung des Angebotes von Hadoop-Cloud-Services und ihre Nutzung. Prof. Dr.-Ing. Rainer Schmidt 6
Klassische relationale Datenbanken sind für manche Aufgabenstellung nicht geeignet. Ein Beispiel sind mehrfache Joins die schnell zu Leistungseinbrüchen führen. Dem versuchen sogenannte NoSQL-Datenbanken zu begegnen. Sie verzichten auf die relationale Struktur und geben Leistungssteigerungen den Vorrang. Ziel des Vortrages: Es soll ein Überblick der NoSQL Technologien gegeben werden. Prof. Dr.-Ing. Rainer Schmidt 7
Hadoop und relationale Datenbanken sollten in Unternehmen nicht alleine stehen. Daher ist die Integration der beiden wichtig. Ziel des Vortrages ist es, Integrationsmöglichkeit für Hadoop und relationale Datenbanken zu beschreiben. Prof. Dr.-Ing. Rainer Schmidt 8
Für die Business Analytics ist ein umfangreicher mathematischer Methodenvorrat geschaffen worden. Ein Beispiel ist das Data Mining, bei dem aus einer Menge historischer Daten ein Entscheidungsbaum gewonnen wird. Dieser Entscheidungsbaum wird dann beim Auftauchen neuer Daten zur Entscheidungsfindung eingesetzt. Ein Beispiel ist die Auswertung, welche Kunden für welche Angebote besonders empfänglich sind. Ziel des Vortrages: Die wichtigsten mathematischen Konzepte für Business Analytics sollen dargestellt werden. Prof. Dr.-Ing. Rainer Schmidt 9
Unstrukturierte Daten tauchen beispielsweise in Twitter-Einträgen auf. Klassische Datenbank-Verfahren sind nicht anwendbar. Ziel des Vortrages: Beschreibung von Verfahren und Technologien zur Integration und Analyse unstrukturierter Daten. Prof. Dr.-Ing. Rainer Schmidt 10
R ist eine Umgebung zur Durchführung von statistischen Auswertungen. Sie ist vor allem bei Nicht-Informatikern beliebt. Ziel des Vortrages: Beschreibung von R und dessen Möglichkeiten. Prof. Dr.-Ing. Rainer Schmidt 11
Funktionale Programmiersprachen ermöglichen es, Funktionen als Parameter anderer Funktionen anzugeben. Auf diese Weise lassen sich komplexe Auswertungsfunktionalitäten bilden. F# ist neben Clojure, Haskell und Scala ein wichtiger Vertreter der funktionalen Programmiersprachen und hat eine schnell wachsende Unterstützerszene. Ziel des Vortrages: Darstellung von F# und seiner Möglichkeiten Prof. Dr.-Ing. Rainer Schmidt 12
Visualisierungsverfahren ermöglichen es, auch größte Datenmengen für den Menschen zu veranschaulichen. Ein Beispiel sind die von Baidu erfassten Reiseanfragen zum chinesischen Neujahrsfest. Ziel des Vortrages: Darstellung von Visualisierungsverfahren. Prof. Dr.-Ing. Rainer Schmidt 13
Prof. Dr.-Ing. Rainer Schmidt 14
Begleitend zum fachlichen Teil gibt es von Prof. Schmidt Vorträge zu Literaturrecherche mit Zotero Erstellen großer Text Teamarbeit Präsentieren. 15