CAS Big Data Frühlingssemester 2015

Größe: px
Ab Seite anzeigen:

Download "CAS Big Data Frühlingssemester 2015"

Transkript

1 CAS Big Data Frühlingssemester 2015

2 Inhaltsverzeichnis 1 Abstract 3 2 Umfeld und Motivation 3 3 Zielgruppe 5 4 Ausbildungsziele 5 5 Voraussetzungen 5 6 Kursübersicht 6 7 Kompetenzprofil 7 8 Kursbeschreibungen Einführung in Big Data Apache Hadoop und das Hadoop Ecosystem InMemory und ColumnStore Datenbanken, NoSQL Hardware, Architektur, Cloud Stream- & Event-Processing, Realtime Special Analytics, Statistics, Machine Learning, Visualization Textdokumente, soziale Netze und Open Data Projektarbeit 15 9 Kompetenznachweise Lehrmittel Ergänzende Lehrmittel Dozierende Organisation Termine 19 Study Guide CAS Big Data Frühlingssemester /20

3 1 Abstract Grosse Datenmengen in Echtzeit analysieren und nutzbar machen? Big Data ist eine der wichtigsten IT- Technologien des Jahrzehnts. Im Fokus stehen möglichst präzise und rasche Vorhersagen für Geschäftsentscheide, das Auffinden kritischer Ereignisse und Muster oder das Auffinden komplexer Zusammenhänge durch Auswertung eigener und globaler Datenquellen. 2 Umfeld und Motivation Die Methoden und Werkzeuge von Big Data ermöglichen die Beschaffung und Analyse grosser Datenmengen. Die Komplexität der Analysen und die oft kurze Lebensdauer der Daten machen eine massiv parallele und stream-orientierte Verarbeitung der Quellen notwendig, beispielsweise mit einem Hadoop-Cluster. Gegenüber klassischen BI-Methoden ist vor allem die Verschiedenartigkeit und Volatilität der Datenquellen ein wichtiges Merkmal von Big Data. Erläuterung zur Abbildung: Big Data wird oft über die 3V-Metapher definiert: Volume: Hohe zu verarbeitenden Datenmenge. Velocity: Hohe Verarbeitungsgeschwindigkeit, aber auch hohe Alterungsgeschwindigkeit der Quelldaten. Realtime-Ansprüche. Variety: Unterschiedlichste Quellen, die gleichzeitig und ad hoq angezapft werden müssen, komplexe Verarbeitungslogik, z.b. Textmining Study Guide CAS Big Data Frühlingssemester /20

4 Zwischen den klassischen Business Intelligence-/Data Warehouse-Methoden und Big Data gibt es ausserdem Unterschiede, die je nach Projekt mehr oder weniger hervortreten: Data Warehouse Vordefinierte Ablagestruktur, Star- und Snowflake-Schema, Datenwürfel. Daten werden möglichst rasch nach dem Entstehen verarbeitet (ETL), gereinigt, normiert und mit Metadaten beschrieben. Daten haben einen gesicherten und hohen Informationsgehalt pro Byte. Firmeninterne Datenquellen. Quellenstruktur oft strikt, Zahlen und Werte mit klarer und einfacher Syntax und Semantik. Data at Rest Daten sind meist langlebig und als Pool vorliegend. Für die Verwertung relevante Daten werden möglichst schnell eingegrenzt. Indexbasierte Verarbeitung als Effizienz-Mittel. Zweckbestimmung der Daten im Voraus bekannt, z.b. Verkäufe, Kundendaten, Finanzkennzahlen, Produktqualitätszahlen usw. Klare Fragestellungen, z.b. Mittelwerte, Summen, Min/Max Berechnungen. Einmalige, gegenwarts-orientierte Analyse der Daten (Cockpit). Transaktionales Umfeld. Konsistenz und Integrität über Gesamtdatenbestand gewährleistet. Gültigkeitsgrenzen. Abfragen reproduzierbar. Big Data Daten werden ad hoq ab Quellen ausgewertet. Geordnete Ablage nach der Analyse ist zweitrangig. Daten werden während der Analyse aufbereitet. Informationsgehalt unsicher und pro Byte eher gering. Firmeninterne kombiniert mit globalen oder öffentliche Datenquellen (open data). Die Quellenstruktur der Daten kann lose und schwach beschrieben sein. Nicht immer klar definierte Syntax und Semantik. Textdaten sind häufig. Daten werden beim Gebrauch verarbeitet, da Art der Analyse ad hoq. Data in Motion Daten oft kurzlebig und müssen aus Streams verarbeitet werden. Realtime Anforderungen, zum Beispiel beim Bezug aus Sensornetzwerken. Gesamter Datenbestand wird für die Verwertung benötigt. Massive Parallelisierung der Verarbeitung als Effizienz-Mittel. Fragestellung manchmal kompliziert und offen ("Gibt es einen Zusammenhang zwischen X und Y"). Iterative Analyse der Daten mit stark prognostischen, zukunftsorientierten Ansprüchen. Komplexe und anspruchsvolle Visualisierung, Alarmierung, Entscheidungsunterstützung usw. Transaktionale Verarbeitung nicht gewährleistet. Daten fliessend. Zu keinem Zeitpunkt gesicherter integrer und konsistenter Zustand vorhanden. Es ist jedoch absehbar, dass sich BI und Big Data im Bereich der Auswertungen und der Analyse annähern. Study Guide CAS Big Data Frühlingssemester /20

5 Applikationsbereiche von Big Data sind beispielsweise: Ereignis-Detektion und Überwachung von grossen Sensor-Netzwerken im Bereich Energie, Transport, Gesundheitswesen, Kommunikation usw. Logfile-Analyse zur Erhebung von Benutzer- und Systemverhalten, Systemsicherheit, Intrusion Detection usw. Sentiment-Analyse von Kunden und Märkten durch Kombination von Firmendaten mit Social Media und öffentlichen Daten. 3 Zielgruppe Fach- und Führungskräfte in Unternehmen und IT-Bereichen, die für den Aufbau, die Planung und die Umsetzung von Big Data Projekten verantwortlich sind. 4 Ausbildungsziele Die Teilnehmenden: kennen die methodischen und technologischen Grundlagen von Big Data. lernen Einsatzmöglichkeiten kennen, und können im eigenen beruflichen Umfeld neue Ideen zur Nutzung von Big Data und zum Erzeugen eines Business Value entwickeln. besitzen eine fundierte Übersicht über die Architektur von Big Data Lösungen. können Big Data-Projekte in ihrem Unternehmen planen, umsetzen und betreiben. können die Einbettung von Big Data Lösungen in die eigene IT-Architektur beurteilen und konzipieren. können globale und firmeninterne Datenquellen und Datenströme in eine Big Data Appliance integrieren. kennen moderne Methoden und Werkzeuge zur Aufbereitung, Analyse und Darstellung von Realtime-Datenströmen. In einer umfassenden Fallstudie wird die Konzeption oder Realisierung eines Big Data Projektes im eigenen Betrieb erarbeitet. 5 Voraussetzungen Die Teilnehmer bringen IT-Vorkenntnisse im Rahmen einer Informatik- oder Wirtschaftsinformatik- Ausbildung mit, insbesondere über Datenbanksysteme, Abfragesprachen (SQL), Modellierung, Reporting und Analyse. Projekterfahrung im Bereich Informationssysteme ist wünschenswert. In der Semesterarbeit erarbeiten die Teilnehmer ein eigenes Thema, typischerweise aus dem beruflichen Umfeld. Kenntnisse in einer objektorientierten Programmiersprache wie Java sind nützlich. Study Guide CAS Big Data Frühlingssemester /20

6 6 Kursübersicht Kurs/Lehreinheit Lektionen Stunden Dozierende Einführung in Big Data 4 Heinz Steiner Nutzenaspekte und betriebliche Bewertung von Big Data Projekten 4 Heinz Steiner Apache Hadoop und das Hadoop Ecosystem 24 Guido Schmutz InMemory und ColumnStore Datenbanken, NoSQL 16 Guido Schmutz Hardware, Architektur, Cloud 12 Daniel Steiger Stream- & Event-Processing, Realtime 16 Guido Schmutz Special Analytics, Statistics, Machine Learning, Visualisation Textdokumente, soziale Netze und Open Data 32 Werner Dähler 24 Jürgen Vogel Projektarbeit Verschiedene Betreuer Total Das CAS umfasst insgesamt 12 ECTS Punkte. Für die einzelnen Kurse ist entsprechend Zeit für Selbststudium, Prüfungsvorbereitung etc. einzurechnen. Study Guide CAS Big Data Frühlingssemester /20

7 7 Kompetenzprofil Legende: 1. Kenntnisse von Begriffen, Definitionen und Regeln; Faktenwissen 2. Verstehen von Zusammenhängen, Erklären von Sachverhalte erklären können 3. Anwendung des Wissen in einfachen Situationen 4. Analyse der eigenen Lösung 5. Synthese neuer Lösungen und Anwendung in komplexen Situationen 6. Beurteilung der Anwendbarkeit für bestimmte Probleme und Situationen, methodische Abwägung und Evaluation von Alternativen, Beziehungen zu anderen Fachgebieten Study Guide CAS Big Data Frühlingssemester /20

8 8 Kursbeschreibungen Nachfolgend sind die einzelnen Kurse dieses Studienganges beschrieben. Der Begriff Kurs schliesst alle Veranstaltungstypen ein, es ist ein zusammenfassender Begriff für verschiedene Veranstaltungstypen wie Vorlesung, Lehrveranstaltung, Fallstudie, Living Case, Fach, Studienreise, Semesterarbeiten usw. 8.1 Einführung in Big Data Kursbeschreibung Lernziele Die Teilnehmer: wissen, wann man von einem Big Data Problem spricht kennen das Potential von Big Data Technologien für Unternehmen kennen den wirtschaftlichen Nutzen von Big Data gewinnen eine Übersicht, wann der Einsatz von Big Data sinnvoll ist Themen Block 1: Wann sprechen wir von Big Data? Methodik, Denkweise, 3V Konzept. Unterschiede gegenüber klassischen Informationssystemen Die Rolle des Data Scientists im Unternehmen Das Big Data Ökosystem Typische Use Cases und Anwendungsbeispiele Block 2: Was macht ein typisches Big Data-Projekt aus? Nutzen und Abgrenzung von Big Data Projekten beurteilen Welche Fallen gilt es zu umschiffen? Bei Big Data-Projekten stellt die Heterogenität der Teammitglieder eine besondere Herausforderungen dar: Welche Vorteile bieten Pilot-Projekte beim Thema Big Data? Projektpolitik. Was ist bei der Kommunikation der Projekte zu beachten? Lehrmittel Folien/Skript Literaturempfehlungen: [1] Study Guide CAS Big Data Frühlingssemester /20

9 8.2 Apache Hadoop und das Hadoop Ecosystem Kursbeschreibung Lernziele Die Teilnehmer: lernen die Architektur von Apache Hadoop kennen kennen die Kernkomponenten von Hadoop und dem Hadoop Ökosystem wissen wie HDFS und MapReduce funktioniert können mit MapReduce einfache Big Data Anwendungen entwickeln lernen die Mittel für die Definition von Datenworkflows kennen lernen die Grenzen von Hadoop kennen und sehen für welche Art von Problemen sich MapReduce bzw. Hadoop eignet lernen Alternativen zu MapReduce, wie z.b. Apache Spark kennen Themen Warum und wozu Hadoop verwendet wird Eigenschaften der Hadoop Architektur Kernkonzepte von Hadoop Funktionalität von MapReduce Die wichtigsten Komponenten des Hadoop Ökosystem: HDFS, MapReduce, Pig, Hive, HBase, Zookeeper, Flume, Cascading, usw. Entwicklung von MapReduce Anwendungen Daten-Import und Export Automatisierung von Datenworkflows Datenserizalisierung/Deseralisierung mit Avro Hadoop APIs Best Practices und Patterns Apache Spark als Alternative bzw. Ergänzung zu Apache Hadoop Lehrmittel Folien/Skript Literaturempfehlungen: [2], [7], [8], [9] Study Guide CAS Big Data Frühlingssemester /20

10 8.3 InMemory und ColumnStore Datenbanken, NoSQL Kursbeschreibung Lernziele Die Teilnehmer: erwerben ein grundlegendes Verständnis von alternativen Datenbankkonzepten verstehen die Konzepte hinter den neuen, modernen NoSQL und NewSQL Datenbanken kennen die Unterschiede zu den relationalen Datenbanken kennen lernen die verschiedenen Arten von NoSQL kennen können erfolgsversprechende Einsatzszenarien erkennen Themen Was ist NoSQL? Was ist NewSQL? Warum gibt es diese neuen Datenbankarten? Relevante Datenbankkonzepte wie BASE, ACID, CAP, Partitionierung, Sharding, Replikation, usw. Eigenschaften der NoSQL und NewSQL Datenbanken Klassifikation der NoSQL und NewSQL Datenbanken Anwendungsfälle für NoSQL und NewSQL Datenbanken Was geschieht mit den traditionellen, relationalen Datenbanken? Schema-Less vs. Schema bzw. Schema-on-Write vs. Schema-on-Read Ausgewählte, populäre NoSQL und NewSQL Datenbanken: MongoDB, HBase, Redis, Cassandra, Neo4J, u.a. NoSQL und NewSQL in einer BigData Architektur Lehrmittel Folien/Skript Literaturempfehlungen: [3], [11] Study Guide CAS Big Data Frühlingssemester /20

11 8.4 Hardware, Architektur, Cloud Kursbeschreibung Lernziele Die Teilnehmer: lernen Big-Data -spezifische Infrastrukturanforderungen zu formulieren kennen die wesentlichen Architekturmerkmale eines Big-Data Systems kennen die aktuellen Big-Data-Plattformen und -Appliances der Marktleader kennen die wichtigsten Integrationstechnologien kennen die betrieblichen Aspekte einer Big-Data Infrastruktur und sind in der Lage, ein Betriebskonzept zu erstellen können die Unterschiede zwischen einer cloud-basierten und einer onpremis Infrastruktur beschreiben und beurteilen lernen die infrastrukturtechnischen Voraussetzungen für die Erfüllung von Sicherheitsanforderungen kennen können den Reifegrad verschiedener Technologien beurteilen Themen Anforderungen und Architekturtreiber im Big-Data Umfeld Reliability, Availability, Scaleability und Performance Big-Data Infrastruktur-Blueprints Big-Data Plattformen Integration von Big-Data Systemen in die bestehende IT-Landschaft (Konnektoren) Lifecycle einer Big-Data Infrastruktur (Aufbau, Betrieb, Optimierung) Überlegungen und Implikationen zu Big-Data in der Cloud Secure Infrastructure Leading-Edge Technologien und Technologietrends Lehrmittel Vorlesungsunterlagen (SlideDoc) Aktuelle Whitepapers, Fachartikel und Hersteller-Unterlagen Study Guide CAS Big Data Frühlingssemester /20

12 8.5 Stream- & Event-Processing, Realtime Kursbeschreibung Lernziele Die Teilnehmer: lernen die Prinzipien des Stream- und Event-Processing kennen können die Komponenten einer Event-Driven Architecture (EDA) beschreiben lernen die Unterschiedlichen Sprachen für die Erkennung und Verarbeitung von Events kennen können Probleme mit Hilfe von Event-Processing lösen können abschätzen, wann sich der Einsatz von Event-Processing lohnt kennen die Positionierung von Event Processing interhalb einer Big Data Architektur Themen Was ist ein Event, was ist eine Message? Was ist Complex Event Processing (CEP)? Historie und Prinzipien von Stream- und Complex Event Processing Event Processing Design Patterns Erkennen von Events Aggregation von Events wie können Business Events von den Raw Events abgeleitet werden Internet of Things und Machine to Machine (M2M) was hat dies mit Event-Processing zu tun? Welche Sprachen für das Event-Processing gibt es? Plattformen und Frameworks für Event-Processing: Twitter Storm bzw. Trident, Esper, Spark Streaming usw. Lehrmittel Folien/Skript Literaturempfehlungen: [4], [10] Study Guide CAS Big Data Frühlingssemester /20

13 8.6 Special Analytics, Statistics, Machine Learning, Visualization Kursbeschreibung Lernziele Die Teilnehmer: kennen die Konsequenzen von Verteiltem Computing auf die Analyse- Algorithmen kennen die wichtigsten Clustering-Methoden kennen die wichtigsten Methoden der Dimensions-Reduktion kennen die wichtigsten Klassifikationsmethoden und wissen, wann welche wie einzusetzen sind kennen die wichtigsten Visualisierungsmöglichkeiten für Massive Datasets Themen Einführung in "konventionelle" Statistik und Data Mining Analyse-Algorithmen unter der Berücksichtigung von Verteiltem Computing Distanz und Ähnlichkeitsmasse Euklidische Distanz / Manhattan Distanz Jaccard-Index Clusteranalyse Hierarchisches Clustering k-means Clustering Dimensionsreduktion Eigenwerte und Eigenvektoren Hauptkomponentenanalyse (PCA) Feature Extraction Maschinelles Lernen div. Klassifikationsmethoden (Decision Tree, SVM, Naive Bayes, Neuronet) Validierungsverfahren Datenvisualisierung Lehrmittel Folien/Skript Literaturempfehlungen: [5] Study Guide CAS Big Data Frühlingssemester /20

14 8.7 Textdokumente, soziale Netze und Open Data Kursbeschreibung Lernziele Die Teilnehmer: lernen Algorithmen und Werkzeuge zur Analyse unstrukturierter Daten (insbesondere von Textdokumenten) und sozialer Netzwerke (Twitter, Facebook, etc.) kennen entwerfen, implementieren und evaluieren Analyseverfahren mit Hilfe gängiger Open Source-Bibliotheken in Java kennen aktuelle technologische Entwicklungen im Web (Open Data, Semantic Web) und haben einen Überblick über die verschiedenen Web- Standards für Daten (HTML/XML, RDF,...) Themen Analyse von Textdokumenten (Natural Language Processing) mit unterschiedlichen Methoden aus der (Computer-) Linguistik und dem maschinellen Lernen: Reguläre Ausdrücke, Named Entity Recognition, Syntax, Semantik Information Retrieval und Web Mining: Text Classification, PageRank Analyse von sozialen Netzwerken auf der Basis von Graphenalgorithmen und Natural Language Processing: Sentiment Analysis, Prestige Publizieren und konsumieren von frei zugänglichen Datensätzen im Web (Open Data) Lehrmittel Folien/Skript Entwicklungsumgebung (Eclipse, Maven, Java) Literaturempfehlungen: [5], [6] Study Guide CAS Big Data Frühlingssemester /20

15 8.8 Projektarbeit 1. Zielsetzung und Thema In der Semesterarbeit bearbeiten die Teilnehmer ein Projekt oder eine Fragestellung aus ihrer Firma. Mit dem gewählten Thema vertiefen die Studierende die im Studium erlernten Methoden. Das Thema der Semesterarbeit kann umfassen: Machbarkeitsstudie Umsetzung oder Implementation von Analytics-Anforderungen Evaluation und Projektierung Algorithmen- oder Software-Entwicklung IT-Architektur Konzeption Optimierung von Lösungen usw. 2. Ablauf Die Semesterarbeit beinhaltet folgende Meilensteine: In der Firma ein Thema suchen, und mit Vorteil einen Ansprechpartner/Betreuer in der Firma definieren. Erstellen einer Projektskizze (siehe unten), Eingabe an die CAS-Leitung Individuelle Kurzpräsentation ( 10' ) und Diskussion (10') des Themas an der BFH Weiterbildung in Bern vor einer Dozierendengruppe. Eventuell Überarbeitung der Projektskizze gemäss Feedback an der Präsentation. Zuordnung eines Experten durch die SWS für die Begleitung. Durchführung der Arbeit in eigener Terminplanung, 1-3 Zwischenreviews mit dem Experten. Schlusspräsentation der Arbeit (Plenum mit allen Kursteilnehmern). Dauer ca. 15 Min. Präsentation + 15 Min. Diskussion. Abgabe des Berichtes an den Experten. Beurteilung durch den Experten. Die Projektskizze umfasst eine ein- bis zweiseitige Aufgabenstellung und eine 10-minütige Power- Point Präsentation mit folgenden Teilen: Titel Umfeld Problemstellung Lösungsansatz (Vorgehen, Methoden) Name und Kontaktadressen der Gruppenmitglieder, und des Ansprechpartners/Betreuers in der Firma Gruppenarbeiten sind, wo möglich, erwünscht und je nach Rahmenbedingungen sogar von Vorteil. Study Guide CAS Big Data Frühlingssemester /20

16 3. Ergebnis und Bewertung Der Bericht ist in elektronischer Form als PDF-Dokument an den Betreuer und den CAS- Verantwortlichen zu schicken. Auf Verlangen des Betreuers ist zusätzlich eine gedruckte Version abzugeben. Bericht: ca Seiten, Source Code soweit notwendig für die Projektbeurteilung. Die Semesterarbeit wird nach folgender Richtlinie bewertet (Durch den Experten entsprechend dem Thema und dem Ablauf der Arbeit anpassbar). Nr. Kriterium Beschreibung Max. Punkte 1. Bericht 80 Punkte 2. Präsentationen 20 Punkte Genereller Eindruck Umfang, Vollständigkeit, Präsentation Komplexität, Stringenz Darstellung, Sprache verständlich, nachvollziehbar Stil, ohne Fachjargon Grammatik, Orthografie etc. Ziele, Ausgangslage, Aufgabenstellung klar und verständlich beurteilbare Ziele Methoden Aus der ersten Beschreibung wird das Problem nachvollziehbar analysiert und strukturiert. Die Methodenauswahl ist begründet und nachvollziehbar. Angemessene Literatur- und Quellenrecherche Ergebnisse Methodik korrekt und professionell angewendet Fundierter Vergleich Zielsetzung vs. Erreichtes Neue Erkenntnisse und eigene Beiträge Stringente Schlussfolgerungen Management Summary, Fazit Formal vollständig, nur Wichtiges ohne Nachschlagen verständlich Zeitmanagement Inhaltlich Roter Faden, logisches Vorgehen klare Begründungen für alle Entscheide Identifikation mit dem Thema Präsentationstechnik Eingehen auf Fragen 3. Total Study Guide CAS Big Data Frühlingssemester /20

17 9 Kompetenznachweise Für die Anrechnung der 12 ECTS-Punkte ist das erfolgreiche Bestehen der Kompetenznachweise (Prüfungen, Projektarbeiten) erforderlich, gemäss folgender Aufstellung: Kompetenznachweis Gewicht Art der Qualifikation Block 1 Nutzenaspekte, Betriebliche Bewertung. Hadoop Ecosystem, Datenbanken, NoSQL. Hardware, Architektur, Cloud. Textdokumente, sozialenetze und Open Data. Erfolgsquote Studierende 4 Schriftliche Prüfung % Block 2 Special Analytics, Statistics, Machine Learning, Visualisation 2 Schriftliche Prüfung % Semesterarbeit 4 Projektarbeit % Gesamterfolgsquote % Gesamtgewicht 10 ECTS Note A - F Jeder Studierende kann in einem Kompetenznachweis eine Erfolgsquote von 0 bis 100% erarbeiten. Die gewichtete Summe aus den Erfolgsquoten pro Thema und dem Gewicht des Themas ergibt eine Gesamterfolgsquote zwischen 0 und 100%. Die Gesamterfolgsquote wird in eine ECTS Note A bis E umgerechnet, gemäss Studienreglement. Weniger als 50% Gesamterfolgsquote ergibt eine ungenügende Note F. Study Guide CAS Big Data Frühlingssemester /20

18 10 Lehrmittel 10.1 Ergänzende Lehrmittel Ergänzende Lehrmittel sind Empfehlungen, um den Stoff zu vertiefen oder zu erweitern. Die Beschaffung liegt im Ermessen der Studierenden: Nr Titel Autoren Verlag Jahr ISBN Link zur Bestellung [1] Big Data Die Revolution, die unser Leben verändern wird Viktor Mayer- Schönberger Redline Verlag 2013 ISBN-10: [2] Hadoop: The Definitive Guide Tom White O' Reilly Press 2012 ISBN-10: [4] Event Processing in Action Peter Niblett, Opher Etzion Manning Press 2010 ISBN-10: [3] NoSQL Distilled Martin Fowler, Pramod J. Sadalage Addision Wesley 2012 ISBN-10: [5] Mining of Massive Datasets Jeffrey David Ullman, Anand Rajaraman Cambridge University Press 2011 Gratis herunterladen ISBN-10: [6] Taming Text Grant Ingersoll, Thomas Morton, Andrew Farris [7] Learning Spark Holden Karau, Andy Konwinski, Patrick Wendell, Matei Zaharia Manning Press 2013 ISBN-10: X O Reilly Media 2015 ISBN-10: [8] Hadoop Application Architecture [9] Big Data: Principles and best practices of scalable realtime data systems Mark Grover, Ted Malaska, Johnathan Seidman, Gwen Shapira Nathan Marz and James Warren O Reilly Media 2014 ISBN-10: Manning Press 2015 ISBN-10: [10] Storm Applied Sean T. Allen, Peter Pathirana, Matthew Jankowski Manning Press 2015 ISBN-10: [11] NoSQL for Mere Mortals Dan Sullivan Addison Wesley 2015 ISBN-10: Study Guide CAS Big Data Frühlingssemester /20

19 11 Dozierende Vorname Name Firma Heinz Steiner Trivadis AG Guido Schmutz Trivadis AG Daniel Steiger Trivadis AG Werner Dähler SECO Bern Jürgen Vogel BFH + Weitere Experten, Betreuer und Gastreferenten aus Unternehmen und Lehre 12 Organisation CAS-Leitung: Prof. Dr. Arno Schmidhauser Tel: CAS-Administration: Andrea Moser Tel: Termine Daten: KW bis KW Dienstag, von 08:30 Uhr bis 16:15 Uhr Study Guide CAS Big Data Frühlingssemester /20

20 Dokumenteninformation Study Guide CAS BGD FS Die Inhalte und Angaben in diesem Study Guide können sich bis zum Studienstart noch verändern. Berner Fachhochschule Technik und Informatik Weiterbildung Wankdorffeldstrasse 102 CH-3014 Bern Telefon ti.bfh.ch/weiterbildung ti.bfh.ch/cas-bgd Study Guide CAS Big Data Frühlingssemester /20

CAS Big Data Frühlingssemester 2014

CAS Big Data Frühlingssemester 2014 CAS Big Data Frühlingssemester 2014 1. Abstract 3 2. Umfeld und Motivation 3 3. Zielgruppe 5 4. Ausbildungsziele 5 5. Voraussetzungen 5 6. Kursübersicht 6 7. Kompetenzprofil 7 8. Organisation 7 9. Kursbeschreibungen

Mehr

CAS Software Architecture

CAS Software Architecture CAS Software Architecture Frühlingssemester 2015 Inhaltsverzeichnis 1 Abstract 3 2 Umfeld und Motivation 3 3 Zielgruppe 3 4 Ausbildungsziele 3 5 Voraussetzungen 4 6 Kursübersicht 4 7 Kompetenzprofil 5

Mehr

CAS Business Intelligence

CAS Business Intelligence CAS Business Intelligence Inhaltsverzeichnis 1 Abstract 3 2 Umfeld und Motivation 3 3 Zielgruppe 3 4 Ausbildungsziele 3 5 Voraussetzungen 4 6 Kursübersicht 4 7 Kompetenzprofil 5 8 Kursbeschreibungen 6

Mehr

CAS Betriebswirtschaft

CAS Betriebswirtschaft CAS Betriebswirtschaft Inhaltsverzeichnis 1 Abstract 3 2 Umfeld und Motivation 3 3 Zielgruppe 3 4 Ausbildungsziele 3 5 Voraussetzungen 3 6 Kursübersicht 4 7 Kompetenzprofil 5 8 Kursbeschreibungen 6 8.1

Mehr

CAS Networking & Security

CAS Networking & Security CAS Networking & Security Herbstsemester 2014 Inhaltsverzeichnis 1 Abstract 3 2 Umfeld und Motivation 3 3 Zielgruppe 3 4 Ausbildungsziele 3 5 Voraussetzungen 3 6 Kursübersicht 4 7 Kompetenzprofil 4 8 Organisation

Mehr

CAS Change Management

CAS Change Management CAS Change Management Inhaltsverzeichnis 1 Abstract 3 2 Umfeld und Motivation 3 3 Zielgruppe 3 4 Ausbildungsziele 3 5 Voraussetzungen 3 6 Kursübersicht 4 7 Kompetenzprofil 5 8 en 6 8.1 Change Management

Mehr

Big Data Informationen neu gelebt

Big Data Informationen neu gelebt Seminarunterlage Version: 1.01 Copyright Version 1.01 vom 21. Mai 2015 Dieses Dokument wird durch die veröffentlicht. Copyright. Alle Rechte vorbehalten. Alle Produkt- und Dienstleistungs-Bezeichnungen

Mehr

CAS Software Development

CAS Software Development CAS Software Development Herbstsemester 2014 Inhaltsverzeichnis 1 Abstract 3 2 Umfeld und Motivation 3 3 Zielgruppe 3 4 Ausbildungsziele 3 5 Voraussetzungen 3 6 Kursübersicht 3 7 Kompetenzprofil 4 8 Organisation

Mehr

CAS Networking & Security

CAS Networking & Security CAS Networking & Security Inhaltsverzeichnis 1 Abstract 3 2 Umfeld und Motivation 3 3 Zielgruppe 3 4 Ausbildungsziele 3 5 Voraussetzungen 3 6 Kursübersicht 4 7 Kompetenzprofil 4 8 Kursbeschreibungen 5

Mehr

CAS Enterprise Content Management

CAS Enterprise Content Management CAS Enterprise Content Management Inhaltsverzeichnis 1 Abstract 3 2 Umfeld und Motivation 3 3 Zielgruppe 4 4 Ausbildungsziele 4 5 Voraussetzungen 4 6 Kursübersicht 4 7 Kompetenzprofil 5 8 en 6 8.1 Knowledge

Mehr

CAS Enterprise Content Management

CAS Enterprise Content Management CAS Enterprise Content Management Herbstsemester 2014 Inhaltsverzeichnis 1 Abstract 3 2 Umfeld und Motivation 3 3 Zielgruppe 3 4 Ausbildungsziele 4 5 Voraussetzungen 4 6 Kursübersicht 4 7 Kompetenzprofil

Mehr

Big-Data-Technologien - Überblick - Prof. Dr. Jens Albrecht

Big-Data-Technologien - Überblick - Prof. Dr. Jens Albrecht Big-Data-Technologien - Überblick - Quelle: http://www.ingenieur.de/panorama/fussball-wm-in-brasilien/elektronischer-fussball-smartphone-app-helfen-training Big-Data-Anwendungen im Unternehmen Logistik

Mehr

Living Lab Big Data Konzeption einer Experimentierplattform

Living Lab Big Data Konzeption einer Experimentierplattform Living Lab Big Data Konzeption einer Experimentierplattform Dr. Michael May Berlin, 10.12.2012 Fraunhofer-Institut für Intelligente Analyseund Informationssysteme IAIS www.iais.fraunhofer.de Agenda n Ziele

Mehr

CAS Cloud Computing Frühlingssemester 2015

CAS Cloud Computing Frühlingssemester 2015 CAS Cloud Computing Frühlingssemester 2015 Inhaltsverzeichnis 1 Abstract 3 2 Umfeld und Motivation 3 3 Zielgruppe 4 4 Ausbildungsziele 4 5 Voraussetzungen 4 6 Kursübersicht 5 7 Kompetenzprofil 6 8 Kursbeschreibungen

Mehr

Big Data Plattformen für polystrukturierte Daten neue Chancen und Herausforderungen

Big Data Plattformen für polystrukturierte Daten neue Chancen und Herausforderungen Big Data Plattformen für polystrukturierte Daten neue Chancen und Herausforderungen Oracle DWH-Konferenz 21. März 2012 Dr. Carsten Bange Gründer & Geschäftsführer BARC Big Data bietet Methoden und Technologien

Mehr

Pavlo Baron. Big Data. für IT-Entscheider. Riesige Datenmengen. und moderne Technologien. gewinnbringend nutzen HANSER

Pavlo Baron. Big Data. für IT-Entscheider. Riesige Datenmengen. und moderne Technologien. gewinnbringend nutzen HANSER Pavlo Baron Big Data für IT-Entscheider Riesige Datenmengen und moderne Technologien gewinnbringend nutzen HANSER Inhalt Vorwort XI 1 Management Summary 1 2 Was? 7 2.1 Mein klassisches Business ist konkurrenzlos,

Mehr

Analyse von unstrukturierten Daten. Peter Jeitschko, Nikolaus Schemel Oracle Austria

Analyse von unstrukturierten Daten. Peter Jeitschko, Nikolaus Schemel Oracle Austria Analyse von unstrukturierten Daten Peter Jeitschko, Nikolaus Schemel Oracle Austria Evolution von Business Intelligence Manuelle Analyse Berichte Datenbanken (strukturiert) Manuelle Analyse Dashboards

Mehr

Institut für angewandte Informationstechnologie (InIT)

Institut für angewandte Informationstechnologie (InIT) School of Engineering Institut für angewandte Informationstechnologie (InIT) We ride the information wave Zürcher Fachhochschule www.init.zhaw.ch Forschung & Entwicklung Institut für angewandte Informationstechnologie

Mehr

Einführung in Hadoop

Einführung in Hadoop Einführung in Hadoop Inhalt / Lern-Ziele Übersicht: Basis-Architektur von Hadoop Einführung in HDFS Einführung in MapReduce Ausblick: Hadoop Ökosystem Optimierungen Versionen 10.02.2012 Prof. Dr. Christian

Mehr

In-Memory & Real-Time Hype vs. Realität: Maßgeschneiderte IBM Business Analytics Lösungen für SAP-Kunden

In-Memory & Real-Time Hype vs. Realität: Maßgeschneiderte IBM Business Analytics Lösungen für SAP-Kunden In-Memory & Real-Time Hype vs. Realität: Maßgeschneiderte IBM Business Analytics Lösungen für SAP-Kunden Jens Kaminski ERP Strategy Executive IBM Deutschland Ungebremstes Datenwachstum > 4,6 Millarden

Mehr

DATA WAREHOUSE. Big Data Alfred Schlaucher, Oracle

DATA WAREHOUSE. Big Data Alfred Schlaucher, Oracle DATA WAREHOUSE Big Data Alfred Schlaucher, Oracle Scale up Unternehmensdaten zusammenfassen Noch mehr Informationen aus Unternehmens- Daten ziehen! Datenmengen, Performance und Kosten Daten als Geschäftsmodell

Mehr

Von Big Data zu Executive Decision BI für den Fachanwender bis hin zu Advanced Analytics 10.45 11.15

Von Big Data zu Executive Decision BI für den Fachanwender bis hin zu Advanced Analytics 10.45 11.15 9.30 10.15 Kaffee & Registrierung 10.15 10.45 Begrüßung & aktuelle Entwicklungen bei QUNIS 10.45 11.15 11.15 11.45 Von Big Data zu Executive Decision BI für den Fachanwender bis hin zu Advanced Analytics

Mehr

Big Data in Marketing und IT

Big Data in Marketing und IT Big Data in Marketing und IT Chancen erkennen, Strategien entwickeln und Projekte erfolgreich umsetzen T-Systems Hacker Day 30. September 2015 Prof. Dr. Alexander Rossmann Reutlingen University Big Data

Mehr

Die Microsoft-Komplettlösung für Datawarehousing, Big Data und Business Intelligence im Überblick. Volker.Hinz@microsoft.com

Die Microsoft-Komplettlösung für Datawarehousing, Big Data und Business Intelligence im Überblick. Volker.Hinz@microsoft.com Die Microsoft-Komplettlösung für Datawarehousing, Big Data und Business Intelligence im Überblick Volker.Hinz@microsoft.com Was sagt der Markt? Fakten Meinung der Analysten zu Microsofts Angeboten Nutzen

Mehr

Das Zettabyte. CeBIT 2011. Dr. Wolfgang Martin Analyst, ibond Partner und Ventana Research Advisor

Das Zettabyte. CeBIT 2011. Dr. Wolfgang Martin Analyst, ibond Partner und Ventana Research Advisor Das Zettabyte CeBIT 2011 Dr. Wolfgang Martin Analyst, ibond Partner und Ventana Research Advisor Das Zetabyte: analytische Datenbanken Die Datenflut. Analytische Datenbanken: Was ist neu? Analytische Datenbanken:

Mehr

Big Data Hype und Wirklichkeit Bringtmehrauchmehr?

Big Data Hype und Wirklichkeit Bringtmehrauchmehr? Big Data Hype und Wirklichkeit Bringtmehrauchmehr? Günther Stürner, Vice President Sales Consulting 1 Copyright 2011, Oracle and/or its affiliates. All rights Überschrift 2 Copyright 2011, Oracle and/or

Mehr

2. Microsoft Innovationstag Nord Integrierte Lösungen in der Öffentlichen Verwaltung

2. Microsoft Innovationstag Nord Integrierte Lösungen in der Öffentlichen Verwaltung 2. Microsoft Innovationstag Nord Integrierte Lösungen in der Öffentlichen Verwaltung Reporting, Analyse und Data Mining André Henkel, initions AG 22. und 23. Oktober 2013 in Hamburg

Mehr

Proseminar - Data Mining

Proseminar - Data Mining Proseminar - Data Mining SCCS, Fakultät für Informatik Technische Universität München SS 2012, SS 2012 1 Data Mining Pipeline Planung Aufbereitung Modellbildung Auswertung Wir wollen nützliches Wissen

Mehr

Inhaltsverzeichnis. Study Guide CAS F 2/12

Inhaltsverzeichnis. Study Guide CAS F 2/12 CAS Führung Inhaltsverzeichnis 1 Abstract 3 2 Umfeld und Motivation 3 3 Zielgruppe 3 4 Ausbildungsziele 3 5 Voraussetzungen 4 6 Kursübersicht 4 7 Kompetenzprofil 5 8 en 6 8.1 Einführungsveranstaltung 6

Mehr

Proseminar - Data Mining

Proseminar - Data Mining Proseminar - Data Mining SCCS, Fakultät für Informatik Technische Universität München SS 2014, SS 2014 1 Data Mining: Beispiele (1) Hausnummererkennung (Klassifikation) Source: http://arxiv.org/abs/1312.6082,

Mehr

Lehrgebiet Informationssysteme

Lehrgebiet Informationssysteme Lehrgebiet AG Datenbanken und (Prof. Michel, Prof. Härder) AG Heterogene (Prof. Deßloch) http://wwwlgis.informatik.uni-kl.de/ Was sind? Computergestützte Programmsysteme, die Informationen erfassen, dauerhaft

Mehr

Prof. Dr.-Ing. Rainer Schmidt 1

Prof. Dr.-Ing. Rainer Schmidt 1 Prof. Dr.-Ing. Rainer Schmidt 1 Business Analytics und Big Data sind Thema vieler Veröffentlichungen. Big Data wird immer häufiger bei Google als Suchbegriff verwendet. Prof. Dr.-Ing. Rainer Schmidt 2

Mehr

Big Data Mythen und Fakten

Big Data Mythen und Fakten Big Data Mythen und Fakten Mario Meir-Huber Research Analyst, IDC Copyright IDC. Reproduction is forbidden unless authorized. All rights reserved. About me Research Analyst @ IDC Author verschiedener IT-Fachbücher

Mehr

SAP HANA eine Plattform für innovative Anwendungen

SAP HANA eine Plattform für innovative Anwendungen SAP HANA eine Plattform für innovative Anwendungen Top Intelligence: Big Data & SAP HANA Zürich, Frankfurt, Hamburg, München, Mülheim/R Februar 2014 Dr. Wolfgang Martin Analyst und Mitglied im Boulder

Mehr

Seminar WS 2012/13. S. Chaudhuri et al, CACM, Aug. 2011. Parallel DBS vs. Open Platforms for Big Data, e.g. HaDoop Near-Realtime OLAP

Seminar WS 2012/13. S. Chaudhuri et al, CACM, Aug. 2011. Parallel DBS vs. Open Platforms for Big Data, e.g. HaDoop Near-Realtime OLAP Seminar WS 2012/13 S. Chaudhuri et al, CACM, Aug. 2011 Parallel DBS vs. Open Platforms for Big Data, e.g. HaDoop Near-Realtime OLAP 2 Vorkonfigurierte, komplette Data Warehouse-Installation Mehrere Server,

Mehr

Text Mining Praktikum. Durchführung: Andreas Niekler Email: aniekler@informatik.uni-leipzig.de Zimmer: Paulinum (P) 818

Text Mining Praktikum. Durchführung: Andreas Niekler Email: aniekler@informatik.uni-leipzig.de Zimmer: Paulinum (P) 818 Text Mining Praktikum Durchführung: Andreas Niekler Email: aniekler@informatik.uni-leipzig.de Zimmer: Paulinum (P) 818 Rahmenbedingungen Gruppen von 2- (max)4 Personen Jede Gruppe erhält eine Aufgabe Die

Mehr

Seminar Wirtschaftsinformatik II B.Sc.

Seminar Wirtschaftsinformatik II B.Sc. Seminar Wirtschaftsinformatik II B.Sc. Prof. Dr. Harald Ritz Sommersemester 2011 Organisatorisches Bewertungsgrundlage Seminar Wirtschaftsinformatik II (B.Sc.) (2 SWS): Vortragsdauer: eine Person, 60 min

Mehr

Symbiose hybrider Architekturen im Zeitalter digitaler Transformation. Hannover, 18.03.2015

Symbiose hybrider Architekturen im Zeitalter digitaler Transformation. Hannover, 18.03.2015 Symbiose hybrider Architekturen im Zeitalter digitaler Transformation Hannover, 18.03.2015 Business Application Research Center (BARC) B (Analystengruppe Europas führendes IT-Analysten- und -Beratungshaus

Mehr

SQL on Hadoop für praktikables BI auf Big Data.! Hans-Peter Zorn und Dr. Dominik Benz, Inovex Gmbh

SQL on Hadoop für praktikables BI auf Big Data.! Hans-Peter Zorn und Dr. Dominik Benz, Inovex Gmbh SQL on Hadoop für praktikables BI auf Big Data! Hans-Peter Zorn und Dr. Dominik Benz, Inovex Gmbh War nicht BigData das gleiche NoSQL? 2 Wie viele SQL Lösungen für Hadoop gibt es mittlerweile? 3 ! No SQL!?

Mehr

Big Data in Azure. Ein Beispiel mit HD Insight. Ralf Stemmer

Big Data in Azure. Ein Beispiel mit HD Insight. Ralf Stemmer Big in Azure Ein Beispiel mit HD Insight Ralf Stemmer Agenda owas ist Big? Was ist HD Insight? owelche Probleme kann man damit lösen? odemo Was ist Big? Was ist HD Insight? Datenexplosion - Rasanter Zuwachs

Mehr

Clouds. Erwartungen der Nutzer. Wolkig bis Heiter. (c) 2013, Peter Sturm, Universität Trier. Er ist verwöhnt! Er ist nicht dankbar!

Clouds. Erwartungen der Nutzer. Wolkig bis Heiter. (c) 2013, Peter Sturm, Universität Trier. Er ist verwöhnt! Er ist nicht dankbar! Clouds Wolkig bis Heiter Erwartungen der Nutzer Er ist verwöhnt! Verfügbarkeit Viele Anwendungen Intuitive Interfaces Hohe Leistung Er ist nicht dankbar! Mehr! Mehr! Mehr! Moore 1 Erwartungen der Entwickler

Mehr

Big Data: Nutzen und Anwendungsszenarien. CeBIT 2014 Dr. Carsten Bange, Gründer und Geschäftsführer BARC

Big Data: Nutzen und Anwendungsszenarien. CeBIT 2014 Dr. Carsten Bange, Gründer und Geschäftsführer BARC Big Data: Nutzen und Anwendungsszenarien CeBIT 2014 Dr. Carsten Bange, Gründer und Geschäftsführer BARC Big Data steht für den unaufhaltsamen Trend, dass immer mehr Daten in Unternehmen anfallen und von

Mehr

Big Data: Definition, Einführung und Live Democase [C1] Arne Weitzel Uetliberg, 16.09.2014 www.boak.ch

Big Data: Definition, Einführung und Live Democase [C1] Arne Weitzel Uetliberg, 16.09.2014 www.boak.ch Big Data: Definition, Einführung und Live Democase [C1] Arne Weitzel Uetliberg, 16.09.2014 www.boak.ch Unstrukturierte Daten spielen eine immer bedeutender Rolle in Big Data-Projekten. Zunächst gilt es

Mehr

Big Data. Prof. Robert Jäschke Forschungszentrum L3S Leibniz Universität Hannover

Big Data. Prof. Robert Jäschke Forschungszentrum L3S Leibniz Universität Hannover Big Data Prof. Robert Jäschke Forschungszentrum L3S Leibniz Universität Hannover Agenda Was ist Big Data? Parallele Programmierung Map/Reduce Der Big Data Zoo 2 3Vs oder: Was ist Big Data? Deutsche Telekom:

Mehr

Big Data Herausforderungen und Chancen für Controller. ICV Jahrestagung, 19.05.2014 Dr. Carsten Bange, Gründer und Geschäftsführer BARC

Big Data Herausforderungen und Chancen für Controller. ICV Jahrestagung, 19.05.2014 Dr. Carsten Bange, Gründer und Geschäftsführer BARC Big Data Herausforderungen und Chancen für Controller ICV Jahrestagung, 19.05.2014 Dr. Carsten Bange, Gründer und Geschäftsführer BARC BARC: Expertise für datengetriebene Organisationen Beratung Strategie

Mehr

Möglichkeiten für bestehende Systeme

Möglichkeiten für bestehende Systeme Möglichkeiten für bestehende Systeme Marko Filler Bitterfeld, 27.08.2015 2015 GISA GmbH Leipziger Chaussee 191 a 06112 Halle (Saale) www.gisa.de Agenda Gegenüberstellung Data Warehouse Big Data Einsatz-

Mehr

Prüfungsberatungs-Stunde Datenbanksysteme 1 (Dbs1)

Prüfungsberatungs-Stunde Datenbanksysteme 1 (Dbs1) Prüfungsberatungs-Stunde Datenbanksysteme 1 (Dbs1) Herbstsemester 2013/14 Prof. S. Keller Informatik HSR Januar 2014, HS13/14 Dbs1 - Prüfungsvorbereitung 1 Dbs1 Ziele Grundlagenwissen in folgenden Gebieten

Mehr

W.WIINM32.11 (Datawarehousing) W.WIMAT03.13 (Statistik)

W.WIINM32.11 (Datawarehousing) W.WIMAT03.13 (Statistik) Modulbeschrieb Business Intelligence and Analytics 16.10.2013 Seite 1/5 Modulcode Leitidee Art der Ausbildung Studiengang Modultyp W.WIINM42.13 Information ist eine derart wichtige Komponente bei der Entscheidungsfindung,

Mehr

#Big Data in #Austria

#Big Data in #Austria Mario Meir-Huber und Martin Köhler #Big Data in #Austria Big Data Herausforderungen und Potenziale 23.6.2014 Vorstellung Studie Studie #BigData in #Austria Start: 1.11.2013 30.04.2014 Projektpartner: IDC

Mehr

Configuration Management mit Verbosy 17.04.2013 OSDC 2013. Eric Lippmann www.netways.de

Configuration Management mit Verbosy 17.04.2013 OSDC 2013. Eric Lippmann www.netways.de Configuration Management mit Verbosy 17.04.2013 OSDC 2013 Eric Lippmann Kurzvorstellung NETWAYS Expertise OPEN SOURCE SYSTEMS MANAGEMENT OPEN SOURCE DATA CENTER Monitoring & Reporting Configuration Management

Mehr

Step 0: Bestehende Analyse-Plattform

Step 0: Bestehende Analyse-Plattform Die Themen 09:30-09:45 Einführung in das Thema (Oracle) 09:45-10:15 Hadoop in a Nutshell (metafinanz) 10:15-10:45 Hadoop Ecosystem (metafinanz) 10:45-11:00 Pause 11:00-11:30 BigData Architektur-Szenarien

Mehr

Big Data - Datenquellen und Anwendungen

Big Data - Datenquellen und Anwendungen Big Data - Datenquellen und Anwendungen AW1 Präsentation Gerrit Thede Fakultät Technik und Informatik Department Informatik HAW Hamburg 18. November 2013 Outline 1 Einleitung 2 Datenquellen 3 Data Science

Mehr

Forschunsprojekte und Independent Coursework. Prof. Dr. Christian Herta 29. Januar 2013

Forschunsprojekte und Independent Coursework. Prof. Dr. Christian Herta 29. Januar 2013 Forschunsprojekte und Independent Coursework Prof. Dr. Christian Herta 29. Januar 2013 Forschungsgebiete Suchtechnologie, Text- und Webmining Verarbeitung unstrukturierter Daten, insbesondere Text Large

Mehr

Software EMEA Performance Tour 2013. 17.-19 Juni, Berlin

Software EMEA Performance Tour 2013. 17.-19 Juni, Berlin Software EMEA Performance Tour 2013 17.-19 Juni, Berlin Accenture s High Performance Analytics Demo-Umgebung Dr, Holger Muster (Accenture), 18. Juni 2013 Copyright 2012 Hewlett-Packard Development Company,

Mehr

QUICK-START EVALUIERUNG

QUICK-START EVALUIERUNG Pentaho 30 für 30 Webinar QUICK-START EVALUIERUNG Ressourcen & Tipps Leo Cardinaals Sales Engineer 1 Mit Pentaho Business Analytics haben Sie eine moderne und umfassende Plattform für Datenintegration

Mehr

Big Data Vom Hype zum Geschäftsnutzen

Big Data Vom Hype zum Geschäftsnutzen Big Data Vom Hype zum Geschäftsnutzen IBM IM Forum, Berlin, 16.04.2013 Dr. Carsten Bange, Gründer und Geschäftsführer BARC Hype 15.04.2013 BARC 2013 2 1 Interesse an Big Data Nature 09-2008 Economist 03-2010

Mehr

Review Freelancer-Workshop: Fit für Big Data. Mittwoch, 29.04.2015 in Hamburg

Review Freelancer-Workshop: Fit für Big Data. Mittwoch, 29.04.2015 in Hamburg Review Freelancer-Workshop: Fit für Big Data Mittwoch, 29.04.2015 in Hamburg Am Mittwoch, den 29.04.2015, hatten wir von productive-data in Zusammenarbeit mit unserem langjährigen Partner Informatica zu

Mehr

DIE ZUKUNFT WARTET NICHT. ANALYSIERE SIE.

DIE ZUKUNFT WARTET NICHT. ANALYSIERE SIE. INFORMATION SCIENCE & BIG DATA ANALYTICS * MASTER OF SCIENCE (MSc ) FLORIAN KALCHER, NDU Student DIE ZUKUNFT WARTET NICHT. ANALYSIERE SIE. *in Akkreditierung DAS DATENUNIVERSUM MEISTERN In der digitalen

Mehr

Digitalisierung wie aus einer Strategie Realität wird.

Digitalisierung wie aus einer Strategie Realität wird. Digitalisierung wie aus einer Strategie Realität wird. Information Builders International Summit Frankfurt, 10.06.2015 Dr. Carsten Bange, Business Application Research Center (BARC) Knüpfen wir dort an,

Mehr

on Azure mit HDInsight & Script Ac2ons

on Azure mit HDInsight & Script Ac2ons Willkommen beim #GAB 2015! on Azure mit HDInsight & Script Ac2ons Lokale Sponsoren: HansPeter Grahsl Netconomy Entwickler & Berater FH CAMPUS 02 Twi9er: @hpgrahsl Überblick Inhalte Was ist HDInsight? Wozu

Mehr

Modulbeschreibung Fakultät Gebäudetechnik und Informatik gültig ab WS 2010/11

Modulbeschreibung Fakultät Gebäudetechnik und Informatik gültig ab WS 2010/11 Modul-Nr.: Studiengang: Angewandte Informatik Modulname: Datenbanken (DB) : Datenbanken 1 (DB1) Datenbanken 2 (DB2) Status: Pflicht alle Niveaustufe: Bachelor Verantwortliche/r: Empfohlenes Semester: DB1

Mehr

Was ist Analyse? Hannover, CeBIT 2014 Patrick Keller

Was ist Analyse? Hannover, CeBIT 2014 Patrick Keller Was ist? Hannover, CeBIT 2014 Patrick Keller Business Application Research Center Historie 1994: Beginn der Untersuchung von Business-Intelligence-Software am Lehrstuhl Wirtschaftsinformatik der Universität

Mehr

Textanalyse mit UIMA und Hadoop.!! Hans-Peter Zorn data2day, Karlsruhe, 27.11.2014

Textanalyse mit UIMA und Hadoop.!! Hans-Peter Zorn data2day, Karlsruhe, 27.11.2014 Textanalyse mit UIMA und Hadoop Hans-Peter Zorn data2day, Karlsruhe, 27.11.2014 Über mich seit 2014: Big Data Scientist @ Inovex 2011-2013: TU Darmstadt, UKP Lab Etablierung der Hadoop-Infrastruktur Unterstützung

Mehr

Analyse von strukturierten und unstrukturierten Daten in Analytischen Informationssystemen SE 2014 Doctoral Symposium

Analyse von strukturierten und unstrukturierten Daten in Analytischen Informationssystemen SE 2014 Doctoral Symposium Analyse von strukturierten und unstrukturierten Daten in Analytischen Informationssystemen SE 2014 Doctoral Symposium Mirco Josefiok 26.02.2014 2 Anwendungsfall Versorgungsforschung Versorgungsforschung

Mehr

Prozessoptimierung in der Markt- und Medienforschung bei der Deutschen Welle (DW) mit Big Data Technologien. Berlin, Mai 2013

Prozessoptimierung in der Markt- und Medienforschung bei der Deutschen Welle (DW) mit Big Data Technologien. Berlin, Mai 2013 Prozessoptimierung in der Markt- und Medienforschung bei der Deutschen Welle (DW) mit Big Data Technologien Berlin, Mai 2013 The unbelievable Machine Company? 06.05.13 The unbelievable Machine Company

Mehr

Fakultät. Modulkoordinator Frank Termer. Modul-Name Wirtschaftsinformatik Modul-Nr : 51012

Fakultät. Modulkoordinator Frank Termer. Modul-Name Wirtschaftsinformatik Modul-Nr : 51012 Fakultät Wirtschaftswissenschaften Studiengang Betriebswirtschaft f. kleine u. mitt. Unternehmen Modulbeschreibung Modulkoordinator Frank Termer Modul-Name Wirtschaftsinformatik Modul-Nr : 51012 CP SWS

Mehr

B1 - Big Data Science: Tornado oder laues Lüftchen? Uetliberg, 15.09.2015 www.boak.ch

B1 - Big Data Science: Tornado oder laues Lüftchen? Uetliberg, 15.09.2015 www.boak.ch B1 - Big Data Science: Tornado oder laues Lüftchen? Uetliberg, 15.09.2015 www.boak.ch WANN REDEN WIR VON BIG DATA SCIENCE? Big Data ist der technische Teil von Big Data Science. Mehr Daten! Mehr Datenquellen(-änderungen)!

Mehr

Data. Guido Oswald Solution Architect @SAS Switzerland. make connections share ideas be inspired

Data. Guido Oswald Solution Architect @SAS Switzerland. make connections share ideas be inspired make connections share ideas be inspired Data Guido Oswald Solution Architect @SAS Switzerland BIG Data.. Wer? BIG Data.. Wer? Wikipedia sagt: Als Big Data werden besonders große Datenmengen bezeichnet,

Mehr

Etablierung serviceorientierter Architekturen mit Web Services

Etablierung serviceorientierter Architekturen mit Web Services Etablierung serviceorientierter Architekturen mit Web Services Vorlesung im (Übersicht zu den Inhalten der Vorlesung) Somemrsemester 2013 1 Ziele und Abgrenzung 2 Allgemeine Lernziele Vermittlung von Basiskenntnissen

Mehr

Business Intelligence Architektur im Umfeld von Big Data (IDAREF) [D2] Bernd Meister Uetliberg, 16.09.2014 www.boak.ch

Business Intelligence Architektur im Umfeld von Big Data (IDAREF) [D2] Bernd Meister Uetliberg, 16.09.2014 www.boak.ch Business Intelligence Architektur im Umfeld von Big Data (IDAREF) [D2] Bernd Meister Uetliberg, 16.09.2014 www.boak.ch In dieser Session wird IDAREF, ein Framework, dass auf logischer Ebene eine analytische

Mehr

Spezialisierung Business Intelligence

Spezialisierung Business Intelligence Spezialisierung Business Intelligence Peter Becker Fachbereich Informatik Hochschule Bonn-Rhein-Sieg peter.becker@h-brs.de 10. Juni 2015 Was ist Business Intelligence? Allgemein umfasst der Begriff Business

Mehr

The integration of business intelligence and knowledge management

The integration of business intelligence and knowledge management The integration of business intelligence and knowledge management Seminar: Business Intelligence Ketevan Karbelashvili Master IE, 3. Semester Universität Konstanz Inhalt Knowledge Management Business intelligence

Mehr

Inhaltsverzeichnis. Pavlo Baron. Big Data für IT-Entscheider. Riesige Datenmengen und moderne Technologien gewinnbringend nutzen

Inhaltsverzeichnis. Pavlo Baron. Big Data für IT-Entscheider. Riesige Datenmengen und moderne Technologien gewinnbringend nutzen Inhaltsverzeichnis Pavlo Baron Big Data für IT-Entscheider Riesige Datenmengen und moderne Technologien gewinnbringend nutzen ISBN (Buch): 978-3-446-43339-7 ISBN (E-Book): 978-3-446-43392-2 Weitere Informationen

Mehr

Foto: violetkaipa - Fotolia

Foto: violetkaipa - Fotolia Die D kön Foto: violetkaipa - Fotolia 10 IT-Trend Big Data atenflut steigt wie nen wir sie nutzen? Ständig erhöht sich die Masse der uns umgebenden Daten, Informationen werden immer schneller generiert.

Mehr

Bachelor/Master-Thesis (für den Standort Stuttgart) Treiberbasierte Planung

Bachelor/Master-Thesis (für den Standort Stuttgart) Treiberbasierte Planung Bachelor/Master-Thesis (für den Standort Stuttgart) Treiberbasierte Planung Hochschulstudium (Wirtschaftsinformatik oder ein vergleichbarer Studiengang) Fachliche und technische Kenntnisse im Bereich Business

Mehr

Prozess- und Datenmanagement Kein Prozess ohne Daten

Prozess- und Datenmanagement Kein Prozess ohne Daten Prozess- und Datenmanagement Kein Prozess ohne Daten Frankfurt, Juni 2013 Dr. Wolfgang Martin Analyst und Mitglied im Boulder BI Brain Trust Prozess- und Datenmanagement Erfolgreiche Unternehmen sind Prozessorientiert.

Mehr

Modultabelle. Masterstudiengänge Wirtschaftsinformatik (90 ECTS-Punkte und 120 ECTS-Punkte) Fakultät Wirtschaftsinformatik und Angewandte Informatik

Modultabelle. Masterstudiengänge Wirtschaftsinformatik (90 ECTS-Punkte und 120 ECTS-Punkte) Fakultät Wirtschaftsinformatik und Angewandte Informatik Otto-Friedrich-Universität Bamberg Modultabelle Masterstudiengänge Wirtschaftsinformatik (90 ECTS-Punkte und 120 ECTS-Punkte) Fakultät Wirtschaftsinformatik und Angewandte Informatik Stand: Wintersemester

Mehr

DduP - Towards a Deduplication Framework utilising Apache Spark

DduP - Towards a Deduplication Framework utilising Apache Spark - Towards a Deduplication Framework utilising Apache Spark utilising Apache Spark Universität Hamburg, Fachbereich Informatik Gliederung 1 Duplikaterkennung 2 Apache Spark 3 - Interactive Big Data Deduplication

Mehr

Prognosen via Datenanalyse Predictive Analytics: Darauf müssen Unternehmen achten

Prognosen via Datenanalyse Predictive Analytics: Darauf müssen Unternehmen achten Prognosen via Datenanalyse Predictive Analytics: Darauf müssen Unternehmen achten von Jürgen Mauerer Foto: Avantum Consult AG Seite 1 von 21 Inhalt Mehrwert aufzeigen nach Analyse des Geschäftsmodells...

Mehr

Gerrit Thede. Big Data - Datenquellen und Anwendungen Ausarbeitung Grundlagen Vertiefung und Anwendungen 1

Gerrit Thede. Big Data - Datenquellen und Anwendungen Ausarbeitung Grundlagen Vertiefung und Anwendungen 1 Gerrit Thede Big Data - Datenquellen und Anwendungen Ausarbeitung Grundlagen Vertiefung und Anwendungen 1 Fakultät Technik und Informatik Studiendepartment Informatik Faculty of Engineering and Computer

Mehr

Exploration und Klassifikation von BigData

Exploration und Klassifikation von BigData Exploration und Klassifikation von BigData Inhalt Einführung Daten Data Mining: Vorbereitungen Clustering Konvexe Hülle Fragen Google: Riesige Datenmengen (2009: Prozessieren von 24 Petabytes pro Tag)

Mehr

Fachgruppe Statistik, Risikoanalyse & Computing. STAT672 Data Mining. Sommersemester 2007. Prof. Dr. R. D. Reiß

Fachgruppe Statistik, Risikoanalyse & Computing. STAT672 Data Mining. Sommersemester 2007. Prof. Dr. R. D. Reiß Fachgruppe Statistik, Risikoanalyse & Computing STAT672 Data Mining Sommersemester 2007 Prof. Dr. R. D. Reiß Überblick Data Mining Begrifflichkeit Unter Data Mining versteht man die Computergestützte Suche

Mehr

Intelligent Traveller Early Situation Awareness itesa

Intelligent Traveller Early Situation Awareness itesa Intelligent Traveller Early Situation Awareness itesa Dr. Martin Skorsky, Senior Researcher 22. Juni 2015 1 1 Intelligent Traveller Early Situation Awareness Automatischen Alarmsystems, das Reisende in

Mehr

Im Einzelnen werden folgende Kenntnisse, Fertigkeiten und Kompetenzen erworben.

Im Einzelnen werden folgende Kenntnisse, Fertigkeiten und Kompetenzen erworben. Modulbeschreibung Code VI.8.1 Modulbezeichnung Wirtschaftsinformatik Beitrag des Moduls zu den Studienzielen Qualifikationsziele (vgl. Leitfaden Punkt 3) Die Studierenden kennen die Konzepte bei der Erstellung

Mehr

Kann man Big Data managen?

Kann man Big Data managen? Kann man Big Data managen? Information Governance in Retail-Unternhmen Uwe Nadler Senior Managing Consultant Big Data Architect Sales Leader Information Governance D-A-CH Themen Die Bedeutung von Information

Mehr

Pentaho Business Analytics Datenintegration > Auswertung > Prognose

Pentaho Business Analytics Datenintegration > Auswertung > Prognose Pentaho Business Analytics Datenintegration > Auswertung > Prognose Pentaho verbindet Datenintegration und BI-Analysen in einer Plattform und ermöglicht es damit sowohl IT- als auch Geschäftsanwendern,

Mehr

EMC. Data Lake Foundation

EMC. Data Lake Foundation EMC Data Lake Foundation 180 Wachstum unstrukturierter Daten 75% 78% 80% 71 EB 106 EB 133 EB Weltweit gelieferte Gesamtkapazität Unstrukturierte Daten Quelle März 2014, IDC Structured vs. Unstructured

Mehr

TRACK II Datenmanagement Strategien & Big Data Speicherkonzepte. TRACK I Big Data Analytics & Self Service BI

TRACK II Datenmanagement Strategien & Big Data Speicherkonzepte. TRACK I Big Data Analytics & Self Service BI 9.30 10.15 Kaffee & Registrierung 10.15 10.45 Begrüßung & aktuelle Entwicklungen bei QUNIS 10.45 11.15 11.15 11.45 Von Big Data zu Executive Decision BI für den Fachanwender bis hin zu Advanced Analytics

Mehr

Software EMEA Performance Tour 2013. 17.-19 Juni, Berlin

Software EMEA Performance Tour 2013. 17.-19 Juni, Berlin Software EMEA Performance Tour 2013 17.-19 Juni, Berlin HP Autonomy Information Governance Strategie: Die Kontrolle über die Informationsflut Petra Berneaud - Account Manager Autonomy Status in vielen

Mehr

Analytische Datenbanken und Appliances als Engine für erfolgreiche Business Intelligence

Analytische Datenbanken und Appliances als Engine für erfolgreiche Business Intelligence Analytische Datenbanken und Appliances als Engine für erfolgreiche Business Intelligence IBM Netezza Roadshow 30. November 2011 Carsten Bange Gründer & Geschäftsführer BARC Die Krise hat die Anforderungen

Mehr

Algorithmische Methoden zur Netzwerkanalyse Vorlesung für den Bereich Master Informatik

Algorithmische Methoden zur Netzwerkanalyse Vorlesung für den Bereich Master Informatik Algorithmische Methoden zur Netzwerkanalyse Vorlesung für den Bereich Master Informatik Dozent: Juniorprof. Dr. Henning Meyerhenke PARALLELES RECHNEN INSTITUT FÜR THEORETISCHE INFORMATIK, FAKULTÄT FÜR

Mehr

Liste V Enterprise JavaBeans

Liste V Enterprise JavaBeans Liste V Enterprise JavaBeans Fachhochschule Wiesbaden, FB Design Informatik Medien Studiengang Allgemeine Informatik Vorlesung zur Vertiefungslehrveranstaltung Spezielle Methoden der Softwaretechnik SS

Mehr

vinsight BIG DATA Solution

vinsight BIG DATA Solution vinsight BIG DATA Solution München, November 2014 BIG DATA LÖSUNG VINSIGHT Datensilos erschweren eine einheitliche Sicht auf die Daten...... und machen diese teilweise unmöglich einzelne individuelle Konnektoren,

Mehr

Operational Intelligence

Operational Intelligence Operational Intelligence Eric Müller Wenn Sie diesen Text lesen können, müssen Sie die Folie im Post-Menü mit der Funktion «Folie einfügen» erneut einfügen. Sonst kann kein Bild hinter die Fläche gelegt

Mehr

Inhaltsverzeichnis. Daniel Liebhart, Guido Schmutz, Marcel Lattmann, Markus Heinisch, Michael Könings, Mischa Kölliker, Perry Pakull, Peter Welkenbach

Inhaltsverzeichnis. Daniel Liebhart, Guido Schmutz, Marcel Lattmann, Markus Heinisch, Michael Könings, Mischa Kölliker, Perry Pakull, Peter Welkenbach sverzeichnis Daniel Liebhart, Guido Schmutz, Marcel Lattmann, Markus Heinisch, Michael Könings, Mischa Kölliker, Perry Pakull, Peter Welkenbach Integration Architecture Blueprint Leitfaden zur Konstruktion

Mehr

Digitale Transformation: BI und Big Data treiben neue Geschäftsmodelle. CeBIT, 18.3.2015 Dr. Carsten Bange, Gründer und Geschäftsführer BARC

Digitale Transformation: BI und Big Data treiben neue Geschäftsmodelle. CeBIT, 18.3.2015 Dr. Carsten Bange, Gründer und Geschäftsführer BARC Digitale Transformation: BI und Big Data treiben neue Geschäftsmodelle CeBIT, 18.3.2015 Dr. Carsten Bange, Gründer und Geschäftsführer BARC BARC: Expertise für datengetriebene Unternehmen Beratung Strategie

Mehr

Social Media trifft Business

Social Media trifft Business Social Media trifft Business Intelligence Social Media Analysis als Teil der Unternehmenssteuerung Tiemo Winterkamp, VP Global Marketing Agenda Social Media trifft Business Intelligence Business Intelligence

Mehr