CAS Business Intelligence
Inhaltsverzeichnis 1 Abstract 3 2 Umfeld und Motivation 3 3 Zielgruppe 3 4 Ausbildungsziele 3 5 Voraussetzungen 4 6 Kursübersicht 4 7 Kompetenzprofil 5 8 Kursbeschreibungen 6 8.1 Data Warehouses 6 8.2 Big Data 7 8.3 Microsoft BI Plattform 7 8.4 Open Source Business Intelligence und Datenintegration 8 8.5 Intelligent Data Analysis 8 8.6 BI-Projekt / Semesterarbeit 9 9 Kompetenznachweise 10 10 Ergänzende Lehrmittel 11 11 Dozierende 11 12 Organisation 11 13 Termine 12 Study Guide CAS BI 2/12
1 Abstract Business Intelligence heisst, Entscheide auf bestmöglicher Datengrundlage in Ihrem Unternehmen zu fällen. Ein Data Warehouse, unterstützt mit Analyse- und Prognose-Werkzeugen, stellt die IT-mässige Grundlage dafür bereit. In diesem CAS erarbeiten Sie Methoden und Werkzeuge, um erfolgreiche BI- Projekte durchzuführen, ein DWH in Ihrer Firma aufzubauen und zu pflegen, und geeignete Analyse- Tools bereitzustellen. 2 Umfeld und Motivation Heutige IT-Systeme erfassen riesige Mengen von Daten für die Abwicklung von Prozessen, beispielsweise in der Logistik, im CRM, im Marketing, im Qualitätsmanagement, in Verkauf, sowie in Überwachungs- und Steuerungssystemen. Eine systematische Datenanalyse schafft die entscheidenden Geschäfts- und Qualitätsvorteile. Muster erkennen, Zusammenhänge finden und Kundenbedürfnisse punktgenau ermitteln sind zentrale IT-Herausforderungen. In der weltweiten Innovations-Initiative a smarter planet von IBM ist Business Intelligence ein zentrales Thema des Jahrzehnts. Big Data, für die Analyse riesiger Ströme strukturierter und unstrukturierter Daten, ist ebenfalls von herausragender Bedeutung im BI-Umfeld. 3 Zielgruppe Dieser Lehrgang richtet sich an IT-Mitarbeitende, die für die Pflege, die Weiterentwicklung oder den Aufbau von BI-Informationssystemen verantwortlich sind. 4 Ausbildungsziele Die Teilnehmenden können als Fach- und Projektverantwortliche Informationssysteme aufbauen, pflegen und Projektleitungen übernehmen. Dieser Lehrgang kann alleinstehend oder als Teil des modularen Programmes Master of Advanced Studies in Information Technology und des Master of Advanced Studies in Data Science der Berner Fachhochschule besucht werden. Study Guide CAS BI 3/12
5 Voraussetzungen Erfahrung im Bereich Datenbanken (Datenmodellierung, Abfragen, Administration, SQL, Indexierung). Allgemeines Informatikwissen (Architektur von IT-Systemen, Algorithmen und Datentypen, Arbeiten mit einer Programmier- oder Skriptsprache, Netzwerke, UML). Laptop mit Admin-Rechten für die praktischen Übungen. Diese werden vorwiegend mit Images von Virtual Box durchgeführt (www.virtualbox.org). Für die Semesterarbeit bringen die Teilnehmenden ein eigenes Thema mit, typischerweise aus dem beruflichen Umfeld. Gruppenarbeiten sind möglich und wünschenswert. Eine Unterstützung durch die Firma, sowie selbstständiges Arbeiten und Problemlösung ist für die Semesterarbeit erforderlich. Details zu den allgemeinen Zulassungsbedingungen finden Sie auf unserer Webseite. 6 Kursübersicht Kurs/Lehreinheit Lektionen Stunden Data Warehouses 96 Big Data 16 Spezialthemen MS BI Stack 8 Spezialthemen Open Source BI 8 Intelligent Data Analysis 40 Semesterarbeit 90 Total 168 90 Das CAS umfasst insgesamt 12 ECTS Punkte. Für die einzelnen Kurse ist entsprechend Zeit für Selbststudium, Prüfungsvorbereitung etc. einzurechnen. Study Guide CAS BI 4/12
7 Kompetenzprofil Legende: 1. Kenntnisse von Begriffen, Definitionen und Regeln; Faktenwissen 2. Verstehen von Zusammenhängen, Erklären von Sachverhalte erklären können 3. Anwendung des Wissens in einfachen Situationen 4. Analyse der eigenen Lösung 5. Synthese neuer Lösungen und Anwendung in komplexen Situationen 6. Beurteilung der Anwendbarkeit für bestimmte Probleme und Situationen, methodische Abwägung und Evaluation von Alternativen, Beziehungen zu anderen Fachgebieten Study Guide CAS BI 5/12
8 Kursbeschreibungen Nachfolgend sind die Inhalte der einzelnen Kurse und Lehreinheiten beschrieben. Änderungen sind bis zu Beginn des Lehrgangs möglich. Angaben zu Terminen und Kompetenznachweisen sind ab Studienbeginn verbindlich. 8.1 Data Warehouses Ein Datawarehouse stellt aufbereitete Daten aus unterschiedlichen Quellen für die betriebliche, strategische und kundenbezogene Entscheidungsfindung bereit. Im Gegensatz zu transaktionsorientierten Systemen ist es meist zeitbezogen, integriert also Daten aus unterschiedlichen Zeitabschnitten. Data Warehouses müssen heute in immer kürzeren Zyklen aktualisiert werden und eine zunehmend flexiblere und vollständige Informationsaufbereitung anbieten, was hohe Anforderungen an Modellierung, Technologie und Betrieb stellt. Kursbeschreibung Lernziele Fundierte Einführung in den Aufbau, die Technologie und den Entwurf von Data- Warehouses. Die Teilnehmenden können in Warehouse-Projekten auf Analyse- und Entwurfsebene verantwortlich mitarbeiten. Themen Definition und Einordnung in die IT-Unternehmensstrategie DWH Referenz-Architektur OLTP, OLAP, DWH Multi-dimensionale Datenmodellierung, Datenwürfel (Cubes) Dimensionale Modellierung mit ADAPT Relationale und Multidimensionale Speicherung (ROLAP, MOLAP) ETL-Prozess (Extract-Transform-Load) Metadaten Umgang mit grossen Datenmengen, Optimierung, Column Stores, In Memory Architektur. Data Quality Management, Data Cleansing / Data Profiling, Betrieb, Scheduling. Data Lineage, Impact Analyse, Testing, Metadaten. DWH-Projekte (Nutzen, Ablauf, Requirements, QS) Betrieb eines DWH (Management, Betrieblich, Technisch) Projektmanagement, Release Management, Change Management Lehrmittel Skript, das alle wesentlichen Lerninhalte umfasst Literaturempfehlungen: "Data Warehouse Systeme. Architektur, Entwicklung, Anwendung" (siehe [1]) "The Data Warehouse Lifecycle Toolkit" (siehe [2]) Study Guide CAS BI 6/12
8.2 Big Data Grosse Datenmengen in Echtzeit analysieren und nutzbar machen? Big Data ist eine der wichtigsten IT- Technologien des Jahrzehnts. Im Fokus stehen möglichst präzise und rasche Vorhersagen für Geschäftsentscheide, das Auffinden kritischer Ereignisse und Muster oder das Auffinden komplexer Zusammenhänge durch Auswertung eigener und globaler Datenquellen. Kursbeschreibung Lernziele Die Teilnehmenden erhalten eine Einführung in Definition, Denkweise, Technologie und Anwendungsmöglichkeit von Big Data, und den Zusammenhang mit Business Intelligence und Data Warehouses. Themen Was ist Big Data Technologie-Grundlage und Enabling Technologies: Hadoop, Map Reduce, NoSQL, In Memory) Anwendungsszenarien im BI Umfeld Lehrmittel Skript, das alle wesentlichen Lerninhalte umfasst ebooks 8.3 Microsoft BI Plattform Basierend auf bekannten Technologien wie SQL Server, SharePoint und Office bietet Microsoft eine Plattform zur Realisierung von Business Intelligence Lösungen. Die enge Integration der Komponenten und die Arbeit mit bekannten Werkzeugen sollen die schnelle Umsetzung und Einführung von solchen Lösungen begünstigen. Kursbeschreibung Lernziele Die Teilnehmenden erhalten einen Überblick zur Business Intelligence Plattform von Microsoft. Anhand praktischer Demonstrationen und der Präsentation eines konkreten Projektes lernen sie die Möglichkeiten der Plattform kennen. Themen Überblick Microsoft Business Intelligence Plattform SQL Server (Database Engine, Integration Services, Analysis Services, Reporting Services) Business Intelligence in SharePoint (Excel services, Power Pivot, PerformancePoint) Power BI Case: Cockpits für Infrastrukturmanagement in Gemeinden Lehrmittel Skript, das alle wesentlichen Lerninhalte umfasst ebooks Study Guide CAS BI 7/12
8.4 Open Source Business Intelligence und Datenintegration Im Open Source Bereich gibt es verschiedene Projekte, welche die gesamte Bandbreite von Business Intelligence abdecken. Pentaho Business Analytics ist ein Beispiel, das von Datenintegration über OLAP, Reporting, Dashboarding, Datamining und Big Data Integration eine umfassende Plattform bietet. Kursbeschreibung Lernziele Die Teilnehmenden erhalten einen Überblick zur Pentaho Analytics Plattform und lernen die Möglichkeiten der Datenintegration genauer kennen. Themen Überblick Pentaho Business Intelligence Einführung in Pentaho Data Integration mit der Präsentation von Beispielen aus der Praxis und Hands-on Übungen Lehrmittel Skript, das alle wesentlichen Lerninhalte umfasst ebooks 8.5 Intelligent Data Analysis Gängige Analysewerkzeuge wie Reporting und OLAP sind heute in Data Warehouses integriert. Daneben bieten Data Mining-Techniken die Möglichkeit, nicht nur einen aggregierten oder gefilterten Einblick in die Daten zu erhalten, sondern erlauben auch, Trends und Muster zu erkennen und damit aus Daten neues Wissen zu generieren. Methoden des Data Mining basieren zu einem grossen Teil auf Konzepten der Statistik. Deshalb sind in diesem Kurs neben dem Schwerpunkt Data Mining auch für dessen Verständnis notwendige statistische Grundkenntnisse ein Thema. Kursbeschreibung Lernziele Der Teilnehmenden können mit Hilfe von Data Mining Techniken explorative Zusammenhänge in Datenbeständen aufspüren, Erklärungsmodelle generieren, validieren und anwenden. Sie können die Erfordernisse der Datenanalyse beim Entwurf und bei der Realisierung von Data Warehouses einbringen. Themen Grundlegende Konzepte der Statistik und des Data Mining CRISP Datenaufbereitung für die Analyse Korrelation und Regression Aufdecken von Ähnlichkeitsstrukturen mit Clusteranalysen Reduzieren von Dimensionalität mit PCA und MDS Assoziationsanalyse Klassifikation von Daten (z.b. mit SVM, KMeans, Trees, Naives Bayes, Neuronalen Netzen) Modellvalidierung Lehrmittel Skript, das alle wesentlichen Lerninhalte umfasst Verwendete Software: R / R-Studio Literaturempfehlung: "Guide to Intelligent Data Analysis" (siehe [4]) Study Guide CAS BI 8/12
8.6 BI-Projekt / Semesterarbeit 8.6.1 Zielsetzung und Thema In der Semesterarbeit bearbeiten die Teilnehmenden ein Projekt oder eine Fragestellung aus ihrer Firma. Die Semesterarbeiten können folgende Themenbereiche beinhalten: Modellierung eines Data Warehouse, Konzeption einer BI-Lösung. Einführung und Prototyping von Datawarehouse-Technologien in der Firma. Realisierung von ETL-Prozessen, Performance Optimierungen, Metadaten-Erstellung, Qualitätsmanagement usw. im BI-Umfeld Evaluationen und Machbarkeitsstudien im BI-Umfeld. Realisierung von Schnittstellen zwischen BI- und anderen Systemen in der Unternehmensarchitektur. Realisierung oder Konzeption von Werkzeugen zur Analyse von Datenbeständen mit statistischen Methoden oder Data Mining. Gruppenarbeiten sind möglich, je nach Rahmenbedingungen sogar von Vorteil. 8.6.2 Ablauf Die Semesterarbeit umfasst ca. 90 Stunden Arbeit und beinhaltet folgende Meilensteine (siehe auch Zeitplan): 1. In der Firma ein Thema suchen, und mit Vorteil einen Ansprechpartner / Betreuer in der Firma definieren. 2. Erstellen einer Projektskizze. 3. Kurzpräsentation des Themas an der SWS vor Dozentengremium. Feedback durch die verantwortlichen Dozierenden. 4. Eventuell Überarbeitung der Projektskizze gemäss Feedback. 5. Zuordnung eines Experten durch die SWS. 6. Durchführung der Arbeit in eigener Terminplanung. 7. 2-3 Meetings mit dem Experten/Expertin organisieren. Projektskizze besprechen Zwischenreview / Beratung Schlusspräsentation 8. Abgabe des Berichtes an den Experten (per Email, auf Wunsch in Papierform) und per Email an die SWS. Die Projektskizze umfasst eine ein- bis zweiseitige Aufgabenstellung und eine 10-minütige Power-Point Präsentation mit folgenden Teilen: Titel Umfeld Problemstellung Lösungsansatz (Vorgehen, Methoden) Name und Kontaktadressen der Gruppenmitglieder, und des Ansprechpartners / Betreuers in der Firma Study Guide CAS BI 9/12
8.6.3 Ergebnis und Bewertung Der Bericht ist in elektronischer Form als PDF-Dokument an den Betreuer zu schicken. Bericht: ca. 20-30 Seiten, Source Code soweit notwendig für die Projektbeurteilung. Die Semesterarbeit wird nach folgenden Kriterien bewertet: Berichtsaufbau, Korrektheit, Vollständigkeit, Klarheit, Wesentlichkeit Projektdefinition, Ziele, Aufgabenstellung Methodik, Auswahl und Anwendung Ergebnisse, Klarheit, Aussagekraft, Stringenz Management Summary Mündliche Präsentation der Ergebnisse 8.6.4 Vertraulichkeit Semesterprojekte können vertraulich behandelt werden. Massgebend für die Rahmenbedingungen ist das Studienreglement. 9 Kompetenznachweise Für die Anrechnung der 12 ECTS-Punkte ist das erfolgreiche Bestehen der Qualifikationsnachweise (Prüfungen, Projektarbeiten) erforderlich, gemäss folgender Aufstellung: Kompetenznachweis Gewicht Art der Qualifikation Erfolgsquote Studierende Data Warehouses, Big Data, Spezialthemen 4 Schriftliche Prüfung 0 100 % Intelligent Data Analysis 2 Schriftliche Prüfung 0 100 % Semesterarbeit 4 Bewertete Projektarbeit 0 100 % Gesamtgewicht 10 Gesamterfolgsquote 0 100 % ECTS Note A - F Alle Studierenden können in einem Qualifikationsthema eine Erfolgsquote von 0 bis 100% erarbeiten. Die gewichtete Summe aus den Erfolgsquoten pro Thema und dem Gewicht des Themas ergibt eine Gesamterfolgsquote zwischen 0 und 100%. Die Gesamterfolgsquote wird in eine ECTS Note A bis E umgerechnet, gemäss Studienreglement. Weniger als 50% Gesamterfolgsquote ergibt eine ungenügende Note F. Study Guide CAS BI 10/12
10 Ergänzende Lehrmittel Ergänzende Lehrmittel sind Empfehlungen, um den Stoff zu vertiefen oder zu erweitern. Die Beschaffung liegt im Ermessen der Studierenden: Nr Titel Autoren Verlag Jahr ISBN Nr. Typ [1] Data Warehouse Systeme. Architektur, Entwicklung, Anwendung Holger Günzel, Andreas Bauer Dpunkt. Verlag GmbH 2013 ISBN: 978-3-89864-785-4 E [2] The Data Warehouse Lifecycle Toolkit Practical Techniques for Building Data Warehouse and Business Intelligence Systems, Second Edition Bob Becker, Joy Mundy, Warren Thornthwaite, Margy Ross, Ralph Kimball John Wiley & Sons 2008 ISBN: 978-0-470-14977-5 E [3] The Data Warehouse Toolkit Ralph Kimball, Margy Ross John Wiley & Sons 2013 978-1-118-53080-1 E [4] Guide to Intelligent Data Analysis How to Intelligently Make Sense of Real Data Frank Klawonn, Frank Höppner, Christian Borgelt, Michael R. Berthold Springer 2012 ISBN: 978-1-4471-2572-3 E 11 Dozierende Vorname Name Firma E-Mail Jörg Frank Syncwork frank@syncwork.de Werner Dähler SECO werner.daehler@seco.admin.ch Christoph Schaller Berner Fachhochschule christoph.schaller@bfh.ch 12 Organisation CAS-Leitung: Prof. Dr. Arno Schmidhauser Tel: +41 31 848 32 75 Mobile: +41 79 312 22 78 E-Mail: arno.schmidhauser@bfh.ch CAS-Administration: Andrea Moser Tel: +41 31 84 83 211 E-Mail: andrea.moser@bfh.ch Study Guide CAS BI 11/12
13 Termine Daten: KW 43, 2015 bis KW 14, 2016 Mittwoch, von 08:30 bis 16:15 Uhr Stundenplan siehe Webseite "Durchführungsdaten" Details Dokumenteninformation Study Guide CAS BI 2015-10-01 Die Inhalte und Angaben in diesem Study Guide können sich bis zum Studienstart noch verändern. Berner Fachhochschule Technik und Informatik Weiterbildung Wankdorffeldstrasse 102 CH-3014 Bern Telefon +41 31 848 31 11 Email: office.ti-be@bfh.ch ti.bfh.ch/weiterbildung ti.bfh.ch/cas-bi Study Guide CAS BI 12/12