Projekt zur Lehrveranstaltung Informationssysteme



Ähnliche Dokumente
Business Intelligence Praktikum 1

Marketing Intelligence Vorstellung der Softwarekomponenten. Josef Kolbitsch Manuela Reinisch

Business Intelligence Praktikum 1

Personendaten für den Öffentlichen Webauftritt der Fachhochschule Köln

How-to: Webserver NAT. Securepoint Security System Version 2007nx

SAP Integration von Business Objects am Beispiel von SAP Student Lifecycle Management. Anke Noßmann Syncwork AG

Anleitung zur Registrierung und Nutzung des Veranstalter- Zugangs für den Veranstaltungskalender der Expertenliste

Literaturverwaltungs- programme: Zotero

Anleitung für Vermieter

Spezialisierung Business Intelligence

LSF-Anleitung für Studierende

Persönliche Daten bearbeiten

UpToNet Workflow Workflow-Designer und WebClient Anwendung

Business Intelligence

Erstellung eines Verfahrensverzeichnisses aus QSEC

SQL Server 2012 und SharePoint im Unternehmenseinsatz. Referent Daniel Caesar

Kapsch Carrier Solutions GmbH Service & Support Helpdesk

Prof. Dr.-Ing. Rainer Schmidt 1

Anleitung für Selbsteinträge für Vereine auf der städtischen Homepage.

e-books aus der EBL-Datenbank

Anleitung für IQES-Verantwortliche Persönliche Konten verwalten

Data Warehouse ??? Ein Data Warehouse ist keine von der Stange zu kaufende Standardsoftware, sondern immer eine unternehmensindividuelle

Fragebogen. zur Erschließung und Sicherung von Online-Dokumenten. Auswahl von elektronischen Publikationen

Im zentralen Service Manager ( können Sie alle Funktionen Ihres Paketes einrichten und verwalten.

Content Management System mit INTREXX 2002.

Evaluationsinstrumente

Marketing Intelligence Schwierigkeiten bei der Umsetzung. Josef Kolbitsch Manuela Reinisch

Übungen Workflow Management. Blatt 2

Perfekt für Homeoffice und Außendienst

Modellbasierte Business Intelligence in der Praxis. Nürnberg,

Ordnung zur Feststellung der besonderen Vorbildung (VorbO) für den Master-Studiengang Medizinische Informatik an der Fachhochschule Dortmund

C09: Einsatz SAP BW im Vergleich zur Best-of-Breed-Produktauswahl

Event-Konzept (Stand )

1Ralph Schock RM NEO REPORTING

Daten-Synchronisation zwischen Mozilla Thunderbird (Lightning) / Mozilla Sunbird und dem ZDV Webmailer

Mit der Maus im Menü links auf den Menüpunkt 'Seiten' gehen und auf 'Erstellen klicken.

Version 1.0 Datum Anmeldung... 2

Inhaltsübersicht. 1 Anmeldung 2. 2 Abonnement weiterleiten / Automatische Antwort 5. 5 Web 6. 6 Internet 7.

GRAFIK WEB PREPRESS

ODM. ww w. syn t egris.de

Seminar C02 - Praxisvergleich OLAP Tools

Data Warehouse Definition (1)

Kurzanweisung für Google Analytics

OP-LOG

White Paper WinLine "Business Intelligence"

Anleitung für die Registrierung und das Einstellen von Angeboten

S TAND N OVEMBE R 2012 HANDBUCH DUDLE.ELK-WUE.DE T E R M I N A B S P R A C H E N I N D E R L A N D E S K I R C H E

END USER GUIDE IBS TICKET SYSTEM HOW-TO. Dokumenten Kontrolle. Version 1.1. Datum IBS Ticket System End User How-To D.doc.

Eine Kurzanleitung in 10 Schritten

Kurz-Anleitung zum Erstellen eines HotPot-Test

3. Neuen Newsbeitrag erstellen Klicken Sie auf das Datensatzsymbol mit dem +, damit Sie einen neuen Newsbeitrag erstellen können.

So empfangen Sie eine verschlüsselte von Wüstenrot

Der Jazz Veranstaltungskalender für Deutschland, Österreich und die Schweiz

FEHLER! TEXTMARKE NICHT DEFINIERT.

Schritt 1: Verwenden von Excel zum Erstellen von Verbindungen zu SQL Server Analysis Services-Daten

Revit Modelle in der Cloud: Autodesk 360 Mobile

Seminar C16 - Datenmodellierung für SAP BW

Kurzanleitung für Unternehmen. Schau rein! eine Marke von

Produktbeschreibung utilitas Ticketsystem

HTBVIEWER INBETRIEBNAHME

Beispiel Shop-Eintrag Ladenlokal & Online-Shop im Verzeichnis 1

ERSTE SCHRITTE.

Studentische Mitwirkung in Berufungskommissionen

Loggen Sie sich in Ihrem teamspace Team ein, wechseln Sie bitte zur Verwaltung und klicken Sie dort auf den Punkt Synchronisation.

Fragebogen zur Nutzung des Angebots der Hochschulbibliothek an elektronischen Medien:

Umsatzturbo Internet. So gelangen Sie auf die erste Seite bei Google, gewinnen neue Patienten, gleichzeitig Ihre (Adwords) Kosten

Arbeiten Sie gerne für die Ablage?

Aktuelles, Mitteilungen und Veranstaltungen verwalten

GKSpro WebServer. Überblick. Web Server. GKSpro. Datenbank. GKSpro. InfoBrief Nr. 61 November GKSpro WebServer.

Die Wasser App.

Kurzeinführung Excel2App. Version 1.0.0

DIAS KV Prozess Steuerung

MORE Profile. Pass- und Lizenzverwaltungssystem. Stand: MORE Projects GmbH

Um sich zu registrieren, öffnen Sie die Internetseite und wählen Sie dort rechts oben

Inhalt. meliarts. 1. Allgemeine Informationen Administration Aufruf Das Kontextmenü Vorlagen...

Anleitung zur Bearbeitung von Prüferkommentaren in der Nachreichung

Meine ZyXEL Cloud. Tobias Hermanns V0.10

Informationsmanagement

Neuerungen in ReviPS Version 12g

Projektfragen 3D Konfigurator

Inhaltsverzeichnis. 1 Was ist Business Intelligence?... 23

Universal Dashboard auf ewon Alarmübersicht auf ewon eigener HTML Seite.

.lowfidelity KONFIGURATION Anleitung

DW42: DWH-Strategie, Design und Technik

ClickProfile Mobile. Leitfaden Client. Ihre Vision ist unsere Aufgabe

Neue Seiten erstellen

Studieren- Erklärungen und Tipps

Fallbeispiel einer mit Neovista PDP realisierten Handels-Lösung

Logische Datenmodellierung zur Abbildung mehrdimensionaler Datenstrukturen im SAP Business Information Warehouse

Informationsblatt zu den Seminaren am Lehrstuhl. für Transportsysteme und -logistik

Web Services stellen eine Integrationsarchitektur dar, die die Kommunikation zwischen verschiedenen Anwendungen

Externe Authentifizierung. Externe Authentifizierung IACBOX.COM. Version Deutsch

M-net -Adressen einrichten - Apple iphone

Updatebeschreibung JAVA Version 3.6 und Internet Version 1.2

easy²-mail Newsletter-Programm Web: Mail: 2007 Dipl. Ing. Erwin Ambrosch

Patselect Profil: Datenübernahme aus Patselect

Meine Welt auf einen Blick erleben.

Inhalt. 1 Einleitung AUTOMATISCHE DATENSICHERUNG AUF EINEN CLOUDSPEICHER

Der Start ins Fernstudium

Transkript:

Prof. Dr.-Ing. Thomas Kudraß Dipl.-Math. Dörte König HTWK Leipzig, F IMN Projekt zur Lehrveranstaltung Informationssysteme Das Projekt ist in drei Teile aufgeteilt, die den Phasen eines Data-Warehouse-Projekts entsprechen. Die Bewertung des Projekts geht zu 50% in die Gesamtnote des Faches Informationssysteme ein. 1. Teil: Datenextraktion aus dem Web und Datenimport Import der Rohdaten aus dem Web mit Hilfe der Browser-Erweiterung Chickenfoot zum automatisierten Browsen in ausgewählten Webseiten Optional: Nutzung von Webservice-Technologien zum Zugriff auf externe Datendienste (z.b. Google, Amazon) Umwandlung der Daten in ein XML-Format (z.b. mittels JavaScript, XPath, FireBug PlugIn) und Import in die relationale Datenbank Extraktion der für die Analyse benötigten relevanten Merkmale 2. Teil: Data Cleaning / Laden Data Cleaning, d.h. Objektkonsolidierung, Datennormalisierung, Ableitung neuer Attribute Beispiele für mögliche Bereinigungen: Angleichung unterschiedlicher Schreibweisen von Namen, Erkennung von Duplikaten, Inkonsistenzen Ausführung und Diskussion der Data-Cleaning-Schritte hinsichtlich Performanz und Datenqualität Laden des ODS bzw. des Data Warehouse 3. Teil: OLAP und Business Intelligence Definition und Erstellung eines Data Cubes, inklusive OLAP-Analysen und mehrdimensionaler Abfragen Nutzung von Oracle-OLAP-Technologien Modellierung von hierarchischen Dimensionen Ergebnisse: o Aufbau des Data-Warehouse-Schemas (Dimensions- und Faktentabellen mit allen Attributen) o Füllen der Dimensions- und Faktentabellen im Analytic Workspace o Erstellung der Data Cubes o Ausführung interaktiver OLAP-Queries basierend auf Cubes o Visualisierung der Anfrageergebnisse (Diagramme) Der ETL-Prozess kann mit dem Oracle Warehouse Builder modelliert werden.

Zum Projekt ist eine kleine Dokumentation zu erstellen. Diese sollte folgende Bestandteile beinhalten: Teil 1: Kurze Beschreibung der gewählten Data-Warehouse-Anwendung (Weltausschnitt). Dazu zählen die wichtigsten Informationsobjekte sowie die geplanten Auswertungen. Konzeptionelle Modellierung der Datenquellen (als Datenbank oder Dokument) Aspekte der Datenqualität (Diskussion) Teil 2: Konzeptionelles Modell des Operational Data Store (ERD) Logisches Modell des Operational Data Store ( Relationenschema) Teil 3: Data-Warehouse-Modell als multidimensionales Datenmodell Definition von mindestens 3 unterschiedlichen OLAP-Queries Darüber hinaus relevante Metadaten sind jeweils in den einzelnen Teilen anzugeben. Teil 1 und Teil 2 zusammen werden in schriftlicher Form als Meilenstein I abgenommen (Termin KW 22). Meilenstein II bildet die Endabnahme am Rechner (Termin KW 26) Das Projekt ist in Zweiergruppen zu bearbeiten.

Mögliche Anwendungs-Szenarien für den Aufbau eines Data Warehouse: Fallstudie 1: Leipzig-Event--Data Warehouse Aufbau eines Data Warehouse über Veranstaltungen und Events in Leipzig, Kapazitäten von Hotels und Gaststätten und anderen Serviceanbietern mit dem Ziel einer besseren Abstimmung und Ressourcenplanung zwischen den Beteiligten. Öffentlich zugängliche Datenquellen: Veranstaltungen (Events): o Veranstaltungsdatenbank von Zeitschriften, Magazinen und Portalen (Leipzig live, LVZ, Kreuzer, meinestadt.de, port01) o offizielles Portal der Stadt Leipzig o Veranstaltungskalender der Stadt Leipzig Locations: o Locationagent o livegigs.de Unterkünfte: o hrs.de, hotel.de, diverse regionale Portale Gastronomie: o Webauftritte von Restaurants und Catering-Firmen Sonstige Serviceanbieter: o Security-, Escort- und Carservice Informationsbedarf: Veranstaltungen (Events): o Name, Veranstaltungstyp (z.b. Konferenz, Party, Konzert, ) o Veranstaltungszeitraum, Veranstaltungszeit o Veranstaltungsort (Adresse oder Location) o Kontaktdaten Anbieter o Eintrittspreis Locations: o Name o Erreichbarkeit Unterkünfte: o Name des Hotels o Bettenkapazität

o Erreichbarkeit Gastronomie: o Name der Einrichtung o verfügbare Plätze o Angebot (Speisen, Getränke) Sonstige Serviceanbieter: o Name der Einrichtung o Adresse o Verfügbarer Service Mögliche Auswertungen Ressourcen- und Kapazitätsvergleich langfristige Übersicht über Events (Aufdeckung von Spitzenlasten und Konkurrenzsituationen in der Zukunft) Auswertungen in verschiedenen Dimensionen: o Veranstaltungstyp o zeitbezogen o ortsbezogene Auswertungen (Locations, Stadtteile..) o Teilnehmerzahl Auswertungen der Datenqualität der Quelldaten im Netz Unvollständige bzw. fehlende Informationen (z.b. bei Adressen von Anbietern) Veraltete Informationen (z.b. nicht-existente oder umbenannte Gaststätten) Inkonsistente (widersprüchliche) Informationen (z.b. widersprüchliche Veranstaltungsbezeichnungen aus verschiedenen Quellen) Offenkundige Fehler in den Einträgen

Fallstudie 2: HTWK-Data Warehouse Aufbau eines Data Warehouse mit öffentlich zugänglichen Informationen über die HTWK Leipzig. Im Data Warehouse sollten Informationen zu finden sein über Professoren & Mitarbeiter der Hochschule, deren Lehrangebote und Forschungsergebnisse: Professoren und Mitarbeiter o Adressinformationen (z.b. E-Mail, Homepage, FB, Telefon, Büro, Sprechzeiten) o Berufungsgebiet / Lehrgebiete o Funktionen an FB / Hochschule Lehrveranstaltungen o Persönlicher Stundenplan (Lehrveranstaltungen und Termine) o Studentische Bewertungen (meinprof.de) Forschung o Forschungsthemen o Bisher betreute Diplomarbeiten o Veröffentlichungen Mögliche Auswertungen Anzahl und Art der Veröffentlichungen (Google Scholar, für Informatik: DBLP Trier) Statistik über Lehrauslastung o Bedienbeziehungen (z.b. Welcher FB bedient welchen anderen FB?) o Auswertungen pro Professor / Fachbereich u.a. Statistik über Lehrangebote Statistik über betreute Diplomarbeiten (sofern Informationen online) Mögliche Auswertedimensionen: Fachbereich, Fachgebiet, Professor Auswertungen der Datenqualität der Quelldaten im Netz Unvollständige bzw. fehlende Informationen (z.b. bei Diplomthemen) Veraltete Informationen (z.b. ausgeschiedene Professoren) Inkonsistente (Widersprüchliche) Informationen (z.b. Zugehörigkeit zu FB, akademischer Grad) Fehler in den Einträgen (z.b. bei Büro-Adresse). Es können auf besonderen Wunsch auch andere Fallbeispiele bearbeitet werden. Diese müssen jedoch zu Beginn des Projekts abgesprochen werden.