Grundlagen der Web-Entwicklung Universitäre Informationsstrukturen Thomas Walter 22.10.2009 1
so ist Baden-Württemberg 2
Information Information: über 2,5 Milliarden (!!!) Treffer bei Google "In Wirklichkeit aber ist Information ein vager, schillernder Begriff mit vielen, sich teilweise widersprechenden Bedeutungen und Definitionen." (Informatikhandbuch, Hanser 2002) klarer: Daten Repräsentation von Information durch Zeichenketten, typischerweise bit-muster 3
Information an Universitäten Information an Universitäten: Lehre Course Management E-Learning Prüfungswesen Forschung Forschungsprimärdaten Forschungssekundärdaten Verwaltungsdaten Studierende, Prüfungen, Personal Haushalt 4
ein paar aktuelle Ansätze TU München: IntegraTUM 5
ein paar aktuelle Ansätze TU Karlsruhe: KIM (Karlsruher Integriertes Informationsmanagement) Hintergrund: DFG-Ausschreibung 2001 (Gewinner TU München, Uni Oldenburg) 6
das gemeinsame Ziel die vorhandene Information zu konsolidieren Zusammenzufassen nutzbar zu machen und die gängigen Randbedingungen beachten Zugriffsrechte keine Redundanzen "revoke" für spezielle Daten muss möglich sein 7
Die HIS GmbH Hochschul Informations System GmbH Gegründet 1969 über die Volkswagen-Stiftung "Softwarehaus der Hochschulen" macht viel mehr als nur Software, aber Software ist Hauptgeschäft typische Produkte: ZUL/SOS/POS, FSV/MBS/IVS fibu, BAU, LSF, QIS-xxx, PSV 8
Informationen an der Universität Fakultäten/Institute UB alle Forschungsdaten Mitarbeiterdaten Prüfungsdaten Benutzerdaten einschließlich "Walk-In-User" Fachanwendung Bibliothekssystem E-Learning, 9
ZDV Informationen an der Universität Benutzerdaten: 30.000+ Accounts zentrales Storage: physikalische Datenspeicherung Zentrale Verwaltung Mitarbeiterdaten Studierendendaten Prüfungsdaten Haushaltsdaten 10
Informationen an der Universität Medizinische Fakultät, UKT und ZIT Mitarbeiterdaten Patientendaten TBA: TK-Anlage Unibund, Alumnat, 11
Quellen der Information verschiedene Datenquellen an der ganzen Universität und darüber hinaus typischerweise RDBMS MS SQL Server, Postgres, MySQL, Oracle, Informix, unterschiedlichste Zuständigkeit 12
typische Fragen und Probleme Qualität der Daten Eindeutigkeit der Daten TK-Gesetzgebung Landesdatenschutzgesetz, Bundesdatenschutzgesetz, Wer und was gehört eigentlich zur "Universität"??? Wie kann einfacher Zugriff auf Daten und Services ermöglicht werden? 13
Kosten- und Leistungsrechnung ab 1998: Entwicklung einer DV-basierten KLR an Hochschulen (Floß, Mehlhorn) (TU Dresden) später Produkt HISCOB-GX (COntrolling-Baustein) Zusammenführung verschiedener Einzelinformationen Ziel: Entscheidungshilfe für Hochschulleitungen (und Ministerien) andere Entwicklungen in dieser Zeit: SuperX (TU Karlsruhe), ICE (HIS) 14
FM HISRPA HISBAU HISIVS AnlVerw HISSVA PersAbr HISMBS/ KAHIKA/ HUELKA HISSOS StudDaten Leistungen, VertSchl, Kennzahlen Flächendaten, Raumdaten AbschrKo BeschVerh PersIstKo IstKo/-erlöse Kalk. Mieten, VertSchl Kalk. Abschr PersNormKo, VertSchl PersIstKo Ausggl. SachKo Einngl. Erlöse Datenflüsse im integrativen Verbund 15
Hochschul-Controlling proprietäre Clientsoftware (VC++) keine besondere Benutzerverwaltung: Controller hat Vollzugriff auf alles fehlende Information: Absolventenzahl, komplette Forschung, Haushaltsdenken in KoSt und KoTr klassisches Problem: Qualität der Grunddaten isolierter Ansatz QISCOB 16
Web-basierte Informationssysteme Übergang zu webbasierten Systemen Ursprünglicher Ansatz der HIS: Java Applet ab 2002: Umstellung auf J2EE, insbesondere Java Servlets Entwicklung des QIS-Frameworks gemeinsam mit der HIS Mehrschichtmodell 17
Systemarchitektur Entwicklung einer Dreischichtarchitektur Web-Präsentation durch Template-Engine 18
Produkte aus dieser Reihe ursprüngliches Produkt webcob/qiscob JEE-Web-Interface für die KLR-Software COB-GX darauf aufbauend webfsv/qisfsv webbasierter Zugriff auf das Haushaltssystem FSV/MBS "Kontostandsinformation" Zugriff auf Primärdaten des MBS oder auf Schattendatenbank separate Benutzerverwaltung 19
20
Usability 2002: erste Usability-Analyse bei HIS-Software bei der Konzeption von Web-Applikationen: Übergang GX QIS um webbasierte Informationssysteme benutzbar zu machen, ist eine aktive Auseinandersetzung mit dem Thema notwendig Beispiel: HIS LSF (Campus) großes Interesse der HIS noch große Herausforderung 21
Identitätsmanagement Identitätsmanagement: bewusster Umgang mit Identitäten, Anonymitäten und Pseudoanomytäten Authentifizierung Autorisierung Single Sign On (SSO) oder einfacher Single Login wesentliche Basis aller aktueller Informationsarchitekturen! abgeleitet sind Dienste wie ldap und Active Directory 22
Situation in etabliertes IdM im Testbetrieb vollständig vorgeprüft und bei Landesdatenschutzbeauftragten eingereicht Mitarbeiter-Daten Studierenden-Daten Benutzer-Daten ZDV UKT/MF: SAP HR Universitätsbund Alumnat Bibliothek 23
K. Spanier, ZDV 24
Authentifizierung und Autorisierung Verzeichnisdienste ldap Active Directory Shibboleth bewährte Software-Standards/Protokolle SAML: XML, SOAP, TLS, XMLsig, XMLenc DFN-AAI: Authentifikation Autorisierungs Infrastruktur weltweite Akzeptanz in.edu und.com Einsatz im D-Grid 25
Prinzip von Shibboleth Benutzer Anbieter Login Heimateinrichtung Lokalisierungsdienst IdP Discovery ok nein Benutzer bekannt? ok Benutzer berechtigt? Benutzerrollen Zugriff ja/nein 26
Komponenten von Shibboleth DFN-AAI schafft Vertauensverhältnis und organisatorischen Rahmen für den Austausch von Nutzerinformationen Personen erhalten elektronische Identität mit Rollen Identity-Provider: Heimateinrichtung Benutzer und seine Rollen Service Provider: Anwendung Discovery Service: "where are you from" 27
Situation Universität Identity-Provider in Produktion v. 2 Service Provider moodle, ilias, Campus Software, webmail-zertifikate ReDI, ASKnet, Elsevier 28
Web-Auftritt Content-Management-System: Verwaltet die Webinhalte Content in RDBMS Benutzer zentral: Rollen, momentan (weitgehend) isoliertes System: keine Datenübernahme aus anderen Datenquellen (Personen, Lehrveranstaltungen, Veröffentlichungen, ) 29
E-Learning Elektronische Lernplattform: ELP Daten der Studierenden und Lehrenden: Shibboleth Zusammenfluss der Kursverwaltung (LSF) und digitalen Lehrinhalte in den Lernplattformen Aufbau eines (EINES) E-Learning-Portals an der Universität 30
Forschungsprimärdaten Projekt BW-eSci(T): Universität und FIZ Karlsruhe Aufbau eines neuen Dienstes des IKM zur Vorhaltung von Forschungsprimärdaten Beispielanwendung Computerlinguistik 31
escidoc Architektur Data Acquisition Service Control of Named Entities Deposit Service (SWORD) Citation Style Service Transformation Validation Search and Indexing Service Technical Metadata Extraction Duplicate Detection Service PID Service Digilib OAI-PMH Admin Tool Policy Decision Point Group Service Role Service User Account Service Organizational Unit Service Context Service Container Service Item Service Content Model Service Set Service Scope Service Statistics Data Service Aggregation Definition Service Report Definition Service Report Service Admin Service Statistics Manager Object Manager Security 32
Basic Resource Types Organizational Unit Context Container Items Container Container Container Items Items Items 33
Aggregationen in escidoc Container Item Metadata Item Metadata Thumbnail Web Resolution Original Resolution Thumbnail Web Resolution Original Resolution Metadata Metadata Metadata Metadata Metadata Metadata 34
escidoc in Integration des Benutzermanagements über Shibboleth in Vorbereitung wichtiger offener Punkt: Langzeitarchivierung 35
Forschungssekundärdaten Wesentliche weitere Datenbasis: Forschungssekundär- Daten Publikationsverzeichnis Web of Science Forschungsdatenbank Querverbindung zu Web-Auftritt der Arbeitsbereiche 36
Datenschutz Integriertes Informations-Management ist stets auch eine Frage des Datenschutzes Beispiel Identitäts-Management betroffene Gesetze: Landesdatenschutzgesetz, Bundesdatenschutzgesetz Telekommunikationsgesetz (TKG) nicht die Personaldatenbank, sondern die darauf aufbauenden Dienste sind Gegenstand des Verfahrens 37
Datenschutz Grundlage: 36 LDSG für die Speicherung: Datenverarbeitung bei Dienst- und Arbeitsverhältnissen Veröffentlichung der Daten: 12(5) LHG für Studierende: 15(1) LDSG Vorabkontrolle durch ZENDAS, eingereicht bei Landesdatenschutzbeauftragten 38
Resumée die Universität verfügt über eine Vielzahl von Daten und damit Information diese Daten liegen in unterschiedlichster Form an verschiedenen Stellen vor eine Konsolidierung der Daten ist wichtig ein Zusammenführen der Daten ist wichtig Basis ist ein erfolgreiches Identitätsmanagement Schichtarchitektur unverzichtbar 39
Resumée Steigerung von Datenqualität Effizienz Service besondere Ansprüche an ein Integriertes Informationsmanagement Rechte und rechtliches Bedienbarkeit 40
Portal(e) SoA Schnittstellen: Webservices Geschäftslogik: Verknüpfung IdM escidoc LSF ELP Datenhaltung 41
Die Herausforderung immer mehr Information die eigentliche Herausforderung bei der Integration der Information sind nicht technischer, sondern organisatorischer Art 42
habe fertig Grenzenlose Aufgaben immer komplexere Systeme differieren (Entropie!) nur Zusammenfassung mittelfristig zielführend (mehr Service ) 43