BICsuite!focus Das BICsuite Scheduling System im Data Warehouse Umfeld



Ähnliche Dokumente
BICsuite!focus Parallelisierung von Prozessen mit der BICsuite Dynamic Submit Funktion

BEDIENUNG ABADISCOVER

Content Management System mit INTREXX 2002.

Fehler und Probleme bei Auswahl und Installation eines Dokumentenmanagement Systems

Task: Nmap Skripte ausführen

Installationsanleitung dateiagent Pro

Microsoft SharePoint 2013 Designer

Einfache und effiziente Zusammenarbeit in der Cloud. EASY-PM Office Add-Ins Handbuch

Microsoft Update Windows Update

SF-RB. Modul Provisionsabrechnung & Planung Reiseagentenprovisionsabrechnung & Planung. SF-Software Touristiksoftware

Web Interface für Anwender

ABACONNECT VERWENDUNG VON APACHE TCPMON UTILITY MIT ABACONNECT WEBSERVICES

Agile Vorgehensmodelle in der Softwareentwicklung: Scrum

.htaccess HOWTO. zum Schutz von Dateien und Verzeichnissen mittels Passwortabfrage

Dokumentenverwaltung. Copyright 2012 cobra computer s brainware GmbH

Fachbericht zum Thema: Anforderungen an ein Datenbanksystem

telefonkonferenz.de für Endanwender

Installationsanleitung WibuKey Treiber

Lizenzierung von System Center 2012

INSTALLATION ABACUS ABAWEBCLIENT

Leitfaden zur Installation von Bitbyters.WinShutdown

Avira Management Console Optimierung für großes Netzwerk. Kurzanleitung

Was meinen die Leute eigentlich mit: Grexit?

Abamsoft Finos im Zusammenspiel mit shop to date von DATA BECKER

LEAN MANUFACTURING. Teil 7 Lean und Six Sigma. Ein Quick Guide für den schnellen Einstieg in die Möglichkeiten der Lean Philosophie.

Sie werden sehen, dass Sie für uns nur noch den direkten PDF-Export benötigen. Warum?

visionapp Base Installation Packages (vbip) Update

Produktinfo Zahlungsvorschlagsliste

2 Die Terminaldienste Prüfungsanforderungen von Microsoft: Lernziele:

Whitepaper. Produkt: combit address manager STAMPIT der Deutschen Post nutzen. combit GmbH Untere Laube Konstanz

impact ordering Info Produktkonfigurator

Einrichtung eines VPN-Zugangs

Internet Explorer Version 6

Avira Server Security Produktupdates. Best Practice


Avira Support Collector. Kurzanleitung

Reporting Services und SharePoint 2010 Teil 1

schedulix!focus Job Scheduling als Alternative zur Ablaufsteuerung mit Shell Scripten

Datenübernahme von HKO 5.9 zur. Advolux Kanzleisoftware

MESONIC WINLine Jahreswechsel. Umstellung des Wirtschaftsjahres SMC IT AG

Virtuelle Fotografie (CGI)

Integration mit. Wie AristaFlow Sie in Ihrem Unternehmen unterstützen kann, zeigen wir Ihnen am nachfolgenden Beispiel einer Support-Anfrage.

Verwendung des Terminalservers der MUG

Lineargleichungssysteme: Additions-/ Subtraktionsverfahren

Inhalt. 1 Einleitung AUTOMATISCHE DATENSICHERUNG AUF EINEN CLOUDSPEICHER

Professionelle Seminare im Bereich MS-Office

40-Tage-Wunder- Kurs. Umarme, was Du nicht ändern kannst.

Überprüfung der digital signierten E-Rechnung

Datenbank-Verschlüsselung mit DbDefence und Webanwendungen.

Skript Pilotphase für Arbeitsgelegenheiten

Managed on-premise Cloud for SAP Solutions

Einzel- s und unpersönliche Massen-Mails versenden

Installation des Authorware Webplayers für den Internet Explorer unter Windows Vista

Gründe für fehlende Vorsorgemaßnahmen gegen Krankheit

Dokumente verwalten. Copyright 2013 cobra computer s brainware GmbH

Menüband. Änderungen, Irrtümer und Druckfehler vorbehalten. Bearbeitet von Harald Borges. Stand April

Der beste Plan für Office 365 Archivierung.

Das Leitbild vom Verein WIR

INDEX. Öffentliche Ordner erstellen Seite 2. Offline verfügbar einrichten Seite 3. Berechtigungen setzen Seite 7. Öffentliche Ordner Offline

Das Handwerkszeug. Teil I

Allgemein. Arbeiten mit der Windchill Bibliothek. Dokumente Informationen Skripte und mehr online jederzeit und überall verfügbar. Inhaltsverzeichnis

Benutzerverwaltung Business- & Company-Paket

EIDAMO Webshop-Lösung - White Paper

In diesem Tutorial lernen Sie, wie Sie einen Termin erfassen und verschiedene Einstellungen zu einem Termin vornehmen können.

Infopark CMS Fiona. Fiona Release Notes

Browserkonfiguration für Internet Explorer 6.0

Windows 8 Lizenzierung in Szenarien

Fernzugriff auf Kundensysteme. Bedienungsanleitung für Kunden

Version smarter mobile(zu finden unter Einstellungen, Siehe Bild) : Gerät/Typ(z.B. Panasonic Toughbook, Ipad Air, Handy Samsung S1):

Neues Modul für individuelle Anlagen. Änderung bei den Postleitzahl-Mutationen

FUTURE NETWORK REQUIREMENTS ENGINEERING

GLASFASERNETZ DATACENTER RHEIN-NECKAR RHEIN-NECKAR-CLOUD MULTIMEDIA. Fixed Line BESCHREIBUNG. carrier ethernet TBFL_PFK_MA_

Online Newsletter III

DriveLock 6. DriveLock und das Windows Sicherheitsproblem mit LNK Dateien. CenterTools Software GmbH

BüroWARE Exchange Synchronisation Grundlagen und Voraussetzungen

Mind Mapping am PC. für Präsentationen, Vorträge, Selbstmanagement. von Isolde Kommer, Helmut Reinke. 1. Auflage. Hanser München 1999

Anleitung zum Archive Reader. ab Version

LEAN MANUFACTURING. Teil 2 Lean Konzepte. Ein Quick Guide für den schnellen Einstieg in die Möglichkeiten der Lean Philosophie.

white sheep GmbH Unternehmensberatung Schnittstellen Framework

NetStream Helpdesk-Online. Verwalten und erstellen Sie Ihre eigenen Tickets

Software zur Anbindung Ihrer Maschinen über Wireless- (GPRS/EDGE) und Breitbandanbindungen (DSL, LAN)

Albert HAYR Linux, IT and Open Source Expert and Solution Architect. Open Source professionell einsetzen

SIX SIGMA TEIL 2: DIE DEFINE PHASE DMAIC MARTIN ZANDER. Green Belt Level

Microsoft Windows XP SP2 und windream

Hilfe zur Urlaubsplanung und Zeiterfassung

Analyse zum Thema: Laufzeit von Support-Leistungen für ausgewählte Server OS

Datenübernahme easyjob 3.0 zu easyjob 4.0

Die integrierte Zeiterfassung. Das innovative Softwarekonzept

Installation der SAS Foundation Software auf Windows

An integrated total solution for automatic job scheduling without user interaction

Anleitung - Archivierung

Wichtige Hinweise zu den neuen Orientierungshilfen der Architekten-/Objektplanerverträge

.. für Ihre Business-Lösung

Prozessbewertung und -verbesserung nach ITIL im Kontext des betrieblichen Informationsmanagements. von Stephanie Wilke am

Die Formatierungsregeln (die so genannte Wiki-Syntax) für Texte in DokuWiki sind zu großen Teilen die selben, wie in anderen Wiki-Systemen.

ANLEITUNG GERÄTEREGISTRATION AN KRZ.SMK

Geschäftsprozessunterstützung mit Microsoft SharePoint Foundation 2010 Microsoft InfoPath 2010 und Microsoft BizTalk Server 2013

S TAND N OVEMBE R 2012 HANDBUCH DUDLE.ELK-WUE.DE T E R M I N A B S P R A C H E N I N D E R L A N D E S K I R C H E

Transkript:

independit Integrative Technologies GmbH Bergstraße 6 D 86529 Schrobenhausen BICsuite!focus Das BICsuite Scheduling System im Data Warehouse Umfeld Dieter Stubler Ronald Jeninga July 30, 2013

Copyright 2013 independit GmbH Rechtlicher Hinweis Dieses Werk ist urheberrechtlich geschützt. Alle Rechte, auch die der Übersetzung, des Nachdrucks und der Vervielfältigung des Artikels, oder Teilen daraus, vorbehalten. Kein Teil des Werkes darf ohne schriftliche Genehmigung der independit GmbH in irgendeiner Form (Fotokopie, Mikrofilm oder ein anderes Verfahren), auch nicht für Zwecke der Unterrichtsgestaltung, reproduziert oder unter Verwendung elektronischer Systeme verarbeitet, vervielfältigt oder verbreitet werden.

Das BICsuite Scheduling System im Data Warehouse Umfeld Einführung In Data Warehouse Umgebungen müssen täglich eine Vielzahl von Prozessen ausgeführt werden. In vielen Unternehmen existiert zwar ein Enterprise Scheduling, welches häufig jedoch nicht zur Steuerung der einzelnen Prozesse im Data Warehouse herangezogen wird. Meist werden größere komplexe Batchprozesse vom Enterprise Scheduling angestoßen, die Ablaufsteuerung innerhalb dieser High Level Batchprozesse wird jedoch außerhalb der Enterprise Schedulings alternativ gelöst. Die Gründe dafür liegen meist in fehlenden Features des eingesetzten Enterprise Schedulings bzw. dessen komplexen und umständlichen Handhabung. Die interne Steuerung der Data Warehouse Batchprozesse erfolgt meist durch den Einsatz von toolinterner Scheduling Funktionalität der eingesetzten Werkzeuge und/oder den Einsatz von Scripting (sh, perl, python,...). Toolinternes Scheduling Der Einsatz von toolinternen Scheduling Funktionen ist problematisch, da häufig auch toolexterne Prozesse mit eingebunden werden müssen. Dies ist oft nicht möglich oder muss häufig über Workarounds gelöst werden. Sind in einer Best Of Breed Umgebung mehrere unterschiedliche Tools für unterschiedliche Aufgaben im Einsatz, wird das Monitoring der in den verschiedenen Systemen aktiven Abläufe zu einem Problem. Soll ein Werkzeug ausgetauscht werden, muss auch die im Werkzeug realisierte Ablaufsteuerung neu implementiert werden. Scripting Noch problematischer ist hier der Einsatz von Scripting. Um ein Minimum an Stabilität zu erreichen, entstehen hier erhebliche Entwicklungsaufwände die häufig in der Entwicklung eines eigenen kleinen Scheduling Systems münden. Notwendigkeit eines Scheduling Systems Beide genannten und häufig anzutreffenden Lösungen sind weder effizient bzgl. der benötigten Enwicklungsressourcen, noch sind sie dazu geeignet einen mittel und langfristig stabilen Betrieb der Data Warehouse Umgebung zu gewährleisten. Der Betrieb einer Data Warehouse Umgebung ohne ein Scheduling System ist immer zu teuer und unzuverlässig. 1

Einsetzbarkeit von Enterprise Scheduling Systemen Enterprise Scheduling Systeme haben ihre Wurzeln in der Steuerung von Produktionsabläufen auf Mainframesystemen. Diese Produktionsabläufe sind typischerweise sehr statisch, wenig komplex, stabil und erfordern im Allgemeinen wenig bis keine Operatoraktivitäten. Da Entwicklung und Produktion typischerweise voneinander getrennt sind, ist für die Enwickler eine Einarbeitung in das Enterprise Scheduling nicht notwendig. In einer typischen Data Warehouse Umgebung ist dies jedoch anders. Data Warehouse Prozessabläufe ändern sich nahezu täglich. Fehler durch Ressourcenengpässe bei der Verarbeitung großer Datenmengen sind wesentlich häufiger. Eine strikte Trennung zwischen Entwicklung und Produktion existiert in den meisten Fällen nicht. Dies führt dazu, dass jeder Entwickler neben seiner eigentlichen Tätigkeit zusätzlich mit Überwachung und Betrieb seiner Data Warehouse Prozesse beschäftigt ist. Die komplexen Abhängigkeitsbeziehungen in Data Warehouse Abläufen stellen hohe Ansprüche an die Funtionalität des eingesetzten Scheduling Systems. Der Einsatz eines Enterprise Scheduling Systems zur Steuerung aller Data Warehouse (Teil)Prozesse ist deshalb häufig keine Lösung, da diese Systeme nicht an die Anforderungen eines Data Warehouse Betriebes angepasst sind. Geforderte Eigenschaften eines Scheduling Systems im Data Warehouse Umfeld Ein Scheduling System im Datawarehouse Umfeld muss daher unter anderem folgende Eigenschaften mitbringen: Der Umgang (Job/batch Definition, Execution, Monitoring, Operation) muss auch ohne Programmierkenntnisse leicht und schnell zu erlernen sein. Dazu müssen die dem System zugrundeliegenden Konzepte einfach, klar und verständlich sein. Das Scheduling System muss alle Features mitbringen um auch komplexe Aufgabenstellungen zur Ablaufsteuerung abbilden zu können, damit nicht auf Scripting Lösungen ausgewichen werden muss. Um auf neue Anforderungen im Data Warehouse schnell reagieren zu können müssen Abläufe jederzeit geändert werden können ohne bereits aktive Abläufe zu beeinflussen. Der Operator muss jederzeit in der Lage sein, Einfluss auf aktive Abläufe nehmen zu können, um auf Ausnahmesituationen geeignet reagieren zu können. Für Installation, Adminstration und Betrieb des Systems dürfen keine besonderen Systemprivilegien (root Rechte, etc) erforderlich sein. 2

Die Definition, Ausführung, Überwachung und Problemanalyse muss ohne zusätzliche Softwareinstallation von jedem Arbeitsplatz aus möglich sein (Web Application Server). Da Data Warehouse Umgebungen immer dazu tendieren die Grenzen der Hardware auszuloten, muss das System geeignete Mechanismen zur Kontrolle der Systemressourcen zur Verfügung stellen um Fehler durch Ressourcenengpässe zu vermeiden bzw. zu reduzieren. Der Zugriff auf Abläufe bzgl. Definition, Monitoring und Operation sowie die Möglichkeit der Ausführung von Jobs in bestimmten Umgebungen (Jobserver) muss durch Privilegien abgesichert werden können. Etablierte Enterprise Scheduling Systeme bieten obige Eigenschaften nicht oder nur teilweise und sind daher für den Einsatz in Data Warehouse Umgebungen nur sehr bedingt geeignet. Im folgenden wollen wir auf einige der oben genannten Punkte etwas näher eingehen. Bedienerfreundlichkeit Die einfache Bedienbarkeit stand bei der Entwicklung des BICsuite Scheduling Systems mit im Vordergrund. Ein Web Application Server stellt ohne Softwareintstallation am Arbeitsplatz ein einfach zu bedienendes, Browser basiertes GUI zur Verfügung, welches von der Ablaufdefinition, Scheduling, Monitoring, Operating bis zur Administration der Jobserver alle Bereiche abdeckt. Erfahrungen beim Kunden zeigen, dass mit einer kurzen Einführung von ca. 3 Stunden jedes Teammitglied in die Lage versetzt werden kann, das System produktiv einzusetzen. Die Möglichkeit für wiederkehrende, komplexere Aufgaben, Templates zu definieren auf Basis derer durch wenige Handgriffe diese Aufgaben gelöst werden können, macht eine tiefergehende Einarbeitung in das System für den Großteil des Teams unnötig. Komplettes Feature Set Data Warehouse Abläufe zeichnen sich typischerweise durch komplexe Abhängigkeitsbeziehungen und Ablauflogik aus. Damit zur Implementierung dieser Abläufe nicht auf Scriptinglösungen ausgewichen werden muss, muss das Scheduling System ein komplettes Feature Set mitbringen. Das BICsuite Scheduling System wurde auf Basis der komplexen Anforderungen eines großen Data Warehouses entworfen und über mehrere Jahre Produktivbetrieb stetig verbessert. Folgende Features des BICsuite Scheduling Systems seien hier exemplarisch genannt: Beliebig viele Benutzerdefinierte Exit Status erlauben eine flexible Reaktion auf das Ergebnis eines Jobs. (nicht nur Failure oder Success!) 3

Neben dem Exit Status können Jobs auch zusätzliche Ergebniswerte dem Scheduling System übergeben, welche im Monitoring angezeigt werden können, um dem Operator zusätzliche Informationen über Jobs zu geben. Auf Basis von Exit Status und Ergebniswerten kann die weitere Verarbeitung von Abläufen über Dependencies und Trigger gesteuert werden. Dazu gehören auch die bedingte bzw. wiederholte Ausführung von Ablaufteilen. Parameter und Ergebniswerte von Jobs können von nachfolgenden Jobs zur internen Steuerung herangezogen werden. Durch die Möglichkeit Abläufe hierachisch zu gliedern, wird die Definition von Dependencies und Triggern zur Ablaufsteuerung erheblich vereinfacht, die Wiederverwendbarkeit von (Teil)Abläufen verbessert und die Überschaubarkeit auch großer Abläufe gewährleistet. Beliebige Teile der Ablaufumgebung (Tabellen, Datenbereiche, DataMarts, Files,...) können als Status und Eigenschafts behaftete Ressourcen abgebildet werden, um Abläufe abhängig von Status und Aktualität der benötigten Ressourcen steuern zu können. (z.b.: Erzeugen eines Reports nur wenn der benötigte Datenbereich VALID ist und innerhalb des letzten Tages aktualisiert wurde). Der dynamische Submit erlaubt es Jobs andere Jobs bzw. Teilabläufe zur Laufzeit anzustoßen. Dies ermöglicht die programmatische Steuerung von Abläufen sowie die Paralleliserung von (Teil)Abläufen. Ein Warning System ermöglicht es den Operator auf mögliche Probleme aufmerksam zu machen, ohne den Ablauf zu beeinflussen. Ein vollständiges API erlaubt es alle Funktionen des BICsuite Scheduling Systems programmatisch zu steuern. Durch die Ablage aller Definitions-, Konfigurations- und Laufzeitdaten in einem RDBMS sind jederzeit beliebige Benutzerdefierte Auswertungen möglich.... Eine komplette Aufstellung aller Features würde hier den Rahmen sprengen. Die Vertreter der Enterprise Scheduling Systeme können hier meist nicht mithalten und erzwingen ein Ausweichen auf Scriptinglösungen. Dabei werden dann Aufgabenstellungen, welche sich nicht durch Features des Scheduling Systems lösen lassen in die Implementierung von Jobs verlagert. Ergebnis sind unflexible, nicht standartisierte, instabile und schwer zu wartende Individuallösungen. 4

Flexibilität In Data Warehous Umgebungen müssen Abläufe beinahe täglich angepasst werden. Hinzu kommt, dass die Abläufe häufig auch eine sehr lange Laufzeit besitzen. Dies führt dazu, dass noch während eine Instanz eines Ablaufes aktiv ist, dieser änderbar sein muss. Damit dies nicht zu Problemen in bereits aktiven und teilweise abgearbeiten Ablaufen führt, dürfen sich Änderungen nur auf neu gestartete Abläufe auswirken. Das Scheduling System muss also in der Lage sein, zu einem Zeitpunkt meherer Versionen einer Ablaufdefinition behandeln zu können. Das BICsuite Scheduling System versioniert deshalb alle Aspekte einer Ablaufdefinition und führt Abläufe in der Version aus, welche beim Start (Submit) des Ablaufes gültig war. Häufig müssen im Data Warehouse ad hoc Aktionen (Fehlerbereinigungen, Analysen, Migrationen,...) umgesetzt werden. Da das Erzeugen von Jobs und Abläufen im BICsuite Scheduling System nur wenige Handgriffe erfordern, können solche ad hoc Aktionen schnell und einfach unter die Kontrolle des Scheduling Systems gestellt werden und unterliegen damit der Ressourcenkontrolle des Systems. Die Risiken, dass solche ad hoc Aktionen, andere wichtige Produktionsabläufe stören, können dadurch deutlich reduziert werden. Operator Funktionen Um auf Ausnahmesituationen (die Regel in Data Warehouse Umgebungen) schnell, reagieren zu können stehen dem Operator Funktionen zum Eingriff in aktive Abläufe zur Verfügung. Diese sind: Anhalten und Weiterlaufenlassen von (Teil)Abläufen (Suspend/Resume) Neustart von Rerun von gescheiterten (Restartable) Jobs (Rerun) Setzen des Exit Status von Jobs Verwerfen von (Teil)Abläufen (Cancel) Ignorieren von Abhängigkeiten Ignorieren von Ressourceanforderungen Verändern der Scheduling Priorität von (Teil)Abläufen Beenden laufender Jobs (Kill) Kommentieren von (Teil)Abläufen Zurücksetzen von Warnings Verändern der Verfügbarkeit und Menge von Ressourcen 5

Starten/Stoppen von Jobservern Alle Operatoreingriffe werden zur späteren Nachvollziehbarkeit in einem Audit Trail festgehalten. Freiheit von Systemprivilegien Typischerweise stehen den Mitarbeitern eines Data Warehouse Teams keine Systemprivilegien (root Rechte,...) zur Verfügung. Benötigt das Scheduling System zum Betrieb bzw. Administration solche Privilegien, so kommt es bei nötigen Änderungen am System zu Zeitverzögerungen und zusätzlichen Kosten bei deren Umsetzung. Insbesondere gilt dies, wenn wie häufig anzutreffen, der Betrieb der Hardware und Betriebssystem an einem Outsourcer übergeben wurde. Das BICsuite Scheduling System benötigt für Installation, Administration und Betrieb keine solchen Privilegien. Damit ist ein schneller und kostengünstiger Zugriff auf alle Aspekte des Scheduling Systems stets gewährleitet. Schlußbemerkung Auch wenn in diesem Dokument nicht auf alle Aspekte und Features des BICsuite Scheduling Systems eingegangen wurde, sollte ein Eindruck über die Leistungsfähigkeit des BICsuite Scheduling Systems in Data Warehouse Umgebungen vermittelt worden sein. Für weitere Fragen steht Ihnen unser Team gerne zur Verfügung. 6