Speicher in der Cloud Kostenbremse, Sicherheitsrisiko oder Basis für die unternehmensweite Kollaboration? von Cornelius Höchel-Winter 2013 ComConsult Research GmbH, Aachen
3 SYNCHRONISATION TEUFELSZEUG ODER NÜTZLICHES WERKZEUG? Abgesehen von einigen Ausnahmen wie Tonido, aero oder BitTorrent Sync, die eine direkte Peer-to-Peer-Synchronisation anbieten, erfolgt die Synchronisation bei allen anderen Cloud-Storage-Providern immer zwischen dem zentralen Server beim Provider auf der einen Seite und dem jeweiligen Endgeräten auf der anderen. Das heißt, es gibt keine direkten Synchronisationsbeziehungen Abbildung 1: Kommunikationsbeziehungen bei Synchronisation 2013 ComConsult Research GmbH, Aachen Seite 15
Quelle: Apple.com Abbildung 2: Synchronisation in der Werbung: Your documents on all your devices. zwischen den Endgeräten: Eine Datei von Endgerät A wird immer zuerst zum Provider hochgeladen und erst dann vom Endgerät B wieder heruntergeladen. Lediglich Dropbox unterstützt mit der Einstellung LAN-Synchronisation eine direkte Client-Client-Kommunikation unter der Voraussetzung, dass beide Was bedeutet aber Synchronisation im konkreten Einsatz, im täglichen Arbeitseinsatz? Glaubt man der Werbung (Abbildung 2), ist die Antwort überzeugend: Verfügbarkeit aller Dokumente auf allen Geräten zu jeder Zeit. Was aber im privaten Umfeld toll klingt und für das Herumzeigen von Urlaubsfotos tatsächlich ganz hilfreich ist, wird im Unternehmensnetzwerk schnell zum Bumerang: 2013 ComConsult Research GmbH, Aachen Seite 16
Synchronisation bedeutet nämlich aus einer etwas anderen Perspektive schlicht redundante Daten! Und wer sich schon mal auch nur am Rande mit Unternehmensorganisation und Betriebsabläufen beschäftigt hat, weiß: Redundante Daten sind schlecht! Und jede Technologie, die redundante Daten erzeugt, macht aus betrieblicher Sicht früher oder später Probleme. Klassisches Bespiel hierfür ist die Unsitte, verschiedene Versionsstände eines Dokuments per E-Mail zu verteilen. Jetzt ist die Idee hinter einer Synchronisation ja durchaus Kopien zu erzeugen, aber keine unabhängigen Kopien wie beim E-Mail-Versand, sondern eben abhängige, miteinander oder mit einer Masterkopie verknüpfte Kopien, die möglichst alle automatisch auf dem aktuellen Stand gehalten werden sollen. Wenn Sie schon einmal versucht haben E-Mail-Kontakte oder -Termine zwischen unterschiedlichen Providern und unterschiedlichen Clients zu synchronisieren, wissen Sie, was davon zu halten ist. Synchronisation ist unserer Erfahrung nach ein sehr kritischer und fehlerbehafteter Dienst, der es zumindest erfordert, dass seine Funktionsmerkmale detailliert unter die Lupe genommen und analysiert werden: IN WELCHE RICHTUNG WIRD SYNCHRONISIERT? Im Grunde sind die einzigen Synchronisationsverfahren, die immer und unter allen Betriebssituationen funktionieren oder nach einem Fehler problemlos wieder aufgesetzt werden können, Master-Slave-Verfahren. Änderungen werden hierbei ausschließlich am Master vorgenommen, die Slave-Kopien werden ausschließlich lesend genutzt. Es mag hier und da Ausnahmen von dieser Aussage geben, nicht jede Software ist schlecht oder schlampig programmiert. Aber bedenken Sie, es geht um Ihre Daten, das sind in aller Regel unstrukturierte Daten, also Daten, die in den unterschiedlichsten Dateiformaten vorliegen, und es geht, wenn Sie über Cloud Storage nachdenken, schnell um riesige Mengen von Daten. Eine Master-Slave-Synchronisation kommt aber nicht in Frage. Die eigentliche Kernaufgabe der hier betrachteten Datei-Synchronisationstools ist es ja gerade, die Dateien aus der Cloud heraus auf das Endgerät des Benutzers zu holen, um so dem Benutzer eine gewohnte Umgebung mit lokal verfügbaren Daten zur Verfügung zu stellen, in der er seine gewohnten (Desktop-)Anwendungen weiterhin nutzen kann. 2013 ComConsult Research GmbH, Aachen Seite 17
Das heißt, die Dateien werden bei einer Synchronisation also per Design auf den verschiedenen Endgeräten geändert, die Cloud selbst dient da dann eher lediglich als Nachschlage- oder Lesespeicher. Gleichzeitig müssen die hochgeladenen veränderten Daten von den andern Clients wieder runtergeladen werden. Es findet also eine klassische Zweiwege-Synchronisation statt mit der Gefahr, dass Synchronisationskonflikte auftreten. WAS PASSIERT, WENN SYNCHRONISATIONSKONFLIKTE AUFTRETEN? Die wichtigste technische Herausforderung an ein solches Synchronisationsverfahren ist es daher, mit Dateien umgehen zu können, die mehr oder weniger gleichzeitig auf verschiedenen Endgeräten verändert wurden. Und die ernüchternde Erkenntnis unserer Untersuchungen ist, dass die Mehrzahl der Produkte schlicht die letzte Änderung berücksichtigt. Eine Prüfung, ob eine Datei mehrfach geändert wurde, findet bei diesen Produkten einfach nicht statt oder wird ignoriert. Die Alternativen zu dieser recht plumpen Strategie sind übrigens auch nicht wirklich überzeugend. Box erkennt beispielsweise durchaus einen Konflikt (siehe Abbildung 3) und erzeugt dann eine zweite Datei mit leicht verändertem Namen. Ok, die Änderungen, die beide Seiten gemacht haben, gehen damit nicht verloren. Wer aber soll die Änderungen zusammenführen? Geht das überhaupt? Der erste Editor wird noch nicht einmal darüber informiert, dass es einen Konflikt gibt! Abbildung 3: Synchronisationskonflikt bei Box 2013 ComConsult Research GmbH, Aachen Seite 18