alphaspirit - Fotolia

Cloud-Datenmigration: Das sind die Hindernisse und so überwinden Sie sie

Eine Standardlösung für die Datenmigration zwischen Clouds ist vorläufig nicht abzusehen. Anwender müssen sich viele Lösungen selbst erarbeiten.

Die Public Cloud verspricht signifikante Vorteile, indem sie die kapital- und technologiefokussierte IT-Strategie durch operative Kosten ersetzt, bei der sich der Serviceprovider damit herumschlagen muss, die Infrastruktur zu verwalten.

Mit der allgegenwärtigen Ausrichtung auf virtuelle Maschinen (VM), die man in der Public Cloud in der Regel als Instanzen bezeichnet, und mit dem zunehmenden Einsatz von Container-Technologie werden Anwendungen immer mobiler.

Was aber taugt eine Anwendung ohne ihre Daten? Um den vollen Nutzen aus der Cloud zu ziehen, braucht man vollständige Datenportabilität zwischen Clouds, egal, ob nun aus dem oder ins firmeneigene Rechenzentrum oder unterschiedlichen Public Clouds.

Im Folgenden geht es um einige Herausforderungen rund um die Datenportabilität und die Lösungen einiger Hersteller für diese Aufgabe.

Wenn IT-Abteilungen ihre Anwendungen in die Public Cloud verlagern, müssen sie sich um einen großen Teil ihrer täglichen Pflichten rund um das Management und die Bereitstellung der Infrastruktur nicht mehr kümmern.

Diese Aufgaben übernimmt der Cloud-Provider. Er bietet IT-Services, die die Komplexitäten des Infrastruktur-Managements vor den Kunden verbergen. Nun können sich die IT-Organisationen auf Anwendungen, Daten und den Geschäftswert konzentrieren. Die Vorteile dieses Modells zeigen sich in geringeren Kosten, weil Services (anders als Infrastruktur) genau dann gekauft werden, wenn man sie braucht.

Selbstverständlich brauchen Applikationen ihre Daten und auch deren Portierbarkeit. Einige der Gründe für letzteres sind:

  1. Resilienz: Daten zwischen Public und Private Clouds verschieben zu können, macht sie widerstandsfähig und auch dann zugänglich, wenn ein einzelner Cloud-Provider technische Probleme hat.
  2. Funktionen: Der von Cloud-Anbietern gebotene Funktionsumfang unterscheidet sich deutlich voneinander. Google ist bekannt für seine Suite von Analysewerkzeugen. Andere Cloud-Provider bieten andere Funktionen an und legen viel Wert auf Compliance oder die Erfüllung regulatorischer Pflichten. Kunden werden daher wohl im Datenbereich meist mit mehreren Providern zusammenarbeiten.
  3. Kosten: Die Kosten der Anbieter von Public-Cloud-Storage liegen eng beisammen. Sparen kann man, wenn man bei großen Datenmengen einen Teil der Daten auf kostengünstigeren Storage-Tiers eines anderen Providers archiviert.
  4. Nutzen günstiger Rechenleistung: Cloud-Anbieter bieten Spot-Instanzen. Das ist kurzfristig verfügbare Rechenleistung mit Rabatt zu bestimmten Tageszeiten. Daten müssen so leicht portierbar sein, dass sie ausreichend schnell zur Verfügung stehen, um derart günstige Rechenleistung zu nutzen, wenn sie gerade erhältlich ist.

Technik, Betrieb und Kosten rund um die Cloud

Datenmobilität ist gut. Allerdings gibt es eine Reihe von Aspekten, unter denen der ständige Datenzugriff zum Problem werden kann.

Zunächst einmal setzt die Physik Grenzen. Schneller als mit Lichtgeschwindigkeit können Daten nicht reisen, deshalb entstehen bei Ein-/Ausgabeoperationen Verzögerungen. Also müssen Daten immer so nah wie möglich bei der Applikation gelagert werden. Beim Cloud-Computing bedeutet das, dass die Daten sich in derselben Cloud befinden sollten.

Verschiebt sich die Applikation, müssen ihr die Daten also folgen. Daten zwischen Clouds zu verschieben, ist zeitraubend und durch Durchsatz und Bandbreite der verfügbaren Verbindungen begrenzt. Dazu kommt ein Kostenfaktor, der weiter unten diskutiert wird.

Aus betrieblicher Sicht geht es um andere Themen. Cloud-Storage-Provider haben ihre eigenen Standards für Datenzugriff und Storage. Es gibt keine direkte Kompatibilität zwischen den Plattformen (oder zwischen der Cloud und dem firmeneigenen Rechenzentrum). Anders ist es, wenn Anbieter de-facto-Standards wie die S3-Schnittstelle von Amazon Web Services unterstützten.

Cloud-Provider haben kein Interesse daran, die Verschiebung von Daten von ihrer Plattform auf eine andere zu erleichtern. Daher vereinfachen die meisten Preismodelle den Datenimport in die Cloud, nehmen aber viel Geld, wenn die Daten zu einem anderen Provider transportiert werden sollen.

Allerdings beginnen einige Cloud-Provider mittlerweile, ihre Preispolitik hinsichtlich dieser Auslagerungskosten zu überdenken. Entweder sie reduzieren die Kosten für eine kleinere Menge von Datentransfers pro Monat oder sie verlangen Fixkosten statt variabler Preise für Datenexporte aus ihrer Cloud.

Können Daten effizient zwischen Cloud-Providern verschoben werden, muss man sich um das Thema Datenkonsistenz kümmern. Wenn es zwei Stunden dauert, Anwendungsdaten zu einem neuen Cloud-Provider zu kopieren, kann es sein, dass sie während dieser Zeit nicht zugänglich sind, damit sichergestellt ist, dass sie den neuen Cloud-Provider in dem Zustand erreichen, wie sie den bisherigen verlassen haben. Das bedeutet, dass Cloud-Bursting-Prozesse nicht so effizient ablaufen, wie die Branche das gern behauptet.

Ein Teil des Problems besteht in den Techniken, die für die Datenmigration in oder zwischen Public Clouds genutzt werden. Im firmeneigenen Rechenzentrum wird für Datenkopien zwischen geografisch voneinander entfernter Speicherhardware Replikation verwendet. Diesen Mechanismus verwendet man hauptsächlich für Resilienz- und Disaster-Recovery-Funktionen.

Ein Vorteil der Replikation besteht darin, dass die Daten am Zweitstandort synchron oder nahezu synchron mit der Quelle sind. Daher ist das Verschieben zur Disaster-Recovery-Site mit nur sehr geringer Ausfallzeit möglich.

Die Cloud bietet nativ nicht dieselbe Flexibilität wie traditionelles Storage. Es gibt dort kein Äquivalent zur Array-basierenden Replikation. Das bedeutet, dass man andere Lösungen auf Ebene der virtuellen Maschinen oder der Applikation braucht.

Zudem ist die Array-basierende Replikation ein sehr statischer Prozess. Replikationsquelle und –ziel sind genau im Voraus festgelegt. Im Gegensatz dazu ist die Cloud weitaus dynamischer. Die Kunden wissen unter Umständen nicht genau im Voraus, wo ihre Anwendung laufen soll – insbesondere in Anbetracht von Spot-Preisen.

Mögliche Lösungen, die Daten in der Cloud mobil machen

Welche Lösungen gibt es, um Daten portabel zu machen? Anbieter verwenden eine Reihe von Technologien:

  1. Caching: Caching-Lösungen sorgen dafür, dass Daten, unabhängig davon, wo sie permanent liegen, dort verfügbar sind, wo die Anwendung läuft. Zu den derzeit verfügbaren Caching-Techniken gehören NAS-Caching von Anbietern wie Avere und Primary Data, das Caching virtueller Maschinen (VM) von Velostrata und  Storage-Gateways von Herstellern wie AWS oder StorSimple/Microsoft. Caches sind gut darin, lokale Daten zeitweise zur Applikation zu bringen, aber sie eignen sich nicht dafür, Daten permanent in die Cloud zu verschieben.
  2. Globale Scale-Out Daten: Hiervon gibt es zwei Typen. Globale NAS-Systeme, die ein einziges global verteiltes Dateisystem von jedem Ort aus verfügbar machen, wo Applikationen laufen. Zu den Anbietern derartiger Systeme gehören Panzura, Nasuni und Elastifile.

Außerdem gibt es verteilte Storage-Plattformen mit Objekt- und Block-basierenden Lösungen über verschiedene Geografien hinweg. Beispiele sind Hedvig, Datera und NooBaa.

Globale Dateisysteme garantieren einen gewissen Grad an Datenintegrität durch globales File-Locking. Objektlösungen bieten Endkonsistenz. Block-basierende Systeme bieten keinen Schutz gegen den Verlust der Datenintegrität, sie überlassen dies der Applikation.

  1. Data Protection: Einige Lösungen nutzen Data-Protection-Techniken, um Daten in die Cloud hinein und aus ihr heraus zu bekommen. Zu ihnen gehören die Replikationslösung von Zerto und die Zeitbasierte Replikation von Reduxio. Außerdem gibt es Anbieter, die mit einer Hardwareinfrastruktur integrierte Software anbieten. Beispiele sind HPE StoreVirtual und NetApp Cloud ONTAP.
  2. Private Storage: Mindestens drei Firmen bieten Private Storage an, das sich in der Nähe des Cloud-Providers in einem Kollokations-Rechenzentrum oder sogar im selben physischen Gebäude befindet. Dabei handelt es sich um Zadara Storage, NetApp und Nimble Storage, das jetzt zu HPE gehört.

Diese Produkte haben traditionelle Funktionen einschließlich Replikation zwischen Hardware, die einen gewissen Grad an Datenportabilität ermöglichen, ohne dass der Anwender dafür bezahlen muss, die Hardwareinfrastruktur einzusetzen.

Anwendungsspezifische Portabilitätsmechanismen nutzen

Die Lösungen, die bisher diskutiert wurden, gehören eher in die Kategorie Infrastruktur. Allerdings kann man auch applikationsbasierende Datenportabilitätsmechanismen verwenden.

NoSQL-Plattformen wie MongoDB bieten Datenspiegelung zwischen Cloud-Instanzen an. Die Replikation kann auch mit traditionellen Datenbanken gemanagt werden.

Google hat kürzlich Spanner in den Markt eingeführt, eine global verteilte SQL-Datenbank, auf die von jeder Spanner-fähigen GCP-Präsenz aus zugegriffen werden kann. Damit können Kunden verteilte Applikationen bauen, ohne sich um strukturierte Datenportabilität zu kümmern.

Diese Beispiele zeigen, dass es heute ein stark divergierendes Lösungsangebot gibt, wobei die Lösungen jeweils spezifische Anforderungen von Anwendungen unterstützen.

Noch existiert keine vereinheitlichte „Datenebene“, die das Thema Datenmigration zwischen Clouds umfassend löst. Heftiger Wettbewerb deutet darauf hin, dass entsprechende Vorschläge wohl eher nicht von Cloud-Providern kommen werden. Anwender bleiben also für die Verwaltung ihrer Daten selbst verantwortlich.

Folgen Sie SearchStorage.de auch auf Twitter, Google+, Xing und Facebook!

Nächste Schritte

Datenmigration gehört zu den Herausforderungen der hybriden Cloud

So führen Sie Datenmigrations-Projekte erfolgreich durch

DSGVO / GDPR: Was Datenportabilität für Storage-Systeme bedeutet

DSGVO / GDPR: Lösungen für Data Discovery und Transparenz

Artikel wurde zuletzt im Juni 2017 aktualisiert

Pro+

Premium-Inhalte

Weitere Pro+ Premium-Inhalte und andere Mitglieder-Angebote, finden Sie hier.

Erfahren Sie mehr über Public Cloud

Diskussion starten

Schicken Sie mir eine Nachricht bei Kommentaren anderer Mitglieder.

Mit dem Absenden dieser Daten erklären Sie sich bereit, E-Mails von TechTarget und seinen Partnern zu erhalten. Wenn Ihr Wohnsitz außerhalb der Vereinigten Staaten ist, geben Sie uns hiermit Ihre Erlaubnis, Ihre persönlichen Daten zu übertragen und in den Vereinigten Staaten zu verarbeiten. Datenschutz

Bitte erstellen Sie einen Usernamen, um einen Kommentar abzugeben.

- GOOGLE-ANZEIGEN

SearchSecurity.de

SearchNetworking.de

SearchEnterpriseSoftware.de

SearchDataCenter.de

Close