Auf dem Prüfstand: Cloud-basiertes Disaster Recovery

Klassisches Disaster Recovery ist aufwändig und teuer. Cloud-DR nutzt dagegen Virtualisierungs- und Cloud-Technologien und ist einfacher und billiger.

Disaster Recovery ist als Killer-Applikation für die Cloud-Plattform bezeichnet worden. Cloud-basiertes Disaster Recovery (DR) bietet in der Tat einige verblüffende Vorteile gegenüber schon länger bestehenden DR-Lösungen, unabhängig, ob diese klassischen Szenarios nun eine dedizierte IT-Infrastruktur an einem zweiten Standort oder nur das Verschieben von Daten zu einem externen Speicherplatz einschließen.

Cloud-DR bietet Einfachheit, schnelles Recovery und niedrigere Kosten, sowohl unter dem Aspekt der eigentlichen Infrastruktur als auch unter dem des notwendigen Managements. Kurz gesagt, indem man die Cloud als eine DR-Plattform nutzt, kann man einen besseren Mehrwert als mit traditionellen Methoden erhalten, und man erhält für viele Unternehmen eine wirklich effektive Lösung für Disaster Recovery, unabhängig von ihrer Größe.

Dieser Artikel definiert Cloud-basiertes DR, prüft die Technologien, die Cloud-DR (oder DR as a Service) zu so einem „heißen Thema“ gemacht haben, und betrachtet schließlich unterschiedliche Varianten von Cloud-DR-Lösungen. Wir diskutieren auch einige der Details, die sich hinter dieser Technologie verstecken und deren sich Unternehmen bewusst sein sollten, bevor sie einen dieser Services einrichten.

Definition von DR

Ein Desaster (engl. Disaster) oder eine Katastrophe in der IT ist alles, was eine ungeplante Ausfallzeit für einen Server oder für eine Applikation verursacht und das wichtig genug ist, dafür einen eigenen DR-Plan aufzustellen. 

Dies bedeutet, dass ein solcher Katastrophenfall durch ganz verschiedene Ursachen ausgelöst werden kann – zum Beispiel durch einen isolierten Hardware-Defekt, durch Data Corruption auf einem Speichersystem oder sogar durch einen Administrator, der aus Versehen einen Server herunterfährt. 

Eine Katastrophe dieser Art kommt nicht erst dann zustande, wenn das Rechenzentrum zwei Meter unter Wasser steht oder ein großes Unwetter ausgebrochen ist. De facto betreffen die meisten Ausfälle auch nicht das ganze Rechenzentrum, sondern nur Teile davon.

Unter einem Recovery ist dann die Fähigkeit zu verstehen, Anwendungen wieder hochzufahren und User und andere Applikationen wieder mit ihnen zu verbinden. Es geht also nicht nur darum, die Daten wieder herzustellen. Wirksame Recovery-Prozesse erforderten in der Vergangenheit redundante Infrastrukturen, aber angesichts von Virtualisierung reicht heute ein zweiter Host, auf dem eine Kopie einer kritischen virtuellen Maschine (VM) läuft, aus, um eine komplette Disaster-Recovery-Lösung zu ersetzen. 

Natürlich ist auch heute für einen funktionierenden DR-Plan sehr viel mehr nötig, als nur ein paar VMs in einem Cloud-Rechenzentrum vorrätig zu halten, aber diese Technologie kann dafür sorgen, den ganzen Recovery-Prozess zu vereinfachen und zumindest potentiell die Kosten von traditionellen DR-Lösungen zu senken.

Definition von Cloud-basierter DR

Für Cloud-DR sind mehrere Definitionen möglich, aber für unsere Zwecke gehen wir von folgender Situation aus: Vorausgesetzt ist ein Unternehmen, das geschäftskritische Applikationen in seinem eigenen Rechenzentrum laufen hat und die dabei entstehenden Daten in Form von VM-Images in die Cloud verschiebt. Die Lösung schließt üblicherweise die Fähigkeit ein, diese VMs in der Host-Infrastruktur neu zu starten, in der sie gespeichert sind.

Die Server-Virtualisierung hat den Recovery-Prozess nachhaltig vereinfacht. Indem eine komplette Server-Instanz in eine Datei oder auch zwei gekapselt werden kann, ist der Neustart einer VM fast so leicht geworden wie das erneute Speichern einer VMDK- oder VHD-Datei. 

Das wird vielleicht nicht die Anforderungen sämtlicher Unternehmen erfüllen, aber so eine „abgespeckte“ DR-Lösung kann so einfach auszuführen sein wie eine Backup-Version einer VM an einem Ort abzulegen und ihre dazugehörigen Dateien an den Original- oder einen Standby-Server zurück zu kopieren.

Recovery an Ort und Stelle

Virtuelle Maschinen kann man auch „an Ort und Stelle“ laufen lassen, indem man einen Recovery-Server an den Backup-Speicherort dirigiert. Mit dieser Funktionalität wandelt sich Cloud-basiertes Backup effektiv in Cloud-DR. 

Zugleich wird damit das neue Marktsegment DR-as-a-Service erzeugt. Während dieser Prozess auf jeden Fall deutlich schnellere Recovery-Zeiten verspricht als das Zurückspielen von VM-Images aus der Cloud, bleiben dennoch einige Fragen offen – meistens drehen sie sich rund um das Thema Latenzzeiten. Anwender sollten sich darüber klar sein, dass noch nicht alles voll und ganz gelöst ist.

Was ist DRaaS?

„Disaster Recovery (DR) as a Service“ besteht im wesentlichen aus Cloud-DR, so wie wir dies definiert haben. In der Tat werden diese beiden Begriffe von den meisten Herstellern abwechselnd gebraucht, da sie eine möglichst große Attraktivität für ihre Produkte anstreben. 

In der Praxis bestehen einige Unterschiede hinsichtlich der Berücksichtigung der Infrastruktur in den monatlichen Abrechnungen. Diese hängen davon ab, ob der Cloud Provider lediglich Cloud-Ressourcen anmietet oder ob er auch eine On-Site-Appliance unterstützt. Aber da Cloud-DR nicht irgendeine Form von Co-location darstellt, bei der der Kunde die Geräte zur Verfügung stellt, verkaufen Cloud Provider de facto DR als ein Service-Paket.

Service-Provider für Cloud-DR

Es gibt zwei miteinander verwandte Ansätze für Cloud-basierte DR: Ein bestehender Backup-Provider fügt seiner Cloud die Option hinzu, auch VM-Images zu speichern und laufen zu lassen. Ein bestehender Service-Provider, der bereits Storage-, Compute- oder Infrastructure-as-a-Service anbietet, fügt einen Disaster-Recovery-Service hinzu.

Provider für Cloud-Backup. Backup und Disaster Recovery überschneiden sich an manchen Stellen und beide werden für eine umfassende Data-Protection-Lösung gebraucht. Aus diesem Grund ist es für einen bestehenden Backup-Anbieter, der Off-Site-Storage zur Verfügung stellt, logisch, auch Cloud-DR hinzuzufügen. 

Viele Anbieter haben das bereits getan. Eine gemeinsame Architektur impliziert den Einsatz einer On-Site-Appliance, entweder als physisches Gerät oder als virtuelle Maschine, um so lokale Backups zu kontrollieren und Daten-Übertragungen in die Cloud zu verwalten. Viele dieser Lösungen bieten eine Umwandlung von physisch zu virtuell an, um Data Protection für noch nicht virtualisierte Bare-Metal-Server zu liefern, um sie so in den DR-Plan miteinzubeziehen.

Die meisten dieser Provider bieten auch die Option an, VMs in der Cloud laufen zu lassen – gewöhnlich in ihrer eigenen Cloud-Infrastruktur. Die Failover- und Failback-Prozesse unterscheiden sich jedoch je nach Anbieter, entsprechend den Charakteristika ihrer jeweiligen Cloud-Infrastrukturen. 

Viele dieser Lösungen richten sich an kleine oder mittelgroße Unternehmen und arbeiten mit solchen Versprechungen wie „Disaster Recovery mit nur einem Klick“. Ganz offensichtlich sollten die Kunden ein Verständnis dafür entwickeln, wie diese Angebote funktionieren und welche Risiken damit verbunden sind. Auf der anderen Seite gibt es sicherlich auch einige Vorteile, die dieser Ansatz mit sich bringt.

Die Kombination von Backup und DR kann den Prozess der Datensicherung vereinfachen, und indem eine On-Site-Appliance benutzt wird, ist eine lokale Kopie der Daten für schnellere File-Restores und – falls nötig – für Server-Recovery verfügbar. Da die meisten Katastrophenfälle in der Regel nur einen Server oder eine Anwendung betreffen und nicht zu einem kompletten Ausfall des Rechenzentrums führen, stellt eine lokale Kopie, die dann eine Wiederherstellung des Servers oder der Applikation anstoßen kann, eine logische und effiziente Lösung dar. 

Eine hybride Appliance vereinfacht den Datenverkehr mit der Cloud und reduziert die laufenden Kosten dieses Prozesses. Sie stellt auch einige Optionen zur Verbesserung des Failback-Vorgangs zur Verfügung, indem sie die Synchronisation mit den Host-Servern übernimmt.

Zu der Masse an Anbietern, die Cloud-DR in eine Datensicherungs-Lösung auf einer On-Site-Appliance hinzugefügt haben, gehören Firmen wie Acronis nScaled, Axcient, Barracuda Networks, Datto, Quantum, Quorum und Unitrends. Es gibt Lösungen für Cloud-Backup einschließlich Optionen für Disaster Recovery, die sich nicht auf eine On-Site-Appliance stützen, aber die hybride Methode ist sehr weit verbreitet und bietet einige deutliche Vorteile.

Provider für Cloud-Infrastruktur. Der andere Ansatz für Cloud-basiertes DR beruht auf Dienstleistungen wie Hosting, Cloud-based Storage und Compute für Infrastruktur-Aufgaben und wird zusätzlich um eine DR-Option ergänzt. 

Einige Firmen bieten Plattform-spezifische Lösungen an, die sich auf die Storage-Systeme ihrer Kunden stützen, um auf diese Weise angepasste Replikationsprozesse zu ermöglichen. Aber die meisten von ihnen bieten ihre eigenen Dienstleistungen für Cloud-Storage und für Compute an, mit denen man Speichern und Lauffähigkeit von VMs in der Cloud unterstützt.

Ihre Angebote unterscheiden sich stark voneinander, von einer vollständigen „disruptive“ Lösung, die on-site installiert ist und vom Provider gemanagt wird, bis hin zu einer einfachen Unterstützung der „Building Blocks“, die ein Unternehmen braucht, um ernsthaft seine eigene Lösung für Cloud-DR zu schaffen. 

Die spezifische Architektur hängt in jedem Fall von dem Service Provider und der Ausgangssituation beim Kunden ab, aber im allgemeinen wird eine Software verwendet, die auf einem dedizierten Server oder einer dedizierten VM läuft und die den Datenverkehr mit der Cloud reguliert und kontrolliert.

Diese Provider konzentrieren sich in der Regel auf das obere Marktsegment: Hier kommt es nicht nur darauf an, bloß einen Host in der Cloud zu besitzen. Ihre Botschaft besteht darin, dass man weder die Qualität der Cloud-Infrastruktur als gegeben sehen sollte noch die Erfüllung der Implementierungs- und Support-Anforderungen, die die meisten Provider anbieten. 

Viele Provider strengen sich allerdings an und wollen die Kundenbedürfnisse auch dann befriedigen, wenn eine Applikation ihren Dienst versagt und an die Cloud weitegegeben wird. Und sie wollen die User und andere Anwendungen am „Front-End“ wieder mit den ausgefallenen Servern verbinden und nicht nur dafür sorgen, dass die abgespeicherten VMs wieder am „Back-End“ zum Laufen kommen.

Einige der Unternehmen, die diese Dienstleistungen anbieten, waren schon in dem klassischen DR-Markt mit redundanten Infrastrukturlösungen aktiv, aber nun haben sie die Vorteile des VM-basierten Disaster Recovery entdeckt. Eine kleine Auswahl von Anbietern umfasst hier Amazon (mit Partnern), Databarracks, Egenera, IBM SoftLayer, Rackspace, EVault (Seagate) und Windstream. VMware hat ebenfalls einen DR-Service in der Cloud aufgesetzt und verwendet seine Hypervisor-basierte Replikationslösung, um VM-Images in die Cloud zu verlagern.

Was bei Cloud-DR besonders wichtig ist

Nicht die lokalen IT-Ausfallszenarios vergessen. Während Unwetterkatastrophen jeder Art regelmäßig die Schlagzeilen besetzen, ist es wesentlich wahrscheinlicher, dass ein Unternehmen den Ausfall von Anwendungen aus so profanen Gründen wie einem Hardware-Crash, beschädigter Software oder wegen menschlichem Versagens erleben wird. Deshalb kann eine Lösung für Cloud-DR eine gewisse Attraktivität für sich beanspruchen, die auf einer On-Site-Storage-Komponente und der Fähigkeit beruht, LAN-basierte Recovery-Möglichkeiten für ausgefallene Server zur Verfügung zu stellen.

Cloud-Backup wird zu Cloud-Compute. Wenn ein Unternehmen entscheidet, eine Anwendung in der Cloud laufen zu lassen anstatt im heimischen Rechenzentrum, verändert sich seine Beziehung zum Cloud-Provider – der Dienstleister für das Cloud-Backup wird zu einem für Cloud-Rechenoperationen (= Cloud-Compute). Für die Kunden kommt es darauf an zu verstehen, welche Arten von Service Level Agreements (SLAs) der Provider anbietet und wie lange die eigenen Anwendungen in der Cloud unterstützt werden. 

Im Falle einer regionalen Katastrophe, die mehrere Unternehmen betrifft, kann der Provider schnell überfordert sein, wenn von mehreren Seiten aus gleichzeitig ein Recovery-Prozess angestoßen wird. Damit die Kunden auch wirklich den Service bekommen, den sie erwarten und den sie benötigen, brauchen sie wirksame SLAs auf Server-Ebene und nicht nur bloße Versprechungen.

Erneuerte Verbindung nicht vergessen. Abgestürzte Server in der Cloud neu zu starten, macht den ersten Schritt im Recovery-Prozess aus, aber es ist nicht der einzige. User und andere Applikations-Server müssen ebenfalls mit jenen VMs verbunden werden. Unternehmen, die sich mit Cloud-DR beschäftigen, müssen auch an solche Details wie Networking, Firewalls, Port Monitoring, Intrusion Protection und Security denken. Alle diese Faktoren beeinflussen die Lauffähigkeit von produktiven Anwendungen in der Cloud, während man die primären Infrastrukturen repariert.

Exit-Strategie. Schließlich sollten Unternehmen sich rechtzeitig Gedanken darüber machen, wie sie eventuell wieder aus Cloud-DR aussteigen – also darüber, wie ein Failback funktioniert und wie lange es dauern wird. Je länger eine Anwendung in der Cloud läuft, desto mehr Zeit wird es in Anspruch nehmen, sie wieder über das Netz mit dem primären Server zu synchronisieren. Für große Datenmengen kann die Lösung sogar darin bestehen, eine Speicher-Appliance zum ursprünglichen Rechenzentrum zu transportieren, aber für diesen Prozess ist ebenfalls eine Re-Synchronisierung notwendig, um zumindest die Transportzeit zu überbrücken.

Fazit

Cloud Disaster Recovery ist eine hervorragende Nutzanwendung der aktuellen Cloud- und Virtualisierungstechnologien. Das Wachstum bei Server-Virtualisierung, Cloud Services und hybriden Backup-Lösungen bietet jenen Unternehmen, die sich nie eine traditionelle DR-Infrastruktur leisten konnten, nun eine umfassende Möglichkeit für „echtes“ Disaster Recovery. 

Die Details einer Cloud-DR-Lösung dürfen dabei aber nicht vernachlässigt werden. Dies gilt besonders für alle Aspekte des Recovery-Prozesses: Welche SLAs bietet zum Beispiel der Provider an? Wie verfährt die Cloud-Umgebung mit der nötigen Neuanbindung von Usern und Anwendungen? Und wie sieht die Exit-Strategie aus, wenn die Katastrophe wieder vorbei ist? Unternehmen sollten auch eine Lösung erwägen, die eine On-Site-Appliance einschließt, um ein Recovery für lokale oder begrenzte IT-Ausfälle bereit zu stellen.

Folgen Sie SearchStorage.de auch auf Twitter, Google+ und Facebook!

Artikel wurde zuletzt im Februar 2015 aktualisiert

Pro+

Premium-Inhalte

Weitere Pro+ Premium-Inhalte und andere Mitglieder-Angebote, finden Sie hier.

Erfahren Sie mehr über Data-Center-Storage

Diskussion starten

Schicken Sie mir eine Nachricht bei Kommentaren anderer Mitglieder.

Mit dem Absenden dieser Daten erklären Sie sich bereit, E-Mails von TechTarget und seinen Partnern zu erhalten. Wenn Ihr Wohnsitz außerhalb der Vereinigten Staaten ist, geben Sie uns hiermit Ihre Erlaubnis, Ihre persönlichen Daten zu übertragen und in den Vereinigten Staaten zu verarbeiten. Datenschutz

Bitte erstellen Sie einen Usernamen, um einen Kommentar abzugeben.

- GOOGLE-ANZEIGEN

SearchSecurity.de

SearchNetworking.de

SearchEnterpriseSoftware.de

SearchDataCenter.de

Close