F

Ausfall von Amazon Web Services: Was heißt das für Disaster Recovery?

Was passiert, wenn der Cloud-Provider ausfällt? Wie sind die Auswirkungen auf Ihre Disaster-Recovery-Strategie? Wir zeigen, wie Sie vorsorgen können.

Wie viel ist ein DR-Plan (Disaster Recovery) noch wert, wenn das Cloud-Rechenzentrum ausfällt, das als Backup-Ziel dient? Eigentlich ist klar, dass jeder Computer ausfallen kann. Und dennoch muss man manchmal erst eine solche Situation erleben, bis man wirklich versteht, was das bedeutet. Dann ist sorgfältigere Planung angesagt.

Wie hat sich zum Beispiel Ihr DR-Plan während des Ausfalls von Amazons Simple Storage Service (S3) im Februar 2017 bewährt? Selbst wenn Sie einem anderen Cloud-Provider vertrauen, lässt sich etwas aus dem Ausfall von Amazon Web Services (AWS) lernen. Insbesondere müssen Storage-Verantwortliche die Service-Level-Agreements für jedes Element des DR-Planes genau kennen, besonders die der Elemente, die sie nicht selbst kontrollieren.

Ablauf des AWS-Ausfalls

Der Ausfall von Amazon Web Services im Februar 2017 lässt sich ziemlich einfach erklären: Ein AWS-Ingenieur gab während eines Wartungseingriffs einen Befehl falsch ein. Das führte dazu, dass die AWS-Infrastruktur, die S3 managt und überwacht, nicht so arbeitete wie sie sollte. Anscheinend konnte keine Anwendung, die S3 in der US-East-1-Region verwendet, neue Objekte erzeugen.

Für DR-Anwendungen bedeutete der Ausfall, dass neue Backups nicht gespeichert werden konnten, was zur Überschreitung kundenspezifischer Recovery Point Objectives (RPO) führte, also des maximalen Zeitraums, über den hinweg Daten verlorengehen dürfen. DR-Applikationen konnten auch nicht mit Hilfe bestehender Backups wiederhergestellt werden, was zur Überschreitung der angestrebten Recovery Time Objectives (RTO) führte, also der angestrebten Zeit bis zur Wiederherstellung der Daten.

AWS brauchte etwa sechs Stunden, um den Dienst komplett wieder funktionsfähig zu machen. AWS garantiert für S3 99,9 Prozent Verfügbarkeit im Monat, was maximal 44 Minuten Downtime pro Monat bedeutet. Deshalb sollte AWS selbstverständlich einen Anteil seiner Gebühren zurückzahlen – schließlich erreichte der Provider im betreffenden Monat nur 90 Prozent Verfügbarkeit. Aber das hilft Anwendern wenig, die während des AWS-Ausfalls einen DR-Vorfall hatten. Sie hätten im Zweifel mit der Wiederherstellung durch den letzten vollständigen Backup bis zum Ende des Ausfalls warten müssen.

So macht man es richtig

Als erstes gilt es zu begreifen, dass Sie als Anwender Cloud-Services nicht unter Ihrer Kontrolle haben. Wer den verfügbaren Service Level kennt, kann vernünftige geschäftliche Entscheidungen darüber zu treffen, ob ein spezifischer Cloud-Service zum eigenen DR-Bedarf passt.

Die Wahrscheinlichkeit, dass der Cloud-Provider genau dann ausfällt, wenn auch Ihr primäres Rechenzentrum ausfällt, ist gering. Eine Google-Suche ergibt, dass S3 seit Inbetriebnahme des Services 2006 nur drei größere Ausfälle zu verzeichnen hatte. Daher scheint das größere Risiko für RTO und RPO im Zusammenbruch der Netzwerkverbindung zwischen dem eigenen Rechenzentrum und AWS zu liegen. Erfasst Ihr DR-Plan diese beiden Risiken? Und ist es unter diesem Gesichtspunkt noch immer geschäftlich sinnvoll, Disaster Recovery as a Service (DRaaS) zu beziehen?

Allerdings gibt es Möglichkeiten, die Risiken durch Cloud- oder Netzwerkausfall zu verringern, beispielsweise kann man mehrere AWS-Sites als Backup-Ziel nutzen, falls das Management wegen eines Ausfalls der DR aus der Cloud misstraut. So beeinträchtigen zum Beispiel Winterstürme in der Region US-East-1 (Nord-Virginia) die Region EU-West-1 (Irland) nicht. Wenn ein S3-Bucket mit Backups von US-East-1 nach EU-West-1 repliziert oder die Backup-Anwendung so einstellt, dass sie von vorn herein Backups in beide Regionen sendet, ist Ausfallrisiko einer AWS-Region entschärft.

Manchmal ist es vielleicht sogar sinnvoll, ein S3-kompatibles Storage-System in einer Niederlassung zu installieren, auf das die Backup-Software schreibt.

Wirklich vorsichtige Anwender können für ihre Backups zwei unterschiedliche Cloud-Provider mit zwei vollständig voneinander getrennten Infrastrukturen nutzen. Doch das Mehr an Speicherbedarf und Netztransfers verursacht erhöhte Kosten. Zudem müssen bei einer solchen Lösung mehrere DR-Pläne gepflegt werden – einer für jeden Standort, auf die Daten repliziert werden. Wer nachrechnet, wird meist feststellen, dass der Extraaufwand die erhöhte Verfügbarkeit nicht aufwiegt.

Jedes Computersystem kann und wird einmal ausfallen. Cloud-basierende DRaaS ist da keine Ausnahme. Deshalb kommt es darauf an, sich darüber klar zu sein, was es für die Verfügbarkeit des Kerngeschäfts bedeutet, wenn die DR durch einen Ausfall des Cloud-Rechenzentrums wie den von AWS beeinträchtigt wird, und dann eine auf die individuelle Situation bezogene Entscheidung zu treffen.

Während die meisten Unternehmen wohl kaum mehr Geld ausgeben werden, um die Verfügbarkeit ihrer DR zu erhöhen, wird es einige Unternehmen geben, für die eine bestmögliche DR-Vorsorge erforderlich ist, egal, wie viel sie kostet.

Folgen Sie SearchStorage.de auch auf Twitter, Google+, Xing und Facebook!

Artikel wurde zuletzt im Mai 2017 aktualisiert

Pro+

Premium-Inhalte

Weitere Pro+ Premium-Inhalte und andere Mitglieder-Angebote, finden Sie hier.

Diskussion starten

Schicken Sie mir eine Nachricht bei Kommentaren anderer Mitglieder.

Mit dem Absenden dieser Daten erklären Sie sich bereit, E-Mails von TechTarget und seinen Partnern zu erhalten. Wenn Ihr Wohnsitz außerhalb der Vereinigten Staaten ist, geben Sie uns hiermit Ihre Erlaubnis, Ihre persönlichen Daten zu übertragen und in den Vereinigten Staaten zu verarbeiten. Datenschutz

Bitte erstellen Sie einen Usernamen, um einen Kommentar abzugeben.

- GOOGLE-ANZEIGEN

SearchSecurity.de

SearchNetworking.de

SearchEnterpriseSoftware.de

SearchDataCenter.de

Close