Wiederherstellung nach einem Störfall: Rechenzentrums-Checklisten

Ein Recovery nach einem Störfall ist nie einfach. Wappnen Sie sich mit unseren Rechenzentrums-Checklisten, um den Recovery-Prozess zu erleichtern.

Als Sie für Ihr Rechenzentrum einen Disaster-Recovery-Plan (DRP) erstellt haben, haben Sie ihn darauf ausgelegt, dass er die Investitionen Ihres Unternehmens in die IT, in die Kommunikation und sein Personal schützt. Je nach der Art des Zwischenfalls kann die Integrität Ihres Rechenzentrums davon entweder unberührt bleiben oder komplett zerstört werden.

DR-Pläne müssen so flexibel und skalierbar sein, dass sie eine breite Palette von Ausfall-Szenarien abdecken. In diesem Artikel stellen wir Ihnen Checklisten empfohlener Schritte vor, die Sie nach einem ernsten Zwischenfall ergreifen sollten. 

Diese Checklisten werden Ihnen die Wiederherstellung nach einem Störfall erleichtern. Stellen Sie sicher, dass Sie die Rechenzentrums-Checkliste – oder eine für ihre Belange modifizierte Version davon – zur Hand haben, wenn Sie die Folgen des Störfalls für ihr Rechenzentrum untersuchen. Sobald Sie die initiale Bewertung der Situation abgeschlossen haben und mit dem Standort ihres Personals zufrieden sind, fangen Sie mit der Umsetzung Ihres DR-Plans an.

Überlegungen bei der Disaster Recovery Planung für das Rechenzentrum

Ein Disaster-Recovery-Plan für ein Rechenzentrum beschäftigt sich einzig und allein mit dem Rechenzentrum und seiner Infrastruktur, also der physischen Einrichtung, der Konstruktion, den Stromquellen, den Umweltsystemen und den Mitarbeitern. Stellen Sie sicher, dass Sie sowohl alle betrieblichen Aspekte Ihres Rechenzentrums als auch die Mitarbeiter berücksichtigt haben. Das heißt, Sie sollten die folgenden Punkte adressieren, wenn Sie Ihren DR-Plan erstellen:

  • Technik- und Verwaltungs-Mitarbeiter des Rechenzentrums, alle Schichten;
  • Rechenzentrumsgebäude (zum Beispiel physische Infrastruktur, Konstruktion, Lage der Ein- und Ausgänge, Doppelbodenbereiche);
  • Lage des Gebäudes (zum Beispiel Zugangswege, Nähe zu Autobahnen und Bahnlinien, Nähe zu Treibstofflagern);
  • Stromerzeugung (zum Beispiel kommerzielle Anbieter, Backup-Systeme);
  • Schutz vor Stromschlägen (Erdung, Blitzableiter, Überspannungsschutz, Leitungsregler);
  • Umweltsysteme (zum Beispiel Heizung, Ventilation, Klimatisierung);
  • Kritische Systeme (zum Beispiel Server, Energieverteiler, VoIP-Systeme, Callcenter-Systeme);
  • Netzwerk-Infrastruktur (zum Beispiel Verkabelung, Router, Kupfer- und Lichtwellenleiter, Kabelschränke);
  • Sicherheit (physischer Zugang und Informationssicherheit);
  • Arbeitsplätze (zum Beispiel Büros, Konferenzräume, Möbel, Beleuchtung);
  • Feuerschutz (zum Beispiel Feuermelder, Rauchmelder, Feuerlöscher, FM200-Löschsysteme);
  • Türen und Wände des Gebäudes (Brandschutzwände und -türen, Doppelböden);
  • Hilfsmittel (zum Beispiel Wasser, Kanäle, Strom, Kommunikation).

Entwicklung eines Reaktionsplans

Wenn Sie die einzelnen Schritte eines Reaktionsplans entwickeln (der Reaktionsplan als Teil eines DR-Plans), sollten Sie Ihre Ideen mit dem Gebäudeverwalter (sofern Sie ein Mieter sind) oder Ihrem Facility Manager (wenn es Ihr eigenes Gebäude ist) und auch Ihrem IT-Management diskutieren. Besprechen Sie Ihren Reaktionsplan mit allen betroffenen internen und externen Beteiligten (wie etwa den Ersthelfern), um sicherzustellen, dass Sie wirklich an alles gedacht haben.

DR-Pläne müssen so flexibel und skalierbar sein, dass sie eine breite Palette von Ausfall-Szenarien abdecken.

Berücksichtigen Sie auch die folgenden Punkte bei der Erstellung:

  • Beziehungen zwischen den unterschiedlichen IT-Gruppen, wie zum Beispiel das Team für interne Technologie, das Team für Anwendungssoftware und die Netzwerk-Administratoren. Dies stellt sicher, dass alle Gruppen, die regelmäßig auf das Rechenzentrum zugreifen, eine Rückmeldung bei der Planung geben können.
  • Beziehungen zwischen externen Beteiligten, wie zum Beispiel Lieferanten oder Managed-Service Provider.
  • Beziehungen zwischen anderen Niederlassungen (sofern Sie welche haben), da diese ein wichtiger Teil des Wiederherstellungsplans sein könnten (zum Beispiel durch alternative Rechenzentrums-Kapazitäten).
  • Relevante Dokumente zur Infrastruktur, etwa Gebäudepläne, Etagenpläne, Systemübersichten, Netzwerkdiagramme oder Konfigurationsbeschreibungen.

Die folgenden Punkte sollten in Ihrem Reaktionsplan berücksichtigt werden:

  1. Was nimmt das Management als schlimmste Bedrohungen des Rechenzentrums wahr, zum Beispiel Feuer, menschliches Versagen, Stromausfall, Systemausfall oder Verletzung der Sicherheitsprotokolle? Seien Sie darauf vorbereitet, dass die ersten Einschätzungen des Managements falsch sein könnten. Bereiten Sie sich daher auf schnelle Korrekturen vor.
  2. Die Einschätzung des Managements hinsichtlich der größten Verwundbarkeiten des Rechenzentrums, zum Beispiel veraltete Notstromsysteme.
  3. Resultate von vorherigen Ausfällen oder Zwischenfällen im Rechenzentrum, wie damit umgegangen und was daraus gelernt wurde.
  4. Die vom Management definierte maximale akzeptierte Ausfallzeit eines Rechenzentrums.
  5. Etablierte Vorgehensweisen für die Reaktion auf Rechenzentrums-Ausfälle.
  6. Erfahrungen und Erkenntnisse aus anderen Rechenzentrums-Zwischenfällen.
  7. Notfall-Teams des Rechenzentrums, die für solche Notfälle trainiert sind.
  8. Notfallbereitschaft Ihres primären und eines alternativen Rechenzentrum-Lieferanten. Wenn Sie diese jemals in Anspruch genommen haben, hat sie vernünftig funktioniert? Kosten des Services und der Status des Servicevertrags.

Rechenzentrums-Checkliste: Allgemeine Reaktion

Die folgende Checkliste kann in der ersten Reaktionsphase auf einen Zwischenfall in Ihrem Rechenzentrum benutzt werden. Natürlich wird die Art des Zwischenfalls die einzuleitenden Schritte und deren Reihenfolge beeinflussen. So werden zum Beispiel die Reaktionen auf einen Stromausfall sich von denen bei einem Feuer unterscheiden. Stellen Sie sicher, dass Sie diese Schritte in Ihrem DR-Plan berücksichtigen.

Szenario 1: Stromausfall

Schritt Notwendige Tätigkeiten Kommentare
1 Ermitteln Sie den Umfang des Ausfalls und ob die Backup-Systeme eingesprungen sind. Nehmen Sie über Mobilfunk Kontakt zu ihren Mitarbeitern auf, prüfen Sie die Stromversorgung, verwenden Sie Taschenlampen, um sich sicher zu bewegen.
2 Stellen Sie fest, ob Personal evakuiert werden muss. Treffen Sie sich so schnell wie möglich mit den wichtigsten IT-Mitarbeitern.
3 Bewerten Sie das Schadenspotenzial für die Firma; stellen Sie sicher, dass kritische Daten gesichert wurden und geschützt sind. Treffen Sie sich so schnell wie möglich mit den wichtigsten IT-Mitarbeitern.
4 Benachrichtigen Sie das Management. Unterrichten Sie sie über die Situation.
5 Kontaktieren Sie das Versorgungsunternehmen. Rufen Sie über Mobiltelefone an, sofern die Festnetzleitungen nicht funktionieren. Fordern Sie ein Notfall-Team an.
6 Stellen Sie die Ursache des Ausfalls fest, ergreifen Sie Wiederherstellungsmaßnahmen. Arbeiten Sie mit dem Versorgungsunternehmen, Elektrikern und anderen zusammen.
7 Treffen Sie eine Einschätzung, wann das Rechenzentrum den Betrieb wieder aufnehmen kann. Treffen Sie sich mit den wichtigsten Mitarbeitern der IT, des Versorgungsunternehmens und anderen.
8 Halten Sie Kontakt mit dem Management und geben Sie ihm regelmäßige Informationen über den Fortschritt. Geben Sie Ratschläge bezüglich der nächsten Aktionen, der Wiederherstellung und den notwendigen Schritten nach dem Ausfall.

Szenario 2: Server-Ausfall

Schritt Notwendige Tätigkeiten Kommentare
1 Stellen Sie den Umfang des Server-Ausfalls, den Datenverlust und mögliche Folgeschäden fest. Benachrichtigen Sie die Mitarbeiter über Mobilfunk, prüfen Sie den beziehungsweise die betroffenen Server.
2 Starten Sie Aktionen zur Wiederherstellung. Prüfen Sie zum Beispiel die Stromversorgung, versuchen Sie, den Server neu zu starten, und lassen Sie Diagnosedurchläufe starten. Nehmen Sie gegebenenfalls Kontakt zu den Anbietern auf.
3 Schätzen Sie den potenziellen Schaden für die Firma ab, stellen Sie sicher, dass kritische Anwendungen und Daten auf Servern liegen, die gesichert wurden und geschützt sind. Treffen Sie sich so schnell wie möglich mit den wichtigsten IT-Mitarbeitern.
4 Finden Sie den Grund für den Server-Ausfall, fahren Sie mit den Wiederherstellungsbemühungen fort. Arbeiten Sie mit dem IT Personal und dem Anbieter zusammen.
5 Schätzen Sie ab, wenn der Serverbetrieb wieder aufgenommen werden kann. Treffen Sie sich mit den wichtigsten IT-Technikern und den Anbietern.
6 Informieren Sie das Management regelmäßig über den aktuellen Status. Geben Sie Ratschläge bezüglich der nächsten Aktionen, der Wiederherstellung und den notwendigen Schritten nach dem Ausfall.

Szenario 3: Feuer im Rechenzentrum

Schritt Notwendige Tätigkeiten Kommentare
1 Schätzen Sie die Art und den Umfang des Feuers ab. Benachrichtigen Sie die Mitarbeiter über Mobilfunk.
2 Benutzen Sie die Brandschutzeinrichtungen wie Sprinkler und Handfeuerlöscher, um das Feuer zu ersticken. Wenn ersichtlich ist, dass das Feuer schwerwiegender ist, sollten Sie das Gelände schnellstmöglich abriegeln.
3 Rufen Sie 112 an und informieren Sie über die Situation.  
4 Evakuieren Sie das Gebäude. Treffen Sie sich umgehend mit den wichtigsten IT-Mitarbeitern der betroffenen Bereiche.
5 Aktiveren Sie, soweit dies möglich ist, Backup-Maßnahmen, um aktuelle Daten zu schützen. Sofern externe Rechenzentren verfügbar sind, aktiveren Sie diese.
6 Sobald das Feuer gelöscht ist, beginnen Sie mit der Abschätzung des Schadens. Treffen Sie sich mit den IT-Mitarbeitern, dem Gebäudepersonal und dem Gebäudeverwalter.
7 Informieren Sie das Management über den aktuellen Status. Geben Sie Ratschläge bezüglich der nächsten Aktionen, der Wiederherstellung und den Schritten nach dem Brand.

Reaktions-Checkliste: Ernste Situationen

Die oben genannte Reihenfolge der Schritte ist typisch für Zwischenfälle in einem Rechenzentrum. Aber diese Reihenfolge kann je nach Organisation variieren. Seien Sie flexibel in ihrer Reaktion; passen Sie ihre Handlungen an die Art und die Schwere des Zwischenfalls an.

Die folgende Rechenzentrums-Checkliste zeigt Ihnen die empfohlenen Schritte, die Sie bei einem schwerwiegenden Störfall im Rechenzentrum ergreifen sollten. Diese Schritte müssen möglicherweise einigen der Schritte in den vorherigen Szenarien vorangestellt werden. Und stellen Sie sicher, dass Sie diese Schritte in Ihrem DR-Plan berücksichtigen.

Reaktions-Checkliste: Gebäude-Verlust

Schritt Notwendige Tätigkeiten Kommentare
1 Kontaktieren Sie die betroffenen Geschäftsbereiche und empfehlen Sie Ihnen, sich auf einen Umzug an einen alternativen Standort vorzubereiten (oder was immer Sie in Ihrem Plan spezifiziert haben). Beraten Sie die wichtigsten internen und externen Mitarbeiter beziehungsweise Unternehmen, wie es im DR-Plan vorgesehen ist.
2 Kontaktieren Sie externe Partner (zum Beispiel Anbieter, Lieferanten, Kuriere, Speicher-Unternehmen), damit diese Ihre Notfallpläne aktivieren. Beraten Sie die wichtigsten internen und externen Mitarbeiter/Unternehmen, wie es im DR-Plan vorgesehen ist.
3 Sofern Hardware-Systeme beschädigt oder zerstört wurden, starten Sie umgehend damit, die betroffene Hardware wiederherstellen zu lassen. Beraten Sie die wichtigsten internen und externen Mitarbeiter beziehungsweise Unternehmen, wie es im DR-Plan vorgesehen ist.
4 Sofern Software (zum Beispiel Betriebssysteme, Anwendungen) beschädigt oder zerstört wurden, starten Sie umgehend damit, diese Software wiederherstellen zu lassen. Beraten Sie die wichtigsten internen und externen Mitarbeiter beziehungsweise Unternehmen, wie es im DR-Plan vorgesehen ist.
5 Sofern Kommunikationseinrichtungen und Netzwerksysteme beschädigt oder unterbrochen wurden, starten Sie unverzüglich damit, diese wiederherstellen zu lassen. Beraten Sie die wichtigsten internen und externen Mitarbeiter beziehungsweise Unternehmen, wie es im DR-Plan vorgesehen ist.
6 Sofern E-Mail- und Blackberry-Server beschädigt oder zerstört wurden, starten Sie damit, diese so schnell wie möglich wiederherstellen zu lassen. Beraten Sie die wichtigsten internen und externen Mitarbeiter beziehungsweise Unternehmen, wie es im DR-Plan vorgesehen ist. Die Geschäftsbereiche müssen unter Umständen alternative Kommunikationsmittel wie soziale Netzwerke oder SMS nutzen, falls E-Mail- und Blackberry-Server zerstört wurden.
7 Sofern kritische Daten beschädigt oder zerstört wurden, starten Sie unverzüglich die Datenwiederherstellung. Beraten Sie die wichtigsten internen und externen Mitarbeiter beziehungsweise Unternehmen, wie es im DR-Plan vorgesehen ist.
8 Sofern Papiere und andere Dokumente zerstört worden sind, starten Sie umgehend damit, diese wiederherstellen zu lassen. Beraten Sie die wichtigsten internen und externen Mitarbeiter beziehungsweise Unternehmen, wie es im DR-Plan vorgesehen ist. Falls das Problem nicht innerhalb eines Tages durch die Wiederherstellung eines Backups gelöst werden kann, diskutieren Sie mit dem Personal und anderen Betroffenen, wie die Situation ad hoc gelöst werden kann.
9 Sofern Papiere und andere Dokumente beschädigt worden sind, starten Sie umgehend damit, diese wiederherstellen zu lassen. Beraten Sie die wichtigsten internen und externen Mitarbeiter beziehungsweise Unternehmen, wie es im DR-Plan vorgesehen ist. Falls das Problem nicht innerhalb eines Tages durch die Wiederherstellung eines Backups gelöst werden kann, diskutieren Sie mit dem Personal und anderen Betroffenen, wie die Situation ad hoc gelöst werden kann.
10 Klären Sie mit dem Management, dass das Rechenzentrumspersonal umziehen muss. Treffen Sie sich mit den IT-Mitarbeitern, dem Management und anderen.
11 Arbeiten Sie mit den verschiedenen Unternehmenseinheiten sowie internen und externen Gruppen zusammen, um alternative Rechenzentrumsflächen zu finden, etwa Managed-Service-Anbieter oder ein Ausweich-Rechenzentrum, bis ein neues Rechenzentrum in Betrieb genommen werden kann. Ihr DR-Plan hat dies hoffentlich umfasst, so dass Sie bereits eine passende primäre und eine alternative Rechenzentrums-Lokation ausfindig gemacht haben.
12 Initiieren und koordinieren Sie die Aktivitäten, die notwendig sind, um mit dem Rechenzentrum umzuziehen. Ihr DR-Plan hat dies hoffentlich enthalten.
13 Stellen Sie dem Management regelmäßig aktualisierte Informationen über den Fortschritt zur Verfügung. Ihr DR-Plan hat dies hoffentlich umfasst.
14 Organisieren Sie regelmäßige Treffen des Wiederherstellungs-Teams. Ihr DR-Plan hat dies hoffentlich berücksichtigt.

Die oben genannten Schritte setzen voraus, dass spezifische Pläne entwickelt wurden, wie mit den verschiedenen aufgeführten Situationen wie E-Mail-Wiederherstellung, Hardware-und Software-Wiederherstellung, Datenrettung und Umzug in ein anderes Rechenzentrum umzugehen ist.

Bewertungen im Anschluss an den Zwischenfall

Sobald sich die Situation beruhigt hat und die Wiederherstellung beginnen kann, führen Sie eine Auswertung des Geschehens durch. Ermitteln Sie, was passiert ist, was funktioniert und was nicht funktioniert hat. Planen und führen Sie so oft wie möglich Meetings durch, um diese wichtigen Daten zu sammeln, da sie für Schadensersatzansprüche und mögliche Rechtsstreitigkeiten nötig sein können.

Weitere Quellen für einen Rechenzentrums-Notfallplan

Die Entwicklung eines Reaktionsplans für Zwischenfälle im Rechenzentrum kann, je nachdem, wie viele Details sie enthalten, sehr komplex sein. Eine Möglichkeit, diesen Prozess zu erleichtern, ist existierende Standards und im Rechenzentrum bewährte Praktiken zu verwenden. Zwei sehr nützliche sind:

Bei der Erstellung des Disaster-Recovery Plans für Ihr Rechenzentrum sollten Sie die folgenden Punkte im Hinterkopf behalten:

  1. Sichern Sie sich die Unterstützung des Managements, so dass Ihr Plan über entsprechendes Budget verfügt, dokumentiert und regelmäßig geübt wird.
  2. Nehmen Sie den Prozess zur DR-Planung ernst: Die Pläne müssen nicht Dutzende von Seiten umfassen, aber sie sollten die aktuellen und genauen Informationen umfassen.
  3. Nutzen Sie Standards wie die oben aufgeführten als Teil des Prozesses.
  4. Halten Sie den Planungsprozess einfach, indem Sie die richtigen Informationen sammeln und organisieren.
  5. Bewerten Sie die Ergebnisse mit den wichtigsten Abteilungen, um sicher zu gehen, dass alle ihre Annahmen korrekt sind.

Zwischenfälle im Rechenzentrum können zu ernsthaften Störungen des Geschäftsbetriebs führen. Während einige Firmen die Wiederherstellung des Rechenzentrums durch den Bau einen zweiten Rechenzentrums oder durch die Anmietung externer, entsprechend ausgestatteter Einrichtungen adressieren, kann eine genaue Einschätzung des Betriebs und der Risiken des Rechenzentrums ein wichtiger Startpunkt in einem DR-Programm sein. 

Mit einem gut durchdachten Disaster-Recovery-Plan, besonders wenn die Rettungs- und Wiederherstellungsschritte gut geplant wurden, kann der Schaden am Rechenzentrum minimiert werden.

Über den Autor: 
Paul Kirvan, CISA, CSSP, FBCI, CBCP, hat über 20 Jahre Erfahrung als Berater, Autor und Ausbilder im Bereich Business Continuity Management. Er war bereits in Dutzenden IT/TK Beratungs- und Prüfungsaufträgen involviert, die unter anderem die Entwicklung und Durchführung von Governance-Programmen bis zu RFP-Vorbereitungen umfassten. Kirvan arbeitet zurzeit als unabhängiger Berater und Prüfer für Business Continuity und ist Geschäftsführer des
Business Continuity Institute USA. Er ist erreichbar unter der E-Mail pkirvan@msn.com.

Folgen Sie SearchStorage.de auch auf Facebook, Twitter und Google+!

Artikel wurde zuletzt im November 2014 aktualisiert

Pro+

Premium-Inhalte

Weitere Pro+ Premium-Inhalte und andere Mitglieder-Angebote, finden Sie hier.

Erfahren Sie mehr über Disaster Recovery

Diskussion starten

Schicken Sie mir eine Nachricht bei Kommentaren anderer Mitglieder.

Mit dem Absenden dieser Daten erklären Sie sich bereit, E-Mails von TechTarget und seinen Partnern zu erhalten. Wenn Ihr Wohnsitz außerhalb der Vereinigten Staaten ist, geben Sie uns hiermit Ihre Erlaubnis, Ihre persönlichen Daten zu übertragen und in den Vereinigten Staaten zu verarbeiten. Datenschutz

Bitte erstellen Sie einen Usernamen, um einen Kommentar abzugeben.

- GOOGLE-ANZEIGEN

SearchSecurity.de

SearchNetworking.de

SearchEnterpriseSoftware.de

SearchDataCenter.de

Close