3dmentat - Fotolia

Snapshots: Mit dem Array oder mit dem Hypervisor?

Snapshots sind mittlerweile einer Alternative für klassische Backups und Restores. Man unterscheidet zwischen Array- und Hypervisor-Snapshots.

Snapshots sind eine bekannte und etablierte Technologie im Bereich Data Protection, die in der Vergangenheit in Storage-Arrays zum Einsatz kam.

Mit dem Aufkommen von Virtualisierung stellt der Hypervisor nun einen alternativen Ort zur Verfügung, von dem aus der Snapshot-Prozess ausgeführt werden kann. Da man so zwei Plätze hat, an denen man Daten per Snapshots sichern kann, ruft das unweigerlich Fragen auf: Welches ist der beste Ort, um einen Snapshot durchzuführen? Und was sind die Vor- und Nachteile der konkurrierenden Verfahren?

Ein Snapshot ist eine Kopie von Daten zu einem genau bestimmten Zeitpunkt, die ein Image eines Volume oder einer Logical Unit Number (LUN) darstellt und die als Backup und für ein Data Recovery genutzt werden kann. Es gibt in der IT-Industrie eine anhaltende Debatte darüber, ob ein Snapshot ein echtes Backup ist, weil ein einzelner Snapshot von seinem Ausgangs-Volume und dem zugrundeliegenden Hardwaresystem abhängt: Bei einem Hardwareausfall ist auch der Snapshot verloren.

Ein Snapshot kann jedoch verwendet werden, um alles von einzelnen Dateien bis zu einer ganzen virtuellen Maschine oder einem Applikations-Server wiederherzustellen.

Snapshots funktionieren, indem sie Metadaten nutzen, um eine logische LUN oder ein logisches Volume auf ihren physischen Platz auf Festplatte oder Flash zu mappen. Ein logisches Volume wird in der Regel in Blocks von 4 KB oder größer aufgeteilt. Der Snapshot-Prozess kopiert die entsprechenden Metadaten, womit der Snapshot eine zu einem bestimmten Zeitpunkt erstellte Kopie des Volumes darstellt.

Es gibt drei Arten an Snapshots:

  • Changed-block Snapshots. Diese Verfahren unterteilen sich wiederum in zwei Kategorien: Copy-on-Write und Redirect-on-Write. Ein Copy-on-Write-Snapshot sichert ein Snapshot-Image, indem Updates des Volumens (nachdem der Snapshot erstellt wurde) zu einem anderen Ort kopiert werden – in der Regel zu einer dedizierten Snapshot-Umgebung. Volume-Updates werden „vor Ort“ gemacht, von dem gleichen physikalischen Plattenstandort. Redirect-on-Write-Snapshots erneuern das Image eines Blocks in einem Volume an einem ungenutzten Plattenplatz. Updates werden immer an einem freien Platz geschrieben.
  • Clones. Dieses Verfahren kopiert das gesamte Volumen zu einem neuen physischen Platz auf Festplatte. Obwohl diese Snapshot-Variante wegen des zusätzlich erforderlichen Speicherplatzes (und dem Overhead durch das Bewegen der Daten) teuer ist, liefert sie ein hohes Ausmaß an physischem Schutz, wenn sie auf einen separaten Satz von physischen Medien kopiert wird.
  • CDP. Continuous Data Protection ist ein alternativer Ansatz für die Datensicherung, bei dem alle Updates eines Volumes verfolgt werden. Theoretisch bedeutet dies, dass ein Volume bis zu jedem beliebigen Zeitpunkt zurückverfolgt werden kann – in der Regel auf dem Niveau von einzelnen Block-Updates. CDP-Systeme können unter dem Gesichtspunkt des Hinzufügens von weiteren Festplatten teuer sein, liefern aber bei Restores einen hohen Grad an Granularität.

Snapshots im Hypervisor

Hypervisor-basierte Snapshots liefern die Möglichkeit, eine Image-Kopie einer virtuellen Maschine (VM) zu ziehen, entweder um auf einzelne Files zuzugreifen oder um sie wiederherzustellen. Darüber hinaus bieten sie einen Rollback-Punkt, um die VM wiederherzustellen oder um einen Clone der VM auf einer anderen virtuellen Maschine zu erzeugen. VMs sind im Prinzip einfache Dateien (VMDKs im Fall von VMware vSphere und VHD-Dateien bei Microsoft Hyper-V), weshalb Snapshots zu erzeugen und zu verwalten nichts anderes bedeutet, als diese Image-Files zu beeinflussen. Hyper-V und vSphere verwalten beide die Snapshots, indem sekundäre Files, die mit den VMDK/VHD-Dateien verbunden sind, genutzt werden, um Updates einer VM zu speichern, nachdem ein Snapshot durchgeführt wurde. Diese Updates nehmen solange zu, bis der Snapshot gelöscht wird. Die sekundären Files werden dann wieder in die ursprünglichen VMDK/VHD-Dateien integriert.

Snapshots im Speicher-Array

Wie bereits erwähnt, werden Snapshots im Storage-Array gemanagt, indem die Metadaten herangezogen werden, die die logisch-physische Beziehung der LUNs oder Volumes zu den Daten auf der Platte nachverfolgen. Wenn ein Snapshot erzeugt wird, repliziert das Array die Metadaten des physischen Layouts auf Festplatte oder Flash. Dabei können sich ein oder mehrere Snapshots auf dieselben physischen Daten auf der Platte beziehen.

Da sich das Quellvolumen kontinuierlich verändert, werden die geänderten Blöcke je nach Snapshot-Technik entweder verschoben oder auf einen freien Speicherplatz geschrieben. Wenn ein Snapshot nicht länger gebraucht wird, werden die Metadaten ganz einfach gelöscht, und einzelne Blöcke, die zu einem Snapshot gehörten, werden freigegeben.

Vor- und Nachteile

Array-basierte Snapshots lassen sich in der Regel sehr schnell ziehen, da sie lediglich aus einer Kopie der Metadaten bestehen, die üblicherweise im Memory abgelegt werden. Aber es kann während des Kopiervorgangs ein geringer Einfluss auf die I/O-Performance auftreten. Die Anzahl der unterstützten Snapshots variiert je nach Plattform, wobei einige Hersteller den Support für tausende von Snapshots pro System liefern. Die meisten Anbieter offerieren ausgearbeitete Zeitpläne für die Automatisierung des Snapshot-Prozesses.

Ein Array-basierter Snapshot ist eine Image-Kopie einer laufenden VM oder eines Applikations-Servers zu einem bestimmten Zeitpunkt, mit dem Ergebnis, dass der Snapshot als eine „Crash Copy“ dieser VM oder Anwendung erscheinen wird, wenn sie komplett wiederhergestellt und zugänglich sind. Man sollte sich auch dessen bewusst sein, dass Snapshots auf dem Array auf einem LUN oder Volume beruhen (die wiederum zu einem Hypervisor gemappt werden).

Dies bedeutet, dass Array-basierte Snapshots viele VMs enthalten können, was es schwierig gestaltet, Zeitpläne für den Schutz einzelner virtueller Maschinen aufzustellen.

Hypervisor-basierte Snapshots arbeiten dagegen auf dem VM-Niveau, was es erlaubt, Snapshot-Policies speziell für jede einzelne VM festzulegen. Der Snapshot-Prozess kann auch mit dem Ruhezustand oder dem Aussetzen von I/O-Aktivität auf dem VM/Applikationsniveau synchronisiert werden, sofern Integrations-Tools für die VM installiert sind: Auf diese Weise kann ein konsistenteres Image statt einer „Crash Copy“ geliefert werden.

Der Nachteil von Hypervisor-basierten Snapshots besteht in dem Overhead, verschiedene getrennte VMDK-Files zu schreiben und diese Updates wieder zurück zu integrieren, wenn der Snapshot gelöscht wird. Dieser Prozess kann viel Zeit beanspruchen und hat einen direkten Einfluss auf die Performance.

Den richtigen Ansatz auswählen

Hypervisor-basierte Snapshots sind eine gute Wahl in den Fällen, bei denen es auf Konsistenz der Anwendungen ankommt, und sie sind die einzige Wahl, wenn die zugrundeliegende Speicherplattform über keine Snapshot-Unterstützung verfügt. Der Hypervisor-basierte Ansatz ist überall dort effizienter, wo Datenspeicher auf großen LUNs aufsetzen: Hier werden keine weiteren Daten aufbewahrt, wie es bei Array-basierten Kopien üblich ist. Aber Array-basierte Lösungen liegen bei der Performance vorne, was schließlich dazu geführt hat, dass einige Verfahren, die von Backup-Anbietern verwendet werden, aus einer Kombination von Hypervisor- und von Array-basierten Snapshots zum gleichen Zeitpunkt bestehen.

Der Prozess funktioniert, indem ein Hypervisor-Snapshot gestartet wird, um die I/Os aus Konsistenzgründen zu suspendieren, gefolgt von einem Array-basierten Snapshot für Flexibilität und Performance. Der Hypervisor-Snapshot kann dann fast unmittelbar ausgelöst werden, wodurch nur sehr wenige Daten in die VMDK integriert werden müssen.

Diese Lösung stellt das Beste aus zwei Welten dar – Datenintegrität plus Flexibilität und Performance von hardwarebasiertem Datenschutz.

Folgen Sie SearchStorage.de auch auf Twitter, Google+ und Facebook!

Artikel wurde zuletzt im Februar 2016 aktualisiert

Pro+

Premium-Inhalte

Weitere Pro+ Premium-Inhalte und andere Mitglieder-Angebote, finden Sie hier.

Erfahren Sie mehr über Data-Center-Storage

Diskussion starten

Schicken Sie mir eine Nachricht bei Kommentaren anderer Mitglieder.

Mit dem Absenden dieser Daten erklären Sie sich bereit, E-Mails von TechTarget und seinen Partnern zu erhalten. Wenn Ihr Wohnsitz außerhalb der Vereinigten Staaten ist, geben Sie uns hiermit Ihre Erlaubnis, Ihre persönlichen Daten zu übertragen und in den Vereinigten Staaten zu verarbeiten. Datenschutz

Bitte erstellen Sie einen Usernamen, um einen Kommentar abzugeben.

- GOOGLE-ANZEIGEN

SearchSecurity.de

SearchNetworking.de

SearchEnterpriseSoftware.de

SearchDataCenter.de

Close