Backup: Deduplizierung und die Auswirkungen auf das Management langlebiger Daten

Tipp

Backup: Deduplizierung und die Auswirkungen auf das Management langlebiger Daten

Deduplizierung kann eine enorme Hilfe für Backup-Administratoren sein. Allerdings ist es erwiesen, dass Deduplizierung in gewissen Bereichen sehr ineffektiv ist.

Einige Unternehmen führen nicht nur normale Backups aus, die lediglich eine redundante Kopie der Produktionsdaten erstellen. Manche Organisationen haben ausgeklügelte und komplexe Strategien für die Datensicherung. Diesen Umstand lassen viele Deduplizierungs-Lösungen komplett außer Acht. Große Firmen verwenden vielleicht eine Vielzahl an Schichten bezüglich des Backup-Storage. Dort werden Daten dann unterschiedlich lange aufgehoben. Weiterhin könnten die Unternehmensrichtlinien vorsehen,  einige der gesicherten oder archivierten Daten außerhalb zu lagern. Denkbar sind alternative Data-Center oder ein

Diesen Artikel hier weiterlesen

Erhalten Sie diesen Artikel exklusiv sowie sämtliche Inhalte wie E-Guides, News, Tipps und mehr.
  • Um diesen Artikel vollständig zu lesen, melden Sie sich bitte kostenlos an. Falls Sie schon ein Mitlgied sind, loggen Sie sich einfach oben links auf der Webseite an.

Mit dem Einreichen Ihrer Daten erklären Sie sich bereit, E-Mails von TechTarget und seinen Partnern zu erhalten. Wenn Sie sich außerhalb der Vereinigten Staaten befinden, stimmen Sie hiermit zu, dass Ihre persönlichen Daten in die Vereinigten Staaten übertragen und dort verarbeitet werden. Datenschutz

Cloud-Backup.

Damit wir uns den Deduplizierungs-Prozess in so einem Fall besser vorstellen können, nehmen wir ein konkretes Beispiel: stellen Sie sich vor, ein Unternehmen führt Disk-basierte Datensicherungen auf einem im Hause befindlichen Backup-Server durch, der 30 Tagessätze an Daten vorhält. Diese Daten synchronisiert der Backup-Server mit einer Appliance außer Haus. Zusätzlich tritt ein Workflow in Kraft, der ältere Backups auf günstigeres Storage auslagert. Nehmen wir an, dass sich 120 Tage an Daten in einem externen Data-Center und komplette zwei Jahre in der Cloud befinden.

Während die Daten auf den hauseigenen Backup-Server geschrieben werden, erfolgt gleichzeitig die Deduplizierung. Die Kopie des primären Backup-Servers ist ein exakter Spiegel. Somit lassen sich die deduplizierten Daten zum Replika-Server senden, ohne diese vorher wieder zusammensetzen zu müssen.

Sobald die Daten aber auf den Backup-Server außer Haus gesendet werden, der Daten länger aufhebt, wird die Sache verzwickt. Das Remote-Storage ist kein Spiegel des Backup-Servers. Deswegen lassen sich die Inhalte des Servers nicht einfach synchronisieren. Bevor Sie die Daten außer Haus senden, müssen Sie die Informationen zunächst wieder zusammensetzen. Eben weil Sie die Daten zu einem Remote-Storage auslagern, werden Sie die Daten zur Sicherheit wahrscheinlich vorher auf der Quellseite deduplizieren. Einfach gesagt, werden deduplizierte Daten nur deswegen wieder zusammengesetzt, um diese abermals zu deduplizieren.

Dieser Vorgang ist natürlich alles andere als praktisch. Deswegen haben sich Backup- und Deduplizierungs-Hersteller verschiedene Lösungen einfallen lassen, um das Verschieben von Daten auf das Langzeit-Storage effizienter zu gestalten. CommVault bietet zum Beispiel eine Technologie an, die sich Deduplication Accelerated Streaming Hash nennt. Kurz bezeichnet die Firma das auch als DASH.

Mittels DASH können Sie deduplizierte Daten auf verschiedene Backup-Schichten schieben, ohne diese vorher wieder zusammensetzen zu müssen. DASH ist sich der deduplizierten Daten bewusst und stellt anhand dieser Informationen eine zweite Kopie zur Verfügung. Dieser Kopier-Vorgang kann für das Lesen von Festplatten oder Netzwerk optimiert sein.

Bei der Disk-Variante liest die Software die Signaturen aus den Metadaten der Quell-Festplatte und schickt diese dann an den Media-Agent des Ziels. Dieser vergleicht die Signaturen mit der Deduplizierungs-Datenbank des Bestimmungsorts.

Ist die Signatur auf dem Ziel vorhanden, existiert die Datei dort bereits. Somit muss die Software die Datei nicht noch einmal übertragen. Existiert die Signatur nicht, gelten die Daten als neu und werden somit zum Ziel übertragen. Gleichzeitig aktualisiert die Software die Datenbank des Bestimmungsorts.

FalconStor bietet eine ähnliche Lösung an, die sich File Interface Deduplication System (FDS) nennt. Dieses Produkt hält eine globale Deduplizierungs-Ablage vor. Dadurch ist eine WAN-optimierte Replikation zu externen Data-Centern möglich.

Netzwerk-optimierte Lösungen für das Kopieren von Daten eignen sich für Umgebungen, bei denen nur eine geringe Bandbreite zur Verfügung steht. Allerdings sind diese Vorgänge I/O-intensiver als die Herangehensweise über die für Festplatten optimierte Variante. Das Prozedere ist im Prinzip sehr ähnlich. Allerdings liest die Netzwerk-Version nicht die Metadaten der Festplatte, sondern generiert zunächst die Signaturen der zu verarbeitenden Daten. Diese werden danach an den Media-Agent des Ziels geschickt, der sie vergleicht.

Fazit

Deduplizierung eignet sich nicht besonders gut in Umgebungen, bei denen Daten in verschiedenen Schichten unterschiedlich lange gelagert werden. Das hat uns die Vergangenheit gelehrt. Das Verschieben verlangt in der Regel einen Zusammenbau der Dateien, bevor man diese verschieben kann. Neue Technologien wie DASH von CommVault ermöglichen es, dass man deduplizierte Daten auf ein anderes Storage kopiert. Eine Wiederherstellung ist vorher nicht notwendig.

Über den Autor: Brien M. Posey, MCSE, trägt die Microsoft-Auszeichnung MVP für Exchange Server, Windows Server und Internet Information Server. Brien hat als CIO für eine landesweite Krankenhauskette gearbeitet. Weiterhin war er für Abteilung Informations-Management in Fort Knox zuständig. Sie finden Briens persönliche Webseite unter www.brienposey.com.

Artikel wurde zuletzt im Juni 2013 aktualisiert

Ihre Meinung zum Artikel Kommentar

Teilen
Kommentare

    Ergebnisse

    Tragen Sie zu dem Gespräch bei

    Alle Felder sind erforderlich. Kommentare werden unterhalb des Artikels erscheinen.

    Haftungsausschluss: Unser Tipp-Austausch ist ein Forum, in welchem Sie technische Beratung und Fachkenntnisse mit Ihrem Peers teilen können, sowie auch von anderen IT-Profis lernen können. TechTarget bietet die Infrastruktur, um dieses Teilen von Informationen zu erleichtern. Wie auch immer, wir können nicht die Genauigkeit oder die Gültigkeit des vorgelegten Materials garantieren. Sie stimmen zu, dass Ihre Benutzung von dem „Fragen Sie den Experten“ Service, sowie auch Ihr Vertrauen von jeglichen Fragen, Antworten, Informationen oder anderen empfangenen Materialien von dieser Webseite auf Ihre eigenes Risiko läuft.