Roman Milert - Fotolia

F

Welche neuen Fortschritte kann Datendeduplizierung bei Backups erreichen?

Mit Datendeduplizierung lassen sich wiederholte Datensets eliminieren. Diese Technologie macht weitere Fortschritte und wird leistungsfähiger.

Datendeduplizierung ist eine Technik zur Optimierung der Storage-Kapazität: Sie identifiziert doppelte oder mehrfache Datensets in einem Daten-Stream und eliminiert sie, so dass eine einzige Kopie von ihnen auf physikalischen Medien erhalten bleibt. Metadaten und Pointer dienen dazu, jede logische Dateninstanz zu verfolgen, die der physikalischen Kopie entspricht.

Datendeduplizierung wurde in Backup-Umgebungen eingeführt, da mehrfache, wiederholte vollständige Backups eines Servers oder einer virtuellen Maschine nur schwer dedupliziert werden konnten, weil sie entweder die gleichen nicht geänderten Daten enthielten oder weil sie auf einem einzigen Master Image basierten.

Die Deduplizierung von Backup-Daten spielt eine größere Rolle in Produkten, die sich um verstreute Daten kümmern wie zum Beispiel bei Plattformen für Copy Data Management (CDM). Diese Produkte erlauben es, Daten auch für andere Zwecke als Data Protection zu benutzen, zum Beispiel um Kopien der produktiven Daten für Test- und Entwicklungsumgebungen zu erzeugen.

Kunden können mit der Wiederverwendung von statischen Daten Kosten einsparen, die jetzt in der Regel auf sich drehenden Medien gespeichert und dann für Deduplizierungs-Appliances eingesetzt werden. CDM-Hersteller verfügen über eingebaute Technologie, mit der Backups effektiv ausgeführt werden können und die sich gut für sekundäre Anforderungen eignet, einschließlich des Managements von Tausenden von Anwendungs-Snapshots.

Eine andere Neuerung bei der Deduplizierung von Backup-Daten besteht in der „Pre-duplication“, bei der die Client-Seite in der Lage ist, Daten zu deduplizieren, bevor sie über das Netzwerk gesendet werden. Dieses Konzept wurde vor fast zehn Jahren von PureDisk aus der Taufe gehoben, einem von mittlerweile von Symantec übernommenen Unternehmen. Heute integrieren es die Hersteller in ihre Plattformen.

Hewlett Packard Enterprise hat dies mit seinem 3PAR-Array getan, um die Deduplizierung von Daten, die von Snapshots stammen, zu verbessern und um die Datenmenge, die über das Netzwerk läuft, zu reduzieren. Der Deduplizierungsvorgang kann auch verteilt ablaufen, wodurch Backups ohne den Management-Engpass der Hash-Werte in einem einzigen Prozess ausgebaut werden können.

Die Backup-Anbieter schauen nun auch direkt auf die Daten und entwickeln intelligente Deduplizierungslösungen, die auf den Anwendungsinhalten und nicht bloß auf einer simplen Block-Level-Identifizierung aufgebaut sind. Eine File-Level-Deduplizierung kann Dateien erkennen, die dann für sich bearbeitet werden, einschließlich von Datei-Attachments beim Backup von E-Mail-Systemen. Auch diese Prozesse machen den Backup-Client intelligenter und reduzieren so die Netzwerklast und die Deduplizierungsvorgänge am Backend.

Folgen Sie SearchStorage.de auch auf Twitter, Google+, Xing und Facebook!

Nächste Schritte

Mit Deduplizierung Backup-Daten erfolgreich, effizient und sicher speichern.

Wann auf Daten-Deduplizierung verzichtet werden kann.

Backup-Optionen: Deduplizierungs-Arrays, Backup-Appliances oder doch die Cloud?

Für was man Deduplizierungs-Arrays einsetzt.

Artikel wurde zuletzt im Dezember 2016 aktualisiert

Pro+

Premium-Inhalte

Weitere Pro+ Premium-Inhalte und andere Mitglieder-Angebote, finden Sie hier.

Erfahren Sie mehr über Kapazitätsoptimierung von Primärspeicher

Diskussion starten

Schicken Sie mir eine Nachricht bei Kommentaren anderer Mitglieder.

Mit dem Absenden dieser Daten erklären Sie sich bereit, E-Mails von TechTarget und seinen Partnern zu erhalten. Wenn Ihr Wohnsitz außerhalb der Vereinigten Staaten ist, geben Sie uns hiermit Ihre Erlaubnis, Ihre persönlichen Daten zu übertragen und in den Vereinigten Staaten zu verarbeiten. Datenschutz

Bitte erstellen Sie einen Usernamen, um einen Kommentar abzugeben.

- GOOGLE-ANZEIGEN

SearchSecurity.de

SearchNetworking.de

SearchEnterpriseSoftware.de

SearchDataCenter.de

Close