Nmedia - Fotolia

F

Wie funktioniert Deduplizierung in der Cloud und welche Vorzüge bringt es?

Deduplizierung in der Cloud sollte man nicht dem Provider überlassen, sondern selbst Vorsorge treffen, um tatsächliche Kostenvorteile zu erzielen.

Deduplizierung entfernt überflüssige oder doppelt vorhandene Daten, um das Speichervolumen zu lasten. Grundsätzlich geht es bei konventioneller Storage ebenso wie in der Cloud.

Bei Primär-Storage kann Deduplizierung dabei helfen, den Platzverbrauch senken, indem identische Datenblöcke entfernt werden. Metadaten verbinden logische Datenkopien mit den physischen. In der Public Cloud sind dagegen die Deduplizierungsmechanismen der Plattform für den Anwender nicht sichtbar.

Wenn der Provider Deduplizierung in der Cloud implementiert, dann profitiert nur er selbst davon. Das liegt darin, dass der Storage-Speicherplatz nach der verbrauchten logischen Kapazität abgerechnet wird und nicht nach der physischen Kapazität und der Provider die möglichen Einsparungen für sich selbst einstreicht.

Das ist ein Problem für jemanden, der Backups in die Cloud auslagert. Das Kopieren von verschiedenen Backup-Images verbraucht große Speichervolumina. Das benötigte Volumen ist viel größer als bei einer Deduplizierungsplattform, etwa einem Festplattensystem, als Backup-Ziel.

Es gibt eine Reihe von Lösungsansätzen für dieses Problem. Viele Backup-Lösungen führen Deduplizierung an der Quelle durch, das heißt bevor Daten übertragen werden. Nur die bereits deduplizierten Daten werden auf physischer Storage gespeichert. Die Backup-Software verwaltet die Metadaten, die die Übertragung von logischem zu physischem Speicher bewältigen.

Eine Alternative wäre ein Storage-Gateway, das die Deduplizierung über ein Storage Interface abwickelt. In diesem Fall ist der Administrator nicht abhängig von der Backup-Software. Daten können leichter auf andere Plattformen übertragen werden.

Bei der ersten Option behält die Backup-Software die Kontrolle über die Metadaten und deshalb ist ein Storage-Gateway zur Deduplizierung vorzuziehen. Dies stellt sicher, dass die Daten über die Backup-Software hinweg transportfähig sind und erleichtert den Datenimport.

Dieser Prozess funktioniert nicht nur in der Cloud, sondern auch bei virtuellen Maschinen (VM), wo das Betriebssystem der VMs identisch oder ähnlich ist.

Bei Backups mit zahlreichen identischen Daten kann Deduplizierung von großem Nutzen sein. Wenn sich nur ein kleiner Prozentsatz der Daten (etwa fünf bis zehn Prozent) zwischen den verschiedenen Backups ändern, ist eine Platzeinsparung von 20 zu 1 oder höher durchaus realistisch.   

Folgen Sie SearchStorage.de auch auf Twitter, Google+, Xing und Facebook!

Nächste Schritte

Mit Deduplizierung Backup-Daten erfolgreich, effizient und sicher speichern

Wann auf Daten-Deduplizierung verzichtet werden kann

Für was man Deduplizierungs-Arrays einsetzt

Backup-Optionen: Deduplizierungs-Arrays, Backup-Appliances oder doch die Cloud?

Artikel wurde zuletzt im Mai 2017 aktualisiert

Pro+

Premium-Inhalte

Weitere Pro+ Premium-Inhalte und andere Mitglieder-Angebote, finden Sie hier.

Erfahren Sie mehr über Daten-Deduplizierung und -Reduzierung

Diskussion starten

Schicken Sie mir eine Nachricht bei Kommentaren anderer Mitglieder.

Mit dem Absenden dieser Daten erklären Sie sich bereit, E-Mails von TechTarget und seinen Partnern zu erhalten. Wenn Ihr Wohnsitz außerhalb der Vereinigten Staaten ist, geben Sie uns hiermit Ihre Erlaubnis, Ihre persönlichen Daten zu übertragen und in den Vereinigten Staaten zu verarbeiten. Datenschutz

Bitte erstellen Sie einen Usernamen, um einen Kommentar abzugeben.

- GOOGLE-ANZEIGEN

SearchSecurity.de

SearchNetworking.de

SearchEnterpriseSoftware.de

SearchDataCenter.de

Close