Datenreduktions-Methoden im All-Flash-Rechenzentrum

Wer All-Flash-Systeme einsetzt, erhält die optimale Speichereffizienz, wenn Datenreduktion mit einer Inline-Methode durchgeführt wird.

Das Konzept eines All-Flash-Rechenzentrums ist verlockend, würden doch alle zeitraubenden Tuning-Prozesse eliminiert. Es würde Rechenzentren ebenso ermöglichen, eine maximale Dichte an virtuellen Maschinen zu erreichen und gleichzeitig alle Applikationsanwender mit einer zufriedenstellenden Antwortzeit zu versorgen.

Datenreduktionsmethoden wie Deduplizierung, Komprimierung und Thin Provisioning sowie die fallenden Flash-pro-GByte-Preise lassen das Konzept des All-Flash-RZ langsam Realität werden. Nur wenige Hersteller liefern alle drei Datenreduktionsmethoden, also ist es wichtig zu wissen, welche Technologie für das eigene Unternehmen das Beste ist.

Erwägt man Datenreduktion einzusetzen, um Flash-Storage günstiger zu machen, dann müssen Administratoren die möglichen Performance-Auswirkungen kennen. Jegliche Art von Layer, die man einem Storage-Medium mit extrem geringen Latenzen hinzufügt, wird die Performance beeinflussen. Die wichtige Frage hier ist: Werden Anwender und Anwendung die Performance-Auswirkung bemerken? In der Regel lässt sich ein Performance-Verlust mit zusätzlichen Prozessoren oder Memory verringern.

Die Datenreduktionsmethode wählen

In den meisten Rechenzentren wird der Overhead jeglicher Datenreduktionsmethode wortwörtlich unbemerkt bleiben. Die Flash-Systeme haben oft genügend Ressourcen, meist mehr als das RZ oft nutzt. Deswegen zahlt es sich aus, einige davon zu nutzen, um die Kosten des Flash-Storage zu minimieren.

Thin Provisioning ist eine gute Investition für nahezu jede Umgebung. Der Overhead wird dynamisch der Kapazität eines Volumes hinzugefügt, ist aber eher minimal. Das ist wichtig, denn andere Datenreduktionsverfahren können dies nicht optimieren. Die Kapazität ist fest einer LUN zugeteilt (hard allocated) und kann nicht geteilt werden.

Deduplizierung eliminiert redundante Datensegmente in Files. Die Reduktionsraten können sehr groß sein, vor allem in virtuellen Umgebungen, wo es viele Gemeinsamkeiten zwischen den Gastbetriebssystemen gibt.

Deduplizierung kann sich allerdings deutlich auf der Performance niederschlagen. Hier werden zahlreiche Metadaten generiert, um die einzigartigen Daten und die dazugehörigen Pointer zu bestimmen. Die Metadaten der Deduplizierung schnell zu verarbeiten ist für die Gesamtperformance kritisch. Flash-Memory kann hier sicher Abhilfe schaffen, aber die Redundanzen langfristig zu sichern, wenn das System erweitert wird, erfordert mehr CPUs. Das wiederum kann den Preis des Storage-Systems weiter nach oben treiben.

Komprimierung reduziert den Kapazitätsverbrauch, indem es Redundanzen innerhalb von Files und nicht nur zwischen Files eliminiert. Zwar kommen hier keine so hohen Reduktionsraten wie bei der Deduplizierung zustande, dafür erreicht diese Methode konsistentere Resultate, da es in allen Files funktioniert und nicht mehrere Files mit redundanten Daten benötigt. Durch in-File-Effizienz eignet sich Komprimierung für Datenbanken und andere Single-File-Informationen.

Die Inline-Anforderung

Datenreduzierung hat zwei Vorteile für All-Flash- und Hybrid-Systeme:

  • Die Reduzierung der benötigten Gesamtkapazität. Viele All-Flash-Hersteller propagieren einen Preis von unter drei US-Dollar pro GByte, andere behaupten einen Preis von unter einem Dollar pro GByte zu erreichen. Der wirkliche Preis hängt vom Effizienzgrad ab, den man erreicht und jedes RZ ist mehr oder weniger einzigartig, wenn es darum geht, wie wirksam diese Technologien wirklich sind.
  • Inline-Datenreduktion verlängert die Lebensdauer der Flash-Module. Die Schreibbeschränkungen von Flash-Modulen sind wohl bekannt und es gibt eine vorbestimmte Anzahl an Schreibprozessen, die ein Flash-Modul verarbeiten kann.

Wendet man alle drei erwähnten Reduktionsverfahren an, bevor die Daten in den Flash geschrieben werden, so nennt man dies ein Inline-Verfahren. Nutzt man beispielsweise alle drei Reduktionsmethoden, erhält man wenigsten eine Reduktionsrate von 5:1. Das bedeute ein Reduktionspotential von 500 Prozent bei Schreibvorgängen, was die Lebensdauer der Flash-Module erheblich verlängert.

Welche Methode die beste ist, hängt auch vom Einsatzszenario ab. Die meisten RZs nutzen Flash für eine Reihe unterschiedlicher Workloads. Jede Datenreduktionsmethode wird zu einem bestimmten Zeitpunkt die Beste für jede Workload sein. Für gemischte Workloads ist das System am effizientesten, das alle Reduktionsverfahren umfasst und Inline-Prozesse durchführt. Derzeit gibt es aber nur wenige Systeme, die alle drei Methoden anbieten.

Bei einigen Anwendungsgebieten variiert die Antwort. In einer Datenbankumgebung zum Beispiel, reicht ein System mit Komprimierung. Hat die Datenbank bereits fast das Limit seiner Performance ausgeschöpft, dann könnte ein System ohne Reduktionstechnologie oder der Option des An-/Abschaltens der Reduktion vonnöten sein. Virtuelle Umgebungen könnten bereits mit einem reinen Deduplizierungssystem bedient werden.

Alternative zur Datenreduktion: Native Kapazität

Eine Alternative zu Datenreduktion ist native Kapazität. In der Vergangenheit wurden Flash-Arrays zu teuer, wenn man keine Reduktionsmechanismen verwendete. Nun gibt es aber dichtere Flash-Speicher wie zum Beispiel Triple-Level Cell (TLC) und 3D NAND. Storage-Systeme mit diesen Medien können sehr wohl die 1-Dollar-pro-GByte-Grenze durchbrechen. Da allerdings ihre Haltbarkeit noch ein Problem darstellt, sollten sie mit zuverlässigen SLC-Medien als zusätzlicher Storage-Tier zum Einsatz kommen, um Schreibprozesse abzufedern.

Der Vorteil dieses Ansatzes ist es, dass die Kosten pro GByte exakt feststehen. Es gibt keine Reduktionsvariable und keinen Performance-Overhead, der in die Berechnung mit einfließen muss.

Datenreduktionsverfahren machen das Konzept des All-Flash-RZ zur Realität. Jede einzelne Methode – Deduplizierung, Komprimierung, Thin Provisioning – hat ihre Vorteile und Effizienz. Trotzdem sind Flash-Arrays am effizientesten, wenn alle drei gleichzeitig und als Inline-Prozess zum Einsatz kommen, bevor die Daten aufs Medium geschrieben werden.

Folgen Sie SearchStorage.de auch auf Twitter, Google+ und Facebook!

Artikel wurde zuletzt im Oktober 2015 aktualisiert

Pro+

Premium-Inhalte

Weitere Pro+ Premium-Inhalte und andere Mitglieder-Angebote, finden Sie hier.

Essential Guide

Flash Storage beschleunigt das Rechenzentrum

Diskussion starten

Schicken Sie mir eine Nachricht bei Kommentaren anderer Mitglieder.

Mit dem Absenden dieser Daten erklären Sie sich bereit, E-Mails von TechTarget und seinen Partnern zu erhalten. Wenn Ihr Wohnsitz außerhalb der Vereinigten Staaten ist, geben Sie uns hiermit Ihre Erlaubnis, Ihre persönlichen Daten zu übertragen und in den Vereinigten Staaten zu verarbeiten. Datenschutz

Bitte erstellen Sie einen Usernamen, um einen Kommentar abzugeben.

- GOOGLE-ANZEIGEN

SearchSecurity.de

SearchNetworking.de

SearchEnterpriseSoftware.de

SearchDataCenter.de

Close