Storage-Services und Datenverteilung in konvergenten Architekturen

Muss die Performance vorhersehbar sein, so sollten IT-Planer eine Lösung mit einem dedizierten Storage-Tier und einem converged Storage-Tier suchen.

Storage Service sind ein wichtiger Teil jeder Infrastruktur, besonders in konvergenten (converged) Architekturen. Viele dieser gebündelten Lösungen nutzen traditionelles Shared Storage (verteilter Speicher wie z.B. NAS) für den Speicher in der Architektur. Dafür bedarf es eines Speichernetzwerks. Allerdings wird die Komplexität eines solchen Netzwerks bezüglich der Integration durch die  Vorarbeit des Herstellers reduziert.

In den meisten und in allen der reinen Software-basierten konvergenten Systeme sind die Storage-Services ein Teil des Compute-Tiers. Die Storage-Software führt die Kapazität der einzelnen Nodes zusammen, was die Kosten und die Komplexität eines zusätzlichen Storage-Controller eliminiert. Diese Systeme können Speichermedien der Serverklasse satt Enterprise-Festplatten und Flash nutzen. Diese beiden Features senken die Kosten enorm.

Allerdings gibt es einige Probleme, wenn Storage-Services Teil des Compute-Tiers sind. Diese Services laufen üblicherweise innerhalb eines VM-Konstrukts (virtuelle Maschine). Das heißt, deren Aktivitäten könnten andere VMs im Cluster nachteilig beeinflussen. Eine I/O-Lastspitze auf einer virtualisierten SQL-Server-Applikation, könnte zu einer Lastspitze auf den VMS mit der Storage-Software erzeugen, was wiederum den I/O-Bus belastet. Da jede Node Storage, Compute und Storage-I/O bereit stellt, sollten einige der I/O-Probleme abgeschwächt werden, allerdings bleiben Bedenken ob der Berechenbarkeit der Performance.

Diese Bedenken könnten sich vergrößern, da die meisten der integrierten oder Software-basierten konvergenten Systeme nicht den Shared Storage ausnutzen können. Data Center, die nicht diese Performance-Berechenbarkeit besitzen, haben auch nur geringe Fähigkeiten dies durch konvergente Storage-Silos zu adressieren. Wo berechenbare Performance benötigt wird, dort sollten IT-Planer eine Lösung anstreben, die sowohl einen dedizierten als auch einen konvergenten Storage-Tier bereit stellt.

Wir werden Daten für Sharing und RAID-Schutz verteilt?

Um Eigenschaften wie eine Live-Migration zu unterstützen, verlangen virtuelle Maschinen multiple Hosts, um Zugang zu den selben virtuellen Festplatten zu erhalten. Ebenso müssen VMs vor einem Festplattenausfall geschützt werden.

Da die gebündelten Lösungen meistens traditionelle Shared Arrays verwenden, braucht man sich hier um Datenschutz keine Sorgen zu machen. Diese Arrays gehören oft der Enterprise-Klasse an und verfügen über RAID-basierte Datensicherheit.

Gebündelte und integrierte Lösungen haben einen anderen Ansatz. Sie sind für ihre Storage-Software optimiert, die typischerweise Scale-out-ähnlich über den Compute-Tier verteilt operieren. Dies kann auf zwei Arten geschehen. Zum einen gibt es ein Replikations-Modell, bei dem jede VM in Echtzeit auf ein oder zwei Nodes repliziert wird. Die meisten IT-Palner wählen eine 3-Wege-Replikation, so dass sie immer noch einen weiteren Schutz haben, selbst wenn eine Node ausfällt.

Replikation ist eine einfache und effiziente Technik. Allerdings müssen IT-Planer beachten, dass hierbei drei Mal so viel an Kapazität benötigt wird. Jeder Schreibprozess wird also verdreifacht, so dass zudem die Netzwerkverbindungen zwischen den Nodes höher belastet werden.

Die zweite Option ist, Technologien wie Erasure Coding zum Schutz der Daten eingesetzt werden kann. Erasure Coding braucht weniger Kapazität als Replikation, etwa um die 30 Prozent. Darüber hinaus sind die I/Os so klein, dass bei Schreib- und Rebuild-Prozessen eine bessere Performance zu erwarten ist. Der Nachteil ist, dass normalerweise jede Node an jedem I/O-Prozess beteiligt ist, egal ob lesend oder schreibend.

Eine finanzielle Überlegung ist, wie die konvergente Architektur Performance zur Verfügung stellt. Die gebündelten Lösungen bieten Performance über Shared Storage. Hier ist es wichtig, dafür zu sorgen, dass das Speichernetzwerk entsprechend konfiguriert und optimiert ist.

Integrierte oder Software-basierte konvergente Infrastrukturen sollten bei der Performance einen Vorteil haben. Da hierbei die Storage-Software im Compute-Tier läuft, sollten die I/O-Zugriffe – vor allem die Lesezugriffe – eine deutlich bessere Performance haben. Wie das in der Realität ist, hängt größtenteils davon ab, wie die Software-Architektur aussieht. Gibt es ein intelligentes Daten-Placement, so kann die Software so gestaltet sein, dass jede VM eine lokale Kopie ihrer Daten besitzt. Das sollte besonders einfach sein für Systeme, die Replikation für den Datenschutz einsetzen. Dies mag für Systeme mit Erasure Coding nicht zutreffen.

Artikel wurde zuletzt im Januar 2015 aktualisiert

Pro+

Premium-Inhalte

Weitere Pro+ Premium-Inhalte und andere Mitglieder-Angebote, finden Sie hier.

Erfahren Sie mehr über Data-Center-Storage

Diskussion starten

Schicken Sie mir eine Nachricht bei Kommentaren anderer Mitglieder.

Mit dem Absenden dieser Daten erklären Sie sich bereit, E-Mails von TechTarget und seinen Partnern zu erhalten. Wenn Ihr Wohnsitz außerhalb der Vereinigten Staaten ist, geben Sie uns hiermit Ihre Erlaubnis, Ihre persönlichen Daten zu übertragen und in den Vereinigten Staaten zu verarbeiten. Datenschutz

Bitte erstellen Sie einen Usernamen, um einen Kommentar abzugeben.

- GOOGLE-ANZEIGEN

SearchSecurity.de

SearchNetworking.de

SearchEnterpriseSoftware.de

SearchDataCenter.de

Close