Petya Petrova - Fotolia

EMC DSSD D5 mit NVMe Fabric: Das All-Flash-Monster

DSSD D5 von EMC ist ein hochleistungsfähiges Flash-Storage, dass NVMe- und PCIe-Technologie vereint, innovatives RAID nutzt und geringe Latenzen hat.

Dieser Artikel behandelt

SSD

ÄHNLICHE THEMEN

Das DSSD D5 von EMC führt eine innovative All-Flash-Architektur ein – NVMe Fabric – und stellt verteilten (shared) Flash-Speicher zur Verfügung, der eine Performance von bis zu 10 Millionen IOPS, 100 GBit/s Bandbreite und Latenzen von 100 Mikrosekunden bietet.

Offiziell heißt die Lösung Rack-Scale Flash, aber intern wird das System auch als Server-Class Storage bezeichnet. Es soll die Lücke zwischen den PCIe-Server-Karten und Netzwerk-Arrays schließen. Die Lösung selbst basiert auf einer Technologie, die der Hersteller bereits 2014 akquirierte.

Das fünf Höheneinheiten große System fasst 36 Flash-Module, die mittels der NVMe Fabric miteinander vernetzt sind. Die Flash-Module sind 3D-TLC-NAND-Medien mit vier Terabyte. Somit offeriert das erste DSSD-Modell eine native Speicherkapazität von 144 Terabyte, von denen letztlich 100 Terabyte nutzbar sind.

Durch die NVMe-Vernetzung der einzelnen Module werden insgesamt 18.000 DIEs zu einem Speicherpool zusammengefasst, bei dem jeder Port jede Zelle einzeln adressieren kann. Es ist eine Performance-orientierte Architektur, die für den Anschluss der Server 96 PCIe-Gen3-Karten zur Verfügung, die allerdings für 48 Server zur Verfügung stehen, da der Hersteller generell von einer dualen Konfiguration ausgeht.

Durch die NVMe-Vernetzung der Module benötigt ein Hop innerhalb der Fabric höchstens 200 Nanosekunden. Die geringen Gesamtlatenzen werden durch einen non-blocking cut-through Switch ermöglicht.

Abbildung 1: DSSD D5 Hardware-Architektur

Da das Design 2016 noch seinesgleichen sucht, musste der Hersteller ein eigenes Format sowie die Kabel dafür entwickeln. Ebenso gibt es ein dediziertes Betriebssystem für das DSSD D5: FLOOD. Das Flood Direct Memory API wurde für bessere Performance konzipiert. Die Applikationen werden direkt in dieses API geschrieben. Adressieren die Anwendungen das DSSD-API als Library, so kann der I/O direkt beim User Space erfolgen und muss nicht über den Kernel laufen, was die Anwendung beschleunigt. Damit lassen sich Objekte sichern und schnell verarbeiten. Darüber hinaus verfügt das DSSD D5 über einen Block-Treiber für bestehende Server und Applikationen sowie über DSSD Plug-Ins, beispielsweise für Hadoop, sei es Cloudera, HortonWorks oder Pivotal. Aber auch Files wie GPFS lassen sich mit dem System ansprechen.

Hohe Systemsicherheit

Um für eine hohe Verfügbarkeit zu sorgen, integrierte der Hersteller verschiedene Technologien wie Dynamic Wear Leveling, physische Flash-kontrolle, Space-Time Garbage Collection und Cubic RAID. Die RAID-Technologie musste EMC neu entwickeln, da sie hier nicht das übliche Error Erasure Coding anwenden wollten und da herkömmliche RAID-Mechanismen nicht greifen, weil sie für Festplatten konzipiert wurden.

Abbildung 2: Meshed NVMe-Fabric

Cubic RAID ist ein multi-dimensionaler RAID-Mechanismus, der die Zelle als Speicherort in einer gitterförmigen Anordnung berücksichtig. Dabei wird jede Reihe und jede Spalte mittels Parity abgesichert. Am Ende werden die verbleibenden vier freien Zellen mit einer Parität für die Parität belegt. Damit lassen sich Reparaturen sich überschneidender Zellen und Spalten umsetzen. Die Reparatur erfolgt sequentiell und auf Chip-Ebene. Cubic RAID prüft also den Zustand des Zell-Bits und nicht die Inhalte der Zelle wie bei ECC.

Zusätzlich kommt die „Predictive Analytics“ des Anbieters zum Einsatz, mit dem sich I/Os im Voraus ebenso bestimmen lassen wie potenzielle Flaschenhälse, Probleme oder Schwachstellen. Dies macht das System um ein weiteres zuverlässiger, da sich Probleme im Entstehen eliminieren lassen. Dies ist ein etabliertes Feature, das bereits in der VMAX/Symmetrix-Familie zum Einsatz kommt.

Kein Software-defined Storage

EMC beweist einmal mehr, dass es selbst in den so virtualisierten Welten nicht nur Software-defined Storage bedarf, um hohe Leistungen zu erreichen. Im Gegenteil. Das DSSD D5 ist eine echte Hardwarelösung mit dedizierter Firmware – sozusagen ein monolithisches Flash-Storage, basierend auf Standards (NVMe, PCIe, 3D TLC-NAND) mit einem eigenen Betriebssystem (Firmware). Die Steuerlogistik ist quasi proprietär, nutzt aber in vollem Umfang standardisierte Protokolle. Der Hersteller versucht hier, massiv den I/O-Stack zu verringern, um schnellere Antwortzeiten, höhere IOPS und weniger Overhead zu erreichen.

Diese Lösung zeigt deutlich, dass sich nach wie vor das Optimum aus innovativen Technologien herausholen lässt, wenn die Software auf die Hardware abgestimmt beziehungsweise dafür konzipiert wurde. Und auch wenn es mehr oder weniger einer DAS-Konfiguration entspricht, so liefert es doch mehr Shared Storage an einzelne Server (48 in Summe) als derzeitige Direct-attached Flash-Lösungen.

Storage wird zum neuen Server

Storage wurde und wird oft als „Schwanz“ oder „Appendix“ zum Server gesehen. Deswegen versuchen Konzepte wie Konvergenz oder Hyper-Konvergenz, Storage, Compute und Netzwerk enger zu verschmelzen. Dabei bleiben die einzelnen Komponenten nach wie vor separiert und integrieren sich nicht völlig. Dies versucht EMC nun über einen geschrumpften I/O-Stack, der in Kürze sicher noch kleiner wird. Vernetzte NVMe-Fabrics werden sich weiter durchsetzen und weitere Hersteller, beispielsweise Pure Storage, werden in Kürze diesem Beispiel folgen.

Das bedeutet, dass letztlich nicht das Storage zur Nebensache geriert, sondern eher der Server als Komponente im Storage-System aufgeht. Hersteller haben erkannt, dass die Anwendung respektive die Daten so nah ans Storage wie möglich gebracht werden muss und dass Storage die Performance mitbringen muss, die für eine Verarbeitung oder/und Analyse notwendig ist. Meshed Fabrics (nicht zu verwechseln mit Meshed Fabrics in SANs), in denen intern jeder Kanal mit jeder Zelle „sprechen“ kann, sind ein Schritt in diese Richtung.

Abbildung 3: Ein verkleinerter I/O-Stack ermöglicht geringere Latenzen.

Allerdings fehlt es noch an entsprechender Skalierbarkeit, denn zwar lassen sich die Systeme durch neue und hochkapazitive Flash-Module erweitern, ein Zusammenschluss mehrerer Systeme ist derzeit nicht möglich. Dies wird aber ein unumgänglicher nächster Schritt, um Leistung und Kapazität simpel steigern zu können. Und auch hier bedarf es dem optimalen Zusammenspiel zwischen neuster Technologie und dediziertem Betriebssystem/Software.

Einsatzgebiete und Unterschiede zu anderen Flash-Technologien

Als wichtigstes Einsatzgebiet sieht der Hersteller vor allem Echtzeitanwendungen. Darüber hinaus sind SAP HANA, Hadoop, In-Memory-Umgebungen, Genomsequenzierung, Fraud Detection, Big-Data-Analytics und jegliche Open-Source-Anwendungen im Echtzeitbereich.

EMC sieht aber weitaus mehr Potenzial, dass sich noch nicht eingrenzen lässt, da diese Architektur noch nicht verbreitet ist und oft noch zeigen muss, was sie kann. So hat unlängst ein nicht-repräsentativer Testlauf mit Oracle RAC ergeben, dass DSSD hier dreimal schneller ist als die Oracle-Lösung selbst.

Um zu verdeutlichen, wie anders der DSSD-Ansatz ist, hier zum Vergleich drei andere Flash-Lösungen:

In-Memory: Daten werden in non-persistentem DRAM gesichert. Durch die Nähe zwischen CPU und DRAM lässt sich eine hohe Performance innerhalb einer Node erreichen. Allerdings verlangsamt sich diese, wenn Daten zwischen unterschiedlichen Node verschoben werden müssen. Weitere Einschränkungen sind kleinere Datensätze, reduzierte Kapazitäten und längere Zeiträume, um Daten zu speichern.

Direct-attached Flash: Daten werden direkt in eine Node mit PCIe-Flash-Karten geschrieben, was hohe IOPS und geringe Latenzen gewährleistet. Allerdings sind die Kapazitäten der Karten her begrenzt. Zudem kann es bei der linearen Skalierung dazu kommen, dass man zu viele ungenutzte Ressourcen vorhält. Da hierbei Daten an individuelle Server gebunden sind, können isolierte IOPS entstehen. Ebenso weist dieses Konstrukt mehrere Single Points of Failure auf.

Shared All-Flash: Performance erfährt hier höhere Latenzen aufgrund der SAN-Netzwerk-Fabric. Es entstehen I/O-Bottlenecks. Da zudem Protokolle und Architekturen genutzt werden, die ursprünglich für Festplattensysteme entwickelt wurden, wird das Potenzial des Flash-Speichers nicht ausgenutzt.

DSSD D5 ist der erste Schritt, eine hoch kapazitive All-Flash-Architektur für Echtzeitanwendungen anzubieten, die den Flash näher an den Prozessor bringt und die Flash-Kontrollinstanz aus dem Datenpfad herausnimmt.

Folgen Sie SearchStorage.de auch auf Twitter, Google+ und Facebook!

Artikel wurde zuletzt im März 2016 aktualisiert

Pro+

Premium-Inhalte

Weitere Pro+ Premium-Inhalte und andere Mitglieder-Angebote, finden Sie hier.

Erfahren Sie mehr über Solid-State-Speicher

0 Kommentare

Älteste Beiträge 

Passwort vergessen?

Kein Problem! Tragen Sie Ihre E-Mail-Adresse unten ein. Wir werden Ihnen eine E-Mail mit Ihrem Passwort schicken.

Ihr Passwort wurde an die folgende E-Mail-Adresse gesendet::

- GOOGLE-ANZEIGEN

SearchSecurity.de

SearchNetworking.de

SearchEnterpriseSoftware.de

SearchDataCenter.de

Close