RAID-Technologie schreitet mit Wide-Striping und Erasure-Coding voran

Klassische RAID-Technologien werden von Innovationen überholt und führen dazu, dass Firmen Ihre bisherigen RAID-Lösungen ersetzen und austauschen.

Was Sie in diesem Artikel erfahren können: Die heutigen RAID-Systeme haben sich weit über das Niveau der 1980er Jahre hinaus entwickelt. Lesen Sie, warum Techniken wie Wide-Striping, Storage-Virtualisierung und Erasure-Coding grundlegende Veränderungen beim Thema RAID bringen.

Kaum eine Technologie ist so eng mit der Branche für Enterprise-Storage-Systeme verzahnt wie RAID. Der Grund dafür ist, dass die Kombination mehrerer physischer Festplatten (HDDs) zu einem einheitlichen virtuellen Laufwerk Performance und Zuverlässigkeit erhöht. Die RAID-Systeme von 2011 gehen deutlich über die traditionellen Platten-Konfigurationen hinaus, die als „RAID-Levels“ bezeichnet werden und erstmals in einer grundlegenden Abhandlung aus dem Jahr 1988 mit dem Titel „A Case for Redundant Arrays of Independent Disks (RAID)“ beschrieben wurden. Heute verlässt man sich zum Schutz von Daten zunehmend auf eine fortschrittliche mathematische Methode namens Erasure-Coding bekannt ist. In der Folge hatten viele schon das Ende von RAIDs prophezeit, doch diese dürften auch in Zukunft noch eine Rolle für den Schutz von Daten spielen.

Überholte RAID-Konzepte

Rein informationshalber sei erwähnt, dass das Paper aus dem Jahr 1988 RAID als Ansatz für die „ungelöste I/O-Krise“ vorgeschlagen hatte. Zum damaligen Zeitpunkt wurden Fortschritte bei CPU- und Speicherleistung durch zu langsame und teure Festplattenlaufwerke konterkariert – in Mainframes steckten einzelne, große und kostspielige Festplatten. RAID wurde entwickelt, um günstige PC-Festplatten als Alternative dazu nutzbar zu machen.

Heute sind zwei der damals fünf vorgeschlagenen „RAID-Levels“ oder -Konfigurationen immer noch populär: RAID 1, bei dem Daten gespiegelt werden; und RAID 5, bei dem sowohl Daten als auch Paritätscheck-Informationen über mehrere Laufwerke verteilt werden. Aber auch für RAID 3 und RAID 4 haben sich Anwendungen gefunden. Beide verteilen ebenfalls Daten über mehrere Disks, verwenden jedoch nur ein einzelnes Laufwerk für die Paritätscheck-Daten.

Alle ursprünglichen RAID-Levels weisen gewisse Gemeinsamkeiten auf. Sie vereinen mehrere Festplatten-Laufwerke und nutzen dabei deren gesamte Kapazität; die Laufwerksgruppierungen sind festgelegt und unflexibel; und die zugrunde liegenden mathematischen Berechnungen sind vergleichsweise simpel und erfordern nur wenig Rechenleistung. Dies alles waren vernünftige Design-Vorgaben für die 90er Jahre. Aber CPU-Leistung und Storage-Kapazität haben sich seitdem deutlich weiterentwickelt. Die CPU-Leistung ist gestiegen: Wo einfache Mathematik auf XOR-Niveau einst eine Herausforderung war, berechnen Controller heute moderne Reed-Solomon-Codes in Echtzeit. Die Festplatten-Performance hinkte ihrer Kapazität hinterher.

Dies ist das Kernproblem, um das es bei Datensicherungssystemen als Nachfolger von RAID geht. Statt nur einen einzigen Mainframes mit 100 kleinen Laufwerken und Controllern der einfachsten Art haben heutige Storage-Systeme für Unternehmen eine unglaubliche Rechenleistung. Sie können zeitgleich Hunderte von Clients über ein Storage Area Network (SAN) oder Network Attached Storage (NAS) versorgen. Unflexible Ansammlungen von Festplatten sind für ein modernes Rechenzentrum deshalb alles andere als sinnvoll.

Der nächste Schritt für RAID: Wide-Striping, Storage-Virtualisierung und Erasure-Coding

Die Hersteller von Storage haben nicht lange gezögert und die RAID-Level so angepasst, dass sie die Bedürfnisse ihrer Kunden erfüllen. Techniken wie Wide-Striping, Storage-Virtualisierung und Erasure-Coding verändern die Grundannahmen zu RAID. Viele dieser Arbeiten geschahen jedoch im Stillen und unsichtbar für den Kunden. Und die alten Bezeichnungen halten sich hartnäckig.

EMC Corp., Hewlett Packard (HP) und andere warfen das „whole disk“-Konzept schon Mitte der 1990er Jahre über den Haufen und bauten RAID 1 und RAID 5-Sets auf Basis von Kapazitätsscheiben („stripes“), die über mehrere Laufwerke verteilt waren. Dies wurde in den 2000er Jahren noch weiter entwickelt von Unternehmen wie 3PAR und Compellent Technologies Inc., deren „Wide-Striping“-Technik nur einen kleinen Anteil der Daten auf jeder Festplatte unterbringt. Das Verteilen von Daten über eine deutlich höhere Anzahl von Laufwerken verbessert die durchschnittliche Performance. Zudem wird der Zeitaufwand für den Neuaufbau eines RAID-Sets bei einem Ausfall deutlich verkürzt. Auch wenn viele Arrays heute noch auf strikt definierte Laufwerksgruppen aufsetzen: Die meisten Geräte aus dem Highend-Bereich verteilen die Daten breiter.

Ähnlich wie bei Server-Virtualisierung wird auch bei Storage-Virtualisierung die starre Verbindung zwischen physischen Systemen und deren logischen Entsprechungen aufgebrochen. Virtualisierte Arrays gaukeln Servern Laufwerke und Dateisysteme vor, die jedoch nicht an ein bestimmtes Disk-Set gebunden sind. Dadurch sind sie in der Lage, die Daten frei zwischen RAID-Sets, Festplatten, Flash-Storage und sogar mehreren Arrays zu bewegen. Konventionelle RAIDs mag auf niedrigem Niveau – nach wie vor – Verwendung finden. Storage-Virtualisierung überwindet jedoch dessen unflexibles Layout und die Kapazitätseinschränkungen.

Erasure-Coding wiederum ist eine neue Art des Schutzes von Daten. Diese geht – mathematisch betrachtet – deutlich über die simplen Paritätsprüfungen klassischer RAID-Systeme hinaus. Auch wenn im Zusammenhang mit RAID 6 häufig der Begriff „Dual-Parity“ fällt, findet hier in Wirklichkeit findet das fortschrittliche Reed-Solomon-Coding Anwendung. Dieses bietet eine Vielzahl von Vorteilen gegenüber der einfachen Paritätsberechnung. derartige Systeme sind nicht nur in der Lage, verlorene Daten wiederherzustellen, sondern können auch beschädigte Daten erkennen. Einige Systeme streuen die Daten breit über Laufwerke, Storage-Knoten und geografische Orte, um die Zuverlässigkeit noch weiter zu erhöhen. Die Algorithmen dafür waren bereits in den 1980ern weithin bekannt. Doch die Rechenleistung war zum damaligen Zeitpunkt noch nicht so weit entwickelt, dass eine Verwendung in Storage-Arrays möglich gewesen wäre.

Leben in der Welt nach RAID

Die Storage-Systeme der Enterprise-Klasse von heute verwenden diese modernen Datenschutz-Techniken ebenso wie klassische RAID-Levels und zumeist auf irgendeine Weise virtualisiert. Käufer von Daten-Storage sehen sich einer großen Zahl von neuen Technologien gegenüber sehen, deren Kombinationsvielfalt eine Bewertung alles andere als leicht macht. Es ist daher unbedingt erforderlich, sich von veralteten „Faustregeln“ in Bezug auf RAID zu lösen und sich stattdessen auf die tatsächliche Performance und Administrierbarkeit der Systeme zu konzentrieren.

So bestand die einzige Möglichkeit, hohe Performance zu erreichen, früher darin, RAID 1 und Data-Striping (auch RAID 0 genannt) zu einem „RAID 1+0“- oder einem „RAID 10“-Set zu kombinieren. Moderne Systeme mit DRAM, Flash-Cache, Wide-Striping und automatischem Tiering aber sind, trotz Verzichts auf das 50 Prozent der Kapazität schluckende RAID 1, bei weitem leistungsfähiger. In ähnlicher Weise vermeiden Administratoren wohl immer noch RAID 5 wegen seiner einst eingeschränkten Performance bei klassischen Implementierungen. Aber die heutigen Systeme können mit diesen Problemen aufräumen und bieten oft mehr Performance, als überhaupt abgerufen werden kann.

Technische Fortschritte haben RAID zu weiterer Verbreitung verholfen. Aber nicht alle RAID-Systeme sind gleichwertig. Die CPU-Leistung und die Cache-Kapazität eines Arrays haben weit größeren Einfluss auf die Performance als die reine Anordnung der Laufwerke. Und Laufwerke mit größerer Kapazität können ein kleines Array als angemessene Alternative zu einem größeren System erscheinen lassen – obwohl die Performance mit Sicherheit darunter leiden wird. Einfach ausgedrückt: Man kann nicht einfach davon ausgehen, dass mit einem bestimmten System schon alles laufen wird.

Die beste Herangehensweise für Storage-Käufer besteht deshalb darin, nicht mit Annahmen auf der Basis von RAID-Levels zu arbeiten, sondern sich mit der realen Performance von Storage-Geräten zu beschäftigen. Sie sollten die Anbieter bitten, Referenzen vorzulegen, und untersuchen, inwieweit ein bestimmtes System ihre Anwendungen unterstützt. RAID ist nicht tot – aber die entscheidenden Fragen im Zusammenhang mit Enterprise-Storage reichen weit darüber hinaus.

Über den Autor: Stephen Foskett arbeitet als unabhängiger Berater und Autor mit Spezialisierung auf Enterprise-Storage und Cloud Computing. Er ist Koordinator von Gestalt IT, einer Community unabhängiger IT-Vordenker, und organisiert deren Tech Field Day-Events. Sie finden Foskett auf GestaltIT.com, FoskettS.net und auf Twitter unter @SFoskett.

Artikel wurde zuletzt im Januar 2011 aktualisiert

Pro+

Premium-Inhalte

Weitere Pro+ Premium-Inhalte und andere Mitglieder-Angebote, finden Sie hier.

Erfahren Sie mehr über RAID

Diskussion starten

Schicken Sie mir eine Nachricht bei Kommentaren anderer Mitglieder.

Mit dem Absenden dieser Daten erklären Sie sich bereit, E-Mails von TechTarget und seinen Partnern zu erhalten. Wenn Ihr Wohnsitz außerhalb der Vereinigten Staaten ist, geben Sie uns hiermit Ihre Erlaubnis, Ihre persönlichen Daten zu übertragen und in den Vereinigten Staaten zu verarbeiten. Datenschutz

Bitte erstellen Sie einen Usernamen, um einen Kommentar abzugeben.

- GOOGLE-ANZEIGEN

SearchSecurity.de

SearchNetworking.de

SearchEnterpriseSoftware.de

SearchDataCenter.de

Close