Physische Datenredundanz

RAID-Technik kurz erklärt

17.10.2006 | Autor / Redakteur: Stephen J. Bigelow / Rainer Graefen

Festplatten ermöglichen eine schnelle und kostengünstige Datenspeicherung. Aber wie jedes elektromechanische Gerät können sie versagen – und in solchen Fällen gehen wertvolle Daten oft unwiederbringlich verloren. IT-Abteilungen haben deshalb ständig ein Auge darauf, solchen Verlusten vorzubeugen. Dazu nutzen sie i.d.R. ein Redundant Array of Independent Disks. Diese kurz RAID genannte Festplattengruppe wird von einem speziellen Controller gesteuert. In handelsüblichen Standard-Servern sind dazu meist drei bis acht Laufwerke pro Gruppe zusammengeschaltet. Speziell für Speicherzwecke genutzte Arrays wie EMCs Clariion enthalten leicht mehrere hundert davon. Je nachdem wie die Gruppe konfiguriert ist, lassen sich unterschiedliche Formen redundanter Datenhaltung herstellen. Man spricht hier von RAID-Leveln.

Der Einsatz eines RAID bietet allgemein gesprochen drei Vorteile:

• Im einfachsten Fall lässt sich die Speicherkapazität mehrerer Festplatten in einem größeren logischen Laufwerk (Volume) bündeln. Aus zwei 100-GB-Disks wird so eine 200 GB große „virtuelle Festplatte“. Damit ist jedoch noch keine Redundanz gegeben, d.h. es existiert keine Datenkopie, auf die der Anwender im Fehlerfall zurückgreifen kann.

• Redundanz wird hergestellt, indem man den Inhalt einer Festplatte unverzüglich auf eine andere kopiert. Versagt das erste Laufwerk, tritt einfach das zweite an dessen Stelle. Leider halbiert dieses auch Mirroring genannte Verfahren die zur Verfügung stehende Speicherkapazität, von den zwei 100-GB-Festplatten aus unserem Beispiel kann also immer nur eine produktiv genutzt werden.

• Schließlich lässt sich durch RAID die Performance steigern. Dazu dient eine als Striping bekannte Methode, welche die Inhalte einer Datei über mehrere Festplatten hinweg verteilt. Auf diese Weise kann ein Laufwerk Dateien in den Cache einlesen, während ein anderes weitere Daten aus dem Cache an die Festplatten-Schnittstelle weitergibt. Das erhöht den effektiven Datendurchsatz. Im Alttagsbetrieb werden meist mehrere dieser Verfahren verknüpft.

RAID-Level und -Kombinationen

Die Wahl des richtigen Levels entscheidet über Kosten, Sicherheit und Performance

Im Lauf der vergangenen 20 Jahre haben sich verschiedene Definitionen herausgebildet, die jeweils schematisch beschreiben, welchen Nutzen die jeweils eingesetzte Technik bietet. Jedem dieser RAID-Level ist dabei eine Nummer zugeordnet:

? RAID-0: Der Fileserver nutzt Striping zur Performance-Steigerung, legt aber keine Kopien an. Das ist zwar performant, aber nicht redundant. Bei nur einem Festplattenversagen gehen alle Daten verloren.

? RAID-1: Bei diesem Verfahren wird der Inhalt einer Festplatte gespiegelt. Das halbiert die Netto-Speicherkapazität, und die Leistungssteigerung fällt nur gering aus.

?

? RAID-5: Dieses auch als „Block-Striping mit verteilter Parity“ bekannte Verfahren errechnet aus den gespeicherten Daten eine Prüfsumme und verteilt diese häufig als Parity-Daten bezeichnete Information über alle Platten im Array. Beim Ausfall einer Festplatte sind immer noch alle Daten verfügbar. Durch das Striping steigt zwar die Lesegeschwindigkeit, die Schreibgeschwindigkeit ist dagegen reduziert, da bei jedem Zugriff die Parity-Daten zu berechnen sind.

?

? RAID-6: Dieser Level funktioniert ähnlich wie RAID-5, mit dem Unterschied, dass die Paritätsdaten (Prüfsumme) nun in doppelter Form vorliegen und auf die eingebundenen Festplatten verteilt werden. Auf diese Weise lässt sich sogar der Ausfall von zwei Laufwerken verkraften. Die davon betroffenen Daten werden nach dem Austausch der Platten rekonstruiert.

Daneben existieren Zwischenstufen wie RAID-2, Raid-3 und RAID-4 für spezielle Einsatzzwecke, doch haben sich die vier oben genannten Verfahren auf breiter Front durchgesetzt. Darüber hinaus ist es möglich, verschiedene RAID-Level miteinander zu kombinieren, wobei das Resultat eine zweistellige Kennziffer erhält: RAID 10 nutzt also Disk Mirroring (RAID-1) und Striping (RAID-0) und wird daher auch oft „RAID 1+0 respektive RAID-10“ genannt; RAID-50 kombiniert RAID-5 und RAID-0 usw.

Laufwerke und Controller

Zur Steuerung eines RAID dient üblicherweise ein dedizierter Controller. Er nimmt dem Hauptprozessor einen Großteil der Ein-/Ausgabeoperationen ab und passt gewöhnlich in einen normalen Erweiterungskarten-Slot im Server (PCI, PCI-X, PCI Express). RAID-Controller verfügen häufig über eigenen RAM-Speicher vorhanden, um Laufwerksinhalte zwischenzuspeichern und eine eigene Stromversorgung (Batterie), die vor Datenverlusten bei Festplattenausfällen schützt. In der Regel bringen sie weitere Software- und Hardware-Features mit, die die Datensicherheit weiter erhöhen. Beispiele dafür sind RAID-Level-Migration, Skalierung logischer Laufwerke, Snapshots und auch Ersatz-Laufwerke (Hot spare), die, wie der Name sagt, im laufenden Betrieb ein defektes Laufwerk ersetzen können.

RAID funktioniert praktisch mit allen bekannten Festplatten-Schnittstellen. Anfangs wurden meist in den Servern fast ausschließlich die robustere SCSI-Laufwerkstechnik zu RAID-Gruppen zusammengefügt. Neuere RAID-Controller unterstützen heute auch serielle Bustechnologien wie SATA/150, SATA/300 und SAS. Das hat den Vorteil, dass die Übertragungswege (Kabel) länger sein dürfen, die Festplatten also in einem separaten Array außerhalb des Servers untergebracht sein können. Manche RAID-Controller unterstützen an ihren Ports entweder nur SATA oder nur SAS. Zwar hat der gewählte Festplattentyp generell keinen Einfluss auf die Funktionsfähigkeit eines RAID, es ist jedoch darauf zu achten, dass die Schnittstelle zum gewählten Controller passt und ein vernünftiges Kosten-Nutzen-Verhältnis erhalten bleibt.

Kommentar zu diesem Artikel abgeben

Schreiben Sie uns hier Ihre Meinung ...
(nicht registrierter User)



Spamschutz 

Bitte geben Sie das Resultat dieser Rechenaufgabe (Addition) ein:
Kommentar abschicken

Dieser Beitrag ist urheberrechtlich geschützt. Sie wollen ihn für Ihre Zwecke verwenden? Infos finden Sie unter www.mycontentfactory.de (ID: 2000345)