Wie Objekt-Storage mit dem quelloffenen OpenStack „Swift“ funktioniert

Eine hohe Skalierbarkeit lässt sich im Cloud-Storage-Bereich mit OpenStack Object Storage erreichen, wie ein e-Commerce-Spezialist eindrucksvoll zeigt.

Der lateinamerikanische e-Commerce-Spezialist MercadoLibre geht mit seinem Einsatz der Cloud-Technologieplattform OpenStack ungewohnte Wege. Das Unternehmen hat seine Umgebung für Daten-Storage grundlegend überarbeitet. Ihren Kern bildet jetzt ein Objekt-Store für Petabytes an Daten.

OpenStack Object Storage, auch bekannt unter dem Code-Namen „Swift“, nutzt Cluster von Standard-Servern, um langfristig zumeist statische Daten wie Dokumente und Fotos zu speichern. Das System verwendet einen Hash-Algorithmus, um jedem auf einem Daten-Knoten oder Server gespeicherten Objekt oder einer Datei einen eindeutigen Identifier zu geben. Durch das Hinzufügen weiterer Knoten/Server lässt sich das System horizontal skalieren.

Die Metadaten für alle Objekte befinden sich auf allen Servern im Cluster, wobei OpenStack-Software für die Replikation sorgt. Anfragen nach Dateien und Objekten gehen an Proxy-Server von Swift (OpenStack Object Storage), wo sie übersetzt, anhand von Metadaten und Hash-Wert lokalisiert und dann abgerufen werden.

Administratoren weisen einen oder mehrere Server einer Zone zu, wobei in jeder Zone eine Kopie jedes Objekts vorliegt. Um eine optimale Balance zwischen Kosten und Schutz vor Daten-Verlusten zu gewährleisten, sind mindestens drei Zonen erforderlich, sagt Beth Cohen, leitende Cloud-Architektin bei Cloud Technology Partners (cloudTP) aus Boston. CloudTP unterstützt Kunden bei der Implementierung von Rackspace Cloud: Private Edition von Rackspace Hosting Inc., das auf OpenStack basiert.

Für mehr Performance und schnellere Zugriffe empfiehlt Cohen allerdings mindestens fünf Zonen, denn wenn bei drei Zonen eine ausfällt, wechselt das System in einen schreibgeschützten Modus. Eine Gruppe von Zonen bildet einen Ring, und jeder dieser Ringe hat dieselbe Datenbank mit MD5-Hashes. Damit wird jedes Objekt in einem Ring wie eine Gruppe behandelt, erklärt Cohen.

MercadoLibre hat vier Zonen eingerichtet und speichert drei Kopien von jedem Objekt. Dies stellt sicher, dass sich in jedem der beiden Rechenzentren des Unternehmens jeweils mindestens eine Kopie befindet. Die Rechenzentren von MercadoLibre befinden sich zwecks verringerter Latenz im US-Bundesstaat Virginia. Denn die meisten seiner Nutzer-Anfragen laufen über Internet-Provider in den USA, wie Alejandro Comisario erklärt, ein Cloud-Techniker bei MercadoLibre.

„Man braucht keine teure Hardware. Jeder Daten-Knoten kann seine eigene billige Festplatte haben“, sagt Comisario. MercadoLibre habe 24 Server von Hewlett-Packard gekauft, von denen jeder mit drei 2-Terabyte-Platten ausgestattet ist.

Artikel wurde zuletzt im Mai 2012 aktualisiert

Pro+

Premium-Inhalte

Weitere Pro+ Premium-Inhalte und andere Mitglieder-Angebote, finden Sie hier.

Erfahren Sie mehr über Remote- und Offsite-Datenspeicher

Diskussion starten

Schicken Sie mir eine Nachricht bei Kommentaren anderer Mitglieder.

Mit dem Absenden dieser Daten erklären Sie sich bereit, E-Mails von TechTarget und seinen Partnern zu erhalten. Wenn Ihr Wohnsitz außerhalb der Vereinigten Staaten ist, geben Sie uns hiermit Ihre Erlaubnis, Ihre persönlichen Daten zu übertragen und in den Vereinigten Staaten zu verarbeiten. Datenschutz

Bitte erstellen Sie einen Usernamen, um einen Kommentar abzugeben.

- GOOGLE-ANZEIGEN

SearchSecurity.de

SearchNetworking.de

SearchEnterpriseSoftware.de

SearchDataCenter.de

Close