Amazon und Google umkämpfen den Archivierungsmarkt

Mit hohen Geschwindigkeiten und guten Preisen mausert sich Google Nearline zum ernstzunehmenden Wettbewerb für Amazon Glacier.

Amazon Glacier war lange Zeit der Platzhirsch unter den Cloud-Archivierungsdiensten und bekommt mit Google Nearline nun Konkurrenz und der Anwender eine Cloud-Archiv-Alternative. Denn Google lässt sich mit hohen Übertragungsgeschwindigkeiten und guten Preisen auf einen Kampf um das Marktsegment ein.

Cloud-Archive und Cloud-Backups spielen eine große Rolle bei den Cloud-Dienstleistungen, reduzieren sie doch Recovery-Zeiten wenn eine Störung oder gar Ausfallzeiten drohen. Bislang entschieden sich die meisten Anwender für Glacier von Amazon Web Services, aber nun wird der Cloud-Storage Nearline von Google immer mehr zur ernstzunehmenden Alternative.

Gerade bei den Geschwindigkeiten scheint Glacier dem Nearline-Service hinterherzuhinken. Mit Glacier kann es schon mal drei bis fünf Stunden dauern, bis der Recovery-Prozess angestoßen wird. Zudem muss der Anwender eine Anfrage an AWS senden. Die Geschwindigkeit des Services basiert auf Bandtechnologie.

Nearline verwendet ein Standard-Storage-Interface und startet den Datentransfer in nur drei Sekunden. Das macht natürlich einen gewaltigen Unterschied bei der Frage, wie schnell die Daten wieder online sein können. Das macht die Wiederherstellungen individueller Files oder Directorys attraktiver und interaktiver. Darüber hinaus gewährleistet Neraline mit mehreren Standorten Storage-Redundanzen und somit Datenintegrität und Disaster-Recovery-Funktionalität. Nearline nutzt die gleiche Schnittstelle wie andere Storage-Dienste von Google.

Google basiert seine Wiederherstellungsbandbreite (retrieval) auf der archivierten Kapazität. So offeriert der Dienst derzeit Bandbreitengeschwindigkeiten von 4 Mbyte/s für jedes gespeicherte TByte. Die Geschwindigkeit wächst mit wachsender Speicherkapazität.

Amazon hat für kleinere Archive einen Übertragungsvorteil. Das mag für kleinere Firmen ein Argument sein, die Nearline in Betracht ziehen. Mittelständische und größere Unternehmen haben meist größere Archive und sind deswegen nicht so besorgt ob der Bandbreite.

Amazon Glacier ist ein solider Service und in punkto Datenintegrität sehr sicher. Die Preisgestaltung ist bei beiden Services ähnlich: ein Cent pro GByte, aber das Kleingedruckte macht Amazon etwas teurer wenn es um das frühe Löschen auf Glacier geht. Allerdings nivellieren die etwas höheren Datentransferkosten von Google das Preisverhältnis wieder.

Wie günstige Cloud-Archive Unternehmen beeinflussen

Wie wirken sich nun günstige Cloud-Archivierungssysteme wie Nearline und Glacier auf Unternehmensprozesse aus? Hier gibt  Facebook mit seinem neuen Disk-basierten Archivsystem ein gutes Beispiel ab. Facebook hat zwei Rechenzentren errichtet – es werden wohl nicht die letzten sein – und jedes davon verfügt über mehr als ein Exabyte an Speicherkapazität. Dabei plant der Social-Media-Riese nicht, auch nur eines der täglich hinzukommenden zwei Millionen Images zu löschen.

Da Facebook für das Speichern dieser Images aber bezahlen muss, ist es wichtig, ein günstiges System zu haben. Das Unternehmen konzipierte eine Schema mit hoher Speicherdichte, indem es zwei Petabyte in ein Rack packt, wobei zwei Server 480 Drives bedienen. Dabei benutzt Facebook ein interessantes Strom-Management, bei dem jeweils nur eines von den 25 Storage-Einheiten im Rack mit Strom versorgt wird. Dadurch benötigt das Rack weniger als zwei Kilowatt und die Drive-Abnutzung ist entsprechend niedrig.

Mittels Erasure Coding und einer geografischen Verteilung der Datenblöcke spart man hier Kapazitäten. Facebook hat sich ein hoch-integres System aufgebaut, dass ein gesamtes Rechenzentrum verlieren – ausfallen lassen – kann, ohne dabei Datenverfügbarkeit zu verlieren. Ebenso interessant ist es, wie Facebook mit seinem primären, „hot“ Storage umgeht. Anstatt drei Replikas im hot Storage vorzuhalten, bleibt nur eine „heiße“ Replik dort und eine weitere Kopie kommt in „cold“ Storage – mit Erasure Coding. Das spart Platz und Strom und reduiziert die Hardware-Kosten.

Wird nun ein Recovery benötigt, so stellt sich Facebook darauf ein, große Datenbestände statt individueller Dateien wiederherzustellen. Das Disk-basierte kalte Storage erlaubt ein selektives Recovery und schnelle Response-Zeiten bedeuten, dass das Recovery interaktiv sein kann. Ein Nachteil dieses Ansatzes ist die enorm steigende Stromabnahme, die mit dem Starten der Drives einhergeht, ebenso die extra Abnutzung wenn die Platten bei diesem Prozess hochgefahren und genutzt werden.

Um die Betriebskosten zu senken, ist es denkbar, dass Google einen ähnlichen Ansatz wie Facebook nutzt. Aufgrund der Speicherdichte heutiger Bandmedien, liegen die Preise von Festplatten und Bändern in etwa auf dem gleichen Niveau. Allerdings ist die Infrastruktur für HDDs weitaus günstiger als eine Tape-Library mit Robotik. Da die Speicherkapazitäten bei Festplatten auch immer weiter steigen, wird dieser Vorteil bestehen bleiben.

Zwar haben Tapes einen Stromvorteil, aber das MAID-Konzept von Facebook lässt das Pendel zugunsten der Disk-Technologie ausschlagen. Es scheint, als ob Nearline den Druck auf andere Cloud-Provider erhöhen wird, einen vergleichbaren Service anzubieten. Andere Provider werden innerhalb des nächsten Jahres aufholen und es mag sogar sein, dass einer davon Google überholt und SSDs einsetzen wird, da auch hier die Preise weiter fallen.

Über den Autor:

Jim O'Reilly war Vice President of Engineering at Germane Systems, wo er ruggedized Server und Storage-Systeme für die US-amerikanische U-Boot-Flotte konzipierte. Ebenso war er im Senior Management bei SGI/Rackable und Verari und arbeitete als CEO bei Startups Scalant und CDS. O’Reilly übernahm leitende Funktionen bei PC Brand und Metakithic sowie Memorex-Telex und NCR. Bei NCR entwickelte sein Team das erste SCSI ASIC, das heute im Smithsonian ist. Jim ist derzeit als Consultant tätig und fokussiert auf Storage und Cloud-Computing.

 

Folgen Sie SearchStorage.de auch auf Twitter, Google+ und Facebook!

Artikel wurde zuletzt im Juni 2015 aktualisiert

Pro+

Premium-Inhalte

Weitere Pro+ Premium-Inhalte und andere Mitglieder-Angebote, finden Sie hier.

Erfahren Sie mehr über Data-Center-Storage

Diskussion starten

Schicken Sie mir eine Nachricht bei Kommentaren anderer Mitglieder.

Mit dem Absenden dieser Daten erklären Sie sich bereit, E-Mails von TechTarget und seinen Partnern zu erhalten. Wenn Ihr Wohnsitz außerhalb der Vereinigten Staaten ist, geben Sie uns hiermit Ihre Erlaubnis, Ihre persönlichen Daten zu übertragen und in den Vereinigten Staaten zu verarbeiten. Datenschutz

Bitte erstellen Sie einen Usernamen, um einen Kommentar abzugeben.

- GOOGLE-ANZEIGEN

SearchSecurity.de

SearchNetworking.de

SearchEnterpriseSoftware.de

SearchDataCenter.de

Close