Wie Big Data Archiv-Strategien verändert

Analyst Jon Toigo erklärt, warum Big-Data-Analysen die Bedeutung von Archiven ändert.

Wenn wir an Archivierungsstrategien denken, reden wir oft über die Vergangenheit und darüber, was wir über unsere Daten wissen. Denken wir aber an die Zukunft, so können wir unmöglich vorhersehen, welche Ereignisse, Trends und Veränderungen Einfluss auf unsere Archivierungsanforderungen haben werden. 

Das betrifft die Daten, die wir vorhalten müssen, die Plattform, auf der wir die Informationen ablegen und die Tools, die brauchen, um die Daten auch künftig für Anwender und Systeme zugänglich zu machen. Diese Welt des „unbekannten Unwissens“ lässt Archivierungsstrategien leider oftmals wie Gedankenexperimente erscheinen und nicht wie einen Teil einer realen Strategie, die hilft, Kosten und Risiken zu minimieren sowie Produktivität zu verbessern.

Wenn Archivierungsprogramme bewilligt und finanziert sind, werden sie oft als alleinstehendes Projekt wahrgenommen. In vielen Fällen gibt es für Archivierungsprojekte eigens dedizierte Mitarbeiter, Prozessoren, Netzwerk und Storage-Infrastrukturen, die vom produktiven Rechenzentrum losgelöst sind. Selbst Cloud-Service-Provider wie Amazon Web Services oder Google offerieren Archiv-Speicher-Dienste, die von anderen Managed-Hosting- und Storage-Services separiert sind.

Wir müssen aufhören, Archive als getrennte Ansammlung von Operationen und Infrastruktur zu sehen, die nichts mit den produktiven Prozessen und Infrastrukturen zu tun hat.

Mit dem wachsenden Interesse an Big-Data-Analytics und dem Aufkommen von Server-basierten und Software-defined Storage-Infrastrukturen, muss man diese alleinstehenden Archivierungsstrategien in Frage stellen. Bei Big-Data-Analytics werden Daten nicht als Archivdaten angesehen. 

Hierbei werden verschiedene Technologien eingesetzt, um sich entwickelnde Trends und voneinander unabhängig scheinende Daten zu analysieren. Für Big-Data-Analytics sind vielmehr alle Informationen „aktiv“. Alle Daten besitzen einen Wert für alltägliche Geschäftsentscheidungen oder Problembehebungen. In diesem Framework haben Archive keine wirkliche Bedeutung.

Zudem geht der Trend bei Storage-Architekturen weg vom zentralisierten Pool oder Repository hin zu getrennten, Server-seitigen DAS-Konfigurationen, die an individuelle Server-Nodes in einem Cluster angeschlossen sind. Dabei ist es unerheblich, ob damit globale Verarbeitungsstrategien, wie Hadoop oder MapReduce, oder aber Workloads von Virtualisierungsstrategien unterstützt werden, wie zum Beispiel VMware Virtual SAN oder Microsoft Cluster Storage Spaces. Auf jeden Fall wird der Begriff des traditionellen Storage-Tierings, bei dem der tertiäre Speicher eben das Archiv ist, in Frage gestellt.

Firmen, die diese so genannte agile Philosophie des Infrastruktur-Designs umsetzen, können keine separierten Archivierungspraktiken konzipieren. Unsere Vorstellung von Archiven muss sich ändern. Wir müssen aufhören, Archive als getrennte Ansammlung von Operationen und Infrastruktur zu sehen, die nichts mit den produktiven Prozessen und Infrastrukturen zu tun hat. 

Stattdessen müssen wir uns nach einem Archivierung-vor-Ort-Konzept (archive-at-place) umsehen. Archivieren vor Ort bedeutet generell, dass die Daten an ihrem physischen Standort verbleiben und dort archiviert werden. Zusätzlich dazu erhalten sie eine Markierung beziehungsweise werden ihnen bestimmte Services zugewiesen, die einer Archiv-Klassifizierung entsprechen.

Folgen Sie SearchStorage.de auch auf Facebook, Twitter und Google+!

Artikel wurde zuletzt im Dezember 2014 aktualisiert

Pro+

Premium-Inhalte

Weitere Pro+ Premium-Inhalte und andere Mitglieder-Angebote, finden Sie hier.

Diskussion starten

Schicken Sie mir eine Nachricht bei Kommentaren anderer Mitglieder.

Mit dem Absenden dieser Daten erklären Sie sich bereit, E-Mails von TechTarget und seinen Partnern zu erhalten. Wenn Ihr Wohnsitz außerhalb der Vereinigten Staaten ist, geben Sie uns hiermit Ihre Erlaubnis, Ihre persönlichen Daten zu übertragen und in den Vereinigten Staaten zu verarbeiten. Datenschutz

Bitte erstellen Sie einen Usernamen, um einen Kommentar abzugeben.

- GOOGLE-ANZEIGEN

SearchSecurity.de

SearchNetworking.de

SearchEnterpriseSoftware.de

SearchDataCenter.de

Close