Essential Guide

Big Data: Anwendung, Datenschutz und Technologie

Eine umfassende Auswahl von Artikeln, Videos und mehr, die von unseren Redakteuren gewählt wurden.

Big Data und das Internet der Dinge verändern Storage-Anforderungen und -Analyse

Die Datenflut des Internets der Dinge schafft neue Möglichkeiten und Notwendigkeiten der Storage-Analyse. Nötig ist ein proaktiver Blick.

Sie können keine Geschichten mehr über Big Data hören? Das ist schlecht, denn diese werden zumindest in absehbarer Zukunft nicht verschwinden. Das gilt vor allen Dingen in Bezug auf Anbieter, die auf eine Erhöhung Ihrer Capex-Ausgaben hoffen. Es gibt aber auch gute Neuigkeiten über die zu erwartende Daten-Explosion zu erzählen und es lohnt sich, die Augen offen zu halten, wie sich dadurch signifikante Änderungen für die derzeitigen  Storage-Angebote ergeben. Einige mag die momentane Situation an die Zeitlupe eines entgleisenden Zugs erinnern, für andere wiederum ist es eine fantastische Welle, auf der man mitreiten kann. Wie auch immer man die Situation bewertet: Für den Großteil des wachsenden Datenvolumens wird das so genannte Internet der Dinge (Internet of Things, IoT)verantwortlich sein.

Im Endeffekt ist mit dem Begriff Internet der Dinge gemeint, dass man mehr und mehr Endgeräten intelligente Sensoren verpasst. Wir interagieren tagtäglich mit diesen Geräten und so wird aus fast allem, was wir berühren, eine Daten-Quelle. Das beste Beispiel in diesem Zusammenhang ist wahrscheinlich Ihr Smartphone. Es kann den Standort, die Blickrichtung, Nutzungsdauer, Bewegung und auch soziale Muster und Verhalten speichern. Haben Sie eine Bastler-Mentalität, können Sie ein günstiges Raspberry Pi kaufen und damit fast jedes Objekt im Haus vernetzen. Die Möglichkeiten sind grenzenlos. Ob das nun eine selbst gebaute Überwachungsanlage ist, das Steuern elektrischer Geräte oder auch das Monitoring der Raumtemperatur. Sie können aufzeichnen, wie aktiv Ihr Goldfisch ist oder zählen lassen, wie oft jemand vor dem Abendessen die Kühlschranktür geöffnet hat.

Neben Sicherheitsrisiken und der Frage nach der Verantwortlichkeit besteht die wesentliche Herausforderung auf der technischen Ebene darin, dass diese komplett vernetzte Welt mit einer unglaublichen Rate immer neue Daten erzeugt. Das gilt auch dann, wenn viele, oder vielleicht sogar alle, dieser Daten komplett uninteressant oder wertlos sind. In unseren eigenen vier Wänden können wir das wahrscheinlich noch verhindern, aber ins Data Center ist das Internet der Dinge schon längst eingezogen. Die meisten aktiven IT-Komponenten enthalten bereits Funktionen zur Instrumentierung und zum Sammeln von Log-Dateien. Die restliche Ausrüstung wird nach und nach mit Sensoren ausgestattet werden. Haben wir erst einmal IT-Komponenten mit diesen Möglichkeiten im Einsatz, wird mit hoher Wahrscheinlichkeit irgendwer diese Daten auch für den Fall der Fälle behalten und eventuell analysieren wollen.

Zur potenziellen Daten-Überlastung trägt das Grundprinzip von Big Data bei: Je mehr Daten-Historie verfügbar, desto besser. Möglicherweise wissen wir heutzutage noch gar nicht, welche Fragen wir an die gespeicherten Daten in der Zukunft richten wollen. Somit ist es am besten, dass wir so viele zusammenhängende Daten wie möglich aufbewahren. In diesem Fall sind wir auch später flexibel genug, sämtliche neu auftauchenden Fragen beantworten zu können. Als Bonus erhalten wir im Laufe der Zeit Einblicke auf immer größer werdende Datensätze.

Fehlende Standards behindern einheitliches Log-Management des Internets der Dinge

Die gute Nachricht lautet, dass wir innerhalb unserer IT bereits über genügend Lösungen verfügen, um die Datenflut des Internets der Dinge zu bändigen: Tools wie zum Beispiel Splunk und VMware vCenter Log Insight eignen sich hervorragend, um Logs und Ereignis-Daten zu aggregieren und diese dann zu analysieren. Splunk hat sich sogar über die IT hinaus bewährt. Wir sprechen hier von Business-übergreifenden Datenquellen, wenn Logs von Web-Anwendern ins Spiel kommen. Möglicherweise interessiert sich die Marketing-Abteilung beispielsweise für das Verhalten der Anwender auf dem Web-Server.

Allerdings ist noch nicht ganz klar, wie IT-Abteilungen die Flut an ungleichen Daten von verschiedenen Sensoren, Log-Dateien und Mess-Geräten unter einen Hut bringen können. Diese werden schließlich von Geräten verschiedener Anbieter auch auf heterogene Weise geliefert. Bisher gibt es noch keine nennenswerten Industrie-Standards und es darf auch bezweifelt werden, ob es irgendwann überhaupt welche geben wird. In der Vergangenheit ist man nicht nur einmal daran gescheitert, Standards für das Monitoring zu erschaffen, die übergreifend konsistent sind. Das gilt sogar für so einfache Metriken wie die CPU-Auslastung. An dieser Stelle ist tiefgreifendes Fachwissen von den Herstellern notwendig, um die Daten von den entsprechenden Geräten richtig interpretieren zu können.

Storage-Anbieter mit „Call Home“-Angeboten bieten Remote-Analyse

Wie sieht es aber nun bei den Storage-Anbietern aus? Die fortschrittlicheren bieten eine so genannte Call-Home-Unterstützung an, bei der die von Ihnen lokal produzierten Daten-Ströme im Storage analysiert werden. In der Industrie werden Daten des Internets der Dinge meistens direkt über drahtlose Internetverbindungen gesammelt, bei Storage-Arrays allerdings wählt man oft den Weg über automatisierte, periodisch stattfindende Uploads der Log-, Status-, Konfigurations- und Nutzungs-Daten. Teilt man diese Daten miteinander, dann können sowohl Storage-Anbieter als auch Kunden gleichermaßen von diesen Daten profitieren.

Diese „Call Home“-Daten zur Remote-Analyse können Storage-Anbieter auf zweifache Weise verwenden. Zum einen liefert sie damit wesentlich effizientere oder sogar proaktive Unterstützung. Immerhin kann der Hersteller direkt sehen, was auf der Storage-Plattform passiert. Weiterhin hat er Einblicke, welche Funktionen in Betrieb und welche Komponenten installiert und konfiguriert sind. Zudem kann der Anbieter die Situation des Kunden auch mit der Installation anderer Kunden vergleichen, die eine ähnliche Implementierung haben. In vielen Call-Home-Szenarien hat der Kunde auch die Möglichkeit, die eigenen, vom Anbieter verarbeiteten und analysierten Daten zu begutachten und entsprechend von diesem Wissen profitieren.

Natürlich hat auch der Storage-Anbieter viele Vorteile von dieser Herangehensweise. Das Produkt-Management kann Funktionen besser priorisieren, der Support ist direkt über häufig auftretende Fehler im Bilde, die Account-Teams können sicherstellen, dass die Kunden das Optimum aus ihren Anschaffung heraus holen und das Marketing ist in der Lage, gezieltere Werbe-Aktionen durchzuführen. Natürlich sind auch die Verkäufer involviert, die just anrufen, wenn die Lizenz ausgereizt ist. Es gibt aber auch Vorteile, die nicht direkt mit dem Kunden zusammenhängen. Zum Beispiel könnte ein Storage-Anbieter damit überwachen, wie sich OEM-Komponenten wie zum Beispiel Flash-Speicher oder Festplatten schlagen. Das könnte zum Beispiel beim Aushandeln neuer Liefer-Verträge dienlich sein.

Die meisten Storage-Anbieter haben über ein tiefgehendes Call-Home-Programm nachgedacht. Viele davon stellten allerdings fest, dass der Aufbau einer Plattform zum Sammeln der entsprechenden Big-Data-Daten des Internets der Dinge an sich keine Kern-Kompetenz ist. An dieser Stelle empfehlen wir eine Call-Home-Provider-Lösung wie beispielsweise Glassbeam. Zu den Kunden von Glassbeam gehören einige namhafte Storage-Anbieter und auch Hersteller von industriellen und medizinischen Internet-der-Dinge-Geräten. Damit können Sie eine umfangreiche Call-Home-Lösung binnen Wochen statt Monaten oder gar Jahren implementieren.

Datenflut und Sammelwut: Big Brother muss nicht immer negativ sein

Sollten sich Storage-Kunde an 1984 und Big Brother erinnert fühlen oder lieber den Service in den Vordergrund rücken, wenn Ihre Arrays von außerhalb überwacht werden und zurück zum Storage-Anbietern telefonieren? Natürlich könnten die so gesammelten Daten ja auch für die Konkurrenz interessant sein, weil sie Informationen über die von Ihnen eingesetzte IT-Architektur enthalten. Es handelt sich dabei allerdings nicht um Business-Daten und so dürften Sie wohl kein Problem damit haben, entsprechende Daten zu versenden und dafür einen verbesserten Support zu erhalten.

Wir als Taneja Group raten Storage-Kunden jedenfalls, sich explizit nach Anbietern umzusehen, die ihre Storage-Lösungen intelligent instrumentalisiert haben. Damit bieten sie proaktive Call-Home-Unterstützung und Sie als Kunde erhalten ganzheitliche Einblicke hinsichtlich der eigenen Infrastruktur. Wir sind der Meinung, dass Sie die Storage-Anbieter als vertrauenswürdige Berater sehen sollten. Wenn Sie Ihren Anbietern nicht vertrauen können, sollten Sie sich allerdings vielleicht nach einer Alternative umsehen.

Über den Autor:

Mike Matchett ist leitender Analyst und Consultant bei der Taneja Group.

Folgen Sie SearchStorage.de auch auf Facebook, Twitter und Google+!

Artikel wurde zuletzt im Juni 2014 aktualisiert

Pro+

Premium-Inhalte

Weitere Pro+ Premium-Inhalte und andere Mitglieder-Angebote, finden Sie hier.

Diskussion starten

Schicken Sie mir eine Nachricht bei Kommentaren anderer Mitglieder.

Mit dem Absenden dieser Daten erklären Sie sich bereit, E-Mails von TechTarget und seinen Partnern zu erhalten. Wenn Ihr Wohnsitz außerhalb der Vereinigten Staaten ist, geben Sie uns hiermit Ihre Erlaubnis, Ihre persönlichen Daten zu übertragen und in den Vereinigten Staaten zu verarbeiten. Datenschutz

Bitte erstellen Sie einen Usernamen, um einen Kommentar abzugeben.

- GOOGLE-ANZEIGEN

SearchSecurity.de

SearchNetworking.de

SearchEnterpriseSoftware.de

SearchDataCenter.de

Close