TDWI-Umfrage zeigt Trends bei Big-Data-Analytik

Steigende Datenmengen und Big Data erfordern von den IT-Verantwortlichen neue Strategien, um die Datenmengen überhaupt in den Griff zu bekommen.

Die jüngste Rezession hat zunehmendes Interesse daran ausgelöst, aus „Big Data“ möglichst viel herauszuholen – vor allem bei Unternehmen, die mit neuen Formen der Kunden-Abwanderung zu tun haben oder sich mit genauerer Risiko-Einschätzung und Betrugsaufdeckung beschäftigen. Dazu suchen immer mehr Organisationen neue Werkzeuge und Plattformen für Big-Data-Analytik, und die Anbieter reagieren darauf. Dies geht aus einer Umfrage des Data Warehousing Institute (TDWI) hervor.

„In den vergangenen drei Jahren hat es einen echten Wachstumssprung gegeben“, sagt Philip Russom, Research-Leiter für Daten-Management bei TDWI, und erinnert daran, dass Big Data am Anfang ein reines Storage-Thema war. Erst nachdem CPU- und Storage-Technologien billiger wurden, bemerkten manche Unternehmen, dass sich mit Big Data auch Analytik betreiben lässt. Russom definiert dies als die Verarbeitung großer Datenbestände mit einer Mischung aus fortschrittlichen Analytik-Werkzeugen wie prädiktiven Analysen, Data-Mining, Statistik, künstlicher Intelligenz und Verarbeitung natürlicher Sprache.

TDWI ist nicht die einzige Marktforschungsfirma, der die Auswirkungen von Big Data auf die Branche aufgefallen sind. In diesem Sommer hatte das Thema, zusammen mit extremer Informationsverarbeitung und -management, auch seinen ersten Auftritt im Hype Cycle neuer Technologien von Gartner. Der Zyklus gibt wieder, wie neu aufkommende Technologien die Phasen vom Hype zu schneller Verbreitung durchlaufen. Big Data wird hier auf der anfänglichen ansteigenden Kurve verortet, auf dem Weg zum „Gipfel der überzogenen Erwartungen“, hat also noch einen langen Weg vor sich.

Was ist „Big Data“?

„Big Data“ ist ein allgemeiner Ausdruck für die großen Mengen an Daten, die heutzutage innerhalb von Unternehmen, im Internet und durch mobile Geräte generiert werden – und deren Verarbeitung in typischen relationalen Datenbanken zu viel Zeit und Geld kosten würde. Dabei bezeichnet Big Data zwar keine bestimmte Menge, doch sind damit zumeist Datenbestände in Größenordnungen von Petabytes oder sogar Exabytes gemeint. Manche Experten verweisen zudem darauf, dass Big Data zusätzlich von der schnellen Geschwindigkeit des Datenflusses in Unternehmen hinein und von einer großen Vielfalt an Datenarten geprägt ist.

Insgesamt liefern die Ergebnisse der TDWI-Umfrage eine Momentaufnahme von Big-Data-Analytik. Sie zeigt, dass nicht einmal über den Begriff echte Einigkeit unter den 325 teilnehmenden IT-Profis, Geschäftsnutzern und Berater aus kleinen, mittelgroßen und großen Organisationen besteht. So sprachen nur 18 Prozent der Befragten selbst von „Big-Data-Analytik“, doch 34 Prozent gaben an, in ihren Organisationen würden große Datenbestände mit einer Sammlung moderner Analytik-Werkzeuge ausgewertet.

Eine Mehrheit der Teilnehmer zeigte Interesse daran, Big-Data-Analytik für Kundenbeziehungen einzusetzen – von der Identifizierung neuer Chancen bei Verkauf und Marketing bis zu mehr Verständnis für das Kundenverhalten. 45 Prozent der Befragten hoffen zudem darauf, dass das Eintauchen in große Datenbestände zu besseren geschäftlichen Erkenntnissen führt.

Überraschungen in der Umfrage

Wie sich zeigte, haben etwa 75 Prozent der Unternehmen fortschrittliche Analytik im Einsatz; 40 Prozent gaben allerdings an, diese noch nicht für die Arbeit mit Big Data zu nutzen. Und auch ein paar Überraschungen hält die Umfrage bereit.

So schaffte es fortschrittliche Daten-Visualisierung an die Spitze der heißesten Zukunftstechnologien. Mit derartigen Werkzeugen können Nutzer raffinierte Grafiken, Karten und Schaubilder auf der Grundlage einer großen Zahl von Datenpunkten erstellen. Dabei können Informationen in mehreren Schichten angezeigt werden und auch flüchtigere Daten wie Beziehungen berücksichtigt werden. „Ich hätte hier viel mehr Nerd-Sachen erwartet“, sagt Russom dazu, „fortschrittliche Daten-Visualisierung ist nicht unbedingt ein Analytik-Werkzeug, und für Big Data wird sie auch nicht gebraucht“.

Eine weitere Überraschung für Russom: Von Echtzeit-Datensammlung und -Analytik ist in der Spitzengruppe nichts zu sehen. „Für Organisationen aller Art war es schon eine lange Reise, herauszufinden, wie man Daten am besten speichert und fortschrittliche Analytik betreibt, und wie man beides zusammenbringt“, sagt Russom. Als nächster Schritt komme dann Echtzeit, und hier habe es deutlich weniger Anwender gegeben, als er gedacht hätte.

Einer der Umfrage-Teilnehmer schrieb dazu sogar: „Wir haben die Skalierbarkeitskrise überlebt, indem wir billige Infrastruktur gekauft haben, so dass Big Data für uns jetzt eine gute Sache ist und kein Problem. Jetzt müssten wir nur noch die Echtzeit-Krise lösen, und dann könnte es losgehen.“

Krise oder nicht, Russom zählt den Wunsch nach Echtzeit-Daten zu den drei großen V seiner Definition von Big Data – Volume, Velocity und Variety, also Volumen, Schnelligkeit und Vielfalt. Nach seinen Worten sind Werkzeuge für Echtzeit-Datensammlung und -Analytik dabei, deutlich reifer zu werden: „Früher waren für Echtzeit-Technologie viele Einzelstücke und Tools unterschiedlicher Anbieter nötig, die nicht immer gut zusammengepasst haben. Mittlerweile wird es mit der Interoperabilität besser, sozusagen in Echtzeit.“

Einsteigen ins Big-Data-Spiel

Kleineren Unternehmen, die noch nicht mit Big Data arbeiten, empfiehlt Russom für den Anfang bezahlbare Werkzeuge. Wenn Kompetenzen für Business Intelligence (BI) kaum vorhanden sind, sollten sie mit einfach zu bedienenden Tools arbeiten, etwa den Produkten von Tableau oder QlikTech. „Beide haben viele Funktionen für fortschrittliche Daten-Visualisierung und können selbst ohne Data Warehouse eine BI-Umgebung schaffen“, sagt er.

Ebenfalls beide kommen auch mit großen Datenbeständen zurecht, doch Russom weist darauf hin, dass Tableau einen 64-Bit-Server erfordert, der eine Zusatzinvestition darstellen kann. Ohne Data Warehouse könnten die Werkzeuge zudem keine historischen Daten speichern.

Für Unternehmen mit einem Data Warehouse stellt sich laut Russom eine andere grundlegende Frage: Ist es von seiner Architektur her für Big-Data-Analytik geeignet? Die Mehrheit der Unternehmen in der Umfrage nannte als aktuell bevorzugte Analytik-Plattform ihr Data Warehouse. Doch nicht jede Art von Data Warehouse ist wirklich für fortschrittliche Analytik geeignet, wie Russom anmerkt.

„Das ist kein Versagen der Produkt-Anbieter“, erklärt er, „die Kunden treffen Entscheidungen und bauen Warehouses, die gut für die Jobs geeignet sind, die sie erfüllen sollen.“ Unternehmen müssen sich deshalb entscheiden, heißt es in der TDWI-Studie: Wollen sie analytische Big Data in einem geteilten, zentralisierten Data Warehouse verwalten oder in einer eigenen, aber damit verknüpften Datenbank?“

Eine eigene Datenbank für Daten-Storage, Modellierung und Abfragen zu betreiben, ist keine neue Idee, wie Russom erklärt. Zudem könnten Neben-Datenbanken wie Hadoop hilfreich sein für Workloads, die nicht im Data Warehouse eines Unternehmens laufen sollen. Von echtem Hadoop-Einsatz hat Russom nach eigener Aussage bislang nicht viel gesehen, doch einige Unternehmen würden mit der Open-Source-Software zumindest experimentieren.

Ein weiteres Drittel der Umfrage-Teilnehmer gab an, dass innerhalb der nächsten drei Jahre ein Wechsel ihrer Analytik-Plattform anstehen dürfte, wobei einige auch eine andere Marke in Betracht ziehen. Für solche Unternehmen könnten laut Russom die Appliances von neuen Anbietern wie Netezza, XtremeData oder EMC Greenplum passend sein. Kognitio, ParAccel, Vertica und 1010data könnten zudem mit speziellen Optionen für Big-Data-Analytik punkten.

Pro+

Premium-Inhalte

Weitere Pro+ Premium-Inhalte und andere Mitglieder-Angebote, finden Sie hier.

Erfahren Sie mehr über Enterprise-Storage: Planung und Management

0 Kommentare

Älteste Beiträge 

Passwort vergessen?

Kein Problem! Tragen Sie Ihre E-Mail-Adresse unten ein. Wir werden Ihnen eine E-Mail mit Ihrem Passwort schicken.

Ihr Passwort wurde an die folgende E-Mail-Adresse gesendet::

- GOOGLE-ANZEIGEN

SearchSecurity.de

SearchNetworking.de

SearchEnterpriseSoftware.de

SearchDataCenter.de

Close