Big-Data-Auswertung

Viele Daten, wenige Analytiker

Die Datenmassen in den Unternehmen wachsen. Doch bei der Auswertung hapert es: die Technologie ist Neuland und Datenanalytiker fehlen.

Menschenmassen saorgen für "Big Data"

"Big Data" gehört bei Gartner und Forrester Research zu den Trend-Stichworten für die nächsten Jahre. Damit ist in erster Linie die gigantische Datenhalde Internet gemeint. Millionen Menschen nutzen Blogs und Foren, Facebook, Twitter, Qype, Ciao und die vielen anderen Online-Communitys für den Austausch untereinander.

Unter anderen erzeugen sie damit recht wertvolle Daten für Unternehmen. Jeden Tag entstehen zu praktisch jedem verfügbaren Produkt, zu jeder Dienstleistung und zu jeder bekannten Marke positive und negative Äußerungen aller Art. In der Theorie können Unternehmen diese Daten nutzen, um ein relativ unverfälschtes Meinungsbild zu ihren Produkten zu bekommen.

Big Data, big Problems

Die Praxis von "Big Data" stößt allerdings recht schnell an Grenzen. Dies liegt unter anderem an den geradezu fantastischen Datenmengen, die bei einer Auswertung von Internetdiensten aller Art anfallen. Hierzu sind größtenteils neue Verfahren notwendig, zum Beispiel bei der notwendigen Sicherung und Archivierung der Daten.

So hat der Backup-Spezialist Spectra Logic vor kurzem eine spezielle Tape-Library vorgestellt, die in der größten Ausbaustufe 3,6 Exabtye Daten speichern kann. Das entspricht der Datenmenge von 3,6 Millionen handelsüblichen Terabyte-Festplatten. Gesichert werden diese Mengen in einem raumfüllenden Tape-Monster mit 400.000 Laufwerksschächten und Roboterarmen, die sich um die Befüllung mit Cartridges kümmern

Auch die Auswertung der Daten ist keine einfache Aufgabe. Herkömmliche Datenbanksysteme stoßen dabei schnell an Grenzen - egal, ob Mainframe-Anwendungen wie DB/2 oder weit verbreitete Server wie MySQL genutzt werden. Diese relationalen Datenbanksysteme (RDBMS, Relational Database Management Systems) sind in Unternehmen heutzutage noch die Regel.

Big Data erfordert jedoch verbesserte DBMS wie zum Beispiel InfiniDB. "Das System kann anspruchsvollen Aufgaben im Bereich Business Intelligence, Data Warehousing und analytischen Umgebungen gerecht werden", meint Christian Niemann, CEO der Uniique AG, die den Vertrieb der Open-Source-Lösung in Deutschland übernommen hat.

Bei einer solchen spaltenorientierte Datenbank ist optimiert für die effiziente Speicherung gleichartiger Daten, wie sie typischerweise in großen Business-Datenbanken anfallen. Für die nur wenig strukturierten Datensammlungen aus dem Web sind in der letzten Zeit vollkommen neu konzipierte Datenmanagementsysteme wie Apache Hadoop entwickelt worden.

Experten für Big Data sind Mangelware

Es ist ein Open-Source-Framework für verteilt arbeitende Software und erlaubt die Verarbeitung großer Datenmengen im Petabyte-Bereich auf Computerclustern. Genutzt werden diese Systeme bisher unter anderem von Facebook und dem Medien-Hoster Imageshack. Für "Business Intelligence" ist Hadoop allerdings Neuland.

Doch technische Probleme lassen sich für gewöhnlich recht schnell lösen. Die typische Dynamik der IT-Branche wird schon für eine permanente Verbesserung der Tools sorgen. Die Euphorie über "Big Data" könnte aus einem anderen Grund einen Dämpfer erleiden: Es gibt kaum Experten, die sich mit der sinnvollen Analyse von Webdaten auskennen.

Nach einer Studie der Technologieberatung EMC schafft die starke Zunahme digitaler Datenbestände in Verbindung mit neuen Analyse-Tools ebenso stark wachsende Möglichkeiten schafft, neue Umsätze und Erkenntnisse aus diesen Daten zu generieren. Durch diese Entwicklung ist der Bedarf an Data Scientists stark angewachsen und übersteigt bei weitem das Angebot an verfügbaren Experten auf dem Arbeitsmarkt.

"Das Big-Data-Zeitalter ist angebrochen", sagt Sabine Bendiek, Geschäftsführerin der EMC Deutschland GmbH. "Was wir brauchen, um alle Potenziale voll auszuschöpfen, sind exzellent ausgebildete, miteinander vernetzte und dynamische Data Science Experten. Nur diese werden in der Lage sein, verborgene Trends in den Datenmengen zu entdecken und neue Erkenntnisse aus ihnen zu ziehen."

Bildquelle: S. Hofschlaeger / pixelio.de

©2020Alle Rechte bei MEDIENHAUS Verlag GmbH

Unsere Website verwendet Cookies, um Ihnen den bestmöglichen Service zu bieten. Durch die weitere Nutzung der Seite stimmen Sie der Verwendung zu. Weitere Infos finden Sie in unserer Datenschutzerklärung.

ok