08.01.2016 Die Datenvielfalt bewältigen

3 Schlüsselfaktoren für Big-Data-Analysen

Von: Matthias Hintenaus *

Sowohl bei der Suche nach relevanten Daten als auch bei der Big-Data-Analyse kommt es auf drei Schlüsselfaktoren an.

Datenvielfalt

Die Anzahl der Datenquellen, in denen relevante Infos liegen, wächst beständig.

Leistungsfähige Inhaltsanalyse:


Ein Such- und Analysewerkzeug im Big-Data-Umfeld muss strukturierte ebenso wie unstrukturierte Daten indizieren. Erst die Kombination beider Analysearten liefert brauchbare Ergebnisse. Techniken des „Natural Language Processing“ (oder auch Computerlinguistik) helfen, unter allen Ergebnissen die entscheidenden zu erfassen. Wird das Erkennen semantischer Zusammenhänge mit statistischen Analysen und Algorithmen für maschinelles Lernen verbunden, erhält der Suchende bessere, weil kontextbezogene Informationen.

Konnektivität:


Die Anzahl der Datenquellen, in denen relevante Informationen liegen, wächst beständig. Eine Plattform muss daher möglichst viele Quellen anbinden, idealerweise alle. Tritt eine neue Datenquelle hinzu, muss sich die Plattform schnell mit ihr verbinden lassen können. Multiple Anschlüsse für strukturierte und unstrukturierte Datentöpfe bewältigen die Datenvielfalt.

Skalierbarkeit:


Um mit großen Datenmengen umzugehen, muss die Plattform so skalierbar sein, dass sich statistische Analysen strukturierter und unstrukturierter Daten mit linguistischen und semantischen Analyse von Texten in mehreren Hauptsprachen kombinieren lassen. Nur so können Ergebnisse in Realzeit zur Verfügung stehen; bei überbordenden Datenmengen würden sonst die Antwortzeiten inakzeptabel lang.

* Sales Director DACH bei Sinequa

Bildquelle: Thinkstock/iStock

©2017 Alle Rechte bei MEDIENHAUS Verlag GmbH