Kollaboration in der Analyse

Agile Zusammenarbeit beim Datenmanagement

Dominik Claßen, Director of Sales Engineering EMEA & APAC bei Hitachi Vantara, im Gespräch über Business Intelligence (BI), Machine Learning und das gewisse Gefühl für die Belastbarkeit von Datenanalysen.

Im Zeitalter von Big Data und der Zusammenführung hunderter bis tausender Datenquellen sei es immens wichtig zu wissen, welche Daten wo in welcher Qualität und in welchem Format vorliegen, so Dominik Claßen.

ITM: Herr Claßen, welche Kompetenzen müssen Angestellte mitbringen, um souverän mit BI-Software arbeiten zu können?
Dominik Claßen:
Lösungen wie beispielsweise unsere „Streamlined Data Refinery“ geben dem Fachbereich die Möglichkeit, jederzeit genau die Daten in einen Adhoc-Data-Mart (ROLAP-Cube) zu ziehen und zu analysieren, die sie aktuell benötigen. Gleichzeitig hat die IT im Hintergrund die volle Kontrolle über Governance, SLAs etc.. Der Fachanwender muss dafür nur über ein intuitives Webinterface die gewünschten Daten selektieren. Hierbei kommt die Kombination von BI-Frontend und DI-Backend in einer integrierten Plattform voll zum Tragen.

ITM: Wie sieht die Arbeitsteilung bei der Arbeit mit BI-Software zwischen IT und Controlling aus?
Claßen:
Das ist komplett kunden- und projektabhängig. Pentaho ermöglicht hier aber eine deutlich engere Kollaboration, da analytische Funktionen und Visualisierungen an jeder Stelle im Prozess verfügbar sind, angefangen im ETL-Tool. Damit wird eine deutlich agilere und effektivere Zusammenarbeit gefördert.

ITM: Mit welchem Schulungsaufwand ist eine Neueinführung realistischerweise verbunden?
Claßen:
Der Aufwand orientiert sich an den Komponenten, die zum Einsatz kommen. Während ein Analyst schon mit weniger als einem Tag Training arbeitsfähig ist, benötigt ein Admin typischerweise zwei bis drei Wochen, je nach Komplexität des Systems.

ITM: Inwiefern ist es erforderlich, für zusätzliche Aufgaben externe Spezialisten einzubeziehen?
Claßen:
Das ist eigentlich nur beim initialen Training und gegebenenfalls bei Sonderthemen der Fall, wo noch kein internes Know-how besteht. Beispiele sind hier der Einstieg in Big Data oder Data Science.

ITM: Welche Voraussetzungen müssen gegeben sein, um einen belastbaren und aussagekräftigen Datenpool erschließen zu können?
Claßen:
Eine zunehmend wichtige Rolle spielen hier die Metadaten. Im Zeitalter von Big Data und der Zusammenführung hunderter bis tausender Datenquellen ist es immens wichtig zu wissen, welche Daten wo in welcher Qualität und in welchem Format vorliegen, um sie dann auch für den Anwender nutzbar zu machen. Die schiere Masse an Daten macht es einem Menschen aber so gut wie unmöglich, die Gesamtheit der Daten zu überblicken. Hier hilft dann zum Beispiel ein automatisch erstellter Metadatenkatalog, auf dem sich Prozesse wie das Matching von Daten mittels Machine Learning automatisiert abarbeiten lassen. Hier können auch Metriken wie Vollständigkeit, Sensibilität und Aktualität von Daten generiert werden, die dem User schnell ein Gefühl für die Belastbarkeit seiner Analysen geben können.

Bildquelle: Hitachi Vantara

©2018Alle Rechte bei MEDIENHAUS Verlag GmbH

Unsere Website verwendet Cookies, um Ihnen den bestmöglichen Service zu bieten. Durch die weitere Nutzung der Seite stimmen Sie der Verwendung zu. Weitere Infos finden Sie in unserer Datenschutzerklärung.

ok