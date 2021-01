Von: Philip Fassing

{newsItem.falMedia[0]}

ITM: Herr Krause, Künstliche Intelligenz kann bei der Datenanalyse Zusammenhänge visualisieren, die Menschen nicht ohne Weiteres herstellen können. Wie funktioniert das in der Praxis?

Michael Krause: Da die Datenmengen weiterhin exponentiell ansteigen und die Daten immer komplexer werden, ist es für einen Menschen nicht praktikabel, alle möglichen Datenfragen zu stellen, geschweige denn alle Fragen zu kennen, die man stellen könnte. KI-Algorithmen können jedoch leicht Anomalien und Ausreißer aufspüren, Beziehungen zwischen Messgrößen identifizieren oder verborgene Datentrends und -muster aufdecken.

ITM: Mit welchen Methoden werden solche Anomalien erkannt?

Krause: Um Anomalien zu erkennen, würde eine KI-Engine z.B. Standard-Normalverteilung für einen gegebenen Datensatz berechnen und z-Scores verwenden, um die Anzahl der Standardabweichungen zu bestimmen, die ein Datenpunkt vom Mittelwert entfernt ist. Für vorlaufende/nachlaufende Indikatoren werden Kreuzkorrelationen verwendet, um Beziehungen zwischen Messgrößen auf gemeinsamen Zeitdimensionen zu finden. Lineare Regressionen werden verwendet, um Tendenzen über die Zeit hinweg zu identifizieren, und k-Mittelwert-Clustering, um Daten in logische Gruppierungen zu segmentieren.

Aber die KI-Algorithmen können noch mehr. Sie analysieren die Nutzungsdaten, wie z.B. die Suchhistorien der Benutzer, Profile und ihre Interaktion mit den Daten. Sie lernen, was für die Benutzer wichtig ist, und liefern ihnen dann entsprechende Einsichten oder machen ihnen, basierend auf häufig verwendeten Begriffen mit ähnlichen Datensätzen, Vorschläge, welche Fragen sie an die Daten stellen könnten, sodass diese Einsichten finden, über die die Benutzer vielleicht noch gar nicht nachgedacht haben.

Wichtiger als die zugrunde liegende Mechanik ist aber, wie KI es nichttechnischen Mitarbeitern ermöglicht, KI-Technologien ohne spezielle Fachkenntnisse zu nutzen. Die Verarbeitung natürlicher Sprache (Natural Language Processing, NLP) ist eine von mehreren Fähigkeiten aus der Welt der Verbraucher, die zusammen mit Search es jedem Anwender leicht machen, Daten zu analysieren. Die Kombination von NLP mit Search ermöglicht es Geschäftsanwendern ohne spezielle Datenkenntnisse, Fragen zu Unternehmensdaten zu stellen, ohne etwas über Metadaten oder die Struktur und Verknüpfung von Tabellen wissen zu müssen. Ergänzt mit Spracherkennung wird es dann möglich, Datenfragen in natürlicher Sprache über Systeme wie Siri oder Alexa zu stellen.

ITM: Für belastbare Analysen braucht es allerdings auch große Mengen an Daten. Woher kommen diese?

Krause: Im letzten Jahrzehnt gab es eine richtige Explosion der Datenmenge. IDC geht davon aus, dass wir bis 2025 175 Zettabytes an Daten haben werden.

Billige, effiziente Speicherung in der Cloud hat dieses Wachstum der Datenmengen möglich gemacht. Die Daten selbst kommen von verschiedenen Quellen, wie z.B. Anwendungen. Jede digitale Anwendung erzeugt Daten. Da immer mehr Teile unseres Lebens online oder digital sind, hat es eine wahre Datenexplosion gegeben, von sozialen Medien bis hin zu TV- oder Musik-Streaming. Dies spiegelt sich auch in Unternehmensumgebungen wider, in denen SaaS-Anwendungen sich ausbreiten und zu einem massiven Anstieg der Datenmengen führen. Andere Quellen sind der Mobilfunk, hier dreht sich alles um Daten, oder IoT, wo besonders im industriellen IoT viele Daten erzeugt werden. Mit dem Wachstum von IoT und der Entwicklung neuer Möglichkeiten, Daten zu bewegen und zu versenden (Stichwort 5G), nimmt die Menge der erzeugten Daten sogar noch weiter zu. Dies ist ein Artikel aus unserer Print-Ausgabe 12/2020. Bestellen Sie ein kostenfreies Probe-Abo.

ITM: Wie wird man mit solchen Datenmengen fertig?

Krause: Unternehmen ertrinken buchstäblich in ihren Daten. Die Technologien, die in der Vergangenheit zur Verarbeitung all dieser Informationen eingesetzt wurden, können dieses Ausmaß kaum bewältigen. Noch problematischer ist jedoch, dass kein Mensch all diese Daten einfach durchforsten kann, um aussagekräftige Erkenntnisse zu gewinnen. Kein Wunder, dass laut Forrester trotz dieser großen verfügbaren Datenmenge 73 Prozent der Daten nicht für die Analyse verwendet werden. Die Frage ist also eigentlich nicht, woher wir große Datenmengen bekommen, sondern wie wir diese für die Analyse zugänglich machen.

ITM: Gibt es für solche Analysen spezielle Anforderungen an den Datenschutz?

Krause: Auch wenn mehr Datenzugriff letztendlich eine gute Sache ist, bedeutet das nicht, dass Endbenutzer Zugriff auf die gesamte Datenmenge ihres Unternehmens oder sogar auf ein ganzes Datenblatt haben sollten. Die Kombination von Datensicherheit und Datenschutz ist hier entscheidend.

ITM: Was müssen die Anwendungen dafür leisten?

Krause: Anwendungen müssen einen sicheren Zugriff in großem Maßstab gewährleisten, ohne die Sicherheit durch Sicherheitsschutz auf Zeilenebene für Milliarden von Datenzeilen zu gefährden. Im Idealfall sollte es möglich sein, benutzerdefinierte Zugriffsberechtigungen für jeden einzelnen Datensatz und Benutzer festzulegen. Fein abgestufte Benutzerberechtigungen sollten gewährleisten, dass nur autorisierte Benutzer Zugriff auf den richtigen Datensatz haben.

Doch auch wenn Sicherheit der Schlüssel für solche Anwendungen ist, gibt es für Unternehmen noch mehr zu beachten. Bedenken beim Datenschutz resultieren oft aus einer weit gefassten Frage, nämlich ob wir KI-Anwendungen vertrauen können oder nicht. Sicherheit bildet zwar die Grundlage für dieses Vertrauen, aber im Zusammenhang mit KI ist Transparenz ebenso wichtig. Die Anwender wollen verstehen, wie die KI Entscheidungen trifft. Wenn KI zum Aufbau von Anwendungen im Gesundheitswesen verwendet wird, bei denen tatsächlich medizinische Empfehlungen gegeben werden, muss erklärt werden, wie die KI funktioniert und wie sie Empfehlungen oder Entscheidungen trifft. Um Unternehmen dabei zu helfen, KI-Anwendungen zu entwickeln, denen die Menschen vertrauen, hat unser Mitbegründer und Vorstandsvorsitzender Ajeet Singh das sogenannte STAR-Framework entwickelt. STAR steht für Sicherheit, Transparenz, Genauigkeit (Accuracy) und Relevanz. Neben Sicherheit und Transparenz vertrauen Menschen eher einer Anwendung, wenn die Ergebnisse, die sie liefert, akkurat – dies gilt insbesondere für geschäftskritische Anwendungsfälle – und für den Benutzer relevant sind.

ITM: In welchen Branchen sehen Sie aktuell das größte Potenzial für den Einsatz von KI-getriebener Datenanalyse?

Krause: KI wird definitiv die Zukunft der Banken- und Versicherungsbranche prägen. Laut einer Studie des Economist planen 86 Prozent der Banken und Versicherungen, ihre KI-bezogenen Investitionen bis 2025 zu erhöhen. Das ist keine Überraschung, da die Finanzdienstleistungsbranche eine der reifsten Branchen ist, wenn es um Daten und Analysen geht. Und ohne Daten kann man KI nicht nutzen. Die KI-gesteuerte Datenanalyse wird der Finanzdienstleistungsbranche dabei helfen, Risiken zu reduzieren, Einnahmen zu verbessern und Kosten zu senken. Das sehen wir auch bei unseren Bankkunden. Mit KI- und such-gesteuerter Analyse konnten die Vermögensberater einer der größten US-Banken eine vollständige 360-Grad-Ansicht ihrer Kunden erstellen und Einblicke in Anlageprodukte, Kreditkarten und Hypotheken erhalten und so neue relevante Produkte und Dienstleistungen für sie identifizieren. Dadurch war es der Bank möglich, das verwaltete Vermögen zu vergrößern und den Kundenwert zu steigern.

ITM: Gibt es weitere Disziplinen, die stark von der Entwicklung profitieren werden?

Krause: Eine weitere wichtige Branche, in der KI-gesteuerte Analysen einen großen Einfluss haben werden, ist die Lieferkette. Egal ob es sich um die zunehmende Bedrohung durch Krankheiten, politische Unruhen oder durch den Klimawandel verursachte Unwetterereignisse handelt, globale Liefernetzwerke müssen intelligenter, anpassungsfähiger und widerstandsfähiger gemacht werden. KI-gesteuerte Analysen machen einen großen Unterschied und versetzen Unternehmen in die Lage, ihre Lieferkettendaten intelligent zu nutzen.