Wie KI bei der Einhaltung der DSGVO helfen kann

Anonym speichern statt persönlich haften

Vor vier Monaten trat die EU-Datenschutz-Grundverordnung (DSGVO) in Kraft. Nach hundert Tagen zogen die Berater der Mayato GmbH Bilanz und stellten fest, dass die Herausforderungen in vielen Bereichen noch nicht bewältigt sind. Insbesondere geht es um die Entfernung personenbezogener Informationen aus Datensätzen, Akten und anderen unstrukturierten Daten, um diese für die weitere Nutzung im Unternehmen vorzubereiten.

Dr. Cäcilia Zirn, Mayato

Dr. Cäcilia Zirn, Computerlinguistin und Leiterin Künstliche Intelligenz bei Mayato: „Der Schutz personenbezogener Daten muss nicht gleich das Ende von ‚Data Mining‘ bedeuten!“

Das Beratungsunternehmen Mayato, spezialisiert auf die Bereiche Business Intelligence, Data Science und Analytics, wird immer wieder mit der Frage konfrontiert, ob sich Unternehmensdaten trotz DSGVO weiterhin zur Qualitätssicherung, Trendanalyse oder Forschung nutzen lassen.

Im medizinischen Umfeld etwa liefern analytische Verfahren ja entscheidende Hinweise auf Behandlungsmöglichkeiten, erkennen Zusammenhänge oder entdecken riskante Nebenwirkungen, wobei hier die Auswertungen von Patientendaten als Basis dienen. Das wird durch die neue Verordnung schwierig, da die Verarbeitung persönlicher Daten stark reglementiert ist. Einen Ausweg aus diesem Dilemma bietet die Anonymisierung der Daten mittels Künstlicher Intelligenz.

Eine effiziente Möglichkeit, um personenbezogene Informationen aus Datensätzen, Akten und anderen unstrukturierten Daten zu entfernen, eröffnen sogenannte „Named Entity Recognition“-Verfahren: Das sind computerlinguistische Methoden, die automatisch in Texten Eigennamen erkennen. Mit diesen Verfahren können beispielsweise im medizinischen Umfeld Patientennamen, behandelnde Ärzte, Krankenhäuser usw. ausfindig gemacht und automatisch aus den Texten herausgelöscht werden.

Zwei Ansätze in der Praxis

Dabei existieren zwei Ansätze: Im einfachsten Fall sind Listen hinterlegt, nach denen vorhandene Dokumente durchsucht und die entsprechenden Begriffe ersetzt werden. In der Praxis erweist sich dies jedoch als schwierig, da beispielsweise für Personennamen kaum eine vollständige Liste erstellt werden kann!

Der zweite Ansatz geht weiter. Tiefergehende Verfahren analysieren den Kontext und die grammatikalische Struktur der Texte. Die Verfahren werden auf einer Menge bereits bekannter, gängiger Namen trainiert. Sie lernen typische Muster, in denen Eigennamen auftreten, und können somit auch vorher unbekannte Namen zielsicher erkennen. Die so bereinigten Daten können nun z.B. in die Cloud geladen oder für Analysen auch an jeweilige Fachbereiche weitergegeben werden.

KI rettet das „Data Mining“

Die Computerlinguistin und Leiterin Künstliche Intelligenz bei Mayato, Dr. Cäcilia Zirn, erklärt dazu: „Der Schutz personenbezogener Daten muss nicht gleich das Ende von ‚Data Mining‘ bedeuten. Genau die Verfahren, die von vielen Datenschützern als gefährlich eingestuft werden, erweisen sich hier als Rettungsanker. Denn auf die zahlreichen Erkenntnisse, die wir dank künstlicher Intelligenz erhalten, wollen die meisten von uns am Ende doch nicht verzichten.“

 

Bildquelle: Mayato

©2018Alle Rechte bei MEDIENHAUS Verlag GmbH

Unsere Website verwendet Cookies, um Ihnen den bestmöglichen Service zu bieten. Durch die weitere Nutzung der Seite stimmen Sie der Verwendung zu. Weitere Infos finden Sie in unserer Datenschutzerklärung.

ok