28.04.2015 Der gläserne Smartphone-Nutzer

Sprachassistenten: Siri, Cortana, Google Okay

Von: Frank Becker

Sie heißen Siri und Cortana oder hören auf den Befehl „Okay Google“. Die digitalen Assistenten auf Smartphones und Tablets helfen bei vielen Dingen des Alltags und wissen eine Menge über den Besitzer, bergen dabei jedoch auch eine Gefahr für alle persönlichen Daten.

Digitale Sprachassistenten – wie Siri, Cortana oder Goolges Okay – auf Smartphones und Tablets sind in vielen Situationen hilfreich, bergern alllerdings auch Risiken für die persönlichen Daten.

Digitale Assistenten wollen mithilfe der Spracherkennung die Bedienung von iPhone, von Windows Phone und von Smartphones mit Android erleichtern. In der aktuellen Ge­rätegeneration sind die Erkennungssysteme so weit fortgeschritten, dass bei einigen Sprachanweisungen fast ein echtes Gespräch zwischen Mensch und Maschine stattfindet.

Die wohl bekannteste Stimme hört auf den Namen „Siri“ und ist die digitale Assistentin auf Apples iPhone und iPad. Auf Endgeräten mit dem Google-Betriebssystem Android lautet die Ansage für Gerätebefehle „Okay Google“. Die neueste Assistentin von Microsoft heißt „Cortana“ und leistet seit Ende letzten Jahres auf Smartphones mit Windows Phone 8.1 ihre Dienste.

Das leistet die Spracherkennung

Die digitalen Assistenten sind darauf ausgelegt, Befehle in natürlich gesprochener Sprache zu empfangen und diese auf den Geräten zu verarbeiten. Der Nutzer fordert seine Information durch direkte Ansprache an: „Zeige mir Fotos von ...“, „Schreibe eine Mail an ...“, „Navigiere nach ...“, „Stelle den Wecker auf ...“, „Trage den Termin ... ein“ oder „Rufe ... an“.

Aus einigen dieser Sprachbefehle entstehen sogar Rückfragen. Für die rechenintensive Aufbereitung der Sprachinformationen ist jedoch eine Internetverbindung zwingend erforderlich, die zusätzliche Kosten durch höheren Traffic oder Roaming-Gebühren verursachen kann.

Googles Assistent auf Android-Geräten versteht sich als reine Sprachsuche. Besondere Gewohnheiten oder Vorlieben des Nutzers berücksichtigt der Dienst bei seiner Suche nicht. Insgesamt ein sehr nüchternes System, doch recht effektiv bei den Suchergebnissen. Zudem hat Google die Sprachsuche auch in seinem Chrome-Browser integriert, sodass man den Dienst auch an jedem Windows-
der Apple-Rechner nutzen kann. Mit den Assistentinnen Siri und Cortana von Apple und Microsoft lässt sich dagegen schon fast ein richtiges Gespräch führen. Die Erkennungsdienste können Sprachbefehle und Suchaufgaben mittels direkter Ansprache verstehen. Die Dienste reagieren sogar auf Fragen, die in Beziehung mit vorhergegangenen Aufgaben gekoppelt sind, wie z. B. „Wie ist das Wetter in Düsseldorf?“, „und in Köln?“

Siri und Cortana sprechen ihre Besitzer mit Namen oder Spitznamen an und haben von ihren Programmierern sogar einen gewissen Sinn für Humor mitbekommen. So können die Assistentinnen nicht nur Witze erzählen, sondern haben für freche Fragen auch entsprechend freche Antworten parat.

Cortana von Microsoft verspricht sogar ein wenig mehr. Neben den reinen Suchanfragen soll die digitale Assistentin bei der Suche auch auf Querverweise vorhergegangener Aktivitäten zurückgreifen. Das bedeutet: Wenn Cortana registriert hat, dass der Nutzer einen bestimmten Ort häufig aufsucht oder regelmäßig nach einem bestimmten Thema im Internet sucht, merkt sich die Assistentin auf Wunsch die Verhaltensweise des Anwenders und verspricht bei späteren Aktionen, automatisch Vorschläge aufgrund des Verhaltensmusters zu machen. Darüber hinaus hat Microsoft Cortana nun auch in sein Betriebssystem Windows 10 integriert, womit die Assistentin den Anwender auch auf dem PC unterstützen möchte.

Neben den mitunter nützlichen Suchfunktionen und Befehlen stellt die Spracherkennung auf Smartphones auch eine Alternative zu der Texteingabe dar. Mit der Spracherkennung bearbeitet der Anwender unterwegs E-Mails, erstellt neue Terminkalendereinträge und verschickt SMS- und Messaging-Nachrichten – alles ohne vorheriges Sprachtraining.

Selbst längere Texte für Briefentwürfe sind mit der Spracheingabe prinzipiell problemlos möglich. Nicht oder falsch erkannte Worte muss der Anwender allerdings mit der Touch-Tastatur korrigieren. Auch wenn die Spracherkennung mit der Zeit neue Vokabeln erlernt, ist der Bedienmix aus Sprach- und Tastatureingabe für längeres Arbeiten mühselig. Zudem können laute Umgebungsgeräusche zu einer höheren Fehlerquote bei der Erkennung ­führen.

Bedienung der Assistenten

Grundsätzlich aktiviert der Nutzer seinen digitalen Assistenten per Knopfdruck. Sobald – angezeigt durch ein akustisches Signal – das Mikrofon zum Zuhören bereit ist, kann der Nutzer seine ­Fragen stellen.

Bei Apple- und Android-Geräten funktioniert das sogar auch auf Zuruf. Mit dem Sprachbefehl „Okay Google“ oder „Hey Siri“ sind die Assistenten auf Android-Geräten sowie dem iPhone bereit, um Anweisungen entgegenzunehmen. Auch Microsoft kann mit dem Befehl „Hey Cortana“ seine Assistentin starten. Diese Funktion wird allerdings aktuell nur von den Lumia-Modellen 930 und 1520 unterstützt. Man kann aber davon ausgehen, dass Microsoft diese Funktion künftig auf allen seinen Modellen standardisieren wird.

Mit der Aktivierung der Assistenten per Sprachbefehl kann der Anwender freihändig Kontakte anrufen, SMS- und E-Mail-Nachrichten verschicken und Abfragen aller Art starten. Das funktioniert sogar mit gesperrten Geräten, die sonst PIN-geschützt sind. Doch Vorsicht: Wer diese Funktion aktiviert, gibt sein Smartphone auch für andere frei. Die Assistenten hören nicht nur auf die Stimme ihres Besitzers, sondern nehmen von jedem Anweisungen entgegen. Damit sind auch Fremde in der Lage, mithilfe der Spracherkennung Nachrichten zu verschicken und Telefonate zu führen, ohne dass der Besitzer es mitbekommt.

Über die Spracherkennung kann Siri sogar die Kontaktdaten des Handybesitzers verraten, selbst bei gesperrtem Bildschirm. Dazu reicht schon die Frage: „Wem gehört dieses Telefon?“ und schon nennt Siri den Namen des Besitzers samt Rufnummern, Adresse und Mail. Das soll natürlich dem ehrlichen Finder des Telefons erleichtern, das Gerät seinem Besitzer zurückzubringen. Doch mit einer Portion krimineller Energie lassen sich diese Informationen auch anders nutzen.

Wer auf Nummer sicher gehen möchte, sorgt dafür, dass in den Geräteeinstellungen des Smartphones alle Parameter, die eine Fremdnutzung erlauben, deaktiviert sind. Man sollte nicht unachtsam alle Möglichkeiten der Spracherkennung ­ ­einschalten.

Persönliche Daten im Netz

Je länger man seine digitale Assistentin beauftragt, Dinge des Alltags zu erledigen, desto besser lernt das Smartphone seinen Besitzer kennen. In Matahari-Manier sorgen Siri, Cortana und Google dafür, dass alle persönlichen Informationen wie Kontakte, Mails, SMS-Nachrichten, besuchte Internetseiten und häufig genutzte Wege auf den Servern von Apple, Google und Microsoft gespeichert sind. Natürlich soll die Speicherung dieser Daten in erster Linie dafür sorgen, dass die Assistenten dazulernen und diese Daten für zukünftige Suchanfragen mit berücksichtigen. Damit soll sich die Suche schneller und effizienter gestalten.

Apple, Google und Microsoft machen daraus auch kein Geheimnis. Welche Informationen die Betriebssystemhersteller speichern, steht in den Sicherheitsrichtlinien, die sich jeder durchlesen kann.

So heißt es bei Apple: „Wenn Sie Siri und die Diktierfunktion verwenden, wird alles, was Sie sagen beziehungsweise diktieren, aufgezeichnet und dann an Apple gesendet, damit die Anfragen verarbeitet werden können. Andere Informationen wie Ihr Name oder Spitzname, die Namen und Spitz­namen Ihrer Adressbuchkontakte, die Beziehung zu bestimmten ­Personen, Musiktitel in Ihrer Sammlung sowie die für HomeKit aktivierten Geräte in Ihrem Haus werden ebenfalls an Apple gesendet.“

Auch Microsoft zeigt in seiner Datenschutzerklärung, welche Nutzerdaten auf dem Server landen. Darin formuliert das Unternehmen: „… sammelt und nutzt Microsoft verschiedene Arten von Daten, z.B. Ihren Handystandort, Daten aus Ihrem Kalender, die von Ihnen verwendeten Apps, spezifische Informationen aus Ihren E-Mails und SMS sowie Ihre Kontakte. ­Cortana erfährt auch mehr über Sie, indem es Daten über die Nutzung Ihres Handys erfasst, z.B. die Musik, die Sie auf Ihrem Handy hören, Ihre Weckereinstellungen, ob der Sperrbildschirm ­aktiviert ist, was Sie sich im Store ansehen und kaufen und vieles mehr.“

Und, wer hätte es gedacht? Auch Google merkt sich, was jeder Besitzer eines Android-Smartphones macht. Der Nutzer kann im Internet sehen, welche Daten über ihn gespeichert sind. Dazu zählen Lesezeichen, E-Mails, Kalender, Kontaktdaten, Standortdaten und vieles mehr. Es sind auch sämtliche Spracherkennungsbefehle gespeichert, die der Nutzer für den Dienst „Okay Google“ verwendet hat. Alle diese Daten lassen sich über Monate und Jahre zurückverfolgen. Bei den Standortdaten kann man genau sehen, an welchem Tag zu welcher Uhrzeit ein Anwender in welcher Funkzelle mit seinem Android-Smartphone eingeloggt war. Mit diesen Daten wird auf dem Bildschirm für jeden Tag des Jahres die Bewegung des Smartphonebesitzers angezeigt. Die Verläufe lassen sich jedoch manuell löschen. Danke dafür!

Natürlich sei unter heutigen Gesichtspunkten alles so sicher, dass man sich keine allzu großen Sorgen machen müsse – dies behaupten jedenfalls Apple, Google und Microsoft. Dennoch ist es erschreckend, wie viele persönliche Informationen mit Unterstützung der digitalen Assistenten auf den Servern der großen Hersteller landen. Natürlich sind die Assistenten praktisch. Man sollte aber ein Gefühl dafür entwickeln, welche Informationen man von sich über Spracherkennung preisgeben möchte. Wer sich damit nicht wohl fühlt, kann Siri und Cortana sowie die Spracherkennung von Google einfach in den Geräteeinstellungen abschalten.

Haushaltsgeräte hören mit

Die digitalen Assistenten sind mittlerweile so populär geworden, dass die Spracherkennung auch in anderen Geräten zum Einsatz kommt. So sind inzwischen einige Fernsehgeräte und Spielekonsolen mit Spracherkennungssystemen ausgerüstet, um die Fernbedienung beiseitelassen zu können. Was dieser Freiheit als bitterer Geschmack mitschwingt, sind die Sicherheitsbedenken und die damit verbundenen personenbezogenen Daten, die mit Sprachbefehlen ins Internet gelangen. 

In den USA vermarktet Amazon beispielsweise seit Ende letzten Jahres einen WLAN-Lautsprecher zum Streamen von Musik mit integrierter Assistentenfunktion. Amazons Assistentin hört auf den Namen Alexa und übernimmt prinzipiell die gleichen Aufgaben wie Siri oder Cortana.

Die Steuerung erfolgt per Ansage und auf Zuruf spielt Alexa die Lieblingsmusik ab, beantwortet Fragen zu Sport sowie Allgemeinwissen und erstellt Einkaufslisten, Termine, Weckzeiten und vieles mehr. Amazon bewirbt seine zylindrische Box mit „Always ready, connected and fast“. Hier liegen auch die Bedenken zu dem System: Sieben empfindliche Mikrofone horchen in den eigenen vier Wänden und warten rund um die Uhr auf Anweisungen. Damit möchte Amazon gewährleisten, auch dann noch Fragen zu hören, wenn die Box im Augenblick Musik abspielt.

Sobald jemand das Erkennungswort „Alexa“ ausspricht, nimmt die Box eine Verbindung zum Internet auf, um die Sprachdaten zur Analyse auf einen Amazon-Server zu übertragen. Da jeder in der Wohnung oder im Haus mit dem Schlagwort die Box aktivieren kann, kann niemand sicher sein, was an Sprachdaten tatsächlich ins Internet gelangt. 


Bildquelle: Thinkstock/ iStock

©2017 Alle Rechte bei MEDIENHAUS Verlag GmbH