07.04.2017 Alexa und Echo

Skills sind keine Apps, Entwickler müssen umdenken

Von: Ingo Steinhaus

Immer mehr Skills erscheinen, doch viele sind wenig weltbewegend. Die Entwickler müssen sich erst einmal in die Besonderheiten einer Sprachschnittstelle hineindenken.

Seit ein paar Wochen gibt es den Amazon Echo auch in Deutschland zu kaufen und er nutzt eine Version der Sprachassistentin Alexa, die Deutsch spricht und versteht. In der Grundausstattung handelt es sich um eine Sprachsteuerung für das Smart Home sowie für Informationsdienste wie Wetter oder Nachrichten. Darüber hinaus ist Alexa auch eine digitale DJ, die Titel von Prime Music abspielt.

Doch mit diesen Basisfunktionen kommen die Anwender nicht weit, besonders die zahlreichen unterschiedlichen Hersteller von Smart-Home-Geräten sind nicht in der Standardausstattung berücksichtigt. Doch Alexa ist erweiterbar, durch sogenannte Skills. Dahinter verbergen sich spezielle Apps für Alexa, die mit der Sprachsteuerung bestimmte Funktionen ausführen.

Solche Skills können beispielsweise ein Taxi herbeirufen, das Kinoprogramm oder die letzten Fußball-Ergebnisse vorlesen. Grundsätzlich lassen sich damit alle Geräte steuern, die an das Internet angeschlossen sind. Das müssen nicht nur Thermostate oder Beleuchtungsanlagen sein, so wäre auch der Anschluss des Garagentors oder sogar des Mähroboters möglich.

Anbieter von ganz unterschiedlichen Services können Alexa als zusätzliche Schnittstelle zu ihren Kunden einsetzen. Einer der Vorreiter in Deutschland ist die Deutsche Bahn, die eine Verbindungsabfrage anbietet. Dazu können die Nutzer des Bahn-Skills sogar einen Heimatbahnhof und eine Standardstrecke einrichten, um aktuelle Auskünfte zu erhalten.

Die Skills gibt es im Skill-Shop auf der Website von Amazon. Er entspricht ungefähr einem Appstore bei Mobilgeräten. Obwohl Alexa noch neu auf dem deutschen Markt ist, gibt es schon etwa 1200 Skills. Inzwischen überlegen zahlreiche Unternehmen, ob sie nicht für ihre Produkte auch eine Alexa-Schnittstelle entwickeln sollen. Es ist beispielsweise für einen Webshop naheliegend, um den Kunden auch das Einkaufen via Echo zu erlauben.

Wirklich sinnvolle Skills sind selten

Entsprechend gibt bereits viele Möglichkeiten, irgendetwas zu bestellen und anzufordern. Auch die Zahl der nicht immer besonders sinnreichen Infoskills mit Quizspielen und ähnlichen Dingen steigt stetig. Zwar gibt es über 50 spezielle Smart-Home-Skills, doch ähnlich wie bei iPhone-Apps vor zehn Jahren gibt es noch nicht besonders viele Skills, die eine produktive Aufgabe erledigen.

Eine Ausnahme ist erst seit ein paar Tagen im Skillshop - die „Bring! Einkaufsliste“. Der Skill basiert auf der Einkaufslisten-App für Android und iOS. Die App erleichtert das Zusammenstellen und lästige Eintippen einer Einkaufsliste, da nur Symbole für typische Produkte angetippt werden müssen. Der Alexa-Skill arbeitet mit der App und den dort definierten Einkaufslisten zusammen. Ein einfacher Sprachbefehl wie „Füge zwei Liter Milch hinzu“ trägt etwas in eine Einkaufsliste ein.

Eine wichtige Frage, die sich viele Unternehmen stellen werden: Lohnt sich das überhaupt? Die Entwickler von Bring! haben inzwischen einige wertvolle Erfahrungen sammeln können. Bereits während der Entwicklung des Prototyps hatten die beiden Entwickler Jörg Egli und Sandro Strebel eine wichtige Einsicht: „Das Development einer sprachgesteuerten App folgt ganz anderen Maßstäben als bei einer grafischen App.“

Die größte Herausforderung war der Entwurf von möglichst natürlichen Dialogen. Dabei müssen die Entwickler umdenken. Bei einer grafischen Benutzeroberfläche hat der Anwender die Wahl zwischen direkt sichtbaren Optionen, mit denen er sich darüber hinaus recht einfach vertraut machen kann. Ganz anders bei einer Sprachschnittstelle. Jürg Egli: „Als Entwickler musste ich mir deshalb konkrete Szenarien ausdenken - Was könnten User fragen? Und was soll Alexa darauf antworten?“

Auf der anderen Seite ist der Aufwand für die Entwicklung eines Skills deutlich geringer als der für eine mobile App. So konnten die beiden Entwickler das bestehende Backend fast unverändert für den Skill einsetzen. Die Entwickler raten interessierten Unternehmen, sich genau über einen Use Case Gedanken zu machen. Nicht jede Dienstleistung eignet sich auch für eine Sprachsteuerung. Je komplexer die Funktion, desto schwieriger ist die Umsetzung für das Alexa-Interface.

Bildquelle: Thinkstock

©2017 Alle Rechte bei MEDIENHAUS Verlag GmbH