09.10.2017 Bilderkennung

Google baut Kameras mit künstlicher Intelligenz

Von: Ingo Steinhaus

Google Lens und Google Clip nutzen künstliche Intelligenz (KI) für neue Einsatzszenarien von Foto- und Videokameras.

Kameraobjektiv aus der Nähe

Google will das Fotografieren neu erfinden

Bei Google ist jetzt alles AI, auch die Bild- und Kamerafunktionen werden durch Machine Learning aufgewertet. Im Laufe des Jahres werden die neuen Pixel-Smartphones von Google mit Google Lens ausgerüstet, einer KI-gestützten Bilderkennungssoftware. Die App führt ein paar Machine-Learning-Services aus dem Hause Google zusammen. Hauptfunktion ist die Erkennung von Objekten in Bildern. Ein Beispiel: Wer eine Pflanze fotografiert, bekommt von der KI mitgeteilt, um welche Pflanze es sich handelt. Darüber hinaus sieht er weitere zusätzliche Informationen, die anhand des erkannten Objektes aus dem Google Suchindex übernommen werden.

Diese Bilderkennung funktioniert auch mit Sehenswürdigkeiten, Gebäuden und sogar Restaurants. Zudem kann die KI-Funktion auch Alltagsaufgaben erledigen: Google Lens kann das Smartphone automatisch mit einem Wi-Fi-Router verbinden, wenn die Kamera auf das Typschild mit SSID und Standardpasswort gerichtet wird. Besonders interessant ist die Verknüpfung von Google Lens und Google Assistant. So soll es beispielsweise möglich sein, Schilder und Plakate mit Terminangaben für Veranstaltungen auszulesen und die Termine per Sprachbefehl im Kalender zu speichern.

Außerdem gibt es eine Verbindung zu Google Translate, sodass in der Kamera auftauchende Texte nach einem Befehl wie „What does this say?“ automatisch übersetzt werden. Eine weitere Möglichkeit, die Google in sein Bilderkennung-Tool einbauen möchte ist eine Bearbeitungsfunktion. Damit soll es möglich sein, bestimmte Bildmotive automatisch aus dem Bild heraus zu „photoshoppen.“ Die meisten dieser Funktionen funktionieren sogar in Echtzeit und erfordern nicht die Aufnahme eines statischen Fotos. Wer beispielsweise fremdsprachige Texte in seiner Umgebung übersetzen möchte, muss nun bloß noch die Kamera darauf richten. Natürlich klappt das in erster Linie mit großen Formaten und kurzen Texten, etwa Plakaten, Beschriftungen an Gebäuden oder Straßenschildern.

Smarte Kamera sucht Motive selbsttätig

Ein anderes Einsatzgebiet von Machine Learning zeigt Google Clips, eine smarte Kamera, die selbsttätig Fotos machen soll. Sie ist beispielsweise für Aufnahmen aus dem Familienleben oder von einer Party gedacht. Der Nutzer stellt die Kamera einfach irgendwo so hin, dass sie den ganzen Raum oder den gemeinsamen Tisch im Blick hat. Nun macht sie in regelmäßigen Abständen Aufnahmen in Form eines kurzen Videoclips. Anschließend und zumindest anfangs ist der Nutzer gefragt, denn er soll die besten Clips aus dieser Sammlung auswählen. Mit künstlicher Intelligenz lernt die smarte Kamera nun, welche Motive und Personen der Nutzer besonders interessant fand und versucht nun, nur noch solche Clips aufzunehmen.

Die smarte Kamera ist ab Werk darauf richtet, nur Motive aufzunehmen, wenn Personen und Objekte darauf besonders gut erkennbar sind. Durch die KI-Routinen lernt die Kamera nun die Personen kennen, die besonders häufig fotografiert werden und berücksichtigt sie entsprechend häufiger bei ihren Clips. Die Besonderheit daran: Das Machine Learning findet nicht etwa in der Cloud statt, sondern direkt im digitalen Innenleben der Kamera. Dadurch ist nach Ansicht von Google gewährleistet, dass die Privatsphäre der abgebildeten Personen berücksichtigt bleibt.

Die smarte Kamera von Google zeigt, dass durch eine geschickte Kombination unterschiedlicher KI-Lernverfahren völlig neue Anwendungen möglich werden. Die Verfahren zur Wiedererkennung von Objekten und zum Identifizieren von wiederholten Bildmustern sind inzwischen recht alltagstauglich, so dass sie sicher auch in anderen Kontexten eingesetzt werden können, beispielsweise in der Lagerlogistik beim Erkennen und Wiedererkennen von Waren durch Roboter.

Bildquelle: Thinkstock

©2017 Alle Rechte bei MEDIENHAUS Verlag GmbH