Deep Learning

Künstliche Intelligenz zum Ausprobieren

Die eindrücklichsten Ergebnisse haben KI-Verfahren bei der Gestaltung und Bearbeitung von fotorealistischen Bildern. Das kann jeder im Web erproben.

Roboterhand über Schachbrett

Künstliche Intelligenz

KI ist überall. Bald übernehmen autonom handelnde und denkende Maschinen die Weltherrschaft. Dann folgt der Judgement Day und nur John Connor kann uns retten – soweit das Setting des Terminator-Franchises aus Hollywood. Die Realität von künstlicher Intelligenz ist weitaus weniger spektakulär. Denn die meisten Anwendungen gibt es in Unternehmen und sie tragen eher langweilig wirkende Namen wie „Predictive Maintenance“.

Trotzdem gibt es verblüffende und spannende Bereiche in der künstlichen Intelligenz, von denen einige sogar alltagstauglich sind. Ein Beispiel für funktionsfähige KI ist der Kölner Übersetzungsservice DeepL. Er ist im Moment für einige Sprachkombinationen der beste, KI gestützte Übersetzer im Internet. Andere Anwendungen haben eher Demonstrationscharakter und zeigen auf unterhaltsame Weise, zu welchen Leistungen KI fähig ist.

Die Apps widmen sich dabei einem Generalthema: der Bilderkennung und -bearbeitung. Das hat seinen Grund, denn diese beiden Anwendungsgebiete gehörten zu den ersten für neuronale Netze und Deep Learning. Entsprechend sind sie weit fortgeschritten. Darüber hinaus eignet sich KI-Bildverarbeitung gut zur Demonstration der Möglichkeiten von künstlichen neuronalen Netzen.

Bilder in Sekundenschnelle verschlagworten

https://www.eyeem.com/eyeem-vision#form

Die Verschlagwort um von Bildmaterial durch menschliche Mitarbeiter ist sehr langsam und aufwendig. KI kann es inzwischen genauso gut. Ein Eindruck davon gibt es auf der Webseite des Bilderdienstes Eyeem. Dort findet sich ein erstaunlich präzise arbeitender Bildbeschreiber, der Fotos mit Stichworten („Tags“) und einer kleinen Beschreibungszeile ausstattet. Jeder kann hier Fotos hochladen und die Anwendung auf die Probe stellen.

Bildbeschreibungen in einem Satz

https://deepai.org/machine-learning-model/neuraltalk

Diese kleine Demo erlaubt die Angabe einer Bilder-URL oder das Hochladen eines Fotos und gibt anschließend eine Bildbeschreibung aus. Es ist übrigens ein interessantes Experiment, ein und dasselbe Bild von NeuralTalk und Eyeem beschreiben zu lassen. Es wird deutlich, dass NeuralTalk nach dem Anfangstraining nicht mehr wesentlich weiterentwickelt wurde, es gibt vergleichsweise häufig falsch beschriebene Bilder. Der kommerzielle Bildbeschreiber von EyeEm dagegen arbeitet deutlich besser als NeuralTalk. Da die Fotografen der Bilder angehalten sind, die automatisch generierten Schlagworte und Bildunterschriften zu verbessern, Hat das neuronale Netz im Laufe der Jahre sehr viel dazugelernt.

Perfekte Bilder für jeden

https://www.autodraw.com/

AutoDraw Ist ein kleines Vektor-Zeichenprogramm, das mithilfe von künstlicher Intelligenz Skizzen in perfekte Zeichnungen umwandeln kann. Ein simples Beispiel: Wer einen Smiley kritzelt, bekommt ihn zur Auswahl angeboten und kann einen perfekten Smiley aus seinen Krakeleien machen. Für viele andere Objekte gibt es sogar eine recht große Auswahl von vorgefertigten Zeichnungen. So kann beispielsweise aus einem sehr grob gekritzelten Auto eine Limousine, ein Pick-up oder ein Rennwagen gemacht werden. Für Perfektionierung der Zeichnung gibt es übrigens einige typische Zeichenwerkzeuge und eine Möglichkeit, das Ergebnis als PNG-Datei herunterzuladen.

Bildbearbeitung, Deep Learning Style

https://deepai.org/machine-learning-model/CNNMRF

Diese kleine KI-Anwendung erzeugt aus zwei Fotos oder Grafiken ein neues Bild, in dem sich der Inhalt des ersten mit dem Stil des zweiten mischt. Ein Beispiel zum Verständnis: Das erste Bild zeigt das Foto eines Pferdes, das zweite eine impressionistisch gemalte Landschaft. Das von dem Neuronetz erzeugtem Bild zeigt nun ein impressionistisch gemaltes Pferd, das Stil und Farbgebung des zweiten Bildes übernimmt. Das erzeugte Bild kann heruntergeladen werden.

Bildretusche mit Neuronetz

https://www.nvidia.com/research/inpainting/

Nicht jedes Foto ist gelungen, manche enthalten unerwünschte Motive. Doch mit der Nvidia-Demo kann ein neuronales Netzwerk einsetzen, um diese Elemente im Bild zu retuschieren.  Der zu retuschieren Bereich wird mit einer weißen Maske übermalt und das neuronale Netzwerk ergänzt die freien Stellen durch die Umgebung Informationen. Das klappt mal mehr, mal weniger gut, aber oft sind die Ergebnisse besser als mit den typischen Photoshop-Werkzeugen.

Malen nach Worten

https://blogs.nvidia.com/

Leider noch nicht für den Test verfügbar ist GauGAN, eine Zeichen-App, die fotorealistischen Landschaften erzeugen kann. Dabei werden mit unterschiedlichen Linien und Flächen die Bereiche für Objekte wie Pflanzen, Steinen, Wasser oder Berge markiert. Das GAN der App erzeugt daraus ein entsprechendes landschaftliches Element. Trainiert worden ist das Netzwerk mit einer Million Landschaft Fotos von Flickr. Die App achtet bei der Gestaltung der Landschaften auf logische Zusammenhänge, so soll sie beispielsweise korrekte Schatten oder Spiegelungen erzeugen, wenn dies notwendig ist.

Diese Person gibt es hier nicht

https://thispersondoesnotexist.com/

Die Website erzeugt bei jeder Aktualisierung das vollständig künstliche Porträt einer Person. Grundlage ist ein so genanntes GAN (Generative Adverserial Network), dass realistisch wirkende Fotos erzeugen kann. Es besteht aus zwei miteinander verbundenen Neuronetzen. Das erste ist der Generator, das zweite bewertet die erzeugten Bilder. Dafür ist es mit Millionen Porträtfotos trainiert worden und kann nun Bilder auswählen, die das Porträt eines Menschen zeigen. Über diese Bewertungsfunktion wird das erste Netz trainiert, sodass es immer bessere und realistischere Porträts erzeugt. Das Erstaunliche daran: Bei verblüffend vielen Porträts gibt es kein „Uncanny Valley“. Das Ganze funktioniert übrigens auch mit Katzen, Startup-Websites und Wohnungsanzeigen.

Bildquelle: Getty Images

©2019Alle Rechte bei MEDIENHAUS Verlag GmbH

Unsere Website verwendet Cookies, um Ihnen den bestmöglichen Service zu bieten. Durch die weitere Nutzung der Seite stimmen Sie der Verwendung zu. Weitere Infos finden Sie in unserer Datenschutzerklärung.

ok