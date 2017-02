Bei Machine Learning geht es nicht darum, dass die Beispiele auswendig gelernt würden. Vielmehr werden Muster aus den Daten erkannt und Programmverhalten daran angepasst. Machine-Learning-Algorithmen werden hauptsächlich unterteilt in sogenanntes „überwachtes“ (engl. „assisted“) Lernen und „unüberwachtes“ („unassisted“) Lernen.

Der Unterschied hierbei besteht in der Art, wie das System lernt: Bei überwachten Algorithmen sind bereits Ergebnisse bekannt, aus denen das System lernen kann. Das System lernt dann anhand der gegebenen Daten Eingaben entsprechend des trainierten Lösungsraumes zu klassifizieren. Unüberwachte Algorithmen hingegen bauen anhand der Eingaben selbständig ein Modell auf, das versucht, die Eingaben so genau wie möglich vorherzusagen. Hierbei werden Klassifikationen nicht vorgegeben, sondern selbständig vom System, etwa durch sogenannte Clustering-Algorithmen, erarbeitet.

Vereinfacht gesagt unterstützt Machine Learning die Entwickler dabei, historische Daten zu nutzen, um bessere Entscheidungen zu treffen. ML-Algorithmen entdecken Muster in den Daten und konstruieren mathematische Modelle, die diese Erkenntnisse beschreiben. Solche Modelle können eingesetzt werden, um Vorhersagen im Kontext von zukünftigen Daten zu treffen. Ein Beispiel für die Anwendung eines Machine-Learning-Modells ist eine Prognose für die Wahrscheinlichkeit, mit der ein Kunde ein bestimmtes Produkt basierend auf seinem bisherigen Verhalten kauft.

Entwickler müssen sich im Vorfeld klar werden, was sie klassifizieren und vorhersagen wollen. Dafür sollten sie möglichst viele Daten sammeln, ohne jedoch selber Annahmen vorweg zu nehmen, was relevant und was nicht relevant ist: Sonst könnte ein Modell entstehen, das zwar das bestehende Datenmaterial gut erkennen kann, sich bei neuen Daten aber nicht so verhält, dass daraus brauchbare Vorhersagen abgeleitet werden können (Overfitting). Um dies zu vermeiden gehört zum Lernprozess immer auch ein Validierungsprozess, bei dem ein Teil der bekannten Daten nicht zum Lernen benutzt wird, sondern zum realistischen Testen des Modells herangezogen wird.

Künstliche Intelligenz geht noch weiter