Der Prozess beginnt damit, dem Algorithmus einen Trainingsdatensatz zur Verfügung zu stellen, der Beispiele sowohl von Eingaben als auch von korrekten Ausgaben enthält. Das Modell analysiert diese Daten und lernt die Zuordnungsfunktion zwischen den Eingabemerkmale und den Ausgabelabels. Dies ermöglicht es dem Modell, genaue Vorhersagen zu treffen, wenn es auf neue Daten trifft. Zum Beispiel hilft ein gelabelter Datensatz mit verschiedenen Dächern und ihren entsprechenden Labels dem Algorithmus, charakteristische Merkmale jeder Dachform zu erkennen.
Sobald das Modell trainiert und validiert wurde, kann es verwendet werden, um Vorhersagen über unbekannte Daten zu treffen, basierend auf dem Wissen, das es erlangt hat. Wenn das Modell weiterhin aus den Daten lernt, verfeinert es seine Genauigkeit und minimiert Fehler. Im Folgenden ist ein typischer Graph dargestellt, bei dem der Fehler (genauer gesagt der Verlust) abnimmt, je mehr ein Modell trainiert wird, bis es ein Niveau erreicht, auf dem weiteres Training nicht mehr zu besseren Fähigkeiten führen würde.