Für die erste Herausforderung trainierten wir ein neuronales Netz in zwei Schritten:
Im ersten Schritt erfolgte das Training mit einem sehr großen, öffentlich zugänglichen Bilddatensatz aus dem Internet.
Im zweiten Schritt wurde das Modell verfeinert durch ein Training mit Bildern von freiwilligen Testpersonen, die mit dem Zielkamerasystem aufgenommen wurde.
Das trainierte neuronale Netz hat dadurch selbständig gelernt, welche Merkmale wichtig sind, um die Ähnlichkeit von Gesichtern zu bestimmen. Es kann jetzt auch mit Gesichtern umgehen, die es vorher noch nicht gesehen hat. Für ein neues Unternehmen, das die Gesichtserkennung einsetzen möchte, muss das neuronale Netz also nicht neu trainiert werden. Es reicht aus, mit dem Kamerasystem Bilder von zugangsberechtigten Personen aufzunehmen und in der Datenbank zu hinterlegen. Wenn sie dann vor der Tür stehen, wird das System sie erkennen.
Die zweite Herausforderung, das Verhindern von unerlaubtem Zugang durch Vorzeigen von Fotos von autorisierten Personen, wurde mittels klassischer Computer-Vision-Methoden gelöst. Dabei wird ausgenutzt, dass das Gesicht einer Person von jeweils zwei Kameras aufgenommen wird, die aus unterschiedlichen Blickwinkeln auf das Gesicht schauen. Vereinfacht gesagt funktioniert diese Methode, indem man die Abstände zwischen bestimmten Punkten im Gesicht misst. Aus den Unterschieden zwischen den beiden Bildern kann man feststellen, ob es sich um ein echtes, also dreidimensionales Gesicht handelt oder um ein flaches Foto von einer Person.