Confused CEO looking through candidate CVs
Automatische Fragenbeantwortung zu Lebensläufen von Bewerbern
Hintergrund
Besonders in großen Unternehmen ist die Zahl der eingehenden Bewerbungen sehr hoch. Da nicht alle Bewerber geeignet sind, kann es sehr zeitaufwendig sein, die am besten geeigneten Kandidaten über die Rekrutierungsdatenbank zu suchen. Dies führt zu langsamen Antwortzeiten für Kandidaten, die den Kriterien der Unternehmen entsprechen.
Herausforderungen
Es wird ein Machine-Learning-Modell benötigt, das in der Lage ist, vordefinierte Fragen auf der Basis von Lebenslaufdokumenten oder -anhängen automatisch zu beantworten. Das können zum Beispiel Fragen nach dem Schulabschluss, Studienfach oder Berufserfahrung sein. Die große Herausforderung für ein solches Modell besteht darin, die Fragen und Informationen aus dem Lebenslauf zu abstrahieren und semantische Beziehungen und Abhängigkeiten zu erkennen, um die entsprechenden Kandidaten zu finden. Dazu wird ein Trainingsdatensatz benötigt, das aus einer Vielzahl an Bewerbungen besteht, in denen die relevanten Informationen markiert ('gelabelt') wurden.
Lösungsansatz
Die automatische Auswertung eingehender Lebensläufen von Kandidaten benötigt ein leistungsstarkes ML-Modell. Beispielsweise ein Modell, das auf der von Google entwickelten BERT-Methode (Bidirectional Encoder Representations from Transformers) basiert. Der Hauptvorteil eines BERT-Modells besteht darin, dass es in der Lage ist, semantisch ähnliche Wörter und Ausdrücke unter Berücksichtigung ihres Kontexts zu erkennen. So weiß es zum Beispiel, dass 'Lehre' und 'Ausbildung' im Kontext einer Bewerbung prinzipiell das Gleiche bedeuten. Das vortrainierte BERT-Basismodell, das ein Grundverständnis der jeweiligen Sprache (z.B. Deutsch) hat, benötigt eine Anpassung auf das spezielle Problem. Dafür wird das Modell auf dem Trainingsdatensatz mit den markierten Bewerbungen trainiert.