Öffentliche Dienste mit Machine Learning automatisieren

Hintergrund

Die öffentliche Verwaltung in Deutschland leidet unter einem Mangel an jungen Talenten. Nach einer McKinsey-Studie wird sich dieser Mangel bis 2030 auf 731.000 Beschäftigte belaufen. Gleichzeitig werden Behörden in ihren Arbeitsabläufen oft als altmodisch angesehen. Durch die Digitalisierung der öffentlichen Dienste könnten Kosten gespart, Wartezeiten verkürzt und ein zufriedenstellendes Serviceniveau auch bei einer reduzierten Anzahl von Mitarbeitern aufrechterhalten werden. Eine Hürde, die es zu überwinden gilt, ist der Verwaltungsjargon, der für die Bürger oft nicht intuitiv ist.

Herausforderungen

Die Automatisierung öffentlicher und staatlicher Dienste erfordert eine Benutzeroberfläche, auf der die Benutzer ihre Bedürfnisse abfragen können und der Dienst alle damit verbundenen relevanten Informationen bereitstellt. Dies kann recht anspruchsvoll sein, da die Benutzeranfragen informelle Formulierungen der Kundenbedürfnisse enthalten, die sich stark vom Verwaltungsjargon unterscheiden können. Daher muss der automatisierte Dienst die Bedeutung der Anfragen verstehen und sie in Verwaltungsjargon übersetzen.

Beispielsweise erfordert die Registrierung eines Unternehmens einen Branchencode. Die offizielle Beschreibung dieses Branchencodes kann dabei sehr anders lauten, als der Geschäftszweck, den ein Nutzer im Freitext formuliert. Wenn ein Benutzer zum Beispiel einen Schönheitssalon registrieren möchte, könnte er/sie "Ich lackiere Nägel" eingeben und sollte den richtigen Geschäftscode für Schönheitssalons finden. Dies ist besonders dann eine Herausforderung, wenn ein Geschäftscode eine Reihe sehr unterschiedlicher Dienstleistungen umfasst.

Zum Beispiel umfasst der Geschäftscode "Verschiedene andere Dienstleistungen" sowohl Piercing-Studios als auch das Facility Management. Herkömmliche, auf Schlüsselwörtern basierende Ansätze sind daher nicht erfolgversprechend, um gute Ergebnisse zu erzielen.

Lösungsansatz

Die Absicht der Benutzeranfragen kann durch ein Modell erkannt werden, das auf dem von Google entwickelten BERT-Modell (Bidirectional Encoder Representations from Transformers) basiert. Der Hauptvorteil des BERT-Modells besteht darin, dass es in der Lage ist, semantisch ähnliche Wörter und Ausdrücke unter Berücksichtigung ihres Kontextes zu erkennen. Es weiß beispielsweise, dass ein "Auto" in diesem Kontext auch ein "Kraftfahrzeug" ist.

Das Basismodell wird dann für den spezifischen Kontext weiter spezialisiert, indem es auf problemspezifisch gekennzeichneten Daten trainiert wird. In diesem Fall sind das vergangene Nutzereingaben, die manuell dem korrekten Branchencode zugeordnet werden.

Mehr Use Cases in Regierung & Öffentlicher Sektor

Analyse von Städtewachstum und Stadtveränderungen

Automatisierte öffentliche Dienste

Kulturpflanzenklassifikation für die EU-Subventionskontrolle (GAP)