NLP

In diesem Themengebiet geht es darum, Muster in unstrukturierten Texten zu finden (im Gegensatz zu bereits strukturierten Informationen in einer Datenbank oder Excel-Tabelle). Ein unstrukturierter Text ist z.B. eine Email, ein PDF- oder Word-Dokument. Der Begriff “natural language processing” (NLP) betont, dass Dokumente verarbeitet werden, die von Menschen für Menschen geschrieben wurde.

Kriterien, um NLP-Projekte zu entdecken

Kriterien, um attraktive Prozess­automati­sierungs­projekte zu finden, in denen Textverständnis zentral ist:

Der Prozess kostet aktuell viel Geld und/oder eine schnellere Bearbeitungszeit bringt deutliche Mehrwerte

Ein (dafür ausgebildeter) Mensch könnte eine gute Entscheidung auf Basis der Inhalte des Textes treffen

Es gibt genügend Daten (Grobe Daumenregel: 500 - 10.000 Dokumente. Die genaue Anzahl hängt selbstverständlich maßgeblich vom Anwendungsfall ab.)

In den letzten Jahren gab es große Fortschritte in Bezug auf die Qualität, mit der Muster in unstrukturierten Daten erkannt werden können. Dies ist neben Hardware-Verbesserungen insbesondere einer Gruppe von Algorithmen zu verdanken, die als neuronale Netze oder als Deep-Learning bezeichnet werden. Das Besondere an diesen Ansätzen ist, dass die Regeln zur Mustererkennung nicht explizit von einem Menschen vorgegeben werden, sondern durch das Netzwerk “von selbst” gelernt werden. Theoretisch ist es so möglich, implizit Millionen von Regeln zu erstellen, die am Ende dazu führen, dass auch komplizierte Muster erkannt werden können. Wir erleben immer wieder, dass nur durch die Kombination aus Kenntnissen über die internen Prozesse mit Expertise im Bereich Natural Language Processing sinnvolle Projekte erkannt und strukturiert werden können. Fragen Sie uns gerne möglichst früh, ob wir eine Prozessautomatisierung für Ihren Anwendungsfall als technisch machbar einschätzen.

Prozess

1. Prozess­analyse

Gemeinsam evaluieren wir Ihre Automatisierungs-Projekte anhand von drei Kriterien: Einsparpotentiale, strategische Wertschöpfung and technische Machbarkeit. Sobald wir uns für ein konkretes Projekt entschieden haben, legen wir großen Wert auf die Integration der späteren Anwender der Software.

2. Innovative Lösungen

Unser Team verfügt über langjährige Erfahrung im Bereich der künstlichen Intelligenz. Unsere Algorithmen finden komplizierte Muster in unstrukturierten Daten (z.B. Bilder oder Texte). Diese Mustererkennung bildet die Basis für die Automatisierung des zugrundeliegenden Prozesses.

3. Zuverlässige Software

Großen Wert legen wir auf die Integration unserer Kunden in unsere Code Repositories sowie in wöchentliche Projektmeetings. Agilität, sauberer Code und eine modulare Programmstruktur helfen uns, einfach zu wartende Software zu liefern, die funktioniert.

Case Studies in NLP

Natural Language Processing

Rechtliche Überprüfung von Mietverträgen

Mit Hilfe verschiedener Methoden aus dem Bereich NLP entdeckt diese Software Fehler in Verträgen.
Unsere Lösung
Natural Language Processing

Semantische Suche für die öffentliche Verwaltung

dida entwickelte einen KI-basierten Algorithmus zur Extraktion relevanter Informationen aus Behördendokumenten.
Unsere Lösung