Natural Language Processing

In diesem Themengebiet geht es darum Muster in unstrukturierten Texten zu finden (im Gegensatz zu bereits strukturierten Informationen in einer Datenbank oder Excel-Tabelle). Ein unstrukturierte Text ist z.B. eine Email, ein PDF- oder Word-Dokument. Der Begriff “natural language” betont, dass es sich um Dokumente handelt, welche von Menschen für Menschen geschrieben wurde.

1

Prozess

2

Algorithmus

3

Entscheidung

In den letzten Jahren gab es große Fortschritte in Bezug auf die Qualität mit der Muster in unstrukturierte Daten erkannt werden können. Dies ist neben Hardware-Verbesserungen insbesondere einer Gruppe von Algorithmen zu verdanken, welche als neuronal Netze oder als Deep-Learning bezeichnet werden. Das Besondere an diesen Ansätzen ist, dass die Regeln zur Mustererkennung nicht explizit von einem Menschen vorgegeben werden, sondern durch das Netzwerk “von selbst” gelernt werden. Theoretisch ist es so möglich implizit Millionen von Regeln zu erstellen, welche am Ende dazu führen, dass auch komplizierte Muster erkannt werden können.

Kriterien, um attraktive Prozess-Automatisierungsprojekte zu finden, in denen Textverständnis zentral ist:

  • Der Prozess kostet aktuell viel Geld und/oder eine schnellere Bearbeitungszeit bringt deutliche Mehrwerte
  • Ein (dafür ausgebildeter) Mensch könnte eine gute Entscheidung auf Basis der Inhalte des Textes treffen
  • Es gibt genügend Daten (Grobe Daumenregel: 500 - 10.000 Dokumente. Die genaue Anzahl hängt selbstverständlich maßgeblich vom Anwendungsfall ab.)

Wir erleben immer wieder, dass nur durch die Kombination aus Kenntnissen über die internen Prozessen mit Expertise im Bereich Natural Language Processing sinnvolle Projekte erkannt und strukturiert werden können. Fragen Sie uns gerne möglichst früh, ob wir eine Prozessautomatisierung für ihren Anwendungsfall als technisch machbar einschätzen.

Use Cases in Natural Language Processing

Handschriftliche Dokumente können durch Machine-Learning-Algorithmen ausgelesen und vorausgefüllt werden. Durch weitere Eingaben können diese Dokumente noch einmal editiert werden, wovon die Genauigkeit des Algorithmus noch mal profitiert.

Elektronische Patientenakten können mittels Machine Learning Algorithmen ausgewertet werden. Dadurch erhalten Ärzte automatisch Vorschläge für Diagnosen und Therapiemöglichkeiten.

Customer-Service-Agenten geben Informationen zu Beschwerden oder Reklamationen in Freitextfelder ein. Daraus geclusterte Informationen können in die Optimierung von Geschäftsprozessen einfließen.

Durch Spracheingabe und Machine Learning Algorithmen lassen sich Standarddokumente klassifizieren und automatisch ausfüllen. Dieses Dokument kann im Nachhinein kontrolliert und editiert werden.

Mit Machine Learning Algorithmen können auf Grundlage historischer Verträge Standardklauseln und Abweichungen von dem Standard festgelegt und identifiziert werden. Dadurch können Abweichungen hervorgehoben und die Verträge anhand vorher festgelegter Kriterien identifiziert und kategorisiert werden.


Erfahren Sie, was dida für Sie tun kann