Natural Language Processing

In diesem Themengebiet geht es darum Muster in unstrukturierten Texten zu finden (im Gegensatz zu bereits strukturierten Informationen in einer Datenbank oder Excel-Tabelle). Ein unstrukturierte Text ist z.B. eine Email, ein PDF- oder Word-Dokument. Der Begriff “natural language” betont, dass es sich um Dokumente handelt, welche von Menschen für Menschen geschrieben wurde.
1

Prozess

2

Algorithmus

3

Entscheidung

In den letzten Jahren gab es große Fortschritte in Bezug auf die Qualität mit der Muster in unstrukturierte Daten erkannt werden können. Dies ist neben Hardware-Verbesserungen insbesondere einer Gruppe von Algorithmen zu verdanken, welche als neuronal Netze oder als Deep-Learning bezeichnet werden. Das Besondere an diesen Ansätzen ist, dass die Regeln zur Mustererkennung nicht explizit von einem Menschen vorgegeben werden, sondern durch das Netzwerk “von selbst” gelernt werden. Theoretisch ist es so möglich implizit Millionen von Regeln zu erstellen, welche am Ende dazu führen, dass auch komplizierte Muster erkannt werden können.

Kriterien, um attraktive Prozess-Automatisierungsprojekte zu finden, in denen Textverständnis zentral ist:

  • Der Prozess kostet aktuell viel Geld und/oder eine schnellere Bearbeitungszeit bringt deutliche Mehrwerte
  • Ein (dafür ausgebildeter) Mensch könnte eine gute Entscheidung auf Basis der Inhalte des Textes treffen
  • Es gibt genügend Daten (Grobe Daumenregel: 500 - 10.000 Dokumente. Die genaue Anzahl hängt selbstverständlich maßgeblich vom Anwendungsfall ab.)

Wir erleben immer wieder, dass nur durch die Kombination aus Kenntnissen über die internen Prozessen mit Expertise im Bereich Natural Language Processing sinnvolle Projekte erkannt und strukturiert werden können. Fragen Sie uns gerne möglichst früh, ob wir eine Prozessautomatisierung für ihren Anwendungsfall als technisch machbar einschätzen.

Use Cases in NLP

Analyse von hand­geschriebenen Anträgen

Handschriftliche Dokumente können durch Machine-Learning-Algorithmen ausgelesen und vorausgefüllt...

Auslesen von Patientenakten

Elektronische Patientenakten können mittels Machine Learning Algorithmen ausgewertet werden....

Automatische Kategorisierung von Dokumenten

Unternehmen, die mit Tausenden von Kunden und Lieferanten zusammenarbeiten, müssen ihre Dokumente...

Datenextraktion aus Mietverträgen

Mietverträge sind oft sehr komplex und haben Dutzende von Seiten. Für einige Aufgaben, wie z.B....

Datenextraktion aus Rechnungen

Unternehmen erhalten täglich Dutzende von Rechnungen. Die Bearbeitung von Rechnungen und die...

Freitextanalyse im Customer Service

Customer-Service-Agenten geben Informationen zu Beschwerden oder Reklamationen in Freitextfelder...

Generierung von Standarddokumenten

Durch Spracheingabe und Machine Learning Algorithmen lassen sich Standarddokumente klassifizieren...

Informationsextraktion aus Bauplänen

Baupläne sind komplex und beinhalten eine große Menge an relevanten Daten. Diese Informationen...

Showing all entries.