Stellen Sie sich vor, dass Sie aus einer Vielzahl von Dokumenten, z.B. Verträgen oder Formularen, bestimmte Inhalte extrahieren möchten (ein Datum, eine Rechnungsnummer, die Anzahl der bestellten Produkte, etc.). Eine solche Aufgabe ist ein perfekter Anwendungsfall für Natural Language Processing (kurz NLP).
Der Erfolg eines NLP-Projekts besteht aus einer Reihe von Schritten von der Datenvorbereitung über die Modellierung bis zum Deployment. Da die Inputdaten oft gescannte Dokumente sind, umfasst der Schritt der Datenvorbereitung zunächst den Einsatz von Tools zur Texterkennung (kurz OCR) sowie später auch die Verwendung von so genannten Labeling-Tools.
In einer Reihe von 3 Webinaren erläutern wir diese Schritte im Detail, geben einige Tipps zur Auswahl geeigneter Tools für bestimmte Problemstellungen und präsentieren ein konkretes Anwendungsbeispiel.
Webinar 2: Labeling-Tools
In diesem Beitrag werden wir uns mit dem Thema der Auswahl eines geeigneten Labeling-Tools befassen. Dabei werden wir auf die folgenden Aspekte eingehen:
- Was bedeutet Labeling und was kann gelabelt werden?
- Warum ist Labeling überhaupt nötig?
- Herausforderungen bei der Wahl eines geeigneten Tools.
- Unsere Tipps, was vor und bei der Auswahl eines Tools wichtig zu beachten ist.
- Kurze Präsentation ausgewählter Tools.
- Andere erwähnenswerte Tools.