dida Logo

Natural Language Processing

In den letzten Jahren gab es enorme Weiterentwicklungen im Bereich des maschinellen Lernens. Mittlerweile kann jedes Muster in einem Bild, welches von einem Menschen erkannt wird, auch von einer Maschine erkannt werden. Manchmal können Maschinen sogar Strukturen erkennen, die ein Mensch nicht erkennt.

Kriterien, um NLP-Projekte zu entdecken

Kriterien, um attraktive Prozess­automati­sierungs­projekte zu finden, in denen Textverständnis zentral ist:

Der Prozess kostet aktuell viel Geld und/oder eine schnellere Bearbeitungszeit bringt deutliche Mehrwerte

Ein (dafür ausgebildeter) Mensch könnte eine gute Entscheidung auf Basis der Inhalte des Textes treffen

Es gibt genügend Daten (Grobe Daumenregel: 500 - 10.000 Dokumente. Die genaue Anzahl hängt selbstverständlich maßgeblich vom Anwendungsfall ab.)

In den letzten Jahren gab es große Fortschritte in Bezug auf die Qualität, mit der Muster in unstrukturierten Daten erkannt werden können. Dies ist neben Hardware-Verbesserungen insbesondere einer Gruppe von Algorithmen zu verdanken, die als neuronale Netze oder als Deep-Learning bezeichnet werden. Das Besondere an diesen Ansätzen ist, dass die Regeln zur Mustererkennung nicht explizit von einem Menschen vorgegeben werden, sondern durch das Netzwerk “von selbst” gelernt werden. Theoretisch ist es so möglich, implizit Millionen von Regeln zu erstellen, die am Ende dazu führen, dass auch komplizierte Muster erkannt werden können. Wir erleben immer wieder, dass nur durch die Kombination aus Kenntnissen über die internen Prozesse mit Expertise im Bereich Natural Language Processing sinnvolle Projekte erkannt und strukturiert werden können. Fragen Sie uns gerne möglichst früh, ob wir eine Prozessautomatisierung für Ihren Anwendungsfall als technisch machbar einschätzen.

Kriterien um Computer Vision-Projekte zu entdecken

1. Prozess­analyse

Gemeinsam evaluieren wir Ihre Automatisierungs-Projekte anhand von drei Kriterien: Einsparpotentiale, strategische Wertschöpfung and technische Machbarkeit. Sobald wir uns für ein konkretes Projekt entschieden haben, legen wir großen Wert auf die Integration der späteren Anwender der Software.

2. Innovative Lösungen

Unser Team verfügt über langjährige Erfahrung im Bereich der künstlichen Intelligenz. Unsere Algorithmen finden komplizierte Muster in unstrukturierten Daten (z.B. Bilder oder Texte). Diese Mustererkennung bildet die Basis für die Automatisierung des zugrundeliegenden Prozesses.

3. Zuverlässige Software

Großen Wert legen wir auf die Integration unserer Kunden in unsere Code Repositories sowie in wöchentliche Projektmeetings. Agilität, sauberer Code und eine modulare Programmstruktur helfen uns, einfach zu wartende Software zu liefern, die funktioniert.

Projekte in Natural Language Processing

Alle Projekte zeigen

Rechtliche Überprüfung von Mietverträgen

Different methods from the field of NLP helped us to create a software that spots errors in legal contracts

Semantische Suche für die öffentliche Verwaltung

dida entwickelte einen KI-basierten Algorithmus zur Extraktion relevanter Informationen aus Behördendokumenten

Automatische Überprüfung von Nebenkosten­abrechnungen

Extraktion numerischer Attribute aus Produktbeschreibungen

Automatisches Extrahieren von numerischen Attributen aus Produktbeschreibungen, um die bestehende Datenbank anzureichern.

Informationen aus Kundenanfragen extrahieren

In this project we created a model that when given a free form vet appointment reason can extract symptoms, diseases and requested services. This data can then be used by our client to improve scheduling and preparation.

Blog Posts in Natural Language Processing

Alle Blog Posts zeigen
Einführendes

Empfehlungssysteme - Ein Überblick

By Konrad Mundinger 29. August 2022

In diesem Blogbeitrag gebe ich einen Überblick über die Grundkonzepte, Anwendungen und Grenzen von Empfehlungssystemen. Unter anderem werde ich auf inhaltsbasierte und kollaborative Filterung eingehen.

Computer Vision

Image Captioning mit Attention-Mechanismus

By Madina Kasymova 30. Mai 2022

In diesem Artikel untersuchen wir, wie eine Pipeline zur Erzeugung von Bildunterschriften funktioniert. Insbesondere betrachten wir den Attention-Mechanismus - ein vielversprechender Ansatz für die Bildbeschriftung.

Natural Language Processing

OpenAI Codex: Warum die Revolution noch ausbleibt

By Fabian Gringel 18. Februar 2022

In diesem Blogbeitrag erkläre ich, wie Codex von OpenAI funktioniert, und insbesondere, wie es sich von GPT-3 unterscheidet. Ich werde begründen, warum ich denke, dass Codex mit Vorsicht verwendet werden sollte und noch nicht bereit ist, den Softwareentwicklungsprozess zu revolutionieren.

Einführendes

Ethik im Natural Language Processing

By Dr. Marty Oelschläger 20. Dezember 2021

Ich erkläre, warum Sprachmodelle dazu neigen, Stereotypen und Vorurteile mit potenziell schädlichen Folgen zu reproduzieren - und wie man sie mit der gebotenen Vorsicht einsetzt.

Natural Language Processing

GPT-3 und darüber hinaus - Teil 2: Schwächen und Gegenmittel

By Fabian Gringel 24. Oktober 2021

Hier erkläre ich, in welchen Situationen GPT-3 noch scheitert, welche Ansätze helfen können, diese Probleme zu entschärfen und vielleicht zum nächsten Durchbruch führen und welche Alternativen zu GPT-3 es bereits gibt.

Computer Vision

Datenzentriertes maschinelles Lernen: Maßgeschneiderte ML-Lösungen zur Produktionsreife bringen

By David Berscheid 6. Oktober 2021

In diesem Artikel werden wir sehen, warum viele ML-Projekte es nicht in die Produktion schaffen, die Konzepte von modell- und datenzentriertem ML vorstellen und Beispiele geben, wie wir bei dida Projekte durch den Einsatz datenzentrierter Techniken verbessern.

Natural Language Processing

GPT-3 und darüber hinaus - Teil 1: Das Grundrezept

By Fabian Gringel 27. September 2021

In diesem Blogartikel erkläre ich, wie GPT-3 funktioniert, warum manche Leute es für gefährlich halten und wie Sie selbst ein GPT-3-ähnliches Modell kostenlos ausprobieren können.

Computer Vision

CLIP: Wie sich der Schatz ungelabelter Bilddaten heben lässt

By Fabian Gringel 21. Juni 2021

Contrastive Language-Image Pretraining (kurz: CLIP) nutzt Bildunterschriften, um einen Zero-Shot-Bildklassifikator zu trainieren. In diesem Blogartikel gebe ich einen groben, nicht-technischen Überblick über die Funktionsweise von CLIP und zeige auch, wie Sie CLIP selbst ausprobieren können!

Use Cases in Natural Language Processing

Alle Use Cases zeigen

Webinare in Natural Language Processing

Alle Webinare zeigen