© unsplash/@campaign_creators

© unsplash/@campaign_creators
Einzelhandel, E-Commerce & Marktplätze

Extraktion und Standardisierung von Produkt­merkmalen

Hintergrund

Kunden auf E-Commerce-Websites suchen auf der Grundlage bestimmter Merkmale nach Produkten, z.B. Blue Jeans oder Kamerapixel in Smartphones. Die Möglichkeit, das richtige Produkt zu filtern und schnell zu finden, kann ein wichtiges Unterscheidungsmerkmal auf dem Markt sein, das Käufe und Konversionen für E-Tailer und Marktplätze vorantreibt.

Herausforderungen

Die Informationen über die Funktionen sind verfügbar, können aber auf verschiedene Eingabequellen verteilt und in verschiedenen Formaten verfügbar sein. Beispielsweise möchte ein Modehändler in der Lage sein, nach Material, dominanter Farbe und Kleidungsstück zu filtern. Modemarken und E-Tailer, die ihre Produkte auf Plattformen wie dem Amazon Marketplace vermarkten, bieten jedoch unterschiedliche Informationen über Produkte an, manchmal sogar über die gleichen Produkte. Diese Informationen müssen so vereinheitlicht werden, dass die Informationen durchsuchbar sind und die Nutzer nach einer festgelegten Terminologie innerhalb einer Website filtern können.

Lösungsansatz

Ungefähre String-/Mustervergleichs-Algorithmen haben in der Vergangenheit bei ähnlichen Aufgaben gute Ergebnisse geliefert. Die Merkmale oder Attribute können handgefertigt oder automatisch erstellt werden, um regelbasierte Ansätze für den Abgleich ähnlicher Elemente und deren entsprechende Kategorisierung bereitzustellen. Dieser Ansatz könnte in Fällen funktionieren, in denen die Beschreibungen relativ ähnlich, aber nicht kontextabhängig sind. Wenn der Kontext (z.B. Produktkategorie) die Semantik der Beschreibung ändert, sind tiefe neuronale Netze wie CNNs oder RNNs Alternativen, einschließlich Worteinbettungen wie BERT.

Diese Webinare könnten Sie interessieren

Texterkennung (OCR) - Der erste Schritt auf dem Weg zu einer erfolgreichen Implementierung eines NLP-Projekts

In diesem Webinar wenden wir uns dem Thema Texterkennung zu.

Ewelina Fiebig

Machine Learning Scientist

Fabian Gringel

Machine Learning Scientist

Labeling-Tools - Der zweite Schritt auf dem Weg zur erfolgreichen Umsetzung eines NLP-Projekts

Der Erfolg eines NLP-Projekts besteht aus einer Reihe von Schritten von der Datenvorbereitung bis zur Modellierung und Bereitstellung. Da es sich bei den Eingabedaten häufig um gescannte Dokumente handelt, werden bei der Datenaufbereitung zunächst Texterkennungswerkzeuge (kurz OCR) und später auch sogenannte Labeling-Tools eingesetzt. In diesem Webinar werden wir uns mit dem Thema der Auswahl eines geeigneten Kennzeichnungswerkzeugs befassen.

Ewelina Fiebig

Machine Learning Scientist

Fabian Gringel

Machine Learning Scientist

Semantische Suche und Verstehen von natürlichem Text mit Neuronalen Netzen: BERT

In diesem Webinar erhalten Sie eine Einführung in die Anwendung von BERT für die semantische Suche anhand einer realen Fallstudie: Jedes Jahr interagieren Millionen von Bürgern mit Behörden und werden regelmäßig von der dort verwendeten Fachsprache überwältigt. Wir haben das BERT erfolgreich eingesetzt, um mit Hilfe von umgangssprachlichen Abfragen aus Regierungsdokumenten die richtige Antwort zu liefern - ohne dabei Fachbegriffe in den Abfragen verwenden zu müssen.

Konrad Schultka

Machine Learning Scientist

Jona Welsch

Machine Learning Scientist

Rekurrente neuronale Netze: Wie Computer lesen lernen

Das Webinar gibt eine Einführung in die Funktionsweise von RNNs und veranschaulicht deren Einsatz an einem Beispielprojekt aus dem Bereich der Legal Tech

Fabian Gringel

Machine Learning Scientist