Man that does product extraction on laptop
Extraktion und Standardisierung von Produktmerkmalen
Hintergrund
Kunden auf E-Commerce-Websites suchen auf der Grundlage bestimmter Merkmale nach Produkten, z.B. Blue Jeans oder Kamerapixel in Smartphones. Die Möglichkeit, das richtige Produkt zu filtern und schnell zu finden, kann ein wichtiges Unterscheidungsmerkmal auf dem Markt sein, das Käufe und Konversionen für E-Tailer und Marktplätze vorantreibt.
Herausforderungen
Die Informationen über die Funktionen sind verfügbar, können aber auf verschiedene Eingabequellen verteilt und in verschiedenen Formaten verfügbar sein. Beispielsweise möchte ein Modehändler in der Lage sein, nach Material, dominanter Farbe und Kleidungsstück zu filtern. Modemarken und E-Tailer, die ihre Produkte auf Plattformen wie dem Amazon Marketplace vermarkten, bieten jedoch unterschiedliche Informationen über Produkte an, manchmal sogar über die gleichen Produkte. Diese Informationen müssen so vereinheitlicht werden, dass die Informationen durchsuchbar sind und die Nutzer nach einer festgelegten Terminologie innerhalb einer Website filtern können.
Lösungsansatz
Ungefähre String-/Mustervergleichs-Algorithmen haben in der Vergangenheit bei ähnlichen Aufgaben gute Ergebnisse geliefert. Die Merkmale oder Attribute können handgefertigt oder automatisch erstellt werden, um regelbasierte Ansätze für den Abgleich ähnlicher Elemente und deren entsprechende Kategorisierung bereitzustellen. Dieser Ansatz könnte in Fällen funktionieren, in denen die Beschreibungen relativ ähnlich, aber nicht kontextabhängig sind. Wenn der Kontext (z.B. Produktkategorie) die Semantik der Beschreibung ändert, sind tiefe neuronale Netze wie CNNs oder RNNs Alternativen, einschließlich Worteinbettungen wie BERT.