Fake products
Identifizierung von Fakeprodukten
Hintergrund
Der Verkauf von gefälschten Produkten kann die Verkäufer-Käufer-Beziehung erheblich schädigen und möglicherweise zu langen Gerichtsverfahren führen, die hohe Kosten und Verluste verursachen. Dieses Problem tritt besonders auf großen Marktplätzen wie dem Amazon Marketplace auf. Die manuelle Identifizierung gefälschter Produkte könnte diese Probleme verhindern, ist aber oft nicht durchführbar oder erfordert viel gut ausgebildetes Personal, da viele gefälschte Produkte nur schwer als "gefälscht" zu identifizieren sind.
Herausforderungen
Um ein Machine Learning (ML) Modell zu trainieren, benötigt das Modell einen ausreichend großen Trainingsdatensatz, in dem Produkte als "Fälschungen" gekennzeichnet und idealerweise Merkmale von gefälschten Produkten identifiziert und erkannt werden. Dies kann eine schwierige Aufgabe sein, da das Labeln von gefälschten Produkten sehr kompetentes Personal erfordert und möglicherweise nicht für jedes Produkt möglich ist.
Außerdem könnten Einzelhändler zögern, die Daten an externe Firmen weiterzugeben, da die Menge der gefälschten Produkte das Problem der gefälschten Produkte auf ihrer Plattform sehr transparent machen würde. Außerdem passen sich die Hersteller von gefälschten Produkten schnell an, sobald sie entdeckt werden, und ändern ihre Taktik und ihr Marketing.
Lösungsansatz
Die Automatisierung der Identifizierung gefälschter Produkte kann durch die Implementierung eines ML-Modells erfolgen, das gefälschte Produkte auf der Grundlage der Erkennung von Mustern in Bildern, wie z.B. Produktionsmerkmalen oder falschen Markenetiketten, identifiziert. Die Identifizierung von gefälschten Produkten basiert auf der Klassifizierung von Bildern anhand spezifischer inhärenter Merkmale des Produkts.
Für solche Bildsegmentierungs- und Klassifikationsaufgaben werden Convolutional Neural Networks (CNN) verwendet, wie z.B. U-Net- oder Mask R-CNN-Architekturen. Diese sind in der Lage, verschiedene Objekte in den Bildern zu erkennen, wie z.B. Markenetiketten, und können deren spezifische Eigenschaften, wie z.B. die Naht, die auf eine Fälschung hinweisen können, extrahieren.
Zusätzlich zum CNN kann ein Generative Adversarial Network (GAN) verwendet werden, das Daten auf der Grundlage von Echtdaten generiert, um dem Mangel an Trainingsdaten von gefälschten Produkten Rechnung zu tragen. Die Verwendung eines GAN reduziert auch den erforderlichen Trainingsaufwand.