Automatische Fragebeantwortung für Suchmaschinen
Angela Maennel
26th April 2021
Was in Veröffentlichungen zum maschinellen Lernen als Open-Domain Question Answering bezeichnet wird, ist nichts anderes als die Beantwortung einer Frage auf der Grundlage einer großen Textsammlung, z. B. die Beantwortung der Frage eines Besuchers einer großen Website unter Verwendung des Inhalts der Website. Aufgrund der jüngsten Fortschritte im Bereich des maschinellen Leseverstehens haben sich Open-Domain Question Answering-Systeme drastisch verbessert. Früher verließen sie sich auf die Redundanz von Informationen, aber jetzt sind sie in der Lage, sorgfältiger zu "lesen". Moderne Systeme sind in der Lage, einen Textabschnitt zu zitieren, der die Frage beantwortet, oder sie sogar neu zu formulieren. Was noch angestrebt wird, ist die Generierung längerer, absatzlanger Antworten oder die Verwendung mehrerer Quellen, um eine Antwort zusammenzustellen. Google hat kürzlich eine solche Funktion in seine Suchmaschine implementiert. Wenn sie eine Passage finden, die die in das Suchfeld getippte Frage beantwortet, zeigt das erste Ergebnis die entsprechende Website mit der hervorgehobenen Passage. Es gibt viele verschiedene Systeme, die sich mit Open-Domain Question Answering befassen, hier werde ich auf ein System im Besonderen eingehen, DrQA (von Chen et al. 2017 ). Dieses spezielle System teilt die Aufgabe in zwei Teile auf, für die es jeweils einfacher ist, Trainingsdaten zu erhalten als für die kombinierte Aufgabe. Ich werde auch erklären, wie diese Idee verwendet werden kann, um ein Fragebeantwortungssystem für eine Website aus einer bereits vorhandenen Suchfunktion zu erstellen.