Zentrales Element des Services unseres Auftraggebers ist eine Online-Plattform, auf der Kunden ihre digitalisierten Dokumente hochladen und Partneranwälte sie anschließend abrufen können.
Die Plattform erlaubt es dem Anwalt, die Anfragen vollständig im Frontend zu bearbeiten, d.h. Mietverträge zu lesen, Gutachten zu formulieren und mit Kunden zu kommunizieren.
Die Plattform ist prinzipiell um zusätzliche Module erweiterbar, welche die bisherigen Prozesse optimieren oder sogar automatisieren.
Hintergrund: Beschreibung des bisherigen Prozesses
Um die Überprüfung eines Kundenmietvertrages in die Wege leiten zu können, benötigt der Auftraggeber zunächst Scans oder Fotos des Dokuments. Sie werden vom Serviceteam des Auftraggebers auf ihre Lesbarkeit geprüft und im positiven Fall einem Partneranwalt zur Verfügung gestellt. Sind sie nicht leserlich, erhält der Kunde eine Nachricht mit Bitte um Verbesserung der Aufnahmequalität.
Der Anwalt untersucht den Vertrag auf einschlägige Informationen und Formulierungen. Da Mietverträge im Allgemeinen keinem vorgegebenen Schema folgen, sondern ihr Aufbau stark voneinander abweichen kann, muss der Anwalt den gesamten Vertrag genau lesen. Beispielsweise befinden sich die für die Renovierungspflicht relevanten Vertragsbestimmungen oft über die ganze Länge des Vertrages verteilt. Der Arbeitsaufwand für den Anwalt ist also relativ hoch, selbst wenn seine juristische Expertise effektiv nur für die Bewertung einiger weniger relevanter Sätze erforderlich ist. Zudem übersehen auch erfahrene Mietrechtsexperten gelegentlich einzelne Vertragsbestimmungen.
Um den Kunden über das Ergebnis seiner Überprüfung zu informieren, erstellt der Partneranwalt ein Gutachten. Da sich Anfragen sowie Erläuterungen wiederholen, bietet sich der Einsatz von Textbausteinen an, die jedoch manuell vom Anwalt ausgewählt und eingefügt werden müssen.
Herausforderungen
Zur Verfügung stehender Input: Scan oder Fotografie des Mietvertrags als PDF-Datei.
Gewünschter Output: Begründete und belegte Einschätzung der Wirksamkeit der Schönheitsreparaturklausel.
Technisch mussten wir dabei u.a. den folgenden Herausforderungen begegnen:
Zu Beginn des Projekts verfügten wir nur über ungelabelte Daten. Für qualitativ hochwertige Annotationen müssten wir neben Data Scientists auch Mietrechtsexperten einbinden.
Uns standen nur wenige hundert Mietverträge für Trainingszwecke zur Verfügung. Gleichzeitig sollten die Algorithmen relativ komplexe Muster erlernen.
Unter den PDF-Dokumenten befanden sich viel mit dem Smartphone aufgenommene Fotografien schlechter Qualität. Viele Mietverträge wiesen handschriftliche Zusätze auf. Die Software sollte aber auch unter diesen Umständen funktionieren.
Unsere Lösung
Eingesetzte Technologien
Backend: Python, TensorFlow, Keras, spaCy, NLTK, scikit-learn, Flask
Infrastructure: GCloud (Training and Google Cloud Vision), Docker, brat rapid annotation tool
Wir präsentieren im Folgenden Lösungen einiger ausgesuchter Teilprobleme.
1. Annotation der Verträge
Um Supervised Learning-Algorithmen anwenden zu können, entwickelten wir ein Annotationsschema, das alle für die Entscheidung der Wirksamkeit relevanten Informationen systematisch umfasst. Das Schema wurde iterativ in gemeinsamen Workshops von dida mit ausgesuchten Mietrechtsexperten entwickelt und kontinuierlich evaluiert. Es wurde Wert darauf gelegt, dass die durch Struktur der Annotationen festgelegten Beziehungen der Vertragsbestandteile möglichst der üblichen Anwaltslogik entsprechen.