Rechtliche Überprüfung von Mietverträgen


Mit Hilfe verschiedener Methoden aus dem Bereich NLP entdeckt unsere Software Fehler in Mietverträgen.

Input

Scan oder Foto eines Mietvertrags

Output

Wirksamkeit der Schönheitsreparaturklausel

Ziel

Automatisieren des Überprüfungsprozesses auf leicht verständliche, erklärbare Weise


Einführung


Unser Auftraggeber ist ein Online-Mieterschutzclub, der seinen Kunden die rechtliche Überprüfung ihrer Mietverträge durch erfahrene Partneranwälte anbietet. Ziel des Projekts ist es, ein intelligentes Software-Tool zu entwickeln, das die Anwälte bei der Analyse der Verträge unterstützt.

Konkret geht es dabei um die automatische Auswertung sogenannter "Schönheitsreparaturklauseln", die den Mieter zur regelmäßigen Renovierung verpflichten sollen. Oft sind sie fehlerhaft formuliert und daher unwirksam. Die Kenntnis der Unwirksamkeit erspart dem Mieter in der Regel viel Zeit und Geld. Das Software-Tool soll die Wirksamkeit der Klausel automatisch einschätzen und im Fall der erkannten Unwirksamkeit auch den Grund dafür samt der einschlägigen Textstellen angeben.


Startpunkt


Unser Auftraggeber, MieterEngel, ist ein Online-Mieterschutzclub, der seinen Kunden die rechtliche Überprüfung ihrer Mietverträge durch erfahrene Partneranwälte anbietet. Ziel des Projekts ist es, ein intelligentes Software-Tool zu entwickeln, das die Anwälte bei der Analyse der Verträge unterstützt.

Bisher war der Prozess sehr personalintensiv. Die Kunden wenden sich mit Fotos ihres Mietvertrags an den Mieterschutzclub. Das Serviceteam von MieterEngel überprüft diese auf Lesbarkeit. Sind sie leserlich, werden sie an Partneranwälte weitergeleitet. Diese müssen den gesamten Vertrag genau lesen, um ein auf die Kundenfragen zugeschnittenes Gutachten zu erstellen.

Insgesamt ist der Prozess...

  • langsamer (separate Prüfung der Lesbarkeit durch Serviceteam)

  • teurer (Einsatz der Partneranwälte für Aufgaben, die kaum juristische Expertise benötigen)

  • und fehleranfälliger (Übersehen relevanter Bestimmungen)

...als es sein müsste.


Herausforderungen


Ziel des Projektes war die Entwicklung eines Software-Tools, das repetitive Arbeitsabläufe automatisiert und es dem Anwalt sowie Service-Team erlaubt, sich auf ihre Kompetenzbereiche zu konzentrieren. Dabei bot sich der Einsatz künstlicher Intelligenz, d.h. selbstlernender Algorithmen an.

Zunächst waren jedoch eine Reihe von offenen Fragen zu beantworten, darunter die folgenden:

  • Umfang: Welche Bereiche lassen sich vorteilhaft automatisieren und wo muss oder soll stattdessen auf die Expertise der Anwälte zurückgegriffen werden? Wie lassen sich beide Sphären optimal verzahnen?

  • Transparenz: Ein “Blackbox”-Algorithmus, der auf undurchsichtige Weise zu seinen Einschätzungen gelangt, würde bei den Anwälten als Nutzern nicht auf Akzeptanz stoßen. Wie können wir den Entscheidungsablauf der KI so transparent präsentieren, dass er für die Nutzer nachvollziehbar ist?

  • Rechtslage: Die vom Algorithmus abzubildende Rechtslage ist keinesfalls eindeutig. Wie kann die Software widersprechende Urteile zu Präzedenzfällen und differierende Rechtsauffassungen berücksichtigen?


Lösung


Flowchart der kompletten Pipeline

Im Laufe des Projekts haben wir eine Software entwickelt, welche von der Bewertung der Aufnahmequalität bis zur Entscheidung über die Zulässigkeit vertraglicher Regelungen alle Arbeitsschritte vollständig automatisiert. Die Resultate der einzelnen Schritte werden dem Nutzer so aufbereitet, dass er die Entscheidungsfindung nachvollziehen und sie bei Bedarf anpassen kann.

Die Umsetzung erfolgte in einem agilen Projektrahmen (MVP nach 6 Monaten, kontinuierliches Anwender-Feedback). Gemeinsam mit der IT-Abteilung des Kunden setzten wir die Lösung als Web-Applikation um, was diverse Vorteile mit sich bringt:

  • schneller Roll-out von Verbesserungen

  • unbegrenztes Hinzufügen von Nutzern,

  • Unabhängigkeit vom Betriebssystem, etc.

Im Video können Sie einen Eindruck des Workflows gewinnen.


Technischer Hintergrund


Zentrales Element des Services unseres Auftraggebers ist eine Online-Plattform, auf der Kunden ihre digitalisierten Dokumente hochladen und Partneranwälte sie anschließend abrufen können.

Die Plattform erlaubt es dem Anwalt, die Anfragen vollständig im Frontend zu bearbeiten, d.h. Mietverträge zu lesen, Gutachten zu formulieren und mit Kunden zu kommunizieren.

Die Plattform ist prinzipiell um zusätzliche Module erweiterbar, welche die bisherigen Prozesse optimieren oder sogar automatisieren.

Hintergrund: Beschreibung des bisherigen Prozesses

Um die Überprüfung eines Kundenmietvertrages in die Wege leiten zu können, benötigt der Auftraggeber zunächst Scans oder Fotos des Dokuments. Sie werden vom Serviceteam des Auftraggebers auf ihre Lesbarkeit geprüft und im positiven Fall einem Partneranwalt zur Verfügung gestellt. Sind sie nicht leserlich, erhält der Kunde eine Nachricht mit Bitte um Verbesserung der Aufnahmequalität.

Der Anwalt untersucht den Vertrag auf einschlägige Informationen und Formulierungen. Da Mietverträge im Allgemeinen keinem vorgegebenen Schema folgen, sondern ihr Aufbau stark voneinander abweichen kann, muss der Anwalt den gesamten Vertrag genau lesen. Beispielsweise befinden sich die für die Renovierungspflicht relevanten Vertragsbestimmungen oft über die ganze Länge des Vertrages verteilt. Der Arbeitsaufwand für den Anwalt ist also relativ hoch, selbst wenn seine juristische Expertise effektiv nur für die Bewertung einiger weniger relevanter Sätze erforderlich ist. Zudem übersehen auch erfahrene Mietrechtsexperten gelegentlich einzelne Vertragsbestimmungen.

Um den Kunden über das Ergebnis seiner Überprüfung zu informieren, erstellt der Partneranwalt ein Gutachten. Da sich Anfragen sowie Erläuterungen wiederholen, bietet sich der Einsatz von Textbausteinen an, die jedoch manuell vom Anwalt ausgewählt und eingefügt werden müssen.

Herausforderungen

Zur Verfügung stehender Input: Scan oder Fotografie des Mietvertrags als PDF-Datei.

Gewünschter Output: Begründete und belegte Einschätzung der Wirksamkeit der Schönheitsreparaturklausel.

Technisch mussten wir dabei u.a. den folgenden Herausforderungen begegnen:

  • Zu Beginn des Projekts verfügten wir nur über ungelabelte Daten. Für qualitativ hochwertige Annotationen müssten wir neben Data Scientists auch Mietrechtsexperten einbinden.

  • Uns standen nur wenige hundert Mietverträge für Trainingszwecke zur Verfügung. Gleichzeitig sollten die Algorithmen relativ komplexe Muster erlernen.

  • Unter den PDF-Dokumenten befanden sich viel mit dem Smartphone aufgenommene Fotografien schlechter Qualität. Viele Mietverträge wiesen handschriftliche Zusätze auf. Die Software sollte aber auch unter diesen Umständen funktionieren.

Unsere Lösung

Eingesetzte Technologien

Backend: Python, TensorFlow, Keras, spaCy, NLTK, scikit-learn, Flask

Infrastructure: GCloud (Training and Google Cloud Vision), Docker, brat rapid annotation tool

Wir präsentieren im Folgenden Lösungen einiger ausgesuchter Teilprobleme.

1. Annotation der Verträge

Um Supervised Learning-Algorithmen anwenden zu können, entwickelten wir ein Annotationsschema, das alle für die Entscheidung der Wirksamkeit relevanten Informationen systematisch umfasst. Das Schema wurde iterativ in gemeinsamen Workshops von dida mit ausgesuchten Mietrechtsexperten entwickelt und kontinuierlich evaluiert. Es wurde Wert darauf gelegt, dass die durch Struktur der Annotationen festgelegten Beziehungen der Vertragsbestandteile möglichst der üblichen Anwaltslogik entsprechen.

Screenshot des Brat Annotation Tools

2. Entscheidungsprozess

Auf Grundlage des entwickelten Annotationsschema ließ sich der Entscheidungsprozess in zwei Schritte unterteilen: Erstens eine Klassifikation der den Vertragstext ausmachenden Sätze, welche die Ermittlung der juristischen Struktur des Vertragstextes zum Ergebnis hat. Die Ergebnisse der Klassifikation lassen sich leicht im Vertragstext darstellen (z.B. durch farbliche Hervorhebung) und damit vom Nutzer überprüfen. Daran schließt zweitens eine regelgeleitete (und sofern vollkommen transparente sowie individuell je nach Rechtsauffassung modifizierbare) Auswertung jener Informationen an.

Die Informationstiefe der Klassifikationsergebnisse erlaubt zudem automatisierte Vorschläge von Textbausteinen für das Antwortschreiben des Anwalts, sodass dieser im Idealfall die Vorschläge des Algorithmus nur überprüfen und bestätigen muss.

3. ML Architektur

Für die Textklassifikation bieten sich Recurrent neural networks (RNNs) an. Nach einigen Experimenten mit verschiedenen Modellarchtikturen entschieden wir uns für ein Bi-LSTM (bidirectional Long short-term memory), das den alternativen Ansätzen überlegen war. Aufgrund der kleinen Datengrundlage nutzten wir vortrainierte Worteinbettungen. Außerdem ergänzten wir das Modell um den attention mechanism, der laut aktueller Forschungsergebnisse die Leistung von RNNs deutlich erhöht. Dies hat sich im vorliegenden Fall bestätigt.

Ein Bi-LSTM mit Attention. Die Eingaben xi sind die Wörter eines Satzes.

Genauere Informationen stellen wir Ihnen gerne in einem persönlichen Gespräch vor.

Ähnliche Projekte