Mit Machine Learning die Umwelt schützen


Edit Szügyi


Maschinelles Lernen löst schon seit Jahrzehnten komplexe Probleme. Man denke nur daran, wie Methoden des maschinellen Sehens lebensbedrohliche Krankheiten zuverlässig vorhersagen können, wie selbstfahrende Autos auf dem Weg sind, die Verkehrssicherheit zu revolutionieren, oder wie die automatische Übersetzung uns in die Lage versetzt, mit fast jedem Menschen auf der Welt zu sprechen. Die Möglichkeiten des maschinellen Lernens sind in vielen Bereichen der Industrie und Wissenschaft angekommen.

Es gibt jedoch einige Bereiche, in denen das Potenzial des maschinellen Lernens schwerer zu erkennen ist und auch weniger genutzt wird. Einer dieser Bereiche ist der Umweltschutz. Der Schutz der Natur ist eine der größten Herausforderungen unserer Generation, die mit drängenden Problemen wie Klimawandel, Plastikverschmutzung oder Ressourcenverknappung konfrontiert ist. Sehen wir uns nun an, wie maschinelles Lernen als Werkzeug im Umweltschutz eingesetzt wurde und werden kann.


Die Technologie ist bereits vorhanden


Daten finden sich überall um uns herum. Neue Technologien und Geräte können große Mengen an Daten sammeln - man denke nur an Satellitenbilder. Diese Art von Daten bietet einen großen Einblick nicht nur in die Gegenwart, sondern auch in die mögliche Zukunft. Es ist jedoch nicht nur unpraktisch, sondern oft auch nicht machbar, menschliche Experten mit der kontinuierlichen Überwachung eines globalen oder sogar lokalen Live-Feeds von Bildmaterial zu beauftragen.

An dieser Stelle kommt das maschinelle Lernen ins Spiel. Im Gegensatz zu Menschen sind Computer und insbesondere Modelle des maschinellen Lernens hervorragend in der Lage, große Datenmengen zu sichten und, was noch wichtiger ist, einen Sinn in diesen Daten zu finden, indem sie Muster erkennen. Dieses Verständnis kann uns dann helfen, bessere Entscheidungen zu treffen.

Die Technologie, die erfolgreichen Methoden des maschinellen Lernens zugrunde liegt, basiert auf jahrzehntelanger Forschung und realen Anwendungen und ist daher ausgereift und zuverlässig. Mit der richtigen Feinabstimmung auf umweltrelevante Datensätze können diese Methoden weitreichende Ergebnisse erzielen. Ein Modell des maschinellen Lernens, das Tumore in medizinischen Bildern erkennt, ist nur ein paar Anpassungen davon entfernt, auf Satellitenbildern eingesetzt zu werden. Ein Modell, das Aktienkurse genau vorhersagt, kann so angepasst werden, dass es Vorhersagen über die Wasser- oder Luftqualität macht.


Anwendungen


Vorhersagen treffen

Die Standardaufgabe des maschinellen Lernens ist das Treffen von Vorhersagen. Wenn wir ein Modell mit Trainingsdaten füttern, gehen wir davon aus, dass die Verteilung der Trainingsdaten repräsentativ für die Daten im Allgemeinen ist. Mit dieser Annahme kann das Modell vorhersagen, wie die Daten zu einem zukünftigen Zeitpunkt oder an einem anderen Ort aussehen werden, der in den Trainingsdaten selbst nicht vorhanden ist.

Die akademische Forschung hat bewiesen, dass fortschrittliche Deep-Learning-Methoden in der Lage sind, die Auswirkungen von sich ändernden Wettermustern und anderen komplexen Faktoren auf die Ernteerträge vorherzusagen, was für die Bewältigung von Problemen wie der Ernährungsunsicherheit von entscheidender Bedeutung sein könnte. Durch die Vorhersage des künftigen Angebots und der Nachfrage in einem Geschäftsbereich können Überproduktionen reduziert werden, was zu weniger Abfall und einer (kosten-)effizienteren Lieferkette führt.

Kenianische Wissenschaftler haben ein Warnsystem entwickelt, das die örtlichen Landwirte anhand von Werten für Bodenfeuchtigkeit, Wind, Luftfeuchtigkeit, Oberflächentemperaturen und Vegetationsindex zwei bis drei Monate vor der eigentlichen Invasion vor Heuschreckeninvasionen warnen kann, so dass sie genügend Zeit haben, sich vorzubereiten und wertvolle Ressourcen zu sparen.

Semantische Segmentierung

 A photograph of a crosswalk next to the result of semantically segmenting the image.

Maschinelles Lernen, genauer gesagt Methoden des maschinellen Sehens, können verwendet werden, um semantische Objekte zu erkennen und sie von ihrem Hintergrundbild zu trennen, indem für jedes Pixel in einem Bild entschieden wird, ob es zu einer bestimmten Kategorie gehört oder nicht.

Wir bei dida haben ein Instrument zum Aufspüren illegaler Minen entwickelt. Diese Minen gefährden die natürlichen Landschaften, und der erste Schritt, damit die lokalen Behörden dagegen vorgehen können, besteht darin, ihre Standorte herauszufinden. Das ist keine leichte Aufgabe, denn die zu überwachenden Gebiete sind riesig. Mit Hilfe unseres automatischen Überwachungssystems können sich die zuständigen Behörden in Guyana, Peru und Surinam nun rechtzeitig über die Lage und das Ausmaß der illegalen Minen informieren.

Erkennung von Anomalien

 Photo of a forest fire

Wenn wir ein Modell des maschinellen Lernens mit Daten füttern, lernt es, was auf der Grundlage dieser Daten normal und erwartet ist. Ausgestattet mit diesen Informationen kann es dann feststellen, welche Ereignisse in neuen, bisher ungesehenen Daten unwahrscheinlich sind, da sie vom Trend abweichen. Dies ist die Standardmethode zur Verhinderung von Kreditkartenbetrug im FinTech-Bereich, aber auch die Umweltwissenschaften können in vielerlei Hinsicht von der Anomalieerkennung profitieren.

Eine Erfolgsgeschichte aus der Praxis ist ein Softwareprodukt, das auf der gleichen Technologie basiert, das durch die Erkennung von Waldbränden innerhalb von Minuten nach deren Ausbruch Land und Menschenleben rettet.

Clustering

Wie bereits in der Einleitung erwähnt, sind Daten überall vorhanden. Dies gilt jedoch vor allem für nicht gelabelte Daten, was die Weiterentwicklung unüberwachter ML-Methoden wie das Clustering sehr wichtig macht. T-distributed stochastic neighbor embeddings (t-SNE) werden verwendet, um komplexe, mehrdimensionale Daten in einem 2- oder 3-dimensionalen Raum darzustellen, in dem Menschen Cluster erkennen können.

Als Anwendungsbeispiel wurde diese Methode verwendet, um effizientere Stromnetze zu schaffen, indem Haushalte geclustert und dadurch ihre spezifischen Nachfragekategorien identifiziert wurden.

Identifizierung wichtiger Merkmale

 Photograph of a smoking factory chimney

Die Natur liefert uns eine Menge äußerst komplexer Datensätze, ein Beispiel dafür sind Daten zur Luftqualität. Es gibt eine große Anzahl von Faktoren, die für die Luftqualität eine entscheidende Rolle spielen. Wenn das Ziel darin besteht, die Luftverschmutzung zu verringern, ist es wichtig, die wichtigsten dieser Faktoren zu identifizieren. Mit einer geeigneten Aufgabe können wir ein Modell für maschinelles Lernen auf die Luftqualitätsdaten trainieren. Sobald es gute Vorhersagen auf den Trainingsdaten trifft, können wir davon ausgehen, dass es die Faktoren gelernt hat, die tatsächlich relevant sind, um Verallgemeinerungen über die Daten zu machen, so dass wir uns dann der Beobachtung des Modells selbst zuwenden können.

Wenn wir uns die Luftverschmutzungsdaten ansehen und den Latent Space untersuchen (eine mathematische Darstellung der Merkmalswerte, die das Modell für maschinelles Lernen aus seinen Trainingsdaten lernt), lernen wir, welche der vielen Merkmale die wichtigsten sind, und mit diesem Wissen können wir Einfluss nehmen, indem wir versuchen, eine begrenzte Anzahl von Faktoren zu ändern.

Synthese

Maschinelles Lernen kann Wissenschaftlern auch bei der Entdeckung neuer Materialien und Chemikalien helfen. Ein großes Problem, bei dem die Synthese durch maschinelles Lernen helfen kann, ist die Entwicklung neuer Materialien, die anstelle von Plastik verwendet werden können, um den Plastikmüll zu reduzieren.

Beim Experimentieren mit biologisch abbaubaren Polymermaterialien werden Modelle des maschinellen Lernens auf Daten über Polymereigenschaften trainiert, um vielversprechende hypothetische Polymere zu identifizieren. Generative Modelle wie Variational Autoencoders oder Generative Adversarial Networks (GANs) können auf bestehende Materialien trainiert werden, um dann über ihre Decoder neue hypothetische Materialien zu erzeugen, die dann durch chemische Experimente validiert werden müssen.


Ausblick


Umweltexperten sind sich einig, dass Methoden des maschinellen Lernens leistungsstarke Werkzeuge für die Bewältigung von Umweltproblemen sind, und die Zahl der akademischen Arbeiten zu diesem Thema hat in den letzten zehn Jahren erheblich zugenommen. Es gibt wichtige Initiativen, die zur Zusammenarbeit aufrufen, wie die Climate Change AI, die durch diesen Forschungsartikel, an dem einige der besten Experten für maschinelles Lernen mitgewirkt haben, ins Leben gerufen wurde. Anwendungen im wirklichen Leben sind jedoch schwieriger zu finden. Dies ist nicht unerwartet, da die Umsetzung akademischer Studien in die Produktion im Allgemeinen ein eher langsamer Prozess ist und das Interesse an Werkzeugen des maschinellen Lernens in Umweltstudien relativ neu ist.

Wenn man über maschinelles Lernen und die Umwelt spricht, muss man auch die andere Seite der Medaille berücksichtigen, zum Beispiel die enorme Menge an Kohlenstoffemissionen, die durch die Ausführung komplexer Modelle verursacht wird. Auch andere allgemeine Aspekte des maschinellen Lernens müssen berücksichtigt werden. Manchmal fehlt es an historischen oder globalen Daten oder die Interpretierbarkeit der Modelle ist fraglich. Auch wenn wir uns dieser Nachteile bewusst sein müssen, sollten sie niemanden davon abhalten, Methoden des maschinellen Lernens einzusetzen. Verschiedene Modelle des maschinellen Lernens eignen sich hervorragend für unterschiedliche Aufgaben, und zu einem erfolgreichen Projekt gehört es, bei der Auswahl oder Implementierung einer Lösung alle Anforderungen und Herausforderungen zu berücksichtigen. So sind beispielsweise nicht alle Modelle Blackboxes, und es gibt ein ganzes Forschungsfeld der interpretierbaren KI, das sich damit befasst, das menschliche Verständnis der von Machine Learning-Algorithmen getroffenen Entscheidungen zu erleichtern.


Schlussfolgerung


Um ein so gravierendes Problem wie den Niedergang unserer natürlichen Umwelt in Angriff zu nehmen, brauchen wir alle verfügbaren Kräfte. In diesem Beitrag haben wir eine kleine, aber bunte Auswahl von Machine-Learning-Projekten vorgestellt, die entweder bereits Teil der Lösung sind oder hervorragende Forschungsergebnisse aufweisen und bereit sind, in die Praxis umgesetzt zu werden. Indem wir die Ideen nach den gemeinsamen Aufgaben des maschinellen Lernens unterteilen, die sie beinhalten, zeigen wir, dass wir die Probleme, die im Umweltschutz auftreten, auf ähnliche Weise lösen können wie Probleme in jedem anderen Bereich. Das bedeutet, dass die Technologie zur Lösung dieser Probleme erprobt ist und dass Machine-Learning-Modelle mit dem richtigen Fachwissen tatsächlich zum Schutz der natürlichen Umwelt beitragen können.