Unsere Lösung: Temporal Attention
Unser Ansatz für dieses Problem basiert auf der Tatsache, dass verschiedene Pflanzenarten zu bestimmten Zeitpunkten ihrer Entwicklung spezifische Spektren reflektieren. Wir verwenden ein tiefes neuronales Netzwerk, das auf temporal attention basiert, um diese Zeitpunkte zu finden (attention ist einer der Mechanismen, die hauptsächlich für den Erfolg der berühmten Transformer-Architektur verantwortlich ist). Sogenannte pixel set encodings ermöglichen es die enorme Menge an Informationen, die in multispektralen Bildzeitreihen enthalten sind, auf effiziente Weise zu nutzen, ähnlich der Arbeit von Garnot et al.
Diese Netzwerkarchitektur ist in der Lage, zeitliche Änderungen des Reflektanz einzelner Pflanzenarten zu erfassen. Sie wird weiter verbessert, zum Beispiel durch die Einbeziehung von (wolkenunabhängigen) Radardaten von Sentinel 1, um Zeitreihen mit stabilen Intervallen zwischen den Bildern zu erhalten.
Verwendete Technologien
Backend: Python, PyTorch, NumPy, geopandas, rasterio, gdal, shapely, pyproj, mgrs
Infrastruktur: GCloud (Training), Git, dvc, tensorboard
Herausforderungen
Wie bei jeder Lösung, die auf optische Satellitendaten zurückgreift, ist die Wolkenbedeckung eine der größten Herausforderungen, die es zu bewältigen gilt. Dies führt zu einer Verringerung der verwendbaren Bilder für eine bestimmte Region und weiter zu einem Ungleichgewicht der verfügbaren Daten zwischen den Jahreszeiten: Wärmere Jahreszeiten haben in der Regel einen klareren Himmel. Somit sind mehr Datenpunkte nutzbar, da die Satelliten in der Lage sind mehr wolkenfreie Bilder aufzunehmen.
Eine weitere Herausforderung ist die Tatsache, dass es sich bei den Datensätzen um Zeitreihen von Bildern mit mehreren Kanälen pro Zeitpunkt handelt, was den Trainingsprozess speicherintensiv macht und intelligente Strategien zur Datenaggregation erfordert.
Da die Satelliten jeweils nur ein begrenztes Gebiet erfassen können, sind die Daten an verschiedenen Orten zeitlich unterschiedlich verfügbar, d. h. die zeitlichen Abfolgen der Datenpunkte für verschiedene Gebiete sind unterschiedlich groß und unterschiedlich lang.