Die Fernerkundung (Analyse von Satelliten- oder Luftbildern) ist aufgrund der großen Menge an verfügbaren Daten eine großartige Deep Learning-Anwendung. ESAs Archiv an Sentinel-Bildern enthält z.B. ~10PB, was ungefähr 7000 Mal der Größe von ImageNet entspricht!
Leider gibt es hier einen kleinen Haken: Labels für Fernerkundungsbilder sind oft extrem schwierig zu erstellen. Bei unserem Projekt zur Erfassung konvektiver Wolken beispielsweise waren in vielen Fällen Expertenwissen und die Verwendung von externen Radardaten erforderlich, um das Labeling durchzuführen.
Eine Möglichkeit, die enorme Menge an ungelabelten Daten zu nutzen, besteht darin, ein Modell auf eine Pretraining-Aufgabe zu trainieren, für die wir leicht Labels generieren können. Hoffentlich kann unser neuronales Netzwerk dadurch Features lernen, die auch für die Hauptaufgabe, an der wir interessiert sind, nützlich sind. Dieser Ansatz wird auch als Transfer-Lernen bezeichnet.