aviary - ein generisches Python-Framework zur KI-Inferenz für Fernerkundungsdaten
26.03.2025 , HS3 (S1)

aviary ist ein generisches Python-Framework, das die Inferenz von KI-Modellen für Fernerkundungsdaten vereinfacht.
Es bietet verschiedene Pipelines mit austauschbaren, erweiterbaren Komponenten. Neben der Nutzung als Python-Package können vorgefertigte Pipelines über die Kommandozeile verwendet werden.
Künftig sollen vortrainierte Modelle für diverse Anwendungsfälle sowie
speziell auf Fernerkundungsdaten trainierte Foundation-Modelle bereitgestellt werden.


Wir, das geospaitial lab der Westfälischen Hochschule, sind ein Forschungsteam für Künstliche Intelligenz und kommunale Geoinformationen und haben in den letzten Jahren verschiedene Auftragsforschungen und Förderprojekte im Bereich automatisierter Auswertung von Mobile-Mapping-Daten und Luftbildern umgesetzt.
Darunter war eine Auftragsforschung des Kreises Recklinghausen, in der versiegelte Flächen aus Luftbildern abgeleitet werden sollten. Dazu wurde ein KI-Modell trainiert und eine entsprechende Software (adois) entwickelt, mit der sich die KI-Inferenz ausführen lässt.

Bei adois handelt es sich jedoch um eine prototypische Implementierung, die beispielsweise nur die Einbindung von Luftbildern über einen Web Map Service erlaubt und nicht als generische Lösung konzipiert wurde.
Als der Regionalverband Ruhr uns daraufhin beauftragt hat, adois auch mit lokalen Daten anwendbar zu machen, haben wir uns daher entschieden, die Software neu zu konzipieren und zu entwickeln.

Daraus ist aviary entstanden - ein neues Framework, das uns und anderen Forscher:innen und Anwender:innen in der Geoinformatik die Nutzung von KI-Modellen erleichtern soll - schließlich wollen wir uns aufs Forschen, Entwickeln und Trainieren konzentrieren.

Die Inferenz von KI-Modellen hat verschiedenste Anforderungen, folgt jedoch stets einem ähnlichen Ablauf:

  • Definition des Prozessierungsbereichs: Welcher Bereich soll ausgewertet werden?
  • Definition der Eingangsdaten: Woher kommen die Eingangsdaten? Liegen sie lokal vor, werden sie über einen Web Service abgerufen oder sind sie in der Cloud?
  • Definition der Vorverarbeitung der Eingangsdaten: Wie werden die Eingangsdaten vorverarbeitet?
  • Definition des KI-Modells: Welches KI-Modell soll verwendet werden?
  • Definition des Exports: Wohin werden die Ergebnisse exportiert? Werden sie lokal gespeichert oder in die Cloud hochgeladen?

aviary abstrahiert diese Schritte und bietet Pipelines, die aus verschiedenen Komponenten bestehen.
Diese Komponenten sind austausch- und erweiterbar, sodass Anwender:innen eigene Pipelines bauen und bei Bedarf Funktionalitäten hinzufügen können.
Dabei ist aviary so konzipiert, dass es möglichst effizient und skalierbar ist. Die Pipelines können beispielsweise auf einem lokalen Rechner oder je nach Bedarf in der Cloud ausgeführt werden.

Neben der Möglichkeit, aviary als Python-Package zu nutzen, können Anwender:innen auch vorgefertigte Pipelines über die Kommandozeile verwenden.
Dazu werden deklarative Konfigurationsdateien verwendet, mit denen die Pipelines auf einfache Weise definiert werden können. Dies macht aviary auch ohne Programmierkenntnisse nutzbar.

Das Modell zur Ableitung versiegelter Flächen aus Luftbildern wurde in aviary integriert.
Weitere Modelle und Pipelines sollen folgen, darunter auch vortrainierte Modelle für diverse Anwendungsfälle sowie speziell auf Fernerkundungsdaten trainierte Foundation-Modelle.
Dies soll im Rahmen unserer Forschungstätigkeiten in URBAN.KI, der Deutschen KI-Initiative für Kommunen, umgesetzt werden.

Bei Interesse ist die Dokumentation vorab unter geospaitial-lab.github.io/aviary zu finden.

Machine Learning Engineer with a passion for geospatial data | geospaitial lab | URBAN.KI