25.03.2026 –, HS2 (ZHG 010)
Souveräne Cloud-Umgebungen eignen sich für die Verarbeitung schützenswerter Daten. Das vorgestellte Datenmanagementsystem nutzt einen Objektspeicher (MinIO) und PostGIS (Raster) auf Basis von Pods zur Verwaltung von zeitlich vagen Geodaten. Durch interoperable Schnittstellen und cloudfähige Datenformate werden Machine-Learning-Anwendungen unterstützt. Mithilfe von Geodiensten können Ergebnisse präsentiert und über die STAC API auffindbar gemacht werden.
Die Nutzung souveräner Cloud-Umgebungen für die Verarbeitung sensibler Daten ist ein aufstrebendes Feld. Sowohl datenschutzrechtliche Vorgaben als auch institutionelle Richtlinien erfordern in vielen Fällen die Hoheit über die gesamte Pipeline der Datenverarbeitung. Zudem stellt die Einhaltung von Budgets aufgrund nutzungsbasierter Preisgestaltungen oft ein Problem bei der Verwendung von Ressourcen öffentlicher Cloud-Provider dar. Auch Bestrebungen, Abhängigkeiten von Big-Tech-Unternehmen zu verringern, erhöhen das Interesse an der Verwendung souveräner IT-Strukturen.
Das vom Bundesamt für Kartographie und Geodäsie (BKG) geförderte Forschungsprojekt „Der zeitliche Wandel von Geodaten” befasst sich mit der Entwicklung von Methoden zur automatisierten Klassifizierung, Speicherung und Analyse von Geodaten unterschiedlichen Alters und unterschiedlicher Qualität. Ein Ziel besteht in der Entwicklung eines Systems zur effizienten Verwaltung und Verarbeitung raumzeitlicher Daten in souveränen Cloud-Umgebungen. Durch die ausschließliche Verwendung von Open-Source-GIS-Komponenten ermöglichen Standardschnittstellen eine interoperable Nutzung durch Machine-Learning-Anwendungen, beispielsweise zur Objektklassifizierung anhand historischer Kartenwerke und Luftbildaufnahmen.
Das in diesem Beitrag vorgestellte Datenmanagementsystem verfolgt einen containerbasierten Ansatz und ist mit Kubernetes (K3s) kompatibel. Ein Objektspeicher, der mit MinIO (S3) umgesetzt wurde, dient als zentrale Speicherkomponente. Zur Aufbereitung von Rasterrohdaten in cloudfähige Formate verfügt das System über Schnittstellen zur Konvertierung in die Formate Cloud Optimized GeoTIFF (COG), PostGIS (Raster) und Zarr (Datacube). Einen direkten Vergleich dieser Formate mit Fokus auf verteilte bzw. parallele Schreiboperationen in Cloud-Umgebungen haben wir kürzlich vorgestellt (https://doi.org/10.25598/agit/2025-58).
Insbesondere die Möglichkeit zur Verwendung vager/grober Zeitangaben zeichnet das entwickelte Datenmanagementsystem aus. Geodaten verwenden zumeist ISO 8601 zur Kodierung temporaler Eigenschaften, was typischerweise die Angabe präziser Datumsangaben voraussetzt. Durch die Speicherung lediglich der signifikanten Datumskomponenten als Tag in den Objekt-Metadaten ist auch die Angabe unpräziser Zeitinformationen möglich.
Zur Bereitstellung von temporalen Rasterdaten als Geodienst dient der Mapserver in Kombination mit PostGIS (Raster). Zu diesem Zweck werden Metadaten samt vager Zeitangaben ausgewertet und unter Verwendung eines Template-Systems in Mapfiles überführt. Das vorgestellte System integriert außerdem pycsw zur Metadatenverwaltung und setzt dabei auf die STAC API. Datensätze werden automatisch in Collections und Items überführt und sind über raumzeitliche Abfragen auffindbar.
Auf Basis von FastAPI und nginx existiert ein effizientes und flexibel erweiterbares Backend. Die bereitgestellten Webschnittstellen werden unter Verwendung von JSON Web Tokens (JWT) gegen unerlaubten Zugriff geschützt.
Wissenschaftlicher Mitarbeiter am Institut für Angewandte Photogrammetrie und Geoinformatik (IAPG) an der Jade Hochschule in Oldenburg.