25.03.2026 –, HS3 (ZHG 009)
Mit wachsenden Datenmengen und komplexen Analysen stoßen klassische GIS-Tools wie QGIS, PostGIS oder GeoPandas zunehmend an Performance- und Skalierungsgrenzen. DuckDB und SedonaDB bieten hier effiziente Alternativen für die lokale Geoverarbeitung, während Apache Spark mit Sedona große Datenmengen skalierbar und verteilt verarbeitet. Der Vortrag vergleicht diese Tools in Bezug auf Installation, Geo-Funktionalität und praktische Einsatzmöglichkeiten.
Klassische GIS-Tools wie QGIS, PostGIS, GeoPandas oder GDAL/OGR haben sich über Jahre bewährt und sind aus der Geodatenverarbeitung nicht wegzudenken. Doch mit immer größeren Datenmengen und anspruchsvolleren Analysen stoßen auch diese Werkzeuge an ihre Grenzen, besonders bei Performance und Skalierbarkeit. Hier bieten DuckDB, SedonaDB und Apache Spark mit der Sedona-Erweiterung zusätzliche Möglichkeiten für spezifische Anwendungsfälle.
DuckDB und SedonaDB ermöglichen es, Geodaten effizient auf lokalen Rechnern zu verarbeiten. Das ist besonders dann vorteilhaft, wenn schnelle Abfragen und Analysen benötigt werden, ohne dass eine aufwendige Infrastruktur aufgebaut werden muss. Apache Spark mit Sedona hingegen ist eine Lösung für die Verarbeitung großer Datenmengen in verteilten Umgebungen, wo Skalierbarkeit und Performance entscheidend sind.
Der Vortrag vergleicht diese Tools anhand verschiedener Kriterien. Ein Schwerpunkt liegt auf der Installation und Einrichtung, also welche Voraussetzungen es gibt und wie hoch der Installationsaufwand ist. Ein weiterer Fokus liegt auf der Geo-Funktionalität, also welche räumlichen Operationen unterstützt werden und wie die Performance im Vergleich zu klassischen Tools ausfällt. Anhand von Beispielen aus der Praxis wird gezeigt, in welchen Fällen die neuen Tools bestehende Workflows ergänzen oder ersetzen können, und es wird ein Überblick gegeben, für welche Szenarien sich die jeweiligen Ansätze eignen.