26.03.2026 –, HS2 (ZHG 010)
Die raum-zeitliche Aggregation großer (Punkt-)Datenmengen für die kartografische Web-Visualisierung stellt eine Herausforderung dar, die auf unterschiedliche Weisen angegangen werden kann. Anhand zweier Praxisbeispiele – auf Datenbankebene in PostgreSQL und im Streamprozessor-Framework Apache Flink – wird die Verwendung von Ubers H3-Programmbibliothek für die hexagonale Aggregation in einem Discrete Global Grid System (DGGS) vorgestellt und diskutiert.
Nahezu-Echtzeit-Daten, Zeitreihendaten und anderweitige raum-zeitliche Ereignisdaten unterliegen unabhängig ihres anvisierten Analysezwecks früher oder später häufig der Notwendigkeit einer kartografischen Darstellung. Ist eine Web-Visualisierung vorgesehen, so gestaltet sich die Datenaufbereitung als herausfordernde Aufgabe, denn eine prototypische quick-and-dirty Web-Darstellung im Browser – bspw. mit OpenLayers – stößt bei größeren Datenmengen schnell an ihre Performance-Grenzen. Je nach Anwendungsfall können die Rohdatenmengen riesig sein. Auch die Bereitstellung der Rohdaten über OGC-Web-Services skaliert schlecht mit zunehmender Datenmenge.
An dieser Stelle wird eine Aggregation oder Generalisierung der Daten notwendig. Dafür eignen sich selbst-definierte Gitter, amtliche bzw. nationale Gittersysteme sowie Diskrete globale Gittersysteme (Discrete Global Grid Systems, DGGS) sehr gut. Einige Varianten wie das geographische Gitter für Deutschland, Ubers hexagonales Gittersystem H3 und Googles hierarchisches Gittersystem S2 werden im Vortrag kurz gegenübergestellt. Vielleicht werfen wir auch einen Blick auf die Arbeitsgruppe DGGS des OGC und auf den OGC-Standard API – DGGS.
Zwar bieten Web-Mapping-Frameworks wie OpenLayers bereits praktische Methoden wie HexBin zur Erstellung eines Hexagon-Gitters für eine räumliche Aggregation von Quelldaten, aber dafür müssen alle Quelldaten zuerst in den Browser des Clients wandern, was erfahrungsgemäß schnell zu Performance-Problemen führt.
Anhand zweier Projektbeispiele werden zielführendere Herangehensweisen vorgestellt, wie Zeitreihendaten effizient per Post-Processing auf Datenbankebene oder in Echtzeit bei der Streaming-Daten-Verarbeitung aggregiert werden können.
Beispiel 1 aus dem mFUND-Projekt ErlebensAtlas aggregiert Daten des Reiseerlebens von Nutzenden des ÖPNV in Hamburg und Berlin im Erfassungszeitraum 2025 zur Unterstützung von Entscheidungsprozessen der Mobilitätsbetreiber. Dafür wird die PostgreSQL-Erweiterung h3-pg zur Aggregation im hexagonalen Gittersystem H3 verwendet.
Beispiel 2 aus dem mFUND-Projekt EDDY zeigt exemplarisch eine Aggregation von V2X-Kommunikationsdaten (Vehicle-to-Everything communication) in Echtzeit mit dem Streaming-Daten-Verarbeitungswerkzeug Apache Flink, wofür ebenfalls eine quelloffene H3-Implementierung in Java verfügbar ist.
Finales Ziel in beiden Fällen ist immer eine performante Bereitstellung der aggregierten Ergebnisdaten über OGC-Web-Schnittstellen wie WMS/WFS oder API – Maps/API – Features. Auf diese Weise sind sie einfach austauschbar und flexibel in Analysewerkzeugen diverser Akteure nutzbar.
Der Vortrag möchte eine möglichst generische Herangehensweise an die Gitter-Aggregation vorstellen, sodass die Übertragbarkeit dieser praktischen Methodik auf zahlreiche andere statistische Anwendungsfälle vermittelt wird. Vor allem Verkehrsdaten, Bewegungsdaten und Sensordaten lassen sich so mit geringem Aufwand elegant visualisieren und für weiterführende Analyseanwendungen aufbereiten.
Michael Scholz studierte Geoinformatik in Münster und arbeitet seit 2012 als Datenjongleur am Institut für Verkehrssystemtechnik des DLR in Braunschweig. Bei seiner täglichen Arbeit zähmt er heterogene Geodaten für Anwendungen der Fahr- und Verkehrssimulation und des autonomen Fahrens, was OpenDRIVE zu einem Kernbestandteil seiner Persönlichkeit macht. Weiterhin optimiert er gerne Geodatenverarbeitungsketten und stellt alles Raum-Zeitliche immer performant über OGC-Schnittstellen bereit. Er bezeichnet sich selbst als Open-Source-Evangelist und ist sehr daran interessiert, die GIS- und Verkehrstechnik-Domänen näher zusammenzubringen. Außerdem ist er gerne auf fahrstreifengrenzenlosen Schotterpisten ferner Länder unterwegs.