Von OpenStreetMap zu semantisch vernetzten Wissensgraphen
26.03.2026 , HS2 (ZHG 010)

Der Beitrag zeigt, wie Community-Geodaten aus OpenStreetMap, Wikidata und weiteren Wikibase-Instanzen automatisiert extrahiert, semantisch harmonisiert und in das Federated Knowledge Graph Ecosystem integriert werden können. Durch Python-basierte RDF-Transformationen, GeoSPARQL-Modellierung und QGIS-Reintegration entsteht eine offene, FAIR-kompatible Pipeline für Cultural-Heritage- und Geoscience-Daten.


Von OpenStreetMap zu semantisch vernetzten Wissensgraphen: Integration von Community-Geodaten in das Federated Knowledge Graph Ecosystem

Extended Abstract

Community-basierte Geodatenplattformen wie OpenStreetMap (OSM), Wikidata (Schmidt, Thiery, und Trognitz 2022) und weitere Wikibase-Instanzen stellen eine der wertvollsten frei verfügbaren Quellen raumbezogener Informationen dar. In der wissenschaftlichen Nutzung, insbesondere im Bereich des Cultural Heritage und der Geowissenschaften, besteht jedoch weiterhin die Herausforderung, diese heterogenen Daten strukturiert, semantisch konsistent und maschinenlesbar in Forschungsinfrastrukturen zu integrieren. Der Beitrag zeigt, wie Community-Geodaten automatisiert extrahiert, transformiert und in das Federated Knowledge Graph Ecosystem (Fischer u. a. 2025; Rossenova u. a. 2025; Thiery u. a. 2025) wie die Knowledge Graph Infrastructure (KGI4NFDI) und den Terminology Service (TS4NFDI) eingebunden werden können.

Die Datenextraktion erfolgt über Overpass Turbo (für OSM-Daten) sowie über SPARQL-Endpoints der Wikibase-Systeme (z. B. Wikidata, fuzzy-sl Wikibase, FactGrid). Anschließend werden die Datensätze mithilfe von Python-Skripten und der Bibliothek rdflib in RDF transformiert und innerhalb von Jupyter Notebooks dokumentiert, um eine reproduzierbare, FAIR4RS-konforme Prozesskette sicherzustellen. Die resultierenden RDF-Graphen werden gemäß CIDOC CRM und GeoSPARQL 1.1 modelliert und über die Material Cultural Heritage Crosswalk Ontology (MaCHeCO) mit dem NFDI4Objects Knowledge Graph interoperabel gemacht. Ergänzend erzeugt das SPARQLing Unicorn Toolkit (Homburg und Thiery 2024b; 2024a) eine HTML-Dokumentation der RDF-Ergebnisse, während das zugehörige SPARQLing Unicorn QGIS-Plugin die Re-Integration der Linked Data in QGIS ermöglicht. Anhand konkreter Use Cases wird das Vorgehen illustriert:

(1) Cultural Heritage Irish Sites – etwa der Ogham Stone Coumeenole North (Q126503090; node:5145413640), cgl. Thiery und Thiery (2023), via https://overpass-turbo.eu/s/2eM0 oder St. Lachtain’s Well (Q121840779; way:935503837), via https://overpass-turbo.eu/s/2eM2 – werden aus OSM und Wikidata abgerufen, semantisch harmonisiert und mit dem NFDI4Objects-Graph verknüpft.

(2) Geoscience Sites – beispielsweise die Franchthi Cave (node:1221172611; Q1441331) oder Crvena Stiljena Cave (node:10879170567; Q121418883), vgl. Thiery und Schenk (2023), sowie die Bohrkerne AU3, AU4 und DE3 (Schenk u. a. 2024) – werden als (duale) geologische und archäologische Entitäten modelliert.

(3) Zur Rekonstruktion georegionaler Kontexte (z. B. der Eifel-Region) werden Fluss- und Grenzrelationen wie der Rhein (123924), die Mosel (390416) oder der Parc naturel des Hautes-Fagnes – Eifel (10601027) integriert, um „fuzzy boundaries“ semantisch zu repräsentieren.

Der Beitrag zeigt, wie durch die Nutzung offener Standards, freier Software (Python, QGIS) und offener Schnittstellen (Overpass, SPARQL) eine durchgängige Pipeline von Community-Daten zu semantisch vernetzten, FAIRen Forschungsdaten entsteht. Damit wird eine Brücke zwischen der FOSSGIS-Community und den NFDI-Forschungsinfrastrukturen geschlagen – ein Beitrag zur nachhaltigen Nutzung, Verknüpfung und Langzeitverfügbarkeit offener Geodaten in Wissenschaft und Kulturerbe.

Referenzen

Fischer, Kristina, Anja Gerber, Thomas Koprucki, Andreas Noback, Marco Reidelbach, Torsten Schrade, und Florian Thiery. 2025. „Windows on Data: Federating Research Data with FAIR Digital Objects and Linked Open Data“. In Proceedings of the Conference on Research Data Infrastructure 2025, herausgegeben von York Sure-Vetter und Paul Groth, 7(5), 𝒬3, 7(5), 𝒬3. Aachen: Squirrel Papers. https://doi.org/10.5281/zenodo.16736221.

Homburg, Timo, und Florian Thiery. 2024a. „SPARQL Unicorn Ontology Documentation“. Squirrel Papers 6 (2): #2. https://doi.org/10.5281/zenodo.10780476.

———. 2024b. „sparqlunicorn/sparqlunicornGoesGIS-ontdoc: Version 0.17“. Squirrel Papers 6 (2): #2. https://doi.org/10.5281/zenodo.8190763.

Rossenova, Lozana, Fidan Limani, Carsten Fortmann-Grote, Angelika Kaplan, Florian Thiery, Atif Latif, Renat Shigapov, u. a. 2025. „How are NFDI consortia using Knowledge Graphs? An overview of common functions and challenges by the Working Group “Knowledge Graphs”“. In Proceedings of the Conference on Research Data Infrastructure 2025, herausgegeben von York Sure-Vetter und Groth Paul, 7(5), 𝒬5, 7(5), 𝒬5. Aachen: Squirrel Papers. https://doi.org/10.5281/zenodo.16736077.

Schenk, Fiona, Ulrich Hambach, Sarah Britzius, Daniel Veres, und Frank Sirocko. 2024. „A Cryptotephra Layer in Sediments of an Infilled Maar Lake from the Eifel (Germany): First Evidence of Campanian Ignimbrite Ash Airfall in Central Europe“. Quaternary 7 (2): 17. https://doi.org/10.3390/quat7020017.

Schmidt, Sophie C., Florian Thiery, und Martina Trognitz. 2022. „Practices of Linked Open Data in Archaeology and Their Realisation in Wikidata“. Digital 2 (3): 333–64. https://doi.org/10.3390/digital2030019.

Thiery, Florian, Lozana Rossenova, Daniel Mietchen, Timo Homburg, und Peter Thiery. 2025. „Distributed Research Data Knowledge Graphs - Challenges of federated queries using the Wikiverse and OpenStreetMap within the NFDI Knowledge Graph Ecosystem“. In Proceedings of the Conference on Research Data Infrastructure 2025, herausgegeben von York Sure-Vetter und Paul Groth, 7(5), 𝒬2, 7(5), 𝒬2. Aachen: Squirrel Papers. https://doi.org/10.5281/zenodo.16736047.

Thiery, Florian, und Fiona Schenk. 2023. „Modelling of Uncertainty in Geo Sciences Sites“. Squirrel Papers 5 (1): #4. https://doi.org/10.5281/zenodo.10255259.

Thiery, Florian, und Peter Thiery. 2023. „Linked Open Ogham. How to publish and interlink various Ogham Data?“ Archeologia e Calcolatori 34 (1): 105–14. https://doi.org/10.19282/ac.34.1.2023.12.

Siehe auch: