11.03.2022 –, Bühne 3
envVisio ist ein neuartiger Ansatz zur Datenbereitstellung, in dem heterogene Sach-, Prozess- und Geodaten homogen verwaltet, veknüpft und per Dienst weiterverarbeitbar bereitgestellt werden. Aktuell wird envVisio als mFUND-Förderprojekt in Kooperation mit Behörden, die diverse Daten und praktische Probleme beisteuern, implementiert. Der Vortrag gibt einen Überblick über die Kernideen des Ansatzes, stellt den Dienst vor und berichtet über die Erfahrungen von Nutzenden.
envVisio ist ein neuartiger Ansatz zur Bereitstellung von Daten über die Umwelt und eine Antwort auf die Frage, wie eine nachhaltige Digitalisierung von Daten zur Umwelt gelingen kann. Die weitere Digitalisierung verlangt zwingend die Bereitstellung von Daten, die einfach weiterverarbeitet werden können, sodass die Daten in neue Wertschöpfungen[1] umgesetzt werden können.
envVisio wendet sich gegen die heute übliche Herangehensweise, sämtliche Daten zu Umweltthemen entsprechend der Geo-Normen der ISO 191xx zu modellieren und bereitzustellen, wie das z.B. in INSPIRE oder X-ÖV geschieht. Diese Herangehensweise produziert eine Reihe von Problemen bei der Weiterverarbeitung von Daten: Die Datenstrukturen sind phänomenal auf einige Anwendungsfälle zugeschnitten. Sie sind statisch, nicht erweiterbar, oft sehr kompliziert und von Anwendungsfall zu Anwendungsfall verschieden.
Um aus solchen Datenstrukturen neue Anwendungen zu generieren, die nicht den Anwendungsfällen entsprechen, auf die sie zugeschnitten wurden, ist ein hoher Aufwand nötig.
Es muss ständig neu codiert werden. Zu jedem neuen Thema muss für die Nutzung und Weiterverarbeitung der bereitgestellten Daten neu implementiert werden. Wie sollen auf diese Weise komplexe Themen bearbeitet werden? Wo sollen die dafür notwendigen Codierer herkommen? Das ist enorm kostspielig und damit eigentlich genau das Gegenteil, was mit der IT erreicht werden soll.
Hinzu kommt, dass auf diese Weise der Zugang zu den Daten auf wenige Expert*Innen beschränkt bleibt. Um Daten in solchen Strukturen verstehen und lesen zu können, ist Fachwissen und eine Vertrautheit mit dem Modell erforderlich. Egal wie offen solche Daten über das Internet erreichbar sind, zugänglich sind sie noch lange nicht.
envVisio setzt mit einer neuen Art der Modellierung einen Kontrapunkt. Kern des Ansatzes ist ein Datenmanagement, das alle Informationen themenübergreifend verknüpfbar und einheitlich strukturiert verarbeitet, sie flexibel verwalten kann und über standardisierte Dienste mit einfach weiterverarbeitbaren Inhalten bereitstellt. Dazu werden alle Objekte aus der Realität in der Datenbank in festen Strukturen verwaltet. Sach-, Prozess- und Geodaten werden separat gespeichert und durch Metadaten in den selben Strukturen beschrieben. Verbindungstabellen erfassen die komplexen Beziehungen zwischen Objekten in der Realität. Dadurch können z.B. Objekte ohne eigenen Geobezug durch ihre Verbindung mit Geobasisdaten räumlich verortet werden. Die Daten selbst, die beschreibenden Metadaten und die Verbindungen sind über einen Dienst unabhängig von ihren Eigenschaften einheitlich abfragbar.
Die Umsetzung erfolgt mit einem aus mehreren Softwarekomponenten bestehenden Data Warehouse, das die Daten entsprechend des envVisio-Modells verwaltet und Import, Visualisierung und Datenbereitstellung unterstützt (siehe https://wiki.gdi-de.org/display/gdideorg/Systemspezifikation+envVisio). Einbindung in Webanwendungen und Standard-GIS Software ist somit unabhängig von der konkreten Anwendung und unter Berücksichtigung der Beziehungen zwischen Objekten verschiedenster Art problemlos möglich.
envVisio konkurriert nicht mit anwendungsbezogenen Fachapplikationen, sondern stellt die Daten der einzelnen Fachverfahren in einen gemeinsamen Kontext mit gegenseitigen Verweisen. Dadurch entsteht eine neue Qualität themenübergreifend harmonisierter Daten. envVisio kann ergänzend in vorhandene Infrastrukturen eingebunden werden. Im Hintergrund können Daten aus Fachapplikationen importiert oder für diese bereitgestellt werden.
envVisio setzt auf offene Zugänge und offenes Wissen:
• Das Modell und seine Ansätze sind in [2] und [3] ausführlich beschrieben und werden in weiteren wissenschaftlichen Publikationen ausgeführt.
• Insbesondere bei der Datenbereitstellung setzt envVisio auf Anbindung der offenen Standards. Der für die Datenbereitstellung definierte envVisio Service beruht auf dem OGC API-Features – Standard und erweitert ihn (siehe https://wiki.gdi-de.org/display/gdideorg/envVisio+Service).
• Open Data Portale sind innerhalb des Projekts wichtige Datenquellen und Orientierungspunkte bei Architekturentscheidungen. envVisio ist so entworfen, dass es als einfach zu bedienende und robuste Schnittstelle für Open Data genutzt werden kann.
• Für envVisio entwickelte Software wird als Open Source veröffentlicht.
Die Methode ist in der Praxis mehrfach umgesetzt, im Folgenden zwei Beispiele:
• Das Landesamt für Umwelt-, Natur- und Verbraucherschutz Nordrhein-Westfalen stellt Daten aus allen Fachbereichen in der Datenföderierungsschicht DFS zusammen. Die DFS ist ein Data Warehouse, das nach der envVisio-Methode aufgebaut ist. Es vereint die Fachdaten zu den Themen Gewässerschutz/Wasserwirtschaft, Bodenschutz, Klima und Energie, Naturschutz, Immissionsschutz, Anlagentechnik und –überwachung in einer einheitlich strukturierten Datenhaltung. Aktuell wird der envVisio Service implementiert, um alle diese Daten nun in einer einheitlichen Struktur bereitzustellen. Damit wird in Nordrhein-Westfalen nun das, was z. B. INSPIRE erreichen wollte, umgesetzt: die behördlich erhobenen Daten liegen in einfach weiterverarbeitbaren und einheitlichen Strukturen zur Schaffung neuer und weiterführender Softwarelösungen vor.
• Das 2020 gestartete mFUND-Projekt „envVisio-GI“ setzt die envVisio-Methode für kommunale Daten um. Die Kommunen erheben vielfältigste, zumeist untereinander nicht kompatible Daten bei der Überwachung der Prozesse in unserer Umwelt. Mithilfe von envVisio werden die Daten zusammengeführt. Der envVisio Service zeigt auf, wie sie einerseits einem breiten Anwenderspektrum zugänglich gemacht und andererseits interoperabel angeboten werden können (s. https://wiki.gdi-de.org/display/gdideorg/mFund).
In beiden Fällen wird ein einziger Datenpool angelegt, der heterogene Daten zur Umwelt aus verschiedenen Quellen sammelt und in einer homogenen Struktur zusammenführt. Damit können die bei den Behörden anfallenden, z. T. sehr unterschiedlichen Aufgaben bewältigt werden. Darüber hinaus eröffnet der Datenpool eine Reihe neuer Möglichkeiten: Die Daten liegen innerhalb einer Struktur bereit, die unabhängig von zweckgebundenen Anwendungsfällen ist. Werkzeuge unterstützen ein exploratives, durch Neugier und zieloffenes Interesse getriebenes Durchsuchen der Daten. Ein breiter Anwender*Innenkreis kann die Daten erforschen und beliebig miteinander verschneiden; eigene, von den Intentionen der ursprünglichen Anwendungsfälle weit entfernte Aggregationen der Daten bilden; neue Perspektiven auf die Daten anschaulich machen; neue Erkenntnisse aus den Daten gewinnen und neue Applikationen implementieren, die diese Daten nutzen.
Der Vortrag gibt einen Überblick über die Kernideen des envVisio-Ansatzes, den Aufbau der Komponenten und berichtet über die praktischen Erfahrungen.
Anmerkungen und Quellen:
[1] Mit „Wertschöpfung“ ist hier keine finanzielle Wertschöpfung gemeint, sondern eine informatische: neue Informationen, ein bessere Vergleichbarkeit, eine breitere Datenbasis. Der Begriff „Anwendungsfall“ wurde bewusst vermieden, weil er eine zu exakte Zielstellung voraussetzt. Es geht eben nicht darum, bestimmte vorab definierte Anwendungsfälle und Anforderungen zu bedienen, sondern eine möglichst universelle Bereitstellung von Daten zu ermöglichen.
[2] Rudolf, H.: Umweltdatenmanagement: Eine Geo-Inspiration. Bernhard Harzer Verlag GmbH Karlsruhe (2018)
[3] Rudolf, H.: Umweltdaten-Intelligenz; In: Freitag, U., Fuchs-Kittowski, F., Abecker, A., Hosenfeld, F. (Hrsg.): Umweltinformationssysteme – Wie verändert die Digitalisierung unsere Gesellschaft?, Springer Vieweg, Wiesbaden 2020
Links:
Unterseite des Wiki des GDI-DE zum Projekt: https://wiki.gdi-de.org/display/gdideorg/mFund
Wissenschaftlicher Mitarbeiter an der Fachhochschule Erfurt
Fachgebiet Vermessung und Geoinformatik
Ursprünglich Soziologe, über Umwege an die TU Chemnitz und in die Informatik gekommen.
Bescäftigung mit dem envVisio-Modell und Masterarbeit über den envVisio Service.
Seit 2020 Data Engineer bei Simplex4Data.