Nikolai Janakiev
Geospatial Data Scientist bei Triply und freiberuflicher Data Scientist und Data Engineer mit Fokus auf geographische Datenverarbeitung, Routing, OpenStreetMap und offene Daten.
Beiträge
Wenn man mit geographischen Daten arbeitet kommt man gelegentlich an die Grenzen der eigenen Hardware sobald man mit großen Datenmengen konfrontiert ist. Da kommt man nicht daran vorbei sich mit Big Data zu beschäftigen und die Elefanten im Raum zu konfrontieren. Speziell der blaue Elefant (PostgreSQL) und der gelbe Elefant (Hadoop) sind im Vordergrund, aber auch einige weitere Open Source Projekte können dafür hilfreich sein und werden hier vorgestellt und verglichen.
In diesen Vortrag geht es um die Erstellung und Schätzung von Transitdaten im General Transit Feed Specification (GTFS) Format mithilfe von OpenStreetMap Daten. Weiters zeigen wir die Schwierigkeiten und Herausforderungen die auftauchen wenn man mit GTFS arbeitet, die verschiedenen Routing Engines die wir damit getestet haben und die Vollständigkeit von OpenStreetMap für diese Anwendung.