2025-11-18 –, Hodler
Im Vortrag wird eine integrierte Plattform für Datenmanagement und Datenanalaysen vorgestellt, die vollständig aus etablierten open-source Tools aufgebaut ist. Modular, flexibel und skalierbar ist sie nicht nur geeignet, um verschiedene KI-Workloads zu unterstützen, sondern die verschiedenen Komponenten sind in den neuesten Versionen um viele neue KI-Funktionen erweitert worden, von denen einige exemplarisch vorgestellt werden.
Trino, Spark, JupyterHub und Apache NiFi bilden eine leistungsfähige Grundlage für moderne KI-Workloads in Kubernetes-Umgebungen. Trino ermöglicht föderierten SQL-Zugriff auf verschiedene Datenquellen und eignet sich ideal für schnelles Feature Engineering. Spark unterstützt verteiltes Training und Inferenz mit bekannten ML-Frameworks. JupyterHub bietet eine interaktive Umgebung für Data Scientists zur Entwicklung und Visualisierung von Modellen. NiFi ergänzt das System durch flexible Datenflüsse und automatisierte ML-Pipelines. In ihren aktuellen Versionen sind die Tools um integrierte KI-Funktionen erweitert worden. Gemeinsam ermöglichen diese Werkzeuge skalierbare, integrierte und produktionsreife KI-Anwendungen – von der Datenaufnahme bis zum Modellbetrieb.
Dr. Stefan Igel ist als COO bei Stackable tätig und verfügt über mehr als 25 Jahre Erfahrung im IT-Projektgeschäft. In dieser Zeit hat er zahlreiche Unternehmen bei der Entwicklung und Implementierung von Datenplattformen und Datenprodukten unterstützt. Aktuell verantwortet er unter anderem verschiedene Datenplattform-Projekte im öffentlichen Sektor sowie die Gaia-X-Aktivitäten von Stackable. Stefan ist von Open-Source-Software überzeugt, da diese insbesondere bei Big-Data-Projekten neben ihrer Leistungsfähigkeit auch Datensouveränität, Sicherheit und Unabhängigkeit gewährleisten können.