DINAcon 2023

Wie gelangt man von Low-Resource-Herausforderungen zu High-Tech-Lösungen?
23.11.2023 , Pakt

Im Mai 2023 lancierten wir mit textshuttle.com die erste öffentliche Übersetzungsplattform, die alle Landessprachen der Schweiz abdeckt. Seither wird die Plattform wöchentlich von Tausenden von Nutzer:innen genutzt und bietet auch Übersetzungen in zwei schweizerdeutsche Dialekte an. Dies ist eine technische Herausforderung, nicht nur, weil nur sehr wenige Trainingsdaten vorliegen, sondern auch, weil in schweizerdeutschen Dialekten eine einheitliche Rechtschreibung und Grammatik fehlt. In diesem Vortrag werden die besonderen Herausforderungen und die von uns umgesetzten Lösungsansätze erörtert. Dabei wird auf NLP-Forschung und praktische Erfahrungen aus anderen Szenarien mit wenig Daten zurückgegriffen – wie etwa bei der Entwicklung spezialisierter Übersetzungsmodelle für Unternehmenskunden.


Florian Schottmann studierte Statistik mit Schwerpunkt Machine Learning. Nach seinem Studium forschte er an der ETH Zürich zu Natural Language Processing (NLP). Seit 2022 leitet er das Forschungs- und Entwicklungsteam von Textshuttle.

Head of Research at Textshuttle