19.05.2026 –, Galilei 1 Sprache: Deutsch
Synthetische Daten können potenziell Datenschutzrisiken reduzieren und als Verfahren der Datenaugmentierung benutzt werden. Die Generierung solcher Daten ist besonders im Sektor Gesundheit für die Entwicklung von KI-Anwendungen eine Option, da hier oft hohe Anforderungen an Datenschutz und kleine Datensätze vorliegen. Die Herausforderung ist allerdings die Generierung von Daten, die nicht nur statistisch ähnlich und sicher sind, vielmehr auch bzgl. der medizinischen Kausallogik und der Fairness die Träger der Ausgangsdaten widerspiegeln. In der Literatur werden verschiedene Qualitätsdimensionen, z.B. Similarity, Usability, Privacy, Fairness …, beschrieben. Am Beispiel tabellarischer Vital- Daten aus der MIMIC Datenbank werden die Herausforderungen untersucht, wobei frei verfügbare Tools wie z.B. Syndat, SynthEval, SynthCheck und Synthetic Data Vault eingesetzt werden und auch mögliche Ansätze zum Faktencheck und Explainable AI (XAI) als Frühwarnung für potenziellen Bias diskutiert werden. Die Praxis-Beispiele der Präsentation stammen aus der Masterarbeit des Co-Autors Daudert.
Priv. Doz. Dr. med. Ernst Wellnhofer arbeitet als freier Senior-Berater u. a. für die Fa. InnoVance und die Charité. Er war als Kardiologe tätig. ist Gastwissenschaftler am Institut für kardiovaskuläre Computer-assistierte Medizin und Externer Dozent am Fernstudieninstitut der Berliner Hochschule für Technik. Er ist seit Beginn 2024 Vorsitzender im Fachausschuss „Software in der Medizintechnik“ im VDI.