Felipe Calderero
I am a hands-on CTO leveraging AI, data, and software engineering to enhance quality of life and expand technology access. With a strong academic foundation, I transitioned into the tech industry to bridge the gap between research and real-world applications. As a Google Gemini and OpenAI educator, I am committed to democratizing AI knowledge and empowering professionals with cutting-edge insights.
My expertise spans AI, data, software engineering, cloud services, and product design, complemented by my roles as a professor and program director at Nuclio Digital School. I hold a PhD in AI from Universitat Politècnica de Catalunya and an MBA from IE Business School. Fluent in Spanish, English, Italian, and Catalan, I thrive in global and multidisciplinary environments, driving innovation at the intersection of technology and education.
Session
¿Alguna vez has necesitado datos realistas para testear, entrenar modelos o hacer una demo… y te has quedado bloqueado porque los datos reales son confidenciales, sensibles o simplemente no existen?
En este taller descubrirás cómo usar el Synthetic Data SDK, una librería open source en Python, para generar datos sintéticos realistas, seguros y listos para usar. Veremos cómo este enfoque permite trabajar con datasets que conservan el valor estadístico del original, pero sin comprometer la privacidad de las personas.
Aprenderás a generar datos sintéticos desde cero, controlar el resultado con filtros y condiciones específicas, y crear conjuntos multitabla con relaciones entre entidades. También exploraremos conceptos como privacidad diferencial (de forma práctica, sin teoría pesada) y la generación de datos justos para ayudar a reducir sesgos en IA.
Todo se hará en notebooks de Colab, sin instalaciones ni prerequisitos complejos. El foco estará en experimentar, aprender y llevarte algo útil para tus propios proyectos: datasets sintéticos, ejemplos de código y acceso directo al repo en GitHub para seguir explorando… o contribuir.
Este taller está dirigido a personas desarrolladoras, data scientists y curiosos/as de Python que quieran trabajar con datos de calidad sin saltarse normativas ni comprometer la privacidad.