Aprende Aprendizaje por refuerzo jugando a Doom
06/10, 15:50–16:25 (Europe/Madrid), Saraiba
Idioma: Español

Los impresionantes avances en el campo del Deep Learning y redes neuronales basadas en el contexto de visión de los videojuegos han demostrado poder crear controladores de nivel humano en los juegos de Atari 2600 a partir de datos visuales (píxeles). Sin embargo, la mayoría de juegos de Atari 2600 son en tercera persona y en entornos bidimensionales no realistas. Este hecho limita la aplicación de estas tecnologías en otros entornos.

Para superar este desafío, nos complace presentaros ViZDoom, una revolucionaria plataforma de prueba que utiliza información visual pura y ofrece una perspectiva en primera persona en un entorno tridimensional semi-realista. Basada en el legendario juego de disparos en primera persona, Doom, ViZDoom permite desarrollar bots capaces de jugar al juego utilizando únicamente el búfer de pantalla, proporcionando una herramienta ligera, rápida y altamente personalizable.

Gracias a la combinación de redes neuronales convolucionales, Q-learning y reproducción de experiencias, hemos logrado entrenar bots altamente competentes. Estos bots no solo muestran comportamientos parecidos a los humanos sino que también confirman la viabilidad del aprendizaje por refuerzo visual en entornos semi-realistas de primera persona en 3D.

Dentro de este contexto, contaremos cómo surgió la idea, el motivo de porque se ha elegido Doom y no otros videojuegos, diferentes escenarios de prueba (movimientos básicos, disparos, recolección de objetos en un laberinto), parámetros y resultados, métricas de rendimiento y, finalmente, los usos reales que se le puede dar.


Temática

Deep Learning

Temáticas adicionales Nivel de la propuesta

Basic (no previous knowledge is necessary)

Soy Nadal y desde hace 3 años y medio formo parte del departamento de Datos e IA de Nagarro. Mi rol es de Ingeniero de Datos y, junto al equipo, he participado en múltiples proyectos relacionados con la IA, IA generativa, ETL de datos, Big Data, etc.

Óscar Tienda es graduado en Gestión Aeronáutica por la UAB y actual estudiante de Máster en Ciencia de Datos por la UOC. Trabaja como Data Scientist en Nagarro desde 2022 y sus anteriores trabajos están vinculados al sector aeronáutico.