Se han guardado sus preferencias de configuración regional. Nos gusta pensar que tenemos un excelente soporte para el español en Pretalx, pero si encuentra problemas o errores, ¡contáctenos!

Óscar Tienda Beteta

Óscar Tienda es graduado en Gestión Aeronáutica por la UAB y actual estudiante de Máster en Ciencia de Datos por la UOC. Trabaja como Data Scientist en Nagarro desde 2022 y sus anteriores trabajos están vinculados al sector aeronáutico.


Twitter

https://x.com/DataOskar

LinkedIn

https://www.linkedin.com/in/oscar-tienda/

Otro enlace (e.g. GitHub)

https://github.com/OscarTienda


Session

06/10
15:50
35minutos
Aprende Aprendizaje por refuerzo jugando a Doom
Nadal, Óscar Tienda Beteta

Los impresionantes avances en el campo del Deep Learning y redes neuronales basadas en el contexto de visión de los videojuegos han demostrado poder crear controladores de nivel humano en los juegos de Atari 2600 a partir de datos visuales (píxeles). Sin embargo, la mayoría de juegos de Atari 2600 son en tercera persona y en entornos bidimensionales no realistas. Este hecho limita la aplicación de estas tecnologías en otros entornos.

Para superar este desafío, nos complace presentaros ViZDoom, una revolucionaria plataforma de prueba que utiliza información visual pura y ofrece una perspectiva en primera persona en un entorno tridimensional semi-realista. Basada en el legendario juego de disparos en primera persona, Doom, ViZDoom permite desarrollar bots capaces de jugar al juego utilizando únicamente el búfer de pantalla, proporcionando una herramienta ligera, rápida y altamente personalizable.

Gracias a la combinación de redes neuronales convolucionales, Q-learning y reproducción de experiencias, hemos logrado entrenar bots altamente competentes. Estos bots no solo muestran comportamientos parecidos a los humanos sino que también confirman la viabilidad del aprendizaje por refuerzo visual en entornos semi-realistas de primera persona en 3D.

Dentro de este contexto, contaremos cómo surgió la idea, el motivo de porque se ha elegido Doom y no otros videojuegos, diferentes escenarios de prueba (movimientos básicos, disparos, recolección de objetos en un laberinto), parámetros y resultados, métricas de rendimiento y, finalmente, los usos reales que se le puede dar.

Deep Learning
Saraiba