Javier Montoya Gutierrez de Ravé
Estudié Matemáticas y Física en la Universidad de Edimburgo. Después de un año trabajando en el área de análisis de datos en Telefónica, decidí cambiar el área en la que me enfocaba para trabajar con datos en el campo médico. Actualmente, estoy trabajando con una beca en mi tesis de maestría, que utiliza el Deep Learning con datos metagenómicos para la clasificación de la microbiota en datos provenientes de pacientes con cáncer colorrectal.
https://www.linkedin.com/in/javier-montoya-gutierrez-de-rave-234402b4/
Session
En el ámbito de la metagenómica, el estudio del material genético, hay una gran dificultad cuando se tratan de procesar los datos con el uso de la Inteligencia Artificial. A la dificultad inherente de la rama genética, se le suma que estos datos son secuencias de nucleótidos, que se representan por las letras “A”, “C”, “G” y “T” y que, además, dependiendo del gen y la especie, pueden tener un tamaño desde cientos a millones de nucleótidos.
La naturaleza de estos datos limita las maneras en las que podemos analizarlos y los hace difíciles de poder ser estudiados con las técnicas mas modernas de ciencias de datos.
Durante esta charla, explicaré una técnica que permite codificar estos datos a imágenes: La Representación del Juego del Caos. Aunque el nombre pueda intimidar, se trata de una técnica simple pero muy funcional por la cual una secuencia de nucleótidos puede ser codificada a una representación gráfica en dos dimensiones. Estas representaciones tienen varias características útiles: son únicas para cada secuencia y permiten recuperar la secuencia original a partir de la imagen. Además, para secuencias lo suficientemente largas, comienzan a aparecer patrones en la imagen que las hacen más distinguibles e interesantes que las secuencias de las que se originan.
Mi objetivo durante la charla es presentar esta técnica y mostrar cómo puede ser desarrollada utilizando Python, ofreciendo ejemplos visuales de secuencias de nucleótidos antes y después de la codificación. Finalmente, expondré los resultados de un caso práctico en el que he participado. En este caso, el uso de esta técnica ha permitido introducir datos de pacientes con cáncer de colon en modelos clasificatorios de Redes Neuronales Convolucionales, logrando métricas de exactitud y precisión para la clase de interés superiores al 90%