Mireya

Matemática apasionada por los datos con máster en ciencia de datos trabajo actualmente como data scientist y me encanta estar al día de todas los avances tecnológicos. Me gusta el deporte y la montaña.


Session

10-06
10:00
35min
Cómo el Covid está fastidiando la predicción de series temporales y qué hacer para evitarlo
Mireya, Jorge Raúl Gómez Sánchez

Casi todas las series temporales tienen ahora algo en común: durante dos años se comportaron de forma extraña por culpa del Covid-19. Da igual que hablemos de las ventas de un supermercado, del consumo eléctrico, del tráfico de una carretera o del precio de la vivienda, todas ellas se han visto impactadas en mayor o menor medida, aunque no tengan directamente que ver con la pandemia. Los patrones temporales de prácticamente todas las series temporales muestran variaciones no predecibles diferentes de las de otros periodos, porque el comportamiento de todos nosotros cambió en muchos y diferentes ámbitos.
Esos dos años de excepcionalidad, que van desde marzo de 2020 hasta bien entrado 2022, dependiendo de la serie temporal que se analice, hacen que esos datos no sean una buena opción para entrenar modelos sin aplicarles ningún procesamiento adicional, pues los modelos aprenderán patrones que (esperemos) no se van a repetir en el futuro.
Por si fuera poco, desde que hemos vuelto a la normalidad, tenemos sólo 2 años de datos correctos, lo que es a todas luces insuficiente como para entrenar y validar un modelo en la mayoría de los casos. Los datos anteriores a 2020 sí que pueden ser válidos, dependiendo de la predicción que hagamos, pero tenemos un salto entre ellos y los actuales que evita un uso sencillo de los mismos. En ambos casos, el resultado es que no suele funcionar bien desestimar los datos de los dos años problemáticos.
En esta charla analizaremos las alternativas que tenemos para evitar que la predicción de series temporales, que ya de por sí tienen dificultades a superar, se transformen en insalvables por culpa del Covid-19. Veremos qué técnicas pueden servir en diferentes casos y qué técnicas no suelen ser una buena idea. Puede que esto sea un problema temporal hasta que la pandemia quede atrás, y la variación de los datos que supuso deje de afectar, pero hasta entonces nos quedan unos cuantos años de científicos de datos peleándose con series temporales especialmente complicadas.

Machine learning, stats
Saraiba