Pronóstico de Series Temporales con ML

08/09/2022

★★★★★Valoración: 4.14 (3224 votos)

El pronóstico de series temporales es una disciplina fundamental en el análisis de datos que busca predecir valores futuros basándose en mediciones pasadas ordenadas cronológicamente. Desde la previsión de la demanda energética hasta la predicción de precios de acciones, su aplicación abarca numerosas industrias y juega un papel crucial en la toma de decisiones estratégicas. En la era del Big Data y la inteligencia artificial, las técnicas de Machine Learning (ML) han emergido como herramientas poderosas para abordar la complejidad inherente de estos datos.

Which ML model is best for time series forecasting? — Recurrent Neural networks (RNN) and Long Short-Term Memory (LSTM) are the most common deep learning models used for time-series forecasting.

Índice de Contenido

¿Qué son los Datos de Series Temporales?
Tipos de Datos de Series Temporales
- Series Temporales Univariadas
- Series Temporales Multivariadas
Datos de Entrada para el Pronóstico
- Datos Endógenos
- Datos Exógenos
Panorama General de los Modelos de Pronóstico
Pronóstico con Machine Learning
- Ingeniería de Características
- Métodos de Pronóstico
Preguntas Frecuentes
Conclusión

¿Qué son los Datos de Series Temporales?

Una serie temporal es simplemente una secuencia de mediciones de la misma variable o grupo de variables realizadas a lo largo del tiempo. Estas mediciones suelen tomarse a intervalos regulares, ya sean horarios, diarios, mensuales o anuales. Un ejemplo clásico es el número de pasajeros de aerolíneas registrado cada mes. La característica distintiva de estos datos es su dependencia del tiempo; el orden de las observaciones es fundamental y las mediciones pasadas a menudo influyen en las futuras.

Tipos de Datos de Series Temporales

Podemos clasificar los datos de series temporales en dos categorías principales:

Series Temporales Univariadas

Estas series contienen datos para una única variable dependiente del tiempo. Es la forma más sencilla de datos de series temporales, donde analizamos y pronosticamos los valores futuros de esa única variable basándonos en su propio historial. Un ejemplo sería el registro diario de la temperatura en una ciudad a lo largo de un año, buscando predecir la temperatura de mañana.

Series Temporales Multivariadas

En contraste, las series temporales multivariadas involucran dos o más variables registradas a lo largo del tiempo. Estas variables pueden estar interrelacionadas o no. Para el pronóstico, se pueden utilizar las variables adicionales como predictores para mejorar la precisión de la variable principal de interés. Volviendo al ejemplo de la temperatura, podríamos incluir la humedad y la velocidad del viento como variables adicionales para predecir la temperatura de mañana. Es crucial considerar si se tendrá acceso a los valores futuros de estas variables predictoras al momento de realizar el pronóstico.

Datos de Entrada para el Pronóstico

Para realizar un pronóstico, generalmente utilizamos dos tipos de variables de entrada:

Datos Endógenos

Estos son datos que están directamente relacionados con la variable que queremos pronosticar. En el ejemplo de la temperatura, los datos endógenos serían la propia temperatura diaria y cualquier característica que podamos extraer de ella (tendencias, estacionalidad, etc.).

Datos Exógenos

Son variables que no están directamente relacionadas con la variable a pronosticar, pero que pueden influir en ella. En el ejemplo de la temperatura, la humedad, la velocidad del viento, la ubicación, el día de la semana o si es festivo son datos exógenos. La capacidad de incorporar datos exógenos es una ventaja significativa de los modelos de ML.

Panorama General de los Modelos de Pronóstico

Existen diversas técnicas y modelos para el pronóstico de series temporales, que se pueden agrupar en tres categorías principales:

Modelos Clásicos

Estos modelos utilizan métodos estadísticos tradicionales. Son efectivos para capturar patrones simples, tendencias y estacionalidades claras. Incluyen:

Promedios Móviles (Moving Averages): Suavizan las fluctuaciones calculando el promedio de un número fijo de observaciones pasadas.
Suavizado Exponencial (Exponential Smoothing): Asigna pesos decrecientes exponencialmente a las observaciones pasadas, dando más importancia a los datos recientes.
Modelos Autoregresivos (AR): Pronostican valores futuros basándose en una combinación lineal de sus propios valores pasados (AR(p) usa los p valores pasados).
ARIMA (Autoregressive Integrated Moving Average): Combina conceptos AR, de diferenciación (para manejar tendencias) y de promedios móviles para capturar patrones más complejos.
SARIMA (Seasonal ARIMA): Extiende ARIMA para incluir componentes estacionales, permitiendo modelar patrones recurrentes.

A pesar de su utilidad, los modelos clásicos tienen limitaciones. Les resulta difícil capturar patrones no lineales o irregulares, manejar datos de alta dimensión (muchas variables) y, en su mayoría, no pueden incorporar datos exógenos de manera efectiva. Muchos asumen relaciones lineales, lo cual no siempre se cumple en datos complejos.

Are language models actually useful for time series forecasting? — In this paper we showed that despite the recent popularity of LLMs in time series forecasting they do not appear to meaningfully improve performance. We experimented with simple ablations, showing that they maintain or improve the performance of the LLM-based counterparts while requiring considerably less compute.

Modelos de Machine Learning

A diferencia de los modelos clásicos, los modelos de ML utilizan algoritmos avanzados para aprender patrones y relaciones directamente de los datos. Esto los hace adecuados para datos complejos y de alta dimensión.

Regresión Lineal (Linear Regression): Modela la relación lineal entre la variable dependiente y los predictores. Es simple pero limitada por su suposición de linealidad.
Random Forest (Bosque Aleatorio): Un método de ensamble basado en árboles de decisión, muy efectivo para relaciones no lineales y datos de alta dimensión.
Gradient Boosting Machines (GBM): Otro método de ensamble que combina múltiples modelos débiles (como árboles) para crear un modelo fuerte. Ofrecen alta precisión predictiva.

Las ventajas de usar ML para pronóstico son notables:

Interpretabilidad: Muchos modelos de regresión o basados en árboles permiten entender la influencia de los predictores.
Escalabilidad: Pueden manejar grandes volúmenes de datos y numerosas variables.
Uso de Datos Exógenos: Pueden incorporar fácilmente información adicional de fuentes externas.
Captura de Patrones Complejos: Son capaces de modelar relaciones no lineales y complejas que los modelos clásicos no pueden.
Métodos de Ensamble: Se pueden combinar varios modelos de ML para mejorar la precisión y robustez.

Modelos de Deep Learning

Los modelos de Deep Learning (DL), como las Redes Neuronales Recurrentes (RNN), Long Short-Term Memory (LSTM) y modelos basados en Transformers, han ganado popularidad, especialmente para conjuntos de datos muy grandes con patrones complejos. Su arquitectura está diseñada para capturar dependencias a largo plazo en datos secuenciales.

Sin embargo, presentan desafíos significativos:

Interpretabilidad: A menudo se consideran "cajas negras" debido a su complejidad, lo que dificulta entender sus predicciones.
Recursos Computacionales: Requieren hardware especializado (GPUs, TPUs) y son computacionalmente intensivos para entrenar.
Requisitos de Datos: Generalmente necesitan una gran cantidad de datos para entrenar eficazmente.

Dado el enfoque de este artículo y las ventajas destacadas, nos centraremos en la aplicación de métodos de Machine Learning.

Pronóstico con Machine Learning

La aplicación de modelos de ML al pronóstico de series temporales requiere transformar los datos en un formato tabular adecuado, donde cada fila es una observación y cada columna es un predictor. Esto implica la ingeniería de características.

Ingeniería de Características

Es un paso crucial para preparar los datos de series temporales para los modelos de ML. Algunas técnicas comunes incluyen:

Características de Retraso (Lag Features): Consiste en incluir valores de la variable en pasos de tiempo anteriores como predictores. Por ejemplo, para predecir la temperatura de hoy, usamos la temperatura de ayer, anteayer, etc. El número de retrasos es un hiperparámetro a ajustar.
Características de Ventana (Window Features): Se calculan estadísticas de resumen (como media, desviación estándar) de un número fijo de observaciones pasadas dentro de una "ventana deslizante". Estas características ayudan a capturar tendencias locales y el comportamiento general de la serie.
Características Exógenas: Como se mencionó, se pueden incorporar variables externas que influyan en la serie. Esto puede incluir datos estáticos (como la ubicación) o datos que varían con el tiempo (como la humedad, o características de fecha y hora como el mes, día de la semana, hora). La clave es saber si se dispondrá de los valores futuros de estas variables al momento del pronóstico.

Métodos de Pronóstico

Una vez que los datos están preparados y el modelo de ML entrenado, necesitamos una estrategia para predecir múltiples pasos de tiempo en el futuro (el "horizonte de pronóstico"). Dos métodos comunes son:

Pronóstico Recursivo: Se entrena un único modelo de ML para predecir un paso de tiempo adelante. La predicción generada para el tiempo t+1 se utiliza luego como entrada para predecir el tiempo t+2, y así sucesivamente, de forma recursiva, hasta alcanzar el horizonte deseado. Es computacionalmente menos costoso ya que solo se entrena un modelo.
Pronóstico Directo: Para un horizonte de pronóstico de N pasos, se entrenan N modelos de ML separados. Cada modelo se entrena específicamente para predecir un paso de tiempo particular dentro del horizonte (por ejemplo, un modelo para t+1, otro para t+2, ..., otro para t+N). Este método es más costoso computacionalmente porque requiere entrenar múltiples modelos, pero en algunos casos puede ofrecer mejores resultados al optimizar cada predicción de paso de tiempo de forma independiente.

Característica	Modelos Clásicos	Modelos de Machine Learning
Complejidad de Patrones	Limitada (principalmente lineal, estacionalidad clara)	Alta (no lineal, irregular)
Datos de Alta Dimensión	Limitado	Bueno
Datos Exógenos	Generalmente no soportado	Fácil integración
Interpretabilidad	Generalmente buena	Depende del modelo (Regresión/Árboles vs. DL)
Requisitos de Datos	Moderados	Moderados a Altos
Coste Computacional	Bajo	Moderado a Alto

Preguntas Frecuentes

¿Cuál es la diferencia clave entre datos de series temporales univariadas y multivariadas?
Los datos univariados contienen una sola variable a lo largo del tiempo, mientras que los multivariados contienen dos o más variables a lo largo del tiempo.

¿Por qué es importante la ingeniería de características en el pronóstico con ML?
Los modelos de ML requieren datos en formato tabular. La ingeniería de características, como los retrasos y las ventanas, transforma los datos de series temporales a este formato y captura información relevante (como patrones pasados y tendencias locales) que el modelo puede aprender.

What is an autoregressive model for time series forecasting? — Autoregressive modeling is a machine learning technique most commonly used for time series analysis and forecasting that uses one or more values from previous time steps in a time series to create a regression.

¿Qué son los datos endógenos y exógenos en el contexto de series temporales?
Los datos endógenos son la propia variable que queremos pronosticar. Los datos exógenos son variables externas que pueden influir en la variable a pronosticar.

¿Cuál es la principal diferencia entre el pronóstico recursivo y directo?
El pronóstico recursivo utiliza un único modelo que predice paso a paso, usando la predicción anterior como entrada. El pronóstico directo entrena un modelo separado para cada paso en el horizonte de pronóstico.

¿Son los modelos de lenguaje grandes (LLMs) útiles para el pronóstico de series temporales?
Según la investigación mencionada, los estudios sugieren que la componente LLM en sí misma a menudo no mejora el rendimiento del pronóstico en comparación con modelos más simples o entrenados desde cero, e incluso puede degradarlo en algunos casos. Las estructuras de atención y parches parecen ser los elementos clave que contribuyen al rendimiento en estos modelos, no necesariamente la capacidad lingüística del LLM.

¿Qué modelo de ML es mejor para pronóstico de series temporales?
No hay un único "mejor" modelo. La elección depende de las características específicas de los datos: su tamaño, la complejidad de los patrones (lineales vs. no lineales), la presencia de estacionalidad o tendencias claras, la dimensionalidad y la necesidad de incorporar datos exógenos. Modelos como Random Forest y Gradient Boosting son a menudo muy efectivos por su capacidad para manejar complejidad y datos exógenos.

Conclusión

El Machine Learning ofrece un enfoque potente y flexible para el pronóstico de series temporales, superando muchas de las limitaciones de los métodos clásicos, especialmente cuando se trata de datos complejos y de alta dimensión. La correcta ingeniería de características, como la creación de retrasos y ventanas, y la elección entre métodos de pronóstico recursivo o directo son cruciales para el éxito. Dominar el pronóstico de series temporales con ML es una habilidad invaluable en el mundo actual basado en datos, aplicable en prácticamente todos los sectores, desde las finanzas hasta la gestión de la cadena de suministro y la atención médica. Comprender los tipos de datos, los modelos disponibles y las técnicas de preparación de datos permite anticipar tendencias futuras con mayor precisión y fundamentar decisiones estratégicas.

Si quieres conocer otros artículos parecidos a Pronóstico de Series Temporales con ML puedes visitar la categoría Automóviles.