Introducing G2.ai, the future of software buying.Try now

¿Qué son los modelos autorregresivos? Tipos, uso y beneficios

4 de Octubre de 2024
por Sagar Joshi

Los modelos autorregresivos (AR) son herramientas estadísticas utilizadas por los científicos de datos en la previsión de series temporales. Estos modelos utilizan datos pasados para hacer predicciones.

Muchas redes neuronales artificiales utilizan modelos autorregresivos para prever resultados usando sus datos de entrenamiento. Por ejemplo, si un líder de ventas quiere prever las ventas del próximo mes, un modelo AR estudia los datos de ventas del mes anterior para hacer la predicción.

El modelo AR fue desarrollado con fines de previsión y aumento de datos. Sirven como una fuente confiable para crear datos de entrenamiento para modelos de IA en sectores como la economía, las finanzas o la previsión meteorológica.

Por ejemplo, estos modelos ofrecen predicciones precisas de cambios de temperatura utilizando patrones históricos. También son valiosos en economía, donde predicen tasas de inflación y crecimiento del producto interno bruto (PIB) para ayudar a los responsables políticos a implementar planes efectivos.

Esta técnica se utiliza en el análisis de series temporales, que asume que el valor actual de la serie temporal es una función de sus valores pasados. Estos modelos utilizan técnicas matemáticas para evaluar la correlación probabilística entre elementos en una secuencia. Basándose en el conocimiento adquirido, adivinan el elemento desconocido.

Tomemos un ejemplo para entender esto mejor. Un modelo autorregresivo que procesa diferentes declaraciones en inglés identifica que la palabra "is" siempre sigue a "here". Cuando genera una nueva secuencia de palabras, automáticamente escribirá "here is" juntas.

Tipos de modelos autorregresivos

Aquí, tenemos algunos tipos notables de modelos autorregresivos para diferentes propósitos y tipos de datos.

  • Modelos autorregresivos (AR) predicen valores basándose en datos pasados.
  • Modelos de media móvil integrada autorregresiva (ARIMA) evalúan las diferencias entre valores en la serie en lugar de usar valores reales. La diferenciación de observaciones en bruto hace que la serie temporal sea estacionaria. La parte de media móvil suaviza las fluctuaciones a corto plazo promediando errores pasados.
  • El modelo autorregresivo vectorial (VAR) ayuda a predecir resultados para todas las series temporales basándose en sus valores pasados y los de otras series.
  • El modelo de media móvil integrada autorregresiva estacional (SARIMA) es una extensión del modelo ARIMA no estacional, pero puede manejar patrones estacionales. SARIMA considera dependencias a corto y largo plazo dentro de los datos.

¿Quieres aprender más sobre Software de Redes Neuronales Artificiales? Explora los productos de Red neuronal artificial.

Entendiendo los modelos autorregresivos en detalle

Los modelos de regresión múltiple predicen valores usando la combinación lineal del predictor. Sin embargo, los modelos autorregresivos usan una combinación de valores pasados para hacer predicciones. Un proceso AR (1) predice el valor actual basándose en el valor que lo precede inmediatamente. En el proceso AR (2), el valor actual se basa en dos valores precedentes. El proceso AR (0) se utiliza para ruido blanco. No depende de los términos intermedios.

Los modelos autorregresivos se basan en datos pasados y asumen que los factores que afectan los datos pasados permanecen iguales. Sin embargo, si estos factores cambian, los datos pueden volverse incorrectos.

A pesar de esto, los expertos mejoran estos modelos para tener mejor en cuenta los errores, la estacionalidad, las tendencias y los datos cambiantes para hacer predicciones. Un modelo avanzado de este tipo es el modelo de media móvil integrada autorregresiva (ARIMA) que hace predicciones precisas.

Encontrarás aplicaciones de modelos AR en muchas áreas donde necesitas:

  • Ver si hay falta de aleatoriedad
  • Predecir cambios futuros
  • Prever patrones recurrentes en los datos
  • Analizar datos de mercado

En general, su precisión en la predicción ayuda a las empresas a tomar mejores decisiones y mejorar la planificación para el futuro.

¿Cómo funciona el modelado autorregresivo?

Un modelo autorregresivo utiliza regresión lineal para predecir los valores siguientes.

Considera la ecuación de una línea (y=c*x+ m), donde y es la variable dependiente, y x es la variable independiente; c y m son constantes de todos los valores posibles de x y .

Por ejemplo, si tienes el conjunto de datos de entrada (x,y) como (1,4), (2,6), (3, 12). Los valores de las constantes c y m son 2 y 2. La ecuación se convierte en y = 2x+2. Trazar estas coordenadas en una línea recta y extrapolarlas dará un valor de y como 10 cuando x es igual a 4.

Así es como funciona la regresión lineal. Los modelos de autorregresión aplican regresión lineal con variables rezagadas de entradas anteriores. No utilizan variables independientes como la regresión lineal. El modelo autorregresivo asume que las variables anteriores influyen condicionalmente en el resultado de la siguiente variable.

La expresión a continuación representa el modelado autorregresivo.

ejemplo de modelado autorregresivo

Fuente: AWS

Y son los resultados de predicción de múltiples valores anteriores multiplicados por sus coeficientes, ϕ (phi). La fórmula considera pesos o parámetros que influyen en las variables predictoras y también tiene en cuenta el ruido aleatorio. Indica que hay margen para mejoras adicionales.

Los profesionales que utilizan el modelado autorregresivo ya sea añaden más valores rezagados o aumentan el número de pasos en la serie temporal para mejorar la precisión de los datos.

Cómo la IA generativa utiliza modelos autorregresivos

El modelado autorregresivo juega un papel crucial en ayudar a la IA generativa a entender la entrada del usuario. El transformador generativo preentrenado (GPT) utiliza el modelado de lenguaje autorregresivo para entender el lenguaje natural y generarlo de una manera que los humanos puedan entender.

Los modelos autorregresivos también apoyan a los modelos de aprendizaje profundo en la generación de imágenes después del análisis. Diferentes redes neuronales de procesamiento de imágenes como PixelRNN y PixelCNN predicen datos visuales utilizando el modelado autorregresivo. También tienen aplicaciones con respecto a la probabilidad de eventos de series temporales.

En algunas situaciones, los ingenieros de aprendizaje automático (ML) tienen una escasez de conjuntos de datos de entrenamiento. Si ese es el caso, recurren al modelado autorregresivo para generar nuevos y realistas entrenamientos de aprendizaje profundo que ayudan a los modelos de IA a mejorar el rendimiento.

Beneficios y limitaciones de los modelos autorregresivos

Varios beneficios de los modelos autorregresivos los hacen una opción adecuada para los científicos de datos.

Beneficios

Puedes usar la función de autocorrelación para decir si hay una falta de aleatoriedad en los conjuntos de datos. Además, usar una serie de variables propias te permite predecir posibles resultados incluso cuando falta información.

La serie de variables propias utiliza los valores rezagados de las variables dependientes como las variables independientes en el modelo. El modelo autorregresivo también es capaz de prever patrones recurrentes en los datos.

Limitaciones

El modelo autorregresivo debe tener un coeficiente de autocorrelación de al menos 0.5 para hacer una predicción precisa. El coeficiente de autocorrelación mide cuán correlacionada está una serie temporal consigo misma a lo largo del tiempo.

Diferentes técnicas regresivas para analizar variables

Además de los modelos autorregresivos, los científicos de datos emplean diferentes técnicas regresivas para analizar variables y sus interdependencias.

  • La regresión lineal utiliza varias variables independientes para predecir resultados dentro del mismo marco de tiempo. La autorregresión predice resultados futuros usando un tipo de variable y expandiéndola a lo largo de varios puntos.
  • La regresión polinómica captura relaciones entre variables no lineales que no pueden representarse en una línea recta.
  • La regresión logística predice la probabilidad de un evento en términos probabilísticos. El resultado se expresa en porcentajes en lugar de un rango de números.
  • La regresión de cresta es similar a la regresión lineal, pero restringe el coeficiente de un modelo. Esta técnica ayuda cuando el algoritmo es propenso a sobreajustarse. El sobreajuste ocurre cuando un modelo se entrena en exceso en un conjunto de datos y devuelve resultados inexactos para datos del mundo real.
  • La regresión Lasso restringe los coeficientes de las variables con un factor de penalización. Permite a los científicos de datos simplificar modelos complejos ignorando parámetros no críticos.

Haciendo las predicciones más fáciles

Los modelos AR son fáciles de implementar e interpretar ya que se centran solo en las relaciones lineales entre datos actuales y pasados. Sin embargo, el modelo se basa en la suposición de que los datos pasados capturan suficientemente toda la información relevante necesaria para predecir valores futuros, lo que influye en gran medida en su efectividad.

Estos modelos son una parte fundamental del análisis de series temporales. Su facilidad de uso y capacidad para modelar dependencias temporales los hacen adecuados para muchas aplicaciones en el mundo real.

Aprende más sobre los diferentes tipos de análisis de regresión que puedes usar para interpretar datos empresariales.

Sagar Joshi
SJ

Sagar Joshi

Sagar Joshi is a former content marketing specialist at G2 in India. He is an engineer with a keen interest in data analytics and cybersecurity. He writes about topics related to them. You can find him reading books, learning a new language, or playing pool in his free time.