Introducing G2.ai, the future of software buying.Try now

Quels sont les modèles autorégressifs ? Types, utilisation et avantages

4 Octobre 2024
par Sagar Joshi

Les modèles autorégressifs (AR) sont des outils statistiques utilisés par les data scientists dans la prévision des séries temporelles. Ces modèles utilisent des données passées pour faire des prédictions.

De nombreux réseaux de neurones artificiels utilisent des modèles autorégressifs pour prévoir des résultats en utilisant leurs données d'entraînement. Par exemple, si un responsable des ventes souhaite anticiper les ventes du mois prochain, un modèle AR étudie les données de ventes du mois précédent pour faire la prédiction.

Le modèle AR a été développé à des fins de prévision et d'augmentation des données. Ils servent de source fiable pour créer des données d'entraînement pour les modèles d'IA dans les secteurs de l'économie, de la finance ou de la prévision météorologique.

Par exemple, ces modèles fournissent des prédictions précises des changements de température en utilisant des schémas historiques. Ils sont également précieux en économie, où ils prédisent les taux d'inflation et la croissance du produit intérieur brut (PIB) pour aider les décideurs à mettre en œuvre des plans efficaces.

Cette technique est utilisée dans l'analyse des séries temporelles, qui suppose que la valeur actuelle de la série temporelle est une fonction de ses valeurs passées. Ces modèles utilisent des techniques mathématiques pour évaluer la corrélation probabiliste entre les éléments d'une séquence. Sur la base des connaissances acquises, ils devinent l'élément inconnu.

Prenons un exemple pour mieux comprendre cela. Un modèle autorégressif qui traite différentes déclarations en langue anglaise identifie que le mot « est » suit toujours « ici ». Lorsqu'il génère une nouvelle séquence de mots, il écrira automatiquement « ici est » ensemble.

Types de modèles autorégressifs

Voici quelques types notables de modèles autorégressifs pour différents objectifs et types de données.

  • Les modèles autorégressifs (AR) prédisent les valeurs en se basant sur des données passées.
  • Les modèles autorégressifs intégrés à moyenne mobile (ARIMA) évaluent les différences entre les valeurs de la série au lieu d'utiliser les valeurs réelles. La différenciation des observations brutes rend la série temporelle stationnaire. La partie moyenne mobile lisse les fluctuations à court terme en moyennant les erreurs passées.
  • Le modèle vectoriel autorégressif (VAR) aide à prédire les résultats pour toutes les séries temporelles en se basant sur leurs valeurs passées et celles des autres séries.
  • Le modèle autorégressif intégré à moyenne mobile saisonnier (SARIMA) est une extension du modèle ARIMA non saisonnier, mais il peut gérer les schémas saisonniers. SARIMA prend en compte les dépendances à court et à long terme au sein des données.

Vous voulez en savoir plus sur Logiciel de réseau de neurones artificiels ? Découvrez les produits Réseau de neurones artificiels.

Comprendre les modèles autorégressifs en détail

Les modèles de régression multiple prédisent les valeurs en utilisant la combinaison linéaire du prédicteur. Cependant, les modèles autorégressifs utilisent une combinaison de valeurs passées pour faire des prédictions. Un processus AR (1) prédit la valeur actuelle en se basant sur la valeur qui la précède immédiatement. Dans le processus AR (2), la valeur actuelle est basée sur deux valeurs précédentes. Le processus AR (0) est utilisé pour le bruit blanc. Il ne dépend pas des termes intermédiaires.

Les modèles autorégressifs sont basés sur des données passées et supposent que les facteurs affectant les données passées restent les mêmes. Cependant, si ces facteurs changent, les données peuvent devenir incorrectes.

Malgré cela, les experts améliorent ces modèles pour mieux prendre en compte les erreurs, la saisonnalité, les tendances et les données changeantes pour faire des prédictions. Un modèle avancé de ce type est le modèle autorégressif intégré à moyenne mobile (ARIMA) qui fait des prédictions précises.

Vous trouverez des applications du modèle AR dans de nombreux domaines où vous devez :

  • Voir s'il y a un manque de hasard
  • Prédire les changements futurs
  • Prévoir des schémas récurrents dans les données
  • Analyser les données de marché

Dans l'ensemble, leur précision de prédiction aide les entreprises à prendre de meilleures décisions et à améliorer la planification pour l'avenir.

Comment fonctionne la modélisation autorégressive ?

Un modèle autorégressif utilise la régression linéaire pour prédire les valeurs suivantes.

Considérons l'équation d'une ligne (y=c*x+ m), où y est la variable dépendante, et x est la variable indépendante ; c et m sont des constantes de toutes les valeurs possibles de x et .

Par exemple, si vous avez le jeu de données d'entrée (x,y) comme (1,4), (2,6), (3, 12). Les valeurs des constantes c et m sont 2 et 2. L'équation devient y = 2x+2. Tracer ces coordonnées sur une ligne droite et les extrapoler donnera une valeur de y de 10 lorsque x est égal à 4.

C'est ainsi que fonctionne la régression linéaire. Les modèles autorégressifs appliquent la régression linéaire avec des variables retardées des entrées précédentes. Ils n'utilisent pas de variables indépendantes comme la régression linéaire. Le modèle autorégressif suppose que les variables antérieures influencent conditionnellement le résultat de la variable suivante.

L'expression ci-dessous représente la modélisation autorégressive.

exemple de modélisation autorégressive

Source : AWS

Y est le résultat des prédictions de plusieurs valeurs précédentes multipliées par leurs coefficients, ϕ (phi). La formule prend en compte les poids ou paramètres qui influencent les variables prédictives et prend également en compte le bruit aléatoire. Cela indique qu'il y a une marge pour des améliorations supplémentaires.

Les professionnels qui utilisent la modélisation autorégressive ajoutent soit plus de valeurs retardées, soit augmentent le nombre d'étapes dans la série temporelle pour améliorer la précision des données.

Comment l'IA générative utilise les modèles autorégressifs

La modélisation autorégressive joue un rôle crucial en aidant l'IA générative à comprendre les entrées des utilisateurs. Le modèle transformateur génératif pré-entraîné (GPT) utilise la modélisation linguistique autorégressive pour comprendre le langage naturel et le générer d'une manière compréhensible par les humains.

Les modèles autorégressifs soutiennent également les modèles d'apprentissage profond dans la génération d'images après analyse. Différents réseaux de neurones de traitement d'images comme PixelRNN et PixelCNN prédisent les données visuelles en utilisant la modélisation autorégressive. Ils ont également des applications concernant la probabilité d'événements de séries temporelles.

Dans certaines situations, les ingénieurs en apprentissage automatique (ML) manquent de jeux de données d'entraînement. Dans ce cas, ils se tournent vers la modélisation autorégressive pour générer de nouvelles données d'entraînement réalistes qui aident les modèles d'IA à améliorer leurs performances.

Avantages et limitations des modèles autorégressifs

Plusieurs avantages des modèles autorégressifs en font un choix approprié pour les data scientists.

Avantages

Vous pouvez utiliser la fonction d'autocorrélation pour déterminer s'il y a un manque de hasard dans les jeux de données. De plus, l'utilisation d'une série auto-variable vous permet de prédire des résultats possibles même lorsque l'information manque.

La série auto-variable utilise les valeurs retardées des variables dépendantes comme variables indépendantes dans le modèle. Le modèle autorégressif est également capable de prévoir des schémas récurrents dans les données.

Limitations

Le modèle autorégressif doit avoir un coefficient d'autocorrélation d'au moins 0,5 pour faire une prédiction précise. Le coefficient d'autocorrélation mesure à quel point une série temporelle est corrélée avec elle-même au fil du temps.

Différentes techniques régressives pour analyser les variables

Outre les modèles autorégressifs, les data scientists emploient différentes techniques régressives pour analyser les variables et leurs interdépendances.

  • La régression linéaire utilise plusieurs variables indépendantes pour prédire des résultats dans le même laps de temps. L'autorégression prédit des résultats futurs en utilisant un type de variable et en l'étendant sur plusieurs points.
  • La régression polynomiale capture les relations entre des variables non linéaires qui ne peuvent pas être représentées par une ligne droite.
  • La régression logistique prédit la probabilité d'un événement en termes probabilistes. Le résultat est exprimé en pourcentages plutôt que dans une plage de nombres.
  • La régression de crête est similaire à la régression linéaire, mais elle restreint le coefficient d'un modèle. Cette technique aide lorsque l'algorithme est sujet au surapprentissage. Le surapprentissage se produit lorsqu'un modèle est surentraîné sur un ensemble de données et renvoie des résultats inexacts pour des données du monde réel.
  • La régression Lasso restreint les coefficients des variables avec un facteur de pénalité. Elle permet aux data scientists de simplifier des modèles complexes en ignorant les paramètres non critiques.

Rendre les prédictions plus faciles

Les modèles AR sont faciles à mettre en œuvre et à interpréter car ils se concentrent uniquement sur les relations linéaires entre les données actuelles et passées. Cependant, le modèle est basé sur l'hypothèse que les données passées capturent suffisamment toutes les informations pertinentes nécessaires pour prédire les valeurs futures, ce qui influence largement son efficacité.

Ces modèles sont une partie fondamentale de l'analyse des séries temporelles. Leur facilité d'utilisation et leur capacité à modéliser les dépendances temporelles les rendent adaptés à de nombreuses applications dans le monde réel.

En savoir plus sur les différents types d'analyse de régression que vous pouvez utiliser pour interpréter les données commerciales.

Sagar Joshi
SJ

Sagar Joshi

Sagar Joshi is a former content marketing specialist at G2 in India. He is an engineer with a keen interest in data analytics and cybersecurity. He writes about topics related to them. You can find him reading books, learning a new language, or playing pool in his free time.