Introducing G2.ai, the future of software buying.Try now

Cosa sono i modelli autoregressivi? Tipi, utilizzo e benefici

Ottobre 4, 2024
da Sagar Joshi

I modelli autoregressivi (AR) sono strumenti statistici utilizzati dai data scientist nelle previsioni delle serie temporali. Questi modelli utilizzano dati passati per fare previsioni.

Molte reti neurali artificiali utilizzano modelli autoregressivi per prevedere risultati utilizzando i loro dati di addestramento. Supponiamo, ad esempio, che un responsabile delle vendite voglia prevedere le vendite del mese prossimo, un modello AR studia i dati delle vendite del mese precedente per fare la previsione.

Il modello AR è stato sviluppato per scopi di previsione e aumento dei dati. Servono come fonte affidabile per creare dati di addestramento per modelli di intelligenza artificiale nei settori dell'economia, della finanza o delle previsioni meteorologiche.

Ad esempio, questi modelli forniscono previsioni accurate dei cambiamenti di temperatura utilizzando modelli storici. Sono anche preziosi in economia, dove prevedono i tassi di inflazione e la crescita del prodotto interno lordo (PIL) per aiutare i responsabili politici a mettere in atto piani efficaci.

Questa tecnica è utilizzata nell'analisi delle serie temporali, che assume che il valore corrente della serie temporale sia una funzione dei suoi valori passati. Questi modelli utilizzano tecniche matematiche per valutare la correlazione probabilistica tra elementi in una sequenza. Basandosi sulla conoscenza acquisita, indovinano l'elemento sconosciuto.

Prendiamo un esempio per capire meglio. Un modello autoregressivo che elabora diverse affermazioni in lingua inglese identifica che la parola "is" segue sempre "here". Quando genera una nuova sequenza di parole, scriverà automaticamente "here is" insieme.

Tipi di modelli autoregressivi

Qui, abbiamo alcuni tipi notevoli di modelli autoregressivi per scopi e tipi di dati diversi.

  • Modelli autoregressivi (AR) prevedono valori basandosi su dati passati.
  • Modelli autoregressivi integrati a media mobile (ARIMA) valutano le differenze tra i valori nella serie invece di utilizzare i valori effettivi. La differenziazione delle osservazioni grezze rende la serie temporale stazionaria. La parte della media mobile appiana le fluttuazioni a breve termine mediando gli errori passati.
  • Il modello autoregressivo vettoriale (VAR) aiuta a prevedere risultati per tutte le serie temporali basandosi sui loro valori passati e su quelli delle altre serie.
  • Il modello autoregressivo integrato a media mobile stagionale (SARIMA) è un'estensione del modello ARIMA non stagionale, ma può gestire modelli stagionali. SARIMA considera dipendenze a breve e lungo termine all'interno dei dati.

Vuoi saperne di più su Software di Reti Neurali Artificiali? Esplora i prodotti Rete Neurale Artificiale.

Comprendere i modelli autoregressivi in dettaglio

I modelli di regressione multipla prevedono valori utilizzando la combinazione lineare del predittore. Tuttavia, i modelli autoregressivi utilizzano una combinazione di valori passati per fare previsioni. Un processo AR (1) prevede il valore corrente basandosi sul valore che lo precede immediatamente. Nel processo AR (2), il valore corrente si basa su due valori precedenti. Il processo AR (0) è utilizzato per il rumore bianco. Non dipende dai termini intermedi.

I modelli autoregressivi si basano su dati passati e assumono che i fattori che influenzano i dati passati rimangano gli stessi. Tuttavia, se questi fattori cambiano, i dati possono diventare errati.

Nonostante ciò, gli esperti migliorano questi modelli per tenere meglio conto degli errori, della stagionalità, delle tendenze e dei dati in cambiamento per fare previsioni. Uno di questi modelli avanzati è un modello autoregressivo integrato a media mobile (ARIMA) che fa previsioni accurate.

Troverai applicazioni del modello AR in molte aree dove è necessario:

  • Vedere se c'è una mancanza di casualità
  • Prevedere cambiamenti futuri
  • Prevedere modelli ricorrenti nei dati
  • Analizzare i dati di mercato

Nel complesso, la loro accuratezza predittiva aiuta le aziende a prendere decisioni migliori e migliorare la pianificazione per il futuro.

Come funziona la modellazione autoregressiva?

Un modello autoregressivo utilizza la regressione lineare per prevedere i valori successivi.

Considera l'equazione per una linea (y=c*x+ m), dove y è la variabile dipendente, e x è la variabile indipendente; c e m sono costanti da tutti i possibili valori di x e .

Ad esempio, se hai il dataset di input (x,y) come (1,4), (2,6), (3, 12). I valori delle costanti c e m sono 2 e 2. L'equazione diventa y = 2x+2. Tracciando queste coordinate su una linea retta ed estraendole si otterrà un valore di y come 10 quando x è uguale a 4.

Questo è come funziona la regressione lineare. I modelli di autoregressione applicano la regressione lineare con variabili ritardate da input precedenti. Non utilizzano variabili indipendenti come la regressione lineare. Il modello autoregressivo assume che le variabili precedenti influenzino condizionatamente l'esito della variabile successiva.

L'espressione seguente rappresenta la modellazione autoregressiva.

esempio di modellazione autoregressiva

Fonte: AWS

Y è il risultato delle previsioni di più valori precedenti moltiplicati con i loro coefficienti, ϕ (phi). La formula considera i pesi o i parametri che influenzano le variabili predittive e tiene conto anche del rumore casuale. Indica che c'è margine per ulteriori miglioramenti.

I professionisti che utilizzano la modellazione autoregressiva aggiungono più valori ritardati o aumentano il numero di passaggi nella serie temporale per migliorare l'accuratezza dei dati.

Come l'IA generativa utilizza i modelli autoregressivi

La modellazione autoregressiva svolge un ruolo cruciale nell'aiutare l'IA generativa a comprendere l'input dell'utente. Il modello generativo pre-addestrato trasformatore (GPT) utilizza la modellazione linguistica autoregressiva per comprendere il linguaggio naturale e generarlo in un modo che gli esseri umani possano comprendere.

I modelli autoregressivi supportano anche i modelli di deep learning nella generazione di immagini dopo l'analisi. Diverse reti neurali di elaborazione delle immagini come PixelRNN e PixelCNN prevedono dati visivi utilizzando la modellazione autoregressiva. Hanno anche applicazioni riguardo alla probabilità di eventi di serie temporali.

In alcune situazioni, gli ingegneri del machine learning (ML) hanno una carenza di dataset di addestramento. In tal caso, si rivolgono alla modellazione autoregressiva per generare nuovi e realistici dati di addestramento di deep learning che aiutano i modelli di intelligenza artificiale a migliorare le prestazioni.

Vantaggi e limitazioni dei modelli autoregressivi

Diversi vantaggi dei modelli autoregressivi li rendono una scelta adatta per i data scientist.

Vantaggi

Puoi utilizzare la funzione di autocorrelazione per dire se c'è una mancanza di casualità nei dataset. Inoltre, utilizzare una serie di variabili auto permette di prevedere possibili risultati anche quando le informazioni sono scarse.

La serie di variabili auto utilizza i valori ritardati delle variabili dipendenti come variabili indipendenti nel modello. Il modello autoregressivo è anche in grado di prevedere modelli ricorrenti nei dati.

Limitazioni

Il modello autoregressivo deve avere un coefficiente di autocorrelazione di almeno 0,5 per fare una previsione accurata. Il coefficiente di autocorrelazione misura quanto una serie temporale è correlata con se stessa nel tempo.

Diverse tecniche regressive per analizzare le variabili

Oltre ai modelli autoregressivi, i data scientist impiegano diverse tecniche regressive per analizzare le variabili e le loro interdipendenze.

  • La regressione lineare utilizza diverse variabili indipendenti per prevedere risultati nello stesso arco temporale. L'autoregressione prevede risultati futuri utilizzando un tipo di variabile e espandendolo su diversi punti.
  • La regressione polinomiale cattura le relazioni tra variabili non lineari che non possono essere rappresentate in una linea retta.
  • La regressione logistica prevede la probabilità di un evento in termini probabilistici. Il risultato è espresso in percentuali piuttosto che in un intervallo di numeri.
  • La regressione ridge è simile alla regressione lineare, ma limita il coefficiente di un modello. Questa tecnica aiuta quando l'algoritmo è incline all'overfitting. L'overfitting si verifica quando un modello è sovra-addestrato su un set di dati e restituisce risultati inaccurati per dati del mondo reale.
  • La regressione lasso limita i coefficienti delle variabili con un fattore di penalità. Permette ai data scientist di semplificare modelli complessi ignorando parametri non critici.

Rendere le previsioni più facili

I modelli AR sono facili da implementare e interpretare poiché si concentrano solo sulle relazioni lineari tra dati correnti e passati. Tuttavia, il modello si basa sull'assunzione che i dati passati catturino sufficientemente tutte le informazioni rilevanti necessarie per prevedere i valori futuri, il che influenza in gran parte la sua efficacia.

Questi modelli sono una parte fondamentale dell'analisi delle serie temporali. La loro facilità d'uso e la capacità di modellare le dipendenze temporali li rendono adatti a molte applicazioni nel mondo reale.

Scopri di più sui diversi tipi di analisi di regressione che puoi utilizzare per interpretare i dati aziendali.

Sagar Joshi
SJ

Sagar Joshi

Sagar Joshi is a former content marketing specialist at G2 in India. He is an engineer with a keen interest in data analytics and cybersecurity. He writes about topics related to them. You can find him reading books, learning a new language, or playing pool in his free time.