Autoregressive (AR) Modelle sind statistische Werkzeuge, die von Datenwissenschaftlern in der Zeitreihenprognose verwendet werden. Diese Modelle nutzen vergangene Daten, um Vorhersagen zu treffen.
Viele künstliche neuronale Netze verwenden autoregressive Modelle, um mit ihren Trainingsdaten Ergebnisse vorherzusehen. Angenommen, ein Vertriebsleiter möchte die Verkäufe des nächsten Monats voraussehen, dann analysiert ein AR-Modell die Verkaufsdaten des Vormonats, um die Vorhersage zu treffen.
Das AR-Modell wurde für Prognose- und Datenaugmentierungszwecke entwickelt. Sie dienen als zuverlässige Quelle zur Erstellung von Trainingsdaten für KI-Modelle in den Bereichen Wirtschaft, Finanzen oder Wettervorhersage.
Zum Beispiel liefern diese Modelle genaue Vorhersagen von Temperaturänderungen anhand historischer Muster. Sie sind auch in der Wirtschaft wertvoll, wo sie Inflationsraten und das Wachstum des Bruttoinlandsprodukts (BIP) vorhersagen, um politischen Entscheidungsträgern zu helfen, effektive Pläne zu erarbeiten.
Was ist ein autoregressives Modell?
Ein autoregressives Modell ist ein statistisches Modell, das zukünftige Werte basierend auf vergangenen Daten vorhersagt. Es wendet lineare Regression auf aktuelle Reihen von vorherigen Werten an.
Diese Technik wird in der Zeitreihenanalyse verwendet, die davon ausgeht, dass der aktuelle Wert einer Zeitreihe eine Funktion seiner vergangenen Werte ist. Diese Modelle verwenden mathematische Techniken, um die probabilistische Korrelation zwischen Elementen in einer Sequenz zu bewerten. Basierend auf dem erworbenen Wissen raten sie das unbekannte Element.
Nehmen wir ein Beispiel, um dies weiter zu verstehen. Ein autoregressives Modell, das verschiedene englische Sprachsätze verarbeitet, erkennt, dass das Wort „is“ immer auf „here“ folgt. Wenn es eine neue Wortfolge generiert, wird es automatisch „here is“ zusammen schreiben.
Arten von autoregressiven Modellen
Hier haben wir einige bemerkenswerte Arten von autoregressiven Modellen für verschiedene Zwecke und Datentypen.
- Autoregressive (AR) Modelle sagen Werte basierend auf vergangenen Daten voraus.
- Autoregressive integrierte gleitende Durchschnittsmodelle (ARIMA) bewerten die Unterschiede zwischen den Werten in der Serie anstelle der tatsächlichen Werte. Die Differenzierung der Rohbeobachtungen macht die Zeitreihe stationär. Der gleitende Durchschnittsteil glättet kurzfristige Schwankungen, indem er vergangene Fehler mittelt.
- Das Vektorautoregressive (VAR) Modell hilft, Ergebnisse für alle Zeitreihen basierend auf ihren vergangenen Werten und denen der anderen Serien vorherzusagen.
- Das saisonale autoregressive integrierte gleitende Durchschnittsmodell (SARIMA) ist eine Erweiterung des nicht-saisonalen ARIMA-Modells, kann jedoch saisonale Muster handhaben. SARIMA berücksichtigt kurzfristige und langfristige Abhängigkeiten innerhalb der Daten.
Möchten Sie mehr über Künstliche Neuronale Netzwerk-Software erfahren? Erkunden Sie Künstliches Neuronales Netzwerk Produkte.
Verständnis von autoregressiven Modellen im Detail
Mehrere Regressionsmodelle sagen Werte voraus, indem sie die lineare Kombination des Prädiktors verwenden. Autoregressive Modelle verwenden jedoch eine Kombination aus vergangenen Werten, um Vorhersagen zu treffen. Ein AR(1)-Prozess sagt den aktuellen Wert basierend auf dem unmittelbar vorhergehenden Wert voraus. Im AR(2)-Prozess basiert der aktuelle Wert auf zwei vorhergehenden Werten. Der AR(0)-Prozess wird für weißes Rauschen verwendet. Er hängt nicht von den dazwischenliegenden Begriffen ab.
Autoregressive Modelle basieren auf vergangenen Daten und gehen davon aus, dass die Faktoren, die die vergangenen Daten beeinflussen, gleich bleiben. Wenn sich diese Faktoren jedoch ändern, können die Daten ungenau werden.
Trotzdem verbessern Experten diese Modelle, um Fehler, Saisonalität, Trends und sich ändernde Daten besser zu berücksichtigen, um Vorhersagen zu treffen. Ein solches fortschrittliches Modell ist das autoregressive integrierte gleitende Durchschnittsmodell (ARIMA), das genaue Vorhersagen macht.
Sie finden Anwendungen von AR-Modellen in vielen Bereichen, in denen Sie:
- sehen, ob es einen Mangel an Zufälligkeit gibt
- zukünftige Änderungen vorhersagen
- wiederkehrende Muster in Daten vorhersagen
- Marktdaten analysieren
Insgesamt hilft ihre Vorhersagegenauigkeit Unternehmen, bessere Entscheidungen zu treffen und die Planung für die Zukunft zu verbessern.
Wie funktioniert die autoregressive Modellierung?
Ein autoregressives Modell verwendet lineare Regression, um die folgenden Werte vorherzusagen.
Betrachten Sie die Gleichung für eine Linie (y=c*x+ m), wobei y die abhängige Variable ist und x die unabhängige Variable ist; c und m sind Konstanten aus allen möglichen Werten von x und .
Zum Beispiel, wenn Sie den Eingabedatensatz (x,y) als (1,4), (2,6), (3, 12) haben. Die Werte der Konstanten c und m sind 2 und 2. Die Gleichung wird zu y = 2x+2. Wenn Sie diese Koordinaten auf einer geraden Linie auftragen und extrapolieren, erhalten Sie einen Wert von y als 10, wenn x gleich 4 ist.
So funktioniert die lineare Regression. Autoregressive Modelle wenden lineare Regression mit verzögerten Variablen aus vorherigen Eingaben an. Sie verwenden keine unabhängigen Variablen wie die lineare Regression. Das autoregressive Modell geht davon aus, dass frühere Variablen bedingt das Ergebnis der nächsten Variablen beeinflussen.
Der untenstehende Ausdruck stellt die autoregressive Modellierung dar.
Quelle: AWS
Y sind die Vorhersageergebnisse mehrerer vorheriger Werte, multipliziert mit ihren Koeffizienten, ϕ (phi). Die Formel berücksichtigt Gewichte oder Parameter, die Prädiktorvariablen beeinflussen, und berücksichtigt auch das zufällige Rauschen. Sie zeigt, dass es Raum für weitere Verbesserungen gibt.
Fachleute, die autoregressive Modellierung verwenden, fügen entweder mehr verzögerte Werte hinzu oder erhöhen die Anzahl der Schritte in der Zeitreihe, um die Datengenauigkeit zu verbessern.
Wie generative KI autoregressive Modelle verwendet
Die autoregressive Modellierung spielt eine entscheidende Rolle dabei, generativer KI zu helfen, Benutzereingaben zu verstehen. Der generative vortrainierte Transformer (GPT)-Modell-Decoder verwendet autoregressive Sprachmodellierung, um natürliche Sprache zu verstehen und sie auf eine Weise zu generieren, die Menschen verstehen können.
Autoregressive Modelle unterstützen auch Deep-Learning-Modelle bei der Bildgenerierung nach der Analyse. Verschiedene Bildverarbeitungsneuronale Netze wie PixelRNN und PixelCNN sagen visuelle Daten mithilfe der autoregressiven Modellierung voraus. Sie haben auch Anwendungen in Bezug auf die Wahrscheinlichkeit von Zeitreihenereignissen.
In einigen Situationen haben Maschinenlern-Ingenieure einen Mangel an Trainingsdatensätzen. In diesem Fall greifen sie auf autoregressive Modellierung zurück, um neue und realistische Deep-Learning-Trainings zu generieren, die KI-Modelle bei der Leistungsverbesserung unterstützen.
Vorteile und Einschränkungen von autoregressiven Modellen
Mehrere Vorteile von autoregressiven Modellen machen sie zu einer geeigneten Wahl für Datenwissenschaftler.
Vorteile
Sie können die Autokorrelationsfunktion verwenden, um festzustellen, ob es einen Mangel an Zufälligkeit in den Datensätzen gibt. Darüber hinaus können Sie mit einer Selbstvariablenreihe mögliche Ergebnisse vorhersagen, selbst wenn Informationen fehlen.
Die Selbstvariablenreihe verwendet die verzögerten Werte der abhängigen Variablen als unabhängige Variablen im Modell. Das autoregressive Modell ist auch in der Lage, wiederkehrende Muster in Daten vorherzusagen.
Einschränkungen
Das autoregressive Modell muss einen Autokorrelationskoeffizienten von mindestens 0,5 haben, um eine genaue Vorhersage zu treffen. Der Autokorrelationskoeffizient misst, wie stark eine Zeitreihe mit sich selbst über die Zeit korreliert ist.
Verschiedene regressive Techniken zur Analyse von Variablen
Neben autoregressiven Modellen verwenden Datenwissenschaftler verschiedene regressive Techniken, um Variablen und ihre Abhängigkeiten zu analysieren.
- Lineare Regression verwendet mehrere unabhängige Variablen, um Ergebnisse innerhalb desselben Zeitrahmens vorherzusagen. Autoregression sagt zukünftige Ergebnisse voraus, indem sie einen Variablentyp verwendet und ihn über mehrere Punkte erweitert.
- Polynomiale Regression erfasst Beziehungen zwischen nichtlinearen Variablen, die nicht in einer geraden Linie dargestellt werden können.
- Logistische Regression sagt die Wahrscheinlichkeit eines Ereignisses in probabilistischen Begriffen voraus. Das Ergebnis wird in Prozent ausgedrückt, anstatt in einer Zahlenreihe.
- Ridge-Regression ist ähnlich wie die lineare Regression, schränkt jedoch den Koeffizienten eines Modells ein. Diese Technik hilft, wenn der Algorithmus anfällig für Überanpassung ist. Überanpassung tritt auf, wenn ein Modell übermäßig auf einen Datensatz trainiert wird und ungenaue Ergebnisse für reale Daten liefert.
- Lasso-Regression schränkt Variablenkoeffizienten mit einem Strafparameter ein. Sie ermöglicht es Datenwissenschaftlern, komplexe Modelle zu vereinfachen, indem sie nicht-kritische Parameter ignoriert.
Vorhersagen einfacher machen
AR-Modelle sind einfach zu implementieren und zu interpretieren, da sie sich nur auf lineare Beziehungen zwischen aktuellen und vergangenen Daten konzentrieren. Das Modell basiert jedoch auf der Annahme, dass vergangene Daten alle relevanten Informationen enthalten, die zur Vorhersage zukünftiger Werte benötigt werden, was seine Effektivität stark beeinflusst.
Diese Modelle sind ein grundlegender Bestandteil der Zeitreihenanalyse. Ihre Benutzerfreundlichkeit und Fähigkeit, zeitliche Abhängigkeiten zu modellieren, machen sie für viele Anwendungen in der realen Welt geeignet.
Erfahren Sie mehr über die verschiedenen Arten der Regressionsanalyse, die Sie zur Interpretation von Geschäftsdaten verwenden können.

Sagar Joshi
Sagar Joshi is a former content marketing specialist at G2 in India. He is an engineer with a keen interest in data analytics and cybersecurity. He writes about topics related to them. You can find him reading books, learning a new language, or playing pool in his free time.
