Einführung in ARIMA Nichtseasonale Modelle. ARIMA p, d, q Vorhersage Gleichung ARIMA Modelle sind in der Theorie die allgemeinste Klasse von Modellen für die Vorhersage einer Zeitreihe, die gemacht werden kann, um stationär zu sein, indem sie gegebenenfalls, wenn auch in Verbindung mit nichtlinearen Transformationen, differenziert werden Wie z. B. Protokollierung oder Abblendung, wenn nötig Eine zufällige Variable, die eine Zeitreihe ist, ist stationär, wenn ihre statistischen Eigenschaften alle über die Zeit konstant sind. Eine stationäre Serie hat keinen Trend, ihre Variationen um ihren Mittelwert haben eine konstante Amplitude, und sie wackelt in einer konsistenten Weise Dh ihre kurzfristigen zufälligen Zeitmuster sehen immer in einem statistischen Sinn gleich aus. Die letztere Bedingung bedeutet, dass ihre Autokorrelationskorrelationen mit ihren eigenen vorherigen Abweichungen vom Mittel konstant über die Zeit bleiben oder äquivalent, dass sein Leistungsspektrum über die Zeit konstant bleibt Variable dieses Formulars kann wie gewöhnlich als eine Kombination von Signal und Rauschen betrachtet werden, und das Signal, wenn man offensichtlich ist, könnte ein Muster der schnellen oder langsamen mittleren Reversion oder sinusförmigen Oszillation oder eines schnellen Wechseles im Zeichen sein, und es könnte auch haben Eine saisonale Komponente Ein ARIMA-Modell kann als ein Filter betrachtet werden, der versucht, das Signal vom Rauschen zu trennen, und das Signal wird dann in die Zukunft extrapoliert, um Prognosen zu erhalten. Die ARIMA-Prognosegleichung für eine stationäre Zeitreihe ist eine lineare, dh regression - Typ-Gleichung, in der die Prädiktoren aus Verzögerungen der abhängigen Variablen und / oder Verzögerungen der Prognosefehler bestehen. Das ist. Gezahlter Wert von Y eine Konstante und / oder eine gewichtete Summe aus einem oder mehreren neueren Werten von Y und einer gewichteten Summe von eins oder Neuere Werte der Fehler. Wenn die Prädiktoren nur aus verzögerten Werten von Y bestehen, ist es ein reines autoregressives, selbstregressives Modell, das nur ein Spezialfall eines Regressionsmodells ist und mit Standardregressionssoftware ausgestattet werden könnte Erstklassiges autoregressives AR 1 - Modell für Y ist ein einfaches Regressionsmodell, bei dem die unabhängige Variable nur Y um eine Periode LAG Y, 1 in Statgraphics oder YLAG1 in RegressIt liegt. Wenn einige der Prädiktoren Fehler der Fehler sind, ein ARIMA-Modell Es handelt sich dabei nicht um ein lineares Regressionsmodell, denn es gibt keine Möglichkeit, den letzten Periodenfehler als eigenständige Variable anzugeben, die Fehler müssen auf einer Periodendauer berechnet werden, wenn das Modell an die Daten angepasst ist. Aus technischer Sicht ist die Problem bei der Verwendung von verzögerten Fehlern als Prädiktoren ist, dass die Vorhersagen des Modells keine linearen Funktionen der Koeffizienten sind, obwohl sie lineare Funktionen der vergangenen Daten sind. Daher müssen Koeffizienten in ARIMA-Modellen, die verzögerte Fehler enthalten, durch nichtlineare Optimierungsmethoden hill-climbing geschätzt werden Anstatt nur ein System von Gleichungen zu lösen. Das Akronym ARIMA steht für Auto-Regressive Integrated Moving Average Lags der stationären Serie in der Prognose Gleichung heißen autoregressive Begriffe, Verzögerungen der Prognosefehler werden als gleitende durchschnittliche Ausdrücke und eine Zeitreihe bezeichnet Die gestört werden muss, um stationär zu sein, soll eine integrierte Version einer stationären Serie sein. Random-Walk - und Random-Trend-Modelle, autoregressive Modelle und exponentielle Glättungsmodelle sind alle Sonderfälle von ARIMA-Modellen. Ein nicht seasonales ARIMA-Modell wird klassifiziert Als ARIMA p, d, q Modell, wobei p die Anzahl der autoregressiven Terme ist. d ist die Anzahl der für die Stationarität benötigten Nichtseasonalunterschiede und ist die Anzahl der verzögerten Prognosefehler in der Vorhersagegleichung. Die Prognosegleichung ist Konstruiert wie folgt Zuerst bezeichne y die d-te Differenz von Y, die bedeutet. Hinweis, dass die zweite Differenz von Y der d 2 Fall ist nicht der Unterschied von 2 Perioden vor Vielmehr ist es die erste Differenz-of-the-first Unterschied, das ist das diskrete Analog einer zweiten Ableitung, dh die lokale Beschleunigung der Serie und nicht die lokale Tendenz. In Bezug auf y die allgemeine Prognose Gleichung ist. Hier sind die gleitenden durchschnittlichen Parameter s definiert, so dass ihre Zeichen sind negativ in der Gleichung, nach der Konvention von Box und Jenkins eingeführt Einige Autoren und Software einschließlich der R-Programmiersprache definieren sie so, dass sie Pluszeichen statt haben Wenn die tatsächlichen Zahlen in die Gleichung gesteckt sind, gibt es keine Mehrdeutigkeit, aber es ist wichtig zu wissen, welche Konvention Ihre Software verwendet, wenn Sie die Ausgabe lesen Oft werden die Parameter dort mit AR 1, AR 2, und MA 1, MA 2, etc. identifiziert. Um das passende ARIMA-Modell für Y zu identifizieren, beginnen Sie mit der Bestimmung der Reihenfolge der differenzierenden d Notwendigkeit Um die Serie zu stationieren und die Brutto-Features der Saisonalität zu entfernen, vielleicht in Verbindung mit einer Varianz-stabilisierenden Transformation wie Logging oder Deflating Wenn Sie an dieser Stelle stoppen und voraussagen, dass die differenzierte Serie konstant ist, haben Sie nur einen zufälligen Spaziergang oder zufällig platziert Trendmodell Allerdings können die stationärisierten Serien noch autokorrelierte Fehler aufweisen, was darauf hindeutet, dass in der Prognosegleichung auch eine Anzahl von AR-Terme p1 und / oder einige Anzahl MA-Terme q1 erforderlich sind. Verfahren zur Bestimmung der Werte von p, d und Q, die am besten für eine gegebene Zeitreihe sind, werden in späteren Abschnitten der Notizen besprochen, deren Links oben auf dieser Seite stehen, aber eine Vorschau auf einige der Arten von nicht-seasonalen ARIMA-Modellen, die häufig angetroffen werden, ist unten angegeben. ARIMA 1 , 0,0 erstklassiges autoregressives Modell, wenn die Serie stationär und autokorreliert ist, vielleicht kann es als ein Vielfaches ihres eigenen vorherigen Wertes prognostiziert werden, plus eine Konstante Die Prognosegleichung in diesem Fall ist. das ist Y, das auf sich selbst zurückgeblieben ist Eine Periode Dies ist ein ARIMA 1,0,0 Konstante Modell Wenn der Mittelwert von Y Null ist, dann wäre der konstante Term nicht enthalten. Wenn der Steigungskoeffizient 1 positiv und kleiner als 1 in der Größenordnung ist, muss er kleiner als 1 in sein Größe, wenn Y stationär ist, beschreibt das Modell das Mittel-Rückkehr-Verhalten, bei dem der nächste Perioden-s-Wert 1 mal so weit weg von dem Mittelwert liegen sollte, wie dieser Periodenwert Wenn 1 negativ ist, prognostiziert er das Mittel-Rückkehr-Verhalten mit Wechsel Von Zeichen, dh es sagt auch voraus, dass Y unterhalb der mittleren nächsten Periode sein wird, wenn es über dem Mittelwert dieser Periode liegt. In einem autoregressiven Modell der zweiten Ordnung ARIMA 2,0,0 würde es einen Y-t-2-Term geben Genau so gut und so weiter Abhängig von den Zeichen und Größenordnungen der Koeffizienten könnte ein ARIMA 2.0,0 Modell ein System beschreiben, dessen mittlere Reversion in einer sinusförmig oszillierenden Weise stattfindet, wie die Bewegung einer Masse auf einer Feder, die Wird zufälligen Schocks ausgesetzt. ARIMA 0,1,0 zufälliger Spaziergang Wenn die Serie Y nicht stationär ist, ist das einfachste Modell für sie ein zufälliges Spaziergangmodell, das als Begrenzungsfall eines AR 1 - Modells betrachtet werden kann Autoregressiver Koeffizient ist gleich 1, dh eine Reihe mit unendlich langsamer mittlerer Reversion Die Vorhersagegleichung für dieses Modell kann wie überall geschrieben werden, wo der konstante Term die durchschnittliche Periodenänderung ist, dh die Langzeitdrift in Y Dieses Modell könnte sein Als ein Nicht-Intercept-Regressionsmodell, bei dem die erste Differenz von Y die abhängige Variable ist, da sie nur eine nicht-seasonale Differenz und einen konstanten Term enthält, wird sie als ARIMA 0,1,0-Modell mit Konstante klassifiziert. Die zufällige Walk - Ohne - Drift-Modell wäre ein ARIMA-0,1,0-Modell ohne constant. ARIMA 1,1,0 differenzierte Autoregressive Modell erster Ordnung Wenn die Fehler eines zufälligen Walk-Modells autokorreliert sind, kann das Problem eventuell durch Hinzufügen einer Verzögerung behoben werden Der abhängigen Variablen zur Vorhersagegleichung - dh durch Rückkehr der ersten Differenz von Y auf sich selbst verzögert um eine Periode Dies würde die folgende Vorhersagegleichung ergeben, die umgeordnet werden kann. Dies ist ein autoregressives Modell erster Ordnung mit einer Ordnung von Nonseasonal differenzing und ein konstanter term - dh ein ARIMA 1,1,0 model. ARIMA 0,1,1 ohne konstante einfache exponentielle Glättung Eine weitere Strategie zur Korrektur autokorrelierter Fehler in einem zufälligen Walk-Modell wird durch das einfache exponentielle Glättungsmodell vorgeschlagen Für einige nichtstationäre Zeitreihen, z. B. solche, die geräuschvolle Schwankungen um ein langsam variierendes Mittel aufweisen, führt das zufällige Spaziergangmodell nicht so gut wie ein gleitender Durchschnitt der vergangenen Werte. Anders ausgedrückt, anstatt die jüngste Beobachtung als die Prognose der Nächste Beobachtung ist es besser, einen Durchschnitt der letzten Beobachtungen zu verwenden, um das Rauschen herauszufiltern und den lokalen Mittel genauer zu schätzen. Das einfache exponentielle Glättungsmodell verwendet einen exponentiell gewichteten gleitenden Durchschnitt der vergangenen Werte, um diesen Effekt zu erzielen. Die Vorhersagegleichung Denn das einfache exponentielle Glättungsmodell kann in einer Anzahl von mathematisch äquivalenten Formen geschrieben werden, von denen eine die sogenannte Fehlerkorrekturform ist, in der die vorherige Prognose in Richtung des von ihr vorgenommenen Fehlers eingestellt wird. Weil e t-1 Y T-1 - t-1 per definitionem kann dies umgeschrieben werden, da ist eine ARIMA 0,1,1 - without-konstante Prognosegleichung mit 1 1 - das bedeutet, dass man eine einfache exponentielle Glättung platzieren kann, indem man sie als ARIMA 0,1,1 Modell ohne Konstante, und der geschätzte MA 1 - Koeffizient entspricht 1-minus-alpha in der SES-Formel Erinnern Sie sich, dass im SES-Modell das Durchschnittsalter der Daten in den Prognosen von 1 Periode 1 beträgt Was bedeutet, dass sie tendenziell hinter Trends oder Wendepunkten um etwa 1 Perioden zurückbleiben. Daraus folgt, dass das Durchschnittsalter der Daten in den 1-Periodenprognosen eines ARIMA 0,1,1 - without-constant-Modells 1 1 - 1 Wenn also 1 0 8 das Durchschnittsalter 5 ist, so nähert sich das ARIMA 0,1,1 - without-konstantes Modell zu einem sehr langfristigen gleitenden Durchschnitt, und wenn 1 sich nähert, wird es Ein zufälliges Spaziergang ohne Drift-Modell. Was ist der beste Weg, um die Autokorrelation zu korrigieren, indem man AR-Terme hinzufügt oder MA-Terme hinzufügt. In den vorangegangenen zwei Modellen, die oben diskutiert wurden, wurde das Problem der autokorrelierten Fehler in einem zufälligen Walk-Modell auf zwei verschiedene Arten festgelegt Durch Hinzufügen eines verzögerten Wertes der differenzierten Reihe zur Gleichung oder Hinzufügen eines verzögerten Wertes des Prognosefehlers, welcher Ansatz am besten ist. Ein Schlüsselbund für diese Situation, der später ausführlicher erörtert wird, ist die positive Autokorrelation In der Regel am besten behandelt durch Hinzufügen eines AR-Begriffs zum Modell und negative Autokorrelation ist in der Regel am besten durch Hinzufügen eines MA-Begriffs In Business-und wirtschaftlichen Zeitreihen, negative Autokorrelation oft entsteht als Artefakt der Differenzierung Im Allgemeinen, differenziert reduziert positive Autokorrelation und kann sogar verursachen Ein Wechsel von positiver zu negativer Autokorrelation So wird das ARIMA-0,1,1-Modell, bei dem die Differenzierung von einem MA-Term begleitet wird, häufiger als ein ARIMA 1,1,0-Modell verwendet. ARIMA 0,1,1 mit konstantem Einfache exponentielle Glättung mit Wachstum Durch die Implementierung des SES-Modells als ARIMA-Modell erhalten Sie tatsächlich eine gewisse Flexibilität Zunächst einmal darf der geschätzte MA 1 - Koeffizient negativ sein, dies entspricht einem Glättungsfaktor größer als 1 in einem SES-Modell In der Regel nicht erlaubt durch das SES-Modell-Anpassungsverfahren Zweitens haben Sie die Möglichkeit, einen konstanten Begriff in das ARIMA-Modell einzubeziehen, wenn Sie es wünschen, um einen durchschnittlichen Nicht-Null-Trend zu schätzen. Das ARIMA-0,1,1-Modell mit Konstante hat Die Vorhersagegleichung. Die Prognosen für ein Periodenabschätzung von diesem Modell sind qualitativ ähnlich denen des SES-Modells, mit der Ausnahme, dass die Trajektorie der Langzeitprognosen typischerweise eine abfallende Linie ist, deren Steigung gleich mu ist, anstatt einer horizontalen Linie. ARIMA 0,2,1 oder 0,2,2 ohne konstante lineare exponentielle Glättung Lineare exponentielle Glättungsmodelle sind ARIMA-Modelle, die zwei Nichtseason-Differenzen in Verbindung mit MA-Terme verwenden. Der zweite Unterschied einer Serie Y ist nicht einfach der Unterschied zwischen Y und Selbst ist von zwei Perioden verzögert, aber vielmehr ist es der erste Unterschied der ersten Differenz - der Wechsel-in-der-Änderung von Y in der Periode t. Somit ist die zweite Differenz von Y in der Periode t gleich Yt-Y T-1 - Y t-1 - Y t-2 Y t - 2Y t-1 Y t-2 Eine zweite Differenz einer diskreten Funktion ist analog zu einer zweiten Ableitung einer stetigen Funktion, die die Beschleunigung oder Krümmung in der Funktion misst Zu einem gegebenen Zeitpunkt. Das ARIMA-0,2,2-Modell ohne Konstante prognostiziert, dass die zweite Differenz der Serie gleich einer linearen Funktion der letzten beiden Prognosefehler ist, die umgestellt werden kann, wo 1 und 2 die MA 1 sind Und MA 2 Koeffizienten Dies ist ein allgemeines lineares exponentielles Glättungsmodell, das im Wesentlichen das gleiche wie das Holt-Modell ist, und das Brown-Modell ist ein Spezialfall Es verwendet exponentiell gewichtete Bewegungsdurchschnitte, um sowohl eine lokale Ebene als auch einen lokalen Trend in der Serie zu schätzen. Term-Prognosen aus diesem Modell konvergieren zu einer Geraden, deren Steigung von der durchschnittlichen Tendenz abhängt, die gegen Ende der Serie beobachtet wird. ARIMA 1,1,2 ohne konstante gedämpfte Trend lineare exponentielle Glättung. Dieses Modell ist in den begleitenden Folien auf ARIMA dargestellt Modelle Es extrapoliert den lokalen Trend am Ende der Serie, aber legt es bei längeren Prognosehorizonten ab, um eine Note des Konservatismus einzuführen, eine Praxis, die empirische Unterstützung hat. Sehen Sie den Artikel auf Warum der gedämpfte Trend von Gardner und McKenzie und der Goldenen Regel arbeitet Artikel von Armstrong et al für Details. Es ist in der Regel ratsam, an Modellen, in denen mindestens eines von p und q ist nicht größer als 1, dh nicht versuchen, ein Modell wie ARIMA 2,1,2, wie dies zu passen Dürfte zu Überfüllung und Gemeinsamen Faktoren führen, die in den Anmerkungen zur mathematischen Struktur von ARIMA-Modellen näher erörtert werden. Spreadsheet-Implementierung ARIMA-Modelle wie die oben beschriebenen sind einfach in einer Tabellenkalkulation implementierbar. Die Vorhersagegleichung ist einfach ein Lineare Gleichung, die sich auf vergangene Werte der ursprünglichen Zeitreihen und vergangene Werte der Fehler bezieht. So können Sie eine ARIMA-Prognosekalkulationstabelle einrichten, indem Sie die Daten in Spalte A, die Prognosemethode in Spalte B und die Fehlerdaten abzüglich Prognosen in Spalte speichern C Die Prognoseformel in einer typischen Zelle in Spalte B wäre einfach ein linearer Ausdruck, der sich auf Werte in vorhergehenden Zeilen der Spalten A und C bezieht, multipliziert mit den entsprechenden AR - oder MA-Koeffizienten, die in anderen Zellen auf der Kalkulationstabelle gespeichert sind. Ich versuche es wirklich, Aber kämpfen, um zu verstehen, wie Autoregressive und Moving Average Arbeit Ich bin ziemlich schrecklich mit Algebra und Blick auf es doesn t wirklich verbessern mein Verständnis von etwas Was ich wirklich lieben ist ein extrem einfaches Beispiel von sagen 10 zeitabhängige Beobachtungen so kann ich sehen, wie Sie arbeiten So lasst uns sagen, dass du die folgenden Datenpunkte des Goldpreises hast. Zum Beispiel, zum Zeitpunkt 10, was wäre der Moving Average von Lag 2, MA 2 oder MA 1 und AR 1 oder AR 2.I Traditionell gelernt über Moving Average ist etwas wie. But bei der Betrachtung von ARMA-Modellen, wird MA als eine Funktion der vorherigen Fehler Begriffe erklärt, die ich kann nicht meinen Kopf um Ist es nur ein Züchter Weg der Berechnung der gleichen Sache. Ich habe das gefunden Post hilfreich Wie man SARIMAX intuitiv versteht, aber Whist die Algebra hilft, kann ich etwas wirklich deutlich sehen, bis ich ein vereinfachtes Beispiel davon sehe. Angesichts der Goldpreisdaten würdest du zuerst das Modell schätzen und dann sehen, wie es funktioniert Impulsantwort Analyse-Prognosen Vielleicht solltest du deine Frage nur auf den zweiten Teil verengen und die Schätzung beiseite lassen. Das heißt, du würdest eine AR 1 oder MA 1 oder was auch immer Modell zB xt 0 5 x varepsilont und fragen uns, wie funktioniert dieses besondere Modell Richard Hardy Aug 13 15 bei 19 58.Für jedes AR q Modell die einfache Möglichkeit, den Parameter s zu schätzen ist es, OLS zu verwenden - und führen Sie die Regression von. Pricet Beta0 Beta1 Cdot Preis dotso Betaq cdot Preis. Lets tun dies in R. Okay, also habe ich ein bisschen betrogen und die Arima-Funktion in R verwendet, aber es liefert die gleichen Schätzungen wie die OLS-Regression - versuchen Sie es. Jetzt können wir einen Blick haben Bei der MA 1 - Modell Jetzt ist das MA-Modell sehr unterschiedlich von der AR-Modell Die MA ist gewichtet Durchschnitt der vergangenen Perioden Fehler, wo als AR-Modell verwendet die vorherigen Perioden tatsächlichen Datenwerte Die MA 1 ist. Pricet mu wt theta1 cdot w. Wo mu ist der Mittelwert und wt sind die Fehlerbegriffe - nicht die previoes Wert des Preises wie im AR-Modell Nun, leider können wir die Parameter durch etwas so einfach wie OLS schätzen, das ich nicht will Decken Sie die Methode hier, aber die R-Funktion arima verwendet maximale Likihood Lets try. Hope das hilft. 2 In Bezug auf die MA 1 Frage Sie sagen, der Rest ist 1 0023 für die zweite Periode Das macht Sinn Mein Verständnis der Rest ist es ist der Unterschied zwischen dem prognostizierten Wert und dem beobachteten Wert Aber Sie sagen dann den prognostizierten Wert für Zeitraum 2, ist Berechnet mit dem Rest für Periode 2 Ist das Recht Isn t der prognostizierte Wert für Periode 2 nur 0 5423 0 4 9977 Wird TE Aug 17 15 bei 11 24.Autoregressive Moving-Average Error Processes. Autoregressive Moving-Average-Fehler Prozesse ARMA-Fehler und andere Modelle, die Verzögerungen von Fehlerbegriffen beinhalten, können durch Verwendung von FIT - Anweisungen geschätzt und mit SOLVE - Anweisungen simuliert oder prognostiziert werden. ARMA - Modelle für den Fehlerprozess werden häufig für Modelle mit autokorrelierten Resten verwendet. Das AR - Makro kann verwendet werden, um Modelle mit autoregressiven Fehlerprozessen zu spezifizieren MA-Makro kann verwendet werden, um Modelle mit gleitenden durchschnittlichen Fehlerprozessen zu spezifizieren. Autoregressive Fehler. Ein Modell mit erstklassigen autoregressiven Fehlern, AR 1, hat die Form. while ein AR 2 Fehlerprozess hat die Form. und so weiter für höher - Auftragsprozesse Beachten Sie, dass die s unabhängig und identisch verteilt sind und einen erwarteten Wert von 0 haben. Ein Beispiel für ein Modell mit einer AR 2 - Komponente ist und so weiter für höherwertige Prozesse. Zum Beispiel können Sie eine einfache lineare Regression schreiben Modell mit MA 2 Moving-Average-Fehlern, da MA1 und MA2 die Moving-Average-Parameter sind. Hinweis, dass RESID Y automatisch von PROC MODEL as. Note definiert wird, dass RESID Y negativ ist. Die ZLAG-Funktion muss für MA-Modelle verwendet werden Um die Rekursion der Verzögerungen zu verkürzen Dies stellt sicher, dass die verzögerten Fehler in der Lag-Priming-Phase bei Null anfangen und fehlende Werte nicht ausbreiten, wenn Verzögerungs-Priming-Periodenvariablen fehlen, und es stellt sicher, dass die zukünftigen Fehler null sind, anstatt zu fehlen Simulation oder Prognose Für Details über die Lag-Funktionen, siehe den Abschnitt Lag Logic. This Modell geschrieben mit dem MA-Makro ist wie folgt. General Form für ARMA-Modelle. Die allgemeine ARMA p, q Prozess hat die folgende Form. An ARMA p, q Modell kann wie folgt spezifiziert werden: Wo AR i und MA j die autoregressiven und gleitenden Mittelwerte für die verschiedenen Verzögerungen darstellen, können Sie beliebige Namen für diese Variablen verwenden und es gibt viele gleichwertige Möglichkeiten, die Spezifikation zu schreiben ARMA-Prozesse können auch mit PROC MODEL geschätzt werden. Beispielsweise kann ein zweibändiger AR 1 - Verfahren für die Fehler der beiden endogenen Variablen Y1 und Y2 wie folgt spezifiziert werden: Konvergenzprobleme mit ARMA-Modellen. ARMA-Modelle können schwer abschätzen sein Die Parameterschätzungen liegen nicht innerhalb des entsprechenden Bereichs, die Restguthaben des Gleitmittel-Modells wachsen exponentiell Die berechneten Residuen für spätere Beobachtungen können sehr groß sein oder überlaufen. Dies kann entweder geschehen, weil falsche Startwerte verwendet wurden oder weil die Iterationen weggezogen wurden Vernünftige Werte. Care sollte bei der Auswahl von Startwerten für ARMA-Parameter verwendet werden. Startwerte von 0 001 für ARMA-Parameter funktionieren in der Regel, wenn das Modell gut auf die Daten passt und das Problem gut konditioniert ist. Beachten Sie, dass ein MA-Modell oft mit einem hohen Pegel angenähert werden kann AR-Modell und umgekehrt Dies kann zu einer hohen Kollinearität in gemischten ARMA-Modellen führen, was wiederum eine ernsthafte Konditionierung in den Berechnungen und Instabilitäten der Parameterschätzungen verursachen kann. Wenn Sie Konvergenzprobleme haben, während Sie ein Modell mit ARMA-Fehler schätzen Prozesse, versuchen, in Schritten zu schätzen Zuerst verwenden Sie eine FIT-Anweisung, um nur die strukturellen Parameter mit den ARMA-Parametern auf Null oder zu vernünftigen vorherigen Schätzungen zu schätzen, falls verfügbar Als nächstes verwenden Sie eine andere FIT-Anweisung, um die ARMA-Parameter nur mit dem Strukturparameter zu schätzen Werte aus dem ersten Lauf Da die Werte der Strukturparameter wahrscheinlich nahe an ihren endgültigen Schätzungen liegen, können die ARMA-Parameter-Schätzungen nun konvergieren. Schließlich verwenden wir eine andere FIT-Anweisung, um gleichzeitige Schätzungen aller Parameter zu erzeugen. Da die Anfangswerte der Parameter Sind nun wahrscheinlich ganz in der Nähe ihrer endgültigen gemeinsamen Schätzungen, die Schätzungen sollten schnell konvergieren, wenn das Modell für die data. AR Initial Conditions geeignet ist. Die anfänglichen Verzögerungen der Fehlerausdrücke von AR p-Modellen können auf unterschiedliche Weise modelliert werden. Die autoregressive Fehler-Start-Methoden, die von SAS-ETS-Prozeduren unterstützt werden, sind die folgenden kleinsten Quadrate ARIMA - und MODEL-Prozeduren. bedingten kleinsten Quadrate AUTOREG-, ARIMA - und MODELL-Prozeduren. Maximum Wahrscheinlichkeit AUTOREG-, ARIMA - und MODELL-Prozeduren. Jugend-Walker-AUTOREG-Prozedur nur. Hildreth - Lu, die die ersten P-Beobachtungen MODELL-Prozedur nur löscht. Siehe Kapitel 8, die AUTOREG-Prozedur, für eine Erläuterung und Diskussion der Vorzüge der verschiedenen AR p Startmethoden. Die CLS-, ULS-, ML - und HL-Initialisierungen können von PROC durchgeführt werden MODEL Bei AR 1 - Fehlern können diese Initialisierungen wie in Tabelle 18 2 dargestellt hergestellt werden. Diese Methoden sind in großen Samples äquivalent. Tabelle 18 2 Initialisierungen, die von PROC MODEL AR 1 ERRORS durchgeführt werden. Die anfänglichen Verzögerungen der Fehlerterme von MA q - Modellen können auch Auf unterschiedliche Weise modelliert werden Die folgenden gleitenden durchschnittlichen Fehler-Start-up-Paradigmen werden von den ARIMA - und MODEL-Prozeduren unterstützt. bedingten kleinsten Quadrate. Konditionale kleinste Quadrate. Die bedingte Methode der kleinsten Quadrate zur Schätzung von gleitenden durchschnittlichen Fehlerbegriffen ist nicht optimal, weil sie ignoriert wird Das Start-up-Problem Dies verringert die Effizienz der Schätzungen, obwohl sie nach wie vor bleiben Die anfänglichen verzögerten Residuen, die sich vor dem Start der Daten erstrecken, werden als 0 angenommen, ihr unbedingter Erwartungswert Dies führt zu einem Unterschied zwischen diesen Resten und dem Generalisierten Kleinste Quadrate Reste für die gleitende durchschnittliche Kovarianz, die im Gegensatz zum autoregressiven Modell durch den Datensatz bestehen bleibt. Normalerweise konvergiert dieser Unterschied schnell auf 0, aber für fast nicht einwandelbare gleitende Durchschnittsprozesse ist die Konvergenz ziemlich langsam Um dieses Problem zu minimieren, sollten Sie Haben viele Daten, und die gleitenden durchschnittlichen Parameterschätzungen sollten gut innerhalb des invertierbaren Bereichs liegen. Dieses Problem kann auf Kosten des Schreibens eines komplexeren Programms korrigiert werden. Unbedingte kleinste Quadrate Schätzungen für den MA 1 Prozess können durch die Angabe des Modells erzeugt werden Wie folgt. Moving-durchschnittliche Fehler können schwer zu schätzen sein Sie sollten die Verwendung einer AR p-Näherung an den gleitenden Durchschnittsprozess verwenden. Ein gleitender Durchschnittsprozess kann in der Regel durch einen autoregressiven Prozess gut angenähert werden, wenn die Daten nicht geglättet oder differenziert wurden. Das AR-Makro. Das SAS-Makro AR generiert Programmieranweisungen für PROC MODEL für autoregressive Modelle Das AR-Makro ist Teil der SAS-ETS-Software und es müssen keine speziellen Optionen für die Verwendung des Makros eingestellt werden. Der autoregressive Prozess kann auf die strukturelle Gleichung angewendet werden Fehler oder die endogene Serie selbst. Das AR-Makro kann für die folgenden Arten von autoregression. unrestricted Vektor autoregression. restricted Vektor autoregression. Univariate Autoregression verwendet werden. Um Modell der Fehler Begriff einer Gleichung als autoregressive Prozess, verwenden Sie die folgende Anweisung nach Die Gleichung. Zum Beispiel nehmen wir an, dass Y eine lineare Funktion von X1, X2 und ein AR 2 - Fehler ist. Sie würden dieses Modell wie folgt schreiben. Die Anrufe nach AR müssen nach allen Gleichungen kommen, die der Prozess anwendet Makroaufruf, AR y, 2, erzeugt die in der LIST-Ausgabe in Abbildung 18 58 dargestellten Aussagen. Abbildung 18 58 LIST Option Ausgang für ein AR 2 - Modell Die PRED-vordefinierten Variablen sind temporäre Programmvariablen, die verwendet werden, so dass die Verzögerungen der Residuen sind Die korrekten Residuen und nicht die, die durch diese Gleichung neu definiert werden. Beachten Sie, dass dies den Aussagen entspricht, die explizit im Abschnitt Allgemeine Formular für ARMA-Modelle geschrieben sind. Sie können die autoregressiven Parameter auch bei ausgewählten Lags auf Null setzen. Wenn Sie beispielsweise autoregressive Parameter wünschen Bei den Verzögerungen 1, 12 und 13 können Sie die folgenden Aussagen verwenden. Diese Anweisungen erzeugen die in Abbildung 18 59 dargestellte Ausgabe. Abbildung 18 59 LIST Option Ausgang für ein AR-Modell mit Lags bei 1, 12 und 13.Die MODEL-Prozedur. Listing of Compiled Program Code. Statement als Parsed. PRED yab x1 c x2.RESID y PRED y - ACTUAL y. ERROR y PRED y - y. OLDPRED y PRED y yl1 ZLAG1 y - perdy yl12 ZLAG12 y - perdy yl13 ZLAG13 y - PREDY. RESID y PRED y - ACTUAL y. ERROR y PRED y - y. Es gibt Variationen über die bedingte Methode der kleinsten Quadrate, je nachdem, ob Beobachtungen am Anfang der Serie zum Aufwärmen des AR Prozesses verwendet werden. Standardmäßig ist die AR Bedingte Methode der kleinsten Quadrate verwendet alle Beobachtungen und nimmt Nullen für die anfänglichen Verzögerungen von autoregressiven Begriffen an. Mit Hilfe der M-Option können Sie verlangen, dass AR die bedingungslose Kleinste-Quadrate-ULS - oder Maximum-Likelihood-ML-Methode verwendet. Zum Beispiel. Diskussionen dieser Methoden ist Die im Abschnitt AR-Initialbedingungen zur Verfügung gestellt werden. Mit der Option M CLS n können Sie verlangen, dass die ersten n Beobachtungen verwendet werden, um Schätzungen der ursprünglichen autoregressiven Verzögerungen zu berechnen. In diesem Fall beginnt die Analyse mit der Beobachtung n 1 Zum Beispiel können Sie Verwenden Sie das AR-Makro, um ein autoregressives Modell an die endogene Variable anstelle des Fehlerbegriffs anzuwenden, indem Sie die Option TYPE V verwenden. Wenn Sie z. B. die fünf vergangenen Verzögerungen von Y der Gleichung im vorherigen Beispiel hinzufügen möchten, Konnte AR verwenden, um die Parameter und die Verzögerungen zu erzeugen, indem man die folgenden Aussagen verwendet. Die vorherigen Aussagen erzeugen die in Abbildung 18 60 gezeigte Ausgabe. Abbildung 18 60 LIST Option Ausgabe für ein AR-Modell von Y. Dieses Modell prognostiziert Y als lineare Kombination von X1 , X2, ein Intercept und die Werte von Y in den letzten fünf Perioden. Unterrestierte Vektor Autoregression. Um die Fehlerbegriffe eines Satzes von Gleichungen als Vektor autoregressiven Prozess zu modellieren, verwenden Sie die folgende Form des AR-Makros nach den Gleichungen. Der Prozeßname-Wert ist ein beliebiger Name, den Sie für AR verwenden, um Namen für die autoregressiven Parameter zu verwenden. Sie können das AR-Makro verwenden, um mehrere verschiedene AR-Prozesse für verschiedene Sätze von Gleichungen zu modellieren, indem Sie für jeden Satz unterschiedliche Prozessnamen verwenden. Der Prozessname stellt sicher, dass Die verwendeten Variablennamen sind eindeutig Verwenden Sie einen kurzen Prozeßnamenwert für den Prozeß, wenn Parameterschätzungen in einen Ausgabedatensatz geschrieben werden sollen. Das AR-Makro versucht, Parameternamen kleiner oder gleich acht Zeichen zu erstellen, aber dies ist durch die Länge von begrenzt Prozessname, der als Präfix für die AR-Parameternamen verwendet wird. Der Variablenlistenwert ist die Liste der endogenen Variablen für die Gleichungen. Zum Beispiel nehmen wir an, dass Fehler für die Gleichungen Y1, Y2 und Y3 durch einen autoregressiven Prozess zweiter Ordnung erzeugt werden Sie können die folgenden Aussagen verwenden, die für Y1 und ähnlichen Code für Y2 und Y3 generieren. Nur die bedingte kleinste Quadrate M CLS oder M CLS n Methode können für Vektorprozesse verwendet werden. Sie können auch das gleiche Formular mit Einschränkungen verwenden Die Koeffizientenmatrix ist bei ausgewählten Verzögerungen 0. Zum Beispiel geben die folgenden Aussagen einen Vektorprozess dritter Ordnung an die Gleichungsfehler mit allen Koeffizienten bei Verzögerung 2, die auf 0 beschränkt ist, und mit den Koeffizienten bei Verzögerungen 1 und 3 uneingeschränkt Drei Serien Y1 Y3 als Vektor autoregressiver Prozess in den Variablen statt in den Fehlern unter Verwendung der TYPE V Option Wenn du Y1 Y3 als Funktion von vergangenen Werten von Y1 Y3 und einigen exogenen Variablen oder Konstanten modellieren möchtest, kannst du AR verwenden Um die Aussagen für die Verzögerungsbegriffe zu erzeugen Schreiben Sie eine Gleichung für jede Variable für den nichtautoregressiven Teil des Modells und rufen Sie dann AR mit der Option TYPE V an. Beispielsweise kann der nichtautoregressive Teil des Modells eine Funktion exogener Variablen sein Können Intercept-Parameter sein Wenn es keine exogenen Komponenten zum Vektor-Autoregression-Modell gibt, einschließlich keine Abschnitte, dann null zu jeder der Variablen zuweisen Es muss eine Zuordnung zu jeder der Variablen geben, bevor AR aufgerufen wird. Dieses Beispiel modelliert den Vektor Y Y1 Y2 Y3 als lineare Funktion nur von seinem Wert in den vorherigen zwei Perioden und einem weißen Rauschfehlervektor Das Modell hat 18 3 3 3 3 Parameter. Syntax des AR Macro. Es gibt zwei Fälle der Syntax des AR-Makros Wenn Einschränkungen Auf einem Vektor AR-Prozess nicht benötigt wird, hat die Syntax des AR-Makros die allgemeine Form. Spezifiziert ein Präfix für AR, um bei der Erstellung von Namen von Variablen zu verwenden, die benötigt werden, um den AR-Prozess zu definieren Wenn der Endolist nicht angegeben ist, wird die endogene Liste standardmäßig verwendet Name, der der Name der Gleichung sein muss, auf die der AR-Fehlerprozess angewendet werden soll. Der Namenswert darf 32 Zeichen nicht überschreiten. Ist die Reihenfolge des AR-Prozesses. Geben Sie die Liste der Gleichungen, auf die der AR-Prozess angewendet werden soll Mehr als ein name gegeben ist, wird ein uneingeschränkter vektorprozess mit den strukturellen residualen aller gleichberechtigten Gleichungen in jeder der Gleichungen erstellt. Wenn nicht spezifiziert, endet der endolistische Standardwert. Die Liste der Verzögerungen, an denen die AR-Terme liegen soll Hinzugefügt werden. Die Koeffizienten der Begriffe bei nicht aufgeführten Verzögerungen werden auf 0 gesetzt. Alle aufgeführten Lags müssen kleiner oder gleich nlag sein und es müssen keine Duplikate vorhanden sein. Wenn nicht angegeben, wird die Laglist standardmäßig auf alle Verzögerungen 1 bis nlag gesetzt Schätzmethode zur Implementierung Gültige Werte von M sind CLS bedingte kleinste Quadrate Schätzungen, ULS unbedingte kleinste Quadrate Schätzungen und ML Maximum Likelihood Schätzungen M CLS ist die Voreinstellung Nur M CLS ist erlaubt, wenn mehr als eine Gleichung angegeben ist Die ULS und ML Methoden sind nicht Unterstützt für Vektor-AR-Modelle von AR. Spezialisiert, dass der AR-Prozess auf die endogenen Variablen selbst anstatt auf die strukturellen Residuen der Gleichungen angewendet werden soll. Restricted Vector Autoregression. Sie können steuern, welche Parameter in den Prozess eingeschlossen sind, auf 0 beschränken Jene Parameter, die Sie nicht einschließen Zuerst verwenden Sie AR mit der DEFER-Option, um die Variablenliste zu deklarieren und die Dimension des Prozesses zu definieren. Dann verwenden Sie zusätzliche AR-Aufrufe, um Begriffe für ausgewählte Gleichungen mit ausgewählten Variablen an ausgewählten Lags zu erzeugen. Zum Beispiel ist der Fehler Gleichungen ergeben sich wie folgt: Dieses Modell besagt, dass die Fehler für Y1 von den Fehlern von Y1 und Y2 abhängen, aber nicht Y3 bei beiden Verzögerungen 1 und 2 und dass die Fehler für Y2 und Y3 von den vorherigen Fehlern für alle drei Variablen abhängen , Aber nur bei Verzögerung 1. AR-Makro-Syntax für eingeschränkte Vektor-AR. Eine alternative Verwendung von AR erlaubt es, Einschränkungen für einen Vektor-AR-Prozess aufzuerlegen, indem er AR mehrmals aufruft, um verschiedene AR-Terme anzugeben und für verschiedene Gleichungen zu verzögern. Der erste Aufruf hat the general form. specifies a prefix for AR to use in constructing names of variables needed to define the vector AR process. specifies the order of the AR process. specifies the list of equations to which the AR process is to be applied. specifies that AR is not to generate the AR process but is to wait for further information specified in later AR calls for the same name value. The subsequent calls have the general form. is the same as in the first call. specifies the list of equations to which the specifications in this AR call are to be applied Only names specified in the endolist value of the first call for the name value can appear in the list of equations in eqlist. specifies the list of equations whose lagged structural residuals are to be included as regressors in the equations in eqlist Only names in the endolist of the first call for the name value can appear in varlist If not specified, varlist defaults to endolist. specifies the list of lags at which the AR terms are to be added The coefficients of the terms at lags not listed are set to 0 All of the listed lags must be less than or equal to the value of nlag and there must be no duplicates If not specified, laglist defaults to all lags 1 through nlag. The MA Macro. The SAS macro MA generates programming statements for PROC MODEL for moving-average models The MA macro is part of SAS ETS software, and no special options are needed to use the macro The moving-average error process can be applied to the structural equation errors The syntax of the MA macro is the same as the AR macro except there is no TYPE argument. When you are using the MA and AR macros combined, the MA macro must follow the AR macro The following SAS IML statements produce an ARMA 1, 1 3 error process and save it in the data set MADAT2.The following PROC MODEL statements are used to estimate the parameters of this model by using maximum likelihood error structure. The estimates of the parameters produced by this run are shown in Figure 18 61.Figure 18 61 Estimates from an ARMA 1, 1 3 Process. There are two cases of the syntax for the MA macro When restrictions on a vector MA process are not needed, the syntax of the MA macro has the general form. specifies a prefix for MA to use in constructing names of variables needed to define the MA process and is the default endolist. is the order of the MA process. specifies the equations to which the MA process is to be applied If more than one name is given, CLS estimation is used for the vector process. specifies the lags at which the MA terms are to be added All of the listed lags must be less than or equal to nlag and there must be no duplicates If not specified, the laglist defaults to all lags 1 through nlag. specifies the estimation method to implement Valid values of M are CLS conditional least squares estimates , ULS unconditional least squares estimates , and ML maximum likelihood estimates M CLS is the default Only M CLS is allowed when more than one equation is specified in the endolist. MA Macro Syntax for Restricted Vector Moving-Average. An alternative use of MA is allowed to impose restrictions on a vector MA process by calling MA several times to specify different MA terms and lags for different equations. The first call has the general form. specifies a prefix for MA to use in constructing names of variables needed to define the vector MA process. specifies the order of the MA process. specifies the list of equations to which the MA process is to be applied. specifies that MA is not to generate the MA process but is to wait for further information specified in later MA calls for the same name value. The subsequent calls have the general form. is the same as in the first call. specifies the list of equations to which the specifications in this MA call are to be applied. specifies the list of equations whose lagged structural residuals are to be included as regressors in the equations in eqlist. specifies the list of lags at which the MA terms are to be added.
No comments:
Post a Comment