Die ARIMA-Modelle sind in der Theorie die allgemeinste Klasse von Modellen zur Prognose einer Zeitreihe, die durch Differenzierung (wenn nötig) vielleicht 8220 stationary8221 gemacht werden kann In Verbindung mit nichtlinearen Transformationen, wie zB Protokollierung oder Abscheidung (falls erforderlich). Eine Zufallsvariable, die eine Zeitreihe ist, ist stationär, wenn ihre statistischen Eigenschaften alle über die Zeit konstant sind. Eine stationäre Reihe hat keinen Trend, ihre Variationen um ihren Mittelwert haben eine konstante Amplitude, und sie wackelt in einer konsistenten Weise. D. h. seine kurzzeitigen Zufallszeitmuster sehen immer im statistischen Sinne gleich aus. Die letztgenannte Bedingung bedeutet, daß ihre Autokorrelationen (Korrelationen mit ihren eigenen vorherigen Abweichungen vom Mittelwert) über die Zeit konstant bleiben oder daß ihr Leistungsspektrum über die Zeit konstant bleibt. Eine zufällige Variable dieser Form kann (wie üblich) als eine Kombination von Signal und Rauschen betrachtet werden, und das Signal (wenn eines offensichtlich ist) könnte ein Muster einer schnellen oder langsamen mittleren Reversion oder einer sinusförmigen Oszillation oder eines schnellen Wechsels im Vorzeichen sein , Und es könnte auch eine saisonale Komponente. Ein ARIMA-Modell kann als ein 8220filter8221 betrachtet werden, der versucht, das Signal vom Rauschen zu trennen, und das Signal wird dann in die Zukunft extrapoliert, um Prognosen zu erhalten. Die ARIMA-Vorhersagegleichung für eine stationäre Zeitreihe ist eine lineare (d. h. Regressionstyp-) Gleichung, bei der die Prädiktoren aus Verzögerungen der abhängigen Variablen und / oder Verzögerungen der Prognosefehler bestehen. Das heißt: Vorhergesagter Wert von Y eine Konstante und / oder eine gewichtete Summe aus einem oder mehreren neuen Werten von Y und / oder einer gewichteten Summe aus einem oder mehreren neuen Werten der Fehler. Wenn die Prädiktoren nur aus verzögerten Werten von Y bestehen, handelt es sich um ein reines autoregressives Modell (8220 selbst-regressed8221), das nur ein Spezialfall eines Regressionsmodells ist und mit einer Standard-Regressions-Software ausgestattet werden kann. Beispielsweise ist ein autoregressives Modell erster Ordnung (8220AR (1) 8221) für Y ein einfaches Regressionsmodell, bei dem die unabhängige Variable nur um eine Periode (LAG (Y, 1) in Statgraphics oder YLAG1 in RegressIt) verzögert ist. Wenn einige der Prädiktoren Verzögerungen der Fehler sind, handelt es sich bei einem ARIMA-Modell nicht um ein lineares Regressionsmodell, da es keine Möglichkeit gibt, 8220last period8217s error8221 als unabhängige Variable festzulegen: Die Fehler müssen auf einer Periodenperiode berechnet werden Wenn das Modell an die Daten angepasst ist. Aus technischer Sicht ist das Problem der Verwendung von verzögerten Fehlern als Prädiktoren, dass die Vorhersagen von model8217s keine linearen Funktionen der Koeffizienten sind. Obwohl es sich um lineare Funktionen der vergangenen Daten handelt. Daher müssen Koeffizienten in ARIMA-Modellen, die verzögerte Fehler enthalten, durch nichtlineare Optimierungsmethoden (8220hill-climbing8221) abgeschätzt werden, anstatt nur ein Gleichungssystem zu lösen. Das Akronym ARIMA steht für Auto-Regressive Integrated Moving Average. Die Verzögerungen der stationären Reihe in der Prognose-Gleichung werden als autoregressiveQuot-Terme bezeichnet, die Verzögerungen der Prognosefehler werden als mittlere Mittelwert-Terme bezeichnet und eine Zeitreihe, die differenziert werden muß, um stationär gemacht zu werden, wird als eine integrierte quotierte Version einer stationären Reihe bezeichnet. Random-walk und random-trend Modelle, autoregressive Modelle und exponentielle Glättungsmodelle sind alle Sonderfälle von ARIMA Modellen. Ein nicht seasonales ARIMA-Modell wird als ein quotarIMA-Modell (p, d, q) klassifiziert, wobei p die Anzahl der autoregressiven Terme ist, d die Anzahl der für die Stationarität benötigten Nicht-Seasonal-Differenzen ist und q die Anzahl der verzögerten Prognosefehler ist Die Vorhersagegleichung. Die Vorhersagegleichung ist wie folgt aufgebaut. Zuerst bezeichne y die d - te Differenz von Y. Das bedeutet, daß die zweite Differenz von Y (der Fall d2) nicht die Differenz von 2 Perioden ist. Es ist vielmehr die erste Differenz der ersten Differenz. Was das diskrete Analogon einer zweiten Ableitung ist, d. h. die lokale Beschleunigung der Reihe anstatt ihres lokalen Takts. In Bezug auf y. Ist die allgemeine Prognosegleichung: Hier sind die gleitenden Durchschnittsparameter (9528217s) so definiert, daß ihre Vorzeichen in der Gleichung negativ sind, und zwar nach der Konvention von Box und Jenkins. Einige Autoren und Software (einschließlich der Programmiersprache R) definieren sie so, dass sie stattdessen Pluszeichen haben. Wenn tatsächliche Zahlen in die Gleichung gesteckt werden, gibt es keine Mehrdeutigkeit, aber es ist wichtig zu wissen, welche Konvention Ihre Software verwendet, wenn Sie die Ausgabe lesen. Oft werden dort die Parameter mit AR (1), AR (2), 8230 und MA (1), MA (2), 8230 usw. bezeichnet. Um das entsprechende ARIMA-Modell für Y zu identifizieren, beginnt man die Reihenfolge der Differenzierung zu bestimmen (D) Notwendigkeit, die Serie zu stationarisieren und die Brutto-Merkmale der Saisonalität zu beseitigen, möglicherweise in Verbindung mit einer variationsstabilisierenden Transformation, wie beispielsweise Protokollierung oder Entleerung. Wenn Sie an diesem Punkt anhalten und voraussagen, dass die differenzierten Serien konstant sind, haben Sie lediglich ein zufälliges oder zufälliges Trendmodell angebracht. Die stationäre Reihe kann jedoch immer noch autokorrelierte Fehler aufweisen, was nahelegt, daß in der Vorhersagegleichung auch eine Anzahl von AR-Terme (p 8805 1) und / oder einige MA-MA-Terme (q 8805 1) benötigt werden. Der Prozess der Bestimmung der Werte von p, d und q, die für eine gegebene Zeitreihe am besten sind, werden in späteren Abschnitten der Notizen (deren Links oben auf dieser Seite sind), aber eine Vorschau von einigen der Typen erörtert Von nicht-saisonalen ARIMA-Modellen, die üblicherweise angetroffen werden, ist unten angegeben. ARIMA (1,0,0) Autoregressives Modell erster Ordnung: Wenn die Serie stationär und autokorreliert ist, kann sie möglicherweise als ein Vielfaches ihres eigenen vorherigen Wertes plus einer Konstante vorhergesagt werden. Die Prognose-Gleichung ist in diesem Fall 8230, die Y auf sich selbst zurückgeblieben um eine Periode zurückgeblieben ist. Dies ist ein 8220ARIMA (1,0,0) constant8221 Modell. Wenn der Mittelwert von Y Null ist, dann würde der konstante Term nicht eingeschlossen werden. Wenn der Steigungskoeffizient 981 & sub1; positiv und kleiner als 1 in der Grße ist (er muß kleiner als 1 in der Grße sein, wenn Y stationär ist), beschreibt das Modell ein Mittelrücksetzverhalten, bei dem der nächste Periodenblockwert 981 1 mal als vorhergesagt werden sollte Weit weg vom Durchschnitt, wie dieser Zeitraum8217s Wert. Wenn 981 & sub1; negativ ist, prognostiziert es ein Mittelwert-Wiederherstellungsverhalten mit einer Veränderung von Vorzeichen, d. h. es sagt auch voraus, daß Y unterhalb der mittleren nächsten Periode liegt, wenn sie über dem Mittel dieser Periode liegt. In einem autoregressiven Modell zweiter Ordnung (ARIMA (2,0,0)), würde es auch einen Yt-2-Term auf der rechten Seite geben, und so weiter. Abhängig von den Zeichen und Größen der Koeffizienten kann ein ARIMA (2,0,0) - Modell ein System beschreiben, dessen mittlere Reversion sinusförmig oszillierend erfolgt, wie die Bewegung einer Masse auf einer Feder, die zufälligen Schocks ausgesetzt ist . ARIMA (0,1,0) zufälliger Weg: Wenn die Reihe Y nicht stationär ist, ist das einfachste mögliche Modell ein zufälliges Wandermodell, das als Begrenzungsfall eines AR (1) - Modells betrachtet werden kann, in dem die autoregressive Koeffizient ist gleich 1, dh eine Reihe mit unendlich langsamer mittlerer Reversion. Die Vorhersagegleichung für dieses Modell kann folgendermaßen geschrieben werden: wobei der konstante Term die mittlere Periodenperiodenänderung (dh die Langzeitdrift) in Y ist. Dieses Modell könnte als ein No-Intercept-Regressionsmodell eingebaut werden, in dem die Die erste Differenz von Y ist die abhängige Variable. Da es nur einen nicht sonderbaren Unterschied und einen konstanten Term enthält, wird er als quotarima (0,1,0) - Modell mit constant. quot klassifiziert. Das random-walk-ohne - driftmodell wäre ein ARIMA (0,1, 0) - Modell ohne konstantes ARIMA (1,1,0) differenziertes autoregressives Modell erster Ordnung: Wenn die Fehler eines Zufallswegmodells autokorreliert werden, kann das Problem möglicherweise durch Hinzufügen einer Verzögerung der abhängigen Variablen zu der Vorhersagegleichung - - ie Durch Rückgang der ersten Differenz von Y auf sich selbst verzögert um eine Periode. Dies würde die folgende Vorhersagegleichung ergeben, die umgeordnet werden kann: Dies ist ein autoregressives Modell erster Ordnung mit einer Ordnung der Nichtsaisonaldifferenzierung und einem konstanten Term - d. e. Ein ARIMA (1,1,0) - Modell. ARIMA (0,1,1) ohne konstante einfache exponentielle Glättung: Eine weitere Strategie zur Korrektur autokorrelierter Fehler in einem Random-Walk-Modell wird durch das einfache exponentielle Glättungsmodell vorgeschlagen. Es sei daran erinnert, dass für einige nichtstationäre Zeitreihen (z. B. diejenigen, die geräuschschwankungen um einen langsam variierenden Mittelwert aufweisen) das Zufallswegmodell nicht ebenso gut funktioniert wie ein gleitender Durchschnitt von vergangenen Werten. Mit anderen Worten, anstatt die letzte Beobachtung als Prognose der nächsten Beobachtung zu nehmen, ist es besser, einen Durchschnitt der letzten Beobachtungen zu verwenden, um das Rauschen herauszufiltern und das lokale Mittel genauer zu schätzen. Das einfache exponentielle Glättungsmodell verwendet einen exponentiell gewichteten gleitenden Durchschnitt vergangener Werte, um diesen Effekt zu erzielen. Die Vorhersagegleichung für das einfache exponentielle Glättungsmodell kann in einer Anzahl mathematisch äquivalenter Formen geschrieben werden. Von denen eine die sogenannte 8220-Fehlerkorrektur8221-Form ist, in der die vorhergehende Prognose in der Richtung ihres Fehlers angepasst wird: Weil e t-1 Y t-1 - 374 t-1 per Definition umgeschrieben werden kann : Es handelt sich um eine ARIMA (0,1,1) - konstante Vorhersagegleichung mit 952 1 1 - 945. Dies bedeutet, dass Sie eine einfache exponentielle Glättung durch Angabe als ARIMA (0,1,1) - Modell ohne passen Konstant und der geschätzte MA (1) - Koeffizient entspricht 1-minus-alpha in der SES-Formel. Es sei daran erinnert, dass im SES-Modell das durchschnittliche Alter der Daten in den 1-Periodenprognosen 1/945 ist, was bedeutet, dass sie tendenziell hinter Trends oder Wendepunkten um etwa 1/945 Perioden zurückbleiben werden. Daraus folgt, dass das Durchschnittsalter der Daten in den 1-Periodenprognosen eines ARIMA-Modells (0,1,1) ohne Konstante 1 / (1 - 952 1) beträgt. Wenn beispielsweise 952 1 0,8 beträgt, ist das Durchschnittsalter 5. Da sich 952 1 1 nähert, wird das ARIMA-Modell (0,1,1) ohne Konstante zu einem sehr langfristigen gleitenden Durchschnitt und als 952 1 Ansätze 0 wird es ein random-walk-ohne-Drift-Modell. What8217s der beste Weg, um für Autokorrelation zu korrigieren: Hinzufügen von AR-Begriffe oder Hinzufügen von MA-Begriffen In den vorherigen beiden Modellen, die oben diskutiert wurden, wurde das Problem der autokorrelierten Fehler in einem zufälligen Fußmodell auf zwei verschiedene Arten behoben: durch Hinzufügen eines Verzögerungswertes der differenzierten Reihe Auf die Gleichung oder das Hinzufügen eines verzögerten Wertes des Prognosefehlers. Welcher Ansatz am besten ist Eine Regel für diese Situation, die später noch ausführlicher diskutiert wird, besteht darin, dass die positive Autokorrelation normalerweise am besten durch Hinzufügen eines AR-Terms zum Modell behandelt wird und negative Autokorrelation in der Regel am besten durch Hinzufügen eines MA-Semester. In der Wirtschafts - und Wirtschaftszeitreihe entsteht häufig eine negative Autokorrelation als Artefakt der Differenzierung. (Im allgemeinen differenziert die Differenzierung die positive Autokorrelation und kann sogar einen Wechsel von positiver zu negativer Autokorrelation bewirken.) Daher wird das ARIMA (0,1,1) - Modell, in dem die Differenzierung von einem MA-Begriff begleitet wird, häufiger verwendet als ein ARIMA (1,1,0) - Modell. ARIMA (0,1,1) mit konstanter einfacher exponentieller Glättung mit Wachstum: Durch die Implementierung des SES-Modells als ARIMA-Modell gewinnen Sie tatsächlich etwas Flexibilität. Zunächst darf der geschätzte MA (1) - Koeffizient negativ sein. Dies entspricht einem Glättungsfaktor von mehr als 1 in einem SES-Modell, das nach dem SES-Modellanpassungsverfahren meist nicht zulässig ist. Zweitens haben Sie die Möglichkeit, einen konstanten Begriff in das ARIMA-Modell aufzunehmen, wenn Sie es wünschen, um einen durchschnittlichen Trend, der nicht Null ist, abzuschätzen. Das Modell ARIMA (0,1,1) mit Konstante hat die Vorhersagegleichung: Die Ein-Perioden-Prognosen aus diesem Modell sind qualitativ denjenigen des SES-Modells ähnlich, mit der Ausnahme, dass die Trajektorie der Langzeitprognosen typischerweise a ist (Deren Neigung gleich mu ist) und nicht eine horizontale Linie. ARIMA (0,2,1) oder (0,2,2) ohne konstante lineare Exponentialglättung: Lineare exponentielle Glättungsmodelle sind ARIMA-Modelle, die zwei nicht-sauren Differenzen in Verbindung mit MA-Begriffen verwenden. Die zweite Differenz einer Folge Y ist nicht einfach die Differenz von Y und selbst von zwei Perioden verzögert, sondern sie ist die erste Differenz der ersten Differenz - i. e. Die Änderung in der Änderung von Y in der Periode t. Somit ist die zweite Differenz von Y in der Periode t gleich (Yt - Yt - 1) - (Yt - 1 - Yt - 2) Yt - 2Yt - 1Yt - 2. Eine zweite Differenz einer diskreten Funktion ist analog zu einer zweiten Ableitung einer stetigen Funktion: sie mißt zu einem gegebenen Zeitpunkt die Quota-Beschleunigung quot oder quotvequot in der Funktion. Das ARIMA (0,2,2) - Modell ohne Konstante sagt voraus, daß die zweite Differenz der Reihe eine lineare Funktion der letzten beiden Prognosefehler ist, die umgeordnet werden können: wobei 952 1 und 952 2 die MA (1) und MA (2) Koeffizienten. Dies ist ein allgemeines lineares exponentielles Glättungsmodell. Im Wesentlichen das gleiche wie Holt8217s Modell, und Brown8217s Modell ist ein spezieller Fall. Es verwendet exponentiell gewichtete gleitende Mittelwerte, um sowohl eine lokale Ebene als auch einen lokalen Trend in der Reihe abzuschätzen. Die Langzeitprognosen von diesem Modell konvergieren zu einer Geraden, deren Steigung von dem durchschnittlichen Trend abhängt, der gegen Ende der Reihe beobachtet wird. ARIMA (1,1,2) ohne konstante gedämpfte lineare Exponentialglättung. Dieses Modell ist in den begleitenden Dias auf ARIMA-Modellen dargestellt. Es extrapoliert die lokale Tendenz am Ende der Serie, sondern flacht es auf längere Prognose Horizonte, um eine Notiz von Konservatismus, eine Praxis, die empirische Unterstützung hat einzuführen. Siehe den Artikel auf quotWarum die Damped Trend Werke von Gardner und McKenzie und die quotGolden Rulequot Artikel von Armstrong et al. für Details. Es ist grundsätzlich ratsam, bei Modellen zu bleiben, bei denen mindestens einer von p und q nicht größer als 1 ist, dh nicht versuchen, ein Modell wie ARIMA (2,1,2) anzubringen, da dies zu Überbeanspruchungen führen kann Die in den Anmerkungen zur mathematischen Struktur von ARIMA-Modellen näher erläutert werden. Spreadsheet-Implementierung: ARIMA-Modelle wie die oben beschriebenen lassen sich einfach in einer Tabellenkalkulation implementieren. Die Vorhersagegleichung ist einfach eine lineare Gleichung, die sich auf vergangene Werte von ursprünglichen Zeitreihen und vergangenen Werten der Fehler bezieht. Auf diese Weise können Sie eine ARIMA-Prognosekalkulation einrichten, indem Sie die Daten in Spalte A, die Prognoseformel in Spalte B und die Fehler (Daten minus Prognosen) in Spalte C speichern. Die Prognoseformel in einer typischen Zelle in Spalte B wäre einfach Ein linearer Ausdruck, der sich auf Werte in vorhergehenden Zeilen der Spalten A und C bezieht, multipliziert mit den entsprechenden AR - oder MA-Koeffizienten, die in Zellen an anderer Stelle auf dem Spreadsheet gespeichert sind. Allgemeine saisonale ARIMA-Modelle: (0,1,1) x (0,1,1 ) Usw. Umriss der saisonalen ARIMA-Modellierung: Der saisonale Teil eines ARIMA-Modells hat die gleiche Struktur wie der nicht saisonale Teil: er kann einen AR-Faktor, einen MA-Faktor und / oder eine Differenzierung aufweisen. Im saisonalen Teil des Modells, alle diese Faktoren arbeiten über Vielfache von Lag s (die Anzahl der Perioden in einer Saison). Ein saisonales ARIMA-Modell wird als ARIMA (p, d, q) x (P, D, Q) - Modell klassifiziert, wobei Pnummer der saisonalen autoregressiven (SAR) Terme, Dnumber der saisonalen Unterschiede, Qnumber der saisonalen gleitenden Durchschnittswerte (SMA) Bei der Identifizierung eines saisonalen Modells, ist der erste Schritt, um festzustellen, ob eine saisonale Unterschied erforderlich ist, zusätzlich oder vielleicht statt einer nicht-saisonalen Unterschied. Sie sollten auf Zeitreihenplots und ACF - und PACF-Plots für alle möglichen Kombinationen von 0 oder 1 nicht-saisonalen Unterschied und 0 oder 1 saisonalen Unterschied zu suchen. Achtung: Verwenden Sie nicht mehr als einen saisonalen Unterschied, nicht mehr als zwei Gesamtdifferenzen (saisonal und nicht saisonal kombiniert). Wenn das saisonale Muster sowohl stark und stabil über die Zeit (z. B. hoch im Sommer und niedrig im Winter, oder umgekehrt) ist, dann sollten Sie wahrscheinlich einen saisonalen Unterschied verwenden, unabhängig davon, ob Sie einen nicht-saisonalen Unterschied verwenden, da dies wird Verhindern, dass das saisonale Muster aus Zerlegung outquot in den langfristigen Prognosen. Fügen Sie diese zu unserer Liste der Regeln für die Identifizierung von Modellen hinzu Regel 12: Wenn die Serie eine starke und konsistente saisonale Muster hat, sollten Sie eine Reihenfolge der saisonalen Differenzierung verwenden - aber nie mehr als eine Reihenfolge der saisonalen Differenzierung oder mehr als 2 verwenden Aufträge der Gesamtdifferenzierung (saisonabhängig). Die Signatur von reinem SAR oder reinem SMA Verhalten ist ähnlich der Signatur von reinem AR oder reinem MA Verhalten, mit der Ausnahme, dass das Muster über Vielfache von Verzögerung s in der ACF und PACF auftritt. Beispielsweise hat ein reines SAR (1) - Verfahren Spikes in der ACF bei den Verzögerungen s, 2s, 3s usw., während die PACF nach der Verzögerung s abschaltet. Umgekehrt hat ein reines SMA (1) - Verfahren Spikes in der PACF bei den Verzögerungen s, 2s, 3s usw., während der ACF nach der Verzögerung s abschaltet. Eine SAR-Signatur tritt gewöhnlich auf, wenn die Autokorrelation bei der saisonalen Periode positiv e ist, während eine SMA-Signatur normalerweise auftritt, wenn die saisonale Autokorrelation negativ ist. Daher: Regel 13: Wenn die Autokorrelation bei der Saisonzeit positiv ist. Erwägen, dem Modell einen SAR-Begriff hinzuzufügen. Wenn die Autokorrelation bei der Saisonperiode negativ ist. Erwägen, dem Modell einen SMA-Begriff hinzuzufügen. Vermeiden Sie das Mischen von SAR - und SMA-Begriffen in demselben Modell und vermeiden Sie die Verwendung von mehr als einer der beiden Arten. Normalerweise reicht ein SAR (1) oder SMA (1) Term aus. Sie werden selten einen echten SAR (2) oder SMA (2) - Prozess finden, und noch selten haben genug Daten, um zwei oder mehr saisonale Koeffizienten abzuschätzen, ohne dass der Schätzalgorithmus in eine Quotefeedback-Schleife eintritt. Obwohl ein saisonales ARIMA-Modell zu haben scheint Nur ein paar Parameter, denken Sie daran, dass backforecasting die Schätzung von ein oder zwei Jahreszeiten im Wert von impliziten Parametern, um es zu initialisieren erfordert. Daher sollten Sie mindestens 4 oder 5 Jahreszeiten von Daten, um eine saisonale ARIMA-Modell passen. Das am häufigsten verwendete saisonale ARIMA-Modell ist das (0,1,1) x (0,1,1) - Modell - d. h. Ein MA (1) xSMA (1) - Modell mit einer saisonalen und einer nicht-saisonalen Differenz. Dies ist im wesentlichen ein sequentielles exponentielles Glättungsmodell. Wenn saisonale ARIMA-Modelle an protokollierte Daten angepasst werden, können sie ein multiplikatives saisonales Muster verfolgen. Beispiel: AUTOSALE-Serie erneut besucht Rückruf, dass wir zuvor Prognose der Retail-Auto-Verkaufs-Serie mit einer Kombination aus Deflation, saisonale Anpassung und exponentielle Glättung. Lets jetzt versuchen, passen die gleiche Serie mit saisonalen ARIMA Modelle, mit der gleichen Stichprobe von Daten von Januar 1970 bis Mai 1993 (281 Beobachtungen). Wie vorher werden wir mit deflationierten Autoverkäufen arbeiten - d. H. Wir verwenden die Serie AUTOSALE / CPI als Eingangsgröße. Hier sind die Zeitreihenplots und ACF - und PACF - Diagramme der Originalreihe, die im Prognoseverfahren durch die Darstellung des Quotienten eines ARIMA (0,0,0) x (0,0,0) Modells mit Konstante erhalten werden Quotsuspension bridgequot Muster in der ACF ist typisch für eine Serie, die sowohl nichtstationäre und stark saisonal ist. Natürlich brauchen wir mindestens eine Ordnung der Differenzierung. Wenn wir eine nicht-saisonale Differenz annehmen, sind die entsprechenden Diagramme wie folgt: Die differenzierte Reihe (die Residuen eines Modells mit wahlfreiem Eintritt) sieht mehr oder weniger stationär aus, aber es gibt immer noch sehr starke Autokorrelation in der Saisonzeit (Verzögerung 12). Weil das saisonale Muster stark und stabil ist, wissen wir (aus Regel 12), dass wir eine Ordnung der saisonalen Differenzierung im Modell verwenden wollen. So sieht das Bild nach einem saisonalen Unterschied aus (nur): Die saisonal differenzierte Serie zeigt ein sehr starkes Muster positiver Autokorrelation, wie wir aus unserem früheren Versuch, ein saisonales Zufallsmodell anzupassen, erinnern. Dies könnte ein Zitat-Signaturquot - oder es könnte signalisieren die Notwendigkeit für einen anderen Unterschied. Wenn wir sowohl eine saisonale als auch eine nicht-saisonale Differenz einnehmen, werden folgende Ergebnisse erzielt: Dies sind natürlich die Residuen aus dem saisonal zufälligen Trendmodell, die wir früher an den Autoverkaufsdaten angepasst haben. Wir sehen jetzt die verräterischen Anzeichen einer leichten Überdifferenzierung. Sind die positiven Spikes in der ACF und PACF negativ geworden. Was ist die richtige Reihenfolge der Differenzierung Eine weitere Information, die hilfreich sein könnte, ist eine Berechnung der Fehlerstatistik der Serie auf jeder Ebene der Differenzierung. Wir können diese berechnen, indem wir die entsprechenden ARIMA-Modelle anpassen, in denen nur differencing verwendet wird: Die kleinsten Fehler, sowohl in der Schätzperiode als auch in der Validierungsperiode, werden durch Modell A erhalten, das eine Differenz von jedem Typ verwendet. Dies, zusammen mit dem Auftreten der Plots oben, deutet stark darauf hin, dass wir sowohl eine saisonale und eine nonsaisonale Unterschied verwenden sollten. Das Modell A ist das saisonale Zufalls-Trend-Modell (SRT-Modell), während das Modell B nur das saisonal zufällige (SRW) Modell darstellt. Wie wir bereits beim Vergleich dieser Modelle festgestellt haben, scheint das SRT-Modell besser zu passen als das SRW-Modell. In der Analyse, die folgt, werden wir versuchen, diese Modelle durch die Zugabe von saisonalen ARIMA Bedingungen zu verbessern. Zurück zum Seitenanfang. Das häufig verwendete ARIMA (0,1,1) x (0,1,1) Modell: SRT Modell plus MA (1) und SMA (1) Begriffe Rückkehr zum letzten Satz von Plots oben, bemerken, dass mit einer Differenz von Jede Art gibt es eine negative Spitze in der ACF bei Verzögerung 1 und auch eine negative Spitze in der ACF bei Verzögerung 12. Wohingegen die PACF in der Nähe dieser beiden Verzögerungen ein graduelleres quadratisches Muster zeigt. Durch die Anwendung unserer Regeln zur Identifizierung von ARIMA-Modellen (speziell Regel 7 und Regel 13) können wir nun folgern, dass das SRT-Modell durch den Zusatz eines MA (1) - Terms und auch eines SMA (1) - Terms verbessert wird. Auch nach Regel 5 schließen wir die Konstante aus, da zwei Befehlsordnungen beteiligt sind. Wenn wir dies alles tun, erhalten wir das ARIMA (0,1,1) x (0,1,1) Modell. Welches das am häufigsten verwendete saisonale ARIMA-Modell ist. Seine Prognose-Gleichung ist: wobei 952 1 der MA (1) - Koeffizient und 920 1 (Kapital-Theta-1) der SMA (1) - Koeffizient ist. Man beachte, dass der Koeffizient des Lag-13-Fehlers das Produkt des MA (1) und des MA-1 ist SMA (1) Koeffizienten. Dieses Modell ist konzeptionell dem Winters-Modell insofern ähnlich, als es eine exponentielle Glättung effektiv auf Niveau, Trend und Saisonalität auf einmal anwendet, obwohl es auf fundierteren theoretischen Grundlagen beruht, insbesondere im Hinblick auf die Berechnung von Konfidenzintervallen für Langzeitprognosen. Seine Residualplots sind in diesem Fall wie folgt: Obwohl eine geringe Autokorrelation bei der Verzögerung 12 verbleibt, ist das Gesamtaussehen der Diagramme gut. Die Modellanpassungsergebnisse zeigen, dass die geschätzten MA (1) - und SMA (1) - Koeffizienten (die nach 7 Iterationen erhalten wurden) tatsächlich signifikant sind: Die Prognosen des Modells ähneln denen des saisonalen Zufallsmodells - d. h. Sie nehmen das saisonale Muster und den lokalen Trend am Ende der Serie auf - aber sie sind etwas glatter im Aussehen, da sowohl das saisonale Muster als auch die Tendenz effektiv gemittelt werden (in einer exponentiell-glättenden Art und Weise) Einige Jahreszeiten: Was ist dieses Modell wirklich tun Sie können es auf die folgende Weise denken. Zuerst berechnet sie die Differenz zwischen jedem Monat8217s-Wert und einem 8220exponentiell gewichteten historischen Durchschnitt8221 für diesen Monat, der durch Anwendung exponentieller Glättung auf Werte berechnet wird, die im selben Monat in früheren Jahren beobachtet wurden, wobei der Glättungsbetrag durch die SMA bestimmt wird (1 ) - Koeffizient. Dann wird eine einfache exponentielle Glättung auf diese Unterschiede angewandt, um die Abweichung von dem historischen Durchschnitt vorherzusagen, der im nächsten Monat beobachtet wird. Der Wert des SMA (1) - Koeffizienten in der Nähe von 1,0 legt nahe, dass viele Jahreszeiten von Daten verwendet werden, um den historischen Durchschnitt für einen bestimmten Monat des Jahres zu berechnen. Es sei daran erinnert, dass ein MA (1) - Koeffizient in einem ARIMA-Modell (0,1,1) 1-minus-alpha in dem entsprechenden exponentiellen Glättungsmodell entspricht und dass das Durchschnittsalter der Daten in einer exponentiellen Glättungsmodellprognose 1 / Alpha. Der SMA (1) - Koeffizient hat eine ähnliche Interpretation in Bezug auf Durchschnittswerte über die Jahreszeiten. Der Wert von 0,91 deutet darauf hin, dass das Durchschnittsalter der für die Schätzung des historischen Saisonmusters verwendeten Daten etwas mehr als 10 Jahre beträgt (fast die Hälfte der Länge des Datensatzes), was bedeutet, dass ein nahezu konstantes saisonales Muster angenommen wird. Der viel kleinere Wert von 0,5 für den MA (1) - Koeffizienten legt nahe, dass relativ wenig Glättung durchgeführt wird, um die aktuelle Abweichung von dem historischen Durchschnitt für denselben Monat abzuschätzen, sodass der nächste Monat8217s vorhergesagte Abweichung von seinem historischen Durchschnitt nahe an den Abweichungen ist Aus dem historischen Durchschnitt, die in den letzten Monaten beobachtet wurden. Das Modell ARIMA (1,0,0) x (0,1,0) mit konstantem SRW-Modell und AR (1) - Zustand Das Vorgängermodell war ein saisonales Random-Trend-Modell (SRT) 1) und SMA (1) Koeffizienten. Ein alternatives ARIMA-Modell für diese Serie kann erhalten werden, indem ein AR (1) - Term für die nicht-saisonale Differenz - d. h. Durch Hinzufügen eines AR (1) Ausdrucks zu dem Seasonal Random Walk (SRW) Modell. Dies ermöglicht es uns, das saisonale Muster in dem Modell zu bewahren, während der Gesamtbetrag der Differenzierung gesenkt wird, wodurch die Stabilität der Trendvorsprünge erhöht wird, wenn dies gewünscht wird. (Erinnern wir uns, dass die Reihe mit einer saisonalen Differenz alleine eine starke AR (1) Signatur zeigte.) Wenn wir dies tun, erhalten wir ein ARIMA (1,0,0) x (0,1,0) Modell mit konstanten, Was zu folgenden Ergebnissen führt: Der AR (1) - Koeffizient ist in der Tat sehr signifikant und der RMSE ist nur 2,06, verglichen mit 3,00 für das SRW-Modell (Modell B im obigen Vergleichsbericht). Die Prognose-Gleichung für dieses Modell ist: Der zusätzliche Begriff auf der rechten Seite ist ein Vielfaches des saisonalen Unterschieds, der im letzten Monat beobachtet wurde, was die Wirkung hat, die Prognose für die Wirkung eines ungewöhnlich guten oder schlechten Jahres zu korrigieren. Dabei bezeichnet 981 1 den AR (1) - Koeffizienten, dessen Schätzwert 0,73 ist. So zum Beispiel, wenn Verkäufe letzter Monat waren X Dollar vor Verkäufen ein Jahr früher, dann die Quantität 0.73X würde die Prognose für diesen Monat hinzugefügt werden. 956 bezeichnet die Konstante in der Prognosegleichung, deren Schätzwert 0,20 beträgt. Die geschätzte MEAN, deren Wert 0,75 ist, ist der Mittelwert der saisonal differenzierten Serien, was der jährliche Trend bei den Langzeitprognosen dieses Modells ist. Die Konstante ist (durch Definition) gleich den mittleren Zeiten 1 minus dem AR (1) - Koeffizienten: 0,2 0,75 (1 8211 0,73). Die Prognose zeigt, dass das Modell in der Tat eine bessere Arbeit als das SRW-Modell der Verfolgung zyklischer Veränderungen (dh ungewöhnlich gute oder schlechte Jahre): Aber die MSE für dieses Modell ist noch deutlich größer als das, was wir für die ARIMA (0, 1,1) x (0,1,1) - Modell. Wenn wir uns die Grundstücke der Residuen anschauen, sehen wir Raum für Verbesserungen. Die Residuen zeigen immer noch ein Zeichen der zyklischen Variation: Die ACF und PACF legen nahe, dass sowohl MA (1) als auch SMA (1) Koeffizienten benötigt werden: Eine verbesserte Version: ARIMA (1,0,1) x (0,1,1) Mit Konstanten Wenn wir die angezeigten MA (1) und SMA (1) Terme dem vorhergehenden Modell hinzufügen, erhalten wir ein ARIMA (1,0,1) x (0,1,1) Modell mit einer Konstante, deren Prognosegleichung Dies ist Ist nahezu identisch mit dem ARIMA (0,1,1) x (0,1,1) - Modell, mit der Ausnahme, dass es die nicht-saisonale Differenz durch einen AR (1) - Term ersetzt (eine partielle Differentialquot) und einen konstanten Term enthält, Langfristigen Trend. Daher nimmt dieses Modell einen stabileren Trend an als das ARIMA (0,1,1) x (0,1,1) - Modell, und das ist der Hauptunterschied zwischen ihnen. Die Modell-Anpassungsergebnisse sind wie folgt: Beachten Sie, dass der geschätzte AR (1) - Koeffizient (981 1 in der Modellgleichung) 0,96 ist, der sehr nahe bei 1,0 liegt, aber nicht so nahe ist, dass er unbedingt ersetzt werden sollte Ein erster Unterschied: sein Standardfehler ist 0.02, also ist er ungefähr 2 Standardfehler von 1.0. Die anderen Statistiken des Modells (die geschätzten MA (1) - und SMA (1) - Koeffizienten und Fehlerstatistiken in den Schätz - und Validierungsperioden sind ansonsten fast identisch mit denen des ARIMA (0,1,1) x (0,1 , 1) - Modell. (Die geschätzten MA (1) und SMA (1) Koeffizienten sind 0,45 und 0,91 in diesem Modell gegenüber 0,48 und 0,91 in der anderen.) Die geschätzte MEAN von 0,68 ist der vorhergesagte langfristige Trend (durchschnittliche jährliche Steigerung). Dies ist im wesentlichen der gleiche Wert, der im (1,0,0) x (0,1,0) - mit konstanten Modell erhalten wurde. Der Standardfehler des geschätzten Mittels ist 0,26, so dass die Differenz zwischen 0,75 und 0,68 nicht signifikant ist. Wenn die Konstante nicht in diesem Modell enthalten wäre, wäre es ein gedämpftes Trendmodell: Der Trend in seinen sehr langfristigen Prognosen würde allmählich abflachen. Die Punktvorhersagen aus diesem Modell ähneln denen des (0,1,1) x (0,1,1) - Modells, da der durchschnittliche Trend ähnlich dem lokalen Trend am Ende der Serie ist. Allerdings wachsen die Konfidenzintervalle für dieses Modell etwas weniger schnell aufgrund seiner Annahme, dass der Trend stabil ist. Beachten Sie, dass die Vertrauensgrenzen für die zweijährigen Prognosen nun innerhalb der horizontalen Rasterlinien bei 24 und 44 bleiben, während die Werte des (0,1,1) x (0,1,1) Modells nicht: saisonale ARIMA Versus exponentielle Glättung und saisonale Anpassung: Jetzt können wir die Leistung der beiden besten ARIMA - Modelle mit einfachen und linearen exponentiellen Glättungsmodellen vergleichen, begleitet von einer multiplikativen saisonalen Anpassung und dem Winters - Modell, wie in den Dias zur Prognose mit saisonaler Anpassung dargestellt: Sind die Ein-Perioden-Prognosen für alle Modelle in diesem Fall extrem eng. Es ist schwierig, eine 8220winner8221 basierend auf diesen Zahlen allein auszuwählen. Zurück zum Seitenanfang. Was sind die Kompromisse zwischen den verschiedenen saisonalen Modellen Die drei Modelle, die multiplikative saisonale Anpassung verwenden Deal mit Saisonalität in einer expliziten Weise - d. H. Saisonale Indizes werden als expliziter Teil des Modells ausgebrochen. Die ARIMA-Modelle behandeln Saisonalität in einer impliziteren Weise - wir können nicht leicht sehen, in der ARIMA-Ausgabe, wie die durchschnittliche Dezember, sagen, unterscheidet sich von der durchschnittlichen Juli. Abhängig davon, ob es wichtig ist, das saisonale Muster zu isolieren, könnte dies ein Faktor bei der Auswahl unter den Modellen sein. Die ARIMA-Modelle haben den Vorteil, dass sie, sobald sie initialisiert worden sind, weniger bewegliche Teile als die exponentiellen Glättungs - und Einstellmodelle haben und daher weniger wahrscheinlich sind, die Daten zu überladen. ARIMA Modelle haben auch eine solide zugrunde liegende Theorie in Bezug auf die Berechnung der Konfidenzintervalle für längerfristige Prognosen als die anderen Modelle. Es gibt mehr dramatische Unterschiede zwischen den Modellen in Bezug auf das Verhalten ihrer Prognosen und Konfidenzintervalle für Prognosen mehr als 1 Zeitraum in die Zukunft. Dies ist, wo die Annahmen, die in Bezug auf Veränderungen in der Trend-und saisonale Muster sind sehr wichtig. Zwischen den beiden ARIMA-Modellen schätzt eine (Modell A) einen zeitlichen Trend, während die andere (Modell B) einen langfristigen durchschnittlichen Trend aufweist. (Wir könnten, falls gewünscht, den langfristigen Trend im Modell B durch Unterdrücken des konstanten Terms abflachen.) Unter den exponentiellen Glättungs-plus-Anpassungsmodellen nimmt ein Modell C einen flachen Trend an, während das andere ( Modell D) einen zeitlich variierenden Trend. Das Winters-Modell (E) nimmt auch einen zeitlichen Trend an. Modelle, die einen konstanten Trend annehmen, sind in ihren Langzeitprognosen relativ zuversichtlicher als Modelle, die dies nicht tun, und dies wird sich in der Regel auch in dem Ausmaß widerspiegeln, in dem Vertrauensintervalle für Prognosen bei längeren Prognosehorizonten breiter werden. Modelle, die keine zeitvariablen Trends voraussetzen, haben im Allgemeinen schmalere Konfidenzintervalle für längerfristige Prognosen, aber schmaler ist es nicht, wenn diese Annahme nicht korrekt ist. Die beiden exponentiellen Glättungsmodelle in Verbindung mit saisonaler Anpassung gehen davon aus, dass das saisonale Muster während der 23 Jahre in der Datenstichprobe konstant geblieben ist, während die anderen drei Modelle dies nicht tun. Soweit das saisonale Muster für die meisten der Monat-zu-Monat-Variation in den Daten verantwortlich ist, ist es wichtig, für die Vorhersage, was wird mehrere Monate in die Zukunft geschehen. Wenn das saisonale Muster vermutlich sich im Laufe der Zeit langsam verändert hat, wäre ein anderer Ansatz, nur eine kürzere Datenhistorie für die Anpassung der Modelle zu verwenden, die feste Saisonindizes abschätzen. Für die Aufzeichnung sind hier die Prognosen und 95 Konfidenzgrenzen für Mai 1995 (24 Monate voraus), die von den fünf Modellen erzeugt werden: Die Punktvorhersagen sind tatsächlich überraschend nahe beieinander, bezogen auf die Breiten aller Konfidenzintervalle. Die SES-Punktvorhersage ist am niedrigsten, weil sie das einzige Modell ist, das am Ende der Serie keinen Aufwärtstrend annimmt. Das Modell ARIMA (1,0,1) x (0,1,1) c hat die engsten Konfidenzgrenzen, da es weniger zeitliche Variation in den Parametern annimmt als die anderen Modelle. Auch die Punktprognose ist etwas größer als die der anderen Modelle, da sie einen langfristigen Trend und nicht einen kurzfristigen Trend (oder Null-Trend) extrapoliert. Das Winters-Modell ist das am wenigsten stabile Modell der Modelle, und seine Prognose weist daher die breitesten Vertrauensgrenzen auf, wie sich aus den detaillierten Prognoseplänen für die Modelle ergab. Und die Prognosen und Vertrauensgrenzen des Modells ARIMA (0,1,1) x (0,1,1) und denen des LESseasonal-Anpassungsmodells sind praktisch identisch. Loggen oder nicht protokollieren Etwas, was wir noch nicht getan haben, aber Haben könnte, ist eine Log-Transformation als Teil des Modells enthalten. Saisonale ARIMA-Modelle sind von Natur aus additive Modelle, also, wenn wir ein multiplikatives saisonales Muster erfassen wollen. Müssen wir dies tun, indem wir die Daten vor dem Einbau des ARIMA-Modells protokollieren. (In Statgraphics müssten wir nur den "Natural Logquot" als Modellierungsoption angeben - keine große Sache.) In diesem Fall scheint die Deflationstransformation eine zufriedenstellende Aufgabe zu haben, die Amplituden der Saisonzyklen zu stabilisieren Scheint ein zwingender Grund zu sein, eine Protokolltransformation hinzuzufügen, soweit es sich um langfristige Trends handelt. Wenn die Residuen eine deutliche Zunahme der Varianz im Laufe der Zeit zeigten, könnten wir anders entscheiden. Es gibt noch eine Frage, ob die Fehler dieser Modelle eine konsistente Varianz über Monate des Jahres haben. Wenn sie don8217t, dann Konfidenzintervalle für Prognosen können dazu neigen, zu breit oder zu schmal nach der Saison. Die Residual-vs-Zeit-Diagramme zeigen in dieser Hinsicht kein offensichtliches Problem, aber um gründlich zu sein, wäre es gut, die Fehlerabweichung pro Monat zu betrachten. Wenn es tatsächlich ein Problem, eine Protokoll-Transformation könnte es zu beheben. Zurück zum Seitenanfang.
No comments:
Post a Comment