Random-Walk-Modell Bei einer Zeitreihe, die ein unregelmäßiges Wachstum zeigt, wie z. B. X2, das früher analysiert wurde, kann die beste Strategie nicht darin bestehen, den Pegel der Reihe in jeder Periode (d. h. die Größe Yt) direkt vorherzusagen. Stattdessen kann es besser sein, zu versuchen, die Veränderung vorherzusagen, die von einer Periode zur nächsten auftritt (d. h. die Größe Yt - Yt-1). Das heißt, es kann besser sein, auf die erste Differenz der Reihe zu schauen, um zu sehen, ob ein vorhersagbares Muster dort gefunden werden kann. Für die Zwecke einer Prognose von einem Periodenabstand ist es ebenso gut, die nächste Änderung vorherzusagen, um die nächste Stufe der Reihe vorherzusagen, da die vorhergesagte Änderung dem aktuellen Pegel hinzugefügt werden kann, um einen vorhergesagten Pegel zu erhalten. Der einfachste Fall eines solchen Modells ist, dass immer voraussagt, dass die nächste Änderung null sein wird, als ob die Serie gleich wahrscheinlich ist, in der nächsten Periode ungeachtet dessen, was sie in der Vergangenheit getan hat, aufwärts oder abwärts zu gehen. Es handelt sich um ein Bild, das einen zufälligen Prozess veranschaulicht, für den dieses Modell geeignet ist: In jedem von links nach rechts verlaufenden Zeitraum nimmt der Wert der Variablen einen unabhängigen Zufallsschritt nach oben oder nach unten, einen sogenannten zufälligen Weg, ein. Sind an beiden Schnittpunkten gleichermaßen die Aufwärts - und Abwärtsbewegung wahrscheinlich, so ist jeder mögliche Links-nach-Rechts-Weg durch das Gitter gleichermaßen a priori wahrscheinlich. Sehen Sie diesen Link für eine schöne Simulation. Eine häufig verwendete Analogie ist die eines Betrunkenen, der zufällig nach links oder rechts taumelt, wenn er vorwärts geht: der Weg, den er verfolgt, wird ein zufälliger Weg sein. Für ein real-world Beispiel, betrachten Sie den täglichen US-Dollar-zu-Euro-Wechselkurs. Ein Gesamtüberblick vom 1. Januar 1999 bis zum 5. Dezember 2014 (4006 Beobachtungen) sieht so aus: Das historische Muster sieht sehr interessant aus, mit vielen Gipfeln und Tälern. ("Chharmaquot oft versuchen, solche Muster zu extrapolieren, indem Sie lokale Trendlinien oder Kurven, die ich nicht empfehlen. Im Durchschnitt werden 49 von ihnen richtig zu erraten, die Richtung, in der der Markt zwischen heute und einem bestimmten zukünftigen Zeitpunkt zu bewegen.) Nun, Hierbei handelt es sich um eine Verschwörung der täglichen Veränderungen (erster Unterschied): Die Volatilität (Varianz) ist nicht über die Zeit konstant, aber die täglichen Veränderungen sind nahezu vollständig zufällig, wie durch eine Darstellung ihrer Autokorrelationen gezeigt wird. Die Autokorrelation bei der Verzögerung k ist die Korrelation zwischen der Variablen und selbst verzögert durch k Perioden. Sind die Werte in der Reihe völlig statistisch im Sinne der statistischen Unabhängigkeit, so sind die wahren Werte der Autokorrelationen gleich Null und die Schätzwerte sollten nicht signifikant von Null verschieden sein. Die roten Linien auf diesem Plot sind Signifikanzbänder für die Prüfung, ob sich die Autokorrelationen der täglichen Änderungen von Null auf dem Wert von 0,05 signifikant unterscheiden, und insgesamt sind sie nicht. Insbesondere sind sie bei den ersten paar Verzögerungen völlig unbedeutend und es gibt kein systematisches Muster. (Bei großen Stichproben unterscheiden sich Autokorrelationen signifikant von Null bei 0,05-Werten, wenn die Größe von plus-oder-minus zwei dividiert durch die Quadratwurzel der Stichprobengröße beträgt. Dabei beträgt die Stichprobengröße 4006 und 2SQRT (4006) ca. 0,03 , Wie sie an der Stelle der roten Linien auf dem Diagramm zu sehen sind.) Das Prognosemodell, das durch diese Diagramme vorgeschlagen wird, ist eine, die lediglich eine Änderung von einer Periode zur nächsten voraussagt, da die Vergangenheit keine Informationen über die Richtung der zukünftigen Bewegungen liefert: Dies ist das sogenannte random-walk-ohne-Drift-Modell. Nimmt sie an, daß die Reihe in jedem Zeitpunkt lediglich einen zufälligen Schritt von ihrer zuletzt aufgezeichneten Position mit Schritten, deren Mittelwert null ist, nimmt. Wenn die mittlere Schrittgröße ein Wert ungleich Null von 945 ist, wird der Prozeß als eine Zufallsspalte bezeichnet. Dessen Vorhersagegleichung ist 374 t Y t-1 945. Der Säufer in dem Bild oben fehlt ein Schuh, so dass er wahrscheinlich trieb. Im allgemeinen könnten die Schritte diskrete oder kontinuierliche Zufallsvariablen sein, und die Zeitskala könnte auch diskret oder kontinuierlich sein. Gelegentliche Spaziergangmuster werden allgemein in den Preisgeschichten der finanziellen Vermögenswerte gesehen, für die spekulative Märkte existieren, wie Aktien und Währungen. Dies bedeutet nicht, dass die Bewegungen in diesen Preisen im Sinne eines unzweckmäßigen Zweckes zufällig sind. Wenn sie nach oben und unten gehen, ist es immer aus einem Grund Aber die Richtung des nächsten Zuges kann nicht ex ante vorhergesagt werden: sie kann nur ex post erklärt werden, denn wenn die Richtung und die Größenordnung der nächsten Preisbewegung vorhergesagt werden konnten Dann hätten die Spekulanten sie schon um diesen Betrag gebeten. Random-Walk-Muster sind auch überall an anderer Stelle in der Natur, zum Beispiel, in dem Phänomen der Brownsche Bewegung, die erstmals von Einstein erklärt wurde gefunden. (Zurück zum Seitenanfang.) Es ist schwer zu sagen, ob die mittlere Schrittgröße in einem zufälligen Weg wirklich Null ist, geschweige denn ihren genauen Wert nur durch Betrachten der historischen Datenprobe. Wenn Sie einen Zufallsprozess simulieren (zB indem Sie ein Tabellenkalkulationsmodell erstellen, das die RAND () - Funktion in der Formel zur Erzeugung der Schrittwerte verwendet), werden Sie typischerweise feststellen, dass unterschiedliche Iterationen desselben Modells dramatisch unterschiedliche Bilder ergeben, Von denen viele signifikante Trends aufweisen werden, wie in der oben erwähnten Simulationsverbindung gezeigt wird. In der Tat wird das gleiche Modell in der Regel sowohl Aufwärts-und Abwärtstrends in wiederholten Iterationen, sowie interessante Kurven, die scheinen zu verlangen, irgendeine Art von komplexen Modell. Dies ist nur eine statistische Illusion, wie die so genannte Quothot-Hand in basketballquot und andere Beispiele für quotstreakinessquot im Sport. Ihr Gehirn versucht, Muster zu finden, auch wenn sie nicht da sind. Siehe die Hot Hand in Sport-Website für mehr dazu. In Anwendungen ist es am besten, auf andere Informationsquellen und auf theoretische Überlegungen bei der Entscheidung zu entscheiden, ob ein Driftterm in das Modell eingeschlossen werden soll, und wenn ja, wie man seinen Wert abschätzen kann. Bei den Wechselkursen gibt es keinen Grund, einen langfristigen Trend in die eine oder andere Richtung zu übernehmen, zumindest nicht einen Trend, der sich gegen den Lärm aus - zeichnen würde. Die mittlere tägliche Veränderung beträgt 0,000012 für diese Stichprobe von Wechselkursdaten, und der Standardfehler des Mittelwertes beträgt 0,00012, so daß sich der Probenmittelwert von Null nur um 110h eines Standardfehlers unterscheidet, der durch kein Maß signifikant ist. Wiederum liefert jedoch der Mittelwert der Schritte in einer endlichen Stichprobe von Zufallsdaten im Allgemeinen keine gute Abschätzung der gegenwärtigen Driftrate, falls vorhanden. Insgesamt scheint es also, dass für diese Zeitreihe ein zufälliges Geh-ohne-Drift-Modell geeignet ist. Wenn das Modell auf die gesamte Historie der Tagesdaten passt, gehen die Prognosen und 50 Vertrauensgrenzen des Modells wie folgt aus: (Diese Grafik wurde von Statgraphics erstellt Machen sie besser auf dem Bild. Es gibt nichts Besonderes über 95 sowieso, abgesehen von der Konvention.) Hier ist eine Nahansicht der tatsächlichen Datenpunkte und Prognosen am Ende der Serie: Die wichtigsten Eigenschaften des Modells, die Werden durch diese Grafik dargestellt: a. Die einstufigen Prognosen innerhalb der Stichprobe folgen genau dem gleichen Weg wie die Daten. Außer daß sie um eine Periode zurückbleiben. (Sie müssen genau hinschauen, um das zu sehen: Auf den ersten Blick mag es vorkommen, dass das Modell perfekt auf die Daten passt, aber in jeder Periode Fehler macht und diese Fehler unabhängige Zufallsvariablen sind.) B. Die Langzeitprognosen außerhalb der Probe folgen einer horizontalen Geraden, die auf dem letzten beobachteten Wert verankert ist. Da keine Aufwärts - oder Abwärtsdrift oder irgendein anderes systematisches Zeitmuster angenommen wird. (Wenn eine Nicht-Null-Drift angenommen wurde, könnte diese Linie nach oben oder nach unten geneigt sein.) C. Die Vertrauensbänder für langfristige Prognosen wachsen breiter in einer Weise, die wie eine seitliche Parabel aussieht. Aus Gründen, die unten erläutert werden. (Zurück zum Seitenanfang.) Bei dem Modell mit dem Zufallsprinzip ohne Drift ist der Standardfehler der 1-Schritt-Vorausprognose der root-mean-squared-Wert der Periodenperiodenänderungen im Datenabtastwert , Dh sie ist die Quadratwurzel des Mittelwertes der quadrierten Werte der ersten Differenz der Reihe. Für eine random-walk-with - drift ist der Prognose-Standardfehler die Stichproben-Standardabweichung der Periodenperiodenänderungen. (Die Differenz zwischen dem RMS-Wert und der Standardabweichung der Änderungen ist meist vernachlässigbar, wenn nicht die Flüchtigkeit im Vergleich zur Drift sehr klein ist.) Der Fehler, den das Modell in einer k-Schritt-Voraus-Prognose macht, ist die Summe von k unabhängig Und identisch verteilte Zufallsvariablen, da das Modell die gleiche Vorhersage fortsetzt, während die Variable k Zufallsschritte nimmt. Da die Varianz einer Summe von unabhängigen Zufallsvariablen die Summe der Varianzen ist, folgt daraus, dass die Varianz des k-step-ahead-Prognosefehlers größer ist als die der Einperiodenprognose um einen Faktor k. Und weil die Standardabweichung des Prognosefehlers die Quadratwurzel seiner Varianz ist, folgt daraus, dass der Standardfehler einer k-Schritt-Voraus-Prognose größer ist als der der 1-Schritt-Voraus-Prognose um einen Faktor der Quadratwurzel - of-k. Dies ist die sogenannte Quotsquare-Wurzel der Zeitquotregel für die Fehler der zufälligen Wandervorhersagen, und sie erklärt die Seiten-Parabelform der Vertrauensbänder für Langzeitprognosen: das ist die Form des Graphen von YSQRT (X). Für diesen sehr großen Datenabtastwert sind der Wurzel-Mittelwert-Quadratwert und die Standardabweichung der Standardabweichung der täglichen Änderungen beide gleich 0,00778 bis 3 signifikante Ziffern, so dass der Standardfehler eines Vorhersagefehlers von k-Schritt voraus ist: 0,00778SQRT (k ), Und die Vertrauensgrenzen werden aus ihr in der üblichen Weise berechnet. Ein Intervall von 95 ist ungefähr die Punktvorhersage plus-oder-minus 2 Standardfehler, und ein 50 Konfidenzintervall ist die Punktvorhersage plus-oder-minus zwei Drittel eines Standardfehlers. Bei den Wechselkursdaten ist es nicht wirklich sinnvoll, die gesamte Stichprobe zu verwenden, um die Standardabweichung der täglichen Änderungen abzuschätzen, da sie nicht über die Zeit konstant war. Eine kürzere Datenhistorie könnte verwendet werden, um dieses Problem zu lösen, und andere Arten von Informationen, wie beispielsweise Preise von Devisenoptionen, könnten ebenfalls in Betracht gezogen werden. Das zufällige Wegmodell kann trivial aussehen, wenn Sie es nie vorher gesehen haben: was könnte einfacher sein, als vorherzusagen, dass morgen das selbe wie heute sein wird Dieses verlangt nicht sogar irgendein Wissen von Statistiken Darum wird es manchmal auch genannt Es ist aber gar nicht trivial. Das quadratisch-root-of-time Muster in seinen Vertrauensbändern für langfristige Prognosen ist von fundamentaler Bedeutung in der Finanzwirtschaft (es ist die Basis der Theorie der Options-Preisgestaltung), und das zufällige Walk-Modell bietet oft einen guten Maßstab Beurteilen die Leistung von komplizierteren Modellen. Das Modell der zufälligen Wanderung kann auch als wichtiger Spezialfall eines ARIMA-Modells angesehen werden (quotautoregressive integrierte gleitende Durchschnittsgröße). Genauer gesagt, es ist ein quotARIMA (0,1,0) - Modell. Allgemeinere ARIMA-Modelle sind in der Lage, mit interessanteren Zeitmustern umzugehen, die korrelierte Schritte, wie mittlere Reversion, Oszillation, zeitveränderliche Mittel und Saisonalität, beinhalten. Diese Themen werden in den ARIMA-Seiten dieser Hinweise ausführlich besprochen. Für eine weitaus umfassendere Erörterung des Zufallswegmodells, veranschaulicht durch eine kürzere Stichprobe der Wechselkursdaten, siehe die Notizen auf dem Zufallsweg-Modellquot-Handout.8.9 Saisonale ARIMA-Modelle Bisher haben wir unsere Aufmerksamkeit auf nicht-saisonale Daten beschränkt Und nicht saisonale ARIMA Modelle. ARIMA Modelle sind jedoch auch in der Lage, eine breite Palette von saisonalen Daten zu modellieren. Ein saisonales ARIMA-Modell wird gebildet, indem zusätzliche saisonale Begriffe in die ARIMA-Modelle aufgenommen werden, die wir bisher gesehen haben. Es wird wie folgt geschrieben: wobei m Anzahl der Perioden pro Saison. Wir verwenden Großbuchstaben für die saisonalen Teile des Modells und Kleinbuchstaben für die nicht-saisonalen Teile des Modells. Der saisonale Teil des Modells besteht aus Begriffen, die den nicht saisonalen Komponenten des Modells sehr ähnlich sind, aber Rückschritte der Saisonzeit mit sich bringen. Zum Beispiel ist ein ARIMA (1,1,1) (1,1,1) 4 Modell (ohne Konstante) für vierteljährliche Daten (m4) und kann geschrieben werden als Die zusätzlichen saisonalen Begriffe werden einfach mit dem nicht-saisonalen multipliziert Bedingungen. Der saisonale Teil eines AR - oder MA-Modells wird in den Saisonverzögerungen der PACF und ACF gesehen. Beispielsweise wird ein ARIMA (0,0,0) (0,0,1) 12 Modell zeigen: eine Spitze bei Verzögerung 12 im ACF aber keine anderen signifikanten Spitzen. Die PACF zeigt exponentiellen Zerfall in den saisonalen Verzögerungen, die, bei Lags 12, 24, 36, ist. Ähnlich zeigt ein ARIMA (0,0,0) (1,0,0) 12 Modell: exponentieller Zerfall in den Saisonverzögerungen der ACF eine einzelne signifikante Spitze bei Verzögerung 12 in der PACF. Bei der Berücksichtigung der entsprechenden Jahreszeiten für ein ARIMA-Modell, beschränken die Aufmerksamkeit auf die saisonalen Verzögerungen. Das Modellierungsverfahren ist fast das gleiche wie für nicht-saisonale Daten, außer dass wir saisonale AR und MA-Bedingungen sowie die nicht-saisonalen Komponenten des Modells auswählen müssen. Der Prozess wird am besten anhand von Beispielen veranschaulicht. Beispiel 8.3 Europäischer vierteljährlicher Einzelhandel Wir beschreiben das saisonale ARIMA-Modellierungsverfahren mit vierteljährlichen europäischen Einzelhandelsdaten von 1996 bis 2011. Die Daten sind in Abbildung 8.14 dargestellt. Abbildung 8.14: Vierteljährlicher Einzelhandelsindex im Euroraum (17 Länder), 19962011 für den Groß - und Einzelhandel sowie Reparatur von Kraftfahrzeugen und Motorrädern. (Index: 2005 100). Grundstück 40 Euretail, ylab quotRetailindexquot. Xlab quotYearquot 41 Die Daten sind eindeutig nicht-stationär, mit etwas Saisonalität, so dass wir zunächst einen saisonalen Unterschied. Die saisonal differenzierten Daten sind in Abbildung 8.15 dargestellt. Diese scheinen auch nicht stationär zu sein, daher nehmen wir einen zusätzlichen ersten Unterschied, der in Abbildung 8.16 gezeigt ist. Tsdisplay 40 diff 40 diff 40 euretail, 4 41 41 41 Unser Ziel ist es nun, ein passendes ARIMA-Modell zu finden, das auf dem ACF und PACF basiert, wie in Abbildung 8.16 gezeigt. Der signifikante Spike bei Lag 1 im ACF deutet auf eine nicht saisonale MA (1) - Komponente hin, und die signifikante Spike bei Lag 4 im ACF deutet auf eine saisonale MA (1) - Komponente hin. Wir beginnen mit einem ARIMA (0,1,1) (0,1,1) 4 Modell, das einen ersten und einen saisonalen Unterschied sowie nicht saisonale und saisonale MA (1) Komponenten anzeigt. Die Residuen für das eingebaute Modell sind in Abbildung 8.17 dargestellt. (Nach analoger Logik könnten wir auch mit einem ARIMA (1,1,0) (1,1,0) 4 Modell begonnen haben.) Fit lt - Arima 40 euretail, Bestellung c 40 0. 1. 1 41. saisonale c 40 0. 1. 1 41 41 tsdisplay 40 residuals 40 fit 41 41 Sowohl ACF als auch PACF zeigen signifikante Spikes bei Lag 2 und fast signifikante Spikes bei Lag 3, was darauf hinweist, dass einige zusätzliche nicht saisonale Bedingungen in das Modell aufgenommen werden müssen. Der AICc des Modells ARIMA (0,1,2) (0,1,1) 4 ist 74,36, während für das Modell ARIMA (0,1,3) (0,1,1) 4 68,53. Wir haben andere Modelle mit AR-Begriffe versucht, aber keine, die einen kleineren AICc Wert gab. Folglich wählen wir das Modell ARIMA (0,1,3) (0,1,1) 4. Die Residuen sind in Abbildung 8.18 aufgetragen. Alle Spikes liegen nun innerhalb der Signifikanzgrenzen, und so erscheinen die Residuen als weißes Rauschen. Ein Ljung-Box-Test zeigt auch, dass die Residuen keine verbleibenden Autokorrelationen aufweisen. Fit3 lt - Arima 40 euretail, bestellen c 40 0. 1. 3 41. saisonale c 40 0. 1. 1 41 41 res lt - verbleibende 40 fit3 41 tsdisplay 40 res 41 box. Test 40 res, lag 16. fitdf 4. type quotLjungquot 41 So haben wir nun ein saisonales ARIMA-Modell, das die erforderlichen Prüfungen bestanden hat und für die Prognose bereit ist. Prognosen des Modells für die nächsten drei Jahre sind in Abbildung 8.19 dargestellt. Beachten Sie, wie die Prognosen dem letzten Trend in den Daten folgen (dies geschieht wegen der doppelten Differenzierung). Die großen und schnell zunehmenden Vorhersageintervalle zeigen, dass der Einzelhandelsindex jederzeit ansteigen oder sinken kann, während der Punkt prognostiziert Trend nach unten, die Vorhersageintervalle für die Daten zu Trend nach oben im Prognosezeitraum zu ermöglichen. Abbildung 8.19: Prognosen der europäischen Einzelhandelsindexdaten nach dem Modell ARIMA (0,1,3) (0,1,1) 4. 80 und 95 Vorhersageintervalle gezeigt. Plot 40 Prognose 40 fit3, h 12 41 41 Wir konnten auto. arima () benutzen, um die meiste Arbeit für uns zu tun. Es hätte das folgende Ergebnis gegeben. Gt auto. Arima 40 euretail 41 ARIMA 40 1. 1. 1 41 40 0. 1. 1 41 91 4 93 Koeffizienten. Ar1 ma1 sma1 0.8828 - 0.5208 - 0.9704 s. D. h. 0,1424 0,1755 0,6792 Sigma 2, geschätzt als 0,1411. Log likelihood - 30.19 AIC 68.37 AICc 69.11 BIC 76.68 Beachten Sie, dass es ein anderes Modell (mit einem größeren AICc-Wert) ausgewählt hat. Auto. arima () nimmt einige Abkürzungen, um die Berechnung zu beschleunigen und wird nicht immer das beste Modell geben. Sie können die Abkürzungen ausschalten und dann wird es manchmal wieder ein anderes Modell. Gt auto. Arima 40 euretail, schrittweise FALSE, Annäherung FALSE 41 ARIMA 40 0. 1. 3 41 40 0. 1. 1 41 91 4 93 Koeffizienten. Ma1 ma2 ma3 sma1 0,2625 0,3697 0,4194 - 0,6615 s. D. h. 0,1239 0,1260 0,1296 0,155 Sigma 2, geschätzt als 0,1451. Log likelihood - 28.7 AIC 67.4 AICc 68.53 BIC 77.78 Dieses Mal hat es das gleiche Modell zurückgegeben, das wir identifiziert hatten. Beispiel 8.4 Cortecosteroid-Arzneimittelvertrieb in Australien Unser zweites Beispiel ist schwieriger. Wir werden versuchen, prognostiziert monatlich Cortecosteroid Droge Umsatz in Australien. Diese sind als H02-Medikamente nach dem Anatomical Therapeutical Chemical Klassifikation Schema bekannt. Abbildung 8.20: Medikamentenabsatz von Cortecosteroid in Australien (in Millionen von Skripten pro Monat). Gespeicherte Daten im unteren Bereich. Lh02 lt - log 40 h02 41 par 40 mfrow c 40 2. 1 41 41 plot 40 h02, ylab quotH02 Verkauf (Millionen Scripte) Xlab quotYearquot 41 grundstück 40 lh02, ylab quotLog H02 salesquot. Xlab quotYearquot 41 Daten von Juli 1991 bis Juni 2008 sind in Abbildung 8.20 aufgetragen. Es gibt einen kleinen Anstieg in der Varianz mit dem Niveau, und so nehmen wir Logarithmen, um die Varianz zu stabilisieren. Die Daten sind stark saisonabhängig und offensichtlich nicht stationär, so dass saisonale Unterschiede verwendet werden. Die saisonal differenzierten Daten sind in Abbildung 8.21 dargestellt. Es ist an dieser Stelle nicht klar, ob wir einen anderen Unterschied machen sollen oder nicht. Wir entscheiden nicht, aber die Wahl ist nicht offensichtlich. Die letzten Beobachtungen scheinen von den früheren Daten verschieden (variabler) zu sein. Dies kann auf die Tatsache zurückzuführen sein, dass Daten manchmal revidiert werden, da frühere Verkäufe spät gemeldet werden. Abbildung 8.21: Saisonabhängig differenzierte Cortecosteroid-Arzneimittelverkäufe in Australien (in Millionen Skripten pro Monat). Tsdisplay 40 diff 40 lh02, 12 41. HauptquartierSeasonally differenzierte H02 scriptsquot. Xlab quotYearquot 41 In den Plots der saisonal differenzierten Daten gibt es Spikes in der PACF bei 12 und 24, aber nichts bei Saisonverzögerungen in der ACF. Dies kann auf einen saisonalen AR (2) Ausdruck hindeuten. In den nicht-saisonalen Verzögerungen gibt es drei signifikante Spikes in der PACF, die auf einen möglichen AR (3) Term schließen lassen. Das Muster in der ACF ist kein Hinweis auf ein einfaches Modell. Folglich deutet diese erste Analyse darauf hin, dass ein mögliches Modell für diese Daten ein ARIMA (3,0,0) (2,1,0) 12 ist. Wir passen dieses Modell, zusammen mit einigen Variationen auf, und berechnen ihre AICc Werte, die in der folgenden Tabelle gezeigt werden. Gt fit lt - Arima 40 h02, Bestellung c 40 3 0. 1 41. Jahreszeit c 40 0. 1. 2 41. lambda 0 41 ARIMA 40 3 0. 1 41 40 0. 1 2 41 91 12 93 Kasten Cox-Umwandlung. Lambda 0 Koeffizienten. Ar1 ar2 ar3 ma1 sma1 sma2 - 0.1603 0.5481 0.5678 0.3827 - 0.5222 - 0.1768 s. D. h. 0,1636 0,0878 0,0942 0,1895 0,0861 0,0872 Sigma 2, geschätzt als 0,004145. Log Wahrscheinlichkeit 250,04 AIC - 486,08 AICc - 485,48 BIC - 463,28 Die Residuen aus diesem Modell sind in Abbildung 8.22 dargestellt. Es gibt erhebliche Spikes sowohl in der ACF und PACF, und das Modell fehlschlägt ein Ljung-Box-Test. Das Modell kann weiterhin für die Prognose verwendet werden, aber die Vorhersageintervalle sind möglicherweise nicht korrekt aufgrund der korrelierten Residuen. Tsdisplay 40 residuals 40 passen 41 41 Kasten. Test 40 Residuen 40 passen 41. Lag 36. fitdf 6. type quotLjungquot 41 Als nächstes versuchen wir mit dem automatischen ARIMA-Algorithmus. Das Ausführen von auto. arima () mit Argumenten, die auf ihren Standardwerten zurückbleiben, führte zu einem ARIMA (2,1,3) (0,1,1) 12-Modell. Allerdings scheitert das Modell immer noch ein Ljung-Box-Test. Manchmal ist es nicht möglich, ein Modell zu finden, das alle Tests bestanden hat. Schließlich haben wir versucht, auto. arima () mit den angegebenen d0 und D1-Diensten auszuführen und größere Modelle als üblich zuzulassen. Dies führte zu einem ARIMA (4,0,3) (0,1,1) 12 Modell, das alle Tests bestanden hat. Fit lt-auto. Arima 40 h02, lambda 0. d 0. D 1. max. Reihenfolge 9, schrittweise FALSE, Approximation FALSE 41 tsdisplay 40 residuals 40 fit 41 41 Box. Test 40 Residuen 40 Fit 41. Lag 36. fitdf 8. type quotLjungquot 41 Test-Set-Auswertung: Wir werden einige der bisher eingesetzten Modelle mit einem Test-Set aus den letzten zwei Jahren vergleichen. So passen wir die Modelle mit Daten von Juli 1991 bis Juni 2006 an und prognostizieren die Skriptverkäufe für Juli 2006 Juni 2008. Die Ergebnisse sind in der folgenden Tabelle zusammengefasst. Getrmse lt - Funktion 40 x, h. 41 123 zug. Ende lt - Zeit 40 x 41 91 Länge 40 x 41 - h 93 Test. Start lt - Zeit 40 x 41 91 Länge 40 x 41 - h 1 93 Zug lt - Fenster 40 x, Endzug. Ende 41 Test lt - Fenster 40 x, Test starten. Start 41 fit lt - Arima 40 Zug. 41 fc lt - prognose 40 fit, hh 41 return 40 genauigkeit 40 fc, test 41 91 2. quotRMSEquot 93 41 125 getrmse 40 h02, h 24. bestellung c 40 3. 0. 0 41, saisonale c 40 2. 1. 0 41, lambda 0 41 getrmse 40 h02, h 24. Ordnung c 40 3. 0. 1 41, saisonale c 40 2. 1. 0 41, lambda 0 41 getrmse 40 h02, h 24. Ordnung c 40 3. 0. 2 41, saisonale c 40 2. 1. 0 41, lambda 0 41 getrmse 40 h02, h 24. Ordnung c 40 3. 0. 1 41, saisonale c 40 1. 1. 0 41, lambda 0 41 getrmse 40 h02, h 24. Ordnung c 40 3. 0. 1 41, saisonale c 40 0. 1. 1 41, lambda 0 41 getrmse 40 h02, h 24. Ordnung c 40 3. 0. 1 41, saisonale c 40 0. 1. 2 41, lambda 0 41 getrmse 40 h02, h 24. Ordnung c 40 3. 0. 1 41, saisonale c 40 1. 1. 1 41, lambda 0 41 getrmse 40 h02, h 24. Ordnung c 40 4. 0. 3 41, saisonal c 40 0. 1. 1 41, lambda 0 41 getrmse 40 h02, h 24. Ordnung c 40 3. 0. 3 41, saisonale c 40 0. 1. 1 41, lambda 0 41 getrmse 40 h02, h 24. Ordnung c 40 4. 0. 2 41, saisonale c 40 0. 1. 1 41, lambda 0 41 getrmse 40 h02, h 24. Bestellung c 40 3. 0. 2 41, saisonale c 40 0. 1. 1 41, lambda 0 41 getrmse 40 h02, h 24. Ordnung c 40 2. 1. 3 41, saisonale c 40 0. 1. 1 41, lambda 0 41 getrmse 40 h02, h 24. Bestellung c 40 2. 1. 4 41, saisonal c 40 0. 1. 1 41, lambda 0 41 getrmse 40 h02, h 24. Ordnung c 40 2. 1. 5 41, saisonale c 40 0. 1. 1 41, lambda 0 41 Die Modelle, die die Niedrigste AICc-Werte tendieren dazu, etwas bessere Ergebnisse als die anderen Modelle zu liefern, aber es gibt keinen großen Unterschied. Auch das einzige Modell, das die Resttests bestanden, gab nicht die besten Out-of-sample RMSE-Werte. Wenn Modelle mit AICc-Werten verglichen werden, ist es wichtig, dass alle Modelle die gleiche Reihenfolge der Differenzierung haben. Beim Vergleich von Modellen mit einem Testset spielt es keine Rolle, wie die Prognosen erstellt wurden - die Vergleiche sind immer gültig. Folglich können wir in der obigen Tabelle einige Modelle mit nur saisonalen Unterschieden und einigen Modellen mit sowohl ersten als auch saisonalen Unterschieden aufnehmen. Aber in der früheren Tabelle mit AICc-Werte, verglichen wir Modelle mit nur saisonale differencing. Keines der hier betrachteten Modelle bestanden alle Restprüfungen. In der Praxis würden wir normalerweise das beste Modell verwenden, das wir finden konnten, auch wenn es nicht alle Tests bestanden hat. Prognosen aus dem Modell ARIMA (3,0,1) (0,1,2) 12 (mit dem niedrigsten RMSE-Wert auf dem Testset und dem besten AICc-Wert bei Modellen mit nur saisonaler Differenzierung und weniger als sechs Parametern) sind Wie in der folgenden Abbildung dargestellt.
No comments:
Post a Comment