Modèle autorégressif distribué retardé (ADR) (II)

Table des matières:

Anonim

Le modèle Lagged Distributed Autoregressive (ADR), de l'anglais Modèle de décalage distribué autorégressif(ADL), est une régression qui implique une nouvelle variable indépendante retardée en plus de la variable dépendante retardée.

En d'autres termes, le modèle ADR est une extension du modèle autorégressif d'ordre p, AR (p), qui inclut une autre variable indépendante dans une période antérieure à la période de la variable dépendante.

Exemple

Sur la base des données de 1995 à 2018, nous calculons les logarithmes népérien desforfaits de ski pour chaque année et on recule d'une période pour les variablesforfaits de skit et des pistest:

An Forfaits de ski () ln_t ln_t-1 Pistes_t Pistes_t-1 An Forfaits de ski () ln_t ln_t-1 Pistes_t Pistes_t-1
1995 32 3,4657 8 2007 88 4,4773 4,3820 6 9
1996 44 3,7842 3,4657 6 8 2008 40 3,6889 4,4773 5 6
1997 50 3,9120 3,7842 6 6 2009 68 4,2195 3,6889 6 5
1998 55 4,0073 3,9120 5 6 2010 63 4,1431 4,2195 10 6
1999 40 3,6889 4,0073 5 5 2011 69 4,2341 4,1431 6 10
2000 32 3,4657 3,6889 5 5 2012 72 4,2767 4,2341 8 6
2001 34 3,5264 3,4657 8 5 2013 75 4,3175 4,2767 8 8
2002 60 4,0943 3,5264 5 8 2014 71 4,2627 4,3175 5 8
2003 63 4,1431 4,0943 6 5 2015 73 4,2905 4,2627 9 5
2004 64 4,1589 4,1431 6 6 2016 63 4,1431 4,2905 10 9
2005 78 4,3567 4,1589 5 6 2017 67 4,2047 4,1431 8 10
2006 80 4,3820 4,3567 9 5 2018 68 4,2195 4,2047 6 8
2019 ? ? 4,2195 6

Pour faire la régression, on utilise les valeurs de ln_t comme variable dépendante et les valeursln_t-1 Ouipistes_t-1 comme variables indépendantes. Les valeurs en rouge sont en dehors de la régression.

On obtient les coefficients de la régression :

Dans ce cas, le signe des régresseurs est positif :

  • Une augmentation de 1 dans le prix leforfaits de ski au cours de la saison précédente (t-1) il a augmenté de 0,48au prix deforfaits de ski pour cette saison (t).
  • Une augmentation d'une piste noire ouverte la saison précédente (t-1) se traduit par une augmentation de 4,1% du prix de laforfaits de ski pour cette saison (t).

Les valeurs entre parenthèses sous les coefficients sont les erreurs types des estimations.

nous substituons

Ensuite,

AnForfaits de ski ()Des pistesAnForfaits de ski ()Des pistes
19953282007886
19964462008405
19975062009686
199855520106310
19994052011696
20003252012728
20013482013758
20026052014715
20036362015739
200464620166310
20057852017678
20068092018686
201963

ADR (p, q) vs. RA (p)

Quel modèle est le mieux adapté pour prédire les prix desforfaits de ski compte tenu des observations ci-dessus, AR (1) ou ADR (1,1) ? En d'autres termes, incorporez-vous la variable indépendantedes pistest-1 dans la régression aide à mieux ajuster notre prédiction?

On regarde le R au carré des régressions des modèles :

Modèle AR (1) : R2= 0,33

Modèle ADR (1,1) : R2= 0,40

Le R2 du modèle ADR (1,1) est supérieur à R2 du modèle AR (1). Cela signifie que la saisie de la variable indépendantedes pistest-1 dans la régression, cela aide à mieux ajuster notre prédiction.