Le modèle Lagged Distributed Autoregressive (ADR), de l'anglais Modèle de décalage distribué autorégressif(ADL), est une régression qui implique une nouvelle variable indépendante retardée en plus de la variable dépendante retardée.
En d'autres termes, le modèle ADR est une extension du modèle autorégressif d'ordre p, AR (p), qui inclut une autre variable indépendante dans une période antérieure à la période de la variable dépendante.
Exemple
Sur la base des données de 1995 à 2018, nous calculons les logarithmes népérien desforfaits de ski pour chaque année et on recule d'une période pour les variablesforfaits de skit et des pistest:
An | Forfaits de ski (€) | ln_t | ln_t-1 | Pistes_t | Pistes_t-1 | An | Forfaits de ski (€) | ln_t | ln_t-1 | Pistes_t | Pistes_t-1 |
1995 | 32 | 3,4657 | 8 | 2007 | 88 | 4,4773 | 4,3820 | 6 | 9 | ||
1996 | 44 | 3,7842 | 3,4657 | 6 | 8 | 2008 | 40 | 3,6889 | 4,4773 | 5 | 6 |
1997 | 50 | 3,9120 | 3,7842 | 6 | 6 | 2009 | 68 | 4,2195 | 3,6889 | 6 | 5 |
1998 | 55 | 4,0073 | 3,9120 | 5 | 6 | 2010 | 63 | 4,1431 | 4,2195 | 10 | 6 |
1999 | 40 | 3,6889 | 4,0073 | 5 | 5 | 2011 | 69 | 4,2341 | 4,1431 | 6 | 10 |
2000 | 32 | 3,4657 | 3,6889 | 5 | 5 | 2012 | 72 | 4,2767 | 4,2341 | 8 | 6 |
2001 | 34 | 3,5264 | 3,4657 | 8 | 5 | 2013 | 75 | 4,3175 | 4,2767 | 8 | 8 |
2002 | 60 | 4,0943 | 3,5264 | 5 | 8 | 2014 | 71 | 4,2627 | 4,3175 | 5 | 8 |
2003 | 63 | 4,1431 | 4,0943 | 6 | 5 | 2015 | 73 | 4,2905 | 4,2627 | 9 | 5 |
2004 | 64 | 4,1589 | 4,1431 | 6 | 6 | 2016 | 63 | 4,1431 | 4,2905 | 10 | 9 |
2005 | 78 | 4,3567 | 4,1589 | 5 | 6 | 2017 | 67 | 4,2047 | 4,1431 | 8 | 10 |
2006 | 80 | 4,3820 | 4,3567 | 9 | 5 | 2018 | 68 | 4,2195 | 4,2047 | 6 | 8 |
2019 | ? | ? | 4,2195 | 6 |
Pour faire la régression, on utilise les valeurs de ln_t comme variable dépendante et les valeursln_t-1 Ouipistes_t-1 comme variables indépendantes. Les valeurs en rouge sont en dehors de la régression.
On obtient les coefficients de la régression :
Dans ce cas, le signe des régresseurs est positif :
- Une augmentation de 1€ dans le prix leforfaits de ski au cours de la saison précédente (t-1) il a augmenté de 0,48€au prix deforfaits de ski pour cette saison (t).
- Une augmentation d'une piste noire ouverte la saison précédente (t-1) se traduit par une augmentation de 4,1% du prix de laforfaits de ski pour cette saison (t).
Les valeurs entre parenthèses sous les coefficients sont les erreurs types des estimations.
nous substituons
Ensuite,
An | Forfaits de ski (€) | Des pistes | An | Forfaits de ski (€) | Des pistes |
1995 | 32 | 8 | 2007 | 88 | 6 |
1996 | 44 | 6 | 2008 | 40 | 5 |
1997 | 50 | 6 | 2009 | 68 | 6 |
1998 | 55 | 5 | 2010 | 63 | 10 |
1999 | 40 | 5 | 2011 | 69 | 6 |
2000 | 32 | 5 | 2012 | 72 | 8 |
2001 | 34 | 8 | 2013 | 75 | 8 |
2002 | 60 | 5 | 2014 | 71 | 5 |
2003 | 63 | 6 | 2015 | 73 | 9 |
2004 | 64 | 6 | 2016 | 63 | 10 |
2005 | 78 | 5 | 2017 | 67 | 8 |
2006 | 80 | 9 | 2018 | 68 | 6 |
2019 | 63 |
ADR (p, q) vs. RA (p)
Quel modèle est le mieux adapté pour prédire les prix desforfaits de ski compte tenu des observations ci-dessus, AR (1) ou ADR (1,1) ? En d'autres termes, incorporez-vous la variable indépendantedes pistest-1 dans la régression aide à mieux ajuster notre prédiction?
On regarde le R au carré des régressions des modèles :
Modèle AR (1) : R2= 0,33
Modèle ADR (1,1) : R2= 0,40
Le R2 du modèle ADR (1,1) est supérieur à R2 du modèle AR (1). Cela signifie que la saisie de la variable indépendantedes pistest-1 dans la régression, cela aide à mieux ajuster notre prédiction.