Critère d'information bayésien

Table des matières:

Anonim

Le critère d'information bayésien ou critère de Schwarz est une méthode qui se concentre sur la somme des carrés des résidus pour trouver le nombre de périodes décalées p qui minimisent ce modèle.

En d'autres termes, nous voulons trouver le nombre minimum de périodes décalées que nous incluons dans l'autorégression pour nous aider à prédire la variable dépendante.

De cette façon, nous aurons le contrôle sur le nombre de périodes décalées p que nous incluons dans la régression. Lorsque nous dépasserons ce niveau optimal, le modèle de Schwarz cessera de décroître et nous aurons donc atteint le minimum. C'est-à-dire que nous aurons atteint le nombre de périodes décalées p qui minimisent le modèle de Schwarz.

On l'appelle aussi le critère d'information de Bayes (BIC).

Articles recommandés : autorégression, somme des carrés des résidus (SCE).

Formule du critère d'information bayésien

Bien qu'à première vue cela semble être une formule compliquée, nous passerons par des parties pour la comprendre. Tout d'abord, d'une manière générale, nous devons :

  • Les logarithmes dans les deux facteurs de la formule représentent l'effet marginal de l'inclusion d'une période décalée p plus dans l'auto-régression.
  • N est le nombre total d'observations.
  • Nous pouvons diviser la formule en deux parties : la partie gauche et la partie droite.

La partie de gauche :

Représente la somme des carrés des résidus (SCE) de l'autorégression dep périodes décalées, divisé par le nombre total d'observations (N).

Pour estimer les coefficients, nous utilisons les moindres carrés ordinaires (MCO). Ainsi, lorsque nous incluons de nouvelles périodes décalées, le SCE (p) ne peut être que maintenu ou diminué.

Ensuite, l'augmentation d'une période décalée dans l'autorégression provoque :

  • SCE (p) : diminue ou reste constant.
  • Coefficient de détermination : augmente.
  • EFFET TOTAL : une augmentation d'une période décalée entraîne une diminution de la partie gauche de la formule.

Maintenant la bonne partie :

(p + 1) représente le nombre total de coefficients dans l'autorégression, c'est-à-dire les régresseurs avec leurs périodes décalées (p) et l'interception (1).

Ensuite, l'augmentation d'une période décalée dans l'autorégression provoque :

  • (p+1) : augmente car on incorpore une période décalée.
  • EFFET TOTAL : une augmentation d'une période décalée entraîne une augmentation de la partie droite de la formule.

Exemple pratique

Nous supposons que nous voulons faire une prédiction sur les prix desforfaits de ski pour la prochaine saison 2020 avec un échantillon de 5 ans mais on ne sait pas combien de temps de latence utiliser : AR (2) ou AR (3) ?

  • Nous téléchargeons les données et calculons les logarithmes népérien des prix des forfaits de ski.

1. Nous estimons les coefficients par OLS et obtenons :

Somme des carrés des résidus (SCE) pour AR (2) = 0,011753112

Coefficient de détermination pour AR (2) = 0,085

2. Nous ajoutons 1 période décalée supplémentaire pour voir comment le SCE change :

Somme des carrés des résidus pour AR (3) = 0,006805295

Coefficient de détermination pour AR (3) = 0,47

On voit que lorsqu'on ajoute une période décalée dans l'autorégression, le coefficient de détermination augmente et le SCE diminue dans ce cas.

  • On calcule le critère d'information bayésien :

Plus le modèle BIC est petit, plus le modèle est préféré. Alors, AR (3) serait le modèle préféré par rapport à AR (2) étant donné que son coefficient de détermination est plus élevé, le SCE est plus faible et le modèle de Schwarz ou critère d'information bayésien est également plus faible.