Variable pertinente omise

Table des matières:

Anonim

L'omission d'une variable pertinente est la non-inclusion d'une variable explicative importante dans une régression. Compte tenu des hypothèses de Gauss-Markov, cette omission entraînerait un biais et une incohérence dans nos estimations.

En d'autres termes, l'omission d'une variable pertinente se produit lorsque nous l'incorporons dans le terme d'erreur u parce que nous ne la prenons pas en compte. Cela entraînera l'existence d'une corrélation entre la variable dépendante et le terme d'erreur u.

Mathématiquement, on suppose que :

Cov (x, u) = 0

Si nous incorporons une variable pertinente dans le terme d'erreur ou alors, ensuite:

Cov (x, u) 0

Compte tenu des hypothèses de Gauss-Markov, cette corrélation :

(ρ (x, u) 0)

Cela ne remplirait pas cela :

E (u | x) = E (u) = 0

C'est-à-dire que l'espérance des erreurs conditionnées aux erreurs explicatives est égale à l'espérance de l'erreur et qu'elle est également nulle. Ce sont les hypothèses d'impartialité (exogénéité stricte + moyenne nulle)

En cas d'omission de la variable pertinente, l'estimateur OLS est biaisé et devient incohérent. Cela viole donc deux des propriétés de l'estimateur et rend notre estimation erronée.

Exemple théorique

On suppose que l'on veut étudier le nombre de skieurs saisonniers (t) en tenant compte de plusieurs facteurs : le prix des forfaits de ski (forfaits de ski) et le nombre de pistes ouvertes (pistes) et la qualité de la neige (neige).

Modèle 0

Nous supposons que les variables explicatives (forfaits de ski, pentes et neige) sont des variables pertinentes pour le modèle 0 car elles appartiennent au modèle de population. Autrement dit, les variables explicatives de notre modèle 0 ont un effet partiel sur la variable dépendante skieurs dans le modèle de population. Ensuite, à la fois dans les modèles de population et d'échantillon (modèle 0) auront des coefficients autres que zéro.

Interprétation

Une augmentation de la qualité de la neige (neige) et du nombre de pistes ouvertes (pistes) entraîne une augmentation des estimations de β2 et3. Par conséquent, cela se reflète dans le nombre de skieurs (skieurs).

Une augmentation en pourcentage du prix des forfaits de ski entraîne une diminution de β1/ 100 en nombre de skieurs (skieurs)

Traiter

Nous traitons la variable neige comme une variable omise du modèle. Ensuite:

Modèle 1

Nous différencions le terme d'erreur u du modèle 0 et le terme d'erreur v du modèle 1 car l'un n'inclut pas la variable pertinente neige et l'autre le fait.

Dans le modèle 1, nous avons omis une variable pertinente du modèle et l'avons introduite dans le terme d'erreur u. Ceci signifie que:

  • Cov (neige, v) ≠ 0 → ρ (neige, v) ≠ 0
  • E (v | neige) ≠ 0

Si nous omettons la variable neige pertinente dans notre modèle 1, nous ferons en sorte que l'estimateur OLS présente un biais et une incohérence. Notre estimation du nombre de skieurs saisonniers sera donc fausse. La station de ski peut être en grande difficulté financière si vous tenez compte de notre estimation du modèle 1.