Modèles à choix binaires

Les modèles de choix binaires sont des modèles où la variable dépendante ne prend que deux valeurs : 1 pour indiquer le « succès » ou « 0 » pour indiquer l'échec. Les modèles d'estimation concrets sont : probabilité linéaire, logit et probit.

Dans le modèle de régression simple ou multiple enseigné dans le cours d'introduction à l'économétrie, la variable dépendante a généralement une interprétation économique (comme l'augmentation du PIB, de l'investissement ou de la consommation) à partir d'autres variables explicatives.

Mais quel modèle utilisons-nous lorsque nous voulons expliquer des événements qui n'ont que deux possibilités ? Par exemple : réussir la matière ou ne pas la réussir, être diplômé de l'université ou ne pas être diplômé, être en emploi ou au chômage, etc. C'est à cela que répondent les modèles de choix binaires.

Dans chacun de ces cas, vous pouvez faire Oui = 1 signifie "succès"; Oui = 0 signifie "échec". Pour cette raison, ils sont appelés modèles de choix binaires et l'équation qu'il utilise est la suivante :

De cette façon, nous obtiendrons la probabilité de succès d'une certaine variable.

Jusqu'à présent, il n'a pas de complication majeure. Cependant, l'estimation et l'interprétation des paramètres nécessitent une plus grande prudence.

Modèle de régression

Modèles d'estimation des paramètres binaires

Compte tenu des caractéristiques précitées de la variable indépendante, il existe trois modèles d'estimation des paramètres :

  • Modèle de probabilité linéaire. Il est calculé par le biais de l'OLS normal.
  • Modèle Logit. Il est calculé avec une fonction de distribution logistique standard.
  • Modèle probit. Il est calculé avec une fonction de distribution normale standard.

Modèle de probabilité linéaire

Le modèle de probabilité linéaire (MPL) est ainsi nommé parce que la probabilité
la réponse est linéaire par rapport aux paramètres de l'équation. Pour l'estimation, utilisez les moindres carrés ordinaires (MCO)

L'équation estimée s'écrit

La variable indépendante (et chapeau) est la probabilité de succès prédite.

Le B0 cap est la probabilité de succès prédite lorsque chacun des x est égal à zéro. Le coefficient B1 cap mesure la variation de la probabilité de succès prédite lorsque x1 augmente d'une unité.

Pour interpréter correctement un modèle de probabilité linéaire, nous devons prendre en compte ce qui est considéré comme un succès et ce qui ne l'est pas.

Exemple de modèle de choix binaire

L'économiste Jeffrey Wooldridge a estimé un modèle économétrique où la variable binaire indique si une femme mariée a participé à la population active (variable expliquée) en 1975. Dans ce cas Oui = 1 signifie que e a participé Oui = 0 ce qui n'a pas été le cas.

Le modèle utilise le niveau de revenu du mari comme variable explicative (hinc), Années d'études (éduquer), des années d'expérience sur le marché du travail (expérience), l'âge (âge), le nombre d'enfants de moins de six ans (enfantslt6) et le nombre d'enfants entre 6 et 18 ans (kidsge6).

Nous pouvons vérifier que toutes les variables, à l'exception de kidsge6, sont statistiquement significatives et que toutes les variables significatives ont l'effet attendu.

Maintenant, l'interprétation des paramètres est comme ceci :

  • Si vous augmentez d'une année d'études, ceteris paribus, la probabilité de rejoindre la population active augmente de 3,8 %.
  • Si l'expérience augmente en un an, la probabilité de faire partie de la population active augmente de 3,9 %.
  • Si vous avez un enfant de moins de 6 ans, ceteris paribus, la probabilité de faire partie de la population active est diminuée de 26,2 %.

Ainsi, nous voyons que ce modèle nous indique l'effet de chaque situation sur la probabilité qu'une femme soit formellement embauchée.

Ce modèle peut être utilisé pour évaluer les politiques publiques et les programmes sociaux, puisque l'évolution de la « probabilité prédite de succès » peut être quantifiée par rapport à des changements unitaires ou marginaux des variables explicatives.

Inconvénients du modèle de probabilité linéaire

Cependant, ce modèle présente deux inconvénients principaux :

  • Cela peut donner des probabilités inférieures à zéro et supérieures à un, ce qui n'a pas de sens en termes d'interprétation de ces valeurs.
  • Les effets partiels sont toujours constants. Dans ce modèle, il n'y a pas de différence entre passer de zéro enfant à un enfant et passer de deux à trois enfants.
  • Comme la variable explicative ne prend que des valeurs de zéro ou un, une hétéroscédasticité peut être générée. Les erreurs standard sont utilisées pour résoudre ce problème.

Pour résoudre les deux premiers problèmes, qui sont les plus importants dans le modèle de probabilité linéaire, les modèles Logit et Probit ont été conçus.

Les références:

Wooldridge, J. (2010) Introduction à l'économétrie. (4e éd.) Mexique : Cengage Learning.

Vous contribuerez au développement du site, partager la page avec vos amis

wave wave wave wave wave