Le modèle de probabilité linéaire est un modèle de choix binaire. En cela, l'espérance conditionnelle de la variable dépendante est une fonction linéaire, c'est-à-dire que la relation de la variable dépendante avec la ou les variables explicatives est constante.
Pour le voir autrement, le modèle de probabilité linéaire est un modèle où l'on a une variable dépendante et une variable indépendante(s) multipliée par un coefficient(s) permanent(s).
Il faut souligner que le modèle de probabilité linéaire est un modèle de choix binaire, c'est-à-dire où la variable dépendante peut prendre deux valeurs. Ces valeurs sont 1 ou 0, pour indiquer respectivement le succès ou l'échec.
Le modèle de probabilité linéaire s'exprime comme suit :
E (Y | X = x) = Pr (Y = 1 | X = x) = p (x) = 0 + β1x
Dans l'équation illustrée, l'espérance conditionnelle de Y étant donné X est interprétée comme égale à β0 + β1x.
Dans ce cas, on prend l'espérance conditionnelle, puisque l'on s'intéresse à connaître la probabilité qu'un individu prenne une décision compte tenu de ses caractéristiques, par exemple (ou une autre variable indépendante peut être prise comme référence).
Inconvénients du modèle de probabilité linéaire
Certains inconvénients du modèle de probabilité linéaire sont les suivants :
- Le modèle de probabilité linéaire peut montrer une hétéroscédasticité. C'est-à-dire, la variance des erreurs n'est pas la même dans toutes les observations faites. Dans ce cas, des erreurs standard sont utilisées.
- On ne peut pas supposer que les erreurs sont normalement distribuées.
- La variable dépendante ne peut prendre que deux valeurs.
- On suppose que les variables indépendantes et dépendantes ont une relation linéaire, c'est-à-dire que le taux de changement est toujours le même. Cependant, il peut être plus précis de construire un modèle où le taux de changement augmente lorsque Y atteint une valeur plus élevée, et l'inverse se produit lorsque Y diminue.
Compte tenu de ces inconvénients, il existe les modèles logit et probit.
Exemple d'un modèle de probabilité linéaire
Un modèle de probabilité linéaire peut être construit, par exemple, où la variable dépendante est de savoir si la personne a actuellement un emploi formel qu'elle a occupé pendant un an ou plus. Les variables indépendantes pourraient être le niveau d'études ou le niveau d'instruction, le sexe et l'âge.
Dans l'exemple illustré, la variable dépendante sera 1 ou 0, mais elle doit être interprétée qualitativement, quelle que soit sa valeur numérique. Ainsi, 1 signifie que la personne a un emploi formel qui a été maintenu pendant plus d'un an, et 0 serait la situation dans laquelle cela ne se produit pas.