L'interaction entre variables indépendantes dans une régression multiple se produit lorsque l'effet partiel sur la variable dépendante d'une variable indépendante dépend d'une autre variable indépendante de la régression.
En d'autres termes, on veut quantifier la relation de dépendance entre variables indépendantes lorsque l'une d'entre elles affecte partiellement la variable dépendante du modèle.
Le point de départ est une régression multiple.
Procédure et exemple
Nous voulons étudier le prix de forfaits de ski(forfaits de skije) selon la qualité de la neige (neigeje) et le niveau des skieurs (niveauje). Nous traiterons ces variables qualitatives comme des variables muettes ou binaires. C'est-à-dire:
neigeje = très bonne qualité de neige => neigeje=1.
neigeje = très mauvaise qualité de neige => neigeje=0.
niveauje = niveau de skieurs élevé => niveauje=1.
niveauje = niveau des skieurs bas => niveauje=0.
Ensuite,
Modèle 1
H.H.1 = est l'effet partiel d'une très bonne qualité de neige (neigeje= 1) sur le journal (forfaits de skije), en maintenant le niveau des skieurs constant (niveauje).
H.H.2 = est l'effet partiel du niveau élevé des skieurs (niveauje= 1) sur le journal (forfaits de skije), en maintenant la qualité de la neige constante (neigeje).
Le modèle 1 a une limitation importante : garder constante l'une des variables muettes du modèle implique que :
niveauje= constant => On ne distingue pas entre haut niveau (niveauje= 1) ou faible (niveauje=0).
neigeje= constant => On ne fait pas la distinction entre une très bonne qualité (neigeje= 1) ou très mauvais (neigeje=0).
Au-delà de cette limitation, on peut modifier la régression pour qu'il y ait une interaction (dépendance) entre les variables indépendantes qui puisse différencier les deux valeurs que prend la variable indépendante constante.
Mathématiquement, on peut considérer que l'effet partiel de neigeje à propos du journal (forfaits de skije) en gardant niveauje constante dépend de la valeur qu'il prend niveauje. En cas de niveauje il se peut que l'effet partiel de niveaujeà propos du journal (forfaits de skije) en gardant neigeje constante dépend de la valeur qu'il prend neigeje.
Schématiquement
S'il y a une interaction entreniveauje Ouineigeje, et alors, quandniveauje est constant, nous pouvons différencier entre le niveau haut ou bas. De cette façon, le prix deforfaits de ski lorsque la qualité de la neige est très bonne (neigeje= 1) sera différent selon que le niveau des skieurs est haut ou bas.
S'il y a une interaction entreniveauje Ouineigejealors quand il neigejec'est constant on peut faire la différence entre une très bonne ou une très mauvaise neige. De cette façon, le prix deforfaits de skilorsque le niveau des skieurs est élevé (niveauje= 1) sera différent selon que la neige est très bonne ou très mauvaise.
Comment traduire cette interaction en régression ? Incorporer le terme d'interaction.
Le terme d'interaction est :
(neigeje · niveauje )
Cette nouvelle régression incorporant à la fois des variables indépendantes binaires et le terme d'interaction est appelée modèle de régression d'interaction à variables binaires.