R au carré ajusté (coefficient de détermination ajusté)

Le R au carré ajusté (ou coefficient de détermination ajusté) est utilisé dans une régression multiple pour voir le degré d'intensité ou d'efficacité des variables indépendantes pour expliquer la variable dépendante.

En termes plus simples, le R au carré ajusté nous indique quel pourcentage de la variation de la variable dépendante est expliqué collectivement par toutes les variables indépendantes.

L'utilisation de ce coefficient est justifiée en ce qu'à mesure que l'on ajoute des variables à une régression, le coefficient de détermination non ajusté a tendance à augmenter. Même lorsque la contribution marginale de chacune des nouvelles variables ajoutées n'a aucune pertinence statistique.

Ainsi, en ajoutant des variables au modèle, le coefficient de détermination pourrait augmenter et on pourrait penser, à tort, que l'ensemble de variables choisi est capable d'expliquer une plus grande partie de la variation de la variable indépendante. Ce problème est communément appelé « surestimation du modèle ».

Coefficient de variationAnalyse de régression

Coefficient de formule de détermination ajusté

Pour résoudre le problème décrit ci-dessus, de nombreux chercheurs suggèrent d'ajuster le coefficient de détermination à l'aide de la formule suivante :

R2 à → R au carré ajusté ou coefficient de détermination ajusté

R2 → R au carré ou coefficient de détermination

m → Nombre d'observations dans l'échantillon

k → Nombre de variables indépendantes

Considérant que 1-R2 est un nombre constant et puisque n est supérieur à k, à mesure que nous ajoutons des variables au modèle, le quotient entre parenthèses devient plus grand. En conséquence. aussi le résultat de la multiplication par 1-R2 . Avec quoi on voit que la formule est construite pour ajuster et pénaliser l'inclusion de coefficients dans le modèle.

En plus de l'avantage précédent, l'ajustement utilisé dans la formule précédente nous permet également de comparer des modèles avec différents nombres de variables indépendantes. Encore une fois, la formule ajuste le nombre de variables entre un modèle et un autre et nous permet de faire une comparaison homogène.

En revenant à la formule précédente, on peut en déduire que le coefficient de détermination ajusté sera toujours égal ou inférieur au coefficient de R2. Contrairement au coefficient de détermination qui varie entre 0 et 1, le coefficient de détermination ajusté pourrait être négatif pour 2 raisons :

  • Plus k se rapproche de n.
  • Plus le coefficient de détermination est bas.
Coefficient de corrélation linéaire

Articles Populaires

Révolution de février 1917

✅ Révolution de février 1917 | Qu'est-ce que c'est, sens, concept et définition. La révolution de février 1917 fut un soulèvement du peuple russe contre le tsar...…