Coefficient de corrélation linéaire

La corrélation, également connue sous le nom de coefficient de corrélation linéaire (Pearson), est une mesure de régression qui tente de quantifier le degré de variation conjointe entre deux variables.

Par conséquent, il s'agit d'une mesure statistique qui quantifie la dépendance linéaire entre deux variables, c'est-à-dire que si les valeurs prises par deux variables sont représentées dans un diagramme de dispersion, le coefficient de corrélation linéaire indiquera à quel point l'ensemble de points représenté est bon ou mauvais. s'approche d'une ligne.

De manière moins familière, nous pouvons le définir comme le nombre qui mesure le degré d'intensité et le sens de la relation entre deux variables.

Étant:

Cov (x; y): la covariance entre la valeur "x" et "y".

(x): écart type de "x".

(y): écart type de "y".

Valeurs que peut prendre la corrélation

ρ = -1 Corrélation parfaite négative

ρ = 0 Il n'y a pas de corrélation

ρ = +1 corrélation parfaite positive

On parle de corrélation positive si chaque fois que la valeur "x" augmente, la valeur "y" augmente, et aussi avec la même intensité (+1).

Dans le cas contraire, si à chaque fois que la valeur "x" augmente et que la valeur "y" diminue, et aussi avec la même intensité, on parle alors de corrélation négative (-1).

Il est important de savoir que cela ne signifie pas qu'ils le font dans la même proportion (sauf s'ils ont le même écart type).

Analyse de régression

Représentation graphique de la corrélation

Corrélation parfaite positive :

Il n'y a pas de corrélation :

Corrélation parfaite négative :

Astuce : à de nombreuses reprises, nous n'avons pas les moyens ni les données pour utiliser cette formule. Par conséquent, si nous avons deux séries de prix, nous pouvons calculer le coefficient de corrélation dans Excel, en utilisant la fonction suivante : coef.de.correl (série de prix x; série de prix y).

r au carré ou coefficient de déterminationcoefficient de variation