Le rho de Spearman est une mesure de dépendance non paramétrique dans laquelle la hiérarchie moyenne des observations est calculée, les différences sont mises au carré et incorporées dans la formule.
En d'autres termes, nous attribuons un classement aux observations de chaque variable et étudions la relation de dépendance entre deux variables données.
Les corrélations classifiées sont une alternative non paramétrique comme mesure de dépendance entre deux variables lorsque nous ne pouvons pas appliquer le coefficient de corrélation de Pearson.
Généralement, la lettre giega est attribuée rhô au coefficient de corrélation.
L'estimation du rho de Spearman est donnée par :
Procédure Rho Spearman
0. Nous partons d'un échantillon de m observations (Aje, Bje).
1. Classer les observations de chaque variable en les corrigeant pour les liens.
- Nous utilisons une fonction excel qui classe les observations pour nous et les ajuste automatiquement si elle trouve des liens entre les éléments. Cette fonction s'appelle HERARCH.MEDIA (classement Aje; Un classementm;ordre).
- Le dernier facteur de la fonction est facultatif et nous indique dans quel ordre nous voulons ordonner les observations. Un nombre différent de zéro trie les observations par ordre croissant. Par exemple, il attribuera au plus petit élément un rang de 1. Si on met un zéro dans la variable ordre, attribuera au plus gros élément un rang de 1 (ordre décroissant).
Exemple pratique
- Dans notre cas, nous attribuons à la variable d'ordre un nombre différent de zéro pour classer les observations dans l'ordre croissant. C'est-à-dire attribuer au plus petit élément de la variable un rang de 1.
- On vérifie que les sommes totales des colonnes de Classement A Oui Classement B ils sont égaux entre eux et se rencontrent :
Dans ce cas n = 10 car nous avons un total de 10 éléments/observations dans chaque variable À Oui B.
La somme totale de la classification A est égale à la somme totale de la classification Y et ils remplissent également la formule ci-dessus.
À | B | Classement A | Classement B | Différences au carré |
0 | 50 | 2,5 | 8,5 | 36 |
70 | -20 | 9 | 3 | 36 |
-20 | 30 | 1 | 6,5 | 30,25 |
40 | -90 | 6 | 1 | 25 |
30 | 0 | 5 | 4 | 1 |
50 | 30 | 7 | 6,5 | 0,25 |
20 | 20 | 4 | 5 | 1 |
0 | -40 | 2,5 | 2 | 0,25 |
80 | 70 | 10 | 10 | 0 |
60 | 50 | 8 | 8,5 | 0,25 |
Le total | 55 | 55 | 130 |
2. Ajoutez les différences entre les classements et mettez-les au carré.
- Une fois que nous avons toutes les observations classées en tenant compte des liens entre elles, nous calculons la différence sous la forme :
réje = Unje -Bje
On définit (dje) comme différence entre la classification de Aje et le classement de Bje.
- Une fois la différence obtenue, on la carré. Les carrés des différences sont appliqués pour n'avoir que des valeurs positives.
On définit dje2 comme la différence au carré entre la classification de Aje et le classement de Bje.
Dans la colonne des différences au carré nous aurons :
réje2 = (Unje -Bje)2
3. Calculez le rho de Spearman :
- On calcule la somme totale des différences au carré de la forme :
Dans notre exemple :
- Nous intégrons le résultat dans la formule rho de Spearman :
Dans notre exemple :
Comparaison : Pearson contre Spearman
Si nous calculons le coefficient de corrélation de Pearson compte tenu des observations précédentes et le comparons avec le coefficient de corrélation de Spearman, nous obtenons :
- Pearson = 0,1109
- Lancier = 0,2121
Nous pouvons voir que la dépendance entre les variables A et B reste faible même en utilisant Spearman au lieu de Pearson.
Si les valeurs aberrantes avaient beaucoup d'influence sur les résultats, nous trouverions une grande différence entre Pearson et Spearman et, par conséquent, nous devrions utiliser Spearman comme mesure de dépendance.