Kendall's Tau (II) - Qu'est-ce que c'est, définition et concept

Il s'agit d'une mesure de dépendance non paramétrique qui identifie les paires concordantes et discordantes de deux variables. Une fois identifiés, les totaux sont calculés et le quotient est établi.

En d'autres termes, nous attribuons un classement aux observations de chaque variable et étudions la relation de dépendance entre deux variables données.

Il existe deux façons de calculer le Tau de Kendall; nous choisissons de calculer la relation de dépendance une fois les observations de chaque variable ordonnées. Dans notre exemple, nous verrons que nous trions les classements de la colonne X par ordre croissant.

Les corrélations classifiées sont une alternative non paramétrique comme mesure de dépendance entre deux variables lorsque nous ne pouvons pas appliquer le coefficient de corrélation de Pearson.

Ce sont les résultats que nous avons référencés dans le premier article -> Kendall's Tau (I) :

Station de ski (je) X Z C NC
À 1 1 6 0
B 2 3 5 0
C 3 4 5 1
4 2 4 0
ET 5 7 4 1
F 6 6 4 1
g 7 5 43 3 LE TOTAL
  • La paire BC-CB est une paire discordante. Nous entrons 1 dans la colonne NC et figons le compteur en dernière position jusqu'à ce que nous trouvions à nouveau une paire correspondante. Dans ce cas, nous avons gelé le nombre de paires d'appariement à 5 jusqu'à la station D. La station D ne peut former que 4 paires d'appariement : AD-DA, DE-ED, DF-FD, DG-GD.

Une autre paire discordante serait EF-FE :

  • La paire EF-FE est une paire discordante. Nous écrivons 1 dans la colonne NC et continuons à faire glisser le nombre 4 de paires concordantes qui peuvent être formées. Les paires correspondantes de la station E seraient : EA-AE, EB-BE, EC-CE, ED-DE car EF-FE est discordante.
    • La paire FG-GF est une paire discordante. Nous écrivons 1 dans la colonne NC et continuons à faire glisser le nombre 4 de paires concordantes qui peuvent être formées. Les paires concordantes de la station F s (nous n'avons pas fait varier le au lieu de 4. Les paires concordantes que nous avons pu montrer auparavant (nous n'avons pas fait varier le seraient : FA-AF, FB-BF, FC-CF, FD-DF parce que FG-GF est choquant.

On calcule le Tau de Kendall

Le Tau de Kendall n'a d'autre secret que d'être le quotient des paires concordantes et discordantes d'un échantillon d'observations.

Interprétation

Notre question initiale était : existe-t-il une relation de dépendance entre les préférences des skieurs alpins et des skieurs nordiques dans des stations de ski données ?

Dans ce cas, nous avons une dépendance entre les deux variables de 0,8695. Un résultat très proche de la limite supérieure. Ce résultat nous indique que les skieurs alpins (X) et les skieurs nordiques (Z) ont classé les stations avec des classements similaires.

Sans avoir à faire de calcul, on constate que les premières stations (A, B, C) reçoivent les meilleurs scores des deux groupes. Autrement dit, les notes des skieurs vont dans le même sens.

Comparaison : Pearson contre Kendall

Si nous calculons le coefficient de corrélation de Pearson compte tenu des observations précédentes et le comparons avec le Tau de Kendall, nous obtenons :

Dans ce cas, le Tau de Kendall nous dit qu'il existe une relation de dépendance plus forte entre les variables X et Z par rapport au coefficient de corrélation de Pearson : 0,8695 > 0,75.

Si les valeurs aberrantes avaient beaucoup d'influence sur les résultats, nous trouverions une grande différence entre Pearson et Spearman et, par conséquent, nous devrions utiliser Spearman comme mesure de dépendance.