Kendall's Tau (I) - Qu'est-ce que c'est, définition et concept

Table des matières:

Kendall's Tau (I) - Qu'est-ce que c'est, définition et concept
Kendall's Tau (I) - Qu'est-ce que c'est, définition et concept
Anonim

Il s'agit d'une mesure de dépendance non paramétrique qui identifie les paires concordantes et discordantes de deux variables. Une fois identifiés, les totaux sont calculés et le quotient est établi.

Les corrélations classifiées sont une alternative non paramétrique comme mesure de dépendance entre deux variables lorsque nous ne pouvons pas appliquer le coefficient de corrélation de Pearson.

En d'autres termes, nous attribuons un classement aux observations de chaque variable et étudions la relation de dépendance entre deux variables données. Il existe deux façons de calculer le Tau de Kendall; nous choisissons de calculer la relation de dépendance une fois les observations de chaque variable ordonnées. Dans notre exemple, nous verrons que nous avons trié les classements de la colonne X par ordre croissant.

Mathématiquement,

Nous définissons:

Cm = nombre total de paires correspondantes.

NCm = nombre total de paires non concordantes (discordantes).

Procédure et exemple pratique

Pour obtenir le Tau de Kendall, il faut d'abord savoir identifier les couples concordants et discordants de deux variables.

Nous utiliserons les préférences des skieurs. Dans cet exemple, nous supposons que nous voulons évaluer si les skieurs classent leurs préférences pour le ski alpin ou le ski nordique dans le même ordre dans une station i. Leurs notes peuvent aller de 1 (très préférable) à 7 (très peu préférable).

Notre question serait : y a-t-il une dépendance entre les préférences des skieurs alpins et des skieurs nordiques dans les stations de ski données ?

Nous définissons:

X = note des skieurs pour le ski alpin de la station i.

Y = évaluation des skieurs pour le ski nordique à la station i.

C = paires concordantes.

NC = paires non concordantes / discordantes.

ETje = station de ski i.

Traiter

  • Nous partons d'un échantillon de n = 7 observations des stations de ski. Chaque ligne du tableau sont des classements donnés par les skieurs. Chaque paire de stations peut être concordante ou discordante. Dans les colonnes C et NC, nous ne comptons les paires que dans un sens. Par exemple, la paire AB et BA sont comptées comme une seule paire pour éviter les répétitions.

Les observations obtenues sont :

Station de ski (je) X Z
À 1 1
B 2 3
C 3 4
4 2
ET 5 7
F 6 6
g 7 5
  1. Nous avons trié les éléments de la colonne X par ordre croissant pour pouvoir les comparer avec les éléments de la colonne Z
  2. On retrouve les paires concordantes et les paires discordantes.
Station de ski (je) X Z CNC
À 1 1 6 0
B 2 3 5 0
C 3 4 5 1
4 2 4 0
ET 5 7 4 1
F 6 6 4 1
g 7 5 43 3 Le total
  • Nous regardons d'abord la colonne Z puisque la colonne X est déjà triée par ordre croissant. Par conséquent, toutes les classifications de la colonne Z qui ne sont pas ascendantes seront des paires de stations discordantes.
    • Lorsque nous cherchons des paires de stations (concordantes et non concordantes) nous aurons toujours la dernière ligne d'observations car nous recherchons des paires (ensembles de deux observations).
    • Tous ceux qui sont en dessous d'une classification de référence seront des paires concordantes. Dans le premier cas, les deux skieurs établissent ce classement de référence à 1. Tous les classements inférieurs à 1 seront des couples concordants avec A. Au total nous avons 7 stations à classer. Donc, il y aura 6 paires concordantes de A. Comme nous n'avons pas de paires discordantes associées à A, nous mettrons un zéro.

Lire la deuxième partie du Tau de Kendall (II)