Quantile - Qu'est-ce que c'est, définition et concept

Table des matières:

Anonim

Un quantile est ce point qui divise la fonction de distribution d'une variable aléatoire en intervalles réguliers.

Par conséquent, ce n'est rien de plus qu'une technique statistique pour séparer les données d'une distribution. Bien sûr, il faut s'assurer que les groupes sont égaux. Pour cette raison, il existe différents types de quantiles, comme nous le verrons plus loin, en fonction du nombre de partitions qu'ils réalisent.

Ils sont extrêmement utiles dans de nombreuses applications pratiques, dans l'exemple que nous allons en montrer une.

Formulaire de calcul des quantiles

Les quantiles peuvent être calculés d'un point de vue paramétrique et non paramétrique. Regardons à la fois plus en détail et aussi la soi-disant "fonction quantile".

  • Paramétrique: Ils sont utilisés dans des distributions dont on connaît la forme. C'est-à-dire que la distribution sera normale, uniforme, exponentielle, etc. De cette façon, on suppose qu'elle est connue et ses principaux paramètres (moyenne arithmétique et variance) également.
  • Non paramétrique: Il convient aux petits échantillons où il est difficile de connaître sa forme exacte et donc on ne connaît pas sa fonction de distribution. Cette méthode fournit des valeurs similaires à la précédente lorsque l'échantillon augmente et, par conséquent, l'utilisation des deux est indifférente.
  • Fonction quantile: Nous sommes face à une forme de calcul probabiliste. L'objectif est de calculer une valeur qui a une certaine probabilité dans une fonction de distribution. Nous n'entrerons pas dans les questions mathématiques qui compliquent le concept.

Quantiles les plus fréquents

Nous allons montrer quels sont les quantiles les plus utilisés en statistique. La plupart d'entre eux sont couramment utilisés pour pouvoir analyser en détail la distribution des données. De plus, une autre de ses utilisations est de séparer les données en groupes, en pouvant choisir la plus élevée ou la plus faible. Dans l'exemple, nous verrons cela plus en détail.

  • quartile: Séparez les valeurs en quatre groupes égaux et il y a trois quartiles. C'est le plus fréquent. Le quartile un (Q1) est la donnée la plus faible et le quartile trois (Q3) est la plus élevée. D'autre part, le quartile deux (Q2) correspond à la médiane (Me) qui est une statistique de position qui divise la distribution des données en deux. Les valeurs quantiles seraient de 0,25 (Q1), 0,5 (Q2) et 0,75 (Q3).
  • Quintile: Semblable au précédent, il est moins fréquent et divise les données en cinq parties égales. Il y a donc quatre quintiles. Les valeurs quantiles dans ce cas seraient 0,20, 0,40, 0,60, 0,80.
  • Décile: Dans ce cas, ils sont divisés en dix parties et, par conséquent, il y a neuf déciles. Encore une fois, ce n'est pas trop fréquent non plus. Leurs valeurs seraient de 0,1 à 0,9.
  • Centiles: Nous sommes confrontés à une variante dans laquelle la distribution est divisée en cent parts égales. Elle peut être intéressante pour de très gros échantillons. Leurs valeurs vont de 0,01 à 0,99.

Exemple de quantile

Regardons un exemple dans lequel nous avons une série de données sur le revenu des habitants d'une certaine commune. Nous avons calculé les trois quartiles et trois déciles les plus représentatifs. Nous incluons les formules utilisées, en tenant compte du fait que pour les déciles nous utilisons l'équivalent en centiles. N'oubliez pas que les données de Q2 et D5 sont équivalentes à la médiane.

On peut observer que le revenu des individus représentant les 25 % les moins favorisés (Q1) est de 2 900. Par rapport au décile, le revenu des 10 % (D1) des individus qui reçoivent le moins est de 2 800. La même interprétation est faite avec les supérieurs, mais à l'envers. Les 25 % (Q3) qui gagnent le plus obtiennent un revenu de 4 100 et les 10 % de 4 800. Le quantile reflète donc une information pertinente pour en savoir plus sur une variable.