La distribution t de Student - Qu'est-ce que c'est, définition et concept

La distribution t de Student ou distribution t est un modèle théorique utilisé pour approximer le moment du premier ordre d'une population normalement distribuée lorsque la taille de l'échantillon est petite et que l'écart type est inconnu.

En d'autres termes, la distribution t est une distribution de probabilité qui estime la valeur de la moyenne d'un petit échantillon tiré d'une population qui suit une distribution normale et dont on ne connaît pas son écart type.

Articles recommandés : degrés de liberté, degrés de liberté (exemple) et distribution normale.

Formule de distribution t de Student

Étant donné une variable aléatoire continue L, nous disons que la fréquence de ses observations peut être approchée de manière satisfaisante à une distribution t avec g degrés de liberté telle que :

Représentation de la distribution t de Student

Fonction de densité d'une distribution t à 3 degrés de liberté (df).

Comme nous pouvons le voir, la représentation de la distribution t ressemble beaucoup à la distribution normale sauf que la distribution normale a des queues plus larges et est plus étayée. En d'autres termes, nous devrions ajouter plus de degrés de liberté à la distribution t afin que la distribution « grandisse » et ressemble davantage à la distribution normale.

Spécialité

Et… Pourquoi la distribution t est-elle si spéciale ?

Eh bien, parce que contrairement à la distribution normale qui dépend de la moyenne et de la variance, la distribution t ne dépend que des degrés de liberté, de l'anglais, degrés de liberté (df). Autrement dit, en contrôlant les degrés de liberté, on contrôle la distribution.

Application t de l'étudiant

La distribution t est utilisée lorsque :

  • Nous voulons estimer la moyenne d'une population normalement distribuée à partir d'un petit échantillon.
  • La taille de l'échantillon est inférieure à 30 éléments, c'est-à-dire n <30.

À partir de 30 observations, la distribution t ressemble étroitement à la distribution normale, nous utiliserons donc la distribution normale.

  • L'écart type d'une population n'est pas connu et doit être estimé à partir des observations de l'échantillon.

Exemple

Nous supposons que nous avons 28 observations d'une variable aléatoire G qui suit une distribution t de Student avec 27 degrés de liberté (df).

Mathématiquement,

Puisque nous travaillons avec des données réelles, il y aura toujours une erreur d'approximation entre les données et la distribution. En d'autres termes, la moyenne, la médiane et le mode ne seront pas toujours zéro (0) ou exactement les mêmes.

Nous représentons la fréquence de chaque observation de la variable G au moyen d'un histogramme.

La variable aléatoire G peut-elle approximer une distribution t ?

Raisons de considérer que la variable G suit une distribution t :

  • La distribution est symétrique. C'est-à-dire qu'il y a le même nombre d'observations à la fois à droite et à gauche de la valeur centrale. De plus, la moyenne et la médiane ont tendance à être proches de la même valeur. La moyenne est approximativement de zéro, moyenne = 0,016.
  • Les observations avec le plus de fréquence ou de probabilité se situent autour de la valeur centrale. Les observations avec moins de fréquence ou de probabilité sont loin de la valeur centrale.