Dans cet article, nous expliquons les propriétés de la distribution t de Student.
En d'autres termes, la distribution t est une distribution de probabilité qui estime la valeur de la moyenne d'un petit échantillon tiré d'une population qui suit une distribution normale pour laquelle nous ne connaissons pas son écart-type.
Articles recommandés : degrés de liberté, degrés de liberté (exemple) et distribution normale.
Histoire
William Sealy Gosset (1876-1937) a eu besoin en 1908 de créer une distribution pour l'aider dans les calculs statistiques sur les bières de marque Guinness en Irlande. Étant donné que les résultats devaient être publiés en utilisant des données privées de la brasserie pour démontrer l'applicabilité de sa nouvelle distribution, l'entreprise a interdit à ses employés de publier des informations confidentielles. Cette limitation n'a pas empêché Gosset de publier son constat sous le pseudonyme de Élève. A partir de ce moment, la distribution t est reconnue comme la distribution t de Student.
Propriétés de la distribution t de Student
Les propriétés de la distribution t de Student sont les suivantes :
- C'est une distribution symétrique. Les valeurs de la moyenne, de la médiane et du mode coïncident. Mathématiquement,
- C'est une distribution unimodale. Les valeurs les plus fréquentes ou les plus susceptibles d'apparaître (mode) se situent autour de la moyenne. Lorsque l'on s'éloigne de la moyenne, la probabilité que les valeurs apparaissent et leur fréquence diminue.
- Si nous avons un échantillon de taille n, alors nous aurons une distribution t avec (n-1) degrés de liberté.
En d'autres termes, la distribution aura le même nombre d'observations des deux côtés de la valeur centrale.
- La fonction de densité ne dépend pas des degrés de liberté pour être symétrique.
- La représentation graphique ressemble à la distribution normale, c'est-à-dire qu'elle est également en forme de cloche.
- La valeur médiane ou médiane est zéro (0).
- Plus les degrés de liberté augmentent, plus la distribution t sera similaire à la distribution normale.
Distribution normale vs distribution t
La distribution t et la distribution normale diffèrent principalement parce que la distribution t attribue plus de probabilité aux observations extrêmes que la distribution normale standard (variance supérieure à 1). En d'autres termes, la distribution t a des queues plus larges que la distribution normale.