Théorème central limite (TCL)

Le théorème central limite (TCL) est une théorie statistique qui stipule que, étant donné un échantillon aléatoire suffisamment grand de la population, la distribution des moyennes de l'échantillon suivra une distribution normale.

De plus, le TCL indique qu'à mesure que la taille de l'échantillon augmente, la moyenne de l'échantillon se rapprochera de la moyenne de la population. Par conséquent, au moyen du TCL, nous pouvons définir la distribution de la moyenne d'échantillon d'une certaine population avec une variance connue. Ainsi, la distribution suivra une distribution normale si la taille de l'échantillon est suffisamment grande.

Principales propriétés du théorème central limite

Le théorème central limite possède une série de propriétés très utiles dans le domaine statistique et probabiliste. Les principaux sont :

  • Si la taille de l'échantillon est suffisamment grande, la distribution des moyennes d'échantillon suivra approximativement une distribution normale. Le TCL considère un échantillon comme grand lorsque sa taille est supérieure à 30. Par conséquent, si l'échantillon est supérieur à 30, la moyenne de l'échantillon aura une fonction de distribution proche d'une normale. Et cela est vrai quelle que soit la forme de la distribution avec laquelle nous travaillons.
  • La moyenne de la population et la moyenne de l'échantillon seront les mêmes. C'est-à-dire que la moyenne de la distribution de toutes les moyennes de l'échantillon sera égale à la moyenne de la population totale.
  • La variance de la distribution des moyennes de l'échantillon sera σ² / n. C'est la variance de la population divisée par la taille de l'échantillon.

Que la distribution des moyennes de l'échantillon ressemble à une moyenne normale est extrêmement utile. Parce que la distribution normale est très facile à appliquer pour effectuer des tests d'hypothèses et la construction d'intervalles de confiance. En statistique, qu'une distribution soit normale est assez important, car de nombreuses statistiques nécessitent ce type de distribution. De plus, le TCL nous permettra de faire des inférences sur la moyenne de la population à travers la moyenne de l'échantillon. Et c'est très utile quand, faute de moyens, on ne peut pas collecter de données sur l'ensemble d'une population.

Exemple du théorème central limite

Imaginons que nous souhaitions analyser les rendements moyens historiques de l'indice S&P 500, qui, comme nous le savons, compte environ 500 sociétés en son sein. Mais nous n'avons pas assez d'informations pour analyser l'ensemble des 500 sociétés de l'indice. Dans ce cas, la rentabilité moyenne du S&P 500 serait la moyenne de la population.

Maintenant, en suivant le TCL, nous pouvons prélever un échantillon de ces 500 entreprises pour effectuer l'analyse. La seule limitation que nous avons est que dans l'échantillon, il doit y avoir plus de 30 entreprises pour que le théorème soit satisfait. Imaginons donc que nous sélectionnions au hasard 50 sociétés de l'indice et répétions le processus plusieurs fois. Les étapes à suivre dans l'exemple seraient les suivantes :

  • Nous choisissons l'échantillon d'environ 50 entreprises et obtenons la rentabilité moyenne de l'ensemble de l'échantillon.
  • Nous sélectionnons en permanence 50 entreprises et obtenons la rentabilité moyenne.
  • La distribution de tous les rendements moyens de tous les échantillons choisis se rapprochera d'une distribution normale.
  • Les rendements moyens de tous les échantillons sélectionnés se rapprocheront des rendements moyens de l'indice total. Comme le montre le théorème central limite.

Par conséquent, par déduction à partir du rendement moyen de l'échantillon, nous pouvons approcher le rendement moyen de l'indice.

Vous contribuerez au développement du site, partager la page avec vos amis

wave wave wave wave wave