Normalisation statistique - Qu'est-ce que c'est, définition et concept

Table des matières:

Anonim

La normalisation statistique est la transformation d'échelle de la distribution d'une variable afin de pouvoir faire des comparaisons par rapport à des ensembles d'éléments et à la moyenne en éliminant les effets d'influences.

En d'autres termes, la normalisation est des proportions sans unités de mesure (sans dimension ou invariant à l'échelle) qui nous permettent de comparer des éléments de différentes variables et différentes unités de mesure.

En statistique et en économétrie, des tables de distribution de probabilité standardisées sont utilisées pour trouver la probabilité qu'une observation prend étant donné la fonction de distribution que suit la variable.

Il est important de ne pas limiter le terme de normalisation uniquement aux ensembles d'éléments où la distribution normale est une bonne approximation de leur fréquence.

Variable statistique

Tableau

Le tableau suivant détaille les normalisations les plus courantes dans les statistiques appliquées à la finance et à l'économie.

  • Le score typé ou standard normalise les erreurs lorsque l'on peut calculer les paramètres de l'échantillon.
  • La normalisation dans la distribution t de Student normalise les résidus lorsque les paramètres sont inconnus et nous faisons une estimation pour les obtenir.
  • Le coefficient de variation utilise la moyenne comme mesure d'échelle, contrairement au score standardisé et au t de Student, qui utilisent l'écart type. La distribution est normalisée pour les distributions de Poisson et exponentielle.
  • Le moment normalisé peut être appliqué à toute distribution de probabilité qui a une fonction génératrice de moment. Autrement dit, que les intégrales des moments sont convergentes.

Applications

Combien de fois avons-nous lu que la distribution de probabilité normale semble être une assez bonne approximation de la fréquence des observations et on nous demande de trouver la probabilité que la variable X prenne une valeur spécifique ?

En d'autres termes, on pose X ~ N (μ, σ2), et on nous demande de trouver P (X ≤ xje)

On sait que pour trouver P (X ≤ xje), nous devons rechercher la probabilité dans les tables de distribution de probabilité. Dans ce cas, dans les tableaux de la distribution de la distribution normale. Les tables de distribution de probabilités les plus utilisées en économétrie et en finance quantitative sont : le chi carré, le t de Student, le F de Fisher-Snedecor, le Poisson, l'exponentiel, le cauchy et la normale standard.

Les probabilités calculées dans les tables de répartition remplissent la propriété :

C'est-à-dire que les probabilités (les nombres dans le tableau) sont typées. Ensuite, nous devrons également taper notre variable en fonction des paramètres de la fonction de distribution si nous voulons trouver la probabilité de P (X ≤ xje).

Exemple pratique

Nous voulons connaître la probabilité que le nombre de skieurs allant skier un vendredi matin soit de 288.

La station de ski nous dit que la fréquence de la variable skieurs peut se rapprocher d'une distribution normale de moyenne 280 et de variance 16.

Donc nous avons:

X ~ N (μ, σ2)

où X est défini comme la variable « skieurs »

Ils nous demandent la probabilité que le nombre de skieurs allant skier un vendredi soit inférieur ou égal à 288. Soit :

P (X 288)

Traiter

Pour trouver la probabilité que le nombre de skieurs soit égal à 288, nous devons d'abord taper la variable.

Ensuite, nous regardons la table de distribution de la normale standard continue :

Z 0 1 2 3
2,0 0,9772 0,9778 0,9783 0,9788

La probabilité que 288 skieurs aillent skier un vendredi matin est de 97,72 % compte tenu des paramètres de moyenne et de variance.