Un estimateur sans biais est celui dont l'espérance mathématique coïncide avec la valeur du paramètre que vous souhaitez estimer. S'ils ne coïncident pas, on dit que l'estimateur a un biais.
La raison de rechercher un estimateur sans biais est que le paramètre que nous voulons estimer est bien estimé. En d'autres termes, si nous voulons estimer les buts moyens par match d'un certain joueur de football, nous devons utiliser une formule qui nous donne une valeur aussi proche que possible de la valeur réelle.
Dans le cas où l'espérance de l'estimateur ne coïncide pas avec la vraie valeur du paramètre, on dit que l'estimateur a un biais. Le biais est mesuré comme la différence entre la valeur attendue de l'estimateur et la valeur réelle. Mathématiquement, on peut noter comme suit :
De la formule ci-dessus, la première et la dernière partie sont claires. C'est-à-dire que l'espérance de l'estimateur est égale à la vraie valeur du paramètre. Si cette égalité est vérifiée, alors l'estimateur est sans biais. La partie centrale mathématiquement plus abstraite est expliquée dans le paragraphe suivant.
La moyenne de toutes les estimations que l'estimateur peut faire pour chaque échantillon différent est égale au paramètre. Par exemple, si nous avons 30 échantillons différents, la chose normale est que dans chaque échantillon l'estimateur (même légèrement) offre des valeurs différentes. Si nous prenons la moyenne des 30 valeurs de l'estimateur dans les 30 échantillons différents, alors l'estimateur devrait renvoyer une valeur égale à la vraie valeur du paramètre.
Estimation ponctuelleLe biais d'un estimateur
Un estimateur sans biais ne peut pas toujours être trouvé pour calculer un certain paramètre. Notre estimateur peut donc être biaisé. Qu'un estimateur ait un biais ne signifie pas qu'il n'est pas valide. Cela signifie simplement qu'il ne correspond pas aussi bien que nous le souhaiterions statistiquement.
Cela dit, même si cela ne correspond pas aussi bien que nous le souhaiterions, nous n'avons parfois d'autre choix que d'utiliser un estimateur biaisé. Par conséquent, il est extrêmement important que nous connaissions l'ampleur de ce biais. Si nous en avons connaissance, nous pouvons utiliser ces informations dans les conclusions de notre enquête. Mathématiquement, le biais est défini comme suit :
Dans la formule ci-dessus, le biais est une valeur non nulle. S'il était nul, l'estimateur serait sans biais.
Exemple d'estimateur sans biais
Un exemple d'estimateur sans biais se trouve dans l'estimateur moyen. Cet estimateur est connu en statistique sous le nom de moyenne d'échantillon. Si nous utilisons la formule mathématique décrite au début, nous concluons que la moyenne de l'échantillon est un estimateur sans biais. Avant d'opérer, nous devons prendre en compte les informations suivantes :
Nous désignons X avec une barre au-dessus de la moyenne de l'échantillon.
La formule de la moyenne de l'échantillon est la somme des n valeurs que nous avons divisées par le nombre de valeurs. Si nous avons 20 données, n sera égal à 20. Nous devrons additionner les valeurs des 20 données et les diviser par 20.
La notation ci-dessus signifie l'espérance ou la valeur attendue de la moyenne de l'échantillon. Familièrement, nous pourrions dire qu'il est calculé comme la valeur moyenne de la moyenne de l'échantillon. Dans cet esprit, en utilisant les techniques mathématiques appropriées, nous pouvons déduire ce qui suit :
L'espérance de l'estimateur coïncide avec 'mu' qui est la vraie valeur du paramètre. C'est-à-dire la vraie moyenne. Tout est dit, quelques notions de base sur les mathématiques sont nécessaires pour comprendre le développement précédent.
De même, on pourrait essayer de faire de même avec l'estimateur de la variance d'échantillon. Dans ce qui suit, S au carré est la variance de l'échantillon et la lettre grecque sigma (qui ressemble à la lettre o avec un bâton à droite) est la vraie variance.
La différence avec la formule ci-dessus est la deuxième partie de la première formule. C'est-à-dire:
Nous concluons que la variance de l'échantillon en tant qu'estimateur de la variance de la population est biaisée. Son biais est égal à la valeur indiquée ci-dessus. Ainsi, cela dépend de la variance de la population et de la taille de l'échantillon (n). Notez que si n (taille de l'échantillon) devient très grand, le biais tend vers zéro.
Si, lorsque l'échantillon a tendance à être très grand, l'estimateur s'approche de la vraie valeur du paramètre, alors nous parlons d'un estimateur asymptotiquement sans biais.