Le critère de factorisation de Fisher-Neyman est un théorème qui nous permet de déterminer si une statistique T remplit la propriété de suffisance.
Intuitivement, ce théorème permet de savoir si une statistique est une statistique suffisante. Et, inversement, sans avoir d'informations au préalable, en essayant de déterminer l'existence d'une statistique suffisante et son expression. Voir assez de statistiques
Formule du critère de factorisation Fisher-Neyman
Formellement, on dit qu'étant donné un échantillon aléatoire simple (m.a.s.) d'une variable aléatoire X de fonction de densité f (x; θ) avec θ ∈ Ω. La statistique T = T (X1,…, Xn) est dite suffisante pour θ, si et seulement si, la fonction de densité de l'échantillon peut s'écrire :
f (x1,…, xn) = h (x1,…, xn) × g (T, θ)
Pour comprendre ce que signifie chacune des parties de ce théorème, nous allons le redéfinir mais avec un exemple :
Nous choisissons au hasard 100 étudiants (échantillon aléatoire simple) et leur demandons quelles sont leurs dépenses annuelles en livres (variable aléatoire X). Cette variable aura une fonction de densité (voir fonction de densité). Il faut alors choisir une statistique suffisante pour calculer un paramètre (θ) (Le paramètre θ sera la moyenne des dépenses annuelles en livres).
La formule indiquée est divisée comme suit :
- f (x1,…, xn) : C'est la fonction de densité de l'échantillon (fonction de densité de l'échantillon sur la variable aléatoire X).
- h (x1,…, xn) : C'est une fonction qui ne prend pas de valeurs négatives uniquement à partir de l'échantillon (à la charge des 100 étudiants).
- g (T, ) : C'est une fonction qui ne dépend que de la statistique choisie (moyenne de l'échantillon) et du paramètre à calculer (moyenne).
En effectuant les calculs appropriés, la preuve est obtenue. Cette démonstration ne sera pas vue ici car des connaissances avancées en mathématiques sont requises.
Le critère de factorisation de Fisher-Neyman en pratique
En ce sens, compte tenu de ce qui précède, le plus important est de comprendre qu'il existe des outils pour vérifier certaines propriétés. Des propriétés qui sont sans aucun doute importantes lors d'études statistiques.
Pourquoi est-ce le plus important ? Parce que nous ne faisons généralement pas de preuves pour voir si une statistique est suffisante. Nous savons juste que c'est suffisant. Par exemple, les mathématiciens ont déjà montré que la moyenne est une statistique suffisante. Par conséquent, nous n'avons pas à le prouver.
En conclusion, l'idée est de connaître l'outil à des fins d'information pour comprendre certains concepts importants dans les études statistiques.