Une statistique est toute fonction réelle mesurable de l'échantillon d'une variable aléatoire.
Le concept de statisticien est un concept de statistiques avancées. La définition est courte et résolument abstraite. C'est un concept très large, mais, comme nous le verrons plus loin, très simple.
Compte tenu de la difficulté du terme, nous effectuerons la description par parties. Ainsi, en premier lieu, il faudra décrire ce que l'on entend par fonction réelle mesurable. Et, dans le second cas, définir ce que nous entendons comme un échantillon d'une variable aléatoire.
Une statistique est une fonction réelle mesurable
Lorsque nous parlons d'une fonction, nous parlons d'une fonction mathématique. Par exemple:
Y = 2X
Selon les valeurs que prend X, alors Y prendra l'une ou l'autre valeur. Supposons que X vaut 2. Alors, Y vaudra 4, le résultat de la multiplication de 2 par 2. Si X vaut 3, alors Y vaudra 6. Résultat de la multiplication de 2 par 3.
Bien sûr, un statisticien n'est pas n'importe quelle fonction. C'est une fonction réelle et mesurable. Ce concept mathématique est franchement simple. Réel, parce qu'il donne lieu à des nombres réels et mesurable parce qu'il peut être mesuré.
Les statistiques ont d'innombrables applications dans la vie quotidienne. Il est donc logique que les valeurs qu'une statistique puisse produire soient réelles et mesurables.
Échantillon d'une variable aléatoire
Nous avons entendu plusieurs fois le concept d'échantillon. Ou le concept d'échantillon représentatif. Pour ce cas, nous ne distinguerons pas les différents types d'échantillons. Ainsi, nous utiliserons la notion d'échantillon au sens large.
Imaginons que nous voulions connaître les dépenses moyennes des familles mexicaines pour l'achat de vêtements. Évidemment, nous n'avons pas assez de ressources pour interroger l'ensemble de la population mexicaine. Que faisons nous? Nous l'estimons à travers un échantillon. Un échantillon de, par exemple, 50 000 familles.
Cet échantillon, tout est dit, devra répondre à des caractéristiques précises. C'est-à-dire qu'il doit être représentatif et contenir de nombreuses familles de différentes zones géographiques, différents goûts, religions ou pouvoir d'achat. Sinon, nous n'obtiendrons pas une valeur fiable.
Une variable aléatoire
Maintenant, c'est un échantillon, mais un échantillon d'une variable aléatoire. Qu'entendons-nous par variable aléatoire? Une variable aléatoire, en termes simples, est une variable difficile à prédire. Autrement dit, dans des conditions similaires, il prend des valeurs différentes.
Par exemple, le nombre qui sera obtenu lorsque vous lancerez un dé est une variable aléatoire. Même si nous le lançons toujours dans des conditions très très similaires, nous obtiendrons des résultats différents.
Maintenant que nous comprenons la définition technique du concept, nous devons rassembler tout ce que nous avons appris. Nous savons ce qu'est une fonction réelle et mesurable. Et, nous savons également ce qu'est l'échantillon d'une variable aléatoire.
Comment malgré tout, le concept reste abstrait, la meilleure façon de le comprendre sera avec un exemple.
Exemple statistique
Supposons qu'il y ait 100 élèves dans une école. Un enseignant nous propose comme activité, d'essayer d'estimer quelle est la note moyenne des élèves de cette école en matière de mathématiques.
Comme nous n'avons ni le temps ni les ressources pour interroger les 100 étudiants, nous avons décidé d'en interroger 10. À partir de là, nous essaierons d'estimer la note moyenne. Nous avons les données suivantes :
Élève | Noter | Élève | Noter |
1 | 4 | 6 | 9 |
2 | 8 | 7 | 7 |
3 | 6 | 8 | 2 |
4 | 7 | 9 | 5 |
5 | 9 | 10 | 3 |
Avant de calculer la note moyenne, suivant le but de cet article, nous appliquerons ce que nous avons appris sur les statistiques sur cet exemple.
Nous savons qu'une statistique est une fonction réelle et mesurable de l'échantillon d'une variable aléatoire. Nous avons l'échantillon d'une variable aléatoire (le tableau ci-dessus). Avec quoi, toute fonction réelle et mesurable dudit échantillon sera une statistique. Par exemple:
Statistique 1 : Etudiant 1 + Etudiant 2 + Etudiant 3 +… + Etudiant 10 = 60
Statistique 2 : Etudiant 1 - Etudiant 2 + Etudiant 3 - Etudiant 4 +… - Etudiant 10 = 2
Statistique 3: -Étudiant 1 - Élève 2 - Élève 3 -… .- Élève 10 = -60
Ces trois statistiques sont des fonctions réelles et mesurables de l'échantillon. Avec quoi, ils sont statistiques. Au niveau théorique, tout cela a du sens. Le sens est que toutes les statistiques ne seront pas valables pour estimer en fonction de quels paramètres.
À ce stade, le concept d'estimateur entre. Un estimateur est une statistique à laquelle certaines conditions vont être requises afin qu'il puisse calculer de manière fiable le paramètre souhaité.
Par exemple, pour estimer le paramètre que nous appelons « note moyenne » ou « note moyenne », nous avons besoin d'un estimateur. Nous appelons cet estimateur la « moyenne ». La moyenne est un estimateur. C'est-à-dire un statisticien qui exige certaines conditions pour pouvoir calculer la note moyenne avec certaines garanties.
Si nous voulons connaître la note moyenne, nous devrons additionner toutes les notes et diviser par le nombre total d'élèves. C'est-à-dire:
Note moyenne = (4 + 8 + 6 + 7 + 9 + 9 + 7 + 2 + 5 + 3) / 10 = 6
La formule de la moyenne est la même, quel que soit l'échantillon. Utilisez toujours toutes les données que l'échantillon contient. Dans ce cas, nous avons les données de 10 étudiants et la formule moyenne utilise les 10 données. Si nous disposions de 20 données provenant de 20 élèves, nous utiliserions toutes les 20. Les statistiques qui remplissent cette caractéristique sont appelées statistiques suffisantes.
En conclusion, une statistique est toute fonction réelle et mesurable d'un échantillon. Une fois que vous avez plusieurs statistiques possibles, certaines conditions sont requises pour pouvoir les considérer comme des estimateurs. Et, grâce aux estimateurs, on peut essayer de "prédire" certaines valeurs à partir d'échantillons plus petits.