L'échantillonnage est le processus par lequel un groupe d'observations appartenant à une population est sélectionné. Ceci, afin de réaliser une étude statistique.
L'échantillonnage, en d'autres termes, est la procédure par laquelle sont prélevés certains individus appartenant à une population qui fait l'objet d'une analyse.
L'échantillonnage est nécessaire en raison du fait que les populations peuvent être trop importantes et qu'il n'est pas possible (économiquement et matériellement parlant) de collecter des données sur tous les individus.
L'objectif est que l'échantillon soit représentatif. C'est-à-dire que ses indicateurs tels que l'âge moyen, le revenu moyen, le pourcentage d'hommes et de femmes, entre autres, soient les mêmes, ou très similaires à celui de la population.
Types d'échantillonnage
Les types d'échantillonnage peuvent être distingués en fonction de différents critères. Ainsi, selon la technique de sélection du sous-groupe, on peut différencier :
Échantillonnage probabiliste
Les observations sont sélectionnées sur la base du caractère aléatoire, c'est-à-dire au hasard. Dans cette catégorie, nous pouvons trouver:
- Échantillonnage aléatoire simple: Tous les individus de la population ont la même probabilité d'être choisis dans l'échantillon. Il présente des avantages, tels que le fait qu'il est facile à réaliser grâce à des systèmes informatiques. Cependant, une liste complète de l'ensemble de la population est requise et, si l'échantillon est très petit, la sélection peut ne pas être représentative.
- Systématique: Une observation est choisie au hasard et, pour sélectionner le reste de l'échantillon, des intervalles numériques réguliers sont utilisés. Autrement dit, supposons que j'ai une population de 10 000 et que je sélectionne au hasard l'observation 600, après quoi je peux considérer des intervalles de 30 observations. Dans ce cas, vous prendriez les observations 600, 630, 660, 690, 720, 750, 780, et ainsi de suite.
- Aléatoire stratifié: La population est divisée en strates, qui sont des groupes qui partagent des caractéristiques communes et sont encore plus homogènes que la population dans son ensemble. Ensuite, un échantillon est sélectionné, de manière aléatoire ou systématique, au sein de chaque strate. L'objectif est d'atteindre une représentativité de chaque strate.
- Par conglomérats ou clusters: consiste à créer des groupes plus petits que la population, qui reflètent ou partagent toutes les caractéristiques de la population. Ensuite, nous choisissons l'un des clusters comme échantillon et l'analysons en détail.
Échantillonnage non probabiliste
La sélection de l'échantillon ne dépend pas de la probabilité, mais de la décision des chercheurs. On peut distinguer quelques sous-catégories :
- Méthode de confiance dans les sujets disponibles: Elle consiste à ce que le chercheur capte les sujets qui lui sont proposés. Ceci, par exemple, en un point géographique à un certain moment.
- Opinion ou méthode intentionnelle: Le chercheur utilise son jugement ou ses critères pour choisir qui participera à l'échantillon. En d'autres termes, en reprenant l'exemple précédent, le chercheur pourrait prélever l'échantillon à un endroit et à un moment précis. Mais vous pourriez, compte tenu des objectifs de la recherche, décider de n'inclure que les personnes mariées et dans la vingtaine et la trentaine.
- Causal ou accessoire: Le chercheur sélectionne directement les individus qui feront partie de l'échantillon. Par exemple, aux élèves d'une école. Ceci, étant donné que vous y avez facilement accès.
- Boule de neige: Elle consiste en ce qu'après avoir trouvé le premier sujet (ou les premiers sujets) de l'échantillon, le chercheur lui demande (ou lui) de l'aider à identifier d'autres individus présentant ces mêmes caractéristiques. C'est une technique utilisée lorsqu'il est difficile de localiser un groupe spécifique en raison du traitement de données sensibles, par exemple les immigrants illégaux.
- Par versements: Le chercheur, en tenant compte de la composition de la population, et en divisant par groupes ou strates, fera une sélection proportionnelle de l'échantillon. Par exemple, imaginez que dans la population il y ait 40 % de personnes de moins de 25 ans, 35 % de personnes entre 25 et 50 ans et 25 % de personnes de plus de 50 ans. Ainsi, un échantillon de 4 000 personnes comprendrait 1 600 sujets de moins de 25 ans, 1 400 entre 25 et 50 ans et 1 000 adultes de plus de 50 ans ou plus. Il convient de noter que les personnes qui couvriront chaque tranche seront sélectionnées par une méthode non probabiliste, c'est-à-dire l'une des techniques expliquées ci-dessus.
De même, il convient de noter que l'échantillonnage peut être simple, s'il n'est effectué qu'une seule fois; double, lorsque deux échantillons sont prélevés (le second peut être utilisé si le premier ne donne pas de résultats définitifs); ou multiple (c'est similaire à double, mais avec plus de deux échantillons).