Statistiques descriptives - Qu'est-ce que c'est, définition et concept

Table des matières:

Anonim

Les statistiques descriptives sont une discipline responsable de la collecte, du stockage, du classement, de la création de tableaux ou de graphiques et du calcul des paramètres de base sur l'ensemble de données.

La statistique descriptive est, avec l'inférence statistique ou la statistique inférentielle, l'une des deux grandes branches de la statistique. Son propre nom l'indique, il essaie de décrire quelque chose. Mais ne le décrivez en aucune façon, mais de manière quantitative. Considérez le poids d'une boîte de légumes, la taille d'une personne ou le montant d'argent qu'une entreprise gagne. Nous pourrions dire beaucoup de choses sur ces variables. Par exemple, on pourrait indiquer que telle ou telle boîte de tomates pèse beaucoup ou pèse moins que d'autres. En continuant avec un autre exemple, on pourrait dire que le revenu d'une entreprise varie beaucoup dans le temps ou qu'une personne a une taille moyenne.

Pour dicter les déclarations ci-dessus, à propos de beaucoup, peu, haut, bas, très variable ou peu variable, nous avons besoin de variables de mesure. C'est-à-dire que nous devons les quantifier, offrir un nombre. Dans cet esprit, nous pourrions utiliser les grammes ou les kilogrammes comme unité de mesure pour trouver le poids d'autant de boîtes de tomates que nous considérons. Une fois qu'on aura pesé trente boîtes, on saura lesquelles pèsent le plus, lesquelles pèsent moins, combien est la plus répétée ou s'il y a beaucoup de disparité entre les poids des différentes boîtes.

La statistique descriptive est née avec cette idée, afin de collecter des données, les stocker, faire des tableaux ou même des graphiques qui nous offrent des informations sur un certain sujet. De plus, ils nous offrent des mesures qui résument les informations d'une grande quantité de données.

Types de variables statistiques

Dans les statistiques descriptives, nous pouvons décrire les données qualitativement ou quantitativement.

  • Variable qualitative : Il fait référence à une qualité. Exemples : la couleur des yeux ou des cheveux d'une personne.
  • Variable quantitative : Il s'agit d'une mesure quantitative. Exemples : la taille d'une personne en centimètres ou le poids d'une personne en kilogrammes.

Ainsi, sur ces variables certains paramètres peuvent être calculés. Surtout sur les variables quantitatives. Puisque, par exemple, quelle est la valeur moyenne de la couleur des yeux ? S'il y a cinq personnes avec la couleur des yeux bleus et cinq avec la couleur des yeux verts, la moyenne ne sera pas qu'elles aient une couleur des yeux bleu-vert moyenne. Par conséquent, dans ce cas, il ne serait pas possible de calculer certains des paramètres que nous verrons ci-dessous.

Variable statistique

Paramètres statistiques de base

Afin de résumer l'information, diverses formules ont été conçues qui offraient des mesures d'un certain type. Ainsi, il y a ceux qui nous offrent des informations sur le centre, d'autres sur la dispersion ou la variabilité et d'autres sur la position d'une valeur.

  • Mesures de tendance centrale: Ainsi nommés car ils fournissent des informations sur le centre de jeu de données. Par exemple, la moyenne est une mesure de tendance ou de position centrale puisque la moyenne nous donne une valeur centrée de l'ensemble de données. Où pourrait-on dire que se situe le point médian ? Au centre, au milieu environ. Un autre exemple de mesure de tendance centrale est la médiane.
  • Mesures de dispersion: Elles sont également appelées mesures de variabilité. Par exemple, l'écart type est une mesure de variabilité puisqu'il nous indique si les valeurs d'un ensemble de données sont très disparates ou non. Deux autres exemples de mesures de dispersion pourraient être la variance et la plage statistique.
  • Mesures de position : Ce ne sont pas les plus connus, mais ils sont fréquemment utilisés. On en trouve un exemple dans les centiles ou déciles. Lorsqu'une donnée spécifique se situe dans le 90e centile, cela signifie que 90 % des données sont inférieures à ces données. Il existe d'autres mesures de position comme les quartiles ou certaines variantes comme le premier quartile.

Répartition des fréquences

Il est également intéressant de voir comment les fréquences sont distribuées. Pour cela, il y a certains concepts que nous devons connaître :

  • Fréquence absolue : C'est le nombre total de fois qu'une observation est répétée. Les observations peuvent parfois être présentées à intervalles.
  • Fréquence relative : C'est le nombre en pourcentage qu'une observation ou un ensemble d'entre elles est répétée.
  • Fréquence cumulée : Elle peut être cumulée relative ou cumulée absolue. Indique le montant accumulé jusqu'à une certaine observation.

Tableaux et graphiques en statistiques descriptives

Bien que les tableaux et les graphiques ne soient pas propres à la statistique descriptive, ils la caractérisent. Dans les rapports, les études et les recherches, l'utilisation de graphiques est très courante. Ils nous aident à montrer les informations d'une manière plus simple et plus limitée.

Bien sûr, dans les tableaux et les graphiques, il existe une immense quantité de types. Voici quelques exemples de graphiques et de tableaux fréquemment utilisés.

  • Histogramme.
  • Graphique à barres.
  • Diagramme circulaire.
  • Tables de probabilité.
  • Tableaux à deux dimensions.
  • Diagramme en boîte.

Exemples de statistiques descriptives

Un exemple de statistiques descriptives serait lorsque nous voulons calculer les buts moyens par match d'un footballeur. Il s'agit de statistiques descriptives, puisque nous essayons de décrire une variable (nombre de buts). Dans ce cas, en calculant une métrique.

Donc, dire que Ronaldo a marqué 1,05 but par match au cours des 30 derniers matchs est une phrase statistique descriptive appropriée.

On pourrait aussi dire, par exemple, que 30% des camarades de classe de Juan ont les yeux bleus, 60% marrons et les 10% restants noirs. Ce serait une variable qualitative (couleur des yeux), mais nous décrivons la fréquence à laquelle elle apparaît.