Variable catégorielle - Qu'est-ce que c'est, définition et concept

Une variable catégorielle est celle qui permet de classer une série de données au moyen de valeurs fixes associées à une qualité ou une catégorie spécifique.

La variable catégorielle, contrairement aux variables cardinales ou continues (qui permettent des calculs numériques), classe les individus ou les cas. Ils prennent normalement des valeurs représentées par des nombres entiers, comme un ou zéro, mais ce ne sont que cela, des représentations.

Dans l'exemple, nous le verrons plus en détail.

Différences entre variable catégorique et variable continue

Il existe quelques différences entre la variable catégorielle et la variable continue ou cardinale qui doivent être connues. Voyons le plus pertinent.

  • Premièrement, la variable catégorielle est utilisée pour le regroupement et la variable continue pour le comptage. En d'autres termes, le premier permet de former des catégories avec une série de données. Par exemple, le sexe ou le nombre d'enfants. La seconde nous donne des informations chiffrées. Par exemple, l'âge.
  • La variable cardinale permet des calculs numériques, les autres non. De cette façon, dans le premier, nous pouvons connaître les moyennes ou les variances, tandis que dans les autres, seules certaines données, telles que le mode ou le pourcentage de catégories.
  • Les catégoriques sont très utiles pour connaître des informations qualitatives, c'est-à-dire une certaine qualité des données. Les continus nous fournissent des données quantitatives, c'est-à-dire des quantités et des valeurs représentées par des nombres.

Techniques statistiques pour les variables catégorielles

Voyons ensuite les techniques statistiques les plus utilisées dans les variables catégorielles, en les comparant à celles des variables continues ou cardinales.

  • Statistiques descriptives: Dans ce type de variables, les analyses sont généralement basées sur des diagrammes à barres et en pourcentage, entre autres. Les cardinaux permettent l'application de techniques d'analyse pour calculer des statistiques de position telles que des quantiles, ou des statistiques de dispersion telles que des variances.
  • Contraste d'hypothèse: Dans le catégorique, les résultats peuvent être extrapolés au moyen de tests d'hypothèses non paramétriques. D'autre part, les continus utilisent des contrastes paramétriques qui peuvent également être inférés.
  • Techniques de régression: Dans ce cas, pour le premier, la régression logistique ou similaire est utilisée, entre autres. Pour les autres types de variables, la technique la plus utilisée est la régression linéaire.

Exemple de variable catégorielle

Pour finir, regardons un exemple très courant en marketing. Imaginons que nous souhaitions vendre un produit et que nous souhaitions connaître l'état civil.

Pour ce faire, nous attribuerons 1 au célibataire, 2 au marié, 3 au divorcé, 4 au partenaire et 5 aux autres.

Voyons l'image puis commentons-la :

On y voit que le pourcentage le plus élevé d'individus sont célibataires, mariés et divorcés, les deux autres options n'étant que de 5%.

Comme nous pouvons le voir, les variables catégorielles sont utiles pour le regroupement. Le graphique à barres nous permet de mieux observer ces pourcentages, car il est plus facile de comparer la taille des barres.

Vous contribuerez au développement du site, partager la page avec vos amis

wave wave wave wave wave