Analyse discriminante - Qu'est-ce que c'est, définition et concept

L'analyse discriminante linéaire, ou analyse discriminante linéaire (LDA), est une technique statistique qui crée une fonction capable de classer des phénomènes, en tenant compte d'une série de variables discriminantes et d'une probabilité d'appartenance.

Par conséquent, nous avons affaire à un type de procédure statistique qui cherche à regrouper en fonction de certaines similitudes. De cette façon, il permet de quantifier la probabilité d'appartenir à l'un ou l'autre groupe. Ces groupes sont connus a priori, contrairement à l'analyse de cluster.

Modèle mathématique de l'analyse discriminante

Voyons à quoi ressemblerait le modèle mathématique d'une analyse discriminante.

C'est très simple, puisqu'il est basé sur un système d'équations linéaires. Bien sûr, l'analyse est plus compliquée, mais ce serait en dehors du travail d'Economy-Wiki.com, l'économie simple.

Comme on peut le voir, il s'agit d'un ensemble d'équations dont la variable dépendante (y) représente certains scores. Celles-ci, à leur tour, sont des fonctions linéaires d'autres variables discriminantes (X) et d'une série de paramètres (a).

L'objectif, à travers ces combinaisons linéaires, est de maximiser la variance entre les groupes et de minimiser celle qui se produit entre les groupes. De cette façon, de nouveaux cas peuvent être regroupés avec une certaine probabilité dont on peut connaître leur valeur, à condition qu'ils répondent à ces critères.

Démarche à suivre pour effectuer une analyse discriminante

Voyons comment une analyse de ce type peut être réalisée :

  1. Vous devez d'abord créer une table de données avec des cas et des variables. Une variable catégorielle qui définit chacun des groupes est également incluse.
  2. Ensuite, le modèle mathématique est généré avec des données numériques. Celui-ci sera basé sur celui que nous avons vu dans la section précédente. Des logiciels de statistiques tels que SPSS ou le R gratuit automatisent l'ensemble du processus.
  3. Enfin, avec cette analyse, nous pourrons expliquer pourquoi chaque cas appartient à l'un ou l'autre groupe et, en plus, établir un critère d'appartenance pour les nouveaux cas. Ceci sera basé sur la probabilité d'être englobé dans l'un ou l'autre.

Exemples d'application de l'analyse discriminante

Pour finir, regardons quelques exemples d'application de l'analyse discriminante.

Rappelons également que dans chacun d'eux l'objectif est de créer une fonction discriminante qui regroupe chaque nouveau cas selon une probabilité.

  • Nous voulons classer différents pays en fonction de leurs données macroéconomiques: Pays sous-développés, émergents ou développés (groupes). Nous créons la fonction discriminante afin de pouvoir calculer la probabilité d'un pays d'appartenir à l'un ou l'autre groupe.
  • Nous souhaitons réaliser une campagne marketing et nous sommes intéressés à savoir dans quels groupes classer les individus: Ainsi, nous pouvons répondre à certaines questions telles que quelles seraient les caractéristiques d'un client occasionnel.
  • Nous voulons connaître le niveau de risque (groupe) de certains clients concernant l'octroi d'un prêt: Nous utiliserons des variables liées à vos revenus, dépenses mensuelles, historique ou type de travail. La fonction discriminante nous fournit des informations pertinentes sur la solvabilité.

Comme on peut le voir, l'analyse discriminante est très utile dans de nombreuses situations. Mais non seulement lié à l'économie, il est également utilisé en médecine, en géologie ou en biologie, entre autres domaines.