Biais de survie - Qu'est-ce que c'est, définition et concept

Le biais de survie est un biais qui se produit dans la collecte de données lorsque les données sont exclues de l'analyse car elles n'existent plus aujourd'hui.

Ce biais apparaît dans une grande variété de contextes où nous nous concentrons uniquement sur les données « survivantes ». Un exemple de ceci est observé lorsque les entreprises interrogent leurs clients sur l'un de leurs produits. Mais ils laissent leurs non-clients, qui seraient dans ce cas les « non-survivants », dans l'oubli.

Dans ce cas, tirer des conclusions de cette étude serait erroné. Étant donné que les résultats ne seraient biaisés que pour la population « survivante ». Et ce ne seraient pas des résultats représentatifs.

Biais de survie en pratique

Un exemple clair de ce biais peut être vu dans l'étude des résultats des fonds d'investissement. Là où la plupart des bases de données n'incluent que les fonds qui existent aujourd'hui. Indépendamment des fonds qui existaient dans le passé.

La raison pour laquelle ils n'existent pas aujourd'hui est que leurs performances ont été pires que celles des « survivants ». Ou même plusieurs fonds ont été fusionnés en un seul. Par conséquent, l'analyse est effectuée sur ces fonds avec les meilleurs résultats. Et ce biais tend à surestimer la performance de l'échantillon de ces fonds.

Le principal problème n'est plus seulement la surestimation de la performance du fonds. Au contraire, l'échantillon sélectionné ne serait pas un échantillon aléatoire de la population totale. Et, par conséquent, les résultats de l'étude peuvent ne pas être représentatifs de la population. C'est finalement ce que nous recherchons lorsque nous sélectionnons un échantillon aléatoire de la population.

Solution au biais de survie

Imaginons que nous souhaitions sélectionner un fonds d'investissement dans lequel investir, en fonction de son comportement passé. Pour éviter ce biais de survie et optimiser cette sélection, nous devons effectuer les étapes suivantes :

  • Choisissez l'horizon temporel avec lequel nous prévoyons de travailler. Par exemple, dix, quinze ou vingt ans d'histoire.
  • Prenez tous les fonds existants depuis le début de l'horizon temporel, qu'ils existent ou non actuellement.
  • À partir de là, sélectionnez l'échantillon de cette population pour l'étude du comportement.

L'idée de ceci, en fin de compte, est d'obtenir cet échantillon aléatoire de la population. Et à partir de là, les conclusions obtenues, si elles pouvaient être représentatives de cette population.

Articles Populaires

Google entrera sur le marché de la santé grâce au Big Data

La pierre angulaire sur laquelle repose l'initiative des moteurs de recherche n'est autre que le conglomérat colossal de données qu'il gère et qui, à travers différentes disciplines et équipes spécialisées, poursuivra de nouvelles découvertes dans le domaine scientifique. Sous le terme de Verily, Google vise à se plonger dans les sciences de la vie et Lire la suite…

La nourriture d'El Corte Inglés débarque en Chine

La stratégie commerciale qui l'a rapproché du géant asiatique représente une étape très importante pour le groupe espagnol, qui a besoin de se développer dans deux domaines différents : le commerce électronique et l'internationalisation. El Corte Inglés et la société chinoise Ou-Jue Internacional ont signé un accord en décembre dernier pour distribuer dans le paysLire la suite…

Pourquoi la bourse chinoise baisse-t-elle autant ?

La Bourse de Shanghai, principal indice de la bourse chinoise, a plongé de près de 15% depuis le début de l'année, après avoir anticipé un ralentissement de son économie et mis en doute la solvabilité de son gigantesque système financier. L'année dernière, les bourses chinoises ont subi une panique des vendeurs de peur que les politiquesLire la suite…