Biais de survie - Qu'est-ce que c'est, définition et concept

Table des matières:

Biais de survie - Qu'est-ce que c'est, définition et concept
Biais de survie - Qu'est-ce que c'est, définition et concept
Anonim

Le biais de survie est un biais qui se produit dans la collecte de données lorsque les données sont exclues de l'analyse car elles n'existent plus aujourd'hui.

Ce biais apparaît dans une grande variété de contextes où nous nous concentrons uniquement sur les données « survivantes ». Un exemple de ceci est observé lorsque les entreprises interrogent leurs clients sur l'un de leurs produits. Mais ils laissent leurs non-clients, qui seraient dans ce cas les « non-survivants », dans l'oubli.

Dans ce cas, tirer des conclusions de cette étude serait erroné. Étant donné que les résultats ne seraient biaisés que pour la population « survivante ». Et ce ne seraient pas des résultats représentatifs.

Biais de survie en pratique

Un exemple clair de ce biais peut être vu dans l'étude des résultats des fonds d'investissement. Là où la plupart des bases de données n'incluent que les fonds qui existent aujourd'hui. Indépendamment des fonds qui existaient dans le passé.

La raison pour laquelle ils n'existent pas aujourd'hui est que leurs performances ont été pires que celles des « survivants ». Ou même plusieurs fonds ont été fusionnés en un seul. Par conséquent, l'analyse est effectuée sur ces fonds avec les meilleurs résultats. Et ce biais tend à surestimer la performance de l'échantillon de ces fonds.

Le principal problème n'est plus seulement la surestimation de la performance du fonds. Au contraire, l'échantillon sélectionné ne serait pas un échantillon aléatoire de la population totale. Et, par conséquent, les résultats de l'étude peuvent ne pas être représentatifs de la population. C'est finalement ce que nous recherchons lorsque nous sélectionnons un échantillon aléatoire de la population.

Solution au biais de survie

Imaginons que nous souhaitions sélectionner un fonds d'investissement dans lequel investir, en fonction de son comportement passé. Pour éviter ce biais de survie et optimiser cette sélection, nous devons effectuer les étapes suivantes :

  • Choisissez l'horizon temporel avec lequel nous prévoyons de travailler. Par exemple, dix, quinze ou vingt ans d'histoire.
  • Prenez tous les fonds existants depuis le début de l'horizon temporel, qu'ils existent ou non actuellement.
  • À partir de là, sélectionnez l'échantillon de cette population pour l'étude du comportement.

L'idée de ceci, en fin de compte, est d'obtenir cet échantillon aléatoire de la population. Et à partir de là, les conclusions obtenues, si elles pouvaient être représentatives de cette population.