Erreur de type I - Qu'est-ce que c'est, définition et concept

Table des matières:

Erreur de type I - Qu'est-ce que c'est, définition et concept
Erreur de type I - Qu'est-ce que c'est, définition et concept
Anonim

L'erreur de type 1 dans les statistiques est définie comme le rejet de l'hypothèse nulle alors qu'elle est réellement vraie. Une erreur de type 1 est également connue sous le nom de faux positif ou erreur de type alpha.

Faire une erreur de type 1 revient à nier quelque chose alors que c'est vrai. Considérons, par exemple, la situation de tester si une campagne marketing menée sur les réseaux sociaux augmente les ventes de glaces d'une entreprise au cours d'une semaine d'été. Les hypothèses seraient les suivantes :

H0: Les ventes n'augmentent pas en raison de la campagne d'été

H1: Augmentation des ventes grâce à une campagne de marketing

Après évaluation du trafic sur le site Web de l'entreprise et des pages visitées après la campagne, les éléments suivants sont détectés :

  • Augmentation bien que du trafic et des visites de 50%.
  • 200% d'augmentation des ventes de glaces.

Au vu de ces résultats, on peut conclure que la campagne publicitaire a été fructueuse et a eu un effet d'entraînement sur l'augmentation des ventes. Cependant, supposons que cette semaine-là, il y a eu une vague de chaleur portant les températures au-dessus de 40 degrés.

Connaissant ce dernier, il faudrait prendre en compte le facteur de température élevée comme cause de l'augmentation des ventes. Si nous n'en tenions pas compte, nous pourrions rejeter notre hypothèse nulle quand elle est vraie, c'est-à-dire que nous penserions que notre campagne a été un franc succès alors qu'en réalité la cause de l'augmentation des ventes était la forte chaleur. Si nous arrivions à cette conclusion, nous rejetterions l'hypothèse nulle alors qu'elle est réellement vraie et commettrions donc une erreur de type 1.

Causes de l'erreur de type 1

L'erreur de type 1 est liée à la significativité du contraste ou alpha, à l'erreur d'estimation des coefficients et peut survenir en raison de 2 violations typiques des hypothèses de départ d'une régression. Ceux-ci sont:

  • Hétéroscédasticité conditionnelle.
  • La corrélation sérielle.

Une régression présentant l'une des violations précédentes sous-estimerait l'erreur des coefficients. Si cela se produit, notre estimation de la statistique t serait supérieure à la statistique t réelle. Ces valeurs plus élevées de la statistique t augmenteraient la probabilité que la valeur tombe dans la zone de rejet.

Imaginons 2 situations.

Situation 1 (erreur d'estimation incorrecte)

  • Importance: 5%
  • Taille de l'échantillon: 300 personnes.
  • Valeur critique: 1,96
  • B1 : 1,5
  • Erreur d'estimation du coefficient : 0,5

T = 1,5 / 0,5 = 3

De cette façon, la valeur tomberait dans la zone de rejet et nous rejetterions l'hypothèse nulle.

Situation 2 (erreur d'estimation correcte)

  • Importance: 5%
  • Taille de l'échantillon: 300 personnes.
  • Valeur critique: 1,96
  • B1 : 1,5
  • Erreur d'estimation du coefficient : 1

T = 1,5 / 1 = 1,5

De cette façon, la valeur tomberait dans la zone de non-rejet et nous ne rejetterions pas l'hypothèse.

Sur la base des exemples précédents, la situation 1 dans laquelle l'erreur est sous-estimée, nous conduirait à rejeter l'hypothèse nulle alors qu'en fait elle est vraie, car comme nous le voyons dans la situation 2 avec l'erreur correctement estimée, nous ne rejetterions pas l'hypothèse être vrai.