Erreurs de type I et de type II dans les statistiques

Des erreurs de type I dans les statistiques se produisent lorsque les statisticiens rejettent incorrectement l'hypothèse nulle ou la déclaration sans effet, lorsque l'hypothèse nulle est vraie, tandis que les erreurs de type II se produisent lorsque les statisticiens ne rejettent pas l'hypothèse nulle et l'hypothèse alternative, ou la déclaration pour laquelle la test est en cours pour fournir des preuves à l'appui, est vrai.

Les erreurs de type I et de type II sont toutes deux intégrées dans le processus de test d'hypothèse, et bien qu'il puisse sembler que nous souhaitons réduire la probabilité de ces deux erreurs aussi faible que possible, il n'est souvent pas possible de réduire les probabilités de ces erreurs. erreurs, ce qui pose la question: "Laquelle des deux erreurs est la plus grave à faire?"

La réponse courte à cette question est que cela dépend vraiment de la situation. Dans certains cas, une erreur de type I est préférable à une erreur de type II, mais dans d'autres applications, une erreur de type I est plus dangereuse à commettre qu'une erreur de type II. Afin d'assurer une bonne planification de la procédure de test statistique, il faut soigneusement examiner les conséquences de ces deux types d'erreurs lorsque vient le temps de décider de rejeter ou non l'hypothèse nulle. Nous verrons des exemples des deux situations dans ce qui suit.

Erreurs de type I et de type II

Nous commençons par rappeler la définition d'une erreur de type I et d'une erreur de type II. Dans la plupart des tests statistiques, l'hypothèse nulle est une déclaration de la revendication dominante sur une population sans effet particulier tandis que l'hypothèse alternative est la déclaration que nous souhaitons fournir des preuves dans notre test d'hypothèse. Pour les tests de signification, quatre résultats sont possibles:

  1. Nous rejetons l'hypothèse nulle et l'hypothèse nulle est vraie. C'est ce qu'on appelle une erreur de type I.
  2. Nous rejetons l'hypothèse nulle et l'hypothèse alternative est vraie. Dans cette situation, la bonne décision a été prise.
  3. Nous ne rejetons pas l'hypothèse nulle et l'hypothèse nulle est vraie. Dans cette situation, la bonne décision a été prise.
  4. Nous ne rejetons pas l'hypothèse nulle et l'hypothèse alternative est vraie. C'est ce qu'on appelle une erreur de type II.

De toute évidence, le résultat préféré de tout test d'hypothèse statistique serait le deuxième ou le troisième, dans lequel la bonne décision a été prise et aucune erreur ne s'est produite, mais le plus souvent, une erreur est commise au cours du test d'hypothèse, mais c'est tout partie de la procédure. Pourtant, savoir comment mener correctement une procédure et éviter les «faux positifs» peut aider à réduire le nombre d'erreurs de type I et de type II.

Différences fondamentales des erreurs de type I et de type II

En termes plus familiers, nous pouvons décrire ces deux types d'erreurs comme correspondant à certains résultats d'une procédure de test. Pour une erreur de type I, nous rejetons à tort l'hypothèse nulle - en d'autres termes, notre test statistique fournit faussement des preuves positives de l'hypothèse alternative. Ainsi, une erreur de type I correspond à un résultat de test «faux positif».

En revanche, une erreur de type II se produit lorsque l'hypothèse alternative est vraie et nous ne rejetons pas l'hypothèse nulle. De cette façon, notre test fournit incorrectement des preuves contre l'hypothèse alternative. Ainsi, une erreur de type II peut être considérée comme un résultat de test «faux négatif».

Essentiellement, ces deux erreurs sont inverses l'une de l'autre, c'est pourquoi elles couvrent l'intégralité des erreurs commises dans les tests statistiques, mais elles diffèrent également dans leur impact si l'erreur de type I ou de type II reste inconnue ou non résolue..

Quelle erreur est meilleure

En pensant en termes de faux positifs et de faux négatifs, nous sommes mieux outillés pour déterminer laquelle de ces erreurs est meilleure - le type II semble avoir une connotation négative, pour une bonne raison.

Supposons que vous concevez un dépistage médical d'une maladie. Un faux positif d'une erreur de type I peut inquiéter un patient, mais cela entraînera d'autres procédures de test qui révéleront finalement que le test initial était incorrect. En revanche, un faux négatif d'une erreur de type II donnerait au patient l'assurance incorrecte qu'il n'a pas de maladie alors qu'il en fait. En raison de ces informations incorrectes, la maladie ne serait pas traitée. Si les médecins pouvaient choisir entre ces deux options, un faux positif est plus souhaitable qu'un faux négatif.

Supposons maintenant que quelqu'un ait été jugé pour meurtre. L'hypothèse nulle ici est que la personne n'est pas coupable. Une erreur de type I se produirait si la personne était reconnue coupable d'un meurtre qu'elle n'avait pas commis, ce qui serait une issue très grave pour le défendeur. D'un autre côté, une erreur de type II se produirait si le jury déclarait la personne non coupable même s'il avait commis le meurtre, ce qui est une excellente issue pour le défendeur mais pas pour la société dans son ensemble. Ici, nous voyons la valeur d'un système judiciaire qui cherche à minimiser les erreurs de type I.