La pratique statistique du test d'hypothèse est répandue non seulement en statistique mais aussi dans les sciences naturelles et sociales. Lorsque nous effectuons un test d'hypothèse, il y a deux ou trois choses qui pourraient mal tourner. Il existe deux types d'erreurs qui, par conception, ne peuvent être évitées, et nous devons être conscients que ces erreurs existent. Les erreurs reçoivent les noms assez piétons des erreurs de type I et de type II. Que sont les erreurs de type I et de type II et comment les distinguer? Brièvement:
Nous explorerons plus de fond derrière ces types d'erreurs dans le but de comprendre ces déclarations.
Le processus de test d'hypothèse peut sembler assez varié avec une multitude de statistiques de test. Mais le processus général est le même. Le test d'hypothèse implique l'énoncé d'une hypothèse nulle et la sélection d'un niveau de signification. L'hypothèse nulle est vraie ou fausse et représente la demande par défaut pour un traitement ou une procédure. Par exemple, lors de l'examen de l'efficacité d'un médicament, l'hypothèse nulle serait que le médicament n'a aucun effet sur une maladie.
Après avoir formulé l'hypothèse nulle et choisi un niveau de signification, nous acquérons des données par observation. Les calculs statistiques nous disent si nous devons ou non rejeter l'hypothèse nulle.
Dans un monde idéal, nous rejetterions toujours l'hypothèse nulle lorsqu'elle est fausse, et nous ne rejetterions pas l'hypothèse nulle lorsqu'elle est effectivement vraie. Mais il existe deux autres scénarios possibles, chacun entraînant une erreur.
Le premier type d'erreur possible implique le rejet d'une hypothèse nulle qui est réellement vraie. Ce type d'erreur est appelé une erreur de type I et est parfois appelé une erreur du premier type.
Les erreurs de type I sont équivalentes à des faux positifs. Revenons à l'exemple d'un médicament utilisé pour traiter une maladie. Si nous rejetons l'hypothèse nulle dans cette situation, notre affirmation est que le médicament a, en fait, un certain effet sur une maladie. Mais si l'hypothèse nulle est vraie, alors, en réalité, le médicament ne combat pas du tout la maladie. Le médicament est faussement prétendu avoir un effet positif sur une maladie.
Les erreurs de type I peuvent être contrôlées. La valeur de alpha, qui est liée au niveau de signification que nous avons sélectionné, a une incidence directe sur les erreurs de type I. Alpha est la probabilité maximale que nous ayons une erreur de type I. Pour un niveau de confiance de 95%, la valeur de alpha est de 0,05. Cela signifie qu'il existe une probabilité de 5% de rejeter une hypothèse vraie nulle. À long terme, un test d'hypothèse sur vingt que nous effectuons à ce niveau entraînera une erreur de type I.
L'autre type d'erreur possible se produit lorsque nous ne rejetons pas une hypothèse nulle qui est fausse. Ce type d'erreur est appelé erreur de type II et est également appelé erreur du deuxième type.
Les erreurs de type II sont équivalentes à de faux négatifs. Si nous repensons au scénario dans lequel nous testons un médicament, à quoi ressemblerait une erreur de type II? Une erreur de type II se produirait si nous acceptions que le médicament n'avait aucun effet sur une maladie, mais en réalité,.
La probabilité d'une erreur de type II est donnée par la lettre grecque beta. Ce nombre est lié à la puissance ou à la sensibilité du test d'hypothèse, noté 1 - beta.
Les erreurs de type I et de type II font partie du processus de test d'hypothèse. Bien que les erreurs ne puissent pas être complètement éliminées, nous pouvons minimiser un type d'erreur.
Typiquement, lorsque nous essayons de diminuer la probabilité d'un type d'erreur, la probabilité pour l'autre type augmente. Nous pourrions diminuer la valeur de l'alpha de 0,05 à 0,01, correspondant à un niveau de confiance de 99%. Cependant, si tout le reste reste le même, la probabilité d'une erreur de type II augmentera presque toujours.
Plusieurs fois, l'application réelle de notre test d'hypothèse déterminera si nous acceptons davantage les erreurs de type I ou de type II. Ce sera ensuite utilisé lorsque nous concevons notre expérience statistique.