Lors de la réalisation d'un test de signification ou d'un test d'hypothèse, il y a deux nombres faciles à confondre. Ces nombres sont facilement confondus car ils sont tous les deux des nombres entre zéro et un, et sont tous deux des probabilités. Un nombre est appelé la valeur p de la statistique de test. L'autre nombre d'intérêt est le niveau de signification ou alpha. Nous allons examiner ces deux probabilités et déterminer la différence entre elles.
Le nombre alpha est la valeur seuil par rapport à laquelle nous mesurons les valeurs de p. Il nous dit à quel point les résultats observés doivent être extrêmes pour rejeter l'hypothèse nulle d'un test de signification.
La valeur de alpha est associée au niveau de confiance de notre test. Ce qui suit répertorie certains niveaux de confiance avec leurs valeurs alpha correspondantes:
Bien qu'en théorie et en pratique de nombreux nombres puissent être utilisés pour l'alpha, le plus couramment utilisé est 0,05. La raison en est à la fois parce que le consensus montre que ce niveau est approprié dans de nombreux cas, et historiquement, il a été accepté comme standard. Cependant, il existe de nombreuses situations où une valeur alpha plus petite doit être utilisée. Il n'y a pas une seule valeur alpha qui détermine toujours la signification statistique.
La valeur alpha nous donne la probabilité d'une erreur de type I. Des erreurs de type I se produisent lorsque nous rejetons une hypothèse nulle qui est réellement vraie. Ainsi, à long terme, pour un test avec un niveau de signification de 0,05 = 1/20, une vraie hypothèse nulle sera rejetée une fois sur 20.
L'autre nombre qui fait partie d'un test de signification est une valeur de p. Une valeur p est également une probabilité, mais elle provient d'une source différente de l'alpha. Chaque statistique de test a une probabilité ou une valeur p correspondante. Cette valeur est la probabilité que la statistique observée se soit produite uniquement par hasard, en supposant que l'hypothèse nulle est vraie.
Puisqu'il existe un certain nombre de statistiques de test différentes, il existe un certain nombre de façons différentes de trouver une valeur de p. Dans certains cas, nous devons connaître la distribution de probabilité de la population.
La valeur de p de la statistique de test est une façon de dire à quel point cette statistique est extrême pour nos données d'échantillon. Plus la valeur de p est petite, plus l'échantillon observé est peu probable.
Pour déterminer si un résultat observé est statistiquement significatif, nous comparons les valeurs de alpha et de la valeur p. Deux possibilités se dégagent:
L'implication de ce qui précède est que plus la valeur de alpha est petite, plus il est difficile de prétendre qu'un résultat est statistiquement significatif. En revanche, plus la valeur de l'alpha est élevée, plus il est facile d'affirmer qu'un résultat est statistiquement significatif. À cela s'ajoute cependant la probabilité plus élevée que ce que nous avons observé puisse être attribué au hasard.