Le test d'hypothèse est un processus scientifique répandu utilisé dans toutes les disciplines des sciences statistiques et sociales. Dans l'étude des statistiques, un résultat statistiquement significatif (ou un résultat statistiquement significatif) dans un test d'hypothèse est obtenu lorsque la valeur de p est inférieure au niveau de signification défini. La valeur p est la probabilité d'obtenir une statistique de test ou un résultat d'échantillon aussi extrême ou plus extrême que celui observé dans l'étude, tandis que le niveau de signification ou alpha indique au chercheur à quel point les résultats doivent être extrêmes pour rejeter l'hypothèse nulle. En d'autres termes, si la valeur de p est inférieure ou égale au niveau de signification défini (généralement noté α), le chercheur peut sans risque supposer que les données observées sont incompatibles avec l'hypothèse que l'hypothèse nulle est vraie, ce qui signifie que le l'hypothèse nulle, ou la prémisse qu'il n'y a pas de relation entre les variables testées, peut être rejetée.
En rejetant ou en infirmant l'hypothèse nulle, un chercheur conclut qu'il existe une base scientifique pour croire qu'il existe une relation entre les variables et que les résultats n'étaient pas dus à une erreur d'échantillonnage ou au hasard. Bien que le rejet de l'hypothèse nulle soit un objectif central dans la plupart des études scientifiques, il est important de noter que le rejet de l'hypothèse nulle n'est pas équivalent à la preuve de l'hypothèse alternative du chercheur.
Le concept de signification statistique est fondamental pour les tests d'hypothèse. Dans une étude qui consiste à prélever un échantillon aléatoire dans une population plus importante dans le but de prouver un résultat qui peut être appliqué à la population dans son ensemble, il existe un potentiel constant pour que les données de l'étude résultent d'une erreur d'échantillonnage ou d'une simple coïncidence. ou le hasard. En déterminant un niveau de signification et en testant la valeur de p par rapport à celui-ci, un chercheur peut en toute confiance maintenir ou rejeter l'hypothèse nulle. Le niveau de signification, dans le plus simple des termes, est la probabilité seuil de rejeter de manière incorrecte l'hypothèse nulle alors qu'elle est en fait vraie. Il s'agit également du taux d'erreur de type I. Le niveau de signification ou alpha est donc associé au niveau de confiance global du test, ce qui signifie que plus la valeur de alpha est élevée, plus la confiance dans le test est élevée.
Une erreur de type I, ou une erreur du premier type, se produit lorsque l'hypothèse nulle est rejetée alors qu'en réalité elle est vraie. En d'autres termes, une erreur de type I est comparable à un faux positif. Les erreurs de type I sont contrôlées en définissant un niveau de signification approprié. Les meilleures pratiques en matière de tests d'hypothèses scientifiques nécessitent de sélectionner un niveau de signification avant même que la collecte de données ne commence. Le niveau de signification le plus courant est de 0,05 (ou 5%), ce qui signifie qu'il existe une probabilité de 5% que le test subisse une erreur de type I en rejetant une hypothèse vraie nulle. Ce niveau de signification se traduit à l'inverse par un niveau de confiance de 95%, ce qui signifie que sur une série de tests d'hypothèse, 95% n'entraînera pas d'erreur de type I.