Test d'hypothèse pour la différence de deux proportions de population

Dans cet article, nous passerons par les étapes nécessaires pour effectuer un test d'hypothèse, ou test de signification, pour la différence de deux proportions de population. Cela nous permet de comparer deux proportions inconnues et de déduire si elles ne sont pas égales l'une à l'autre ou si l'une est supérieure à l'autre.

Aperçu et contexte du test d'hypothèse

Avant d'entrer dans les détails de notre test d'hypothèse, nous examinerons le cadre des tests d'hypothèse. Dans un test de signification, nous essayons de montrer qu'une déclaration concernant la valeur d'un paramètre de population (ou parfois la nature de la population elle-même) est vraisemblablement vraie. 

Nous rassemblons des preuves pour cette déclaration en effectuant un échantillon statistique. Nous calculons une statistique à partir de cet échantillon. La valeur de cette statistique est ce que nous utilisons pour déterminer la vérité de la déclaration d'origine. Ce processus contient de l'incertitude, mais nous pouvons quantifier cette incertitude

Le processus global pour un test d'hypothèse est donné par la liste ci-dessous:

  1. Assurez-vous que les conditions nécessaires à notre test sont remplies.
  2. Énoncez clairement les hypothèses nulles et alternatives. L'hypothèse alternative peut impliquer un test unilatéral ou bilatéral. Nous devons également déterminer le niveau de signification, qui sera indiqué par la lettre grecque alpha.
  3. Calculez la statistique de test. Le type de statistique que nous utilisons dépend du test particulier que nous effectuons. Le calcul repose sur notre échantillon statistique. 
  4. Calculez la valeur de p. La statistique de test peut être traduite en une valeur p. Une valeur de p est la probabilité que le hasard produise à lui seul la valeur de notre statistique de test en supposant que l'hypothèse nulle est vraie. La règle générale est que plus la valeur de p est petite, plus les preuves contre l'hypothèse nulle sont grandes.
  5. Tirer une conclusion. Enfin, nous utilisons la valeur alpha qui a déjà été sélectionnée comme valeur seuil. La règle de décision est que si la valeur de p est inférieure ou égale à alpha, alors nous rejetons l'hypothèse nulle. Sinon, nous ne parvenons pas à rejeter l'hypothèse nulle.

Maintenant que nous avons vu le cadre d'un test d'hypothèse, nous allons voir les détails d'un test d'hypothèse pour la différence de deux proportions de population. 

Les conditions

Un test d'hypothèse pour la différence de deux proportions de population nécessite que les conditions suivantes soient remplies: 

  • Nous avons deux échantillons aléatoires simples provenant de grandes populations. Ici, «grande» signifie que la population est au moins 20 fois plus grande que la taille de l'échantillon. Les tailles d'échantillon seront désignées par n1 et n2.
  • Les individus de nos échantillons ont été choisis indépendamment les uns des autres. Les populations elles-mêmes doivent également être indépendantes.
  • Il y a au moins 10 succès et 10 échecs dans nos deux échantillons.

Tant que ces conditions sont remplies, nous pouvons continuer notre test d'hypothèse.

Les hypothèses nulles et alternatives

Maintenant, nous devons considérer les hypothèses pour notre test de signification. L'hypothèse nulle est notre déclaration d'absence d'effet. Dans ce type particulier de test d'hypothèse, notre hypothèse nulle est qu'il n'y a pas de différence entre les deux proportions de population. Nous pouvons écrire ceci comme H0: p1 = p2.

L'hypothèse alternative est l'une des trois possibilités, selon les spécificités de ce que nous testons: 

  • Hunep1 est supérieur à p2. Il s'agit d'un test unilatéral ou unilatéral.
  • Hune: p1 est inférieur à p2. C'est aussi un test unilatéral.
  • Hune: p1 n'est pas égal à p2. Il s'agit d'un test bilatéral ou bilatéral.

Comme toujours, pour être prudent, nous devons utiliser l'hypothèse alternative bilatérale si nous n'avons pas de direction en tête avant d'obtenir notre échantillon. La raison pour cela est qu'il est plus difficile de rejeter l'hypothèse nulle avec un test bilatéral.

Les trois hypothèses peuvent être réécrites en précisant comment p1 - p2 est lié à la valeur zéro. Pour être plus précis, l'hypothèse nulle deviendrait H0:p1 - p2 = 0. Les hypothèses alternatives potentielles seraient écrites comme suit:

  • Hunep1 - p> 0 équivaut à la déclaration "p1 est supérieur à p2."
  • Hunep1 - p< 0 is equivalent to the statement "p1 est inférieur à p2."
  • Hunep1 - p2  ≠ 0 équivaut à la déclaration "p1 n'est pas égal à p2."