Exemple de test T à deux échantillons et intervalle de confiance

Parfois, dans les statistiques, il est utile de voir des exemples élaborés de problèmes. Ces exemples peuvent nous aider à trouver des problèmes similaires. Dans cet article, nous allons parcourir le processus de réalisation de statistiques inférentielles pour un résultat concernant deux moyennes de population. Non seulement verrons-nous comment effectuer un test d'hypothèse sur la différence de deux moyennes de population, mais nous construirons également un intervalle de confiance pour cette différence. Les méthodes que nous utilisons sont parfois appelées test à deux échantillons t et intervalle de confiance à deux échantillons t.

L'énoncé du problème

Supposons que nous souhaitons tester l'aptitude mathématique des enfants des écoles primaires. Une question que nous pouvons nous poser est de savoir si les niveaux supérieurs ont des scores moyens aux tests plus élevés.

Un échantillon aléatoire simple de 27 élèves de troisième année est soumis à un test de mathématiques, leurs réponses sont notées et les résultats se révèlent avoir un score moyen de 75 points avec un écart-type de 3 points.

Un échantillon aléatoire simple de 20 élèves de cinquième est soumis au même test de mathématiques et leurs réponses sont notées. Le score moyen des élèves de cinquième année est de 84 points avec un écart-type de 5 points.

Dans ce scénario, nous posons les questions suivantes:

Les données de l'échantillon nous fournissent-elles des preuves que le score de test moyen de la population de tous les élèves de cinquième année dépasse le score de test moyen de la population de tous les élèves de troisième année?
Quel est un intervalle de confiance à 95% pour la différence des scores moyens aux tests entre les populations de troisième année et de cinquième année?

Conditions et procédure

Nous devons sélectionner la procédure à utiliser. Ce faisant, nous devons nous assurer et vérifier que les conditions de cette procédure sont remplies. On nous demande de comparer deux moyennes de population. Une collection de méthodes pouvant être utilisées pour ce faire est celle des procédures t à deux échantillons.

Afin d'utiliser ces procédures t pour deux échantillons, nous devons nous assurer que les conditions suivantes sont remplies:

Nous avons deux échantillons aléatoires simples des deux populations d'intérêt.
Nos simples échantillons aléatoires ne constituent pas plus de 5% de la population.
Les deux échantillons sont indépendants l'un de l'autre et il n'y a pas de correspondance entre les sujets.
La variable est normalement distribuée.
La moyenne de la population et l'écart-type sont inconnus pour les deux populations.

Nous constatons que la plupart de ces conditions sont remplies. On nous a dit que nous disposions d'échantillons aléatoires simples. Les populations que nous étudions sont importantes car il y a des millions d'élèves dans ces classes.

La condition que nous ne pouvons pas supposer automatiquement est que les résultats des tests soient normalement distribués. Comme nous avons une taille d'échantillon suffisamment grande, par la robustesse de nos procédures t, nous n'avons pas nécessairement besoin que la variable soit distribuée normalement.

Puisque les conditions sont remplies, nous effectuons quelques calculs préliminaires.

Erreur standard

L'erreur type est une estimation d'un écart type. Pour cette statistique, nous ajoutons la variance d'échantillon des échantillons, puis prenons la racine carrée. Cela donne la formule:

(s₁² / n₁ + s₂² / n₂)^1/2

En utilisant les valeurs ci-dessus, nous voyons que la valeur de l'erreur standard est

Science