Parfois, dans les statistiques, il est utile de voir des exemples élaborés de problèmes. Ces exemples peuvent nous aider à trouver des problèmes similaires. Dans cet article, nous allons parcourir le processus de réalisation de statistiques inférentielles pour un résultat concernant deux moyennes de population. Non seulement verrons-nous comment effectuer un test d'hypothèse sur la différence de deux moyennes de population, mais nous construirons également un intervalle de confiance pour cette différence. Les méthodes que nous utilisons sont parfois appelées test à deux échantillons t et intervalle de confiance à deux échantillons t.
Supposons que nous souhaitons tester l'aptitude mathématique des enfants des écoles primaires. Une question que nous pouvons nous poser est de savoir si les niveaux supérieurs ont des scores moyens aux tests plus élevés.
Un échantillon aléatoire simple de 27 élèves de troisième année est soumis à un test de mathématiques, leurs réponses sont notées et les résultats se révèlent avoir un score moyen de 75 points avec un écart-type de 3 points.
Un échantillon aléatoire simple de 20 élèves de cinquième est soumis au même test de mathématiques et leurs réponses sont notées. Le score moyen des élèves de cinquième année est de 84 points avec un écart-type de 5 points.
Dans ce scénario, nous posons les questions suivantes:
Nous devons sélectionner la procédure à utiliser. Ce faisant, nous devons nous assurer et vérifier que les conditions de cette procédure sont remplies. On nous demande de comparer deux moyennes de population. Une collection de méthodes pouvant être utilisées pour ce faire est celle des procédures t à deux échantillons.
Afin d'utiliser ces procédures t pour deux échantillons, nous devons nous assurer que les conditions suivantes sont remplies:
Nous constatons que la plupart de ces conditions sont remplies. On nous a dit que nous disposions d'échantillons aléatoires simples. Les populations que nous étudions sont importantes car il y a des millions d'élèves dans ces classes.
La condition que nous ne pouvons pas supposer automatiquement est que les résultats des tests soient normalement distribués. Comme nous avons une taille d'échantillon suffisamment grande, par la robustesse de nos procédures t, nous n'avons pas nécessairement besoin que la variable soit distribuée normalement.
Puisque les conditions sont remplies, nous effectuons quelques calculs préliminaires.
L'erreur type est une estimation d'un écart type. Pour cette statistique, nous ajoutons la variance d'échantillon des échantillons, puis prenons la racine carrée. Cela donne la formule:
(s1 2 / n1 + s22 / n2)1/2
En utilisant les valeurs ci-dessus, nous voyons que la valeur de l'erreur standard est