Les statistiques inférentielles concernent le processus consistant à commencer par un échantillon statistique et à arriver ensuite à la valeur d'un paramètre de population inconnu. La valeur inconnue n'est pas déterminée directement. Nous nous retrouvons plutôt avec une estimation qui se situe dans une plage de valeurs. Cette plage est connue en termes mathématiques comme un intervalle de nombres réels et est spécifiquement appelée un intervalle de confiance.
Les intervalles de confiance se ressemblent tous à plusieurs égards. Les intervalles de confiance bilatéraux ont tous la même forme:
Estimation ± Marge d'erreur
Les similitudes dans les intervalles de confiance s'étendent également aux étapes utilisées pour calculer les intervalles de confiance. Nous examinerons comment déterminer un intervalle de confiance bilatéral pour une moyenne de population lorsque l'écart-type de la population est inconnu. Une hypothèse sous-jacente est que nous échantillonnons à partir d'une population normalement distribuée.
Processus d'intervalle de confiance pour une moyenne avec un sigma inconnu
Nous allons parcourir une liste d'étapes nécessaires pour trouver l'intervalle de confiance souhaité. Bien que toutes les étapes soient importantes, la première l'est particulièrement:
Vérifier les conditions: Commencez par vous assurer que les conditions de notre intervalle de confiance sont remplies. Nous supposons que la valeur de l'écart-type de la population, notée par la lettre grecque sigma σ, est inconnue et que nous travaillons avec une distribution normale. Nous pouvons assouplir l'hypothèse selon laquelle nous avons une distribution normale tant que notre échantillon est suffisamment grand et n'a pas de valeurs aberrantes ou d'asymétrie extrême.
Calculer l'estimation: Nous estimons notre paramètre de population, dans ce cas, la moyenne de la population, en utilisant une statistique, dans ce cas, la moyenne de l'échantillon. Cela implique de former un échantillon aléatoire simple à partir de notre population. Parfois, nous pouvons supposer que notre échantillon est un simple échantillon aléatoire, même s'il ne répond pas à la définition stricte.
Valeur critique: Nous obtenons la valeur critique t* qui correspondent à notre niveau de confiance. Ces valeurs sont trouvées en consultant un tableau de scores t ou en utilisant le logiciel. Si nous utilisons une table, nous aurons besoin de connaître le nombre de degrés de liberté. Le nombre de degrés de liberté est inférieur de un au nombre d'individus dans notre échantillon.
Marge d'erreur: Calculer la marge d'erreur t*s / √n, où n est la taille de l'échantillon aléatoire simple que nous avons formé et s est l'écart type de l'échantillon, que nous obtenons à partir de notre échantillon statistique.
Conclure: Terminez en rassemblant l'estimation et la marge d'erreur. Cela peut être exprimé comme Estimation ± Marge d'erreur ou comme Estimation - Marge d'erreur à Estimation + marge d'erreur. Dans l'énoncé de notre intervalle de confiance, il est important d'indiquer le niveau de confiance. Cela fait tout autant partie de notre intervalle de confiance que les chiffres pour l'estimation et la marge d'erreur.
Exemple
Pour voir comment nous pouvons construire un intervalle de confiance, nous allons travailler sur un exemple. Supposons que nous savons que les hauteurs d'une espèce spécifique de pois sont normalement réparties. Un échantillon aléatoire simple de 30 plants de pois a une hauteur moyenne de 12 pouces avec un écart-type d'échantillon de 2 pouces. Qu'est-ce qu'un intervalle de confiance de 90% pour la hauteur moyenne de l'ensemble de la population de pois?
Nous allons suivre les étapes décrites ci-dessus:
Vérifier les conditions: Les conditions sont remplies car l'écart-type de la population est inconnu et nous avons affaire à une distribution normale.
Calculer l'estimation: On nous a dit que nous avons un échantillon aléatoire simple de 30 plants de pois. La hauteur moyenne de cet échantillon est de 12 pouces, c'est donc notre estimation.
Valeur critique: Notre échantillon a une taille de 30, et il y a donc 29 degrés de liberté. La valeur critique du niveau de confiance de 90% est donnée par t* = 1,699.
Marge d'erreur: Maintenant, nous utilisons la formule de la marge d'erreur et obtenons une marge d'erreur de t*s / √n = (1,699) (2) / √ (30) = 0,620.
Conclure: Nous concluons en mettant tout ensemble. Un intervalle de confiance à 90% pour le score de taille moyenne de la population est de 12 ± 0,62 pouces. Alternativement, nous pourrions indiquer cet intervalle de confiance de 11,38 pouces à 12,62 pouces.
Considérations pratiques
Les intervalles de confiance du type ci-dessus sont plus réalistes que d'autres types pouvant être rencontrés dans un cours de statistiques. Il est très rare de connaître l'écart type de la population mais pas la moyenne de la population. Ici, nous supposons que nous ne connaissons aucun de ces paramètres de population.