L'une des principales parties des statistiques inférentielles est la mise au point de méthodes de calcul des intervalles de confiance. Les intervalles de confiance nous permettent d'estimer un paramètre de population. Plutôt que de dire que le paramètre est égal à une valeur exacte, nous disons que le paramètre se situe dans une plage de valeurs. Cette plage de valeurs est généralement une estimation, ainsi qu'une marge d'erreur que nous ajoutons et soustrayons de l'estimation.
Un niveau de confiance est attaché à chaque intervalle. Le niveau de confiance donne une mesure de la fréquence à laquelle, à long terme, la méthode utilisée pour obtenir notre intervalle de confiance capture le véritable paramètre de la population.
Il est utile lors de l'apprentissage des statistiques de voir quelques exemples élaborés. Ci-dessous, nous examinerons plusieurs exemples d'intervalles de confiance concernant une moyenne de population. Nous verrons que la méthode que nous utilisons pour construire un intervalle de confiance sur une moyenne dépend de plus amples informations sur notre population. Plus précisément, l'approche que nous adoptons dépend de la connaissance ou non de l'écart-type de la population..
Énoncé des problèmes
Nous commençons avec un simple échantillon aléatoire de 25 espèces particulières de tritons et mesurons leur queue. La longueur moyenne de la queue de notre échantillon est de 5 cm.
Si nous savons que 0,2 cm est l'écart-type des longueurs de queue de tous les tritons de la population, alors quel est un intervalle de confiance de 90% pour la longueur moyenne de queue de tous les tritons de la population?
Si nous savons que 0,2 cm est l'écart-type des longueurs de queue de tous les tritons de la population, alors quel est un intervalle de confiance de 95% pour la longueur moyenne de la queue de tous les tritons de la population?
Si nous constatons que ce 0,2 cm est l'écart-type des longueurs de queue des tritons dans notre échantillon de la population, alors quel est un intervalle de confiance de 90% pour la longueur moyenne de la queue de tous les tritons de la population?
Si nous constatons que 0,2 cm est l'écart-type des longueurs de queue des tritons dans notre échantillon de population, alors quel est un intervalle de confiance de 95% pour la longueur moyenne de queue de tous les tritons de la population?
Discussion des problèmes
Nous commençons par analyser chacun de ces problèmes. Dans les deux premiers problèmes, nous connaissons la valeur de l'écart-type de la population. La différence entre ces deux problèmes est que le niveau de confiance est plus élevé dans # 2 que ce qu'il est pour # 1.
Dans les deux seconds problèmes, l'écart type de la population est inconnu. Pour ces deux problèmes, nous allons estimer ce paramètre avec l'écart-type de l'échantillon. Comme nous l'avons vu dans les deux premiers problèmes, nous avons également ici différents niveaux de confiance.
Solutions
Nous calculerons des solutions pour chacun des problèmes ci-dessus.
Puisque nous connaissons l'écart type de la population, nous utiliserons un tableau de z-scores. La valeur de z ce qui correspond à un intervalle de confiance à 90% est de 1,645. En utilisant la formule de la marge d'erreur, nous avons un intervalle de confiance de 5 - 1,645 (0,2 / 5) à 5 + 1,645 (0,2 / 5). (Le 5 dans le dénominateur ici est parce que nous avons pris la racine carrée de 25). Après avoir effectué l'arithmétique, nous avons 4,934 cm à 5,066 cm comme intervalle de confiance pour la moyenne de la population.
Puisque nous connaissons l'écart type de la population, nous utiliserons un tableau de z-scores. La valeur de z qui correspond à un intervalle de confiance à 95% est de 1,96. En utilisant la formule de la marge d'erreur, nous avons un intervalle de confiance de 5 - 1,96 (0,2 / 5) à 5 + 1,96 (0,2 / 5). Après avoir effectué l'arithmétique, nous avons 4,922 cm à 5,078 cm comme intervalle de confiance pour la moyenne de la population.
Ici, nous ne connaissons pas l'écart type de la population, seulement l'écart type de l'échantillon. Ainsi, nous utiliserons un tableau de scores t. Lorsque nous utilisons un tableau de t scores nous devons savoir combien de degrés de liberté nous avons. Dans ce cas, il y a 24 degrés de liberté, soit un de moins que la taille de l'échantillon de 25. La valeur de t qui correspond à un intervalle de confiance à 90% est de 1,71. En utilisant la formule de la marge d'erreur, nous avons un intervalle de confiance de 5 - 1,71 (0,2 / 5) à 5 + 1,71 (0,2 / 5). Après avoir effectué l'arithmétique, nous avons 4,932 cm à 5,068 cm comme intervalle de confiance pour la moyenne de la population.
Ici, nous ne connaissons pas l'écart type de la population, seulement l'écart type de l'échantillon. Ainsi, nous utiliserons à nouveau un tableau de scores t. Il y a 24 degrés de liberté, soit un de moins que la taille de l'échantillon de 25. La valeur de t qui correspond à un intervalle de confiance à 95% est de 2,06. En utilisant la formule de la marge d'erreur, nous avons un intervalle de confiance de 5 - 2,06 (0,2 / 5) à 5 + 2,06 (0,2 / 5). Après avoir effectué l'arithmétique, nous avons 4,912 cm à 5,082 cm comme intervalle de confiance pour la moyenne de la population.
Discussion des solutions
Il y a quelques éléments à noter pour comparer ces solutions. La première est que, dans chaque cas, à mesure que notre niveau de confiance augmentait, plus la valeur de z ou t que nous avons fini avec. La raison en est que pour être plus confiant d'avoir effectivement capturé la moyenne de la population dans notre intervalle de confiance, nous avons besoin d'un intervalle plus large.
L'autre caractéristique à noter est que pour un intervalle de confiance particulier, ceux qui utilisent t sont plus larges que celles avec z. La raison en est qu'un t la distribution a une plus grande variabilité dans ses queues qu'une distribution normale standard.
La clé pour corriger les solutions de ces types de problèmes est que si nous connaissons l'écart type de la population, nous utilisons un tableau de z-scores. Si nous ne connaissons pas l'écart-type de la population, nous utilisons un tableau de t scores.