Apprenez la différence entre un paramètre et une statistique

Dans plusieurs disciplines, l'objectif est d'étudier un large groupe d'individus. Ces groupes pourraient être aussi variés qu'une espèce d'oiseau, des étudiants de première année aux États-Unis ou des voitures conduites dans le monde entier. Les statistiques sont utilisées dans toutes ces études lorsqu'il est impossible, voire impossible, d'étudier chaque membre du groupe d'intérêt. Plutôt que de mesurer l'envergure de chaque oiseau d'une espèce, de poser des questions d'enquête à chaque étudiant de première année ou de mesurer l'économie de carburant de chaque voiture dans le monde, nous étudions et mesurons plutôt un sous-ensemble du groupe.

La collection de tout le monde ou de tout ce qui doit être analysé dans une étude s'appelle une population. Comme nous l'avons vu dans les exemples ci-dessus, la population pourrait être énorme. Il pourrait y avoir des millions voire des milliards d'individus dans la population. Mais nous ne devons pas penser que la population doit être importante. Si notre groupe à l'étude est des élèves de quatrième année dans une école particulière, alors la population se compose uniquement de ces élèves. Selon la taille de l'école, cela pourrait être moins d'une centaine d'élèves dans notre population.

Pour rendre notre étude moins coûteuse en termes de temps et de ressources, nous étudions uniquement un sous-ensemble de la population. Ce sous-ensemble est appelé un échantillon. Les échantillons peuvent être assez grands ou assez petits. En théorie, un individu d'une population constitue un échantillon. De nombreuses applications des statistiques nécessitent qu'un échantillon compte au moins 30 individus.

Paramètres et statistiques

Ce que nous recherchons généralement dans une étude, c'est le paramètre. Un paramètre est une valeur numérique qui indique quelque chose sur l'ensemble de la population étudiée. Par exemple, nous pouvons vouloir connaître l'envergure moyenne du pygargue à tête blanche américain. Il s'agit d'un paramètre car il décrit l'ensemble de la population.

Les paramètres sont difficiles, voire impossibles à obtenir exactement. D'un autre côté, chaque paramètre a une statistique correspondante qui peut être mesurée exactement. Une statistique est une valeur numérique qui indique quelque chose à propos d'un échantillon. Pour étendre l'exemple ci-dessus, nous pourrions attraper 100 pygargues à tête blanche, puis mesurer l'envergure de chacun d'eux. L'envergure moyenne des 100 aigles que nous avons capturés est une statistique.

La valeur d'un paramètre est un nombre fixe. Contrairement à cela, puisqu'une statistique dépend d'un échantillon, la valeur d'une statistique peut varier d'un échantillon à l'autre. Supposons que notre paramètre de population ait une valeur, inconnue de nous, de 10. Un échantillon de taille 50 a la statistique correspondante avec la valeur 9.5. Un autre échantillon de taille 50 provenant de la même population a la statistique correspondante avec la valeur 11,1.

Le but ultime du domaine des statistiques est d'estimer un paramètre de population à l'aide d'échantillons statistiques.

Dispositif mnémonique

Il existe un moyen simple et direct de se rappeler ce qu'un paramètre et une statistique mesurent. Tout ce que nous devons faire, c'est regarder la première lettre de chaque mot. Un paramètre mesure quelque chose dans une population et une statistique mesure quelque chose dans un échantillon.

Exemples de paramètres et de statistiques

Voici quelques exemples de paramètres et de statistiques:

  • Supposons que nous étudions la population de chiens à Kansas City. Un paramètre de cette population serait la taille moyenne de tous les chiens de la ville. Une statistique serait la taille moyenne de 50 de ces chiens.
  • Nous envisagerons une étude sur les personnes âgées du secondaire aux États-Unis. Un paramètre de cette population est l'écart type des moyennes cumulatives de tous les aînés du secondaire. Une statistique est l'écart type des moyennes pondérées d'un échantillon de 1 000 personnes âgées du secondaire.
  • Nous considérons tous les électeurs probables pour une prochaine élection. Il y aura une initiative de vote pour changer la constitution de l'État. Nous souhaitons déterminer le niveau de soutien à cette initiative de vote. Un paramètre, dans ce cas, est la proportion de la population d'électeurs probables qui soutiennent l'initiative de vote. Une statistique connexe est la proportion correspondante d'un échantillon d'électeurs probables.