Qu'est-ce que l'échantillonnage statistique?

Plusieurs fois, les chercheurs veulent connaître les réponses à des questions de grande envergure. Par exemple:

  • Qu'est-ce que tout le monde dans un pays en particulier a regardé à la télévision hier soir?
  • Pour qui un électorat a-t-il l'intention de voter lors d'une prochaine élection?
  • Combien d'oiseaux reviennent de la migration à un certain endroit?
  • Quel pourcentage de la population active est au chômage?

Ces types de questions sont énormes en ce sens qu'elles nous obligent à suivre des millions de personnes.

Les statistiques simplifient ces problèmes en utilisant une technique appelée échantillonnage. En réalisant un échantillon statistique, notre charge de travail peut être considérablement réduite. Plutôt que de suivre les comportements de milliards ou de millions, nous n'avons qu'à examiner ceux de milliers ou de centaines. Comme nous le verrons, cette simplification a un prix.

Populations et recensements

La population d'une étude statistique est ce que nous essayons de découvrir. Il se compose de toutes les personnes interrogées. Une population peut vraiment être n'importe quoi. Les Californiens, les caribous, les ordinateurs, les voitures ou les comtés pourraient tous être considérés comme des populations, selon la question statistique. Bien que la plupart des populations étudiées soient grandes, elles ne doivent pas nécessairement être.

Une stratégie de recherche sur la population consiste à effectuer un recensement. Dans un recensement, nous examinons chaque membre de la population dans notre étude. Le recensement américain en est un excellent exemple. Tous les dix ans, le Census Bureau envoie un questionnaire à tous les habitants du pays. Ceux qui ne retournent pas le formulaire sont visités par des recenseurs

Les recensements sont semés d'embûches. Ils sont généralement coûteux en termes de temps et de ressources. En plus de cela, il est difficile de garantir que tous les membres de la population soient atteints. D'autres populations sont encore plus difficiles à réaliser avec un recensement. Si nous voulions étudier les habitudes des chiens errants dans l'État de New York, bonne chance tout de ces canines transitoires.

Échantillons

Puisqu'il est normalement impossible ou peu pratique de retrouver chaque membre d'une population, la prochaine option disponible consiste à échantillonner la population. Un échantillon est un sous-ensemble d'une population, sa taille peut donc être petite ou grande. Nous voulons un échantillon suffisamment petit pour être gérable par notre puissance de calcul, mais suffisamment grand pour nous donner des résultats statistiquement significatifs.

Si une entreprise de sondage tente de déterminer la satisfaction des électeurs à l'égard du Congrès et que sa taille d'échantillon est de un, alors les résultats vont être dénués de sens (mais faciles à obtenir). D'un autre côté, demander à des millions de personnes va consommer trop de ressources. Pour trouver un équilibre, les sondages de ce type ont généralement des tailles d'échantillons d'environ 1000.

Échantillons aléatoires

Mais avoir la bonne taille d'échantillon n'est pas suffisant pour garantir de bons résultats. Nous voulons un échantillon représentatif de la population. Supposons que nous voulons savoir combien de livres l'Américain moyen lit chaque année. Nous demandons à 2 000 étudiants de suivre ce qu'ils ont lu au cours de l'année, puis revenons avec eux après un an. Nous constatons que le nombre moyen de livres lus est de 12, puis concluons que l'Américain moyen lit 12 livres par an.

Le problème avec ce scénario est avec l'exemple. La majorité des étudiants ont entre 18 et 25 ans et sont tenus par leurs instructeurs de lire des manuels et des romans. C'est une mauvaise représentation de l'Américain moyen. Un bon échantillon contiendrait des personnes d'âges différents, de tous horizons et de différentes régions du pays. Pour acquérir un tel échantillon, nous aurions besoin de le composer de façon aléatoire afin que chaque Américain ait une probabilité égale d'être dans l'échantillon.

Types d'échantillons

L'étalon-or des expériences statistiques est l'échantillon aléatoire simple. Dans un tel échantillon de taille n individus, chaque membre de la population a la même probabilité d'être sélectionné pour l'échantillon, et chaque groupe de n les individus ont la même probabilité d'être sélectionnés. Il existe différentes façons d'échantillonner une population. Certains des plus courants sont:

  • Échantillon aléatoire
  • Échantillon aléatoire simple
  • Échantillon de réponse volontaire
  • Échantillon de commodité
  • Échantillon systématique
  • Échantillon de cluster
  • Échantillon stratifié

Quelques conseils

Comme le dit le proverbe: «Bien commencé est à moitié fait.» Pour nous assurer que nos études et expériences statistiques donnent de bons résultats, nous devons les planifier et les démarrer avec soin. Il est facile de trouver de mauvais échantillons statistiques. De bons échantillons aléatoires simples nécessitent un certain travail pour obtenir. Si nos données ont été obtenues au hasard et de manière cavalière, quelle que soit la sophistication de notre analyse, les techniques statistiques ne nous donneront aucune conclusion valable..