Les mesures de la tendance centrale sont des nombres qui décrivent ce qui est moyen ou typique dans une distribution de données. Il existe trois principales mesures de la tendance centrale: la moyenne, la médiane et le mode. Bien qu'ils soient tous des mesures de la tendance centrale, chacun est calculé différemment et mesure quelque chose de différent des autres.
La moyenne est la mesure la plus courante de la tendance centrale utilisée par les chercheurs et les personnes dans toutes sortes de professions. C'est la mesure de la tendance centrale qui est également appelée moyenne. Un chercheur peut utiliser la moyenne pour décrire la distribution des données des variables mesurées sous forme d'intervalles ou de ratios. Ce sont des variables qui incluent des catégories ou des gammes correspondant numériquement (comme la race, la classe, le sexe ou le niveau d'éducation), ainsi que des variables mesurées numériquement à partir d'une échelle qui commence par zéro (comme le revenu du ménage ou le nombre d'enfants dans une famille).
Une moyenne est très facile à calculer. Il suffit d'ajouter toutes les valeurs de données ou "scores", puis de diviser cette somme par le nombre total de scores dans la distribution des données. Par exemple, si cinq familles ont respectivement 0, 2, 2, 3 et 5 enfants, le nombre moyen d'enfants est (0 + 2 + 2 + 3 + 5) / 5 = 12/5 = 2,4. Cela signifie que les cinq ménages ont en moyenne 2,4 enfants.
La médiane est la valeur au milieu d'une distribution de données lorsque ces données sont organisées de la valeur la plus faible à la valeur la plus élevée. Cette mesure de la tendance centrale peut être calculée pour les variables mesurées avec des échelles ordinales, d'intervalle ou de rapport.
Le calcul de la médiane est également assez simple. Supposons que nous ayons la liste de nombres suivante: 5, 7, 10, 43, 2, 69, 31, 6, 22. Premièrement, nous devons organiser les nombres dans l'ordre du plus bas au plus élevé. Le résultat est le suivant: 2, 5, 6, 7, 10, 22, 31, 43, 69. La médiane est 10 car c'est le nombre médian exact. Il y a quatre nombres en dessous de 10 et quatre nombres au-dessus de 10.
Si votre distribution de données a un nombre pair de cas, ce qui signifie qu'il n'y a pas de milieu exact, vous ajustez simplement légèrement la plage de données afin de calculer la médiane. Par exemple, si nous ajoutons le nombre 87 à la fin de notre liste de nombres ci-dessus, nous avons 10 nombres totaux dans notre distribution, il n'y a donc pas de nombre intermédiaire unique. Dans ce cas, on prend la moyenne des scores des deux nombres médians. Dans notre nouvelle liste, les deux nombres du milieu sont 10 et 22. Donc, nous prenons la moyenne de ces deux nombres: (10 + 22) / 2 = 16. Notre médiane est maintenant 16.
Le mode est la mesure de la tendance centrale qui identifie la catégorie ou le score qui se produit le plus fréquemment dans la distribution des données. En d'autres termes, c'est le score le plus courant ou le score qui apparaît le plus de fois dans une distribution. Le mode peut être calculé pour tout type de données, y compris celles mesurées en tant que variables nominales, ou par nom.
Par exemple, supposons que nous examinons des animaux appartenant à 100 familles et que la distribution ressemble à ceci:
Animal Nombre de familles qui en sont propriétaires
Le mode ici est "chien" car plus de familles possèdent un chien que tout autre animal. Notez que le mode est toujours exprimé sous forme de catégorie ou de score, et non pas la fréquence de ce score. Par exemple, dans l'exemple ci-dessus, le mode est "chien", pas 60, qui est le nombre de fois que le chien apparaît.
Certaines distributions n'ont pas de mode du tout. Cela se produit lorsque chaque catégorie a la même fréquence. D'autres distributions peuvent avoir plusieurs modes. Par exemple, lorsqu'une distribution a deux scores ou catégories avec la même fréquence la plus élevée, elle est souvent appelée «bimodale».