La variance et l'écart-type sont deux mesures de variation étroitement liées dont vous entendrez beaucoup parler dans les études, les revues ou les cours de statistique. Ce sont deux concepts de base et fondamentaux de la statistique qui doivent être compris pour comprendre la plupart des autres concepts ou procédures statistiques. Ci-dessous, nous examinerons ce qu'ils sont et comment trouver la variance et l'écart-type.
Par définition, la variance et l'écart-type sont tous deux des mesures de variation pour les variables de rapport d'intervalle. Ils décrivent la variation ou la diversité d'une distribution. La variance et l'écart-type augmentent ou diminuent en fonction de la proximité des scores groupés autour de la moyenne.
La variance est définie comme la moyenne des écarts au carré de la moyenne. Pour calculer la variance, vous devez d'abord soustraire la moyenne de chaque nombre, puis mettre les résultats au carré pour trouver les différences au carré. Vous trouvez alors la moyenne de ces différences au carré. Le résultat est la variance.
L'écart type est une mesure de la répartition des nombres dans une distribution. Il indique dans quelle mesure, en moyenne, chacune des valeurs de la distribution s'écarte de la moyenne, ou centre, de la distribution. Il est calculé en prenant la racine carrée de la variance.
La variance et l'écart-type sont importants car ils nous disent des choses sur l'ensemble de données que nous ne pouvons pas apprendre simplement en regardant la moyenne ou la moyenne. Par exemple, imaginez que vous avez trois frères et sœurs plus jeunes: un frère qui a 13 ans et des jumeaux qui en ont 10. Dans ce cas, l'âge moyen de vos frères et sœurs serait de 11 ans. Imaginez maintenant que vous avez trois frères et sœurs âgés de 17 et 12 ans. , et 4. Dans ce cas, l'âge moyen de vos frères et sœurs serait toujours de 11 ans, mais la variance et l'écart-type seraient plus importants.
Disons que nous voulons trouver la variance et l'écart-type de l'âge parmi votre groupe de 5 amis proches. Vous et vos amis avez respectivement 25, 26, 27, 30 et 32 ans.
Tout d'abord, nous devons trouver l'âge moyen: (25 + 26 + 27 + 30 + 32) / 5 = 28.
Ensuite, nous devons calculer les différences à partir de la moyenne pour chacun des 5 amis.
25 - 28 = -3
26 - 28 = -2
27 - 28 = -1
30 - 28 = 2
32 - 28 = 4
Ensuite, pour calculer la variance, nous prenons chaque différence de la moyenne, la mettons au carré, puis faisons la moyenne du résultat.
Écart = ((-3)2 + (-2)2 + (-1)2 + 22 + 42) / 5
= (9 + 4 + 1 + 4 + 16) / 5 = 6,8
Ainsi, la variance est de 6,8. Et l'écart-type est la racine carrée de la variance, qui est de 2,61. Cela signifie qu'en moyenne, vous et vos amis êtes séparés de 2,61 ans.
Bien qu'il soit possible de calculer la variance à la main pour des ensembles de données plus petits comme celui-ci, des logiciels statistiques peuvent également être utilisés pour calculer la variance et l'écart-type.
Lors de tests statistiques, il est important de connaître la différence entre un population et un échantillon. Pour calculer l'écart type (ou variance) d'une population, vous devez collecter des mesures pour tous les membres du groupe que vous étudiez; pour un échantillon, vous collecteriez uniquement les mesures d'un sous-ensemble de la population.
Dans l'exemple ci-dessus, nous avons supposé que le groupe de cinq amis était une population; si nous l'avions traité comme un échantillon à la place, le calcul de l'écart-type de l'échantillon et de la variance de l'échantillon serait légèrement différent (au lieu de diviser par la taille de l'échantillon pour trouver la variance, nous aurions d'abord soustrait un de la taille de l'échantillon, puis divisé par ce plus petit nombre).
La variance et l'écart type sont importants en statistique, car ils servent de base à d'autres types de calculs statistiques. Par exemple, l'écart type est nécessaire pour convertir les résultats des tests en scores Z. La variance et l'écart-type jouent également un rôle important lors de la réalisation de tests statistiques tels que les tests t.
Frankfort-Nachmias, C. & Leon-Guerrero, A. (2006). Statistiques sociales pour une société diversifiée. Thousand Oaks, Californie: Pine Forge Press.