Lorsque nous mesurons la variabilité d'un ensemble de données, il existe deux statistiques étroitement liées à cela: la variance et l'écart-type, qui indiquent tous deux la répartition des valeurs des données et impliquent des étapes similaires dans leur calcul. Cependant, la principale différence entre ces deux analyses statistiques est que l'écart type est la racine carrée de la variance.
Afin de comprendre les différences entre ces deux observations de l'écart statistique, il faut d'abord comprendre ce que chacune représente: la variance représente tous les points de données d'un ensemble et est calculée en faisant la moyenne de l'écart quadratique de chaque moyenne tandis que l'écart type est une mesure de l'écart autour de la moyenne lorsque la tendance centrale est calculée via la moyenne.
Par conséquent, la variance peut être exprimée comme l'écart quadratique moyen des valeurs des moyennes ou [écart quadratique des moyennes] divisé par le nombre d'observations et l'écart type peut être exprimé comme la racine carrée de la variance.
Pour bien comprendre la différence entre ces statistiques, nous devons comprendre le calcul de la variance. Les étapes du calcul de la variance de l'échantillon sont les suivantes:
Les raisons de chacune de ces étapes sont les suivantes:
Comme indiqué précédemment, l'écart type est simplement calculé en trouvant la racine carrée de ce résultat, qui fournit le standard absolu d'écart quel que soit le nombre total de valeurs de données.
Lorsque nous considérons la variance, nous nous rendons compte qu'il y a un inconvénient majeur à l'utiliser. Lorsque nous suivons les étapes du calcul de la variance, cela montre que la variance est mesurée en termes d'unités carrées car nous avons additionné les différences au carré dans notre calcul. Par exemple, si nos données d'échantillon sont mesurées en termes de mètres, alors les unités pour une variance seraient données en mètres carrés.
Afin d'uniformiser notre mesure de l'écart, nous devons prendre la racine carrée de la variance. Cela éliminera le problème des unités carrées et nous donnera une mesure de la propagation qui aura les mêmes unités que notre échantillon d'origine.
Il existe de nombreuses formules dans les statistiques mathématiques qui ont des formes plus agréables lorsque nous les énonçons en termes de variance au lieu de l'écart-type.