Le calcul d'une variance d'échantillon ou d'un écart-type est généralement exprimé sous forme de fraction. Le numérateur de cette fraction implique une somme des écarts au carré de la moyenne. En statistiques, la formule pour cette somme totale des carrés est
Σ (xje - X)2
Ici, le symbole x̄ fait référence à la moyenne de l'échantillon, et le symbole Σ nous dit de additionner les différences au carré (xje - x̄) pour tous je.
Bien que cette formule fonctionne pour les calculs, il existe une formule de raccourci équivalente qui ne nous oblige pas à calculer d'abord la moyenne de l'échantillon. Cette formule de raccourci pour la somme des carrés est
Σ (xje2) - (Σ xje)2/n
Ici la variable n fait référence au nombre de points de données dans notre échantillon.
Pour voir comment fonctionne cette formule de raccourci, nous allons considérer un exemple calculé à l'aide des deux formules. Supposons que notre échantillon soit 2, 4, 6, 8. La moyenne de l'échantillon est (2 + 4 + 6 + 8) / 4 = 20/4 = 5. Maintenant, nous calculons la différence de chaque point de données avec la moyenne 5.
Nous plaçons maintenant chacun de ces nombres et les additionnons ensemble. (-3)2 + (-1)2 + 12 + 32 = 9 + 1 + 1 + 9 = 20.
Nous allons maintenant utiliser le même ensemble de données: 2, 4, 6, 8, avec la formule de raccourci pour déterminer la somme des carrés. Nous mettons d'abord en carré chaque point de données et les additionnons ensemble: 22 + 42 + 62 + 82 = 4 + 16 + 36 + 64 = 120.
L'étape suivante consiste à additionner toutes les données et à mettre cette somme au carré: (2 + 4 + 6 + 8)2 = 400. On divise ceci par le nombre de points de données pour obtenir 400/4 = 100.
Nous soustrayons maintenant ce nombre à 120. Cela nous donne que la somme des écarts au carré est 20. C'est exactement le nombre que nous avons déjà trouvé dans l'autre formule.
Beaucoup de gens accepteront simplement la formule à leur valeur nominale et ne savent pas pourquoi cette formule fonctionne. En utilisant un peu d'algèbre, nous pouvons voir pourquoi cette formule de raccourci est équivalente à la façon traditionnelle et traditionnelle de calculer la somme des écarts au carré.
Bien qu'il puisse y avoir des centaines, sinon des milliers de valeurs dans un ensemble de données réelles, nous supposerons qu'il n'y a que trois valeurs de données: x1 , X2, X3. Ce que nous voyons ici pourrait être étendu à un ensemble de données contenant des milliers de points.
Nous commençons par noter que (x1 + X2 + X3) = 3 x̄. L'expression Σ (xje - X)2 = (x1 - X)2 + (X2 - X)2 + (X3 - X)2.