L'écart type de l'échantillon est une statistique descriptive qui mesure la propagation d'un ensemble de données quantitatives. Ce nombre peut être n'importe quel nombre réel non négatif. Puisque zéro est un nombre réel non négatif, il semble intéressant de demander: «Quand l'écart-type de l'échantillon sera-t-il égal à zéro?» Cela se produit dans le cas très spécial et très inhabituel où toutes nos valeurs de données sont exactement les mêmes. Nous explorerons les raisons pour lesquelles.
Deux questions importantes auxquelles nous souhaitons généralement répondre au sujet d'un ensemble de données sont les suivantes:
Il existe différentes mesures, appelées statistiques descriptives, qui répondent à ces questions. Par exemple, le centre des données, également connu sous le nom de moyenne, peut être décrit en termes de moyenne, médiane ou mode. D'autres statistiques, moins connues, peuvent être utilisées comme la midhinge ou la trimean.
Pour la diffusion de nos données, nous pourrions utiliser la plage, la plage interquartile ou l'écart type. L'écart type est associé à la moyenne pour quantifier la diffusion de nos données. Nous pouvons ensuite utiliser ce nombre pour comparer plusieurs ensembles de données. Plus notre écart-type est grand, plus l'écart est important.
Considérons donc à partir de cette description ce que cela signifierait d'avoir un écart-type de zéro. Cela indiquerait qu'il n'y a aucun écart dans notre ensemble de données. Toutes les valeurs de données individuelles seraient regroupées en une seule valeur. Puisqu'il n'y aurait qu'une seule valeur que nos données pourraient avoir, cette valeur constituerait la moyenne de notre échantillon.
Dans cette situation, lorsque toutes nos valeurs de données sont les mêmes, il n'y aurait aucune variation que ce soit. Intuitivement, il est logique que l'écart-type d'un tel ensemble de données soit nul.
L'écart type d'échantillon est défini par une formule. Donc, toute déclaration telle que celle ci-dessus doit être prouvée en utilisant cette formule. Nous commençons par un ensemble de données qui correspond à la description ci-dessus: toutes les valeurs sont identiques, et il y a n valeurs égales à X.
Nous calculons la moyenne de cet ensemble de données et voyons qu'il est
X = (X + X +… + X) /n = nx/n = X.
Maintenant, lorsque nous calculons les écarts individuels à partir de la moyenne, nous voyons que tous ces écarts sont nuls. Par conséquent, la variance et l'écart-type sont tous deux également égaux à zéro.
Nous voyons que si l'ensemble de données n'affiche aucune variation, alors son écart type est nul. Nous pouvons nous demander si l'inverse de cette affirmation est également vrai. Pour voir si c'est le cas, nous utiliserons à nouveau la formule de l'écart-type. Cette fois, cependant, nous fixerons l'écart-type à zéro. Nous ne ferons aucune hypothèse sur notre ensemble de données, mais verrons quel paramètre s = 0 implique
Supposons que l'écart-type d'un ensemble de données soit égal à zéro. Cela impliquerait que la variance de l'échantillon s2 est également égal à zéro. Le résultat est l'équation:
0 = (1 / (n - 1)) ∑ (Xje - X )2
Nous multiplions les deux côtés de l'équation par n - 1 et voir que la somme des écarts au carré est égale à zéro. Puisque nous travaillons avec des nombres réels, la seule façon pour que cela se produise est que chacun des écarts au carré soit égal à zéro. Cela signifie que pour chaque je, le terme (Xje - X )2 = 0.
Nous prenons maintenant la racine carrée de l'équation ci-dessus et voyons que chaque écart par rapport à la moyenne doit être égal à zéro. Depuis pour tous je,
Xje - X = 0
Cela signifie que chaque valeur de données est égale à la moyenne. Ce résultat ainsi que celui ci-dessus nous permettent de dire que l'écart type d'échantillon d'un ensemble de données est nul si et seulement si toutes ses valeurs sont identiques.