Qu'est-ce qu'une plage de statistiques?

En statistiques et en mathématiques, la plage correspond à la différence entre les valeurs maximale et minimale d'un ensemble de données et constitue l'une des deux caractéristiques importantes d'un ensemble de données. La formule d'une plage est la valeur maximale moins la valeur minimale dans l'ensemble de données, ce qui permet aux statisticiens de mieux comprendre la variation de l'ensemble de données..

Deux caractéristiques importantes d'un ensemble de données comprennent le centre des données et la répartition des données, et le centre peut être mesuré de plusieurs façons: les plus populaires sont la moyenne, la médiane, le mode et le milieu de gamme, mais dans de la même manière, il existe différentes façons de calculer la répartition de l'ensemble de données et la mesure de propagation la plus simple et la plus grossière est appelée la plage.

Le calcul de la plage est très simple. Tout ce que nous devons faire est de trouver la différence entre la plus grande valeur de données de notre ensemble et la plus petite valeur de données. En résumé, nous avons la formule suivante: Gamme = Valeur maximale-Valeur minimale. Par exemple, l'ensemble de données 4, 6, 10, 15, 18 a un maximum de 18, un minimum de 4 et une plage de 18-4 = 14.

Limites de portée

La plage est une mesure très grossière de la propagation des données car elle est extrêmement sensible aux valeurs aberrantes et, par conséquent, il existe certaines limites à l'utilité d'une véritable plage d'un ensemble de données pour les statisticiens, car une seule valeur de données peut affecter considérablement la valeur de la plage.

Par exemple, considérez l'ensemble de données 1, 2, 3, 4, 6, 7, 7, 8. La valeur maximale est 8, le minimum est 1 et la plage est 7. Ensuite, considérez le même ensemble de données, uniquement avec la valeur 100 incluse. La gamme devient maintenant 100-1 = 99 où l'ajout d'un seul point de données supplémentaire a grandement affecté la valeur de la plage. L'écart type est une autre mesure de l'écart qui est moins sensible aux valeurs aberrantes, mais l'inconvénient est que le calcul de l'écart type est beaucoup plus compliqué.

La gamme ne nous dit également rien sur les caractéristiques internes de notre ensemble de données. Par exemple, nous considérons l'ensemble de données 1, 1, 2, 3, 4, 5, 5, 6, 7, 8, 8, 10 où la plage de cet ensemble de données est 10-1 = 9. Si nous comparons ensuite cela à l'ensemble de données de 1, 1, 1, 2, 9, 9, 9, 10. Ici, la plage est, encore une fois, neuf, cependant, pour ce deuxième ensemble et contrairement au premier ensemble, les données est regroupé autour du minimum et du maximum. D'autres statistiques, telles que le premier et le troisième quartile, devraient être utilisées pour détecter une partie de cette structure interne.

Applications de la gamme

La plage est un bon moyen d'obtenir une compréhension très basique de la répartition réelle des nombres dans l'ensemble de données, car elle est facile à calculer car elle ne nécessite qu'une opération arithmétique de base, mais il existe également quelques autres applications de la plage de un ensemble de données dans les statistiques.

La plage peut également être utilisée pour estimer une autre mesure de l'écart, l'écart type. Plutôt que de passer par une formule assez compliquée pour trouver l'écart-type, nous pouvons plutôt utiliser ce qu'on appelle la règle de plage. La plage est fondamentale dans ce calcul.

La plage se produit également dans un diagramme à boîte ou un tracé de boîte et de moustaches. Les valeurs maximale et minimale sont toutes deux représentées à la fin des moustaches du graphique et la longueur totale des moustaches et de la boîte est égale à la plage.