Qu'est-ce que le résumé à 5 chiffres?

Il existe une variété de statistiques descriptives. Des nombres tels que la moyenne, la médiane, le mode, l'asymétrie, le kurtosis, l'écart type, le premier quartile et le troisième quartile, pour n'en nommer que quelques-uns, chacun nous disent quelque chose sur nos données. Plutôt que de regarder ces statistiques descriptives individuellement, leur combinaison permet parfois de nous donner une image complète. Dans cette optique, le résumé à cinq chiffres est un moyen pratique de combiner cinq statistiques descriptives.

Quels cinq chiffres?

Il est clair qu'il doit y avoir cinq chiffres dans notre résumé, mais lesquels? Les nombres choisis sont destinés à nous aider à connaître le centre de nos données, ainsi que la répartition des points de données. Dans cette optique, le résumé à cinq chiffres comprend les éléments suivants:

  • Le minimum - c'est la plus petite valeur de notre ensemble de données.
  • Le premier quartile - ce nombre est noté Q1 et 25% de nos données tombent en dessous du premier quartile.
  • La médiane - c'est le point médian des données. 50% de toutes les données sont inférieures à la médiane.
  • Le troisième quartile - ce nombre est noté Q3 et 75% de nos données tombent en dessous du troisième quartile.
  • Le maximum - c'est la plus grande valeur de notre ensemble de données.

La moyenne et l'écart type peuvent également être utilisés ensemble pour transmettre le centre et la diffusion d'un ensemble de données. Cependant, ces deux statistiques sont sensibles aux valeurs aberrantes. La médiane, le premier quartile et le troisième quartile ne sont pas aussi fortement influencés par les valeurs aberrantes.

Un exemple

Étant donné l'ensemble de données suivant, nous présenterons le résumé à cinq chiffres:

1, 2, 2, 3, 4, 6, 6, 7, 7, 7, 8, 11, 12, 15, 15, 15, 17, 17, 18, 20

Il y a un total de vingt points dans l'ensemble de données. La médiane est donc la moyenne des dixième et onzième valeurs de données ou:

(7 + 8) / 2 = 7,5.

La médiane de la moitié inférieure des données est le premier quartile. La moitié inférieure est:

1, 2, 2, 3, 4, 6, 6, 7, 7, 7

Ainsi, nous calculonsQ1= (4 + 6) / 2 = 5.

La médiane de la moitié supérieure de l'ensemble de données d'origine est le troisième quartile. Nous devons trouver la médiane de:

8, 11, 12, 15, 15, 15, 17, 17, 18, 20

Ainsi, nous calculonsQ3= (15 + 15) / 2 = 15.

Nous assemblons tous les résultats ci-dessus ensemble et signalons que le résumé à cinq chiffres pour l'ensemble de données ci-dessus est 1, 5, 7,5, 12, 20.

Représentation graphique

Cinq résumés numériques peuvent être comparés les uns aux autres. Nous constaterons que deux ensembles avec des moyennes et des écarts-types similaires peuvent avoir des résumés à cinq chiffres très différents. Pour comparer facilement deux résumés à cinq chiffres en un coup d'œil, nous pouvons utiliser un diagramme à boîte ou un graphique à boîte et à moustaches.