Il existe une variété de statistiques descriptives. Des nombres tels que la moyenne, la médiane, le mode, l'asymétrie, le kurtosis, l'écart type, le premier quartile et le troisième quartile, pour n'en nommer que quelques-uns, chacun nous disent quelque chose sur nos données. Plutôt que de regarder ces statistiques descriptives individuellement, leur combinaison permet parfois de nous donner une image complète. Dans cette optique, le résumé à cinq chiffres est un moyen pratique de combiner cinq statistiques descriptives.
Il est clair qu'il doit y avoir cinq chiffres dans notre résumé, mais lesquels? Les nombres choisis sont destinés à nous aider à connaître le centre de nos données, ainsi que la répartition des points de données. Dans cette optique, le résumé à cinq chiffres comprend les éléments suivants:
La moyenne et l'écart type peuvent également être utilisés ensemble pour transmettre le centre et la diffusion d'un ensemble de données. Cependant, ces deux statistiques sont sensibles aux valeurs aberrantes. La médiane, le premier quartile et le troisième quartile ne sont pas aussi fortement influencés par les valeurs aberrantes.
Étant donné l'ensemble de données suivant, nous présenterons le résumé à cinq chiffres:
1, 2, 2, 3, 4, 6, 6, 7, 7, 7, 8, 11, 12, 15, 15, 15, 17, 17, 18, 20
Il y a un total de vingt points dans l'ensemble de données. La médiane est donc la moyenne des dixième et onzième valeurs de données ou:
(7 + 8) / 2 = 7,5.
La médiane de la moitié inférieure des données est le premier quartile. La moitié inférieure est:
1, 2, 2, 3, 4, 6, 6, 7, 7, 7
Ainsi, nous calculonsQ1= (4 + 6) / 2 = 5.
La médiane de la moitié supérieure de l'ensemble de données d'origine est le troisième quartile. Nous devons trouver la médiane de:
8, 11, 12, 15, 15, 15, 17, 17, 18, 20
Ainsi, nous calculonsQ3= (15 + 15) / 2 = 15.
Nous assemblons tous les résultats ci-dessus ensemble et signalons que le résumé à cinq chiffres pour l'ensemble de données ci-dessus est 1, 5, 7,5, 12, 20.
Cinq résumés numériques peuvent être comparés les uns aux autres. Nous constaterons que deux ensembles avec des moyennes et des écarts-types similaires peuvent avoir des résumés à cinq chiffres très différents. Pour comparer facilement deux résumés à cinq chiffres en un coup d'œil, nous pouvons utiliser un diagramme à boîte ou un graphique à boîte et à moustaches.