Les premier et troisième quartiles sont des statistiques descriptives qui sont des mesures de position dans un ensemble de données. Comme pour la médiane du point médian d'un ensemble de données, le premier quartile marque le quart ou 25%. Environ 25% des valeurs des données sont inférieures ou égales au premier quartile. Le troisième quartile est similaire, mais pour les 25% supérieurs des valeurs de données. Nous examinerons ces idées plus en détail dans ce qui suit.
Il existe plusieurs façons de mesurer le centre d'un ensemble de données. La moyenne, la médiane, le mode et le milieu de gamme ont tous leurs avantages et leurs limites à exprimer le milieu des données. De toutes ces façons de trouver la moyenne, la médiane est la plus résistante aux valeurs aberrantes. Il marque le milieu des données dans le sens où la moitié des données est inférieure à la médiane.
Il n'y a aucune raison que nous devons nous arrêter à trouver juste le milieu. Et si nous décidions de poursuivre ce processus? Nous avons pu calculer la médiane de la moitié inférieure de nos données. Une moitié de 50% est de 25%. Ainsi, la moitié de la moitié, ou le quart, des données seraient inférieures à cette valeur. Étant donné que nous traitons un quart de l'ensemble d'origine, cette médiane de la moitié inférieure des données est appelée le premier quartile et est notée par Q1.
Il n'y a aucune raison pour laquelle nous avons examiné la moitié inférieure des données. Au lieu de cela, nous aurions pu regarder la moitié supérieure et effectuer les mêmes étapes que ci-dessus. La médiane de cette moitié, que nous désignerons par Q3 divise également l'ensemble de données en trimestres. Cependant, ce nombre représente le quart supérieur des données. Ainsi, les trois quarts des données sont inférieures à notre nombre Q3. C’est pourquoi nous appelons Q3 le troisième quartile.
Pour que tout soit clair, regardons un exemple. Il peut être utile d'examiner d'abord comment calculer la médiane de certaines données. Commencez avec l'ensemble de données suivant:
1, 2, 2, 3, 4, 6, 6, 7, 7, 7, 8, 11, 12, 15, 15, 15, 17, 17, 18, 20
Il y a un total de vingt points de données dans l'ensemble. Nous commençons par trouver la médiane. Puisqu'il existe un nombre pair de valeurs de données, la médiane est la moyenne des dixième et onzième valeurs. En d'autres termes, la médiane est:
(7 + 8) / 2 = 7,5.
Regardez maintenant la moitié inférieure des données. La médiane de cette moitié se situe entre les cinquième et sixième valeurs de:
1, 2, 2, 3, 4, 6, 6, 7, 7, 7
Ainsi, le premier quartile est égal à Q1 = (4 + 6) / 2 = 5
Pour trouver le troisième quartile, regardez la moitié supérieure de l'ensemble de données d'origine. Nous devons trouver la médiane de:
8, 11, 12, 15, 15, 15, 17, 17, 18, 20
Ici la médiane est (15 + 15) / 2 = 15. Ainsi le troisième quartile Q3 = 15.
Les quartiles aident à nous donner une image plus complète de notre ensemble de données dans son ensemble. Les premier et troisième quartiles nous renseignent sur la structure interne de nos données. La moitié médiane des données se situe entre les premier et troisième quartiles et est centrée sur la médiane. La différence entre le premier et le troisième quartile, appelée plage interquartile, montre comment les données sont organisées sur la médiane. Une petite plage interquartile indique des données regroupées autour de la médiane. Une plage interquartile plus large montre que les données sont plus étalées.
Une image plus détaillée des données peut être obtenue en connaissant la valeur la plus élevée, appelée valeur maximale, et la valeur la plus basse, appelée valeur minimale. Le minimum, le premier quartile, la médiane, le troisième quartile et le maximum sont un ensemble de cinq valeurs appelées le résumé à cinq chiffres. Un moyen efficace d'afficher ces cinq nombres est appelé un diagramme à boîtes ou un diagramme à moustaches et à moustaches.