Un histogramme est un type de graphique qui a de larges applications en statistique. Les histogrammes fournissent une interprétation visuelle des données numériques en indiquant le nombre de points de données qui se trouvent dans une plage de valeurs. Ces plages de valeurs sont appelées classes ou bacs. La fréquence des données qui tombent dans chaque classe est représentée par l'utilisation d'une barre. Plus la barre est haute, plus la fréquence des valeurs de données dans ce bac est élevée.
À première vue, les histogrammes ressemblent beaucoup aux graphiques à barres. Les deux graphiques utilisent des barres verticales pour représenter les données. La hauteur d'une barre correspond à la fréquence relative de la quantité de données dans la classe. Plus la barre est haute, plus la fréquence des données est élevée. Plus la barre est basse, plus la fréquence des données est faible. Mais les apparences peuvent être trompeuses. C'est ici que s'arrêtent les similitudes entre les deux types de graphes.
La raison pour laquelle ces types de graphiques sont différents est liée au niveau de mesure des données. D'une part, des graphiques à barres sont utilisés pour les données au niveau nominal de mesure. Les graphiques à barres mesurent la fréquence des données catégorielles, et les classes d'un graphique à barres sont ces catégories. D'un autre côté, les histogrammes sont utilisés pour des données qui sont au moins au niveau ordinale de mesure. Les classes d'un histogramme sont des plages de valeurs.
Une autre différence clé entre les graphiques à barres et les histogrammes est liée à l'ordre des barres. Dans un graphique à barres, il est courant de réorganiser les barres par ordre décroissant de hauteur. Cependant, les barres d'un histogramme ne peuvent pas être réorganisées. Ils doivent être affichés dans l'ordre où les classes se produisent.
Le diagramme ci-dessus nous montre un histogramme. Supposons que quatre pièces soient retournées et que les résultats soient enregistrés. L'utilisation de la table de distribution binomiale appropriée ou de calculs simples avec la formule binomiale montre que la probabilité qu'aucune tête ne montre est 1/16, la probabilité qu'une tête montre est 4/16. La probabilité de deux têtes est de 6/16. La probabilité de trois têtes est de 4/16. La probabilité de quatre têtes est de 1/16.
Nous construisons un total de cinq classes, chacune de largeur un. Ces classes correspondent au nombre de têtes possibles: zéro, un, deux, trois ou quatre. Au-dessus de chaque classe, nous dessinons une barre verticale ou un rectangle. Les hauteurs de ces barres correspondent aux probabilités mentionnées pour notre expérience de probabilité de lancer quatre pièces et de compter les têtes.
L'exemple ci-dessus montre non seulement la construction d'un histogramme, mais il montre également que des distributions de probabilité discrètes peuvent être représentées avec un histogramme. En effet, une distribution de probabilité discrète peut être représentée par un histogramme.
Pour construire un histogramme qui représente une distribution de probabilité, nous commençons par sélectionner les classes. Ce devraient être les résultats d'une expérience de probabilité. La largeur de chacune de ces classes doit être d'une unité. Les hauteurs des barres de l'histogramme sont les probabilités pour chacun des résultats. Avec un histogramme construit de cette manière, les zones des barres sont également des probabilités.
Étant donné que ce type d'histogramme nous donne des probabilités, il est soumis à quelques conditions. Une stipulation est que seuls des nombres non négatifs peuvent être utilisés pour l'échelle qui nous donne la hauteur d'une barre donnée de l'histogramme. Une deuxième condition est que, puisque la probabilité est égale à la surface, toutes les surfaces des barres doivent totaliser une, équivalant à 100%.
Les barres d'un histogramme n'ont pas besoin d'être des probabilités. Les histogrammes sont utiles dans des domaines autres que la probabilité. Chaque fois que nous souhaitons comparer la fréquence d'apparition de données quantitatives, un histogramme peut être utilisé pour représenter notre ensemble de données.