Un histogramme est un type de graphique utilisé dans les statistiques. Ce type de graphique utilise des barres verticales pour afficher des données quantitatives. Les hauteurs des barres indiquent les fréquences ou fréquences relatives des valeurs dans notre ensemble de données.
Bien que n'importe quel logiciel de base puisse construire un histogramme, il est important de savoir ce que fait votre ordinateur dans les coulisses lorsqu'il produit un histogramme. Les étapes suivantes décrivent les étapes utilisées pour construire un histogramme. Avec ces étapes, nous pourrions construire un histogramme à la main.
Avant de dessiner notre histogramme, il y a quelques préliminaires que nous devons faire. L'étape initiale implique des statistiques sommaires de base de notre ensemble de données.
Premièrement, nous trouvons la valeur de données la plus élevée et la plus basse dans l'ensemble de données. À partir de ces nombres, la plage peut être calculée en soustrayant la valeur minimale de la valeur maximale. Nous utilisons ensuite la plage pour déterminer la largeur de nos classes. Il n'y a pas de règle d'ensemble, mais à titre indicatif, la plage doit être divisée par cinq pour les petits ensembles de données et 20 pour les grands ensembles. Ces nombres donneront une largeur de classe ou une largeur de bac. Nous devrons peut-être arrondir ce nombre et / ou faire preuve de bon sens.
Une fois la largeur de la classe déterminée, nous choisissons une classe qui inclura la valeur de données minimale. Nous utilisons ensuite notre largeur de classe pour produire les classes suivantes, s'arrêtant lorsque nous avons produit une classe qui inclut la valeur de données maximale.
Maintenant que nous avons déterminé nos classes, l'étape suivante consiste à faire un tableau des fréquences. Commencez par une colonne qui répertorie les classes dans l'ordre croissant. La colonne suivante devrait avoir un décompte pour chacune des classes. La troisième colonne concerne le nombre ou la fréquence des données dans chaque classe. La dernière colonne concerne la fréquence relative de chaque classe. Cela indique quelle proportion des données se trouve dans cette classe particulière.
Maintenant que nous avons organisé nos données par classes, nous sommes prêts à dessiner notre histogramme.