Histogrammes de fréquence relative

En statistiques, il existe de nombreux termes qui ont des distinctions subtiles entre eux. Un exemple de ceci est la différence entre la fréquence et la fréquence relative. Bien qu'il existe de nombreuses utilisations pour les fréquences relatives, il y en a une en particulier qui implique un histogramme de fréquence relative. Il s'agit d'un type de graphique qui a des liens avec d'autres sujets en statistiques et statistiques mathématiques.

Définition

Les histogrammes sont des graphiques statistiques qui ressemblent à des graphiques à barres. Cependant, le terme histogramme est généralement réservé aux variables quantitatives. L'axe horizontal d'un histogramme est une droite numérique contenant des classes ou des bacs de longueur uniforme. Ces cases sont des intervalles d'une droite numérique où les données peuvent tomber et peuvent être constituées d'un seul nombre (généralement pour les ensembles de données discrets qui sont relativement petits) ou d'une plage de valeurs (pour les ensembles de données discrets plus grands et les données continues).

Par exemple, nous pouvons être intéressés à considérer la distribution des scores sur un quiz de 50 points pour une classe d'élèves. Une façon possible de construire les bacs serait d'avoir un bac différent pour tous les 10 points.

L'axe vertical d'un histogramme représente le nombre ou la fréquence à laquelle une valeur de données se produit dans chacun des casiers. Plus la barre est haute, plus les valeurs de données tombent dans cette plage de valeurs de bac. Pour revenir à notre exemple, si nous avons cinq élèves qui ont marqué plus de 40 points au quiz, alors la barre correspondant au bac de 40 à 50 sera de cinq unités de haut.

Comparaison de l'histogramme de fréquence

Un histogramme de fréquence relative est une modification mineure d'un histogramme de fréquence typique. Plutôt que d'utiliser un axe vertical pour le nombre de valeurs de données qui tombent dans un bac donné, nous utilisons cet axe pour représenter la proportion globale des valeurs de données qui tombent dans ce bac. Puisque 100% = 1, toutes les barres doivent avoir une hauteur de 0 à 1. De plus, les hauteurs de toutes les barres de notre histogramme de fréquence relative doivent totaliser 1.

Ainsi, dans l'exemple courant que nous avons examiné, supposons qu'il y ait 25 élèves dans notre classe et cinq ont obtenu plus de 40 points. Plutôt que de construire une barre de hauteur cinq pour ce bac, nous aurions une barre de hauteur 5/25 = 0,2.

En comparant un histogramme à un histogramme de fréquence relative, chacun avec les mêmes cases, nous remarquerons quelque chose. La forme globale des histogrammes sera identique. Un histogramme de fréquence relative ne met pas l'accent sur les comptes globaux dans chaque casier. Au lieu de cela, ce type de graphique se concentre sur la relation entre le nombre de valeurs de données dans le bac et les autres bacs. La façon dont il montre cette relation est en pourcentage du nombre total de valeurs de données.

Fonctions de masse de probabilité

On peut se demander à quoi sert de définir un histogramme de fréquence relative. Une application clé concerne les variables aléatoires discrètes où nos casiers sont de largeur un et sont centrés sur chaque entier non négatif. Dans ce cas, nous pouvons définir une fonction par morceaux avec des valeurs correspondant aux hauteurs verticales des barres dans notre histogramme de fréquence relative.

Ce type de fonction est appelé fonction de masse de probabilité. La raison de la construction de la fonction de cette manière est que la courbe définie par la fonction a un lien direct avec la probabilité. La zone sous la courbe à partir des valeurs une à b est la probabilité que la variable aléatoire ait une valeur de une à b.

Le lien entre la probabilité et l'aire sous la courbe est celui qui apparaît à plusieurs reprises dans les statistiques mathématiques. L'utilisation d'une fonction de masse de probabilité pour modéliser un histogramme de fréquence relative est une autre de ces connexions.