Une distribution normale de données est une distribution dans laquelle la majorité des points de données sont relativement similaires, ce qui signifie qu'ils se produisent dans une petite plage de valeurs avec moins de valeurs aberrantes aux extrémités hautes et basses de la plage de données.
Lorsque les données sont normalement distribuées, leur traçage sur un graphique donne une image en forme de cloche et symétrique souvent appelée courbe en cloche. Dans une telle distribution de données, la moyenne, la médiane et le mode ont tous la même valeur et coïncident avec le pic de la courbe.
Cependant, en sciences sociales, une distribution normale est plus un idéal théorique qu'une réalité commune. Le concept et son application en tant que lentille à travers laquelle examiner les données est à travers un outil utile pour identifier et visualiser les normes et les tendances au sein d'un ensemble de données.
L'une des caractéristiques les plus remarquables d'une distribution normale est sa forme et sa symétrie parfaite. Si vous pliez une image d'une distribution normale exactement au milieu, vous obtiendrez deux moitiés égales, chacune une image miroir de l'autre. Cela signifie également que la moitié des observations dans les données se situe de part et d'autre du milieu de la distribution.
Le point médian d'une distribution normale est le point qui a la fréquence maximale, c'est-à-dire le nombre ou la catégorie de réponse avec le plus d'observations pour cette variable. Le point médian de la distribution normale est également le point où tombent trois mesures: la moyenne, la médiane et le mode. Dans une distribution parfaitement normale, ces trois mesures sont toutes du même nombre.
Dans toutes les distributions normales ou presque normales, il existe une proportion constante de l'aire sous la courbe située entre la moyenne et toute distance donnée de la moyenne lorsqu'elle est mesurée en unités d'écart type. Par exemple, dans toutes les courbes normales, 99,73% de tous les cas se situent dans les trois écarts-types de la moyenne, 95,45% de tous les cas se situent dans les deux écarts-types de la moyenne et 68,27% des cas se situent dans un écart-type de la moyenne.
Les distributions normales sont souvent représentées par des scores standard ou des scores Z, qui sont des nombres qui nous indiquent la distance entre un score réel et la moyenne en termes d'écarts-types. La distribution normale standard a une moyenne de 0,0 et un écart type de 1,0.
Même si une distribution normale est théorique, plusieurs variables étudiées par les chercheurs ressemblent étroitement à une courbe normale. Par exemple, les résultats aux tests standardisés tels que SAT, ACT et GRE ressemblent généralement à une distribution normale. La taille, la capacité athlétique et les nombreuses attitudes sociales et politiques d'une population donnée ressemblent généralement à une courbe en cloche.
L'idéal d'une distribution normale est également utile comme point de comparaison lorsque les données ne sont pas normalement distribuées. Par exemple, la plupart des gens supposent que la distribution du revenu des ménages aux États-Unis serait une distribution normale et ressemblerait à la courbe en cloche lorsqu'elle est tracée sur un graphique. Cela signifierait que la plupart des citoyens américains gagnent dans la moyenne des revenus, ou en d'autres termes, qu'il existe une classe moyenne saine. Pendant ce temps, le nombre de ceux des classes économiques inférieures serait faible, tout comme le seraient les chiffres des classes supérieures. Cependant, la répartition réelle du revenu des ménages aux États-Unis ne ressemble pas du tout à une courbe en cloche. La majorité des ménages se situent dans la fourchette basse à moyenne inférieure, ce qui signifie qu'il y a plus de pauvres qui luttent pour survivre que de gens vivant une vie confortable de la classe moyenne. Dans ce cas, l'idéal d'une distribution normale est utile pour illustrer l'inégalité des revenus.