Les distributions de données et les distributions de probabilité ne sont pas toutes de la même forme. Certains sont asymétriques et asymétriques à gauche ou à droite. D'autres distributions sont bimodales et ont deux pics. Une autre caractéristique à considérer lorsque l'on parle d'une distribution est la forme des queues de la distribution à l'extrême gauche et à l'extrême droite. La kurtosis est la mesure de l'épaisseur ou de la lourdeur des queues d'une distribution. Le kurtosis d'une distribution est dans l'une des trois catégories de classification:
Nous examinerons tour à tour chacune de ces classifications. Notre examen de ces catégories ne sera pas aussi précis que nous le serions si nous utilisions la définition mathématique technique de la kurtosis.
La kurtosis est généralement mesurée par rapport à la distribution normale. Une distribution qui a des queues en forme à peu près de la même manière que toute distribution normale, et pas seulement la distribution normale standard, est dite mésokurtique. Le kurtosis d'une distribution mésokurtique n'est ni élevé ni faible, il est plutôt considéré comme une référence pour les deux autres classifications.
Outre les distributions normales, les distributions binomiales pour lesquelles p est proche de 1/2 sont considérés comme mésokurtiques.
Une distribution leptokurtic est celle qui a une kurtosis supérieure à une distribution mésokurtic. Les distributions leptokurtiques sont parfois identifiées par des pics fins et hauts. Les queues de ces distributions, à droite comme à gauche, sont épaisses et lourdes. Les distributions leptokurtiques sont nommées par le préfixe "lepto" qui signifie "maigre".
Il existe de nombreux exemples de distributions leptokurtiques. L'une des distributions leptokurtiques les plus connues est la distribution t de Student.
La troisième classification de kurtosis est platykurtic. Les distributions platykurtiques sont celles qui ont des queues élancées. Plusieurs fois, ils possèdent un pic inférieur à une distribution méso-catalytique. Le nom de ces types de distributions vient de la signification du préfixe "platy" qui signifie "large".
Toutes les distributions uniformes sont platykurtiques. En plus de cela, la distribution de probabilité discrète à partir d'un seul flip d'une pièce est platykurtic.
Ces classifications de kurtosis sont encore quelque peu subjectives et qualitatives. Bien que nous puissions voir qu'une distribution a des queues plus épaisses qu'une distribution normale, que faire si nous n'avons pas le graphique d'une distribution normale avec lequel comparer? Et si nous voulons dire qu'une distribution est plus leptokurtic qu'une autre?
Pour répondre à ce genre de questions, nous avons besoin non seulement d'une description qualitative de la kurtosis, mais d'une mesure quantitative. La formule utilisée est μ4/ σ4 où μ4 est le quatrième moment de Pearson sur la moyenne et le sigma est l'écart-type.
Maintenant que nous avons un moyen de calculer le kurtosis, nous pouvons comparer les valeurs obtenues plutôt que les formes. La distribution normale se révèle avoir un kurtosis de trois. Cela devient maintenant notre base pour les distributions méso-catalytiques. Une distribution avec kurtosis supérieur à trois est leptokurtic et une distribution avec kurtosis moins de trois est platykurtic.
Puisque nous traitons une distribution méso-catalytique comme une ligne de base pour nos autres distributions, nous pouvons soustraire trois de notre calcul standard pour kurtosis. La formule μ4/ σ4 - 3 est la formule de l'excès de kurtosis. On pourrait alors classer une distribution à partir de son excès de kurtosis: