Quelle est l'inégalité de Chebyshev?

L'inégalité de Chebyshev indique qu'au moins 1-1 /K2 des données d'un échantillon doivent relever de K écarts-types de la moyenne (ici K est un nombre réel positif supérieur à un).

Tout ensemble de données qui est normalement distribué ou sous la forme d'une courbe en cloche a plusieurs caractéristiques. L'un d'eux concerne la dispersion des données par rapport au nombre d'écarts-types par rapport à la moyenne. Dans une distribution normale, nous savons que 68% des données correspondent à un écart-type de la moyenne, 95% à deux écarts-types de la moyenne et environ 99% à moins de trois écarts-types de la moyenne.

Mais si l'ensemble de données n'est pas distribué sous la forme d'une courbe en cloche, une quantité différente pourrait se trouver à l'intérieur d'un écart-type. L'inégalité de Chebyshev fournit un moyen de savoir quelle fraction des données relève K écarts-types de la moyenne pour tout base de données.

Faits sur l'inégalité

On peut également énoncer l'inégalité ci-dessus en remplaçant l'expression «données d'un échantillon» par une distribution de probabilité. En effet, l'inégalité de Chebyshev est le résultat de la probabilité, qui peut ensuite être appliquée aux statistiques.

Il est important de noter que cette inégalité est un résultat qui a été prouvé mathématiquement. Ce n'est pas comme la relation empirique entre la moyenne et le mode, ou la règle empirique qui relie la plage et l'écart-type.

Illustration de l'inégalité

Pour illustrer l'inégalité, nous allons l'examiner pour quelques valeurs de K:

  • Pour K = 2 nous avons 1 - 1 /K2 = 1 - 1/4 = 3/4 = 75%. Donc, l'inégalité de Chebyshev dit qu'au moins 75% des valeurs de données de toute distribution doivent être dans les deux écarts-types de la moyenne.
  • Pour K = 3 nous avons 1 - 1 /K2 = 1 - 1/9 = 8/9 = 89%. Ainsi, l'inégalité de Chebyshev dit qu'au moins 89% des valeurs de données de toute distribution doivent être dans les trois écarts-types de la moyenne.
  • Pour K = 4 nous avons 1 - 1 /K2 = 1 - 1/16 = 15/16 = 93,75%. Ainsi, l'inégalité de Chebyshev dit qu'au moins 93,75% des valeurs de données de toute distribution doivent se situer dans les deux écarts-types de la moyenne.

Exemple

Supposons que nous ayons échantillonné les poids des chiens dans le refuge pour animaux local et constaté que notre échantillon a une moyenne de 20 livres avec un écart-type de 3 livres. Avec l'utilisation de l'inégalité de Chebyshev, nous savons qu'au moins 75% des chiens que nous avons échantillonnés ont des poids qui sont deux écarts-types de la moyenne. Deux fois l'écart-type nous donne 2 x 3 = 6. Soustrayez et ajoutez ceci de la moyenne de 20. Cela nous indique que 75% des chiens ont un poids de 14 livres à 26 livres.

Utilisation de l'inégalité

Si nous en savons plus sur la distribution avec laquelle nous travaillons, nous pouvons généralement garantir que davantage de données sont à un certain nombre d'écarts-types de la moyenne. Par exemple, si nous savons que nous avons une distribution normale, alors 95% des données sont deux écarts-types de la moyenne. L'inégalité de Chebyshev dit que dans cette situation, nous savons que au moins 75% des données correspondent à deux écarts-types de la moyenne. Comme nous pouvons le voir dans ce cas, cela pourrait être bien plus que ce 75%.

La valeur de l'inégalité est qu'elle nous donne un scénario du «pire des cas» dans lequel les seules choses que nous savons sur nos données d'échantillon (ou distribution de probabilité) sont la moyenne et l'écart-type. Lorsque nous ne savons rien d'autre sur nos données, l'inégalité de Chebyshev fournit un aperçu supplémentaire de la répartition de l'ensemble de données..

Histoire de l'inégalité

L'inégalité doit son nom au mathématicien russe Pafnuty Chebyshev, qui a déclaré l'inégalité pour la première fois sans preuve en 1874. Dix ans plus tard, l'inégalité a été prouvée par Markov dans son doctorat. thèse. En raison des différences dans la façon de représenter l'alphabet russe en anglais, il est également orthographié Chebyshev comme Tchebysheff.