Médianes de distribution exponentielle

La médiane d'un ensemble de données est le point médian dans lequel exactement la moitié des valeurs de données sont inférieures ou égales à la médiane. De la même manière, nous pouvons penser à la médiane d'une distribution de probabilité continue, mais plutôt que de trouver la valeur moyenne dans un ensemble de données, nous trouvons le milieu de la distribution d'une manière différente.

La surface totale sous une fonction de densité de probabilité est 1, ce qui représente 100%, et par conséquent, la moitié de celle-ci peut être représentée par un demi ou 50 pour cent. L'une des grandes idées des statistiques mathématiques est que la probabilité est représentée par l'aire sous la courbe de la fonction de densité, qui est calculée par une intégrale, et donc la médiane d'une distribution continue est le point sur la droite réelle où exactement la moitié de la zone se trouve à gauche.

Cela peut être plus succinctement indiqué par l'intégrale incorrecte suivante. La médiane de la variable aléatoire continue X avec fonction densité F( X) est la valeur M telle que:

0,5 = ∫m − ∞f (x) dx0,5 = \ int_ m ^ - \ infty f (x) dx0,5 = ∫m − ∞ f (x) dx

Médiane pour la distribution exponentielle

Nous calculons maintenant la médiane de la distribution exponentielle Exp (A). Une variable aléatoire avec cette distribution a une fonction de densité F(X) = e-X/UNE/ A pour X tout nombre réel non négatif. La fonction contient également la constante mathématique e, environ égal à 2,71828.

Étant donné que la fonction de densité de probabilité est nulle pour toute valeur négative de X, tout ce que nous devons faire est d'intégrer ce qui suit et de résoudre pour M:

0,5 = ∫0M f (x) dx

Puisque l'intégrale ∫ e-X/UNE/Un dX = -e-X/UNE, le résultat est que

0,5 = -e-M / A + 1

Cela signifie que 0,5 = e-M / A et après avoir pris le logarithme naturel des deux côtés de l'équation, nous avons:

ln (1/2) = -M / A

Puisque 1/2 = 2-1, par propriétés des logarithmes nous écrivons:

- ln2 = -M / A

La multiplication des deux côtés par A nous donne le résultat que la médiane M = A ln2.

Inégalité moyenne médiane dans les statistiques 

Il convient de mentionner une conséquence de ce résultat: la moyenne de la distribution exponentielle Exp (A) est A, et comme ln2 est inférieur à 1, il s'ensuit que le produit Aln2 est inférieur à A. Cela signifie que la médiane de la distribution exponentielle est inférieur à la moyenne.

Cela a du sens si nous pensons au graphique de la fonction de densité de probabilité. En raison de la longue queue, cette distribution est asymétrique vers la droite. Plusieurs fois, quand une distribution est asymétrique vers la droite, la moyenne est à droite de la médiane.

Ce que cela signifie en termes d'analyse statistique, c'est que nous pouvons souvent prédire que la moyenne et la médiane ne sont pas directement corrélées étant donné la probabilité que les données soient biaisées vers la droite, ce qui peut être exprimé comme la preuve de l'inégalité moyenne médiane connue sous le nom d'inégalité de Tchebychev..

À titre d'exemple, considérons un ensemble de données qui postule qu'une personne reçoit un total de 30 visiteurs en 10 heures, où le temps d'attente moyen pour un visiteur est de 20 minutes, tandis que l'ensemble de données peut présenter que le temps d'attente médian serait quelque part entre 20 et 30 minutes si plus de la moitié de ces visiteurs sont venus dans les cinq premières heures.