L'approximation normale de la distribution binomiale

Les variables aléatoires avec une distribution binomiale sont connues pour être discrètes. Cela signifie qu'il existe un nombre dénombrable de résultats pouvant survenir dans une distribution binomiale, avec une séparation entre ces résultats. Par exemple, une variable binomiale peut prendre une valeur de trois ou quatre, mais pas un nombre compris entre trois et quatre.

Avec le caractère discret d'une distribution binomiale, il est quelque peu surprenant qu'une variable aléatoire continue puisse être utilisée pour approximer une distribution binomiale. Pour de nombreuses distributions binomiales, nous pouvons utiliser une distribution normale pour approximer nos probabilités binomiales.

Cela peut être vu en regardant n lancer de pièces et location X être le nombre de têtes. Dans cette situation, nous avons une distribution binomiale avec une probabilité de succès p = 0,5. À mesure que nous augmentons le nombre de lancers, nous constatons que l'histogramme de probabilité ressemble de plus en plus à une distribution normale.

Énoncé de l'approximation normale

Chaque distribution normale est complètement définie par deux nombres réels. Ces nombres sont la moyenne, qui mesure le centre de la distribution, et l'écart type, qui mesure la propagation de la distribution. Pour une situation binomiale donnée, nous devons être en mesure de déterminer la distribution normale à utiliser.

La sélection de la distribution normale correcte est déterminée par le nombre d'essais n dans le cadre binomial et la probabilité constante de succès p pour chacun de ces essais. L'approximation normale de notre variable binomiale est une moyenne de np et un écart type de (np(1 - p)^0,5.

Par exemple, supposons que nous avons deviné sur chacune des 100 questions d'un test à choix multiple, où chaque question avait une réponse correcte sur quatre choix. Le nombre de bonnes réponses X est une variable aléatoire binomiale avec n = 100 et p = 0,25. Ainsi, cette variable aléatoire a une moyenne de 100 (0,25) = 25 et un écart-type de (100 (0,25) (0,75))^0,5 = 4,33. Une distribution normale avec une moyenne de 25 et un écart type de 4,33 fonctionnera pour approximer cette distribution binomiale.

Quand l'approximation est-elle appropriée??

En utilisant quelques mathématiques, il peut être démontré qu'il existe quelques conditions que nous devons utiliser une approximation normale de la distribution binomiale. Le nombre d'observations n doit être suffisamment grand et la valeur de p de sorte que les deux np et n(1 - p) sont supérieurs ou égaux à 10. Il s'agit d'une règle d'or, qui est guidée par la pratique statistique. L'approximation normale peut toujours être utilisée, mais si ces conditions ne sont pas remplies, l'approximation peut ne pas être aussi bonne qu'une approximation.

Par exemple, si n = 100 et p = 0,25 alors nous sommes justifiés d'utiliser l'approximation normale. Ceci est dû au fait np = 25 et n(1 - p) = 75. Étant donné que ces deux nombres sont supérieurs à 10, la distribution normale appropriée fera un assez bon travail d'estimation des probabilités binomiales.

Pourquoi utiliser l'approximation?

Les probabilités binomiales sont calculées en utilisant une formule très simple pour trouver le coefficient binomial. Malheureusement, en raison des factorielles de la formule, il peut être très facile de rencontrer des difficultés de calcul avec la formule binomiale. L'approximation normale nous permet de contourner n'importe lequel de ces problèmes en travaillant avec un ami familier, une table de valeurs d'une distribution normale standard.

Plusieurs fois, la détermination d'une probabilité qu'une variable aléatoire binomiale tombe dans une plage de valeurs est fastidieuse à calculer. En effet, pour trouver la probabilité qu'une variable binomiale X est supérieur à 3 et inférieur à 10, il faudrait trouver la probabilité que X est égal à 4, 5, 6, 7, 8 et 9, puis additionnez toutes ces probabilités ensemble. Si l'approximation normale peut être utilisée, nous devrons plutôt déterminer les scores z correspondant à 3 et 10, puis utiliser un tableau de probabilités z pour la distribution normale standard..

Science