Distribution des probabilités dans les statistiques

Si vous passez beaucoup de temps à traiter des statistiques, vous rencontrez très vite l'expression «distribution de probabilité». C'est ici que nous pouvons vraiment voir à quel point les domaines de probabilité et les statistiques se chevauchent. Bien que cela puisse sembler quelque chose de technique, l'expression distribution des probabilités n'est vraiment qu'un moyen de parler de l'organisation d'une liste de probabilités. Une distribution de probabilité est une fonction ou une règle qui attribue des probabilités à chaque valeur d'une variable aléatoire. La distribution peut dans certains cas être répertoriée. Dans d'autres cas, il est présenté sous forme de graphique.

Exemple

Supposons que nous lançons deux dés, puis enregistrons la somme des dés. Des sommes allant de deux à 12 sont possibles. Chaque somme a une probabilité particulière de se produire. Nous pouvons simplement les énumérer comme suit:

  • La somme de 2 a une probabilité de 1/36
  • La somme de 3 a une probabilité de 2/36
  • La somme de 4 a une probabilité de 3/36
  • La somme de 5 a une probabilité de 4/36
  • La somme de 6 a une probabilité de 5/36
  • La somme de 7 a une probabilité de 6/36
  • La somme de 8 a une probabilité de 5/36
  • La somme de 9 a une probabilité de 4/36
  • La somme de 10 a une probabilité de 3/36
  • La somme de 11 a une probabilité de 2/36
  • La somme de 12 a une probabilité de 1/36

Cette liste est une distribution de probabilité pour l'expérience de probabilité de lancer deux dés. Nous pouvons également considérer ce qui précède comme une distribution de probabilité de la variable aléatoire définie en regardant la somme des deux dés.

Graphique

Une distribution de probabilité peut être représentée graphiquement, et parfois cela aide à nous montrer des caractéristiques de la distribution qui n'étaient pas apparentes à la simple lecture de la liste des probabilités. La variable aléatoire est tracée le long de la X-axe, et la probabilité correspondante est tracée le long de la y-axe. Pour une variable aléatoire discrète, nous aurons un histogramme. Pour une variable aléatoire continue, nous aurons l'intérieur d'une courbe lisse.

Les règles de probabilité sont toujours en vigueur et se manifestent de plusieurs manières. Comme les probabilités sont supérieures ou égales à zéro, le graphique d'une distribution de probabilité doit avoir y-coordonnées non négatives. Une autre caractéristique des probabilités, à savoir que l'une est le maximum que peut être la probabilité d'un événement, apparaît d'une autre manière.

Zone = Probabilité

Le graphique d'une distribution de probabilité est construit de telle manière que les zones représentent des probabilités. Pour une distribution de probabilité discrète, nous calculons simplement les aires des rectangles. Dans le graphique ci-dessus, les zones des trois barres correspondant à quatre, cinq et six correspondent à la probabilité que la somme de nos dés soit de quatre, cinq ou six. Les zones de toutes les barres totalisent un total.

Dans la distribution normale standard ou courbe en cloche, nous avons une situation similaire. L'aire sous la courbe entre deux z correspond à la probabilité que notre variable se situe entre ces deux valeurs. Par exemple, l'aire sous la courbe en cloche pour -1 z.

Distributions importantes

Il existe littéralement une infinité de distributions de probabilité. Une liste de certaines des distributions les plus importantes suit:

  • Distribution binomiale - Donne le nombre de succès pour une série d'expériences indépendantes avec deux résultats
  • Distribution du chi carré - Pour déterminer la proximité des quantités observées avec un modèle proposé
  • Distribution F - Utilisé dans l'analyse de variance (ANOVA)
  • Distribution normale - Appelé la courbe en cloche et se retrouve dans toutes les statistiques.
  • Distribution t de l'étudiant - Pour une utilisation avec de petits échantillons à partir d'une distribution normale