Différences entre la probabilité et les statistiques

La probabilité et les statistiques sont deux sujets mathématiques étroitement liés. Les deux utilisent la même terminologie et il existe de nombreux points de contact entre les deux. Il est très fréquent de ne voir aucune distinction entre les concepts de probabilité et les concepts statistiques. Plusieurs fois, le matériel de ces deux sujets est regroupé sous le titre «probabilité et statistiques», sans chercher à séparer les sujets de quelle discipline. Malgré ces pratiques et le terrain d'entente des sujets, ils sont distincts. Quelle est la différence entre la probabilité et les statistiques?

Ce qui est connu

La principale différence entre la probabilité et les statistiques est liée à la connaissance. Par cela, nous nous référons à quels sont les faits connus lorsque nous abordons un problème. Inhérente à la fois à la probabilité et aux statistiques est une population, composée de chaque individu que nous sommes intéressés à étudier, et un échantillon, composé des individus qui sont sélectionnés dans la population.

Un problème de probabilité commencerait par que nous sachions tout sur la composition d'une population, puis nous demanderions: «Quelle est la probabilité qu'une sélection ou un échantillon de la population présente certaines caractéristiques?»

Exemple

Nous pouvons voir la différence entre la probabilité et les statistiques en pensant à un tiroir de chaussettes. Nous avons peut-être un tiroir avec 100 chaussettes. Selon notre connaissance des chaussettes, nous pourrions avoir un problème de statistique ou un problème de probabilité.

Si nous savons qu'il y a 30 chaussettes rouges, 20 chaussettes bleues et 50 chaussettes noires, alors nous pouvons utiliser la probabilité pour répondre aux questions sur la composition d'un échantillon aléatoire de ces chaussettes. Les questions de ce type seraient:

  • "Quelle est la probabilité que nous tirions deux chaussettes bleues et deux chaussettes rouges du tiroir?"
  • "Quelle est la probabilité que nous sortions 3 chaussettes et ayons une paire assortie?"
  • "Quelle est la probabilité que nous dessinions cinq chaussettes, avec remplacement, et elles sont toutes noires?"

Si au lieu de cela, nous n'avons aucune connaissance des types de chaussettes dans le tiroir, alors nous entrons dans le domaine des statistiques. Les statistiques nous aident à déduire les propriétés de la population sur la base d'un échantillon aléatoire. Les questions de nature statistique seraient:

  • Un échantillonnage aléatoire de dix chaussettes du tiroir a produit une chaussette bleue, quatre chaussettes rouges et cinq chaussettes noires. Quelle est la proportion totale de chaussettes noires, bleues et rouges dans le tiroir?
  • Nous échantillonnons au hasard dix chaussettes du tiroir, notons le nombre de chaussettes noires, puis remettons les chaussettes dans le tiroir. Ce processus est effectué cinq fois. Le nombre moyen de chaussettes pour chacun de ces essais est de 7. Quel est le nombre réel de chaussettes noires dans le tiroir?

Point en commun

Bien sûr, les probabilités et les statistiques ont beaucoup en commun. En effet, les statistiques sont construites sur la base de la probabilité. Bien que nous ne disposions généralement pas d'informations complètes sur une population, nous pouvons utiliser des théorèmes et des résultats de probabilité pour arriver à des résultats statistiques. Ces résultats nous renseignent sur la population.

Tout cela sous-tend l'hypothèse selon laquelle nous avons affaire à des processus aléatoires. C'est pourquoi nous avons souligné que la procédure d'échantillonnage que nous avons utilisée avec le tiroir à chaussettes était aléatoire. Si nous ne disposons pas d'un échantillon aléatoire, nous ne construisons plus sur des hypothèses qui sont présentes dans la probabilité.

La probabilité et les statistiques sont étroitement liées, mais il existe des différences. Si vous avez besoin de savoir quelles méthodes sont appropriées, demandez-vous simplement ce que vous savez.