La probabilité et les statistiques sont deux sujets mathématiques étroitement liés. Les deux utilisent la même terminologie et il existe de nombreux points de contact entre les deux. Il est très fréquent de ne voir aucune distinction entre les concepts de probabilité et les concepts statistiques. Plusieurs fois, le matériel de ces deux sujets est regroupé sous le titre «probabilité et statistiques», sans chercher à séparer les sujets de quelle discipline. Malgré ces pratiques et le terrain d'entente des sujets, ils sont distincts. Quelle est la différence entre la probabilité et les statistiques?
La principale différence entre la probabilité et les statistiques est liée à la connaissance. Par cela, nous nous référons à quels sont les faits connus lorsque nous abordons un problème. Inhérente à la fois à la probabilité et aux statistiques est une population, composée de chaque individu que nous sommes intéressés à étudier, et un échantillon, composé des individus qui sont sélectionnés dans la population.
Un problème de probabilité commencerait par que nous sachions tout sur la composition d'une population, puis nous demanderions: «Quelle est la probabilité qu'une sélection ou un échantillon de la population présente certaines caractéristiques?»
Nous pouvons voir la différence entre la probabilité et les statistiques en pensant à un tiroir de chaussettes. Nous avons peut-être un tiroir avec 100 chaussettes. Selon notre connaissance des chaussettes, nous pourrions avoir un problème de statistique ou un problème de probabilité.
Si nous savons qu'il y a 30 chaussettes rouges, 20 chaussettes bleues et 50 chaussettes noires, alors nous pouvons utiliser la probabilité pour répondre aux questions sur la composition d'un échantillon aléatoire de ces chaussettes. Les questions de ce type seraient:
Si au lieu de cela, nous n'avons aucune connaissance des types de chaussettes dans le tiroir, alors nous entrons dans le domaine des statistiques. Les statistiques nous aident à déduire les propriétés de la population sur la base d'un échantillon aléatoire. Les questions de nature statistique seraient:
Bien sûr, les probabilités et les statistiques ont beaucoup en commun. En effet, les statistiques sont construites sur la base de la probabilité. Bien que nous ne disposions généralement pas d'informations complètes sur une population, nous pouvons utiliser des théorèmes et des résultats de probabilité pour arriver à des résultats statistiques. Ces résultats nous renseignent sur la population.
Tout cela sous-tend l'hypothèse selon laquelle nous avons affaire à des processus aléatoires. C'est pourquoi nous avons souligné que la procédure d'échantillonnage que nous avons utilisée avec le tiroir à chaussettes était aléatoire. Si nous ne disposons pas d'un échantillon aléatoire, nous ne construisons plus sur des hypothèses qui sont présentes dans la probabilité.
La probabilité et les statistiques sont étroitement liées, mais il existe des différences. Si vous avez besoin de savoir quelles méthodes sont appropriées, demandez-vous simplement ce que vous savez.