Méthodes paramétriques et non paramétriques en statistiques

Il existe quelques divisions de sujets dans les statistiques. Une division qui vient rapidement à l'esprit est la différenciation entre les statistiques descriptives et inférentielles. Il existe d'autres façons de séparer la discipline des statistiques. L'une de ces méthodes consiste à classer les méthodes statistiques comme paramétriques ou non paramétriques.

Nous découvrirons quelle est la différence entre les méthodes paramétriques et les méthodes non paramétriques. La façon dont nous allons le faire est de comparer différentes instances de ces types de méthodes.

Méthodes paramétriques

Les méthodes sont classées selon ce que nous savons de la population que nous étudions. Les méthodes paramétriques sont généralement les premières méthodes étudiées dans un cours d'introduction à la statistique. L'idée de base est qu'il existe un ensemble de paramètres fixes qui déterminent un modèle de probabilité.

Les méthodes paramétriques sont souvent celles pour lesquelles nous savons que la population est approximativement normale, ou nous pouvons approximer en utilisant une distribution normale après avoir invoqué le théorème de la limite centrale. Il existe deux paramètres pour une distribution normale: la moyenne et l'écart type.

En fin de compte, la classification d'une méthode comme paramétrique dépend des hypothèses qui sont faites sur une population. Quelques méthodes paramétriques comprennent:

  • Intervalle de confiance pour une moyenne de population, avec un écart type connu.
  • Intervalle de confiance pour une moyenne de population, avec un écart-type inconnu.
  • Intervalle de confiance pour une variance de population.
  • Intervalle de confiance pour la différence de deux moyennes, avec un écart-type inconnu.

Méthodes non paramétriques

Pour contraster avec les méthodes paramétriques, nous définirons des méthodes non paramétriques. Ce sont des techniques statistiques pour lesquelles nous n'avons pas à faire d'hypothèse de paramètres pour la population que nous étudions. En effet, les méthodes ne dépendent pas de la population d'intérêt. L'ensemble des paramètres n'est plus fixe, ni la distribution que nous utilisons. C'est pour cette raison que les méthodes non paramétriques sont également appelées méthodes sans distribution.

Les méthodes non paramétriques gagnent en popularité et en influence pour un certain nombre de raisons. La raison principale est que nous ne sommes pas autant contraints que lorsque nous utilisons une méthode paramétrique. Nous n'avons pas besoin de faire autant d'hypothèses sur la population avec laquelle nous travaillons que ce que nous devons faire avec une méthode paramétrique. Beaucoup de ces méthodes non paramétriques sont faciles à appliquer et à comprendre.

Quelques méthodes non paramétriques comprennent:

  • Test de signe pour la moyenne de la population
  • Techniques d'amorçage
  • Test U pour deux moyens indépendants
  • Test de corrélation de Spearman

Comparaison

Il existe plusieurs façons d'utiliser les statistiques pour trouver un intervalle de confiance concernant une moyenne. Une méthode paramétrique impliquerait le calcul d'une marge d'erreur avec une formule, et l'estimation de la moyenne de la population avec une moyenne d'échantillon. Une méthode non paramétrique pour calculer une moyenne de confiance impliquerait l'utilisation du bootstrap.

Pourquoi avons-nous besoin de méthodes paramétriques et non paramétriques pour ce type de problème? Plusieurs fois, les méthodes paramétriques sont plus efficaces que les méthodes non paramétriques correspondantes. Bien que cette différence d'efficacité ne soit généralement pas un problème majeur, il existe des cas où nous devons déterminer quelle méthode est la plus efficace..