Définition du bimodal dans les statistiques

Un ensemble de données est bimodal s'il a deux modes. Cela signifie qu'aucune valeur de données unique ne se produit avec la fréquence la plus élevée. Au lieu de cela, deux valeurs de données sont liées pour avoir la fréquence la plus élevée.

Exemple d'un ensemble de données bimodales

Pour aider à donner un sens à cette définition, nous allons examiner un exemple d'un ensemble avec un mode, puis comparer cela avec un ensemble de données bimodales. Supposons que nous ayons l'ensemble de données suivant:

1, 1, 1, 2, 2, 2, 2, 3, 4, 5, 5, 6, 6, 6, 7, 7, 7, 8, 10, 10

Nous comptons la fréquence de chaque nombre dans l'ensemble de données:

  • 1 se produit dans l'ensemble trois fois
  • 2 se produit dans l'ensemble quatre fois
  • 3 se produit dans le jeu une fois
  • 4 se produit dans le jeu une fois
  • 5 se produit dans l'ensemble deux fois
  • 6 se produit dans l'ensemble trois fois
  • 7 se produit dans l'ensemble trois fois
  • 8 se produit dans le jeu une fois
  • 9 se produit dans le zéro défini
  • 10 se produit dans l'ensemble deux fois

Ici, nous voyons que 2 se produit le plus souvent, et c'est donc le mode de l'ensemble de données. 

Nous contrastons cet exemple avec le suivant

1, 1, 1, 2, 2, 2, 2, 3, 4, 5, 5, 6, 6, 6, 7, 7, 7, 7, 7, 8, 10, 10, 10, 10, 10

Nous comptons la fréquence de chaque nombre dans l'ensemble de données:

  • 1 se produit dans l'ensemble trois fois
  • 2 se produit dans l'ensemble quatre fois
  • 3 se produit dans le jeu une fois
  • 4 se produit dans le jeu une fois
  • 5 se produit dans l'ensemble deux fois
  • 6 se produit dans l'ensemble trois fois
  • 7 se produit dans l'ensemble cinq fois
  • 8 se produit dans le jeu une fois
  • 9 se produit dans le zéro défini
  • 10 se produit dans l'ensemble cinq fois

Ici, 7 et 10 se produisent cinq fois. C'est supérieur à toutes les autres valeurs de données. Ainsi, nous disons que l'ensemble de données est bimodal, ce qui signifie qu'il a deux modes. Tout exemple de jeu de données bimodal sera similaire à celui-ci.

Implications d'une distribution bimodale

Le mode est une façon de mesurer le centre d'un ensemble de données. Parfois, la valeur moyenne d'une variable est celle qui se produit le plus souvent. Pour cette raison, il est important de voir si un ensemble de données est bimodal. Au lieu d'un seul mode, nous aurions deux.

Une implication majeure d'un ensemble de données bimodales est qu'il peut nous révéler qu'il existe deux types différents d'individus représentés dans un ensemble de données. Un histogramme d'un ensemble de données bimodales présentera deux pics ou bosses.

Par exemple, un histogramme de résultats de tests bimodaux aura deux pics. Ces pics correspondront à l'endroit où la fréquence la plus élevée d'élèves a été notée. S'il y a deux modes, cela pourrait montrer qu'il y a deux types d'élèves: ceux qui ont été préparés pour le test et ceux qui ne l'ont pas été.