Exemple de test de permutation

Une question qu'il est toujours important de poser en statistique est: «Le résultat observé est-il dû au hasard seul, ou est-il statistiquement significatif?» Une classe de tests d'hypothèse, appelés tests de permutation, nous permet de tester cette question. La vue d'ensemble et les étapes d'un tel test sont:

  • Nous avons divisé nos sujets en un groupe témoin et un groupe expérimental. L'hypothèse nulle est qu'il n'y a pas de différence entre ces deux groupes.
  • Appliquer un traitement au groupe expérimental.
  • Mesurer la réponse au traitement
  • Considérez toutes les configurations possibles du groupe expérimental et la réponse observée.
  • Calculer une valeur de p basée sur notre réponse observée par rapport à tous les groupes expérimentaux potentiels.

Ceci est un aperçu d'une permutation. Pour étoffer ce schéma, nous allons passer du temps à examiner en détail un exemple élaboré d'un tel test de permutation..

Exemple

Supposons que nous étudions des souris. En particulier, nous nous intéressons à la rapidité avec laquelle les souris terminent un labyrinthe qu'elles n'ont jamais rencontré auparavant. Nous souhaitons apporter des preuves en faveur d'un traitement expérimental. L'objectif est de démontrer que les souris du groupe de traitement résoudront le labyrinthe plus rapidement que les souris non traitées. 

Nous commençons par nos sujets: six souris. Pour plus de commodité, les souris seront désignées par les lettres A, B, C, D, E, F. Trois de ces souris doivent être sélectionnées au hasard pour le traitement expérimental, et les trois autres sont placées dans un groupe témoin dans lequel les sujets reçoivent un placebo.

Nous allons ensuite choisir au hasard l'ordre dans lequel les souris sont sélectionnées pour exécuter le labyrinthe. Le temps passé à terminer le labyrinthe pour toutes les souris sera noté, et une moyenne de chaque groupe sera calculée.

Supposons que notre sélection aléatoire ait des souris A, C et E dans le groupe expérimental, avec les autres souris dans le groupe témoin placebo. Une fois le traitement mis en œuvre, nous choisissons au hasard l'ordre de passage des souris dans le labyrinthe. 

Les temps d'exécution pour chacune des souris sont:

  • La souris A exécute la course en 10 secondes
  • La souris B exécute la course en 12 secondes
  • La souris C exécute la course en 9 secondes
  • La souris D exécute la course en 11 secondes
  • La souris E exécute la course en 11 secondes
  • La souris F exécute la course en 13 secondes.

Le temps moyen pour terminer le labyrinthe pour les souris du groupe expérimental est de 10 secondes. Le temps moyen pour terminer le labyrinthe pour ceux du groupe témoin est de 12 secondes.

Nous pourrions poser quelques questions. Le traitement est-il vraiment la raison du temps moyen plus rapide? Ou avons-nous simplement eu de la chance dans notre sélection de groupe témoin et expérimental? Le traitement n'a peut-être eu aucun effet et nous avons choisi au hasard les souris les plus lentes pour recevoir le placebo et les souris plus rapides pour recevoir le traitement. Un test de permutation aidera à répondre à ces questions.

Hypothèses

Les hypothèses de notre test de permutation sont:

  • L'hypothèse nulle est la déclaration d'absence d'effet. Pour ce test spécifique, nous avons H0: Il n'y a pas de différence entre les groupes de traitement. Le temps moyen pour exécuter le labyrinthe pour toutes les souris sans traitement est le même que le temps moyen pour toutes les souris avec le traitement.
  • L'hypothèse alternative est ce que nous essayons d'établir des preuves en faveur de. Dans ce cas, nous aurions Hune: Le temps moyen pour toutes les souris avec le traitement sera plus rapide que le temps moyen pour toutes les souris sans traitement.

Permutations

Il y a six souris et il y a trois places dans le groupe expérimental. Cela signifie que le nombre de groupes expérimentaux possibles est donné par le nombre de combinaisons C (6,3) = 6! / (3! 3!) = 20. Les individus restants feraient partie du groupe témoin. Il y a donc 20 façons différentes de choisir au hasard des individus dans nos deux groupes.

L'affectation de A, C et E au groupe expérimental a été effectuée au hasard. Puisqu'il y a 20 configurations de ce type, la configuration spécifique avec A, C et E dans le groupe expérimental a une probabilité de 1/20 = 5% de se produire.