Une analyse factorielle de la variance, également connue sous le nom d'ANOVA, nous permet de faire des comparaisons multiples de plusieurs moyennes de population. Plutôt que de le faire par paires, nous pouvons examiner simultanément tous les moyens envisagés. Pour effectuer un test ANOVA, nous devons comparer deux types de variation, la variation entre les moyennes des échantillons, ainsi que la variation à l'intérieur de chacun de nos échantillons.
Nous combinons toutes ces variations en une seule statistique, appelée F statistique car il utilise la distribution F. Pour ce faire, nous divisons la variation entre les échantillons par la variation au sein de chaque échantillon. La façon de le faire est généralement gérée par un logiciel, cependant, il est utile de voir un de ces calculs élaboré.
Il sera facile de se perdre dans ce qui suit. Voici la liste des étapes que nous suivrons dans l'exemple ci-dessous:
Le logiciel fait tout cela assez facilement, mais il est bon de savoir ce qui se passe dans les coulisses. Dans ce qui suit, nous élaborons un exemple d'ANOVA en suivant les étapes énumérées ci-dessus.
Supposons que nous ayons quatre populations indépendantes qui satisfont aux conditions de l'ANOVA à facteur unique. Nous souhaitons tester l'hypothèse nulle H0: μ1 = μ2 = μ3 = μ4. Aux fins de cet exemple, nous utiliserons un échantillon de taille trois de chacune des populations étudiées. Les données de nos échantillons sont:
La moyenne de toutes les données est de 9.
Nous calculons maintenant la somme des écarts au carré de chaque moyenne d'échantillon. C'est ce qu'on appelle la somme des carrés d'erreur.
On additionne ensuite toutes ces sommes de déviations au carré et on obtient 6 + 18 + 18 + 6 = 48.
Maintenant, nous calculons la somme des carrés de traitement. Nous examinons ici les écarts au carré de chaque moyenne d'échantillon par rapport à la moyenne globale et multiplions ce nombre par un de moins que le nombre de populations:
3 [(11 - 9)2 + (10 - 9)2 +(8 - 9)2 + (7 - 9)2] = 3 [4 + 1 + 1 + 4] = 30.
Avant de passer à l'étape suivante, nous avons besoin des degrés de liberté. Il y a 12 valeurs de données et quatre échantillons. Ainsi, le nombre de degrés de liberté de traitement est 4 - 1 = 3. Le nombre de degrés de liberté d'erreur est 12 - 4 = 8.
Nous divisons maintenant notre somme de carrés par le nombre approprié de degrés de liberté afin d'obtenir les carrés moyens.
La dernière étape consiste à diviser le carré moyen pour le traitement par le carré moyen pour l'erreur. Il s'agit de la statistique F des données. Ainsi pour notre exemple F = 10/6 = 5/3 = 1,667.
Des tableaux de valeurs ou un logiciel peuvent être utilisés pour déterminer la probabilité d'obtenir une valeur de la statistique F aussi extrême que cette valeur par hasard uniquement.