Les tests d'hypothèse sont l'un des sujets majeurs dans le domaine des statistiques inférentielles. Il existe plusieurs étapes pour effectuer un test d'hypothèse et nombre d'entre elles nécessitent des calculs statistiques. Un logiciel statistique, tel qu'Excel, peut être utilisé pour effectuer des tests d'hypothèse. Nous verrons comment la fonction Excel Z.TEST teste des hypothèses sur une moyenne de population inconnue.
Conditions et hypothèses
Nous commençons par énoncer les hypothèses et les conditions de ce type de test d'hypothèse. Pour déduire la moyenne, nous devons avoir les conditions simples suivantes:
L'échantillon est un simple échantillon aléatoire.
L'échantillon est de petite taille par rapport à la population. Cela signifie généralement que la taille de la population est plus de 20 fois la taille de l'échantillon.
La variable étudiée est normalement distribuée.
L'écart type de la population est connu.
La moyenne de la population est inconnue.
Il est peu probable que toutes ces conditions soient remplies dans la pratique. Cependant, ces conditions simples et le test d'hypothèse correspondant se rencontrent parfois au début d'une classe de statistiques. Après avoir appris le processus d'un test d'hypothèse, ces conditions sont assouplies afin de travailler dans un cadre plus réaliste.
Structure du test d'hypothèse
Le test d'hypothèse particulier que nous considérons a la forme suivante:
Énoncer les hypothèses nulles et alternatives.
Calculez la statistique de test, qui est un z-But.
Calculez la valeur de p en utilisant la distribution normale. Dans ce cas, la valeur de p est la probabilité d'obtenir au moins aussi extrême que la statistique de test observée, en supposant que l'hypothèse nulle est vraie.
Comparer la valeur de p avec le niveau de signification pour déterminer s'il faut rejeter ou ne pas rejeter l'hypothèse nulle.
Nous voyons que les étapes deux et trois sont des calculs intensifs par rapport aux deux étapes un et quatre. La fonction Z.TEST effectuera ces calculs pour nous.
Fonction Z.TEST
La fonction Z.TEST effectue tous les calculs des étapes deux et trois ci-dessus. Il effectue la majorité du nombre de calculs pour notre test et renvoie une valeur de p. Il y a trois arguments pour entrer dans la fonction, chacun étant séparé par une virgule. Ce qui suit explique les trois types d'arguments pour cette fonction.
Le premier argument de cette fonction est un tableau d'exemples de données. Nous devons saisir une plage de cellules correspondant à l'emplacement des exemples de données dans notre feuille de calcul.
Le deuxième argument est la valeur de μ que nous testons dans nos hypothèses. Donc, si notre hypothèse nulle est H0: Μ = 5, alors nous entrerions un 5 pour le deuxième argument.
Le troisième argument est la valeur de l'écart type de la population connue. Excel traite cela comme un argument facultatif
Remarques et avertissements
Il y a quelques points à noter à propos de cette fonction:
La valeur de p qui est sortie de la fonction est unilatérale. Si nous effectuons un test bilatéral, cette valeur doit être doublée.
La sortie p unilatérale de la fonction suppose que la moyenne de l'échantillon est supérieure à la valeur de μ par rapport à laquelle nous testons. Si la moyenne de l'échantillon est inférieure à la valeur du deuxième argument, alors nous devons soustraire la sortie de la fonction de 1 pour obtenir la vraie valeur de p de notre test.
Le dernier argument de l'écart-type de la population est facultatif. Si ce n'est pas entré, cette valeur est automatiquement remplacée dans les calculs d'Excel par l'écart type d'échantillon. Lorsque cela est fait, théoriquement, un test t devrait être utilisé à la place.
Exemple
Nous supposons que les données suivantes proviennent d'un échantillon aléatoire simple d'une population normalement distribuée de moyenne inconnue et d'écart type de 3:
1, 2, 3, 3, 4, 4, 8, 10, 12
Avec un niveau de signification de 10%, nous souhaitons tester l'hypothèse que les données de l'échantillon proviennent d'une population avec une moyenne supérieure à 5. Plus formellement, nous avons les hypothèses suivantes: