De nombreux problèmes d'inférence statistique nous obligent à trouver le nombre de degrés de liberté. Le nombre de degrés de liberté sélectionne une distribution de probabilité unique parmi une infinité de nombres. Cette étape est un détail souvent ignoré mais crucial dans le calcul des intervalles de confiance et le fonctionnement des tests d'hypothèse.
Il n'y a pas une seule formule générale pour le nombre de degrés de liberté. Cependant, il existe des formules spécifiques utilisées pour chaque type de procédure dans les statistiques inférentielles. En d'autres termes, le cadre dans lequel nous travaillons déterminera le nombre de degrés de liberté. Ce qui suit est une liste partielle de certaines des procédures d'inférence les plus courantes, ainsi que le nombre de degrés de liberté utilisés dans chaque situation..
Les procédures impliquant une distribution normale standard sont répertoriées pour être complètes et pour dissiper certaines idées fausses. Ces procédures ne nous obligent pas à trouver le nombre de degrés de liberté. La raison en est qu'il existe une seule distribution normale standard. Ces types de procédures englobent celles impliquant une moyenne de population lorsque l'écart-type de la population est déjà connu, ainsi que les procédures concernant les proportions de la population..
Parfois, la pratique statistique nous oblige à utiliser la distribution t de Student. Pour ces procédures, comme celles qui traitent d'une moyenne de population avec un écart-type de population inconnu, le nombre de degrés de liberté est inférieur de un à la taille de l'échantillon. Ainsi, si la taille de l'échantillon est n, alors il y a n - 1 degrés de liberté.
Plusieurs fois, il est logique de traiter les données comme appariées. L'appariement est généralement effectué en raison d'une connexion entre la première et la deuxième valeur de notre paire. Plusieurs fois, nous appairions avant et après les mesures. Notre échantillon de données appariées n'est pas indépendant; cependant, la différence entre chaque paire est indépendante. Ainsi, si l'échantillon a un total de n paires de points de données (pour un total de 2n puis il y a n - 1 degrés de liberté.
Pour ces types de problèmes, nous utilisons toujours une t-distribution. Cette fois, il y a un échantillon de chacune de nos populations. Bien qu'il soit préférable que ces deux échantillons soient de la même taille, cela n'est pas nécessaire pour nos procédures statistiques. Ainsi, nous pouvons avoir deux échantillons de taille n1 et n2. Il existe deux façons de déterminer le nombre de degrés de liberté. La méthode la plus précise consiste à utiliser la formule de Welch, une formule de calcul complexe impliquant les tailles d'échantillon et les écarts-types d'échantillon. Une autre approche, appelée approximation conservatrice, peut être utilisée pour estimer rapidement les degrés de liberté. C'est simplement le plus petit des deux nombres n1 - 1 et n2 - 1.
L'une des utilisations du test du chi carré est de voir si deux variables catégorielles, chacune avec plusieurs niveaux, présentent une indépendance. Les informations sur ces variables sont enregistrées dans un tableau à double sens avec r lignes et c Colonnes. Le nombre de degrés de liberté est le produit (r - 1)(c - 1).
La qualité d'ajustement du chi carré commence par une seule variable catégorielle avec un total de n les niveaux. Nous testons l'hypothèse que cette variable correspond à un modèle prédéterminé. Le nombre de degrés de liberté est inférieur de un au nombre de niveaux. En d'autres termes, il existe n - 1 degrés de liberté.
Une analyse factorielle de la variance (ANOVA) nous permet de faire des comparaisons entre plusieurs groupes, éliminant ainsi le besoin de plusieurs tests d'hypothèse par paires. Puisque le test nous oblige à mesurer à la fois la variation entre plusieurs groupes ainsi que la variation au sein de chaque groupe, nous nous retrouvons avec deux degrés de liberté. La statistique F, qui est utilisée pour un facteur ANOVA, est une fraction. Le numérateur et le dénominateur ont chacun des degrés de liberté. Laisser c être le nombre de groupes et n est le nombre total de valeurs de données. Le nombre de degrés de liberté du numérateur est inférieur de un au nombre de groupes, ou c - 1. Le nombre de degrés de liberté pour le dénominateur est le nombre total de valeurs de données, moins le nombre de groupes, ou n - c.
Il est clair que nous devons faire très attention à savoir avec quelle procédure d'inférence nous travaillons. Cette connaissance nous informera du nombre correct de degrés de liberté d'utilisation.