Il existe de nombreuses distributions de probabilités utilisées dans les statistiques. Par exemple, la distribution normale standard, ou courbe en cloche, est probablement la plus largement reconnue. Les distributions normales ne sont qu'un type de distribution. Une distribution de probabilité très utile pour étudier les variances de la population s'appelle la distribution F. Nous examinerons plusieurs des propriétés de ce type de distribution.
La formule de densité de probabilité pour la distribution F est assez compliquée. Dans la pratique, nous n'avons pas besoin de nous préoccuper de cette formule. Il peut cependant être très utile de connaître certains détails des propriétés concernant la distribution F. Quelques-unes des caractéristiques les plus importantes de cette distribution sont répertoriées ci-dessous:
Ce sont quelques-unes des caractéristiques les plus importantes et les plus faciles à identifier. Nous regarderons de plus près les degrés de liberté.
Une caractéristique partagée par les distributions khi-deux, les distributions t et les distributions F est qu'il existe vraiment une famille infinie de chacune de ces distributions. Une distribution particulière est distinguée en connaissant le nombre de degrés de liberté. Pour un t distribution, le nombre de degrés de liberté est inférieur de un à la taille de notre échantillon. Le nombre de degrés de liberté pour une distribution F est déterminé d'une manière différente de celle d'une distribution t ou même d'une distribution khi carré.
Nous verrons ci-dessous exactement comment une distribution F apparaît. Pour l'instant, nous n'envisagerons que suffisamment pour déterminer le nombre de degrés de liberté. La distribution F est dérivée d'un rapport impliquant deux populations. Il y a un échantillon de chacune de ces populations et il y a donc des degrés de liberté pour ces deux échantillons. En fait, nous soustrayons un des deux tailles d'échantillon pour déterminer nos deux nombres de degrés de liberté.
Les statistiques de ces populations se combinent en une fraction pour la statistique F. Le numérateur et le dénominateur ont tous deux des degrés de liberté. Plutôt que de combiner ces deux nombres en un autre nombre, nous les conservons tous les deux. Par conséquent, toute utilisation d'une table de distribution F nous oblige à rechercher deux degrés de liberté différents.
La distribution F découle de statistiques inférentielles concernant les variances de population. Plus précisément, nous utilisons une distribution F lorsque nous étudions le rapport des variances de deux populations normalement distribuées.
La distribution F n'est pas uniquement utilisée pour construire des intervalles de confiance et tester des hypothèses sur les variances de population. Ce type de distribution est également utilisé dans une analyse de variance à un facteur (ANOVA). L'ANOVA cherche à comparer la variation entre plusieurs groupes et la variation au sein de chaque groupe. Pour ce faire, nous utilisons un ratio de variances. Ce ratio de variances a la distribution F. Une formule quelque peu compliquée nous permet de calculer une statistique F comme statistique de test.