L'un des objectifs des statistiques est d'organiser les données de manière significative. Les tableaux bidirectionnels sont un moyen important d'organiser un type particulier de données appariées. Comme pour la construction de tout graphique ou tableau dans les statistiques, il est très important de connaître les types de variables avec lesquelles nous travaillons. Si nous avons des données quantitatives, un graphique tel qu'un histogramme ou un tracé de tige et de feuille doit être utilisé. Si nous avons des données catégoriques, alors un graphique à barres ou un graphique à secteurs est approprié.
Lorsque vous travaillez avec des données couplées, nous devons être prudents. Il existe un nuage de points pour les données quantitatives appariées, mais quel type de graphique existe-t-il pour les données catégorielles appariées? Chaque fois que nous avons deux variables catégorielles, nous devons utiliser un tableau à double sens.
Tout d'abord, nous rappelons que les données catégorielles concernent des traits ou des catégories. Il n'est pas quantitatif et n'a pas de valeurs numériques.
Un tableau bidirectionnel consiste à répertorier toutes les valeurs ou niveaux pour deux variables catégorielles. Toutes les valeurs de l'une des variables sont répertoriées dans une colonne verticale. Les valeurs de l'autre variable sont répertoriées le long d'une ligne horizontale. Si la première variable a m valeurs et la deuxième variable a n valeurs, il y aura alors un total de mn entrées dans le tableau. Chacune de ces entrées correspond à une valeur particulière pour chacune des deux variables.
Le long de chaque ligne et le long de chaque colonne, les entrées sont totalisées. Ces totaux sont importants pour déterminer les distributions marginales et conditionnelles. Ces totaux sont également importants lorsque nous effectuons un test d'indépendance du chi carré.
Par exemple, nous considérerons une situation dans laquelle nous examinerons plusieurs sections d'un cours de statistique dans une université. Nous voulons construire un tableau à double sens pour déterminer les différences éventuelles entre les hommes et les femmes au cours. Pour ce faire, nous comptons le nombre de notes de chaque lettre qui ont été gagnées par les membres de chaque sexe.
Nous notons que la première variable catégorielle est celle du sexe, et il y a deux valeurs possibles dans l'étude des hommes et des femmes. La deuxième variable catégorielle est celle du grade de la lettre, et il y a cinq valeurs qui sont données par A, B, C, D et F. Cela signifie que nous aurons un tableau bidirectionnel avec 2 x 5 = 10 entrées, plus un ligne supplémentaire et une colonne supplémentaire qui seront nécessaires pour tabuler les totaux de ligne et de colonne.
Notre enquête montre que:
Ces informations sont entrées dans le tableau bidirectionnel ci-dessous. Le total de chaque ligne nous indique combien de chaque type de note a été obtenu. Les totaux de la colonne nous indiquent le nombre d'hommes et le nombre de femmes.
Les tableaux bidirectionnels aident à organiser nos données lorsque nous avons deux variables catégorielles. Ce tableau peut être utilisé pour nous aider à comparer entre deux groupes différents dans nos données. Par exemple, nous pourrions considérer la performance relative des hommes dans le cours de statistiques par rapport à la performance des femmes dans le cours.
Après avoir formé un tableau bidirectionnel, l'étape suivante peut consister à analyser les données statistiquement. On peut se demander si les variables qui sont dans l'étude sont indépendantes les unes des autres ou non. Pour répondre à cette question, nous pouvons utiliser un test du chi carré sur la table bidirectionnelle.
Masculin | Femme | Total | |
UNE | 50 | 60 | 110 |
B | 60 | 80 | 140 |
C | 100 | 50 | 150 |
ré | 40 | 50 | 90 |
F | 30 | 20 | 50 |
Total | 280 | 260 | 540 |