L'une des nombreuses façons de classer les variables statistiques est de considérer les différences entre les variables explicatives et les variables de réponse. Bien que ces variables soient liées, il existe d'importantes distinctions entre elles. Après avoir défini ces types de variables, nous verrons que l'identification correcte de ces variables a une influence directe sur d'autres aspects des statistiques, comme la construction d'un nuage de points et la pente d'une droite de régression.
Nous commençons par examiner les définitions de ces types de variables. Une variable de réponse est une quantité particulière sur laquelle nous posons une question dans notre étude. Une variable explicative est tout facteur qui peut influencer la variable de réponse. Bien qu'il puisse y avoir de nombreuses variables explicatives, nous nous intéresserons principalement à une seule variable explicative.
Une variable de réponse peut ne pas être présente dans une étude. La dénomination de ce type de variable dépend des questions posées par un chercheur. La réalisation d'une étude observationnelle serait un exemple de cas où il n'y a pas de variable de réponse. Une expérience aura une variable de réponse. La conception minutieuse d'une expérience tente d'établir que les changements dans une variable de réponse sont directement causés par des changements dans les variables explicatives.
Pour explorer ces concepts, nous examinerons quelques exemples. Pour le premier exemple, supposons qu'un chercheur souhaite étudier l'humeur et les attitudes d'un groupe d'étudiants de première année. Tous les étudiants de première année reçoivent une série de questions. Ces questions sont conçues pour évaluer le degré de mal du pays d'un élève. Les étudiants indiquent également dans l'enquête à quelle distance leur collège est de la maison.
Un chercheur qui examine ces données pourrait simplement être intéressé par les types de réponses des étudiants. La raison en est peut-être d'avoir une idée globale de la composition d'un nouvel étudiant de première année. Dans ce cas, il n'y a pas de variable de réponse. En effet, personne ne voit si la valeur d'une variable influence la valeur d'une autre.
Un autre chercheur pourrait utiliser les mêmes données pour tenter de répondre si les étudiants qui venaient de plus loin avaient un plus grand mal du pays. Dans ce cas, les données relatives aux questions sur le mal du pays sont les valeurs d'une variable de réponse, et les données qui indiquent la distance du domicile forment la variable explicative.
Pour le deuxième exemple, nous pourrions être curieux de savoir si le nombre d'heures passées à faire des devoirs a un effet sur la note qu'un élève gagne à un examen. Dans ce cas, parce que nous montrons que la valeur d'une variable change la valeur d'une autre, il y a une variable explicative et une variable de réponse. Le nombre d'heures étudiées est la variable explicative et le score au test est la variable de réponse.
Lorsque nous travaillons avec des données quantitatives appariées, il convient d'utiliser un nuage de points. Le but de ce type de graphique est de montrer les relations et les tendances au sein des données appariées. Nous n'avons pas besoin d'avoir à la fois une variable explicative et une variable de réponse. Si tel est le cas, alors l'une ou l'autre variable peut être tracée le long de l'un ou l'autre axe. Cependant, en cas de réponse et de variable explicative, la variable explicative est toujours tracée le long de la X ou axe horizontal d'un système de coordonnées cartésiennes. La variable de réponse est ensuite tracée le long de la y axe.
La distinction entre les variables explicatives et les réponses est similaire à une autre classification. Parfois, nous appelons les variables indépendantes ou dépendantes. La valeur d'une variable dépendante dépend de celle d'une variable indépendante. Ainsi, une variable de réponse correspond à une variable dépendante tandis qu'une variable explicative correspond à une variable indépendante. Cette terminologie n'est généralement pas utilisée dans les statistiques car la variable explicative n'est pas vraiment indépendante. Au lieu de cela, la variable prend uniquement les valeurs observées. Nous n'avons peut-être aucun contrôle sur les valeurs d'une variable explicative.