Qu'est-ce qu'un nuage de points?

L'un des objectifs des statistiques est l'organisation et l'affichage des données. Plusieurs fois, une façon de procéder consiste à utiliser un graphique, un graphique ou un tableau. Lorsque vous travaillez avec des données appariées, un type de graphique utile est un nuage de points. Ce type de graphique nous permet d'explorer facilement et efficacement nos données en examinant une dispersion de points dans l'avion.

Données appariées

Il convient de souligner qu'un nuage de points est un type de graphique utilisé pour les données appariées. Il s'agit d'un type d'ensemble de données dans lequel chacun de nos points de données est associé à deux nombres. Des exemples courants de tels appariements incluent:

  • Une mesure avant et après un traitement. Cela pourrait prendre la forme de la performance d'un élève lors d'un prétest puis d'un post-test plus tard..
  • Un plan expérimental de paires appariées. Ici, un individu est dans le groupe témoin et un autre individu similaire est dans le groupe de traitement.
  • Deux mesures du même individu. Par exemple, nous pouvons enregistrer le poids et la taille de 100 personnes.

Graphiques 2D

La toile vierge avec laquelle nous allons commencer pour notre nuage de points est le système de coordonnées cartésiennes. Ceci est également appelé le système de coordonnées rectangulaires du fait que chaque point peut être localisé en dessinant un rectangle particulier. Un système de coordonnées rectangulaires peut être mis en place par:

  1. Commençant par une droite numérique horizontale. C'est ce qu'on appelle le X-axe.
  2. Ajoutez une ligne numérique verticale. Intersection du X-axe de telle sorte que le point zéro des deux lignes se croise. Cette deuxième ligne numérique est appelée y-axe.
  3. Le point d'intersection des zéros de notre droite numérique est appelé l'origine.

Nous pouvons maintenant tracer nos points de données. Le premier numéro de notre paire est le X-coordonner. Il s'agit de la distance horizontale par rapport à l'axe des y, et donc également de l'origine. Nous allons vers la droite pour des valeurs positives de X et à gauche de l'origine pour les valeurs négatives de X.

Le deuxième numéro de notre paire est le y-coordonner. Il s'agit de la distance verticale par rapport à l'axe des x. Partant du point d'origine sur la X-l'axe, montez pour des valeurs positives de y et vers le bas pour les valeurs négatives de y.

L'emplacement sur notre graphique est ensuite marqué d'un point. Nous répétons ce processus encore et encore pour chaque point de notre ensemble de données. Le résultat est une dispersion des points, qui donne son nom au nuage de points.

Explication et réponse

Une instruction importante qui reste est de faire attention à quelle variable se trouve sur quel axe. Si nos données appariées consistent en un appariement explicatif et de réponse, alors la variable explicative est indiquée sur l'axe des x. Si les deux variables sont considérées comme explicatives, alors nous pouvons choisir laquelle doit être tracée sur l'axe des x et laquelle sur la y-axe.

Caractéristiques d'un nuage de points

Il existe plusieurs caractéristiques importantes d'un nuage de points. En identifiant ces traits, nous pouvons découvrir plus d'informations sur notre ensemble de données. Ces fonctionnalités incluent:

  • La tendance globale parmi nos variables. En lisant de gauche à droite, quelle est la situation dans son ensemble? Une tendance à la hausse, à la baisse ou cyclique?
  • Toutes les valeurs aberrantes de la tendance générale. Ces valeurs sont-elles éloignées du reste de nos données ou sont-elles des points d'influence?
  • La forme de toute tendance. Est-ce linéaire, exponentiel, logarithmique ou autre?
  • La force de toute tendance. Dans quelle mesure les données correspondent-elles au modèle global que nous avons identifié?

Rubriques connexes

Les nuages ​​de points qui présentent une tendance linéaire peuvent être analysés avec les techniques statistiques de régression linéaire et de corrélation. La régression peut être effectuée pour d'autres types de tendances non linéaires.