Une introduction aux statistiques de sociologie

La recherche sociologique peut avoir trois objectifs distincts: description, explication et prédiction. La description est toujours une partie importante de la recherche, mais la plupart des sociologues tentent d'expliquer et de prédire ce qu'ils observent. Les trois méthodes de recherche les plus couramment utilisées par les sociologues sont les techniques d'observation, les enquêtes et les expériences. Dans chaque cas, une mesure est impliquée qui donne un ensemble de nombres, qui sont les résultats, ou données, produits par l'étude de recherche. Les sociologues et autres scientifiques résument les données, trouvent des relations entre les ensembles de données et déterminent si les manipulations expérimentales ont affecté une variable d'intérêt.

Le mot statistique a deux significations:

  1. Le domaine qui applique des techniques mathématiques à l'organisation, la synthèse et l'interprétation des données.
  2. Les techniques mathématiques elles-mêmes. La connaissance des statistiques présente de nombreux avantages pratiques.

Même une connaissance rudimentaire des statistiques vous permettra de mieux évaluer les affirmations statistiques des journalistes, des météorologues, des annonceurs de télévision, des candidats politiques, des représentants du gouvernement et d'autres personnes qui peuvent utiliser les statistiques dans les informations ou les arguments qu'ils présentent..

Représentation des données

Les données sont souvent représentées dans des distributions de fréquences, qui indiquent la fréquence de chaque score dans un ensemble de scores. Les sociologues utilisent également des graphiques pour représenter les données. Ceux-ci incluent des graphiques circulaires, des histogrammes de fréquence et des graphiques linéaires. Les graphiques linéaires sont importants pour représenter les résultats des expériences car ils sont utilisés pour illustrer la relation entre les variables indépendantes et dépendantes.

Statistiques descriptives

Les statistiques descriptives résument et organisent les données de recherche. Les mesures de tendance centrale représentent le score typique dans un ensemble de scores. Le mode est le score le plus fréquent, la médiane est le score moyen et la moyenne est la moyenne arithmétique de l'ensemble des scores. Les mesures de variabilité représentent le degré de dispersion des scores. La plage est la différence entre les scores les plus élevés et les plus bas. La variance est la moyenne des écarts au carré de la moyenne de l'ensemble des scores, et l'écart-type est la racine carrée de la variance.

De nombreux types de mesures tombent sur une courbe normale ou en forme de cloche. Un certain pourcentage des scores tombe en dessous de chaque point de l'abscisse de la courbe normale. Les centiles identifient le pourcentage de scores inférieurs à un score particulier.

Statistiques corrélationnelles

Les statistiques corrélationnelles évaluent la relation entre deux ou plusieurs ensembles de scores. Une corrélation peut être positive ou négative et varier de 0,00 à plus ou moins 1,00. L'existence d'une corrélation ne signifie pas nécessairement que l'une des variables corrélées provoque des changements dans l'autre. L'existence d'une corrélation n'exclut pas non plus cette possibilité. Les corrélations sont généralement représentées graphiquement sur des diagrammes de dispersion. La technique de corrélation la plus courante est peut-être la corrélation produit-moment de Pearson. Vous ajustez la corrélation produit-moment de Pearson pour obtenir le coefficient de détermination, qui indiquera la quantité de variance dans une variable prise en compte par une autre variable.

Statistiques déductives

Les statistiques inférentielles permettent aux chercheurs en sciences sociales de déterminer si leurs résultats peuvent être généralisés à partir de leurs échantillons aux populations qu'ils représentent. Considérons une enquête simple dans laquelle un groupe expérimental qui est exposé à une condition est comparé à un groupe témoin qui ne l'est pas. Pour que la différence entre les moyennes des deux groupes soit statistiquement significative, la différence doit avoir une faible probabilité (généralement inférieure à 5%) de se produire par une variation aléatoire normale.

Sources:

  • McGraw Hill. (2001). Introduction à la statistique pour la sociologie. http://www.mhhe.com/socscience/sociology/statistics/stat_intro.htm