Modélisation d'équations structurelles

La modélisation d'équations structurelles est une technique statistique avancée qui comporte de nombreuses couches et de nombreux concepts complexes. Les chercheurs qui utilisent la modélisation d'équations structurelles ont une bonne compréhension des statistiques de base, des analyses de régression et des analyses factorielles. La construction d'un modèle d'équation structurelle nécessite une logique rigoureuse ainsi qu'une connaissance approfondie de la théorie du domaine et des preuves empiriques antérieures. Cet article fournit un aperçu très général de la modélisation des équations structurelles sans creuser dans les subtilités impliquées.

La modélisation d'équations structurelles est un ensemble de techniques statistiques qui permettent d'examiner un ensemble de relations entre une ou plusieurs variables indépendantes et une ou plusieurs variables dépendantes. Les variables indépendantes et dépendantes peuvent être continues ou discrètes et peuvent être des facteurs ou des variables mesurées. La modélisation d'équations structurelles porte également plusieurs autres noms: modélisation causale, analyse causale, modélisation d'équations simultanées, analyse des structures de covariance, analyse de trajectoire et analyse factorielle confirmatoire.

Lorsque l'analyse factorielle exploratoire est combinée à des analyses de régression multiples, le résultat est une modélisation d'équation structurelle (SEM). SEM permet de répondre aux questions qui impliquent des analyses de régression multiple des facteurs. Au niveau le plus simple, le chercheur pose une relation entre une seule variable mesurée et d'autres variables mesurées. Le but du SEM est d'essayer d'expliquer les corrélations «brutes» entre les variables directement observées.

Diagrammes de chemin

Les diagrammes de cheminement sont fondamentaux pour le SEM car ils permettent au chercheur de représenter le modèle hypothétique ou l'ensemble de relations. Ces diagrammes sont utiles pour clarifier les idées du chercheur sur les relations entre les variables et peuvent être directement traduits dans les équations nécessaires à l'analyse.

Les diagrammes de chemin se composent de plusieurs principes:

  • Les variables mesurées sont représentées par des carrés ou des rectangles.
  • Les facteurs, qui sont constitués de deux indicateurs ou plus, sont représentés par des cercles ou des ovales.
  • Les relations entre les variables sont indiquées par des lignes; l'absence d'une ligne reliant les variables implique qu'aucune relation directe n'est supposée.
  • Toutes les lignes ont une ou deux flèches. Une ligne avec une flèche représente une relation directe hypothétique entre deux variables, et la variable avec la flèche pointant vers elle est la variable dépendante. Une ligne avec une flèche aux deux extrémités indique une relation non analysée sans direction implicite de l'effet.

Questions de recherche traitées par la modélisation d'équations structurelles

La principale question posée par la modélisation des équations structurelles est: «Le modèle produit-il une matrice de covariance de population estimée qui est cohérente avec la matrice de covariance de l'échantillon (observé)?» Après cela, SEM peut répondre à plusieurs autres questions..

  • Adéquation du modèle: les paramètres sont estimés pour créer une matrice de covariance de population estimée. Si le modèle est bon, les estimations des paramètres produiront une matrice estimée qui est proche de la matrice de covariance de l'échantillon. Ceci est évalué principalement avec la statistique de test du chi carré et les indices d'ajustement.
  • Test de la théorie: chaque théorie ou modèle génère sa propre matrice de covariance. Alors quelle théorie est la meilleure? Les modèles représentant des théories concurrentes dans un domaine de recherche spécifique sont estimés, opposés les uns aux autres et évalués.
  • Ampleur de la variance des variables expliquée par les facteurs: Quelle proportion de la variance des variables dépendantes est expliquée par les variables indépendantes? Ceci est répondu par des statistiques de type R au carré.
  • Fiabilité des indicateurs: Quelle est la fiabilité de chacune des variables mesurées? SEM dérive de la fiabilité des variables mesurées et des mesures de cohérence interne de la fiabilité.
  • Estimations de paramètres: SEM génère des estimations de paramètres, ou coefficients, pour chaque chemin dans le modèle, qui peuvent être utilisées pour distinguer si un chemin est plus ou moins important que d'autres chemins pour prédire la mesure du résultat.
  • Médiation: une variable indépendante affecte-t-elle une variable dépendante spécifique ou la variable indépendante affecte-t-elle la variable dépendante par le biais d'une variable médiatrice? C'est ce qu'on appelle un test des effets indirects.
  • Différences entre les groupes: deux ou plusieurs groupes diffèrent-ils dans leurs matrices de covariance, leurs coefficients de régression ou leurs moyennes? La modélisation de plusieurs groupes peut être effectuée en SEM pour tester cela.
  • Différences longitudinales: les différences au sein des personnes et entre elles au fil du temps peuvent également être examinées. Cet intervalle de temps peut être des années, des jours ou même des microsecondes.
  • Modélisation à plusieurs niveaux: ici, des variables indépendantes sont collectées à différents niveaux de mesure imbriqués (par exemple, les élèves imbriqués dans des classes imbriquées dans des écoles) sont utilisés pour prédire des variables dépendantes au même niveau ou à d'autres niveaux de mesure.

Faiblesses de la modélisation d'équations structurelles

Par rapport aux procédures statistiques alternatives, la modélisation d'équations structurelles présente plusieurs faiblesses:

  • Il nécessite une taille d'échantillon relativement grande (N de 150 ou plus).
  • Cela nécessite une formation beaucoup plus formelle en statistique pour pouvoir utiliser efficacement les logiciels SEM.
  • Cela nécessite une mesure et un modèle conceptuel bien spécifiés. SEM est basé sur la théorie, il faut donc avoir des modèles a priori bien développés.

Les références

Tabachnick, B. G. et Fidell, L. S. (2001). Using Multivariate Statistics, Fourth Edition. Needham Heights, MA: Allyn et Bacon.

Kercher, K. (consulté en novembre 2011). Introduction à SEM (Structural Equation Modeling). http://www.chrp.org/pdf/HSR061705.pdf