Qu'est-ce que le conditionnement opérant? Définition et exemples

Le conditionnement opérant se produit lorsqu'une association est établie entre un comportement particulier et une conséquence pour ce comportement. Cette association est fondée sur l'utilisation de renforcement et / ou de punition pour encourager ou décourager les comportements. Le conditionnement opérant a d'abord été défini et étudié par le psychologue comportemental B.F. Skinner, qui a mené plusieurs expériences bien connues de conditionnement opérant avec des sujets animaux..

Points clés: conditionnement des opérateurs

  • Le conditionnement opérant est le processus d'apprentissage par le renforcement et la punition.
  • Dans le conditionnement opérant, les comportements sont renforcés ou affaiblis en fonction des conséquences de ce comportement.
  • Le conditionnement opérant a été défini et étudié par le psychologue comportemental B.F. Skinner.

Les origines

B.F. Skinner était un comportementaliste, ce qui signifie qu'il croyait que la psychologie devrait se limiter à l'étude des comportements observables. Alors que d'autres comportementalistes, comme John B. Watson, se sont concentrés sur le conditionnement classique, Skinner était plus intéressé par l'apprentissage qui s'est produit par le conditionnement opérant.

Il a observé que dans le conditionnement classique, les réponses ont tendance à être déclenchées par des réflexes innés qui se produisent automatiquement. Il a appelé ce genre de comportement intimé. Il a distingué le comportement du répondant du comportement opérant. Comportement des opérateurs était le terme Skinner utilisé pour décrire un comportement qui est renforcé par les conséquences qui en découlent. Ces conséquences jouent un rôle important dans la répétition ou non d'un comportement.

Les idées de Skinner étaient basées sur la loi d'effet d'Edward Thorndike, qui a déclaré que le comportement qui provoque des conséquences positives sera probablement répété, tandis que le comportement qui provoque des conséquences négatives ne se répétera probablement pas. Skinner a introduit le concept de renforcement dans les idées de Thorndike, précisant que le comportement qui sera renforcé sera probablement répété (ou renforcé).

Pour étudier le conditionnement opérant, Skinner a mené des expériences en utilisant une «boîte Skinner», une petite boîte qui avait un levier à une extrémité qui fournirait de la nourriture ou de l'eau une fois pressé. Un animal, comme un pigeon ou un rat, a été placé dans la boîte où il était libre de se déplacer. Finalement, l'animal presserait le levier et serait récompensé. Skinner a constaté que ce processus a conduit l'animal à appuyer plus fréquemment sur le levier. Skinner mesurerait l'apprentissage en suivant le taux de réponses de l'animal lorsque ces réponses étaient renforcées.

Renforcement et punition

À travers ses expériences, Skinner a identifié les différents types de renforcement et de punition qui encouragent ou découragent les comportements.

Renforcement

Un renforcement qui suit de près un comportement encouragera et renforcera ce comportement. Il existe deux types de renfort:

  • Renforcement positif se produit lorsqu'un comportement aboutit à un résultat favorable, par ex. un chien recevant une friandise après avoir obéi à une commande, ou un élève recevant un compliment de l'enseignant après s'être bien comporté en classe. Ces techniques augmentent la probabilité que l'individu répète le comportement souhaité afin de recevoir à nouveau la récompense.
  • Renforcement négatif se produit lorsqu'un comportement entraîne la suppression d'une expérience défavorable, par ex. un expérimentateur cessant de donner des chocs électriques à un singe lorsque le singe appuie sur un certain levier. Dans ce cas, le comportement de pression sur le levier est renforcé car le singe voudra à nouveau retirer les chocs électriques défavorables.

De plus, Skinner a identifié deux types différents de renforçateurs.

  • Renforts primaires renforcent naturellement les comportements parce qu'ils sont intrinsèquement souhaitables, par ex. nourriture.
  • Renforts conditionnés renforcer les comportements non pas parce qu'ils sont intrinsèquement souhaitables, mais parce que nous apprendre de les associer à des renforçateurs primaires. Par exemple, le papier-monnaie n'est pas intrinsèquement souhaitable, mais il peut être utilisé pour acquérir des biens intrinsèquement souhaitables, comme de la nourriture et un abri..

Châtiment

La punition est l'opposé du renforcement. Lorsque la punition suit un comportement, elle décourage et affaiblit ce comportement. Il existe deux types de punition.

  • Punition positive (ou punition par application) se produit lorsqu'un comportement est suivi d'un résultat défavorable, par ex. un parent donne une fessée à un enfant après que l'enfant a utilisé un mot maudit.
  • Punition négative (ou punition par renvoi) se produit lorsqu'un comportement mène à la suppression de quelque chose de favorable, par ex. un parent qui refuse à un enfant son allocation hebdomadaire parce que l'enfant s'est mal conduit.

Bien que la punition soit encore largement utilisée, Skinner et de nombreux autres chercheurs ont constaté que la punition n'est pas toujours efficace. La punition peut supprimer un comportement pendant un certain temps, mais le comportement indésirable a tendance à revenir à long terme. La punition peut également avoir des effets secondaires indésirables. Par exemple, un enfant qui est puni par un enseignant peut devenir incertain et craindre car il ne sait pas exactement quoi faire pour éviter de futures punitions..