24/03/2022
S1E2
Voici la suite du premier extrait de "Je ne suis pas un arbre"
Les quatre volets
En cours de psychologie on explique aux étudiants la distinction entre les quatre volets du conditionnement opérant : le renforcement positif (on récompense), le renforcement négatif (on enlève quelque chose de désagréable), la punition positive (on effectue quelque chose de désagréable) et la punition négative (on enlève quelque chose d’agréable).
Renforcement positif Punition positive
Renforcement négatif Punition négative
Le concept de conditionnement opérant est souvent employé pour expliquer certains aspects du travail de dressage des chevaux. Quelques exemples :
L’exemple classique du renforcement positif c’est lorsqu’on donne une carotte au cheval pour récompenser l’exécution d’une tâche difficile. Beaucoup de dresseurs refusent cette facilité. Moi je suis assez humble pour reconnaître que dans certains cas le cheval ne sera pas suffisamment impressionné par le simple fait que j’exprime ma satisfaction avec un sourire. Mais, l’octroi d’un sourire rentre-t-il dans la catégorie de renforcement positif, du conditionnement ? Et alors entre êtres humains, le sourire participe-t-il d’un mécanisme social basé, lui aussi, sur le conditionnement ? Questions importantes !
Un exemple du renforcement négatif serait le relâchement de la demande dès que le cheval l’a comprise, élément clé du dialogue avec le cheval, comme nous l’avons vu. Par exemple, si le cheval répond correctement à l’action des jambes en se portant en avant, on relâche instantanément la demande. Précision : nous ne sommes pas obligés de considérer l’action des jambes comme quelque chose de désagréable.
La punition positive serait le fait de faire quelque chose de désagréable au cheval s’il ne répond pas de la façon souhaitée à la demande du dresseur. Par exemple, on le frappe avec la cravache quand il fait une bêtise. Comme nous l’avons vu, un tel déchainement de violence, simple expression de l’incompétence du cavalier, n’est pas utile, car il y a peu de probabilité que le cheval associe la punition avec la cause. D’une façon moins extrême, certains pourraient considérer que la notion d’inconfort proposée par l’école dite éthologique entre dans cette catégorie. L’exemple le plus classique est la fameuse « leçon des jambes » : si le cheval ne répond pas à l’action des jambes, on renforce la demande par une action du stick. Même réflexion : ces actions sont, ou devraient être, considérées comme des encouragements plutôt que des punitions dans le sens usuel, non-scientifique, du terme.
La punition négative consisterait à enlever quelque chose qu’apprécie le cheval s’il ne consent pas d’effectuer l’action voulue. Si on peut punir un enfant en le privant de son cours d’équitation le samedi matin quand il a de mauvaises notes à l’école (ce n’est pas une bonne idée non plus), ce genre de stratégie serait complétement incompréhensible pour le cheval, qui jouit d’une totale indifférence aussi bien à la politique qu’aux conjectures.
Pas de conditionnement pour le langage
Pour Skinner, le conditionnement opérant peut même expliquer le phénomène du langage humain. L’idée est séduisante : l’enfant acquiert sa langue maternelle en associant le son des mots qu’il entend aux objets auxquels ces mots correspondent. Ses hypothèses sur les sens des mots seraient confirmées ou réfutées respectivement par du renforcement positif (la « récompense » d’être compris) ou de la punition positive (la « pénalité » d’être incompris). Par exemple, si l’enfant prononce correctement le mot « poney », sa mère va surement l’emmener au champ regarder les jolis poneys : récompense. S’il le prononce mal, en substituant un « m » pour le « p », sa mère risque de lui donner un billet de 50 euros ou bien le traiter d’infâme capitaliste anglo-saxon : punition. Très vite il va préférer la première option : le mot « poney » est appris ! Et ainsi de suite.
Il est vrai aussi que dans toute conversation humaine le premier participant demande implicitement à son interlocuteur de lui confirmer régulièrement la compréhension qu’il a de ses propos. Ces confirmations peuvent prendre diverses formes : l’interlocuteur peut enchaîner, ou bien interroger, ou tout simplement émettre des mots, ou des sons sans réelle signification, des interjections (« ahh », « mmm » « oui », « en effet », « ma foi »…). Il peut aussi employer des gestes, sans vocalisation. Le test classique est de demander à deux participants dans des salles voisines de s’appeler au téléphone. Le premier doit raconter une histoire un peu longue à l’autre. Ce dernier va spontanément ponctuer l’échange, avec des questions ou des vocalisations sans signification explicite. Peu importe. Dès qu’il arrête de le faire, le premier va inévitablement interrompre son histoire pour demander si l’autre est encore là. D’un point de vu béhavioriste, la présence de confirmations régulières constitue « renforcement positif » et l’absence « punition négative ». Ce schéma de dialogue en continu, qui demande la reconnaissance régulière de la compréhension, ou au moins la présence, de l’autre, ressemble beaucoup au mécanisme demande-compréhension-relâchement que nous avons vu pour la communication avec le cheval. Jusqu’où peut-on considérer que l’un ou l’autre cas relève du conditionnement ?
La théorie béhavioriste de l’acquisition du langage a été vite démantelée par Chomsky dans les années 1960. Si elle offrait une explication plausible pour l’acquisition des mots, elle ne pouvait pas expliquer comment l’enfant acquiert, très rapidement, une parfaite maîtrise de la structure grammaticale de sa langue maternelle. Selon Skinner, l’enfant apprend les règles de grammaire de la même façon qu’il apprend les mots, parce que les adultes de son entourage le corrigent (« punition positive ») quand il commet des erreurs de grammaire, soit explicitement soit par simple répétition de la forme correcte. Mais dans la pratique l’adulte corrige très peu ou pas du tout les expressions de l’enfant. Et de toute façon il y a tellement de règles grammaticales qu’il serait inconcevable de toutes les aborder durant les quelques années que l’enfant met pour les acquérir. Chomsky postule, donc, l’existence d’un mécanisme inné, une espèce de cadre neurologique préformé qui sera très vite configuré en fonction des particularités, finalement superficielles, de la langue maternelle en question. À partir de l’âge de dix ans environ, les connexions neuronales de ce cadre sont redéployées vers d’autres fonctions cognitives, l’enfant n’en ayant plus besoin puisque il aura assimilé la grammaire de sa langue maternelle. Ce redéploiement explique pourquoi un enfant de moins de dix ans apprend très rapidement, très facilement et parfaitement une langue étrangère quand la famille émigre dans un nouveau pays, tandis que l’adulte a beaucoup plus de difficulté, et n’acquiert jamais une compétence totale. (Après 40 ans en France je garde toujours, à mon grand désespoir, mon accent d’origine.)
Et le conditionnement pour le cheval ?
Qu’en est-il de la communication avec le cheval ?
[...]
A suivre