12/02/2022
🐴 Le renforcement positif chez le cheval
"Le R+ il n'y a pas que l'alimentation: les grattouilles, la voix, et ça, je ne connais personne qui fait un tant soit peu de TAP qui ne s'en sert pas"
C'est vrai... Et... C'est pas vrai! Il y a plusieurs choses que je dois aborder pour répondre plus en profondeur à cette phrase, qui me revient extrêmement souvent, sous des formes diverses et variées.
🥕 La première, c'est que, oui, c'est vrai: le renforcement positif ne se limite pas aux récompenses alimentaires (renforcement primaires, qui comblent un besoin primaire -la nourriture-, d'où leur nom). Il existe des renforcements secondaires, dont la voix et les caresses/grattouilles rapides. Mais pour les mettre en place, il faut d'abord utiliser... de la nourriture!
Quand vous associez un mot ou une caresse (qui en soit n'ont rien d'attrayant pour le cheval) avec de la nourriture (qui est naturellement très appréciée), vous créez votre renforcement secondaire. La théorie dit qu'à force de répéter cette association, le mot ou la caresse peuvent agir comme stimulus renforçateur, à la place de la nourriture, dans le cadre d'un travail avec renforcement positif.
Cependant, vous ne savez peut-être pas que ces renforcements sont bien moins efficaces (voire... ne le sont pas du tout, en réalité!) que la friandise. Ethology Lea Lansade a d'ailleurs publié, en 2017, les résultats d'une expérience très intéressante le démontrant (https://www.facebook.com/permalink.php?story_fbid=388184029628171&id=114033623709881&__cft__[0]=AZXzbYYO0I0o5bjd2WWJ6XkRTkTTttTE62ZxOP6xcrQ6NbSsSc2ITgNnTOl9_qaEOhpMJcVZzZSnfW0XFKbmQ7a-0-XguEG8DwxZh2vxyqjp2MlOE_qAckieGT1M8IqN01ewcKVcjUOgjWGBPwQquKLPhz3xcZwV1HRN4JfNmaEVoQ&__tn__=%2CO%2CP-R)
S'agissant de la grattouille, ça peut marcher. Mais puisque c'est un renforcement qui a moins de valeur que la nourriture, il faut trouver LE spot qui fait vraiment du bien, et le gratter suffisamment longtemps pour que le cheval trouve qu'il gagne quelque chose à obéir en échange du moment de bien-être que vous lui offrez (là, c'est du renforcement primaire, contrairement à la gargouille rapide sur le garrot -par défaut- quand le cheval fait bien un truc). Et ça, c'est pas toujours facile, ni même pratique (gratter l'intérieur des cuisses en étant en selle, faut être plutôt doué!).
🥕 Le deuxième point que j'aimerais éclaircir, c'est... C'est pas parce qu'on félicite ou donne un bonbon qu'on fait du renforcement positif, non non!
On a tous commencé par mixer le renforcement positif et négatif, en pensant utiliser les deux. On demande notre comportement en renforcement négatif, et on récompense avec un bonbon (je parle du renforcement primaire ici, vous ayant expliqué qu'il était le plus pertinent ci-dessus).
Carol-Ann Doucet, dans son groupe Comportement équin et méthodes positives : La Révolution Équestre, a écrit un super article là-dessus dont je me permets de reprendre un extrait ici:
"En fait, il y a deux petites règles toutes simples qui permettent de déterminer s'il s'agit vraiment de R+ employé dans les règles de l'art ou de R- couronné d'un bonbon.
1. Le comportement a-t-il été obtenu sans l'usage du R- ? Non = R- avec bonbon
2. Si on avait enlevé le R+ de l'équation, le cheval l'aurait-il fait quand même ? Oui = R- avec bonbon"
Avec ces deux règles, vous pouvez donc savoir si vous faites vraiment du renforcement positif, ou si, en réalité, c'est du renforcement négatif avec une compensation.
🥕 Je vous entends arriver : "Mais moi je ne mets pas la pression. Je mets mon code, et mon cheval le fait, puis je récompense."
Ok, c'est super! Mais... La règle n°1 partagée ci-dessus s'applique au moment de l'apprentissage du comportement. Car oui, vous donnez votre code sans aucune pression... Aujourd'hui! Mais comment votre cheval a-t-il appris à répondre à ce code?
Quelle motivation y a-t-il derrière sa réponse? Est-ce qu'il a été conditionné à répondre, sous peine d'une augmentation de pression? Ou a-t-il été conditionné à répondre pour gagner quelque chose (et s'il ne le faisait pas, il perdait juste l'occasion d'avoir une récompense, rien de plus)?
Si c'est la première option, alors non, ça n'est pas non plus du renforcement positif. Car il y a une pression psychologique passée qui est ancrée et associée à cette demande, il y a donc un évitement de l'aversif en répondant favorablement à votre code. Il n'y a pas la recherche de la bonne réponse dans l'espoir de gagner quelque chose de bien (non, juste un relâchement de pression, ça n'est pas un gain de confort, c'est plutôt un soulagement d'inconfort!).
Je suis peut-être plus claire en disant cela : en renforcement positif, le formateur ajoute quelque chose de désiré pour augmenter la fréquence des comportements. Cela signifie donner à l'apprenant quelque chose qu'il veut en échange d'un comportement que vous voulez. Si ici, ce n'est pas la motivation de la récompense qui a poussé le cheval a faire le comportement, alors non, ça n'est pas du renforcement positif.
🥕 Donc non, on ne peut pas dire que le renforcement positif soit partout. Il est surtout... Nulle part! 🙃 Mais pour s'en rendre compte, il faut bien comprendre le fonctionnement de celui-ci, et il y a d'ailleurs bien plus à découvrir sur le fonctionnement du R+ que ce que j'ai raconté ici... Et si vous voulez en savoir plus, il y a énormément de comptes Facebook ou instagram à suivre, pour découvrir comment vous pourriez intégrer vraiment le renforcement positif dans vos entraînements! Et je suis aussi là si vous avez des questions!
PS: Pour être claire, si je ne l'ai pas suffisamment été: si vous avez construits des apprentissages en R+ et d'autres en R-, alors oui, vous avez fait du R+. Si les apprentissages ont été fait en utilisant le R- et le R+ en même temps, vous n'avez donc fait que du R- (puisque ce n'est pas la motivation du bonbon qui a provoqué le comportement, mais l'évitement de l'inconfort).
PPS: Je suis, vous le savez, une convaincue du R+. Mais loin de moi l'idée de cracher sur les autres méthodes, j'espère que vous ne vous sentirez pas offensés à la lecture de ce post, qui est là dans un but explicatif et pas dans un esprit de donneur de leçon! D'ailleurs, sachez que Popo a été éduqué en R- les deux premières années que l'on a passées ensemble, et j'ai passé les deux dernières années à (presque) tout lui ré-apprendre en R+ pour que les associations demande-conséquence ne soient que positives. Pour autant, je ne sais pas encore me passer totalement de renforcement négatif... Et je ne pense pas que ça soit possible, avec nos capacités et contraintes humaines. En tout cas, pas avec celles qui sont les miennes!
Un article en anglais, mais la traduction google est correcte et vous aidera : https://www.fairhorsemanship.com/are-you-using-r-or-r-with-a-cookie