Le conditionnement opérant

Demander au cheval d’effectuer un reculer grâce à de petites pressions exercées avec un stick sur son poitrail, de partir au galop au recul de la jambe extérieure, de faire la révérence en utilisant une friandise… Quel est le point commun entre ces exercices ? Tous sont enseignés au cheval en utilisant le conditionnement opérant : un principe d’apprentissage par lequel le cheval apprend à associer une réponse comportementale de sa part aux conséquences de cette dernière, grâce à un renforcement. Tout, absolument tout dans l’équitation, est basé sur ce processus d’apprentissage. Mais quelles en sont les règles et comment bien l’utiliser ?

 

3

Niveau de technicité :
Récompense alimentaire
Sommaire

Petits rappels sur les apprentissages

Qu’est-ce qu’un apprentissage ?

 

Un apprentissage est une modification durable du comportement d’un individu comme résultat d’une expérience passée, exprimée par l’animal après exposition à un (des) stimulus (stimuli) * de l’environnement. L’animal reproduira ce nouveau comportement quand il sera à nouveau confronté au même stimulus. En général, les animaux modifient leur comportement de la façon qui leur est la plus favorable.

* stimulus = tout changement dans l’environnement qui entraîne une réponse comportementale de l’animal (vue d’un congénère/objet nouveau, arrivée du soigneur/vétérinaire, distribution de nourriture, approche de la chambrière, action des aides du cavalier, claquement d’une bâche agricole, odeur d’un produit de soin…)

 

Le conditionnement opérant : un apprentissage associatif

 

conditionnement opérantEncore appelé conditionnement skinnerien ou conditionnement instrumental, le conditionnement opérant est un apprentissage dit « associatif ». Cela signifie simplement que le cheval va apprendre consciemment à associer une action particulière de sa part (par exemple passer à l’allure supérieure) aux conséquences de cette dernière (arrêt de la pression des jambes).

 

Les grands principes du conditionnement opérant

L’objectif du conditionnement opérant est d’amener le cheval à réaliser volontairement une action attendue de sa part.

 

Motiver le cheval à réaliser volontairement l’action attendue

 

Pour amener le cheval à effectuer volontairement une action, il faut déjà l’y motiver. C’est le rôle du renforcement. Mais que signifie ce terme ?

 

Le renforcement ou comment faire apparaître un comportement désiré

 

Un renforcement augmente la probabilité qu’un comportement soit à nouveau réalisé. Autrement dit, le renforcement sert à favoriser l’expression d’un comportement désiré. Cela permet à l’homme d’indiquer au cheval que le comportement adopté était bien celui qu’il attendait. Deux cas de figure sont possibles :

  • Soit le cavalier/dresseur motive le cheval en lui donnant quelque chose ayant naturellement une valeur forte et agréable (friandise, grattage au garrot…) une fois qu’il a fait l’action attendue. Petit-à-petit, le cheval comprend que pour obtenir la récompense convoitée, il doit réaliser l’action en question. C’est ce qu’on appelle l’apprentissage avec renforcement positif (R+). La récompense alimentaire reste de loin la plus efficace.
  • Soit le cavalier/dresseur motive le cheval en le mettant dans une situation inconfortable/désagréable (pression des jambes/mains, stimulation avec petits coups de cravache/stick…) jusqu’à ce qu’il produise l’action attendue. La stimulation cesse au moment précis où le cheval donne ne serait-ce qu’un début de bonne réponse, si faible soit-elle. En équitation, on dit que l’on « cède » (descente des aides). C’est le retrait de la pression qui renforce la réponse. C’est ce qu’on appelle l’apprentissage avec renforcement négatif (R-). L’équitation classique est principalement basée sur l’usage de ce type de renforcement.

 

Dans les deux cas, le cheval fait un lien de cause à effet entre son comportement et les conséquences favorables de ce comportement : apport de quelque chose d’agréable (R+) ou arrêt d’une stimulation inconfortable/désagréable (R-).

Il n’y a aucun jugement de valeur dans les termes « renforcement positif » ou « renforcement négatif ». C’est une notion mathématique : « positif » signifie simplement qu’on apporte quelque chose et « négatif » qu’on soustrait quelque chose.

 

Le cheval doit comprendre 1) ce qu’on attend de lui…

 

Motiver le cheval ne suffit pas, il faut aussi qu’il comprenne quelle est l’action attendue. Pour cela, il doit être placé dans un contexte favorable, qui va lui permettre de produire par hasard cette action. Par exemple, pour l’apprentissage de la cession à la jambe chez un jeune cheval, il est souvent conseillé de commencer à travailler l’exercice sur une petite diagonale en rejoignant la piste. Il est en effet plus facile de rejoindre la piste que de la quitter.

 

… et 2) à quel moment son action est attendue

 

Il reste enfin à ajouter un ordre ou signal qui permette au cheval de savoir quand son action est attendue. Dans l’exemple ci-dessus, le cavalier place ses aides (jambe droite reculée et jambe gauche à la sangle pour un déplacement latéral vers la gauche). La pression de la jambe droite cesse immédiatement une fois que le cheval a fait un pas de côté. Le cheval comprend ainsi que pour arrêter cette pression inconfortable, il lui suffit de se déplacer latéralement.

Au début, le cheval aura besoin de temps pour décomposer et comprendre l’association [ordre – début R- – action – fin R-] ou [ordre – action – R+]. Avec l’expérience, les codes vont se mettre en place et le cheval va petit-à-petit apprendre à réagir à la plus légère demande de son cavalier/dresseur. L’apprentissage se fait ainsi doucement, par façonnage. On parle d’apprentissage par « essais et erreurs ».

 

Dans quels cas s’applique le conditionnement opérant ?

 

Tout le temps et dans toutes les disciplines ! Tout, absolument tout dans l’équitation, est basé sur le principe du conditionnement opérant. Mieux vaut donc connaître ce principe et savoir bien l’utiliser.

 

Comment bien utiliser le conditionnement opérant ?

Voici la méthode pas à pas, décomposée en 6 grandes étapes.

 

Etape 1 : identifier l’action attendue de la part du cheval

 

La première chose à faire est de précisément définir l’action attendue de la part du cheval. Au début, attention à bien rester progressif dans la complexité des demandes, surtout avec les jeunes chevaux en formation : demander des actions très simples comme avancer, tourner, s’arrêter, changer d’allure… Il faut savoir se contenter de peu et être patient. Avec l’expérience, on pourra ensuite demander au cheval de réaliser des actions de plus en plus complexes.

 

Etape 2 : choisir l’ordre ou signal

 

Il faut ensuite choisir un ordre/signal ou une combinaison d’ordres/signaux (tactiles, visuels, auditifs…) clairs et facilement identifiables par le cheval. De la même façon, le signal devra être d’autant plus simple que le niveau d’expérience du cheval sera faible. Avec le temps et l’expérience, ces signaux se feront de plus en plus subtils, jusqu’à devenir imperceptibles pour l’observateur extérieur. Il est étonnant de constater à quel point les chevaux expérimentés sont capables de différencier des combinaisons d’aides complexes.

 

Etape 3 : bien choisir et doser le renforcement

 

Selon l’exercice demandé, le contexte, le tempérament et la sensibilité du cheval, le choix de la nature et de l’intensité du renforcement ne sera pas le même. Ainsi, savoir manier les deux types de renforcement (R+ ou R-) est un réel atout. Cela permet de jongler entre les deux afin de choisir le plus adapté au contexte, au résultat souhaité et au cheval, voire de les combiner. Pour être efficace, le renforcement doit être très motivant pour le cheval et bien dosé. Autrement dit, le cheval doit avoir clairement envie d’obtenir le R+ ou de se soustraire à l’inconfort du R-, et l’intensité du renforcement doit être mesurée (poignée de granulés versus seau, pression des mollets versus grands coups de talons).

 

Etape 4 : réfléchir à la façon d’amener le cheval à produire par hasard la réponse attendue

 

Le cheval n’a absolument aucune idée de ce que l’on attend de lui. Le cavalier/dresseur doit donc faire en sorte de placer sa monture dans un contexte favorable, pour l’amener à produire par hasard l’action souhaitée. C’est de la logique. Par exemple, il y a peu de chance d’apprendre le départ au galop à un jeune cheval inexpérimenté en le talonnant à grands coups depuis l’arrêt ou le pas. Bien au contraire, c’est la meilleure façon pour qu’il se fasse peur et/ou se braque par incompréhension ! L’apprentissage doit se faire de manière progressive, en ayant au préalable appris au cheval à mobiliser ses hanches et à alléger son avant-main sur un cercle par exemple. Une fois le cheval en équilibre et devant la jambe, le départ au galop viendra de lui-même, naturellement.

 

Etape 5 : prévoir un nombre suffisant de séances

 

Il faut prévoir un nombre d’essais (nombre d’associations [ordre – début R- – action – fin R-] ou [ordre – action – R+]) suffisamment grand pour que le cheval commence à comprendre, mais raisonnable pour entretenir sa motivation tout au long de la séance et d’une séance à l’autre sans le lasser. On privilégiera des séances assez courtes (de l’ordre de quelques minutes) avec plusieurs essais (10-20 essais) à des séances trop longues. Il est plus bénéfique de savoir s’arrêter, même si l’on n’a pas obtenu tout ce que l’on voulait, pour reprendre quelques heures ou jours après. Le cheval sera alors plus disponible. « Demander souvent, se contenter de peu, récompenser beaucoup ». Attention cependant à bien obtenir au moins un début de réponse, aussi faible soit-il, car un essai qui ne se concrétise pas n’enseigne rien au cheval.

 

Il n’existe pas de règle générale ; tout dépend du cheval et de ses capacités, de ce qu’on veut lui apprendre et de la façon dont on s’y prend. Certains chevaux auront besoin d’un grand nombre de séances très courtes. D’autres comprendront plus vite et s’accommoderont de séances légèrement plus longues.

 

Etape 6 : se lancer et s’ajuster

 

Commencer dans un endroit calme et connu du cheval pour que son attention soit focalisée sur l’exercice, et pas sur l’environnement extérieur. Votre cheval doit être attentif à vous. Si la demande n’est pas comprise, ajustez-vous. Au début, ne pas hésiter à récompenser beaucoup ou céder très vite, au moindre signe de bonne réponse.

Bien souvent, le cheval va tenter plusieurs actions, par essais-erreurs, avant de comprendre ce qu’on lui demande. Le travail du cheval est bien plus la conséquence d’un entraînement mental que d’un simple entraînement mécanique. Pour cette raison, le conditionnement opérant est un type d’apprentissage qui nécessite un timing et un dosage très précis dans l’emploi des renforcements. Ces derniers doivent être parfaitement coordonnés avec l’apparition du comportement souhaité, au risque d’être incompris et donc inefficaces s’ils sont retardés par rapport à la réponse donnée par le cheval. Le bon professeur est celui qui se fait comprendre rapidement, avec des choses très simples.

Et la punition dans tout ça ?

La punition est un autre moyen d’apprentissage par conditionnement opérant. Contrairement au renforcement, qui sert à favoriser l’expression d’un comportement désiré, elle a pour but de faire disparaître un comportement non désiré. Il existe là encore deux cas de figures :

  • Soit le cavalier/dresseur motive le cheval à cesser un comportement non désiré en introduisant un stimulus désagréable/inconfortable (coup de cravache, tape sur le nez…) immédiatement suite à ce comportement. C’est ce qu’on appelle l’apprentissage avec punition positive (P+). Dans ce cas, il peut s’agir de la même stimulation qu’un renforcement négatif, mais c’est le moment où on l’emploie qui change. Au lieu d’être appliqué avant le comportement souhaité, le stimulus intervient après le comportement que l’on souhaite faire disparaître. Ainsi, le cheval apprend que pour ne pas recevoir la stimulation inconfortable, il ne doit pas produire ce comportement. Bien qu’elle puisse avoir un impact néfaste sur le bien-être du cheval et devrait être évitée, c’est la punition classiquement employée en équitation.
  • Soit le cavalier/dresseur motive le cheval à cesser un comportement non désiré en lui supprimant quelque chose qu’il apprécie. C’est ce qu’on appelle l’apprentissage avec punition négative (P-). Il peut s’agir, par exemple, de repartir avec le seau de grain quand le cheval tape dans sa porte. Ce type de punition est rarement utilisé en équitation.

 

Le cheval fait ainsi un lien de cause à effet entre son comportement et les conséquences défavorables de ce comportement : apport de quelque chose de désagréable (P+) ou suppression de quelque chose d’agréable (P-).

 

Punir avec parcimonie

 

Tout comme pour les renforcements, l’intensité de la punition doit être mesurée :

  • Trop faible, elle n’aura aucune valeur pour le cheval et sera inutile.
  • Trop forte, elle risque de mettre le cheval dans un état d’anxiété néfaste pour son bien-être et pour la suite des apprentissages.

 

Il faut trouver le bon dosage en fonction du cheval. Pour certains, une simple élévation soudaine de la voix suffira, alors que pour d’autres, il faudra peut-être aller jusqu’à le toucher ou le surprendre.

 

Appliquer toujours les mêmes règles

 

Une action punie une fois ne doit pas être autorisée par la suite, et inversement. Le cheval a besoin de repères clairs et précis ; il faut rester cohérent. Un cheval autorisé depuis longtemps à mordiller ne fera pas l’association entre son comportement et la punition s’il est puni du jour au lendemain pour ce même comportement.

 

Et si l’apprentissage que j’essaie de mettre en place ne marche pas ?

  • Est-ce que l’ordre utilisé était suffisamment clair et précis ? Règle n°1 « 1 ordre = 1 action »
  • Avez-vous répété suffisamment de fois l’association [ordre-réponse-renforcement] ?
  • Avez-vous bien dosé le renforcement ?
  • Avez-vous bien respecté une bonne contiguïté temporelle ?

Le laps de temps entre la réponse et le renforcement doit être le plus court possible, afin que le cheval puisse associer les deux. C’est ce qu’on appelle la contiguïté temporelle.

 

•    A quelle fréquence avez-vous utilisé les renforcements ?

Au début de l’apprentissage, il est important de renforcer le cheval à chaque essai réussi. C’est ce qu’on appelle le renforcement continu. Chaque bonne réponse est associée à l’arrêt du R- ou à la distribution du R+.


Une fois que le cheval a bien compris la relation de cause à effet entre le renforcement et la réponse, le renforcement n’a plus besoin d’être donné systématiquement (2 fois sur 3, puis 1 fois sur 2 par exemple, puis l’utiliser très rarement). C’est ce qu’on appelle le renforcement partiel.

 

•    Avez-vous respecté la notion de contingence ?

La contingence est une notion complexe, mais déterminante. Il s’agit de la probabilité de donner une récompense après une action de la part du cheval par rapport à la probabilité de la donner en dehors. Il est montré que dégrader la contingence, c’est-à-dire donner des récompenses gratuitement, et pas seulement pour récompenser une réponse particulière, va nuire aux apprentissages. Le cheval comprend qu’il n’a plus besoin de faire l’exercice demandé, puisque même s’il ne fait rien, il peut recevoir la récompense.

Ce qu’il faut retenir

Le principe de l’apprentissage par conditionnement opérant est d’amener le cheval à associer une action volontaire de sa part à une conséquence qui lui est favorable : soit l’arrivée d’un renforcement positif (R+), soit l’arrêt d’un renforcement négatif (R-).


Bien connaître les éléments de ce conditionnement est une véritable boîte à outils que tout cavalier a intérêt à connaître et à maîtriser pour bien former/éduquer son cheval. Le choix des outils doit se faire en fonction de l’exercice, du cheval, du contexte… Ces outils peuvent aussi être utilisés de façon complémentaire pour un même apprentissage ! Dans tous les cas, un bon entraîneur cherchera toujours à réduire l’excitation ou la peur, et à privilégier des codes légers.


L’apprentissage par conditionnement opérant est parfois appelé « apprentissage par essais et erreurs ». Accepter les erreurs, elles font partie de l’apprentissage ! Le dressage d’un cheval est un long façonnage, sur plusieurs années. C’est petit-à-petit, en combinant les différents apprentissages, que l’on va conduire le cheval à réaliser des actions complexes comme des figures de dressage.

En savoir plus sur nos auteurs
  • Léa LANSADE Ingénieur de recherche en éthologie - INRAE-IFCE
  • Marianne VIDAMENT Docteur vétérinaire - ingénieur de développement IFCE
  • Christine BRIANT Docteur vétérinaire - ingénieur de développement IFCE
  • Nelly GENOUX Ingénieur agronome - IFCE
Bibliographie
  • IFCE (2015). Travailler son cheval selon les principes de l’apprentissage. Editions Haras Nationaux, 77 pages.
  • BARAGLI P., PADALINO B. et TELATIN A. (2015). The role of associative and non-associative learning in the training of horses and implications for the welfare (a review). Annali dell'Istituto superiore di sanita, 51, pages 40-51.
  • ISES (International Society of Equitation Science) - Principes fondamentaux de l’entraînement du cheval → Poster en français
  • LEBLANC M.A. (2015). Comment pensent les chevaux ? Belin, 192 pages.
  • ROCHE H. (2013). Motiver son cheval, clicker training et récompenses. Belin, 224 pages.
  • SANKEY C. (2011). Aliment ou grattage : quelle récompense pour le cheval ? 37ème Journée de la Recherche Équine, IFCE.
Pour retrouver ce document: www.equipedia.ifce.fr
Date d'édition: 11 08 2020
Cette fiche vous a-t-elle été utile ?