mardi 22 décembre 2009

Magic Pavlov

En 1890 un médecin russe étudiait les sécrétions gastriques du chien lorsqu'il observa un peu par hasard que son propre chien se mettait à baver dès qu'il entendait la sonnette de son repas. La notion de réflexe de Pavlov (puisque c'est de lui dont il s'agit) était né et l'on a découvert depuis que tous les animaux sans exception sont "conditionnables", y compris ceux qui, comme le petit ver Caenorhabtis Elegans n'ont ni cerveau ni système nerveux très élaboré. Malgré son caractère très simple, le conditionnement pavlovien instrumental [Cf le commentaire de BCY sur la différence entre ces deux types de conditionnement] n'en finit pas de m'épater par sa puissance et son omniprésence chez une espèce aussi évoluée que la nôtre.

Distinguer l'indistinguable...
Première surprise, son champ d'application est extraordinairement large. J'ai ainsi découvert que l'on peut, grâce à un apprentissage conditionné (conditionnel devrait-on dire, paraît-il), apprendre à identifier des subtilités normalement indistinguables consciemment. Il existe par exemple des molécules jumelles (que les chimistes appellent énantiomères) dont l'odeur est normalement indiscernable pour le nez humain. Pourtant, si l'on essaye quand même de les distinguer en recevant une récompense chaque fois qu'on y parvient, on peut apprendre progressivement à faire la différence entre les deux odeurs alors qu'on a l'impression de répondre complètement au hasard.

(source: S Dehaene, cours du collège de France, 2009)

Acquérir des préférences à son insu
L'apprentissage conditionné ne fait même pas forcément appel à la mémoire. Le neurologue Antonio Damasio raconte par exemple l'histoire d'un de ses patients, nommé David, atteint d'une amnésie totale suite à une profonde lésion cérébrale. Il ne pouvait se souvenir d'aucun fait nouveau, d'aucun mot, d'aucun lieu, d'aucun visage rencontré la veille. Damasio monta une expérience avec la complicité de trois aide-soignants qui firent travailler David durant cinq jours d'affilée. L'un jouait le rôle du "bon garçon", l'encourageant et le récompensant souvent. Le second se montrait au contraire très désagréable, obligeant David à réaliser des tâches pénibles. Le troisième avait une attitude neutre et lui faisait faire des activités ni agréables ni particulièrement déplaisantes. D'un jour à l'autre, David ne se souvenait absolument plus des visages de ces aide-soignants ni de leur attitude. Le sixième jour on présenta à David plusieurs séries de photos, et on lui demanda d'y choisir les personnes avec qui il aimerait bien être ami. David choisit le gentil expérimentateur huit fois sur dix lorsqu'il le pouvait. Par contre il évita systématiquement le "bad guy" et il choisit l'aide-soignant "neutre" avec une probabilité proche de celle du hasard. Comme l'explique Damasio,
"il ignorait pourquoi il choisissait l'un et rejetait l'autre; il le faisait, tout simplement. La préférence non consciente qu'il manifestait, cependant, est probablement liée aux émotions qui avaient été induites en lui durant l'expérience, ainsi qu'à la ré-induction non consciente d'une certaine partie de ces émotions au moment où il se trouvait soumis au test."
Autrement dit nos goûts et nos préférences -nos valeurs aussi?- pourraient se forger de manière pavlovienne conditionnée à partir d'expériences vécues, alors qu'on ne conserve plus aucun souvenir de ces expériences. On aime ou on n'aime pas, mais on ne peut plus expliquer pourquoi. Et si on doit vraiment le faire, on invente littéralement des explications pour justifier a posteriori ces préférences. Pas étonnant que le conditionnement ait alimenté autant de fantasmes dans la littérature d'anticipation qui y a vu la technique d'aliénation par excellence, que ce soit dans le Meilleur des Mondes ou dans Orange Mécanique.

Apprendre dans le coma

Quel étudiant n'a pas rêvé d'apprendre ses cours en dormant? Malheureusement on n'en est pas là. Par contre, pas de problème pour acquérir un réflexe conditionné sans être soi-même conscient. Une équipe britannique a récemment étudié comment des patients dans le coma et des personnes sous anesthésie répondent au conditionnement pavlovien. Ces chercheurs ont habitué ces patients à recevoir un souffle d’air sur leurs paupières immédiatement après leur avoir fait "entendre" (si tant est qu'ils entendent) une note de musique particulière. Les personnes sous anesthésie ne réagissent pas. Normal, leurs perceptions sont totalement inhibées. En revanche 15 patients sur les 22 en état de conscience minimale contractent leur paupière dès qu'ils entendent la note, en anticipation du souffle qu'ils s'attendent à recevoir. Malgré leur coma, ces patients ont préservé une certaine capacité d'apprentissage par conditionnement ce qui pourrait permettre dans le futur à mieux diagnostiquer l'état cérébral des patients comateux.

L'intuition: une clairvoyance émotionnelle?
Les exemples précédents pourraient laisser entendre que l'apprentissage
pavlovien par conditionnement ne concerne que les sensations ou les émotions primaires. Ce n'est pas du tout le cas: on retrouve l'apprentissage par conditionnement à l'autre extrémité de l'échelle cognitive, du côté des fonctions nobles que sont la délibération consciente et la décision rationnelle.C'est encore une fois Antonio Damasio qui a illustré la frontière ténue entre ces deux modes d'apprentissage dans une expérience connue sous le nom d'Iowa Gambling Task (jeu des paris d'Iowa, car elle a été testée initialement là-bas).
Vous avez quatre paquets de cartes retournées devant vous. Chaque carte vous fait soit gagner, soit perdre de l'argent.Votre but: gagner un maximum d'argent en retournant une carte après l'autre dans l'un des quatre tas. Ce que vous ne savez pas, c'est que deux de ces tas sont très risqués ("Bad decks" en bleu dans le schéma): leurs cartes font soit gagner beaucoup, soit perdre beaucoup d'argent. Pour gagner, il vaut mieux piocher dans les deux autres tas ("Good decks" en vert), qui vous rapportent des gains modestes mais réguliers et ne vous font perdre que plus rarement de petites sommes.


(Extrait de Bechara & Damasio, Deciding avantageously before knowing advantageous strategy, 1996)

Au début de l'expérience, les participants piochent au hasard dans les quatre tas (phase "pre-punishment" à gauche en jaune dans le schéma, barres du bas). Au bout d'une cinquantaine de tirage ils "sentent" que deux des tas sont plus risqués que les autres (phase "hunch" en rose). Au bout de 80 tirages la majorité des joueurs savent expliquer ce qui se passe ("conceptual period" en rouge à droite). Mais il se passe quelque chose de très étonnant entre le 10eme et le 50eme tirage: durant cette phase ("pre-hunch" en orange) les participants commencent à améliorer leur stratégie avant de pouvoir exprimer leur préférence pour certains tas. Ils choisissent de mieux en mieux avant de s'en rendre compte! Plus troublant encore, durant cette phase d'apprentissage non-conscient, les chercheurs ont mis en évidence des signaux physiques de stress (mesurés à la quantité de sueur produite dans la paume des mains - barres SCR au milieu du schéma) chez les joueurs chaque fois qu'ils s'apprêtent à piocher dans le mauvais tas.

Les deux modalités de notre intelligence
Cette expérience célèbre (aux Etats-Unis en tous cas) laisse supposer que notre système de compréhension et de décision se fait à deux niveaux:
- une étape intuitive, rapide, inconsciente et fortement émotionnelle durant laquelle on "sent" plus ou moins ce qu'il faut faire sans pouvoir expliquer pourquoi; ce sont typiquement ces processus mentaux qui permettent d'avoir "l'intelligence du jeu" dans les sports collectifs.
- une deuxième étape de prise de conscience, plus lente durant laquelle on est capable d'expliquer rationnellement ses choix et ses décisions. On décide d'abord, on justifie ensuite, de la même manière que l'on avait déjà remarqué qu'on agit avant de décider d'agir. Décidément notre cerveau est bizarrement câblé!

Et si ce que l'on appelle "l'intuition" ou le "gut feeling" en anglais n'était autre qu'une forme particulièrement raffinée du bon vieux conditionnement? Je me demande si cela n'expliquerait pas les liens étranges entre décision, mémoire et émotion:
- on se souvient d'autant mieux des événements qu'ils sont associés à une émotion très forte;
- les personnes privés d'émotion à la suite d'une lésion de leur cortex préfrontal ont du mal à prendre des décisions correctes (c'est l'autre découverte de l'expérience précédente);
- face à un problème compliqué on a bien souvent le "sentiment" d'être sur la bonne piste. On "sent" brusquement une illumination, quelque chose qui se dénoue et qui provoque une soudaine excitation à la perspective de trouver. Le "Eurêka!" ne vient que l'instant d'après, lorsqu'on est capable d'exprimer clairement sa solution, que notre conscience a repris le contrôle et est capable de mettre en mots ce que notre inconscient a instinctivement

Je soupçonne les chercheurs et les amateurs d'énigmes d'avoir développé une véritable addiction pour cette sensation extrêmement jouissive d'être sur le point de trouver, pile au moment où notre inconscient nous susurre à l'oreille les indices permettant de trouver la solution. Un inconscient sophistiqué, permettant de prendre des décisions et source de créativité: on est très très loin de l'image freudienne d'un inconscient fantasmatique, gardien muet de nos désirs refoulés.

Sources:
Antonio Damasio, Le sentiment même de soi: corps, émotion, conscience (1999)
Malcolm Gladwell, Blink (2005)
Bechara, Damasio et al, Deciding Advantageously Without Knowing the Advantageous Strategy (1997)

Billets connexes
Eloge du pifomètre qui traite d'un autre aspect de notre délibération non consciente: la décantation
Très précieuse auto-justification, où l'on découvre que la différence entre justification et motivation n'est carrément pas évidente.
Les absences sont toujours raison sur d'autres mécanismes de notre inconscient non freudien