dimanche 21 novembre 2010

Prodiges et vertiges de l'analogie - le remix

Sur les conseils d'Alexandre, je viens de finir "Prodiges et Vertiges de l'analogie", de Jacques Bouveresse et j'ai été un peu déçu. J'attendais d'y voir décrite la fascination de la pensée pour une analogie bien choisie, toujours plus convaincante qu'un raisonnement rigoureux, au détriment parfois du bon sens élémentaire. Manque de chance, Bouveresse se polarise sur la fameuse polémique déclenchée par Sokal et son essai est uniquement une dénonciation (convaincante du reste) des verbiages philosophiques à base de concepts scientifiques mal digérés comme le théorème d'incomplétude de Gödel ou le principe d'incertitude d'Heisenberg. Certes il fait parfois référence à notre penchant déraisonnable pour les belles images quand il écrit par exemple à propos d'une jolie formule de Régis Debray (sur lequel il s'acharne longtemps): "c'est évidemment beaucoup trop simple pour être vrai, mais c'est tellement bien dit que ça le devient." (p99). Mais il n'analyse pas les raisons qui rendent ces jolies formules aussi irrésistibles pour l'esprit que la lumière pour le papillon de nuit*.
N'ayant ni le talent ni l'érudition de Bouveresse, je vous propose dans ce billet une synthèse xochipillesque de ce que j'aurais aimé voir dans son essai. En substance, que l'analogie occupe une place centrale dans notre boîte à outils mentale. Son pouvoir de fascination pour l'esprit s'explique précisément parce qu'elle est LA méthode d'apprentissage et de mémorisation par excellence. Je me risque à penser que c'est grâce à cette faculté cognitive tout à fait primaire que nous constituons nos repères mentaux, notre représentation du monde, nos croyances, nos valeurs etc. Vous me direz ce que vous pensez de ce Bouveresse remixé.

La pensée abstraite naît de l'analogie
J'ai déjà raconté dans ce billet la puissance de l'apprentissage par association inconsciente. L'analogie est une forme élaborée de l'association mentale est tout aussi impressionnante. Pour vous en convaincre, essayons de décortiquer ce qui se cache derrière un mot abstrait (un meuble, une ville...). Le philosophe Wittgenstein a montré à qu'un terme comme "jeux" recouvre tellement d'activités différentes qu'il est impossible de leur trouver le moindre dénominateur commun: certains jeux sont amusants mais pas tous, ils se jouent parfois à plusieurs parfois tout seuls, il y a souvent des gagnants et des perdants mais pas toujours, tantôt des règles et tantôt aucune etc. Il faut donc renoncer à définir un jeu par un ensemble de conditions à remplir. "Et le résultat de cet examen, le voici : un réseau complexe de similitudes se chevauchant et s’entrecroisant ; parfois des similitudes globales, parfois des similitudes de détail. Je ne vois pas de meilleure expression pour caractériser ces similitudes que celle de ressemblance de famille car les diverses ressemblances entre les membres d'une famille : la conformation, les traits, la couleur des yeux, la démarche, le tempérament, etc., se chevauchent et s'entrecroisent de la même manière. Et je dirai : les 'jeux' forment une famille." Une activité est un jeu si elle ressemble suffisamment à tel ou tel autre jeu bien connu. Autrement dit, une abstraction se construit sur des analogies plutôt que sur des règles logiques.

L'analogie: une faculté cognitive très primaire
Cette comparaison mentale est sans doute une faculté cognitive très primaire puisqu'on peut comparer très facilement même si l'on n'a aucune idée des critères de comparaison. Prenez les genres musicaux par exemple. Si vous n'êtes pas un musicien chevronné vous êtes sans doute incapable de spécifier un style de musique (le jazz, le rock, la country, la salsa etc.) en termes de rythmes, de mélodies, d'harmoniques, de tempo etc. (perso, je me suis toujours interrogé sur ce qui fait la différence entre le "rock" et le "pop"; si vous avez une idée, ça m'intéresse) Et pourtant vous n'aurez aucune difficulté à étiqueter le style d'une chanson que vous écoutez pour la première fois, simplement parce que vous le rapprochez mentalement du style d'un autre morceau que vous connaissez.

Connaître c'est reconnaître

Poussons un cran plus loin le raisonnement. Lorsque vous croisez un ami par hasard dans la rue, vous le reconnaissez instantanément car vous associez automatiquement son image avec la représentation mentale que vous vous en faites. Idem quand vous reconnaissez une odeur ou un bruit: vous établissez naturellement une correspondance entre une perception réelle et une représentation mentale, en faisant abstraction des différences éventuelles. Borgès raconte dans une de ses nouvelles, l'histoire de Funès, un homme pourvu d'une mémoire si prodigieuse qu'il ne pouvait rien oublier. Funès éprouvait toutes les peines du monde à reconnaître les choses car il ne pouvait oublier les différences entre le chien qu'il avait vu la veille et le même chien aujourd'hui, vu sous un autre angle et sous une lumière différente.
Et si la connaissance relevait du même type de pontage mental, jeté cette fois non plus entre une perception particulière et une catégorie (le truc à poil tout bavant est un chien) mais entre plusieurs catégories différentes et une super-catégorie qui les englobe (les chiens et les chats, de la famille des mammifères)? C'est l'idée de Borgès quand il écrit à propos du malheureux Funès: "Je soupçonne cependant qu'il n'était pas très capable de penser. Penser c'est oublier des différences, c'est généraliser, abstraire. Dans le monde surchargé de Funes il n'y avait que des détails, presque immédiats."  L'analogie serait alors le pilier de notre intelligence puisque penser = conceptualiser, concept = reconnaissance, et reconnaitre = faire une analogie.

La logique n'est rien sans l'analogie

Bien entendu, il existe d'autres processus mentaux qui structurent notre pensée, la logique par exemple ("Tous les hommes sont mortels, Socrate est un homme donc Socrate est mortel"). Mais tout rigoureux qu'il soit, un raisonnement ne s'ancre dans notre esprit que s'il réussit à s'associer à des illustrations concrètes qu'on mémorise facilement. C'est tout le principe des techniques mnémotechniques (source). Si la formule E=mc² est si célèbre, c'est qu'elle fait sens, c'est-à-dire qu'on peut lui associer une interprétation (l'idée que la matière est une forme d'énergie comme une autre), une application (les applications civiles ou militaires du nucléaire), des images (la formule elle-même, très simple ou encore les photos d'Einstein) etc. Notre mémoire et plus généralement nos représentations du monde ne trouvent leur place dans notre esprit que grâce au réseau hiérarchique d'associations, d'analogies qui se sont sédimentés dans notre cerveau.

J'ai trouvé dans mon podcast préféré (Radiolab, en anglais malheureusement) une illustration a contrario de cette idée. Eureqa (téléchargeable gratuitement ici) est un programme génial permettant d'inférer les équations de n'importe quel système à étudier (mécanique, électronique, biologiques etc) à partir simplement des données observées au cours du temps. Face à un mouvement mécanique, il retrouve tout seul toutes les lois de Newton, les lois de conservation de l'énergie de la quantité de mouvement etc. Dingue non? Un biologiste a donc voulu mettre à profit ce programme révolutionnaire pour comprendre la loi d'évolution d'un système biologique particulièrement complexe qui présentait de bien étranges récurrences. Eureqa lui a rapidement craché une équation très simple qui non seulement rendait parfaitement compte des observations, mais qui prédisait en plus d'autres motifs cachés qu'on a pu vérifier après coup. Sauf que le sens de l'équation proposée est jusqu'ici resté complètement opaque pour les chercheurs: la formule semble exacte mais on n'arrive pas à interpréter son sens et le mystère n'a fait que s'épaissir. Faute de pouvoir la relier avec d'autres lois connues, la formule découverte ne trouve pas sa place dans notre corpus de connaissance, elle est littéralement indigérable par notre esprit.

Ne pas confondre Eureqa et Eurêka!
Le programme Eureqa fournit des équations mais ne peut déclencher chez son utilisateur le fameux déclic qui marque la compréhension, cet instant délicieux où les choses prenne sens tout à coup en s'associant les unes avec les autres. L'image de la lumière qui s'allume au-dessus de la tête de celui qui vient de comprendre (source: iStockphoto/Kutay Tanir) semble particulièrement bien choisie: cet instant se traduit apparemment par une brutale transition dans le fonctionnement de nos neurones qui synchronisent soudain leurs décharges. C'en est presque lacanien: on raisonne en résonnant dans sa tête. Je n'ai rien trouvé dans la littérature au sujet de la décharge de volupté qui accompagne cet instant précis, mais je suis convaincu qu'il n'y a pas une grande différence de nature entre ce plaisir "intellectuel" et d'autres plaisirs plus charnels. Et il doit en être de même pour certains animaux, puisqu'on a découvert plusieurs dauphins sauvages s'entraînant spontanément à "marcher sur leur queue" rien que pour le plaisir de surmonter ce défi, après avoir côtoyé un de leurs congénères dressé à le faire puis remis en liberté.


Un raccourci pour l'intelligibilité du monde
Revenons à nos moutons. Nous avons, me semble-t-il, tous les éléments d'explications pour comprendre le pouvoir d'attraction des analogies bien choisies. L'analogie est d'autant plus tentante lorsque l'image employée est familière et que son association est naturelle avec l'objet en question. Si en plus, elle apporte une explication simple à un phénomène difficilement compréhensible, elle devient irrésistible. Il est devenu quasiment impossible de parler d'économie autrement que par métaphores sportives ou guerrières, du genre "La France gagne/perd la bataille de l'emploi"; "Le G20 en panne de croissance"; "Le MEDEF fait de la résistance", etc. Les problèmes commencent lorsque l'analogie est à la fois naturelle et biaisée.
- On l'a vu dans la série de billets sur la mondialisation, la fameuse image d'une guerre économique entre les nations est dangereuse car contrairement à la guerre, la
concurrence internationale n'est sûrement pas un jeu à somme nulle.
- Tout aussi trompeuse, l'image du gâteau économique qu'on partage (en parlant des emplois, des richesses etc) puisque bien souvent la taille du gâteau en question dépend en grande partie de la manière dont on choisit de le découper!
- En médecine, l'image de la fièvre brûlant le malade a longtemps conduit à la combattre alors qu'elle est la meilleure défense de l'organisme contre la maladie.
- En polique, la personnification du corps électoral est source des commentaires les plus farfelus ("l'électorat a voulu donner un avertissement mesuré au gouvernement" ou encore "les électeurs ont affiché un soutien prudent à tel candidat") comme si la moyenne des votes reflétait l'opinion de la majorité des votants.
- En biologie, la comparaison du cerveau à un ordinateur super-puissant a la peau dure, alors qu'elle passe sous silence le rôle prépondérant des émotions dans son fonctionnement.
- Il y a enfin les regrettables analogies pseudo-darwiniennes servant à justifier la survie des plus aptes ("survival of the fittest").

Evidemment tous les proverbes sont construits sur des analogies discutables ("on ne fait pas d'omelettes sans casser des oeufs" ou "un tien vaut mieux que deux tu l'auras"), et je ne vais pas m'amuser à en recenser toutes les limites. Mais à titre de salubrité publique, je laisse quand même ce billet ouvert pour y consigner les analogies faussement évidentes à mesure qu'elles me tombent sous le nez...

* Pour illustrer ma thèse toute xochipillesque, je mettrai les images ou les analogies en vert dans ce billet.

Sources:

Jacques Bouveresse: Prodiges et Vertiges de l'analogie

Billets connexes:

Eloge du pifomètre: comment la solution vient au rêveur
Commerce international: un exemple d'égalité! sur les analogies trop évidentes dans le domaine économique
Magic Pavlov: sur les prodiges de l'association mentale

mercredi 17 novembre 2010

Capa ou l'auto-réalisation

Robert Capa a-t-il vraiment existé?
Saviez-vous que l'histoire de Robert Capa est née d'une incroyable supercherie? Tout commence en 1934 lorsque Endre Friedmann, un jeune photographe hongrois arrive à Paris. Sa copine Gerda Pohorylle, une réfugiée juive allemande, tape les légendes de ses photos et lui sert d'agent auprès des rédactions parisiennes. Leur business marche moyennement jusqu'à ce qu'elle ait une idée de génie: ils s'inventent de toutes pièces un personnage dont ils seraient les agents, un célèbre photographe américain, censé être riche, chic et qui vivrait une vie trépidante, entre mondanités et reportages aux quatre coins du monde -donc injoignable. Les deux jeunes gens proposent désormais les photos d'Endre comme étant celles de ce fabuleux Robert Capa dont Gerda se prétend l'agent. Pour être plus crédible elle triple le prix des clichés et ça marche! Il faut dire qu'à l'époque personne ne pouvait googler pour vérifier. La manœuvre finit par être plus ou moins éventée mais cela n'empêcha pas les rédactions de Vu et Regards d'envoyer Endre et Gerda couvrir la guerre civile d'Espagne. Leurs photos (les siennes et celles de Gerda) font le tour du monde. Endre Friedman s'éclipse peu à peu derrière le mythique Robert Capa dont il adopte définitivement le nom. La légende forgée de toutes pièces en 1934 devient peu à peu réalité: après la mort de Gerda, tuée accidentellement pendant la guerre d'Espagne en 1937, Endre-Robert Capa couvre tous les champs de bataille avec un succès extraordinaire. En 1939, il émigre aux Etats-Unis et se fait naturaliser américain. Après la guerre, il mène la vie de flambeur qu'il avait imaginée pour son personnage, buvant des coups avec Hemingway, voyageant avec Steinbeck et jouant au poker avec John Huston. Il papillonne d'une maîtresse à l'autre, vivant dans des hôtels de luxe et dilapidant les fonds de la prestigieuse agence Magnum qu'il a fondée après guerre avec Cartier-Bresson. Et bien sûr il arpente tous les champs de bataille dont il tire des photos légendaires. Sa fin est digne de sa légende: il meurt en reportage, emporté par une mine en Indochine.

Les mystères des prophéties auto-réalisatrices Robert Capa a-t-il vraiment existé? Oui, bien sûr si on le considère simplement comme le pseudo d'Endre Friedmann. Non, si l'on reconnaît que le mensonge initial à son sujet fut sans doute ce qui lui a mis le pied à l'étrier. Le côté indécidable de ce mensonge qui n'en est pas vraiment un chatouille notre logique. Comme le baron de Munchhausen (la source de l'image est ici), qui parvient à se sortir du marais dans lequel il s'est embourbé, lui et son cheval, en tirant très fort sur ses cheveux, le mensonge sur Capa l'extirpe de sa condition et se convertit comme par magie en vérité. Ce processus de "bootstrap" (qui signifie littéralement "se soulever en tirant sur ses lacets") est le propre des prophéties auto-réalisatrices qui ne se réalisent que parce que leur énoncé bouleverse le cours des choses. La parole, pourtant bien humaine, crée la réalité comme si elle était divine et ce n'est sans doute pas un hasard si les oracles de la Pythie fonctionnaient sur ce principe, au grand malheur d'Œdipe. Moins classe mais plus proche de nous, Michael Vendetta est un quidam devenu ultra-célèbre simplement parce qu'il prétendait partout qu'il allait le devenir: la méthode Coué ou encore le wishfull thinking, ça marche... parfois! En tous cas, elles sont une belle illustration de ces réactions en cascade qui me fascinent tant.

Cascades collectives

L'emballement collectif à partir d'une vague déclaration ou d'une rumeur peut avoir des effets spectaculaires. En 1973 la rumeur courut aux Etats-Unis que le choc pétrolier allait entrainer une pénurie de papier toilette. Les gens se sont précipités pour refaire leurs stocks par simple précaution. Ce rush collectif a effectivement entraîné un début de pénurie qui a créé la panique, validant après coup la rumeur. Les bulles financières ou les krach boursiers obéissent au même principe, sans qu'il soit besoin d'incriminer traders ou hedge funds: déjà en 1637 le prix du bulbe de tulipe a atteint vingt fois le salaire annuel d’un artisan, créant la première bulle spéculative de l'histoire. Comment une telle folie est-elle possible? Très simplement: il suffit que chacun raisonne non plus en fonction de ce qu'il pense être le juste prix, mais en fonction de ce qu'il croit être l'opinion du marché sur ce prix (même s'il est lui-même persuadé que le marché se trompe). L'optimisme de quelques-uns provoque l'optimisme des autres qui renforce en retour l'optimisme général. Et l'inverse en cas de krach.


La courbe des prix lors de la Tulipomania, en 1637 (source: Wikipedia)
Même en temps normal, les prophéties auto-réalisatrices sont courantes sur les marchés boursiers. Elles fonctionnent un peu comme les raisonnements par récurrence en maths: pour que le marché soit influencé par le nombre de tâches solaires, il suffit qu'un expert reconnu montre qu'une telle influence a été bel et bien observée par le passé et prédise qu'une telle influence perdurera. Même si tout le monde trouve ça loufoque, chacun aura intérêt à prendre en compte la possibilité que d'autres suivront cette prédiction. Chacun spéculera donc comme s'il croyait lui-même en la prédiction, ce qui la validera à coup sûr. Vous rigolez mais pour le Dow Jones, la corrélation est assez spectaculaire, sans qu'on comprenne exactement pourquoi:

Evolution comparée de la moyenne du Dow Jones (DJIA moyenné sur 11 ans) et le nombre de tâches solaires (source: pdf)

Les sondages peuvent avoir le même effet, lorsque chaque électeur ajuste sa propre stratégie électorale en fonction des sondages, comme s'il s'agissait d'une réalité indifférente à ses propres choix. Les sondages peuvent ainsi crédibiliser telle ou telle candidature. En 2002 ils eurent l'effet inverse (prophétie autodestructrice) puisque les électeurs de gauche dispersèrent leurs votes en croyant acquise la place de Jospin au second tour.
Les boucles inter-individuelles
Si les préjugés ont la vie dure, c'est en partie parce qu'ils possèdent souvent ce don d'auto-réalisation. Nos attentes conscientes (ou inconscientes comme on l'a vu dans ce billet) influencent nos comportements de manière à les confirmer. Cette boucle comportementale connue sous le nom d'effet Pygmalion a été spectaculairement mise en évidence sur des rats de laboratoire. Des chercheurs ont fait croire à des étudiants qu'un groupe de rats (choisis en réalité au hasard) étaient particulièrement doués pour sortir d'un labyrinthe, contrairement à un autre groupe de rats n'ayant aucune aptitude particulière. Les étudiants se sont-ils montrés plus chaleureux ou plus amicaux avec le premier groupe? Toujours est-il que les deux groupes de rats se sont dans l'ensemble comportés conformément à l'étiquette qu'on leur avait attribuée (arbitrairement rappelons-le). De nombreuses expériences du même genre, avec des élèves qu'on présentait comme particulièrement doués à des examinateurs, ont confirmé cet étrange phénomène.

Dans le fond, la plupart des situations conflictuelles procède de ce genre de boucle auto-renforçante lorsque la méfiance de l'un attise celle de l'autre. Pareil pour les comportements pathologiques: la jalousie maladive par exemple ou la paranoïa s'alimentent de tous les efforts que l'entourage fait pour éviter de provoquer une nouvelle crise. Ce n'est pas une blague: on devient vraiment parano quand tout le monde conspire contre soi!

L'auto-suggestion: la capacité à se mentir à soi-même?
Lorsqu'elle fonctionne sans personne d'autre que soi-même, la prophétie auto-réalisatrice prend des allures de mystère. L'effet placebo par exemple, qui fonctionne parce que je crois dans la prédiction que le traitement me soignera. Son jumeau, l'effet nocebo qui fonctionne en sens inverse, est tout aussi spectaculaire.
Plus prosaïquement, l'auto-suggestion est un moteur puissant: on réussit d'autant mieux ce qu'on entreprend qu'on est persuadé (à tort ou à raison) qu'on va y arriver. Et tout comme Robert Capa, on accède rarement aux sommets sans une petite dose de mégalomanie. Est-ce cette évidence psychologique qui expliquerait qu'on ait trouvé en 1991que les meilleurs sportifs sont ceux qui parviennent le mieux à se duper eux-mêmes, c'est-à-dire ceux qui arrivent le plus facilement à être convaincu simultanément d'une chose et de son contraire? Voire que l'Espagne ait remporté la coupe du monde, simplement parce qu'un poulpe le lui avait prédit? Ce drôle de résultat serait en tous cas cohérent avec tout ce qu'on vient de voir: on a plus de chance de l'emporter si l'on est convaincu qu'on peut battre ses adversaires. Mais une telle conviction exige forcément qu'on ne tienne pas compte de toutes ses faiblesses. Autrement dit, pour être un battant il faudrait savoir se mentir un petit peu à soi-même, le moment venu. Tiens tiens...


Sources

La biographie de Robert Capa, sur le site de la BNF qui lui a récemment consacré une exposition.
Wikipedia, comme d'hab

Billets connexes
Conscience en flagrant délire, sur notre bonne-mauvaise foi
Discriminations en cascades, sur la manière dont naissent et s'ancrent les préjugés

dimanche 7 novembre 2010

Le principe de moindre action, un bijou de la physique.

Bon, voilà je savais qu'un jour ou l'autre je n'y couperais pas et c'est arrivé ce week-end. Je me préparais à la question depuis longtemps, collectionnant les explications pédagogiques, les démonstrations plus ou moins compréhensibles et les exégèses historiques sur le sujet. Ce week-end, donc, mon numberone m'a posé LA question qui tue: "d'où ça sort la loi avec les sinus sur la réfraction de la lumière?". Je m'attaque donc à la réponse aujourd'hui et en profite pour vous présenter le "principe de moindre action", une loi physique aussi méconnue que fascinante qui explique aussi bien les lois de l'optique que celle de la mécanique classique, relativiste ou quantique, rien que ça! Billet classé X bien sûr, mais si vous êtes allergiques aux maths vous pouvez quand même suivre ce billet (j'espère!) en sautant simplement les paragraphes réservés aux furieux. C'est parti!

Un peu de réflexion pour commencer.

On sait depuis toujours ou presque (depuis Héron d'Alexandrie au moins) qu'un rayon de lumière se réfléchit sur une surface selon un angle de réflexion (i2 sur la figure) égal à son angle d'incidence (i1), exactement comme une boule de billard rebondit sur une surface perpendiculairement à celle-ci.
 


La règle semble évidente, mais comment l'expliquer? Un indice: la trajectoire obtenue correspond comme par hasard à la plus courte possible, une fois qu'on s'est imposé le point de départ et le point d'arrivée. La démonstration de cette propriété n'est pas trop compliquée (Xochipillette est morte de rire):


Le rayon choisirait-il toujours le chemin le plus court pour relier deux points? Il faut voir, mais ça pourrait expliquer pourquoi il se déplace en ligne droite entre deux obstacles. Tiendrait-on là une loi universelle?

Comment ça, le maître-nageur n'est pas une lumière?
Quand un bâton est plongé dans l'eau il l'air brisé comme sur l'image (source ici) Au XVIIeme siècle, les savants se battaient pour trouver une explication rigoureuse de ce phénomène de réfraction. On se doutait bien que la vitesse de la lumière était différente dans l'air et dans l'eau et Pierre de Fermat se mit en tête de démontrer proprement ce phénomène en partant de l'hypothèse que la lumière suit toujours la trajectoire la plus rapide. Pour comprendre le problème, on prend d'habitude l'image suivante: imaginez un maître-nageur sur la plage, qui aperçoit une personne dans l'eau en train de se noyer. Quelle trajectoire doit-il prendre pour la secourir le plus vite possible, sachant qu'il va plus vite en courant sur la plage qu'en nageant dans la mer?

S'il choisit le parcours en ligne droite, il perdra du temps en nageant trop longtemps. Mieux vaut qu'il coure un peu plus loin pour avoir moins à nager. Pas trop quand même, car sinon il perdra trop de temps à courir! Pas triviale comme question, mais c'est du gâteau pour un génie comme Pierre de Fermat. "Un peu de géométrie pourra nous tirer d'affaire" comme il dit (je reprends ici la solution proposée en commentaire d'un billet d'Alexandre Moatti sur le sujet):
(Pour les furieux seulement)
Dans les triangles rectangles OFH et OFK, on a HF= OF sin i et OK= OF sin r
On en déduit que HF/OK= sin i / sin r = Vair/Veau 
Si on note {XY} le temps de parcours de X à Y on a donc {HF}={OK}
Par ailleurs AL>AO et LF>HF (car les triangles ALO et HLF sont rectangles)

donc AF>AO+HF qu'on peut réécrire en termes de temps de parcours {AF}>{AO}+{HF}
De même {FB} > {KB}
En additionnant ces deux inégalités on obtient {AF}+{FB}>{AO}+{HF}+{KB}
Or on a vu que {HF}={OK} cette inégalité s'écrit donc {AF}+{FB}>{AO}+{OK}+{KB}

donc {AF}+{FB}>{AO}+{OB}ce qui correspond à ce qu'on voulait montrer…

Le raisonnement est exactement le même si vous remplacez le maître-nageur par un rayon lumineux traversant dans deux milieux différents (eau et verre par exemple) en suivant le trajet le plus rapide. Ce qu'on appelle l'indice d'un milieu (noté n) est une quantité inversement proportionnelle à la vitesse de la lumière dans ce milieu. Si la lumière est aussi intelligente que le maître-nageur, elle adoptera le trajet le plus rapide, et passera donc par le même point O défini par la règle n1 sin(i) = n2 sin(r). C'est la loi de réfraction de Snell-Descartes!

Quand Fermat réussit à démontrer ce résultat en 1661 à partir du seul principe de "moindre temps" de la lumière il en est fasciné: "Le fruit de mon travail a été le plus extraordinaire, le plus imprévu et le plus heureux qui fût jamais". Il sent qu'il tient là une loi de la physique très générale qu'il appelle "principe d'économie naturelle", selon lequel "la nature agit toujours par les voies les plus courtes"*. L'histoire allait lui donner raison au-delà de tout ce qu'il pouvait imaginer...

De l'optique à la mécanique: le principe de moindre action
L'approche de Fermat est évidemment troublante pour un esprit rationnel: comment la lumière sait-elle que tel chemin est le le plus court et pas tel autre? Son principe semble par ailleurs violer le principe de causalité: comment le rayon connaît-il le chemin à prendre à partir de sa destination finale? Les esprits pieux de l'époque virent dans ce principe très simple et un peu magique l'expression d'une certaine perfection divine qui gouvernait toutes les lois de la physique. Comme l'écrivait Leibniz par exemple:
"Car étant donné, que la facture du monde tout entier est la plus parfaite qui soit et qu’elle a été exécutée par le créateur le plus sage, il n’arrive absolument rien dans le monde, dans lequel ne se manifeste pas un certain procédé de maximum ou de minimum ; c’est pourquoi on ne peut pas douter que tous les effets du monde puissent être déduits aussi facilement des causes finales, au moyen de la méthode des maxima et des minima, que des causes efficientes elles-mêmes" (cité par Jacques Bouveresse ici).
Autrement dit, Leibniz défendait un argument téléologique, c'est-à-dire qu'on pouvait expliquer les phénomènes naturels non plus à partir de leurs causes (les forces subies etc.) mais à partir de leur finalité. Le principe étant que le résultat obtenu sera obligatoirement le "meilleur" possible, c'est-à-dire un maximum ou un minimum.
Cette explication à l'envers fit sortir Voltaire de ses gonds et lui inspira la fameuse tirade sur Pangloss dans Candide (source de l'image: ici):

"Pangloss enseignait la métaphysico-théologo-cosmolonigologie. Il prouvait admirablement qu'il n'y a point d'effet sans cause, et que, dans ce meilleur des mondes possibles, le château de monseigneur le baron était le plus beau des châteaux et madame la meilleure des baronnes possibles. "Il est démontré, disait-il, que les choses ne peuvent être autrement : car, tout étant fait pour une fin, tout est nécessairement pour la meilleure fin. Remarquez bien que les nez ont été faits pour porter des lunettes, aussi avons-nous des lunettes. Les jambes sont visiblement instituées pour être chaussées, et nous avons des chausses." (Candide, chap1)

Bon, mais il en fallait plus pour arrêter nos scientifiques dans leur quête d'un principe métaphysique. Après tout, les boules de billard se comportent comme des rayons lumineux quand elles roulent en ligne droite ou qu'elles rebondissent contre les parois; Maupertuis généralisa donc l'approche de Fermat à la mécanique et postula en 1744 ce qu'il appela un "principe de moindre action":
"Maintenant, voici ce principe, si sage, si digne de l'être suprême: lorsqu'il arrive quelque changement dans la Nature, la quantité d'Action employée pour ce changement est toujours la plus petite qu'il soit possible."
Plutôt que d'expliquer comme Newton le mouvement d'un corps en décrivant à chaque instant ses variations de vitesse et de position avec des lois du genre accélération= force / masse, Maupertuis conjecturait que l'on peut trouver directement sa trajectoire globale dès lors qu'on en connaît les points de départ et d'arrivée. Sa méthode est audacieuse: parmi toutes les trajectoires possibles et imaginables entre ces deux points, la seule que choisit la nature est celle qui maximise (ou minimise) sa fameuse "action". Un petit schéma vaut mieux qu'une longue explication:
Optimiser oui... mais quoi exactement?
Quelle était cette "action" que la nature s'efforce de rendre extrêmale? Pour Maupertuis, c'était l'accumulation de la quantité de mouvement de la particule, le long de sa trajectoire. De son côté, Euler, qui aida Maupertuis à formaliser proprement sa théorie, penchait plutôt sur l'accumulation d'énergie potentielle (celle que confère l'altitude par exemple), tous les corps cherchant spontanément à se mettre dans l'état d'énergie potentielle la plus faible. Ce fut Lagrange qui mit  tout le monde d'accord  en 1788 avec une formulation générale encore en vigueur aujourd'hui. Dans le cas particulier d'un corps soumis à un potentiel (la gravité, les forces électromagnétiques par exemple), la quantité que la trajectoire réelle minimise à intervalle de temps donné, est la moyenne de la différence entre énergie cinétique (T) et énergie potentielle (U).

Pour les furieux:
L'action de Lagrange s'écrit:



S= action entre les points a (au temps ta) et b (au temps tb)
£= Lagrangien du système, fonction de la position, la vitesse et du temps
T=Energie cinétique (½mv²)
U=Energie potentielle (fonction de la position)
Pour Maupertuis, l'action s'écrivait plutôt:
  
Dans le cas où l'énergie totale est constante et peut s'écrire E=T+U, les deux approches coincident. On peut en effet écrire que T-U = 2T -E = E+T-U = E-2U
Puisque E est une constante, il revient au même de chercher l'extrêmum de T-U (comme le fait Lagrange), de 2T (comme Maupertuis) ou de U (comme Euler)!
On peut aussi démontrer le principe de Fermat en partant de l'action de Lagrange, mais c'est beaucoup plus compliqué!

Non seulement ça marche, mais il montra en plus l'équivalence parfaite entre son principe reformulé de moindre action et toutes les lois (causales) de Newton. (voir la démonstration ici par exemple). Fortiche ce Lagrange. Seulement voilà, je ne sais pas pour vous, mais moi cette histoire de minimisation de la "différence entre énergie cinétique et potentielle" ne me parle pas du tout. Autant je vois bien à quoi correspond la somme de ces énergies -l'énergie totale (E) qui se conserve- autant le sens physique de leur différence (T-U) m'échappe. D'ailleurs  je ne dois pas être le seul, car ce principe de moindre action est souvent vu comme une espèce d'artifice mathématique plus ou moins abscons.  A force de chercher, j'ai pourtant fini par trouver une interprétation physique à chacune des trois expressions de ce principe de moindre action tel qu'exprimé par Lagrange, Maupertuis et Euler. A vous de choisir celle qui vous parle le plus!

Une certaine répugnance à changer de vitesse
L'expression de Maupertuis à base de quantité de mouvement me semble finalement la plus simple à comprendre: pour changer la quantité de mouvement d'un corps il faut une force, il paraît logique que la trajectoire "choisit" soit celle qui évite au maximum de subir l'action de ces forces. J'y voit l'analogue d'une loi du moindre effort, de la résistance au changement etc. Je sollicite par avance l'indulgence du lecteur si je dis une ânerie, mais j'y vois aussi la raison pour laquelle la balle au golf a la facheuse tendance à contourner le trou plutôt que d'y rentrer et d'en ressortir éventuellement.
Selon le principe de Maupertuis la bille emprunte la trajectoire accumulant le moins d'énergie cinétique moyenne en un temps donné (le calcul est dans l'encadré ci-dessus). Or l'énergie cinétique varie avec le carré de la vitesse, donc entre le point de départ et d'arrivée, sa moyenne sera toujours supérieure au carré de la distance parcourue (AB sur le schéma) divisée par le carré du temps imparti (t). Plus la vitesse variera, plus l'énergie cinétique moyenne sera grande.D'après le principe de Maupertuis, la bille "répugnera" donc à emprunter les trajectoires où la vitesse varie dans tous les sens. Si elle doit passer par le trou puis en ressortir, sa vitesse va augmenter brutalement quand elle y plonge puis diminuer quand elle en sort. Pas bon en termes d'action ça! Mieux vaut qu'elle contourne gentiment le trou sans accoups dans sa vitesse et tant pis pour le joueur...

Pourquoi la différence entre énergie cinétique et potentielle?

Laissez une balle verticalement et laissez la retomber dans votre main. Elle monte très vite, ralentit, s'arrête, puis redescend en accélérant. Si on mesure l'évolution de son altitude en fonction du temps, on obtient une courbe parabolique qui ressemble à ça:
La balle passe peu de temps aux basses altitudes (U est alors faible), lorsque sa vitesse est grande (donc T aussi). Comme ces phases de décollage et d'atterrissage sont courtes, elles contribuent peu à la moyenne de T-U sur la durée totale de la trajectoire. Ca tombe bien puisqu'à ce moment là T-U est grand. A l'inverse, la balle passe beaucoup plus de temps à hautes altitudes (quand U est grand), et à faible vitesse (quand T petit). Pas bête la balle, car du coup la faible valeur de T-U contribue pour beaucoup à la moyenne. Bref, la trajectoire de la balle semble bien optimisée. Vous pouvez essayer toutes les autres formes de courbes tarabiscotées, dès lors que départ, arrivée et durée sont fixés, la parabole décrite effectivement par la balle est la courbe qui minimise le plus la moyenne de T-U.

Evidemment ces considérations n'ont pas beaucoup d'intérêt si on reste dans des cas aussi simples. Mais dans la vraie vie, on a souvent affaire à des formes de champs (électromagnétiques notamment) affreusement compliqués dont on peut éventuellement connaître la valeur approchée en tous point de l'espace mais certainement pas l'équation globale. Impossible donc d'appliquer les lois de Newton si on ne connaît pas l'équation du champ! Par contre, l'approche précédente de recherche de trajectoire optimale est super simple: il suffit de simuler informatiquement différentes trajectoires de durée fixe et de calculer pour chacune la quantité totale T-U. accumulée. La trajectoire réelle sera celle qui minimise cette quantité : fastoche!

Des géodésiques dans l'espace?
Revenons un instant sur l'approche de Fermat. La lumière minimise son temps de parcours dans le milieu, autrement dit elle suit une géodésique: une droite quand l'indice du milieu est constant, une courbe lorsqu'il varie. Comme le temps de parcours est proportionnel à l'indice, le trajet réellement emprunté par la lumière est celui qui minimise la moyenne de l'indice le long de la trajectoire. Pour la lumière, un indice élevé a donc exactement le même effet qu'une distance plus grande, autrement dit les variations d'indice indiquent une déformation de la métrique de l'espace pour le rayon lumineux.

Dans le cas d'un corps soumis à des forces dérivant d'un potentiel  (gravité, champ électrique ou magnétique...), on a vu que le principe de moindre action peut s'exprimer comme la minimisation de la moyenne de l'énergie potentielle le long de la trajectoire réelle (c'est l'approche d'Euler). Il y a donc une analogie formelle entre l'indice du milieu pour la lumière et l'énergie potentielle U pour le corps en mouvement. On peut du coup considérer les trajectoires physiques comme des géodésiques d'un espace déformé par un champ d'énergie potentiel. Autrement dit selon le principe de moindre action à la sauce d'Euler, il y a équivalence entre le mouvement d'une particule soumise à un potentiel indépendant du temps dans un espace euclidien et la trajectoire d'une particule libre dans un espace courbe. D'après  Jean-Louis Basdevant (dans son cours sur le sujet) Einstein aurait bien eu cette idée en tête dès 1908 lorsqu'il construisit sa théorie de la relativité générale, théorie qui conclut justement que la gravitation courbe la trajectoire de la lumière de la même manière qu'un changement d'indice optique.

Cela étant, Jacques Léon avec qui j'ai eu le plaisir d'échanger sur ce sujet m'a indiqué les limites de cette analogie dans le cas des corps physiques. L'intensité de l'énergie potentielle pour un objet dépend non seulement de sa position mais aussi de sa masse. Donc le simili-"indice de réfraction gravitationnel" n'est pas une propriété intrinsèque de l'espace puisqu'il dépend de la masse du corps en mouvement. Ce problème-là ne se pose pas avec la lumière car les photons ont une masse nulle: les trajectoires de la lumière sont de vraies géodésiques d'espace-temps alors que les trajectoires des corps massifs n'en sont pas vraiment.

Un principe unificateur fascinant

Depuis que Hamilton et Jacobi lui ont donné sa formulation moderne, le principe de moindre action a trouvé des applications dans tous les domaines.  Le formalisme lagrangien est très pratique car il s'applique à n'importe quel système de coordonnées (sphériques, cylindriques ou composite). Et lorsque le mouvement est contraint par des obstacles ou des liaisons entre éléments d'un système, c'est un jeu d'enfant  que d'intégrer ces contraintes dans les équations de Lagrange (sous forme de multiplicateurs de Lagrange pour ceux que ça intéresse).

Il n'existe à ma connaissance pas un seul domaine de la physique dont l'évolution ne puisse être décrite comme une maximisation ou de minimisation de quelque chose: la forme des bulles de savon, des alvéoles des nids d'abeilles, des spirales de la nature etc. peuvent toujours s'expliquer par la maximisation d'une certaine fonction du système. Le principe de moindre action est la seule théorie qui n'ait pour l'instant jamais été pris en défaut. Mieux, elle permet de retrouver à peu près toutes les lois de la physique! Grâce à lui, Emmy Noether a montré que derrière chaque symétrie des lois de la nature se cache une loi de conservation d'une certaine grandeur physique. David Hilbert a retrouvé les équations de la relativité générale à l'aide de ce principe. Enfin ce principe étrange s'est avéré parfaitement compatible avec les bizarreries de la physique quantique. Au point que Richard Feynman en a fait, avec son concept "d'intégrale de chemin", le fondement de son électrodynamique quantique, théorie qui permet selon lui "de décrire tous les phénomènes du monde physique, à l'exclusion des effets gravitationnels".

Bref, depuis 300 ans le principe de moindre action n'a  cessé d'inspirer toute l'histoire de la physique et je suis fasciné par la quantité et la puissance de ses applications à partir de son énoncé tout simple, voire simpliste. Est-ce parce que son pouvoir d'unification continue de nous effrayer un petit peu qu'il n'est enseigné ni au lycée ni en prépa? A une époque où l'on déplore le désintérêt des jeunes pour la science, on ne perdrait rien à leur montrer ce petit bijou des lois de la nature.

* Pour être exact, la lumière suit toujours un trajet dont la durée est extrêmale: minimale le plus souvent mais il arrive que ce trajet soit maximal. Pour simplifier ce billet qui est déjà bien assez compliqué comme ça, chaque fois que je parle de "minimum" ou de "maximum" il faut lire "extrêmal"...

Sources:
R Feynman: The principle of least Action, special lecture (pdf)
L'article de Wikipedia sur le sujet
Une excellente synthèse (en format ppt) sur le sujet
La conférence de Florence Robine en 2007 (pdf)

Le cours de Jean-Louis Basdevant et Christoph Kopper: Principes variationnels et mécanique analytique (également en pdf)

Billets connexes:
Le théorème de Noether: couteau suisse de la physique
Billet classé (puissance) X: pourquoi on retrouve toujours la suite de Fibonacci dans le cœur des tournesol, les pommes de pin etc...