dimanche 7 novembre 2010

Le principe de moindre action, un bijou de la physique.

Bon, voilà je savais qu'un jour ou l'autre je n'y couperais pas et c'est arrivé ce week-end. Je me préparais à la question depuis longtemps, collectionnant les explications pédagogiques, les démonstrations plus ou moins compréhensibles et les exégèses historiques sur le sujet. Ce week-end, donc, mon numberone m'a posé LA question qui tue: "d'où ça sort la loi avec les sinus sur la réfraction de la lumière?". Je m'attaque donc à la réponse aujourd'hui et en profite pour vous présenter le "principe de moindre action", une loi physique aussi méconnue que fascinante qui explique aussi bien les lois de l'optique que celle de la mécanique classique, relativiste ou quantique, rien que ça! Billet classé X bien sûr, mais si vous êtes allergiques aux maths vous pouvez quand même suivre ce billet (j'espère!) en sautant simplement les paragraphes réservés aux furieux. C'est parti!

Un peu de réflexion pour commencer.

On sait depuis toujours ou presque (depuis Héron d'Alexandrie au moins) qu'un rayon de lumière se réfléchit sur une surface selon un angle de réflexion (i2 sur la figure) égal à son angle d'incidence (i1), exactement comme une boule de billard rebondit sur une surface perpendiculairement à celle-ci.
 


La règle semble évidente, mais comment l'expliquer? Un indice: la trajectoire obtenue correspond comme par hasard à la plus courte possible, une fois qu'on s'est imposé le point de départ et le point d'arrivée. La démonstration de cette propriété n'est pas trop compliquée (Xochipillette est morte de rire):


Le rayon choisirait-il toujours le chemin le plus court pour relier deux points? Il faut voir, mais ça pourrait expliquer pourquoi il se déplace en ligne droite entre deux obstacles. Tiendrait-on là une loi universelle?

Comment ça, le maître-nageur n'est pas une lumière?
Quand un bâton est plongé dans l'eau il l'air brisé comme sur l'image (source ici) Au XVIIeme siècle, les savants se battaient pour trouver une explication rigoureuse de ce phénomène de réfraction. On se doutait bien que la vitesse de la lumière était différente dans l'air et dans l'eau et Pierre de Fermat se mit en tête de démontrer proprement ce phénomène en partant de l'hypothèse que la lumière suit toujours la trajectoire la plus rapide. Pour comprendre le problème, on prend d'habitude l'image suivante: imaginez un maître-nageur sur la plage, qui aperçoit une personne dans l'eau en train de se noyer. Quelle trajectoire doit-il prendre pour la secourir le plus vite possible, sachant qu'il va plus vite en courant sur la plage qu'en nageant dans la mer?

S'il choisit le parcours en ligne droite, il perdra du temps en nageant trop longtemps. Mieux vaut qu'il coure un peu plus loin pour avoir moins à nager. Pas trop quand même, car sinon il perdra trop de temps à courir! Pas triviale comme question, mais c'est du gâteau pour un génie comme Pierre de Fermat. "Un peu de géométrie pourra nous tirer d'affaire" comme il dit (je reprends ici la solution proposée en commentaire d'un billet d'Alexandre Moatti sur le sujet):
(Pour les furieux seulement)
Dans les triangles rectangles OFH et OFK, on a HF= OF sin i et OK= OF sin r
On en déduit que HF/OK= sin i / sin r = Vair/Veau 
Si on note {XY} le temps de parcours de X à Y on a donc {HF}={OK}
Par ailleurs AL>AO et LF>HF (car les triangles ALO et HLF sont rectangles)

donc AF>AO+HF qu'on peut réécrire en termes de temps de parcours {AF}>{AO}+{HF}
De même {FB} > {KB}
En additionnant ces deux inégalités on obtient {AF}+{FB}>{AO}+{HF}+{KB}
Or on a vu que {HF}={OK} cette inégalité s'écrit donc {AF}+{FB}>{AO}+{OK}+{KB}

donc {AF}+{FB}>{AO}+{OB}ce qui correspond à ce qu'on voulait montrer…

Le raisonnement est exactement le même si vous remplacez le maître-nageur par un rayon lumineux traversant dans deux milieux différents (eau et verre par exemple) en suivant le trajet le plus rapide. Ce qu'on appelle l'indice d'un milieu (noté n) est une quantité inversement proportionnelle à la vitesse de la lumière dans ce milieu. Si la lumière est aussi intelligente que le maître-nageur, elle adoptera le trajet le plus rapide, et passera donc par le même point O défini par la règle n1 sin(i) = n2 sin(r). C'est la loi de réfraction de Snell-Descartes!

Quand Fermat réussit à démontrer ce résultat en 1661 à partir du seul principe de "moindre temps" de la lumière il en est fasciné: "Le fruit de mon travail a été le plus extraordinaire, le plus imprévu et le plus heureux qui fût jamais". Il sent qu'il tient là une loi de la physique très générale qu'il appelle "principe d'économie naturelle", selon lequel "la nature agit toujours par les voies les plus courtes"*. L'histoire allait lui donner raison au-delà de tout ce qu'il pouvait imaginer...

De l'optique à la mécanique: le principe de moindre action
L'approche de Fermat est évidemment troublante pour un esprit rationnel: comment la lumière sait-elle que tel chemin est le le plus court et pas tel autre? Son principe semble par ailleurs violer le principe de causalité: comment le rayon connaît-il le chemin à prendre à partir de sa destination finale? Les esprits pieux de l'époque virent dans ce principe très simple et un peu magique l'expression d'une certaine perfection divine qui gouvernait toutes les lois de la physique. Comme l'écrivait Leibniz par exemple:
"Car étant donné, que la facture du monde tout entier est la plus parfaite qui soit et qu’elle a été exécutée par le créateur le plus sage, il n’arrive absolument rien dans le monde, dans lequel ne se manifeste pas un certain procédé de maximum ou de minimum ; c’est pourquoi on ne peut pas douter que tous les effets du monde puissent être déduits aussi facilement des causes finales, au moyen de la méthode des maxima et des minima, que des causes efficientes elles-mêmes" (cité par Jacques Bouveresse ici).
Autrement dit, Leibniz défendait un argument téléologique, c'est-à-dire qu'on pouvait expliquer les phénomènes naturels non plus à partir de leurs causes (les forces subies etc.) mais à partir de leur finalité. Le principe étant que le résultat obtenu sera obligatoirement le "meilleur" possible, c'est-à-dire un maximum ou un minimum.
Cette explication à l'envers fit sortir Voltaire de ses gonds et lui inspira la fameuse tirade sur Pangloss dans Candide (source de l'image: ici):

"Pangloss enseignait la métaphysico-théologo-cosmolonigologie. Il prouvait admirablement qu'il n'y a point d'effet sans cause, et que, dans ce meilleur des mondes possibles, le château de monseigneur le baron était le plus beau des châteaux et madame la meilleure des baronnes possibles. "Il est démontré, disait-il, que les choses ne peuvent être autrement : car, tout étant fait pour une fin, tout est nécessairement pour la meilleure fin. Remarquez bien que les nez ont été faits pour porter des lunettes, aussi avons-nous des lunettes. Les jambes sont visiblement instituées pour être chaussées, et nous avons des chausses." (Candide, chap1)

Bon, mais il en fallait plus pour arrêter nos scientifiques dans leur quête d'un principe métaphysique. Après tout, les boules de billard se comportent comme des rayons lumineux quand elles roulent en ligne droite ou qu'elles rebondissent contre les parois; Maupertuis généralisa donc l'approche de Fermat à la mécanique et postula en 1744 ce qu'il appela un "principe de moindre action":
"Maintenant, voici ce principe, si sage, si digne de l'être suprême: lorsqu'il arrive quelque changement dans la Nature, la quantité d'Action employée pour ce changement est toujours la plus petite qu'il soit possible."
Plutôt que d'expliquer comme Newton le mouvement d'un corps en décrivant à chaque instant ses variations de vitesse et de position avec des lois du genre accélération= force / masse, Maupertuis conjecturait que l'on peut trouver directement sa trajectoire globale dès lors qu'on en connaît les points de départ et d'arrivée. Sa méthode est audacieuse: parmi toutes les trajectoires possibles et imaginables entre ces deux points, la seule que choisit la nature est celle qui maximise (ou minimise) sa fameuse "action". Un petit schéma vaut mieux qu'une longue explication:
Optimiser oui... mais quoi exactement?
Quelle était cette "action" que la nature s'efforce de rendre extrêmale? Pour Maupertuis, c'était l'accumulation de la quantité de mouvement de la particule, le long de sa trajectoire. De son côté, Euler, qui aida Maupertuis à formaliser proprement sa théorie, penchait plutôt sur l'accumulation d'énergie potentielle (celle que confère l'altitude par exemple), tous les corps cherchant spontanément à se mettre dans l'état d'énergie potentielle la plus faible. Ce fut Lagrange qui mit  tout le monde d'accord  en 1788 avec une formulation générale encore en vigueur aujourd'hui. Dans le cas particulier d'un corps soumis à un potentiel (la gravité, les forces électromagnétiques par exemple), la quantité que la trajectoire réelle minimise à intervalle de temps donné, est la moyenne de la différence entre énergie cinétique (T) et énergie potentielle (U).

Pour les furieux:
L'action de Lagrange s'écrit:



S= action entre les points a (au temps ta) et b (au temps tb)
£= Lagrangien du système, fonction de la position, la vitesse et du temps
T=Energie cinétique (½mv²)
U=Energie potentielle (fonction de la position)
Pour Maupertuis, l'action s'écrivait plutôt:
  
Dans le cas où l'énergie totale est constante et peut s'écrire E=T+U, les deux approches coincident. On peut en effet écrire que T-U = 2T -E = E+T-U = E-2U
Puisque E est une constante, il revient au même de chercher l'extrêmum de T-U (comme le fait Lagrange), de 2T (comme Maupertuis) ou de U (comme Euler)!
On peut aussi démontrer le principe de Fermat en partant de l'action de Lagrange, mais c'est beaucoup plus compliqué!

Non seulement ça marche, mais il montra en plus l'équivalence parfaite entre son principe reformulé de moindre action et toutes les lois (causales) de Newton. (voir la démonstration ici par exemple). Fortiche ce Lagrange. Seulement voilà, je ne sais pas pour vous, mais moi cette histoire de minimisation de la "différence entre énergie cinétique et potentielle" ne me parle pas du tout. Autant je vois bien à quoi correspond la somme de ces énergies -l'énergie totale (E) qui se conserve- autant le sens physique de leur différence (T-U) m'échappe. D'ailleurs  je ne dois pas être le seul, car ce principe de moindre action est souvent vu comme une espèce d'artifice mathématique plus ou moins abscons.  A force de chercher, j'ai pourtant fini par trouver une interprétation physique à chacune des trois expressions de ce principe de moindre action tel qu'exprimé par Lagrange, Maupertuis et Euler. A vous de choisir celle qui vous parle le plus!

Une certaine répugnance à changer de vitesse
L'expression de Maupertuis à base de quantité de mouvement me semble finalement la plus simple à comprendre: pour changer la quantité de mouvement d'un corps il faut une force, il paraît logique que la trajectoire "choisit" soit celle qui évite au maximum de subir l'action de ces forces. J'y voit l'analogue d'une loi du moindre effort, de la résistance au changement etc. Je sollicite par avance l'indulgence du lecteur si je dis une ânerie, mais j'y vois aussi la raison pour laquelle la balle au golf a la facheuse tendance à contourner le trou plutôt que d'y rentrer et d'en ressortir éventuellement.
Selon le principe de Maupertuis la bille emprunte la trajectoire accumulant le moins d'énergie cinétique moyenne en un temps donné (le calcul est dans l'encadré ci-dessus). Or l'énergie cinétique varie avec le carré de la vitesse, donc entre le point de départ et d'arrivée, sa moyenne sera toujours supérieure au carré de la distance parcourue (AB sur le schéma) divisée par le carré du temps imparti (t). Plus la vitesse variera, plus l'énergie cinétique moyenne sera grande.D'après le principe de Maupertuis, la bille "répugnera" donc à emprunter les trajectoires où la vitesse varie dans tous les sens. Si elle doit passer par le trou puis en ressortir, sa vitesse va augmenter brutalement quand elle y plonge puis diminuer quand elle en sort. Pas bon en termes d'action ça! Mieux vaut qu'elle contourne gentiment le trou sans accoups dans sa vitesse et tant pis pour le joueur...

Pourquoi la différence entre énergie cinétique et potentielle?

Laissez une balle verticalement et laissez la retomber dans votre main. Elle monte très vite, ralentit, s'arrête, puis redescend en accélérant. Si on mesure l'évolution de son altitude en fonction du temps, on obtient une courbe parabolique qui ressemble à ça:
La balle passe peu de temps aux basses altitudes (U est alors faible), lorsque sa vitesse est grande (donc T aussi). Comme ces phases de décollage et d'atterrissage sont courtes, elles contribuent peu à la moyenne de T-U sur la durée totale de la trajectoire. Ca tombe bien puisqu'à ce moment là T-U est grand. A l'inverse, la balle passe beaucoup plus de temps à hautes altitudes (quand U est grand), et à faible vitesse (quand T petit). Pas bête la balle, car du coup la faible valeur de T-U contribue pour beaucoup à la moyenne. Bref, la trajectoire de la balle semble bien optimisée. Vous pouvez essayer toutes les autres formes de courbes tarabiscotées, dès lors que départ, arrivée et durée sont fixés, la parabole décrite effectivement par la balle est la courbe qui minimise le plus la moyenne de T-U.

Evidemment ces considérations n'ont pas beaucoup d'intérêt si on reste dans des cas aussi simples. Mais dans la vraie vie, on a souvent affaire à des formes de champs (électromagnétiques notamment) affreusement compliqués dont on peut éventuellement connaître la valeur approchée en tous point de l'espace mais certainement pas l'équation globale. Impossible donc d'appliquer les lois de Newton si on ne connaît pas l'équation du champ! Par contre, l'approche précédente de recherche de trajectoire optimale est super simple: il suffit de simuler informatiquement différentes trajectoires de durée fixe et de calculer pour chacune la quantité totale T-U. accumulée. La trajectoire réelle sera celle qui minimise cette quantité : fastoche!

Des géodésiques dans l'espace?
Revenons un instant sur l'approche de Fermat. La lumière minimise son temps de parcours dans le milieu, autrement dit elle suit une géodésique: une droite quand l'indice du milieu est constant, une courbe lorsqu'il varie. Comme le temps de parcours est proportionnel à l'indice, le trajet réellement emprunté par la lumière est celui qui minimise la moyenne de l'indice le long de la trajectoire. Pour la lumière, un indice élevé a donc exactement le même effet qu'une distance plus grande, autrement dit les variations d'indice indiquent une déformation de la métrique de l'espace pour le rayon lumineux.

Dans le cas d'un corps soumis à des forces dérivant d'un potentiel  (gravité, champ électrique ou magnétique...), on a vu que le principe de moindre action peut s'exprimer comme la minimisation de la moyenne de l'énergie potentielle le long de la trajectoire réelle (c'est l'approche d'Euler). Il y a donc une analogie formelle entre l'indice du milieu pour la lumière et l'énergie potentielle U pour le corps en mouvement. On peut du coup considérer les trajectoires physiques comme des géodésiques d'un espace déformé par un champ d'énergie potentiel. Autrement dit selon le principe de moindre action à la sauce d'Euler, il y a équivalence entre le mouvement d'une particule soumise à un potentiel indépendant du temps dans un espace euclidien et la trajectoire d'une particule libre dans un espace courbe. D'après  Jean-Louis Basdevant (dans son cours sur le sujet) Einstein aurait bien eu cette idée en tête dès 1908 lorsqu'il construisit sa théorie de la relativité générale, théorie qui conclut justement que la gravitation courbe la trajectoire de la lumière de la même manière qu'un changement d'indice optique.

Cela étant, Jacques Léon avec qui j'ai eu le plaisir d'échanger sur ce sujet m'a indiqué les limites de cette analogie dans le cas des corps physiques. L'intensité de l'énergie potentielle pour un objet dépend non seulement de sa position mais aussi de sa masse. Donc le simili-"indice de réfraction gravitationnel" n'est pas une propriété intrinsèque de l'espace puisqu'il dépend de la masse du corps en mouvement. Ce problème-là ne se pose pas avec la lumière car les photons ont une masse nulle: les trajectoires de la lumière sont de vraies géodésiques d'espace-temps alors que les trajectoires des corps massifs n'en sont pas vraiment.

Un principe unificateur fascinant

Depuis que Hamilton et Jacobi lui ont donné sa formulation moderne, le principe de moindre action a trouvé des applications dans tous les domaines.  Le formalisme lagrangien est très pratique car il s'applique à n'importe quel système de coordonnées (sphériques, cylindriques ou composite). Et lorsque le mouvement est contraint par des obstacles ou des liaisons entre éléments d'un système, c'est un jeu d'enfant  que d'intégrer ces contraintes dans les équations de Lagrange (sous forme de multiplicateurs de Lagrange pour ceux que ça intéresse).

Il n'existe à ma connaissance pas un seul domaine de la physique dont l'évolution ne puisse être décrite comme une maximisation ou de minimisation de quelque chose: la forme des bulles de savon, des alvéoles des nids d'abeilles, des spirales de la nature etc. peuvent toujours s'expliquer par la maximisation d'une certaine fonction du système. Le principe de moindre action est la seule théorie qui n'ait pour l'instant jamais été pris en défaut. Mieux, elle permet de retrouver à peu près toutes les lois de la physique! Grâce à lui, Emmy Noether a montré que derrière chaque symétrie des lois de la nature se cache une loi de conservation d'une certaine grandeur physique. David Hilbert a retrouvé les équations de la relativité générale à l'aide de ce principe. Enfin ce principe étrange s'est avéré parfaitement compatible avec les bizarreries de la physique quantique. Au point que Richard Feynman en a fait, avec son concept "d'intégrale de chemin", le fondement de son électrodynamique quantique, théorie qui permet selon lui "de décrire tous les phénomènes du monde physique, à l'exclusion des effets gravitationnels".

Bref, depuis 300 ans le principe de moindre action n'a  cessé d'inspirer toute l'histoire de la physique et je suis fasciné par la quantité et la puissance de ses applications à partir de son énoncé tout simple, voire simpliste. Est-ce parce que son pouvoir d'unification continue de nous effrayer un petit peu qu'il n'est enseigné ni au lycée ni en prépa? A une époque où l'on déplore le désintérêt des jeunes pour la science, on ne perdrait rien à leur montrer ce petit bijou des lois de la nature.

* Pour être exact, la lumière suit toujours un trajet dont la durée est extrêmale: minimale le plus souvent mais il arrive que ce trajet soit maximal. Pour simplifier ce billet qui est déjà bien assez compliqué comme ça, chaque fois que je parle de "minimum" ou de "maximum" il faut lire "extrêmal"...

Sources:
R Feynman: The principle of least Action, special lecture (pdf)
L'article de Wikipedia sur le sujet
Une excellente synthèse (en format ppt) sur le sujet
La conférence de Florence Robine en 2007 (pdf)

Le cours de Jean-Louis Basdevant et Christoph Kopper: Principes variationnels et mécanique analytique (également en pdf)

Billets connexes:
Le théorème de Noether: couteau suisse de la physique
Billet classé (puissance) X: pourquoi on retrouve toujours la suite de Fibonacci dans le cœur des tournesol, les pommes de pin etc...