samedi 13 septembre 2008

La relativité lumineuse même sans lumière

Ordinairement pour expliquer la relativité on commence par des histoires de lumière: comment au XIXeme, on est d'abord arrivé à mesurer sa vitesse dans le vide, puis son drôle de comportement: qu'elle provienne d'une étoile s'approchant de la Terre ou s'en éloignant, la vitesse apparente de la lumière est toujours exactement la même. Cette violation patente de la loi de composition des vitesses (qui exprime simplement le fait que quand vous marchez dans un train, votre vitesse par rapport au sol est la somme de la vitesse du train et de votre vitesse par rapport au train) a bien entendu plongé les scientifiques dans la perplexité. C'est principalement pour expliquer ce phénomène qu'Einstein a reconstruit les bases de la mécanique relativiste, en prenant pour postulat de base que la vitesse de la lumière dans le vide est une constante.

Bien sûr, cette loi a été vérifiée maintes fois expérimentalement et la théorie de la relativité est maintenant totalement admise en dehors de quelques hurluberlus; il y a pourtant dans cette démarche quelque chose qui me laisse sur ma faim: admettre comme postulat une propriété aussi bizarroïde m'a toujours semblé un peu gênant intellectuellement . Certes, cela ne m'empêche pas de dormir la nuit, mais ne peut-on donc retrouver par le seul jeu de l'esprit et des expériences imaginaires la logique de la relativité restreinte? Faut-il vraiment avoir connaissance de l'expérience de Michelson (mettant en évidence pour la première fois l'invariance de la vitesse de la lumière) ou les équations de Maxwell (qui font appel implicitement à cette vitesse constante, sans pour autant la justifier) pour envisager une alternative aux lois de la mécanique Galiléenne?

J'ai fini par trouver mon bonheur dans le livre de Jean Hladik (pour comprendre simplement la théorie de la relativité). Remontant aux publications de Poincaré (de 1904!), Hladik décortique son raisonnement et montre comment Poincaré avait trouvé les équations de la relativité restreinte dès 1904, sans devoir faire appel à l'hypothèse bizarre de l'invariance de la vitesse de la lumière. Je ne peux résister au plaisir de vous livrer une version simplifiée du raisonnement, tant pis si c'est un peu technique, mon prochain billet le sera moins, promis.

Recette de la transformation de Lorentz (préparation: 5 minutes, cuisson:10 minutes):
[Edit du 22/9/2008: je remercie Michel Chrysos, professeur de Physique à l'Université d'Angers et co-inventeur de cette recette, de m'en avoir proposé une amélioration considérable (en rouge dans le texte), permettant de se passer du 4eme postulat.]
Prenez quatre trois postulats tout à fait raisonnables, sur lesquels l'honnête homme ne fera pas (trop) de débat:
1) On postule que les lois de la physique sont les mêmes dans tous les référentiels en translation uniforme les uns par rapport aux autres (=se déplaçant à vitesse constante l'un par rapport à l'autre). C'est le bon vieux principe de la relativité galiléenne qu'on reprend, car c'est dans les vieilles casseroles qu'on fait les meilleures sauces;
2) Ensuite, pour rester dans le classique, on suppose que l'espace est homogène dans toutes les directions: pas de direction privilégiée.
3) Plus original: on postule que l'on sait synchroniser toutes les horloges d'un même référentiel: à un instant donné elles indiquent toutes la même heure.
4) La touche du chef: "La cause d'un événement précède son effet" dans tous les référentiels. Ce qui signifie que si un événement a lieu avant un autre dans un référentiel, l'ordre des deux événements sera le même dans tous les référentiels. Cela revient finalement à dire qu'on ne peut remonter le temps sous peine de tomber dans les paradoxes classiques du type "je tue mon arrière-grand-père, donc je ne peux naitre, donc je ne peux l'avoir tué etc".
Voilà, c'est tout ce qu'il faut postuler.

Pas d'histoire de lumière là-dedans, ni d'invariance de quoique ce soit, vous remarquez? Et pourtant rien qu'en faisant bouillir à feux doux ces quatre petits ingrédients de rien du tout, on a la recette de la relativité. C'est parti pour une petite gymnastique mathématico-culinaire, n'hésitez pas à m'interrompre si je dis une bêtise!
Comme plan de travail, on considère deux référentiels R et R' plans justement, d'origine O et O' et dont les axes Ox et O'x' coïncident. On ne raisonne que sur cet axe, les deux autres directions de l'espace sont supposées communes pour simplifier. Leurs horloges marquent respectivement un temps t et t' et O' s'éloigne de O à la vitesse V constante (vue de O): nos deux référentiels sont bien en translation uniforme l'un par rapport à l'autre.
Le but est d'exprimer x' et t' en fonction de x et de t et de (re)trouver la fameuse transformation de Lorentz assez simplement.

1) Linéarité de la transformation cherchée
Comme l'espace et le temps sont homogènes, la loi reliant ces variables est linéaire et ne peut dépendre que de V:
x'=a(V)x + b(V)t (1)
t'=c(V)t+ d(V)x (2)
où a(V), b(V), c(V) et d(V) sont des fonctions de V uniquement.
2) O' a une vitesse V par rapport à O:
O' a pour coordonnées x'=0 et t'=0 dans son référentiel R', et x=Vt dans le référentiel R. En remplaçant tout ça dans l'équation (1) on obtient V=-b(V)/a(V)
En mettant a(V) en facteur et en changeant le nom des fonctions dans (2), les équations ci-dessus deviennent:
x'= a(V)[x-Vt]
t'= a(V)[C(V)t+D(V)x]
3) Invariance par réflexion dans un miroir:
Le postulat d'homogénéité de l'espace suppose que si l'on gradue Ox et Ox' en sens inverse, on passe des coordonnées (-x') aux coordonnées (-x) par les mêmes équations. V devient -V mais t et t' ne changent pas. On obtient ainsi:
-x'=a(-V)[-x+Vt]
t'=a(-V)[C(-V)t-D(-V)x]

On en conclut que a(-V)=a(V); C(-V)=C(V) et D(-V)=-D(V)
4) Transformation inverse:
Les lois étant les mêmes dans tous les référentiels en translation uniforme, on doit retrouver x et t en appliquant nos formules à x' et t'
x=a(-V)[x'+Vt']=a(V)[x'+Vt']
t=a(-V)[C(-V)t'+D(-V)x']=a(V)[C(V)t'-D(V)x']
En remplaçant x' et t' par leur expressions en fonction de x et t on obtient (j'omets les "(V)" pour alléger):
x=a²[x-Vt+VCt+VDx]=a²[(1+VD)x+V(C-1)t]
t=a²[C²t+CDx-Dx+DVt]=a²[(C-1)Dx+(C²+DV)t]
On en déduit que C(V)=1 et que a²[1+VD(V)]=1
Nos équations deviennent:
x'=a[x-Vt]
t'=a[t+Dx]
5) Composition des transformations (au passage on note que toutes ces hypothèses ne font que traduire l'appartenance de la transformation cherchée à un "groupe", notion chère à Poincarré)
On considère maintenant un troisième référentiel R", d'axe 0"x" aligné sur O'x', mais dont l'origine O" se déplace à la vitesse U par rapport à 0'.
x"=a(U)[x'-Ut']=a(U)a(V)[(1-UD(V))x-(U+V)t]=a(U)a(V)(1-UD(V))[x-(U+V)/(1-UD(V))t]
t"=a(U)[t'+D(U)x']=a(U)a(V)[(1-VD(U))t+(D(U)+D(V))x]

Mais si W est la vitesse de O" par rapport à O, on doit avoir x"=a(W)(x-Wt) et t"=a(W)(t+D(W)x)
En ordonnant et en identifiant terme à terme, on vérifie que l'on a nécessairement
D(V)=kV où k est une constante
et que W=(U+V)/(1-kUV) (3)

Ce qui traduit une loi de composition des vitesses beaucoup plus complexe que celle que nous connaissons en mécanique classique où W=U+V!
Du coup on en déduit que a²(V)=1/(1+kV²) en retenant pour a la valeur positive car a(0)=1
Nos équations deviennent:
x'=a[x-Vt]
t'=a[t+kVx]
6) Quel signe pour k? C'est là qu'intervient le principe du "respect de la causalité"
La constante k à la dimension de l'inverse du carré d'une vitesse. Intéressons nous à son signe.
  • Si k=0, D(V)=0 et a(V)=1 Les équations que l'on obtient sont tout simplement x'=(x-Vt) et t'=t.
    On retrouve les lois galiléennes de passage d'un référentiel à l'autre. Ces lois sont UNE des solutions de notre problème, qui fonctionne pour les petites vitesses. Mais si nous sommes actuellement en train de faire tous ces calculs, c'est pour trouver une formule qui marche aussi pour les grandes vitesses!
  • si k >0,
    Cela signifie que la vitesse composée W de deux vitesses U et V toutes deux positives , est plus grande que la somme des deux vitesses puisque W=(U+V)/(1-kUV). W n'a pas de limite si U et V sont très grands.
    Montrons que dans ce cas, on ne respecte plus le principe de causalité [ceci est une démonstration de mon cru, goûtez-la pour voir si elle vous convainc, je suis preneur de recettes alternatives!].
    Soit deux événements E'1 et E'2, associés respectivement aux coordonnées (x'1, t'1) et (x'2,t'2) dans R' (respectivement sans les ' dans R).
    Si E'1 est la cause de E'2 dans R', alors il lui est antérieur et Δt'=t'2-t'1 est positif dans R'. On suppose que Δx' est également positif.
    Le principe de causalité impose que
    Δt>0 également. Dans le référentiel R, Δt=a(V)(Δt'-kVΔx') avec a(V) positif.
    Or si V est très grand, rien n'empêche V d'être supérieur à
    Δt'/(kΔx') ce qui entrainerait dans ce cas que Δt<0.>


    La somme de deux vitesses U et V s'écrit toujours W=(U+V)/(1-kUV).
    Si k>0, cette égalité implique que deux vitesses U et V toutes deux positives et très grandes, peuvent s'additionner pour donner une vitesse négative: il suffit pour cela que UV>1/k... Résultat absurde.
    Pour éviter cette impossibilité, on peut imaginer que l'on ne puisse jamais avoir UV>1/k, en faisant l'hypothèse qu'il existe une vitesse limite V
    max telle que Vmax²<1/k,>
    Mais dans ce cas, pour U et V=Vmax, W=2Vmax/(1-kVmax²) max
    En simplifiant on obtient kVmax<-1 ce qui est impossible puisque Vmax et k sont positifs.
    Conclusion: k ne peut pas être positif...

  • Donc k est nécessairement négatif, comme il a la dimension inverse du carré d'une vitesse, on peut écrire k=-1/c², c étant une constante ayant la dimension d'une vitesse.

    Voilà, c'est fini! les équations s'écrivent maintenant:
x'=g(x-Vt)
t'=g(t-V/c²x)
avec g=(1/(1-V²/c)

La loi de composition des vitesses (3) s'écrit W=(U+V)/(1+UV/c²) et donc W est toujours plus petit que U et V. Dans cette formule, on voit que c est la vitesse limite de tout référentiel par rapport à un autre.

Il ne reste qu'à trouver la valeur de c. La vitesse de la lumière est une bonne candidate à cette valeur, car justement, on n'a jamais trouvé jusqu'ici de particule dépassant cette vitesse et elle ne change pas, quelque soit le référentiel.

Vous pouvez servir: on retrouve avec ces valeurs, la fameuse transformation de Lorentz, dont découle toute les équations de la relativité restreinte, et notamment celle de E=mc².

La démonstration de Poincaré permet ainsi assez facilement de trouver les équations relativistes:
1) sans avoir à postuler a priori l'invariance de la vitesse de la lumière dans le vide. Si un jour on découvrait que cette invariance n'était pas vraie, cela ne remettrait pas en cause ce modèle;
2) en postulant le respect de la causalité (toute cause précède son effet dans le temps);
3) elle permet d'expliquer pourquoi les très grandes vitesses ne s'additionnent pas "classiquement" mais tendent vers une limite indépassable qui semble bien être celle de la lumière dans le vide. La transformation de Lorentz permet de comprendre pourquoi la vitesse de la lumière ne change pas par changement de référentiel sans postuler cette propriété au départ.

La relativité retrouvée par la pure expérience de pensée, je trouve ça bluffant!