mardi 23 septembre 2008

Born again Thalès

La légende
- Rolala, le prof nous a dit que la semaine prochaine on allait apprendre Thalès. Rien que le nom, ça a l'air compliquéééééééé!!! me dit mon numberone.
Pas de panique, fiston. Thalès c'est d'abord une légende: l'histoire veut que
ce savant grec du VIe siècle avant JC, arrivé à Khéops se trouva mis au défi par le pharaon de l'époque de mesurer la hauteur de la gigantesque pyramide, sans autre instrument qu'une simple corde. Il s'assit par terre, et se mit à songer devant l'ombre de la pyramide: cette ombre est bien proportionnelle à la hauteur de ma pyramide, se dit-il, mais dans quelle proportion? Contemplant alors sa propre ombre, notre savant réalisa qu'à une heure donnée, toutes les ombres étaient proportionnelles à la hauteur des objets! Il mesura alors sur le sol la taille de son ombre et en la comparant avec sa propre hauteur, il calcula ce facteur de proportionnalité pour obtenir la hauteur cherchée. C'est ainsi qu'il pu estimer la hauteur de la pyramide à 67 fois sa propre hauteur.

Une élégante démonstration du théorème de Thalès pour un triangle rectangle

Cette histoire est sans doute une légende mais elle a le mérite d'être facile à retenir. Elle constitue également une élégante manière de démontrer le fameux théorème du même nom, sans calcul et sans connaître grand chose à part le théorème de Pythagore. Presque pas de calculs, c'est promis!

Reprenons notre bonhomme Thalès, sa pyramide et leurs ombres et symbolisons-les, de profil bien sûr (on est en Egypte) par des triangles. Si ce n'est pas Numérobis qui a construit la pyramide, et si Thalès se tient droit, nos triangles sont rectangles. Les hypoténuses de ces triangles sont les rayons du soleil qui sont tous parallèles entre eux. Nos deux triangles rectangles ont donc deux de leurs angles égaux entre eux (on dit qu'ils sont semblables).

Dessinons-les maintenant (triangles I et II), mais en les disposant comme sur la figure ci-contre. Construisons les rectangles dans lesquels ils s'inscrivent: on a appelé I' l'aire du triangle complémentaire de I (en blanc), et II' le complémentaire de II. III est le rectangle en bas à droite et III' le petit rectangle qui ferme le grand triangle blanc en haut à gauche.

Par construction, on a I'=I; II'=II et l'aire du grand triangle bleu est égale à celle du grand triangle blanc s'écrit I+II+III=I'+II'+III'
On en déduit donc que III'=III
Comme III=xb (l'aire d'un rectangle vaut le produit de ses côtés) et III'=ay, alors xb=ay
Egalité qui s'écrit encore y/x=b/a.

Ce rapport est le facteur de proportionnalité entre les objets et leurs ombres, celui qui a permis à Thalès de calculer la taille de la pyramide (y) à partir de son ombre (a), sa propre taille(b) et l'ombre de la pyramide (x) par la relation y=xb/a.

Traditionnellement, le théorème de Thalès s'exprime sous l'autre forme:
y/b=x/a

En appliquant la relation de Pythagore (x²+y²=z² et a²+b²=c²), on a également
z²=x²+y²=x² (1+b²/a²)=x²c²/a²
z=xc/a

D'où la relation z/c=x/a=y/b qui traduit simplement le fait que deux triangles rectangles semblables (=ayant les mêmes angles) ont leurs côtés proportionnels deux à deux. Voilà le théorème de Thalès démontré pour un triangle rectangle. Le plus dur est fait!

Généralisation à un triangle quelconque

Et pour des triangles quelconques, ça marche aussi, dis?







Procédons de la même façon pour les deux triangles ABC et AB'C' d'angles égaux. On décompose chaque triangle en une somme de deux triangles rectangles (ABD et BCD d'un côté, AB'D' et B'C'D' de l'autre). Les triangles rectangles sont semblables deux à deux et on peut leur appliquer à chacun les formules de proportionnalité que l'on vient de trouver. En rassemblant les égalités indiquées sur la figure, et en mélangeant très fort on obtient: AB'/AB=B'C'/BC. En décomposant différemment le triangle ABC (par deux triangles rectangles coupant le côté AB perpendiculairement par exemple), on obtient finalement:

AB'/AB=B'C'/BC=AC'/AC


Moralité: deux triangles semblables quelconques (c'est à dire ayant les mêmes angles) ont leurs côtés proportionnels deux à deux. Le théorème de Thalès ne dit rien d'autre:
Soit un triangle ABC, et deux points D et E des droites (AB) et (AC) de sorte que la droite (DE) soit parallèle à la droite (BC) (comme indiqué sur la figure ci-contre). Alors on a :
\frac{AD}{AB}=\frac{AE}{AC}=\frac{DE}{BC}




Quelques applications amusantes

Que veulent dire ces drôles d'égalités: c'est archi simple! Si A est un vidéo-projecteur et DE l'écran sur lequel on projette le film, le théorème de Thalès dit simplement que si l'on double l'éloignement de l'écran (AB=2AD), la taille de l'image doublera aussi (BC=2DE)...

On peut se servir du théorème de Thalès pour faire des divisions, comme sur la figure ci-contre: pour savoir combien vaut y/x, on place B sur l'axe horizontal tel que AB=y, puis un segment vertical BC de longueur x. On trace ABC et l'on repère le point C' tel que B'C'=1. En appliquant nos formules, on trouve bien que AB'=y/x



Pour faire des multiplications, c'est presque pareil, sauf qu'on trace d'abord AB'=y, puis B'C'=1. On trace la droite AC' sur laquelle on repère le point C tel que CB=x. En appliquant nos formules, on trouve AB=xy...

Thalès est l'inventeur de la première règle à calcul!

Pour la petite histoire, il semble que bien avant Thalès, Euclide avait déjà démontré ces formules et que la proportionnalité des longueurs de triangles semblables soit une propriété découverte par les Égyptiens et les Babyloniens plus de mille ans avant. Mais ils n'avaient probablement pas une aussi belle histoire à raconter que celle des pyramides...

Références:
le site de Wikipedia sur Thalès et son théorème, démontré de manière plus classique en calculant l'aire d'un triangle à partir du produit de sa hauteur par sa base.
Une autre démonstration tout en image ici.

samedi 13 septembre 2008

La relativité lumineuse même sans lumière

Ordinairement pour expliquer la relativité on commence par des histoires de lumière: comment au XIXeme, on est d'abord arrivé à mesurer sa vitesse dans le vide, puis son drôle de comportement: qu'elle provienne d'une étoile s'approchant de la Terre ou s'en éloignant, la vitesse apparente de la lumière est toujours exactement la même. Cette violation patente de la loi de composition des vitesses (qui exprime simplement le fait que quand vous marchez dans un train, votre vitesse par rapport au sol est la somme de la vitesse du train et de votre vitesse par rapport au train) a bien entendu plongé les scientifiques dans la perplexité. C'est principalement pour expliquer ce phénomène qu'Einstein a reconstruit les bases de la mécanique relativiste, en prenant pour postulat de base que la vitesse de la lumière dans le vide est une constante.

Bien sûr, cette loi a été vérifiée maintes fois expérimentalement et la théorie de la relativité est maintenant totalement admise en dehors de quelques hurluberlus; il y a pourtant dans cette démarche quelque chose qui me laisse sur ma faim: admettre comme postulat une propriété aussi bizarroïde m'a toujours semblé un peu gênant intellectuellement . Certes, cela ne m'empêche pas de dormir la nuit, mais ne peut-on donc retrouver par le seul jeu de l'esprit et des expériences imaginaires la logique de la relativité restreinte? Faut-il vraiment avoir connaissance de l'expérience de Michelson (mettant en évidence pour la première fois l'invariance de la vitesse de la lumière) ou les équations de Maxwell (qui font appel implicitement à cette vitesse constante, sans pour autant la justifier) pour envisager une alternative aux lois de la mécanique Galiléenne?

J'ai fini par trouver mon bonheur dans le livre de Jean Hladik (pour comprendre simplement la théorie de la relativité). Remontant aux publications de Poincaré (de 1904!), Hladik décortique son raisonnement et montre comment Poincaré avait trouvé les équations de la relativité restreinte dès 1904, sans devoir faire appel à l'hypothèse bizarre de l'invariance de la vitesse de la lumière. Je ne peux résister au plaisir de vous livrer une version simplifiée du raisonnement, tant pis si c'est un peu technique, mon prochain billet le sera moins, promis.

Recette de la transformation de Lorentz (préparation: 5 minutes, cuisson:10 minutes):
[Edit du 22/9/2008: je remercie Michel Chrysos, professeur de Physique à l'Université d'Angers et co-inventeur de cette recette, de m'en avoir proposé une amélioration considérable (en rouge dans le texte), permettant de se passer du 4eme postulat.]
Prenez quatre trois postulats tout à fait raisonnables, sur lesquels l'honnête homme ne fera pas (trop) de débat:
1) On postule que les lois de la physique sont les mêmes dans tous les référentiels en translation uniforme les uns par rapport aux autres (=se déplaçant à vitesse constante l'un par rapport à l'autre). C'est le bon vieux principe de la relativité galiléenne qu'on reprend, car c'est dans les vieilles casseroles qu'on fait les meilleures sauces;
2) Ensuite, pour rester dans le classique, on suppose que l'espace est homogène dans toutes les directions: pas de direction privilégiée.
3) Plus original: on postule que l'on sait synchroniser toutes les horloges d'un même référentiel: à un instant donné elles indiquent toutes la même heure.
4) La touche du chef: "La cause d'un événement précède son effet" dans tous les référentiels. Ce qui signifie que si un événement a lieu avant un autre dans un référentiel, l'ordre des deux événements sera le même dans tous les référentiels. Cela revient finalement à dire qu'on ne peut remonter le temps sous peine de tomber dans les paradoxes classiques du type "je tue mon arrière-grand-père, donc je ne peux naitre, donc je ne peux l'avoir tué etc".
Voilà, c'est tout ce qu'il faut postuler.

Pas d'histoire de lumière là-dedans, ni d'invariance de quoique ce soit, vous remarquez? Et pourtant rien qu'en faisant bouillir à feux doux ces quatre petits ingrédients de rien du tout, on a la recette de la relativité. C'est parti pour une petite gymnastique mathématico-culinaire, n'hésitez pas à m'interrompre si je dis une bêtise!
Comme plan de travail, on considère deux référentiels R et R' plans justement, d'origine O et O' et dont les axes Ox et O'x' coïncident. On ne raisonne que sur cet axe, les deux autres directions de l'espace sont supposées communes pour simplifier. Leurs horloges marquent respectivement un temps t et t' et O' s'éloigne de O à la vitesse V constante (vue de O): nos deux référentiels sont bien en translation uniforme l'un par rapport à l'autre.
Le but est d'exprimer x' et t' en fonction de x et de t et de (re)trouver la fameuse transformation de Lorentz assez simplement.

1) Linéarité de la transformation cherchée
Comme l'espace et le temps sont homogènes, la loi reliant ces variables est linéaire et ne peut dépendre que de V:
x'=a(V)x + b(V)t (1)
t'=c(V)t+ d(V)x (2)
où a(V), b(V), c(V) et d(V) sont des fonctions de V uniquement.
2) O' a une vitesse V par rapport à O:
O' a pour coordonnées x'=0 et t'=0 dans son référentiel R', et x=Vt dans le référentiel R. En remplaçant tout ça dans l'équation (1) on obtient V=-b(V)/a(V)
En mettant a(V) en facteur et en changeant le nom des fonctions dans (2), les équations ci-dessus deviennent:
x'= a(V)[x-Vt]
t'= a(V)[C(V)t+D(V)x]
3) Invariance par réflexion dans un miroir:
Le postulat d'homogénéité de l'espace suppose que si l'on gradue Ox et Ox' en sens inverse, on passe des coordonnées (-x') aux coordonnées (-x) par les mêmes équations. V devient -V mais t et t' ne changent pas. On obtient ainsi:
-x'=a(-V)[-x+Vt]
t'=a(-V)[C(-V)t-D(-V)x]

On en conclut que a(-V)=a(V); C(-V)=C(V) et D(-V)=-D(V)
4) Transformation inverse:
Les lois étant les mêmes dans tous les référentiels en translation uniforme, on doit retrouver x et t en appliquant nos formules à x' et t'
x=a(-V)[x'+Vt']=a(V)[x'+Vt']
t=a(-V)[C(-V)t'+D(-V)x']=a(V)[C(V)t'-D(V)x']
En remplaçant x' et t' par leur expressions en fonction de x et t on obtient (j'omets les "(V)" pour alléger):
x=a²[x-Vt+VCt+VDx]=a²[(1+VD)x+V(C-1)t]
t=a²[C²t+CDx-Dx+DVt]=a²[(C-1)Dx+(C²+DV)t]
On en déduit que C(V)=1 et que a²[1+VD(V)]=1
Nos équations deviennent:
x'=a[x-Vt]
t'=a[t+Dx]
5) Composition des transformations (au passage on note que toutes ces hypothèses ne font que traduire l'appartenance de la transformation cherchée à un "groupe", notion chère à Poincarré)
On considère maintenant un troisième référentiel R", d'axe 0"x" aligné sur O'x', mais dont l'origine O" se déplace à la vitesse U par rapport à 0'.
x"=a(U)[x'-Ut']=a(U)a(V)[(1-UD(V))x-(U+V)t]=a(U)a(V)(1-UD(V))[x-(U+V)/(1-UD(V))t]
t"=a(U)[t'+D(U)x']=a(U)a(V)[(1-VD(U))t+(D(U)+D(V))x]

Mais si W est la vitesse de O" par rapport à O, on doit avoir x"=a(W)(x-Wt) et t"=a(W)(t+D(W)x)
En ordonnant et en identifiant terme à terme, on vérifie que l'on a nécessairement
D(V)=kV où k est une constante
et que W=(U+V)/(1-kUV) (3)

Ce qui traduit une loi de composition des vitesses beaucoup plus complexe que celle que nous connaissons en mécanique classique où W=U+V!
Du coup on en déduit que a²(V)=1/(1+kV²) en retenant pour a la valeur positive car a(0)=1
Nos équations deviennent:
x'=a[x-Vt]
t'=a[t+kVx]
6) Quel signe pour k? C'est là qu'intervient le principe du "respect de la causalité"
La constante k à la dimension de l'inverse du carré d'une vitesse. Intéressons nous à son signe.
  • Si k=0, D(V)=0 et a(V)=1 Les équations que l'on obtient sont tout simplement x'=(x-Vt) et t'=t.
    On retrouve les lois galiléennes de passage d'un référentiel à l'autre. Ces lois sont UNE des solutions de notre problème, qui fonctionne pour les petites vitesses. Mais si nous sommes actuellement en train de faire tous ces calculs, c'est pour trouver une formule qui marche aussi pour les grandes vitesses!
  • si k >0,
    Cela signifie que la vitesse composée W de deux vitesses U et V toutes deux positives , est plus grande que la somme des deux vitesses puisque W=(U+V)/(1-kUV). W n'a pas de limite si U et V sont très grands.
    Montrons que dans ce cas, on ne respecte plus le principe de causalité [ceci est une démonstration de mon cru, goûtez-la pour voir si elle vous convainc, je suis preneur de recettes alternatives!].
    Soit deux événements E'1 et E'2, associés respectivement aux coordonnées (x'1, t'1) et (x'2,t'2) dans R' (respectivement sans les ' dans R).
    Si E'1 est la cause de E'2 dans R', alors il lui est antérieur et Δt'=t'2-t'1 est positif dans R'. On suppose que Δx' est également positif.
    Le principe de causalité impose que
    Δt>0 également. Dans le référentiel R, Δt=a(V)(Δt'-kVΔx') avec a(V) positif.
    Or si V est très grand, rien n'empêche V d'être supérieur à
    Δt'/(kΔx') ce qui entrainerait dans ce cas que Δt<0.>


    La somme de deux vitesses U et V s'écrit toujours W=(U+V)/(1-kUV).
    Si k>0, cette égalité implique que deux vitesses U et V toutes deux positives et très grandes, peuvent s'additionner pour donner une vitesse négative: il suffit pour cela que UV>1/k... Résultat absurde.
    Pour éviter cette impossibilité, on peut imaginer que l'on ne puisse jamais avoir UV>1/k, en faisant l'hypothèse qu'il existe une vitesse limite V
    max telle que Vmax²<1/k,>
    Mais dans ce cas, pour U et V=Vmax, W=2Vmax/(1-kVmax²) max
    En simplifiant on obtient kVmax<-1 ce qui est impossible puisque Vmax et k sont positifs.
    Conclusion: k ne peut pas être positif...

  • Donc k est nécessairement négatif, comme il a la dimension inverse du carré d'une vitesse, on peut écrire k=-1/c², c étant une constante ayant la dimension d'une vitesse.

    Voilà, c'est fini! les équations s'écrivent maintenant:
x'=g(x-Vt)
t'=g(t-V/c²x)
avec g=(1/(1-V²/c)

La loi de composition des vitesses (3) s'écrit W=(U+V)/(1+UV/c²) et donc W est toujours plus petit que U et V. Dans cette formule, on voit que c est la vitesse limite de tout référentiel par rapport à un autre.

Il ne reste qu'à trouver la valeur de c. La vitesse de la lumière est une bonne candidate à cette valeur, car justement, on n'a jamais trouvé jusqu'ici de particule dépassant cette vitesse et elle ne change pas, quelque soit le référentiel.

Vous pouvez servir: on retrouve avec ces valeurs, la fameuse transformation de Lorentz, dont découle toute les équations de la relativité restreinte, et notamment celle de E=mc².

La démonstration de Poincaré permet ainsi assez facilement de trouver les équations relativistes:
1) sans avoir à postuler a priori l'invariance de la vitesse de la lumière dans le vide. Si un jour on découvrait que cette invariance n'était pas vraie, cela ne remettrait pas en cause ce modèle;
2) en postulant le respect de la causalité (toute cause précède son effet dans le temps);
3) elle permet d'expliquer pourquoi les très grandes vitesses ne s'additionnent pas "classiquement" mais tendent vers une limite indépassable qui semble bien être celle de la lumière dans le vide. La transformation de Lorentz permet de comprendre pourquoi la vitesse de la lumière ne change pas par changement de référentiel sans postuler cette propriété au départ.

La relativité retrouvée par la pure expérience de pensée, je trouve ça bluffant!

mardi 2 septembre 2008

Parallèles mais presque

(image de techno-science.net)
Gasp! En feuilletant les cours de mon numbertwo je réalise qu'une bonne partie de ce qu'on nous apprend en géométrie en CM2 est à revoir depuis que l'on sait que la la Terre est ronde!

- Une droite est le plus court chemin entre deux points prolongé de part et d'autre à l'infini (NB: ça m'énervait de pas trouver de démonstration simple alors je m'y suis essayé en fin de billet, à vos stylos rouges!) A la surface de la Terre, une droite est donc un grand cercle passant par ces deux points: "grand" cercle car il a le même centre que la Terre et donc de même périmètre que celle-ci. Arf, donc une droite sur Terre n'est jamais infinie!

- Deux droites parallèles ne se coupent jamais? Ben, faut voir à voir, puisque tous nos grands cercles se coupent toujours et en deux points (situés aux antipodes l'un de l'autre). En fait des droites parallèles ça n'existe pas sur Terre. De même, deux droites non parallèles ne se coupent pas en un seul point, mais en deux (situés aux antipodes l'un de l'autre)...

- La somme des angles d'un triangle fait 180°? Que nenni: si l'on prend par exemple un triangle avec pour sommet le pôle Nord, et deux points situés aux antipodes de l'équateur, regardez bien ça fait 180°+90°+90°=360°! Adios du coup le théorème de Pythagore, puisqu'on peut imaginer un triangle équilatéral et avec des angles droits partout (deux extrémités sur l'équateur à 90° d'écart de longitude et une extrémité au pôle)!

- La circonférence d'un cercle sur Terre fait 2πr? Bah faites le calcul, moi je trouve plutôt 2πR cosθ, θ étant la latitude du cercle en question (en le supposant parallèle à l'équateur).

Toutes ces belles certitudes envolées, ça donne le vertige.
----------------------------------------------------------------------------------------------

Pour démontrer que le plus court chemin entre deux points d’une sphère est la portion du grand cercle qui les relie, prenons… deux points qu’on appellera A et B pour pas être trop original quand même sur une spère de rayon 1. Pivotons la sphère une première fois pour que les points soient sur la même latitude, puis une seconde fois pour qu’ils soient situés de part et d’autre symétriquement par rapport au pôle de la sphère. Nos deux points sont maintenant situés sur un même méridien et leur latitude est égale, c’est plus joli.

On postulera que la courbe recherchée est plane (je suis preneur de justification!). Comme notre figure est symétrique par rapport à l’axe Nord-Sud (0z), son plan-support doit l’être aussi. Il n’y a donc que deux « candidats »: le plan horizontal portant la parallèle joignant A et B (c’est l’arc C1 en bleu sur la figure) et le plan vertical portant le méridien passant par A et B (arc C2, en rouge). Comparons ces deux arcs :

C1 est un demi-cercle (puisque A et B sont sur le même méridien) et si θ est l’angle entre Oz et OA, le rayon du cercle support de C1 vaut sinθ. La longueur de l’arc C1 est donc π sinθ.

C2 est un arc de cercle passant par le pôle donc sa longueur vaut 2θ.

Comme θ prend ses valeurs entre 0 et π/2, on vérifie que sur cet intervalle < π sinθ: le verdict est sans appel, c’est le méridien (donc l’arc C2 du grand cercle) qui est le plus court chemin entre A et B.

Ce n’est pas très intuitif car on est habitué aux projections cylindriques de la Terre qui représentent les parallèles comme des lignes droites alors que les grands cercles sont projetées comme des courbes. Deux étudiants sur ce site ont démontré comment calculer la différence entre les deux trajets : entre Poitiers et Seattle il y a 8000km de distance à vol d’avion, mais 1000 de plus si l’on suit un parallèle!