samedi 21 avril 2012

La géométrie des équations (2/2)

Part 2: Résoudre c’est dévisser!

On a vu dans l’épisode précédent que trouver les racines d’un polynôme se fait en jouant sur les « symétries » de ses racines, en regardant ce qui se passe quand on les « étiquette » de toutes les façons possibles. Ces symétries renvoient à leur tour à des figures géométriques particulières: deux points en miroir pour le second degré, un triangle équilatéral pour le polynôme du troisième degré. Le génie de Galois a été de montrer que cette correspondance est en fait générale: résoudre une équation revient à décomposer sa figure géométrique caractéristique en symétries élémentaires. Les choses commencent à devenir vraiment intéressante pour le quatrième degré…

Le tétraèdre est soluble dans un rectangle (et un triangle)

La figure associée à un polynôme du quatrième degré est cette fois un tétraèdre, dont les sommets (a,b,c,d) représentent les racines (r1,r2,r3,r4). Il y a trois types de transformations qui laissent le tétraèdre invariant:

– Les symétries autour des trois médiatrices du tétraèdre forment (avec l’identité) un sous-groupe de quatre transformations qui transforment abcd en badc, cdba et dcba.
– Les trois rotations autour d’un des sommets forment un deuxième type de sous-groupe (composé par exemple de abcd, acdb et adbc). Il y a quatre tels sous-groupes de rotations (un par sommet).
– Chaque transposition de deux sommets deux à deux forme un sous-groupe de deux éléments (par exemple abcd et abdc): il y a 6 sous-groupes de transpositions (un par arête).

Au total  il y a donc 24 façons de placer les racines sur les 4 sommets du tétraèdre (4 x 3 x 2=24) et ces 24 dispositions s’obtiennent géométriquement en combinant le sous-groupe des symétries autour des médiatrices (4 dispositions), avec un sous-groupe des rotations autour d’un sommet fixé (3 éléments) et une transposition simple (2 éléments):

Cette décomposition peut s’exprimer encore plus simplement. On a vu dans le dernier billet que trois rotations combinées à une transposition forment exactement le groupe des symétries du triangle. Quant aux symétries axiales autour des médiatrices du tétraèdre, bizarrement elles correspondent aux symétries d’un rectangle (qui elles aussi forment un groupe):

En termes de symétries,  notre tétraèdre est donc symboliquement le « produit » d’un rectangle par un triangle!

Elle est pas belle ma formule?

Dissiper progressivement l’ambiguïté entre les racines

Je n’ai encore jamais vu écrit ça dans les bouquins, sans doute parce qu’une telle formule pourrait laisser croire que le produit de ces transformations est commutatif ce qui n’est pas vrai: la combinaison d’une symétrie et d’une rotation varie selon l’ordre dans lequel on fait ces opérations. Tant pis, je m’y risque quand même car la résolution de l’équation du quatrième degré revient précisément à « diviser » la symétrie du tétraèdre par une succession de transformations élémentaires. On résout l’équation en « dévissant » (la formule est de Norbert Verdier [1]) les groupes de symétries enchâssés les uns dans les autres.

A mesure qu’on retire des symétries, on cerne de mieux en mieux l’identité des racines, un peu à la manière dont on comprend qui est Juan Lopez Fernandez à partir de son nom complet en Espagnol: on commence par situer sa famille (Lopez) qui comprend tous ses cousins, frères et soeurs, puis on isole sa fratrie par le nom de sa mère (Fernandez). Enfin son prénom Juan le distingue de ses frères.

Les quatre étapes de la résolution algébrique (détaillées dans le dernier billet) reviennent à effectuer les opérations symboliques suivantes, en commençant par la droite:

 
– Etape 1: on « divise » le tétraèdre par les trois rotations. De là « naissent »  A, B et C (racines cubiques d’un polynôme auxiliaire de degré 3), les « noms de famille » des racines en quelque sorte. [Pour mémoire  A=r1 r2+ r3r4 par exemple]
– Etape 2 et 3: on supprime les symétries du rectangle en divisant le résultat obtenu par deux symétries axiales. Des deux polynômes auxiliaires correspondant jaillissent les six paires de racines-jumelles, qui sont en quelque sorte le nom maternel des racines [r1 r2 par exemple ou bien r3r4].
– Etape 4: la suppression de la dernière symétrie axiale donne un prénom à chaque racine (par exemple r1) qui la distingue de sa soeur jumelle (par exemple r2).

Bon mon analogie avec Juan Lopez Fernandez a des limites parce qu’en algèbre chaque racine est jumelle de toutes les autres, selon la façon dont on les considère, mais vous voyez l’idée: on réduit progressivement « l’indiscernabilité » de chaque racine par rapport aux autres en retirant une après l’autre les relations qui la lient à ses copines. On se croirait dans un essai de René Girard, et sa théorie mimétique!

Cette place centrale donnée à la symétrie dans les équations est sans doute ce qui fait le charme de la « théorie de l’ambiguïté » de Galois. Elle illustre à merveille cette définition de la symétrie que proposa le mathématicien Hermann Weyl: « cette sorte d’harmonie entre les diverses parties grâce à quoi elles s’intègrent dans un tout: la beauté est liée à cette symétrie-là ».

Allez, vous avez bien mérité un petit clip pour digérer tout ça (et même si vous ne comprenez pas l’Allemand, on en a Cure…):



Le dodécaèdre (5eme degré) ne se divise pas

Un dodécaèdre (source Wikipedia)

Que se passe-t-il pour une équation de dégré 5? Ce genre d’équation a en général 5x4x3x2=120 transformations possibles. La bestiole géométrique correspondante est un dodécaèdre, qui est un assemblage de 12 pentagones réguliers. Si l’on joue au jeu des symétries avec le dodécaèdre, tout commence plutôt bien: on y déniche pas moins de 60 transpositions élémentaires (permutations de deux sommets entre eux) et 60 rotations des pentagones autour de leur centre. Ces rotations forment un grand sous-groupe que les mathématiciens appellent le « groupe alterné » A5 car il est composé de toutes les combinaisons en nombre pair des transpositions élémentaires.

Mais contrairement au tétraèdre ou au triangle, si vous essayez d’aller plus loin et de décomposer le dodécaèdre avec une de ces rotations, il vous reste entre les mains un tas de configurations qui n’a plus rien de symétrique. Autrement dit, A5 n’est divisible par aucune rotation ou transformation élémentaire. Pour le comprendre, prenez cinq symboles (a,b,c,d,e) et essayez d’écrire une expression algébrique « presque symétrique » avec ces lettres. Vous vous rendrez vite compte qu’en permutant les lettres, votre expression peut prendre une, deux ou cinq valeurs différentes (qui correspondent aux trois symétries identifiées: identité,  transpositions de sommets deux à deux et rotations dans l’axe des pentagones), mais jamais trois ou quatre valeurs différentes:

Traduite en termes algébriques, cette « indivisibilité géométrique » signifie que les racines du polynôme de degré 5 sont (généralement) tellement intriquées les unes dans les autres qu’on ne peut en démêler l’écheveau!  Or, nous dit Galois, une équation algébrique n’est résoluble que si la forme géométrique associée est « décomposable » en rotations et permutations élémentaires. Si, comme dans le cas d’un polynôme du 5° degré, ce n’est pas le cas, il est impossible de calculer « algébriquement » ces racines. Algébriquement signifiant au moyen des opérations arithmétiques classiques (+ – : et *) et des racines.

Un pont (à double sens) entre l’algèbre et la géométrie

Grâce à Galois, la résolution des équations algébrique se ramène donc à un problème de géométrie consistant à décomposer une figure symétrique en produits de figures symétriques plus « élémentaires ». Mais qu’est-ce qu’une figure symétrique « élémentaire »?
En algèbre, tout entier peut s’écrire comme le produit de nombres premiers. Par exemple 15=3*5. Les nombres premiers sont donc les briques de base de l’ensemble des entiers. De la même façon, on peut essayer de trouver les « briques de base » géométriques à partir desquelles sont construites toutes les figures symétriques. Par exemple un polygone à 15 côtés est le produit d’un triangle et d’un pentagone (cliquez pour agrandir):
(source ici)

En géométrie, les nombres premiers jouent un rôle aussi important qu’en algèbre. Tous les polyèdres réguliers ayant un nombre premier de côtés sont « indivisibles »: leurs symétries de rotation ne sont pas décomposables en sous-groupes de symétrie plus petits. Un triangle, un pentagone ou un heptagone réguliers constituent donc des briques de base pour la géométrie. Mais contrairement au monde des entiers ce ne sont pas les seules! Certaines figures géométriques comme le dodécaèdre sont, comme on l’a vu, indivisibles géométriquement alors que le nombre de leurs côtés (60) n’est pas un nombre premier.

L’existence de telles briques élémentaires de ce deuxième type est la raison profonde pour laquelle certaines équations algébriques n’ont pas de solution algébrique. La théorie de Galois montre en effet qu’une équation n’est résoluble algébriquement que si  la figure associée est une combinaison de polyèdres ayant un nombre premier de côtés (ses symétries sont divisibles en symétries élémentaires du premier type). Si au contraire cette figure contient une brique élémentaire du deuxième type, comme le dodécaèdre, l’équation associée (du 5eme degré dans ce cas) n’admet pas de racine algébrique.

A pieds joints dans le calcul!

Cette façon très novatrice qu’ a eu Galois d’envisager la géométrie et ses figures de symétrie a eu une influence extraordinaire dans un tas de domaines scientifiques. De là est née la théorie des groupes bien sûr, mais ses répercutions se sont aussi fait sentir en physique des particules (où les symétries jouent un rôle clé) ou même en cryptologie! Et son travail sur les équations lui-même connaît actuellement un renouveau, grâce à la puissance des ordinateurs.

Jusque récemment, on n’utilisait sa théorie que pour savoir si une équation est résoluble ou pas. Certes Galois proposait une méthode de calcul avec laquelle il invitait ses successeurs à « sauter à pieds joints sur ces calculs; grouper les opérations, les classer suivant leurs difficultés et non suivant leurs formes ». Mais la complexité de son algorithme devient vite trop effrayante et l’on préférait d’autres méthodes plus simples. L’arrivée des ordinateurs a radicalement changé la donne et remis les outils de Galois au goût du jour. Dans une conférence à l’Académie des sciences, Alain Connes en donne un aperçu. A ce stade, j’avoue que j’ai totalement décroché mais les maths ont alors quitté depuis longtemps le domaine de la logique pour rejoindre celui de la contemplation. A vous de voir (à partir de la 48eme minute)…



Mes sources:
[1] Galois, le mathématicien maudit, de Norbert Verdier (Belin 2011), un excellent livre que je vous recommande…
Symétries d’Alain Connes (Pour la Science 2001)
Résolution des équations algébriques de degré 3 et 4 (A. Marrakchi, 2011) sur le site de l’IHP consacré au bicentenaire de Galois
La symétrie ou les maths au clair de Lune, de Marcus du Sautoy: superbe livre (dont les grandes idées sont résumées dans cet article de Newscientist de 2008)

Billets connexes:
Le théorème de Noether, couteau suisse de la physique, qui parle d’une autre manière de voir la beauté des symétries.
Jeu de réflexion pour se détendre après cette overdose de maths.

dimanche 15 avril 2012

La géométrie des équations

 « Les bons mathématiciens trouvent des analogies entre les théorèmes ; les excellents mathématiciens arrivent à voir des analogies entre les analogies » disait Stephan Banach. Parmi ces correspondances extraordinaires, j’ai découvert au hasard de mes lectures celle que le jeune Evariste Galois avait établie entre l’algèbre des polynômes et la géométrie des figures symétriques.

Part 1: Un polyèdre derrière chaque polynôme

Avertissement aux âmes sensibles: La théorie est assez costaud mais je vais essayer de vous en présenter les grands principes sans vous infliger une explication (dont je serais bien incapable du reste!) sur les automorphismes et les extensions de corps. Cela étant, certains passages  contiennent encore pas mal de X et peuvent choquer les plus mathophobes. Mes prochains billets seront moins hard, promis!

Mesurer son champ avec un polynôme

Mais d’abord, pour répondre à l’inévitable question de mon numbertwo: « A quoi ça sert ces polynômes? ». Et bien, pour une fois, la réponse est simple: les polynômes permettent de résoudre un tas de problèmes de la vie courante. Prenons par exemple un polynôme simple: P(x)=x²-Px+S. Ses racines L et l (c’est à dire les valeurs de x pour lesquelles P(x)=0) vérifient les relations L+l=P et Ll=S (il suffit pour s’en convaincre de développer P(x) réécrit sous la forme (x-L)(x-l)).

Résoudre P(x)=0 permet donc de trouver les dimensions L et l d’un champ rectangulaire dont on ne connaît que le périmètre (2P) et la surface S (héhé, je n’avais pas choisi mes paramètres au hasard ;-)) Pas étonnant que l’on s’intéresse à ce genre d’équations depuis l’Antiquité! Les anciens qui n’avaient pas encore inventé les nombres négatifs,  résolvaient ce genre de problème de façon entièrement géométrique:

Fonctions « presque » symétriques des racines…

Dans notre exemple, L+l et Ll sont des fonctions « symétriques » des racines, c’est-à-dire que leur valeur ne dépend pas de la façon dont on « étiquette » L et l (on pourrait choisir pour L la plus petite des solutions plutôt que la plus grande). On vient de voir que ces deux fonctions s’expriment à partir des coefficients P et S de P(x). Il s’agit là d’une propriété tout à fait générale, valable quelque soit le degré n du polynôme de départ. Si P(x)=a0+a1x+a2x²+….+anx a pour racines r1, r2, r3… rn , alors toute expression f(r1,r2,r3…) invariante par permutation des racines s’écrit comme une combinaison des coefficients de P(x), c’est-à-dire qu’il existe une fonction F telle que f(r1,r2,r3…) = F( a0,a1,a2,…an). Inversement, toute expression formée à partir des coefficients a,a1, a2, … ade P(x) est une fonction symétrique des racines r1,r2,r3… rn.

C’est une propriété anodine et connue depuis longtemps mais au XVIIIeme siècle, Lagrange la poussa un cran plus loin: il remarqua que si une fonction des racines est « presque symétrique », c’est-à-dire qu’elle ne prend que k valeurs différentes quand on change l’étiquetage des racines, alors ces k valeurs sont les racines d’un polynôme « auxiliaire » de degré k, dont les coefficients s’expriment en fonction de ceux de P(x).

Pas de panique! C’est plus simple que ça n’en a l’air: pour notre polynôme de départ P(x)= x²-Px+S, l’expression (r1-r2) ne prend que deux valeurs différentes (L-l) et (l-L) selon ce qu’on choisit d’appeler r1et r2. Lagrange affirme simplement que ces deux valeurs sont les racines d’un « polynôme auxiliaire » de degré 2: P'(x)=x²-P²/4+S. C’est juste une manière compliquée de dire que si on appelle Δ le discriminant de P(x) défini par Δ²=P²/4-S, alors   L-l=+/-Δ. Mais en mathématiques, il faut parfois savoir compliquer un peu les choses pour les rendre plus simples à résoudre (rappelez-moi de faire un billet là-dessus…)

En découdre avec les polynômes du troisième degré

C’est cette propriété qui permet de résoudre les équations du troisième degré sur laquelle on s’est pris la tête durant des siècles. En observant toutes les méthodes de résolutions qui marchaient, Lagrange s’aperçut qu’elles utilisaient toujours cette propriété remarquable des fonctions « presque symétriques »:

Etape 1: on forme une expression u3(r1 r2 r3) qui ne prend que deux valeurs possibles U et V quand on change l’étiquetage des trois racines (r1 r2 r3). U et V sont donc les racines d’un polynôme auxiliaire de degré 2 connu (je graisse à chaque fois qu’on calcule une nouvelle quantité).
Etape 2: Une fois  U et V connus on peut calculer u et puisque u3= U et  v3=V.
Etape 3: Un peu de gymnastique algébrique permet de « remonter » depuis u et v jusqu’aux racines r1r2 et r3 recherchées

Le détail des calcul ci-dessous pour ceux que ça intéresse (ils peuvent même cliquer pour agrandir):

 

Quatrième degré? Facile!

Pour le quatrième degré, c’est presque plus simple. Cette fois on forme une expression du genre f(ri)=r1 r2+ r3r(on peut aussi choisir f’=(r1+r2)( r3+r4) par exemple), fonction « presque symétrique » des racines, qui ne prend que trois valeurs possibles quand on permute les racines de toutes les façons possibles (A=r1 r2+ r3r4 ;  B=r1 r3+ r2r4 et C= r1r4 +r2 r3) . Une fois qu’on a calculé A, B et C, on remonte par étapes jusqu’aux racines de P(x) (les détails du calcul sont sur cet excellent site consacré à Galois).

Toujours pour ceux que ça intéresse:

Etape 1: On peut calculer AB et C puisque ce sont les racines d’un polynôme auxiliaire de degré 3 dont on connaît les coefficients.
Etape 2: On s’intéresse ensuite aux quantités (r1 r2) et( r3r4) dont on connaît la somme (A) et le produit a0 (terme constant du polynôme P(x)). Les quantités (r1r2) et( r3r4) sont donc les racines d’un nouveau polynôme auxiliaire de degré 2 et on peut sans problème les calculer.
Idem pour les quatre autres paires de racines (r1 r3); (r1 r4); (r2r3); (r2r4) et (r3r4)
Etape 3: On s’attaque maintenant aux quantités (r1+r2) et (r3+r4), dont on connaît la somme (-a3, coefficient du terme en x3 de P(x)) et le produit (AB): on peut donc calculer (r1+r2) et (r3+r4) qui sont les racines d’un troisième polynôme auxiliaire de degré 2. Idem pour les autres paires de racines (je vous les écris pas…)
Etape 4: Une fois qu’on connaît  (r1+r2) et (r1 r2), on peut calculer r1et ren extrayant les racines d’un quatrième polynôme auxiliaire de degré 2. Et voilà!

On remonte donc aux quatre  racines grâce à une série de quatre polynômes auxiliaires (un de degré 3 et trois de degré 2) formés à partir d’expressions « presque » symétriques des racines r1 r2,ret rrecherchées. Peut-on extraire comme ça les racines de n’importe quel polynôme quelque soit son degré? Il fallut attendre le XIXe siècle pour qu’Abel montre que cette belle méthode n’allait pas plus loin. Il n’y a pas de formule magique pour extraire les racines d’ équations du 5eme degré, mais il fallut tout le génie de Galois pour comprendre pourquoi, grâce aux lois de la géométrie…

Bilan: une figure géométrique derrière chaque équation

Si on reprend notre polynôme de départ P(x)=x²-Px+S et que l’on place ses racines (r1et r2) sur une règle graduée, on constate qu’elles sont « en miroir » l’une de l’autre par rapport au nombre P/2:

Le coup de génie de Galois fut de généraliser ce type de correspondance et d’associer une figure géométrique propre à chaque polynôme. Cette figure reflète géométriquement les symétries qui lient les racines entre elles. Chaque relation de symétrie entre les racines du polynôme correspond à une transformation géométrique qui laisse la figure invariante, et vice-versa.

Pour un polynôme du troisième degré, la figure associée est un triangle équilatéral:

Si l’on se représente les trois racines  (r1 r2 r3) comme les sommets d’un triangle équilatéral (dans le plan complexe), il y a six manières de les disposer sur le triangle, donc six manières de les permuter à partir d’une situation initiale. Ces six permutations possibles correspondent aux six transformations géométriques qui laissent le triangle inchangé:
– trois rotations autour du centre (schéma de gauche) correspondant aux trois permutations cycliques des sommets
– trois symétries autour des des médiatrices du triangle (schéma de droite) qui transposent deux à deux les sommets.

Les rotations du triangle forment un sous-groupe car la combinaison de deux rotations est une rotation (ce n’est pas vrai des symétries axiales). Et si vous y réfléchissez, vous verrez qu’il suffit de combiner une seule symétrie axiale avec toutes les rotations possibles, pour retrouver les six transformations possibles du triangle.

Le groupe des symétries du triangle peut en quelque sorte se « diviser » par le sous-groupe de ses rotations pour donner une transposition de deux sommets:

La méthode de résolution de l’équation du troisième degré n’est rien d’autre que la mise en oeuvre algébrique de cette décomposition géométrique:
– L’étape 1 (polynôme auxiliaire du second degré) correspond à l’extraction d’une symétrie axiale particulière (dont u et v sont deux représentants)
– L’étape 2 (extraction d’une racine cubique) correspond aux trois rotations (=permutations cycliques) appliquées à cette symétrie.

Si on peut résoudre une équation du troisième degré, c’est parce qu’on peut décomposer les transformations d’un triangle en rotations et en symétries axiales élémentaires. Voilà schématiquement ce que découvrit Galois à 20 ans. Dans le prochain billet, je vous expliquerai comment ça marche pour les degrés supérieurs…

Mes sources:
[1] Galois, le mathématicien maudit, de Norbert Verdier (Belin 2011), un excellent livre que je vous recommande…
Symétries d’Alain Connes (Pour la Science 2001)
Résolution des équations algébriques de degré 3 et 4 (A. Marrakchi, 2011) sur le site de l’IHP consacré au bicentenaire de Galois
La symétrie ou les maths au clair de Lune, de Marcus du Sautoy: superbe livre (dont les grandes idées sont résumées dans cet article de Newscientist de 2008)
Billets connexes:
Le théorème de Noether, couteau suisse de la physique, qui parle d’une autre manière de voir la beauté des symétries.
Jeu de réflexion pour se détendre après cette overdose de maths.

vendredi 30 mars 2012

Dé-mailons nous!

 (Billet paru cette semaine dans le + du NouvelObs)

La panne de trois jours qui a frappé tous les utilisateurs du “Blackberry mail” en octobre 2011 a traumatisé quelques-uns de mes collègues. L’un d’eux, qui se trouvait à l’étranger à ce moment là, me confiait qu’il avait le sentiment d’être exclu de l’entreprise, inutile et vaguement coupable de n’être même pas capable aux sollicitations de ses pairs.

Plus je communique, plus j’existe.

C’est vrai qu’il y a six ou sept ans, avoir un Blackberry conférait une sorte de supériorité professionnelle. On était au courant de tout avant tout le monde, on réagissait avant tout le monde sur les mails importants, même si on était en déplacement. Et puis, à mesure que le Blackberry s’est démocratisé, il est devenu normal de répondre dans la minute qui suit au mail de son patron. J’ai même vu des réponses automatiques d’absence pour une matinée de rendez-vous extérieur!  Une de mes collègues a même deux mobiles- un Blackberry et un iPhone – car pour traiter ses mails dans le métro il y en a toujours un des deux qui capte mieux que l’autre. On se poste désormais devant son mail comme l’ouvrier jadis devant sa chaîne de production. Mais contrairement à lui, le cadre moderne est heureux avec son tonneau des Danaïdes qui se remplit plus vite qu’il ne se vide. Car chaque mail reçu prouve que l’on compte un peu dans l’entreprise, que quelqu’un a pensé à nous l’envoyer. On mesure son importance au nombre de courriels reçus par jour. Alors forcément, le jour où le mail tombe en panne, le monde s’écroule. Ne plus recevoir de mails c’est le premier signe d’une mise au placard. Derrière la consultation frénétique de sa messagerie se cache le besoin de se rassurer sur sa place réelle dans l’organisation.

Et puis éplucher ses mails les uns après les autres est une manière bien pratique de faire son boulot sans trop se poser de questions sur la manière de s’y prendre, avec en prime le sentiment du devoir accompli une fois qu’on a fini. L’imagerie cérébrale a montré que chaque envoi de mail procure une micro-satisfaction, par le simple fait de s’être prouvé à soi-même qu’on a su y répondre, qu’on est réactif et fidèle au poste. On devient vite accroc à ces petites doses de dopamine qui ont le même effet dans notre cerveau -toutes proportions gardées!- que le sexe, la drogue ou le rock&roll. Certains de mes collègues ne savent plus discuter sans garder l’oeil et le pouce sur leur smartphone, à l’affût du moindre mail entrant. On prend son shoot de mail comme on grille une clope pour recevoir sa dose de nicotine.

Plus je communique, moins je comprends ce qui se passe!

source de l'image

Je reçois une centaine de mails par jour. Bien moins que d’autres, mais bien plus que ce qui me serait vraiment nécessaire pour faire mon boulot correctement. Sous prétexte de transparence, le moindre compte-rendu de réunion a au minimum une dizaine de destinataires et est accompagné en pièce jointe de l’inévitable document PowerPoint de trente pages. Et il en est toujours un pour signaler une imprécision dans ce compte-rendu. En « réponse à tous » bien entendu. Suit alors parfois une longue partie de ping-pong à ce sujet, prenant la Terre entière pour témoin. Sous ce déluge de « non-information » je passe plus de temps à écoper ma boîte de réception en essayant de ne pas passer à côté de ce qui est important. Mais je participe moi-même sans m’en apercevoir à cette entropie délirante.

Plus j’ai d’outils de communication, plus je suis seul…

La communication directe, d’humanoïde à humanoïde est la grande perdante de l’hystérie informationnelle. Si l’on ne veut pas crouler sous les messages en attente le lendemain matin, il faut “dépiler » sa boîte mail en permanence. Même en réunion, il n’est pas rare que tout le monde ait le nez plongé dans son PC (ou son mobile, c’est plus discret) à l’exception de celui qui parle… dans le vide. Réagir par mail est devenu plus naturel que de décrocher son téléphone -réservé aux cas d’urgence. Est-ce parce qu’il permet aussi de contrôler ce qu’on écrit, de garder une trace et -surtout- de ne pas trop s’impliquer émotionnellement si le sujet est délicat? Je ne sais pas, car même chez mes ados de fils je constate le même phénomène: ils n’appellent plus leur copains mais sont capables de passer des soirées entières à tchatter sur facebook ou à s’échanger des textos. C’est d’ailleurs grâce à sa messagerie instantanée que Blackberry survit encore, face à la déferlante de smartphones concurrents. La communication se vit désormais surtout au doigt et à l’oeil.

Quant à se déplacer pour voir les gens et leur parler directement, c’est paradoxalement devenu plus compliqué depuis que les openspace se sont généralisés. Vous me direz qu’ils ont été conçus pour que les gens se parlent d’avantage. Certes, mais traumatisés par un brouhaha auquel ils n’étaient plus habitués, les locataires de ces grands espaces ouverts ont exigé le silence autour d’eux. On tolère le chuchotement entre voisins de bureaux mais le moindre éclat de voix provoque des regards venimeux. Alors pour s’épargner le courroux de ses collègues, on échange par mail entre voisins. La messagerie instantanée a progressivement remplacé le petit bavardage informel entre collègues-copains, en attendant la pause café ou le déjeuner. Entre temps, il faut se contenter le plus souvent de rapports électroniques avec ses pairs…

source ici

 

Travailler ou communiquer, il faut choisir…

Le travail de fond a aussi fait les frais de cette communication tous azimuts. On s’accoutume vite au mode de travail haché où l’on traite plusieurs choses en même temps, au point que l’on perd peu à peu sa capacité à se concentrer. Pour lutter contre cet effondrement de la productivité, Thierry Breton a annoncé qu’il interdirait l’usage du mail en interne chez Atos. Je ne sais pas si ça va changer quoique ce soit, mais c’est vrai que je me surprends parfois à procrastiner quand il s’agit de traiter un dossier de fond et une fois que je m’y mets, je m’interromps toutes les cinq minutes pour consulter mes mails. Il y en a toujours un plus urgent à traiter que ce satané dossier. En désespoir de cause, je rentre chez moi pour m’atteler à la tâche. Et là, miracle. Loin des sollicitations du bureau, volontairement privé de mail, je boucle mon dossier en moins de deux heures. Et au lieu du plaisir fugitif que je ressens quand j’ai fini de traiter mes mails, c’est une satisfaction durable que j’éprouve alors, comme après avoir nagé un kilomètre ou couru pendant une bonne heure. Après l’ère de l’hypercommunication paralysante, va-t-on enfin atteindre l’âge de la non-communication hyperefficace?

dimanche 25 mars 2012

Notre cerveau joue aux dés (2/2)

Je vous ai parlé dans mon dernier billet de la façon dont, face à une image ou un son ambigu, notre cerveau utilisait le hasard et les probabilités pour « tirer » aléatoirement une interprétations possible du signal. Un peu à la manière d’un système de particules intriquées où le hasard est le seul à définir l’état dans lequel on observe le système parmi tous les états probables. L’analogie  entre neurosciences et physique quantique est tentante, mais elle a ses limites. Une fois qu’un système quantique a été observé, il est irréversiblement modifié et réduit à une de ses valeurs propres. Les mesures ultérieures sur ce système donneront ensuite toujours la même valeur. Il en va tout autrement pour notre cerveau, puisqu’après qu’il ait donné une réponse, on peut sans problème lui demander un deuxième choix. C’est d’ailleurs cette possibilité qui a permis d’explorer encore plus loin son fonctionnement intime…

Notre attention est aussi l’objet du hasard…

Que se passe-t-il quand on s’entraîne à détecter un signal très furtif et que l’on se trompe mettons 20% des fois. La réponse semble à peu près évidente: on avait simplement mal vu le signal dans 20% des cas. Mais puisqu’on a appris à se méfier des évidences, on peut aussi imaginer un scénario alternatif. Puisque le hasard guide nos réponses conscientes, on peut supposer qu’on n’a ni mieux ni moins bien vu ce qui se passait lors des essais ratés. Simplement pour tous les essais, on n’aurait jugé le bon résultat probable qu’à 80% en moyenne. Selon ce scénario audacieux, l’incertitude des réponses ne se concentrerait pas sur les essais ratés, mais elle se nicherait au cœur de chacun des essais, y compris quand ils sont réussis. Comment savoir si la variabilité de nos réponses est inter-essais ou intra-essais?

Pour le savoir une équipe du MIT a demandé à des volontaires de s’entraîner à repérer certaines lettres entourées d’un cercle, parmi une série qui défilait rapidement. Les sujets devaient donner la lettre qu’ils pensaient être la bonne, puis devaient donner un second choix, puis un troisième etc. Le raisonnement des chercheurs a été le suivant:
– Si on se trompe parce qu’on a mal vu certains essais, les deuxièmes choix des essais ratés devraient être très biaisés.
– Si on se trompe à cause de l’incertitude propre à chaque essai, les premiers et les deuxièmes choix devraient suivre la même loi de distribution centrée autour de la réponse exacte, aussi bien pour les essais réussis que pour les essais ratés.

L’analyse de la distribution des deuxième choix pour les essais ratés penche très clairement en faveur de la deuxième hypothèse. Aussi bizarre que ça puisse paraître, premiers, deuxièmes et troisièmes choix semblent effectivement être le résultat d’un tirage aléatoire sur une distribution de probabilités parfaitement centrée autour de la bonne réponse!

D’après Vul & al (2009) Attention as Inference: Selection Is Probabilistic; Responses Are All-or-None Samples.

Tout comme nos perceptions sensorielles, nos réponses attentionnelles semblent donc elles aussi déterminées aléatoirement parmi l’ensemble des réponses probables. Mais contrairement à un système quantique (dont la mesure ne fournit qu’un seul état parmi tous les états possibles), il suffit de poser la question pour connaître les différentes réponses envisagées par notre cerveau.

La sagesse des foules… dans sa tête!

Pourquoi s’arrêter en si bon chemin? La même équipe du MIT s’est demandé si on ne pourrait envisager que notre cerveau fonctionne de la même façon probabiliste lorsqu’il s’agit de fournir un jugement ou une opinion. Il faudrait alors considérer que ce que notre cerveau considèrerait comme notre » meilleure réponse » (best guess) serait non pas la réponse la plus vraisemblable, mais une des réponses possibles, choisie avec une probabilité égale à son degré de vraisemblance.  Je ne sais pas si vous voyez à quelle point cette idée est contre-intuitive: par définition, le « best guess » est la réponse que l’on imagine être la plus vraisemblable. Or ce modèle prédit paradoxalement qu’on maximise ses chances de tomber juste en moyenne si l’on prend la moyenne de ses choix de premier, de deuxième et de troisième ordre!

Les chercheurs ont interrogé 430 volontaires sur une question difficile (« Quel pourcentage d’aéroports dans le monde se trouve aux Etats-Unis? »). Après qu’ils aient donné leur réponse (dont le degré d’erreur est mesuré par les colonnes bleues), on leur demande une deuxième réponse (Guess 2, colonnes marron) soit immédiatement (colonnes de gauche) soit trois semaines plus tard (colonne de droite), les sujets n’étant évidemment pas informés qu’on allait les réinterroger sur le sujet.

On constate sans surprise que cette deuxième réponse est moins précise que la première (les colonnes marron sont plus hautes). Jusque là tout est normal puisque la première réponse est celle que le sujet croit la plus exacte. Mais ce qui est plus étrange c’est que la moyenne des deux réponses (colonnes vertes) est beaucoup plus proche de la réalité que la première réponse! Exactement comme le modèle probabiliste l’avait prédit.

Ca ne vous rappelle rien? C’est bien sûr un phénomène analogue à celui de la sagesse des foules dont je vous ai déjà parlé dans ce billet. Comme Galton l’avait découvert au XIXeme lors d’une foire aux bestiaux, l’estimation d’une valeur par de très nombreuses opinions indépendantes est statistiquement plus exacte que celle du meilleur expert. Sauf qu’ici, la foule serait notre propre cerveau qui, après avoir évalué la vraisemblance de chaque réponse possible, tirerait autant de fois que l’on veut une de ces réponses parmi cette distribution de probabilités.

Comme on le voit sur le graphique, l’effet est encore plus marqué lorsque la deuxième réponse est demandée trois semaines plus tard, sans doute parce que les personnes sont moins influencées par leur première réponse après un long délai entre les deux introspections. C’est la même règle que celle qui prévaut lorsqu’on interroge de nombreuses personnes: pour éviter le biais collectif, la prédiction n’est statistiquement bonne que si les personnes interrogées ignorent l’opinion des autres (autrement elles risquent de se fier aveuglément à l’opinion générale).

Combien de personnes logent dans mon crâne?

On peut pousser l’analogie encore plus loin et se demander à combien de personnes correspondrait cette introspection répétée. On sait comment la précision de la réponse  évolue statistiquement en fonction du nombre de personnes interrogées. A partir de cette loi, on peut donc calculer, à combien de personnes équivaut cette sagesse des foules propre à notre cerveau: une deuxième réponse immédiate correspond à l’interrogation de 1,1 personnes et une réponse trois semaines plus tard fournit la même précision que 1,3 personnes interrogées.


Comme pour la sagesse des foules classiques, on voit tout l’intérêt d’une introspection répétée « à froid », au moment de porter des jugements ou de prendre des décisions. La première intuition est certes souvent la bonne, mais les réflexions ultérieures peuvent la nuancer utilement. L’analogie avec la sagesse des foules fait aussi écho aux observations de Thomas Seeley (voir ce billet) au sujet des similitudes entre le fonctionnement d’un cerveau et celui d’un essaim d’abeilles en train de choisir son futur nid. Là encore la compilation des expressions de chaque abeille éclaireur fait émerger presque à tous les coups la meilleure solution. Rien ne vaut le collectif pour prendre une bonne décision!

Sources:
Vul & al. (2009) Attention as Inference: Selection Is Probabilistic; Responses Are All-or-None Samples (pdf)
Vul & Pashler (2008) Measuring the crowd within (pdf)

Billets connexes
Le billet précédent, pour ceux qui ont raté le début
Etrange perspicacité collective sur le phénomène de sagesse des foules
Les abeilles ça déménage (2/2) où on fait l’analogie inverse: l’essaim, comme modèle de cerveau virtuel