in ,

Le secret pour deviner avec plus de précision grâce aux mathématiques

Le secret pour deviner avec plus de précision grâce aux mathématiques

Qu'ont en commun un physicien du XXe siècle, un statisticien du XVIIIe siècle et un philosophe grec ancien ? Ils savaient tous extrapoler avec une précision incroyable. Journaliste Jacob Aron explique comment combiner leurs méthodes pour améliorer votre capacité à deviner

Le secret pour deviner avec plus de précision grâce aux mathématiques

Qu'y a-t-il dans la boîte ?

Supposons que je vous montre une boîte et vous demande de deviner ce qu’elle contient, sans fournir plus de détails. Vous pourriez penser que cela est complètement impossible, mais la nature du conteneur fournit certaines informations : le contenu doit être plus petit que la boîte, par exemple, alors qu'une boîte en métal solide peut contenir des liquides et résister à des températures avec lesquelles une boîte en carton aurait du mal.

Existe-t-il un moyen de décrire ce processus de deviner avec des informations limitées d'une manière mathématiquement sensée ? De toute évidence, certaines choses ne peuvent pas être devinées de manière fiable – le lancer d’une pièce de monnaie, le lancer de dés – et nous les appelons aléatoires. Mais pour tout le reste, quelques outils pratiques peuvent vous aider à mieux limiter vos suppositions, plutôt que de choisir une réponse dans l'éther.

Une estimation contrainte est en réalité une estimation, et celle-ci a une longue histoire. L’exemple le plus impressionnant est peut-être celui du philosophe grec Eratosthène, qui vivait à Alexandrie, en Égypte, au 3ème siècle avant JC. Avec quelques idées simples, il a pu estimer la circonférence de la Terre avec une précision surprenante. Sa méthode exacte est perdue, mais on peut la reconstituer grâce à des textes écrits après son œuvre.

Essentiellement, Eratosthène savait qu'à midi, au solstice d'été, le soleil semblait être directement au-dessus de la ville antique de Syène, ne projetant aucune ombre sur un puits. Pendant ce temps, au même jour et à la même heure à Alexandrie, une tige verticale projetait une ombre d’un angle d’environ 7 degrés, soit environ 1/50ème de cercle. Il savait que la distance entre les deux villes était de 5 000 stades, une unité de longueur, et estimait donc que la circonférence totale de la Terre devait être 50 fois supérieure, soit 250 000 stades.

Ératosthène a fait ici quelques approximations sur la géométrie, mais nous pouvons l'ignorer. Ce qui est un peu plus délicat, c'est que nous ne connaissons pas la véritable valeur d'un stade. On pense qu’Eratosthène utilisait quelque chose à peu près équivalent à 160 mètres. Cela nous donne une circonférence de 160*250 000 = 40 000 kilomètres, remarquablement proche de la mesure moderne de 40 075 kilomètres. Bien entendu, différentes valeurs pour un stade (elles vont de 150 à 210 mètres) vous donnent une réponse différente et un niveau de précision différent, selon la générosité que nous voulons être envers Eratosthène.

Le secret pour deviner avec plus de précision grâce aux mathématiques

Tel était le monde selon Ératosthène, mais il était capable d'estimer la circonférence de la Terre avec assez de précision.

Le point ici est que quelques calculs simples mais raisonnables peuvent vous donner une estimation assez puissante : mesurer une planète sans avoir à en faire le tour. Le maître du XXe siècle en la matière était le physicien Enrico Fermi, qui a construit le tout premier réacteur nucléaire et a joué un rôle clé dans le projet américain Manhattan visant à développer une bombe atomique. Il était présent lors de la première détonation d'une telle arme, le test Trinity, et a tenté d'estimer la puissance de l'explosion – personne ne savait vraiment de quoi il s'agirait – en laissant tomber de petits morceaux de papier et en observant comment ils étaient déplacés par l'explosion. Comme Eratosthène, sa technique exacte n'a jamais été enregistrée, mais son estimation selon laquelle il s'agissait d'une bombe de 10 kilotonnes représente environ la moitié de la valeur réelle de 21 kilotonnes acceptée aujourd'hui pour le rendement de Trinity. Ce n’est pas parfait, mais c’est au moins dans la bonne fourchette.

En effet, atterrir dans la bonne direction était en quelque sorte le stratagème de Fermi – il aimait ce genre d'estimations au fond de l'enveloppe, à tel point qu'elles sont maintenant connues sous le nom de problèmes de Fermi. L’exemple classique est un défi qu’il lance aux étudiants : estimer le nombre d’accordeurs de piano dans la ville de Chicago. En partant de la population de Chicago (environ 3 millions d'habitants), on pourrait supposer qu'un ménage moyen compte quatre personnes, soit 750 000 ménages. Si une personne sur cinq possède un piano, il y en a 150 000 à Chicago. Si nous supposons qu’un accordeur de piano peut travailler sur quatre pianos par jour de semaine, il peut en atteindre environ 1 000 par an. Ainsi, si ces 150 000 pianos sont entretenus chaque année, il doit y avoir 150 accordeurs de pianos à Chicago.

Le problème avec cette estimation n’est pas qu’elle soit exacte, mais qu’elle est limitée dans son inexactitude. Nous avons formulé un certain nombre d'hypothèses en cours de route – mais étant donné que certaines seront des surestimations tandis que d'autres seront des sous-estimations, et en supposant qu'il n'y ait pas de biais dans une direction, les erreurs seront probablement limitées. Si nos calculs avaient indiqué qu'il y avait un million d'accordeurs de piano à Chicago, par exemple, vous pourriez être presque sûr que c'est faux.

Bien que l’estimation de Fermi soit une technique puissante pour les suppositions initiales, nous recueillons parfois de nouvelles informations qui peuvent nous aider à affiner notre première réponse. Revenons à l'exemple de boîte avec lequel j'ai commencé. Si je sortais de la boîte une boule bleue portant le numéro 32, cela changerait-il votre hypothèse sur son contenu ? Vous pourriez supposer qu’il y a d’autres boules à l’intérieur de la boîte, que certaines d’entre elles sont bleues et que d’autres portent des chiffres – mais existe-t-il un moyen de quantifier cela ? Oui, grâce à Thomas Bayes, statisticien et ministre de l'Église du XVIIIe siècle.

Le secret pour deviner avec plus de précision grâce aux mathématiques

Un portrait que l'on pense être celui de Thomas Bayes

L'idée étonnante de Bayes a été de renverser la probabilité, en la transformant d'un outil permettant de comprendre le caractère aléatoire – comme le résultat d'un tirage au sort – à un cadre permettant de mesurer et de réviser l'incertitude. Il a établi une équation, le théorème de Bayes, pour transformer les observations en preuves. Il se compose de quatre parties : préalable, preuve, vraisemblance et postérieure. Laissez-moi vous expliquer tour à tour.

L’a priori est notre hypothèse de base. Imaginons que je sers trois parfums de glace lors d'une fête (chocolat, fraise et vanille) et que je veux savoir lequel sera le plus populaire pour être sûr de m'approvisionner. Une hypothèse de base raisonnable est que les préférences en matière de saveurs sont uniformément réparties entre les gens, un tiers de la population appréciant chaque saveur. Mais ensuite la fête commence et je commence à devenir nerveux. Les 10 premières personnes ont toutes opté pour du chocolat – c'est mon témoignage.

C'est ici que ça devient un peu compliqué. Pour définir la probabilité, je dois examiner mon hypothèse initiale. Si les préférences gustatives étaient réellement égales, quelles sont les chances de voir 10 chocolats d’affilée ? La réponse est (1/3) ^ 10, soit environ 1 sur 60 000. C'est assez improbable, ce qui suggère que mon hypothèse initiale est probablement fausse, et je dois la mettre à jour pour supposer une préférence beaucoup plus élevée pour le chocolat, ce qui nous donnerait une plus grande probabilité de voir les preuves observées. Cette mise à jour nous donne le postérieur.

Ce théorème s’avère extraordinairement puissant. Revenons à mon exemple de boîte : la première balle que j'ai retirée restreint massivement les possibilités de ce qu'il y a à l'intérieur. Si je sors une autre balle, celle-ci rouge et marquée « 50 », cela restreint encore plus les possibilités – vous savez maintenant qu’il existe au moins deux couleurs de balle, et si vous supposez qu’elles sont uniformément numérotées dans l’ordre, leur quantité totale est probablement petite (inférieure à 100) plutôt que grande (plus d’un million). Chaque balle que je retire vous donne encore plus de preuves, que vous pouvez utiliser pour mettre à jour votre précédent à chaque fois.

Un endroit où vous avez peut-être rencontré le théorème de Bayes sans le savoir est votre boîte de réception électronique. Les premiers filtres anti-spam utilisaient le raisonnement bayésien, en supposant qu'un certain pourcentage d'e-mails étaient du spam (le précédent), puis en utilisant les e-mails que vous et votre fournisseur de services marquiez comme spam (la preuve) en combinaison avec la probabilité que certains mots et expressions apparaissent dans les spams (la probabilité) pour savoir quels e-mails sont réellement du spam (le postérieur).

Le filtrage du spam illustre pourquoi deviner n’est pas une astuce mathématique avec des cases, mais est pertinent par rapport au monde réel. Et l’exploitation de ces techniques – l’estimation de Fermi et le raisonnement bayésien – est plus importante que jamais dans un monde d’IA à correspondance de modèles comme ChatGPT. Comme je l'ai écrit récemment, la façon dont les IA modernes sont construites signifie qu'elles cherchent souvent à confirmer plutôt qu'à mettre à jour ou à remettre en question vos antécédents, en s'adaptant aux modèles existants sans prendre pleinement en compte les nouvelles preuves qui ne correspondent pas. Ne laissez pas une IA deviner à votre place – apprenez à le faire correctement vous-même.

Teyana Taylor sait que « un million de filles tueraient pour son travail » et pour sa robe Chanel

Teyana Taylor sait que « un million de filles tueraient pour son travail » et pour sa robe Chanel

En Allemagne, les contenus télévisés liés au climat atteignent les téléspectateurs engagés mais passent à côté des groupes sceptiques