in

Les modèles mathématiques étonnamment utiles dans certaines données du monde réel

Electronic stok data board.

Des prix boursiers aux numéros de maison, certaines collections de nombres ne sont pas aussi aléatoires que vous le pensez, dit Katie Steckles

Carte de données Electronic Stok.

« Regardez les prix boursiers et vous pourriez voir le modèle … »

Si vous deviez regarder la première page d'un journal, vous constateriez probablement qu'il contient beaucoup de chiffres: des montants d'argent, des tailles de population, des mesures de longueur ou de zone. Si vous avez retiré tous ces chiffres et les mettre dans une liste, vous auriez une collection de nombres aléatoires.

Mais ces chiffres ne seraient pas aussi aléatoires que vous le pensez. Dans les données du monde réel, comme les totaux de trésorerie ou les hauteurs des bâtiments, le premier chiffre d'un nombre donné est étonnamment susceptible d'être 1. Si les chiffres étaient vraiment aléatoires, environ 1/9 allait commencer par 1, mais en pratique, il ressemble souvent plus à un tiers. Le chiffre 9 est le moins susceptible de montrer la voie, survenant environ 1 / 20e du temps, et les autres chiffres suivent une courbe entre eux.

Ce modèle, connu sous le nom de loi de Benford, est une distribution couramment observée des premiers chiffres dans certains types d'ensembles de données – en particulier ceux où les valeurs sont tirées d'une grande gamme non spécifiée. Vous ne voyez pas que cela se produise avec des choses comme les hauteurs humaines (où les chiffres se trouvent tous dans une petite plage) ou des dates (où il y a des restrictions sur les valeurs que le nombre peut prendre).

Mais si vous avez demandé à un groupe de personnes de vérifier le montant d'argent sur leur compte bancaire, ou de donner leur numéro de maison, ou de rechercher les prix boursiers (photo), vous pourriez voir le modèle – ce sont tous des chiffres qui pourraient s'étendre sur plusieurs ordres de grandeur. Certaines rues n'ont que quelques maisons, tandis que d'autres en ont des centaines. C'est pourquoi le phénomène se produit.

Imaginez une rue avec neuf propriétés: la proportion de numéros de maison commençant par chaque chiffre serait une division égale à neuf voies. Mais dans une rue avec 19 maisons, plus de la moitié commencent avec 1. Ces deux extrêmes se produisent alors que nous augmentons le nombre de maisons: avec 100, il y a un nombre à peu près égal de chaque chiffre initial; Sautez cela à 200 et, encore une fois, la moitié d'entre eux commencent avec 1.

Étant donné que chaque élément de données du monde réel provient d'un ensemble de taille inconnue, la probabilité moyenne d'un nombre commençant par 1 finit par être quelque part entre ces deux valeurs. Des calculs similaires peuvent être effectués pour les autres chiffres, ce qui nous donne la fréquence globale avec laquelle chacune apparaît. L'effet est le plus visible dans les grandes collections de données.

L'une des raisons est utile est qu'elle vous donne un indice lorsque les données ont été truquées. Si vous regardiez un ensemble de comptes d'entreprise, vous vous attendez à trouver des distributions de type Benford dans les chiffres des ventes. Mais si quelqu'un a fabriqué des données en choisissant des nombres aléatoires, lorsque vous tracez les fréquences des premiers chiffres, il n'aura pas la courbe caractéristique. Il s'agit d'une astuce que les comptables médico-légaux utilisent pour détecter une activité suspecte.

Donc, la prochaine fois que vous vérifierez vos comptes ou comparez les longueurs des rivières, gardez un œil sur le nombre de chiffres commencez par 1 – vous pourriez simplement repérer la loi de Benford en action!

Katie Steckles est mathématicien, maître de conférences, Youtuber et auteur basée à Manchester, au Royaume-Uni. Elle est également conseillère pour la colonne de puzzle de Issues.fr, Brentwister. Suivez-la @Steck

Pour d'autres projets, visitez newscientist.com/maker

New Scientist. Science news and long reads from expert journalists, covering developments in science, technology, health and the environment on the website and the magazine.

Ne vous inquiétez pas, pas de guêpes radioactives géantes ici

2H4G74E Lisbon, Portugal. 2nd Nov, 2021. Vice President of Global Affairs and Communications of Meta (Facebook), Nick Clegg addresses the audience (via web transmission) at Altice Arena Centre Stage during the second day of the Web Summit 2021 in Lisbon.This is one of the largest technology conferences in the world and also a meeting point for the debate on technological evolution in people

Nick Clegg ne dit rien du tout dans un nouveau livre comment sauver Internet