L’industrie de l’IA consomme de grandes quantités d’énergie, d’eau douce et de liquidités. Désormais, il a également besoin de puces mémoire, les mêmes que celles utilisées dans les ordinateurs portables, les smartphones et les consoles de jeux.

Une machine fabriquant des puces semi-conductrices
Le dernier produit convoité par l’industrie de l’IA est la mémoire informatique, et le secteur signe des accords directement avec des fabricants pour des milliards de dollars de puces – les mêmes puces que les consommateurs utilisent dans les smartphones, les ordinateurs portables et les consoles de jeux. Au mieux, cela fait monter les prix, et au pire, cela provoque des pénuries qui limitent la production.
Pourquoi l’IA a-t-elle besoin d’autant de mémoire ?
Les modèles d’IA sont très, très gros. Vous pouvez les considérer comme des grilles de milliards, voire de milliards de paramètres – des nombres stockés en mémoire – sur lesquels sont effectués des calculs extrêmement répétitifs mais, pris dans leur ensemble, exigeants. C'est ainsi qu'un grand modèle de langage prend une entrée et génère une sortie.
Le transfert de cette quantité de données vers les processeurs à partir de disques durs bon marché mais lents – ce que nous appelons communément le stockage informatique – crée des goulots d'étranglement absurdes. Pour éviter cela, d’énormes quantités de RAM beaucoup plus rapides – ce que nous appelons normalement la mémoire informatique – sont utilisées à la place.
Et il y a un autre facteur : les modèles créés par les sociétés d’IA fonctionnent à une échelle énorme. Cela signifie qu'ils nécessitent des ordinateurs capables d'exécuter des centaines, des milliers ou des millions de copies de ces modèles, afin qu'un grand nombre de clients puissent les utiliser en même temps.
Prenez une tâche extrêmement gourmande en calcul, étendez-la à un grand nombre d'utilisateurs, supprimez les limites d'expansion en ajoutant des investissements pratiquement infinis dans le mix, et vous obtenez une demande insatiable de matériel. Une entreprise qui fabrique quelques millions d’ordinateurs portables par an n’est tout simplement pas à la hauteur.
Pourquoi les fabricants de puces ne peuvent-ils pas simplement fabriquer plus de puces ?
C'est plus facile à dire qu'à faire. Les usines de semi-conducteurs ont une capacité limitée et en construire une nouvelle implique des investissements massifs et prend souvent plusieurs années.
Certains signes montrent également que les fabricants ne veulent pas mettre fin à la sécheresse. Les médias coréens rapportent que Samsung Electronics et SK Hynix, qui fabriquent ensemble environ 70 % de ces puces, sont réticents à trop augmenter l'offre en cas de ralentissement de l'industrie de l'IA et se retrouvent avec de nouvelles usines de puces inutilisées et coûteuses et un déficit de commandes.
Et avec la demande actuelle en plein essor et Samsung dans la position confortable de pouvoir augmenter ses prix jusqu'à 60 %, pourquoi l'entreprise ferait-elle bouger ce bateau ? Les chiffres montrent qu'une puce de 32 Go que Samsung vendait 149 dollars en septembre était en vente pour 239 dollars en novembre.
Avons-nous déjà vu des pénuries comme celle-ci ?
Encore et encore. Pendant des années, le boom de l’IA a vu les entreprises aspirer toutes les puces informatiques des unités de traitement graphique (GPU) possibles pour construire de vastes centres de données capables de former et d’exécuter des modèles toujours plus grands. Cette demande incessante est la raison pour laquelle le cours de l'action du fabricant de puces Nvidia est passé de 13 dollars début 2021 à un sommet de plus de 200 dollars ces derniers mois.
En 2021, nous avons connu une pénurie de toutes sortes de puces informatiques en raison d’une combinaison parfaite de facteurs, notamment la pandémie mondiale, une guerre commerciale, des incendies, la sécheresse et des tempêtes de neige. Cela a affecté la fabrication de tout, des camionnettes aux micro-ondes.
Nous avons même constaté une pénurie de disques durs la même année lorsqu'une nouvelle crypto-monnaie appelée Chia, qui fonctionnait sur l'espace de stockage plutôt que sur la puissance de l'ordinateur, a gagné en popularité.
Bref, la technologie évolue vite. Parfois beaucoup plus rapide que les chaînes d’approvisionnement mondiales.
Quand la pénurie prendra-t-elle fin ?
Pas bientôt. OpenAI a signé des accords avec Samsung et SK Hynix qui lui permettront de prendre livraison d'environ 40 % de l'approvisionnement mondial en mémoire. Et ce n’est qu’une entreprise d’IA, même si elle fait partie des géants. Microsoft, Google et ByteDance, entre autres, achètent également toutes les puces possibles.
Une façon de mettre fin à la pénurie – et peut-être de créer rapidement une surabondance – serait que l’effondrement de l’IA dont les économistes, les banquiers et même le patron d’OpenAI mettent en garde se produise réellement. Mais cela aurait probablement des conséquences économiques dévastatrices, ce n’est donc peut-être pas une panacée.
Si cet effondrement ne se produit pas, les estimations suggèrent qu'il faudra peut-être attendre 2028 avant que les choses ne se calment et que la demande et l'offre ne retrouvent l'équilibre, certaines petites entreprises mettant en ligne de nouvelles usines.
Certains suggèrent que cette attente pourrait constituer une fuite problématique pour l’ensemble de l’industrie manufacturière. Sanchit Vir Gogia, analyste industriel chez Greyhound Research, a déclaré à Reuters que « le manque de mémoire est désormais passé d'une préoccupation au niveau des composants à un risque macroéconomique ».


