Les chercheurs du MIT présentent Lightning, une smartNIC photonique-électronique reconfigurable qui répond aux demandes d’inférence de réseau neuronal profond en temps réel à 100 Gbit/s. Crédit : Alex Shipps/MIT CSAIL via Midjourney
Le système « Lightning » connecte les photons aux composants électroniques des ordinateurs à l’aide d’une nouvelle abstraction, créant ainsi le premier prototype informatique photonique capable de répondre aux demandes d’inférence d’apprentissage automatique en temps réel.
L’informatique est à un point d’inflexion. La loi de Moore, qui prédit que le nombre de transistors sur une puce électronique doublera chaque année, ralentit en raison des limites physiques liées à l’installation d’un plus grand nombre de transistors sur des micropuces abordables. Ces augmentations de puissance informatique ralentissent à mesure que la demande augmente pour des ordinateurs hautes performances capables de prendre en charge des modèles d’intelligence artificielle de plus en plus complexes. Cet inconvénient a conduit les ingénieurs à explorer de nouvelles méthodes pour étendre les capacités de calcul de leurs machines, mais la solution reste floue.
Potentiel du calcul photonique
L’informatique photonique est un remède potentiel aux exigences informatiques croissantes des modèles d’apprentissage automatique. Au lieu d’utiliser des transistors et des fils, ces systèmes utilisent des photons (particules lumineuses microscopiques) pour effectuer des opérations de calcul dans le domaine analogique. Les lasers produisent ces petits faisceaux d’énergie qui se déplacent à la vitesse de la lumière comme un vaisseau spatial volant à vitesse de distorsion dans un film de science-fiction. Lorsque des cœurs de calcul photonique sont ajoutés à des accélérateurs programmables comme une carte d’interface réseau (NIC et son homologue augmenté, SmartNIC), le matériel résultant peut être branché pour turbocharger un ordinateur standard.
MIT les chercheurs ont désormais exploité le potentiel de la photonique pour accélérer l’informatique moderne en démontrant ses capacités dans apprentissage automatique. Surnommé « Lightning », leur SmartNIC reconfigurable photonique-électronique aide les réseaux neuronaux profonds – des modèles d’apprentissage automatique qui imitent la façon dont le cerveau traite les informations – à effectuer des tâches d’inférence telles que la reconnaissance d’images et la génération de langage dans des chatbots tels que ChatGPT. La conception novatrice du prototype permet des vitesses impressionnantes, créant ainsi le premier système informatique photonique capable de répondre aux demandes d’inférence d’apprentissage automatique en temps réel.
Surmonter les limites photoniques
Malgré leur potentiel, l’un des défis majeurs liés à la mise en œuvre de dispositifs informatiques photoniques est qu’ils sont passifs, ce qui signifie qu’ils ne disposent pas de mémoire ou d’instructions pour contrôler les flux de données, contrairement à leurs homologues électroniques. Les systèmes informatiques photoniques précédents étaient confrontés à ce goulot d’étranglement, mais Lightning supprime cet obstacle pour garantir le bon déroulement du mouvement des données entre les composants électroniques et photoniques.
« L’informatique photonique a montré des avantages significatifs en accélérant des tâches de calcul linéaire volumineuses telles que la multiplication matricielle, alors qu’elle a besoin de l’électronique pour s’occuper du reste : accès à la mémoire, calculs non linéaires et logique conditionnelle. Cela crée une quantité importante de données à échanger entre la photonique et l’électronique pour effectuer des tâches informatiques du monde réel, comme une demande d’inférence d’apprentissage automatique », explique Zhizhen Zhong, postdoctorant dans le groupe du professeur agrégé du MIT Manya Ghobadi au MIT Computer Science. et Laboratoire d’Intelligence Artificielle (CSAIL). « Le contrôle de ce flux de données entre la photonique et l’électronique était le talon d’Achille des travaux informatiques photoniques de pointe antérieurs. Même si vous disposez d’un ordinateur photonique ultra-rapide, vous avez besoin de suffisamment de données pour l’alimenter sans blocage. Sinon, vous avez un supercalculateur qui tourne au ralenti sans effectuer aucun calcul raisonnable.
Ghobadi, professeur agrégé au Département de génie électrique et d’informatique (EECS) du MIT et membre du CSAIL, et ses collègues du groupe sont les premiers à identifier et à résoudre ce problème. Pour réaliser cet exploit, ils ont combiné la vitesse de la photonique et les capacités de contrôle du flux de données des ordinateurs électroniques.
Faire le lien entre la photonique et l’électronique
Avant Lightning, les systèmes informatiques photoniques et électroniques fonctionnaient indépendamment et parlaient des langages différents. Le système hybride de l’équipe suit les opérations de calcul requises sur le chemin de données à l’aide d’une abstraction de comptage-action reconfigurable, qui connecte la photonique aux composants électroniques d’un ordinateur. Cette abstraction de programmation fonctionne comme un langage unifié entre les deux, contrôlant l’accès aux flux de données qui y transitent. Les informations transportées par les électrons sont traduites en lumière sous forme de photons, qui fonctionnent à la vitesse de la lumière pour faciliter l’accomplissement d’une tâche d’inférence. Ensuite, les photons sont reconvertis en électrons pour transmettre l’information à l’ordinateur.
En connectant de manière transparente la photonique à l’électronique, la nouvelle abstraction de comptage-action rend possible la fréquence de calcul rapide en temps réel de Lightning. Les tentatives précédentes utilisaient une approche stop-and-go, ce qui signifie que les données seraient entravées par un logiciel de contrôle beaucoup plus lent qui prenait toutes les décisions concernant ses mouvements.
« Construire un système informatique photonique sans abstraction de la programmation par comptage, c’est comme essayer de diriger une Lamborghini sans savoir comment conduire », explique Ghobadi, auteur principal de l’article.
« Que feriez-vous? Vous avez probablement un manuel de conduite dans une main, puis appuyez sur l’embrayage, puis vérifiez le manuel, puis relâchez le frein, puis vérifiez le manuel, et ainsi de suite. Il s’agit d’une opération intermittente car, pour chaque décision, vous devez consulter une entité de niveau supérieur pour vous dire quoi faire. Mais ce n’est pas ainsi que nous conduisons ; nous apprenons à conduire puis à utiliser la mémoire musculaire sans consulter le manuel ou les règles de conduite au volant. Notre abstraction de programmation comptage-action agit comme la mémoire musculaire dans Lightning. Il pilote de manière transparente les électrons et les photons du système au moment de l’exécution.
Une révolution informatique respectueuse de l’environnement
Les services d’apprentissage automatique effectuant des tâches basées sur l’inférence, comme ChatGPT et BERT, nécessitent actuellement de lourdes ressources informatiques. Non seulement ils sont coûteux – certaines estimations montrent que ChatGPT nécessite 3 millions de dollars par mois pour fonctionner – mais ils sont également préjudiciables à l’environnement, émettant potentiellement plus du double du dioxyde de carbone d’une personne moyenne. La foudre utilise des photons qui se déplacent plus rapidement que les électrons dans les fils, tout en générant moins de chaleur, ce qui lui permet de calculer à une fréquence plus rapide tout en étant plus économe en énergie.
Pour mesurer cela, le groupe Ghobadi a comparé son appareil à des unités de traitement graphique standard, des unités de traitement de données, des SmartNIC et d’autres accélérateurs en synthétisant une puce Lightning. L’équipe a observé que Lightning était plus économe en énergie lors de la réalisation de requêtes d’inférence. « Nos études de synthèse et de simulation montrent que Lightning réduit la consommation d’énergie des inférences d’apprentissage automatique de plusieurs ordres de grandeur par rapport aux accélérateurs de pointe », explique Mingran Yang, étudiant diplômé du laboratoire de Ghobadi et co-auteur de l’article. En étant une option plus rentable et plus rapide, Lightning présente une mise à niveau potentielle pour les centres de données afin de réduire l’empreinte carbone de leur modèle d’apprentissage automatique tout en accélérant le temps de réponse d’inférence pour les utilisateurs.
Les autres auteurs de l’article sont Homa Esfahanizadeh, postdoctorant au MIT CSAIL, et l’étudiant de premier cycle Liam Kronman, ainsi que le professeur agrégé du MIT EECS, Dirk Englund, et trois récents diplômés du département : Jay Lang ’22, MEng ’23 ; Christian Williams ’22, MEng ’23; et Alexander Sludds ’18, MEng ’19, PhD ’23. Leurs recherches ont été financées en partie par le DARPA Le programme FastNICs, le programme ARPA-E ENLITENED, le DAF-MIT AI Accelerator, le bureau de recherche de l’armée américaine par l’intermédiaire de l’Institute for Soldier Nanotechnologies, les subventions de la National Science Foundation (NSF), le NSF Center for Quantum Networks et une bourse Sloan.
Le groupe présentera ses conclusions ce mois-ci au groupe d’intérêt spécial sur la communication de données (SIGCOMM) de l’Association for Computing Machinery.