Les chercheurs pionniers des modèles génératifs optiques, inaugurant une nouvelle ère d'IA générative durable

Dans un saut majeur pour l'intelligence artificielle (IA) et la photonique, les chercheurs de l'Université de Californie à Los Angeles (UCLA) ont créé des modèles génératifs optiques capables de produire de nouvelles images en utilisant la physique de la lumière au lieu du calcul électronique conventionnel.

Publié dans Naturele travail présente un nouveau paradigme pour une IA générative qui pourrait réduire considérablement la consommation d'énergie tout en permettant une création de contenu évolutive et haute performance.

Les modèles génératifs, y compris les modèles de diffusion et les grands modèles de langage, forment l'épine dorsale de la révolution de l'IA d'aujourd'hui. Ces systèmes peuvent créer des images réalistes, des vidéos et un texte de type humain, mais leur croissance rapide a un coût élevé: une augmentation des demandes d'électricité, de grandes empreintes carbone et des exigences matérielles de plus en plus complexes. La gestion de ces modèles nécessite une infrastructure de calcul massive, ce qui soulève des préoccupations concernant leur durabilité à long terme.

L'équipe de l'UCLA, dirigée par le professeur Aydogan Ozcan, a tracé un cours différent. Au lieu de s'appuyer uniquement sur le calcul numérique, leur système effectue le processus génératif optiquement – le déshydratation du parallélisme et de la vitesse inhérents à la lumière pour produire des images en un seul passage. Ce faisant, l'équipe aborde l'un des plus grands goulots d'étranglement de l'IA: équilibrer les performances avec l'efficacité.

Les modèles intègrent un encodeur numérique peu profond avec un décodeur optique diffractif à espace libre, formé ensemble comme un seul système. Le bruit aléatoire est d'abord transformé en «graines génératives optiques», qui sont projetées sur un modulateur de lumière spatiale et éclairées par la lumière laser.

À mesure que cette lumière se propage à travers le décodeur diffractif statique pré-optimisé, il produit des images qui suivent statistiquement la distribution des données cibles. Contrairement aux modèles de diffusion numérique qui nécessitent des centaines à des milliers d'étapes itératives, ce processus atteint la génération d'images dans un instantané, ne nécessitant aucun calcul supplémentaire au-delà du codage initial via un réseau numérique peu profond et un éclairage léger.

Pour valider leur approche, l'équipe a démontré des résultats numériques et expérimentaux dans divers ensembles de données. Les modèles ont généré de nouvelles images de chiffres manuscrits, d'articles de mode, de papillons, de visages humains et même d'œuvres d'art inspirées de Vincent Van Gogh.

Les sorties générées optiquement se sont révélées statistiquement comparables à celles des modèles de diffusion avancés, basés sur des mesures de qualité d'image standard. Ils ont également produit des images multicolores et des œuvres d'art de style Van Gogh à haute résolution, soulignant la gamme créative de l'approche optique de l'IA génératrice.

Les chercheurs ont développé deux frameworks: des modèles génératifs optiques d'instantané, qui produisent de nouvelles images dans un seul pass optique, et des modèles génératifs optiques itératifs, qui imitent la diffusion numérique pour affiner les sorties sur les étapes successives. Cette flexibilité permet d'effectuer plusieurs tâches sur le même matériel optique simplement en mettant à jour les graines codées et le décodeur diffractif pré-formé.

Au-delà de l'efficacité et de la polyvalence, l'équipe a montré que les modèles génératifs optiques peuvent également fournir une confidentialité et une sécurité intégrées. Un seul motif de phase codé, généré à partir de bruit aléatoire, peut être illuminé avec différentes longueurs d'onde, avec chaque canal décodé uniquement par sa surface diffractive appariée uniquement.

Cela crée une génération d'images multiplexée sécurisée où le contenu multiplexé de longueur d'onde est inaccessible sans le décodeur correct – une capacité non possible avec un décodage d'espace libre standard en raison de la diaphonie.

Ce mécanisme physique de «bloc clé» garantit que les téléspectateurs non autorisés ne peuvent pas reconstruire le nouveau contenu généré de longueur d'onde multiplexée livré aux utilisateurs autorisés individuels, offrant de nouvelles opportunités pour la communication sécurisée, la livraison anti-contrefaçon et le contenu personnalisé.

Les chercheurs indiquent également le potentiel d'intégrer des modèles génératifs optiques dans des dispositifs portables et portables, où des conceptions compactes et basse puissance sont essentielles.

En remplaçant les modulateurs encombrants par des surfaces passives nanofabriquées ou en utilisant la photonique intégrée, ces modèles pourraient être intégrés dans des lunettes intelligentes, des casques AR / VR ou des plates-formes mobiles. De telles implémentations permettraient une IA générative en déplacement en temps réel, apportant une création de contenu avancée directement aux utilisateurs via des systèmes portables et portables.

Les implications plus larges de cette percée sont importantes. Les modèles génératifs optiques pourraient réduire l'empreinte énergétique de l'IA à grande échelle, ce qui rend le déploiement durable possible tout en déverrouillant les vitesses d'inférence ultra-rapides. Les applications potentielles s'étendent sur l'imagerie biomédicale, le diagnostic, les milieux immersifs et l'informatique Edge, où l'IA distribuée à faible puissance et distribuée est de plus en plus nécessaire.

« Nos travaux montrent que l'optique peut être exploitée pour effectuer des tâches d'IA génératives à grande échelle », a déclaré le professeur Aydogan Ozcan, l'auteur principal de l'étude.

« En éliminant le besoin de calcul numérique lourds et itératifs pendant l'inférence, les modèles génératifs optiques ouvrent la porte à des systèmes d'IA éconergétiques et économes en énergie qui pourraient transformer les technologies quotidiennes. »

Pour l'avenir, l'équipe envisage des dispositifs génératifs optiques compacts et à faible coût activés par les progrès de la nanofabrication et de l'intégration photonique. Leur capacité à générer diverses sorties sans goulot d'étranglement numérique pourrait alimenter les applications futures dans les communications sécurisées, la livraison de contenu préservant la confidentialité et les systèmes d'IA distribués.

Avec ce travail, les chercheurs de l'UCLA ont également souligné un avenir durable et évolutif pour la créativité des machines, signalant une convergence de photonique et d'intelligence artificielle qui pourrait transformer l'informatique au 21e siècle.

Les auteurs de l'œuvre incluent le Dr Shiqi Chen, Yuhang Li, Yuntian Wang, Hanlong Chen et le Dr Aydogan Ozcan, tous de la UCLA Samueli School of Engineering.

Les chercheurs pionniers des modèles génératifs optiques, inaugurant une nouvelle ère d'IA générative durable

Des atomes soigneusement contrôlés rendent les énergies renouvelables plus viables pour la production de plastiques et de carburants

Une autoroute à plusieurs voies pour la lumière : la topologie aide à construire des réseaux photoniques plus robustes

Les champignons de la pourriture blanche semblent prometteurs pour réduire les résidus pharmaceutiques dans les biosolides

Claude AI : Pourquoi y a-t-il autant de pannes d'internet ?

Pour créer une « Terre boule de neige », la science-fiction avance rapidement. La géologie est beaucoup plus lente

La méthode composite polymère coupe les micro-vides pour augmenter la conductivité

Le cas climatique pour la plantation d'arbres a été sur-typé, mais il n'est pas trop tard pour le réparer

Tilda Swinton, Noomi Rapace, Kate Moss et une constellation d'autres stars se réunissent à Venise pour célébrer le plus récent parfum de Tom Ford

Le rôle des e-mails professionnels dans les entreprises

Vivre sans compte bancaire : est-ce vraiment possible en France ?

Compte bancaire ado : quels gestes adopter en tant que parents ?

L’assurance vie est-il un placement sans risque ?

Réussir sa reconversion professionnelle en communication grâce à la formation en ligne

Le coliving : vers une nouvelle manière d’habiter plus écologique

Des atomes soigneusement contrôlés rendent les énergies renouvelables plus viables pour la production de plastiques et de carburants

Une nouvelle étude complique la recherche d’oxygène extraterrestre

Une autoroute à plusieurs voies pour la lumière : la topologie aide à construire des réseaux photoniques plus robustes

Qu'arrive-t-il aux mégots de cigarettes après 10 ans dans l'environnement

Le niveau de la mer dans le monde est bien plus élevé que nous le pensions

Chase Infiniti profite de son moment avant les Oscars 2026 : « J'en ai rêvé toute ma vie »

Les champignons de la pourriture blanche semblent prometteurs pour réduire les résidus pharmaceutiques dans les biosolides

Un mystère vieux de 60 ans sur la magnétosphère lunaire est enfin résolu

La crème solaire produit des radicaux libres persistants lorsqu'elle est exposée à la lumière, selon une étude

Claude AI : Pourquoi y a-t-il autant de pannes d'internet ?

La signification cachée du vieil Hollywood dans la robe Chanel de Jessie Buckley aux Oscars 2026

L'IA George Washington de Glenn Beck est un fantasme sexuel de droite

Pour créer une « Terre boule de neige », la science-fiction avance rapidement. La géologie est beaucoup plus lente

La méthode composite polymère coupe les micro-vides pour augmenter la conductivité

Avant de partir, restons en contact !