in

Les chercheurs pionniers des modèles génératifs optiques, inaugurant une nouvelle ère d'IA générative durable

Les chercheurs pionniers des modèles génératifs optiques, inaugurant une nouvelle ère d'IA générative durable

Dans un saut majeur pour l'intelligence artificielle (IA) et la photonique, les chercheurs de l'Université de Californie à Los Angeles (UCLA) ont créé des modèles génératifs optiques capables de produire de nouvelles images en utilisant la physique de la lumière au lieu du calcul électronique conventionnel.

Publié dans Naturele travail présente un nouveau paradigme pour une IA générative qui pourrait réduire considérablement la consommation d'énergie tout en permettant une création de contenu évolutive et haute performance.

Les modèles génératifs, y compris les modèles de diffusion et les grands modèles de langage, forment l'épine dorsale de la révolution de l'IA d'aujourd'hui. Ces systèmes peuvent créer des images réalistes, des vidéos et un texte de type humain, mais leur croissance rapide a un coût élevé: une augmentation des demandes d'électricité, de grandes empreintes carbone et des exigences matérielles de plus en plus complexes. La gestion de ces modèles nécessite une infrastructure de calcul massive, ce qui soulève des préoccupations concernant leur durabilité à long terme.

L'équipe de l'UCLA, dirigée par le professeur Aydogan Ozcan, a tracé un cours différent. Au lieu de s'appuyer uniquement sur le calcul numérique, leur système effectue le processus génératif optiquement – le déshydratation du parallélisme et de la vitesse inhérents à la lumière pour produire des images en un seul passage. Ce faisant, l'équipe aborde l'un des plus grands goulots d'étranglement de l'IA: équilibrer les performances avec l'efficacité.

Les modèles intègrent un encodeur numérique peu profond avec un décodeur optique diffractif à espace libre, formé ensemble comme un seul système. Le bruit aléatoire est d'abord transformé en «graines génératives optiques», qui sont projetées sur un modulateur de lumière spatiale et éclairées par la lumière laser.

À mesure que cette lumière se propage à travers le décodeur diffractif statique pré-optimisé, il produit des images qui suivent statistiquement la distribution des données cibles. Contrairement aux modèles de diffusion numérique qui nécessitent des centaines à des milliers d'étapes itératives, ce processus atteint la génération d'images dans un instantané, ne nécessitant aucun calcul supplémentaire au-delà du codage initial via un réseau numérique peu profond et un éclairage léger.

Pour valider leur approche, l'équipe a démontré des résultats numériques et expérimentaux dans divers ensembles de données. Les modèles ont généré de nouvelles images de chiffres manuscrits, d'articles de mode, de papillons, de visages humains et même d'œuvres d'art inspirées de Vincent Van Gogh.

Les sorties générées optiquement se sont révélées statistiquement comparables à celles des modèles de diffusion avancés, basés sur des mesures de qualité d'image standard. Ils ont également produit des images multicolores et des œuvres d'art de style Van Gogh à haute résolution, soulignant la gamme créative de l'approche optique de l'IA génératrice.

Les chercheurs ont développé deux frameworks: des modèles génératifs optiques d'instantané, qui produisent de nouvelles images dans un seul pass optique, et des modèles génératifs optiques itératifs, qui imitent la diffusion numérique pour affiner les sorties sur les étapes successives. Cette flexibilité permet d'effectuer plusieurs tâches sur le même matériel optique simplement en mettant à jour les graines codées et le décodeur diffractif pré-formé.

Au-delà de l'efficacité et de la polyvalence, l'équipe a montré que les modèles génératifs optiques peuvent également fournir une confidentialité et une sécurité intégrées. Un seul motif de phase codé, généré à partir de bruit aléatoire, peut être illuminé avec différentes longueurs d'onde, avec chaque canal décodé uniquement par sa surface diffractive appariée uniquement.







Cela crée une génération d'images multiplexée sécurisée où le contenu multiplexé de longueur d'onde est inaccessible sans le décodeur correct – une capacité non possible avec un décodage d'espace libre standard en raison de la diaphonie.

Ce mécanisme physique de «bloc clé» garantit que les téléspectateurs non autorisés ne peuvent pas reconstruire le nouveau contenu généré de longueur d'onde multiplexée livré aux utilisateurs autorisés individuels, offrant de nouvelles opportunités pour la communication sécurisée, la livraison anti-contrefaçon et le contenu personnalisé.

Les chercheurs indiquent également le potentiel d'intégrer des modèles génératifs optiques dans des dispositifs portables et portables, où des conceptions compactes et basse puissance sont essentielles.

En remplaçant les modulateurs encombrants par des surfaces passives nanofabriquées ou en utilisant la photonique intégrée, ces modèles pourraient être intégrés dans des lunettes intelligentes, des casques AR / VR ou des plates-formes mobiles. De telles implémentations permettraient une IA générative en déplacement en temps réel, apportant une création de contenu avancée directement aux utilisateurs via des systèmes portables et portables.

Les implications plus larges de cette percée sont importantes. Les modèles génératifs optiques pourraient réduire l'empreinte énergétique de l'IA à grande échelle, ce qui rend le déploiement durable possible tout en déverrouillant les vitesses d'inférence ultra-rapides. Les applications potentielles s'étendent sur l'imagerie biomédicale, le diagnostic, les milieux immersifs et l'informatique Edge, où l'IA distribuée à faible puissance et distribuée est de plus en plus nécessaire.

« Nos travaux montrent que l'optique peut être exploitée pour effectuer des tâches d'IA génératives à grande échelle », a déclaré le professeur Aydogan Ozcan, l'auteur principal de l'étude.

« En éliminant le besoin de calcul numérique lourds et itératifs pendant l'inférence, les modèles génératifs optiques ouvrent la porte à des systèmes d'IA éconergétiques et économes en énergie qui pourraient transformer les technologies quotidiennes. »

Pour l'avenir, l'équipe envisage des dispositifs génératifs optiques compacts et à faible coût activés par les progrès de la nanofabrication et de l'intégration photonique. Leur capacité à générer diverses sorties sans goulot d'étranglement numérique pourrait alimenter les applications futures dans les communications sécurisées, la livraison de contenu préservant la confidentialité et les systèmes d'IA distribués.

Avec ce travail, les chercheurs de l'UCLA ont également souligné un avenir durable et évolutif pour la créativité des machines, signalant une convergence de photonique et d'intelligence artificielle qui pourrait transformer l'informatique au 21e siècle.

Les auteurs de l'œuvre incluent le Dr Shiqi Chen, Yuhang Li, Yuntian Wang, Hanlong Chen et le Dr Aydogan Ozcan, tous de la UCLA Samueli School of Engineering.

Le cas climatique pour la plantation d'arbres a été sur-typé, mais il n'est pas trop tard pour le réparer

Le cas climatique pour la plantation d'arbres a été sur-typé, mais il n'est pas trop tard pour le réparer

Tilda Swinton, Noomi Rapace, Kate Moss et une constellation d'autres stars se réunissent à Venise pour célébrer le plus récent parfum de Tom Ford

Tilda Swinton, Noomi Rapace, Kate Moss et une constellation d'autres stars se réunissent à Venise pour célébrer le plus récent parfum de Tom Ford