Les mathématiciens aiment la certitude des preuves. C'est ainsi qu'ils vérifient que leur intuition correspond à la vérité observable.
Cet amour logique des preuves est particulièrement adapté à l'ouverture de la boîte noire de l'intelligence artificielle (IA) à l'examen dans le but d'établir la confiance. Les mathématiques et l'IA peuvent sembler être des partenaires naturels, mais l'IA commence à peine à recevoir une attention considérable de la communauté des mathématiques. Au Pacific Northwest National Laboratory (PNNL), les mathématiciens explorent les limites de ce que l'IA peut atteindre tout en assurant que nous pouvons croire ce qu'il nous dit.
La relation entre les mathématiques et l'IA
Henry Kvinge, un mathématicien de PNNL qui est profondément impliqué dans la recherche sur l'IA, décompose la relation en trois seaux qui jouent chacun un rôle vital dans l'exploitation du potentiel des systèmes d'IA.
Mathématiques pour comprendre l'IA: Les mathématiques offrent des outils puissants pour déchiffrer le fonctionnement interne des modèles d'IA complexes, dit-il. Par exemple, les chercheurs s'efforcent de décoder ce qui se passe dans les réseaux de neurones – les boîtes noires de l'IA – pour s'assurer que les décisions qu'ils prennent ne reposent pas sur un raisonnement erroné ou une logique défectueuse. Les mathématiques aident à disséquer ces systèmes complexes, en identifiant les défaillances sous-jacentes et en optimisant les performances. Récemment, Kvinge a écrit un article qui résume ses réflexions sur la façon dont les concepts mathématiques comme la courbure, la forme et la symétrie fournissent des kits d'outils pour analyser la précision d'un modèle d'IA donné pour une tâche assignée.
Mathématiques pour inspirer le développement de l'IA: Les mathématiques fournissent le langage pour décrire les principes de conception de haut niveau des systèmes d'IA. En codant pour les principes mathématiques, les modèles d'IA peuvent être contraints, tout en étant autorisés à apprendre une solution à partir des données de manière organique. Cette approche peut entraîner une réduction du temps de formation, nécessitant moins de ressources de calcul, a déclaré Kinge.
Par exemple, les développeurs parlent souvent de la formation de l'IA dans le contexte d'un paysage de perte avec des montagnes et des vallées correspondant respectivement à des modèles faibles et forts. Pendant l'entraînement, l'objectif est de faire en sorte que le modèle s'installe dans une large vallée relativement peu profonde correspondant à un modèle robuste. Dans ce contexte, des concepts mathématiques comme la symétrie et la courbure peuvent être utilisés pour développer des routines de formation qui poussent le modèle vers des solutions plus favorables, a-t-il ajouté.
IA pour les mathématiques: Tout comme les scientifiques ont commencé à explorer comment l'IA peut contribuer à des découvertes scientifiques plus rapides, les mathématiciens se rendent compte que l'IA peut être formée pour résoudre les problèmes complexes et non résolus en mathématiques, a déclaré Kinte. Récemment, Kvinge et ses collègues ont montré qu'un algorithme d'IA pouvait fournir les idées nécessaires pour redécouvrir un résultat difficile dans la combinatoire algébrique.
Les chercheurs ont mis en place leur problème afin qu'ils aient pu ouvrir la boîte noire et pair à l'intérieur pour voir comment l'algorithme a atterri sur ses résultats. Ce type d'étude est encore relativement rare car l'ingénierie inverse La solution trouvée par un système basé sur l'apprentissage en profondeur est laborieuse et nécessite une expertise spéciale.
Comme le note Kvinge, de nombreux mathématiciens traditionnels restent sceptiques quant à l'efficacité de l'IA dans l'avancement des mathématiques pures. Cependant, ce résultat a montré l'application réussie d'un modèle d'IA étroit à un problème mathématique spécifique. Des résultats comme celui-ci devraient progressivement réchauffer la communauté plus large au potentiel de la recherche axée sur l'IA, a-t-il ajouté.
Le résultat de la recherche faisait partie d'un investissement plus important sur 4 ans de PNNL pour explorer le rôle des mathématiques pour le raisonnement artificiel en science (Mars). Le succès de ce travail initial a conduit à de nouvelles questions et défis que Kvinge et son équipe aborderont sous le nouvel investissement de PNNL appelé Generative IA: Foundations for the Future et grâce à son travail collaboratif explorant la topologie, l'algèbre et la géométrie pour relever les défis fondamentaux des sciences des données.
Sur ce front, Kvinge a encouragé ses collègues mathématiques à explorer la gamme de problèmes mathématiques non résolus conviviaux sur l'IA sur lesquels l'équipe de Mars a collaboré pour produire pour la communauté des mathématiques. L'ensemble organisé de repères ML dans les problèmes de combinatoire algébrique, ainsi que des solutions publiés, sont disponibles sur Github.
Collaboration entre les mathématiciens et les ingénieurs de données
L'expérience de Kvinge a été que dans le développement de l'IA, bon nombre des avancées les plus importantes sont motivées par l'ingénierie. Les mathématiciens, traditionnellement enclins à travailler à partir des premiers principes, peuvent mieux collaborer en étant ouvert à l'application de mathématiques à des problèmes et des observations faites sur des systèmes réels par la communauté d'apprentissage automatique, a-t-il déclaré. Cette dynamique maintient les contributions des mathématiques fondées sur des problèmes pratiques.
En se plongeant dans des données et en analysant les comportements émergents dans les modèles d'IA, les mathématiciens peuvent proposer des solutions plus pertinentes. Les mathématiques offrent un cadre pour prendre des décisions de conception, tout en laissant l'exécution à l'algorithme d'apprentissage.
« Il y a ce célèbre article dans Machine Learning appelé » The Bitter Leçon « , qui dit essentiellement que autant que possible, vous devriez essayer de supprimer les choix humains du processus d'apprentissage et compter sur les données et calculer », a-t-il déclaré. « Grâce à sa capacité à encadrer les concepts à un niveau très abstrait, les mathématiques peuvent nous aider à imposer des contraintes minimales à un système, laissant le reste pour l'algorithme d'apprentissage. »
Le problème est que, a-t-il ajouté, « ces modèles reprendront certaines corrélations parasites qui sont liées à la façon dont vous avez collecté ou pré-soutr les données. C'est comme un étudiant qui trouvait un moyen d'assigner le test sans apprendre réellement le matériel. Pour le moment, il est important d'avoir un humain dans la boucle pour attraper ce type de chose. »
Mais pénétrer dans les réseaux de neurones pour faire ce type de travail de détective nécessite des mathématiques. Et cela va garder Kinge et ses collègues occupés dans un avenir prévisible.


