06/23/2026 | News release | Distributed by Public on 06/23/2026 06:14
Mis à jour le 23/06/2026
L'intelligence artificielle excelle dans les tâches de prédiction, comme la déduction des mots qui se suivent dans une phrase. Mais il existe tout un pan de l'IA où cette approche, appelée apprentissage supervisé, fonctionne beaucoup moins bien, dès que l'algorithme doit non seulement prédire, mais aussi agir en interaction avec ce qui ce qui l'entoure. C'est le cas par exemple d'un robot qui doit s'adapter à son environnement, d'un système d'aide à la décision médicale qui évalue l'effet d'un traitement sur l'état d'un patient, ou encore d'un véhicule autonome confronté à des décisions en temps réel.
Ce passage de la prédiction à l'action relève de l'apprentissage par renforcement. « Les conséquences s'avèrent importantes pour les algorithmes qui deviennent instables, constate Francis Bach, expert du machine learning, responsable de l'équipe-projet SIERRA, commune à Inria, au CNRS et à l'École normale supérieure-PSL, et détenteur d'une chaire PRAIRIE. Dans ces situations complexes en haute dimension, où les variables sont multiples, les techniques existantes s'effondrent et les ingénieurs passent un temps considérable à procéder par essai-erreur pour stabiliser les systèmes. »
Le projet Tourmalet, qui mobilisera l'ensemble de l'équipe-projet commune SIERRA, vise justement à combler ce manque de fiabilité des algorithmes. Son nom n'a pas été choisi au hasard. Passionné de cyclisme, Francis Bach l'a choisi en l'honneur du célèbre col pyrénéen du Tour de France : « A priori, ce projet est risqué et il permet d'explorer de nouveaux horizons, comme le col du Tourmalet. Ce nom symbolise donc notre recherche. »
Pour mener à bien ce projet ambitieux, le chercheur vient de se voir attribuer une ERC Advanced Grant. C'est la troisième bourse européenne que Francis Bach parvient à décrocher, après une Starting Grant en 2009 et une Consolidator Grant en 2016. Un palmarès rare dans un même domaine de recherche. « C'est valorisant, mais je considère que cette distinction constitue avant tout une reconnaissance pour mon équipe, souligne-t-il. Également pour Inria, qui a mis en place une cellule ERC afin d'aider ses chercheurs à se porter candidats. C'est un soutien précieux. »
Cette bourse représente aussi un puissant accélérateur pour son projet : « Disposer de 2,5 millions d'euros sur cinq ans va nous permettre de nous concentrer sur nos travaux scientifiques. C'est un vrai confort qui simplifie notre recherche. »
En quoi consistera l'innovation développée par le projet Tourmalet ? Pour la comprendre, il faut distinguer trois approches de construction d'un modèle d'IA. La première est celle de la boîte noire, dominante aujourd'hui. Elle consiste à entraîner des modèles avec des milliards de paramètres, sans qu'il soit nécessaire de décrire ce qui se passe entre l'entrée et la sortie. Cette approche se révèle particulièrement performante tant que les volumes de données sont abondants. En revanche, elle rend difficile la compréhension des résultats obtenus et ne permet pas toujours d'en garantir la fiabilité. À l'opposé, la boîte blanche consiste à tout modéliser et à écrire à la main la totalité des règles et des interactions. Une tâche à la fois titanesque et souvent inapplicable face à la complexité du monde réel.
Le projet Tourmalet, lui, explore une voie intermédiaire, celle de la boîte grise. « L'idée, c'est de donner suffisamment d'informations et d'injecter les contraintes physiques et structurelles au modèle, tout en laissant l'algorithmique et les données trouver ensuite les détails », explique Francis Bach. Prenons une vidéo : plutôt que de décrire chaque pixel et ses interactions avec les pixels voisins, on indique simplement qu'une image à l'instant T ressemble fortement à l'image à l'instant T+1, hormis quelques mouvements. Cette contrainte minimale suffit déjà à guider l'apprentissage.
L'autre pilier du projet Tourmalet concerne les garanties mathématiques, autrement dit la capacité d'un algorithme à certifier ses propres résultats. « Quand on n'est pas sûr, il faut le spécifier, pour que l'utilisateur sache à quel point se fier à la machine, insiste Francis Bach. Dans les domaines à enjeux critiques comme la médecine ou la robotique, ces garanties deviennent indispensables. »
Des garanties de deux natures. D'une part, les garanties a priori permettent de dimensionner l'algorithme, avant de le faire tourner. Elles visent à estimer les ressources nécessaires pour résoudre un problème donné. Par exemple, combien de cas médicaux un hôpital doit-il analyser avant qu'une solution d'IA soit opérationnelle ? Les garanties a posteriori, elles, sont fournies une fois l'algorithme exécuté. Par exemple, si un robot doit arriver à un point donné, peut-on certifier qu'il l'atteindra à 20 centimètres près ?
En apprentissage supervisé classique, de telles garanties existent déjà. En revanche, elles restent à construire dans le cadre de l'apprentissage par renforcement, où les interactions et les données de haute dimension compliquent l'analyse.
Le projet Tourmalet démarrera en 2027, avec le recrutement prévu de quatre doctorants et d'un chercheur junior sur cinq ans. Il s'appuiera sur des collaborations étroites avec d'autres équipes du Centre Inria de Paris, pour s'assurer que les algorithmes développés soient pertinents en situations réelles, en particulier dans la robotique ou en vision artificielle.
À terme, les résultats de Tourmalet prendront notamment la forme de logiciels open source, afin de permettre à d'autres scientifiques d'exploiter directement les algorithmes produits. « À l'issue du projet, un apprentissage par renforcement plus stable et plus sûr à l'utilisation sera possible. Il s'avérera aussi beaucoup moins coûteux à développer », projette Francis Bach. Un enjeu central à l'heure où les coûts économiques et environnementaux liés à l'entraînement des IA continuent de grimper. Et une étape indispensable pour déployer l'IA de demain.