Séminaire : Quelles mathématiques pour une IA fiable, frugale, moins artificielle ?
Chaque mois, la firme OpenAI nous annonce un nouvel opus de GPT, censé nous rapprocher de la super intelligence ou AGI (Artificial General Intelligence) et d’éclipser l’intelligence humaine. Ce devait être le fameux GPT 5 en août 2025 mais ce fut vite une déception parmi les fans. Depuis, on attend toujours surtout après l’annonce de NVIDIA d’investir $100mds à comparer aux €1,3mds que ASML investit dans Mistral AI !
La technologie LLM souffre en effet de défauts congénitaux :
Hallucinations, Les modèles de langage hallucinent parce que les procédures standard d’entraînement et d’évaluation récompensent les conjectures plutôt que la reconnaissance de l’incertitude. » L’IA est incapable de dire « Je ne sais pas ».
Difficultés à raisonner, les chercheurs d’Apple ont sorti d’Apple un rapport nommé « Illusion of Thinking » où ils analysent les capacités de raisonnement des LRM (Large Reasoning Language) comme GPT-4, Claude 3.7 Sonnet ou encore DeepSeek-R1 qui utilisent la technique du « Chain of Thougth ». Ils ont soumis à ces IAs des problèmes logiques de Tour de Hanoi et des énigmes de traversée de rivière. Ces IAs, qui effectuent de la reconnaissance de motifs et de la prédiction, parfaitement entrainées sur des benchmarks mathématiques, sont pourtant incapables de résoudre ce type de problèmes.
Un gouffre en énergie, le dernier centre de donnée d’Elon Musk, Colossus 2, nécessite 1 GW, soit une tranche de centrale nucléaire. Les GAFAM ont mis la main sur le nouveau secteur des mini réacteurs nucléaires ou SMR.
Penser qu’on peut faire émerger l’intelligence par accumulation de données relève de la croyance au déterminisme.
En effet, imiter ou extrapoler n’est pas créer, au même titre qu’exécuter ne signifie pas comprendre. L’histoire célèbre de Hans le Malin au début du 20 ième siècle, le cheval doué en arithmétique, montre que ces illusions d’intelligence ne datent pas d’aujourd’hui.
Au final, les IA génératives sont non fiables par définition et énergivores. Elles n’ont aucun avenir dans les usines et les processus critiques.
Comment aller au-delà et faire sauter ces verrous. L’avenir réside dans des modèles qui s’inspirent de l’apprentissage efficace et frugal des humains. Les neurosciences peuvent apporter des solutions.
La mathématicienne Olivia Caramello a identifié un certain nombre de caractéristiques fondamentales qui sont à l’origine de l’efficacité de l’intelligence humaine :
- La capacité à identifier des invariants, permettant une compréhension qualitative, plutôt que numérique ou quantitative, de phénomènes complexes
- La capacité à combiner et à synthétiser différents points de vue sur un thème donné, correspondant à différents invariants
- La capacité à fonctionner à différents niveaux d’abstraction et à s’appuyer sur des connaissances acquises précédemment.
- L’utilisation de différents types de langages pour décrire et représenter des éléments de la réalité, afin que les découvertes sur le monde puissent être exprimées, stockées et communiquées à d’autres agents
Nous sommes encore loin d’une forme d’une nouvelle intelligence artificielle bénéficiant de toutes ces caractéristiques. De nouvelles bases mathématiques sont nécessaires pour atteindre ces objectifs.
Ce séminaire propose comme piste la théorie des topos d’Alexandre Grothendieck, un univers de concepts mathématiques, multidimensionnels et interconnectés, servant de pont entre différents domaines des mathématiques, comme la logique, la géométrie et l’algèbre.
COORDINATION SCIENTIFIQUE
![]() |
![]() |
![]() |
|
David Menga EDFlab Saclay |
Gérard Memmi Telecom Paris |
Bernard Monnier MIM |
Tarifs
- Participation aux frais :
- Gratuit
Pour les entreprises adhérentes d’Aristote - 60,00€ TTC
Pour les entreprises non adhérentes à Aristote - 70.00€ TTC
Pour les règlements sur place
INSCRIPTION
- Formulaire d’inscription :
Parking EDF, si vous souhaitez en bénéficier (plaque pour Groupe EDF/ pas de plaque pour les externes) inscription au plus tard le 11 mai (aucun délai supplémentaire ne pourra être accordé).
PAIEMENT
- Par Carte Bleue :
- directement lors de l’inscription
- Par chèque :
- à l’ordre de “Association Aristote”
- Par virement bancaire :
- (IBAN : FR76 3000 4008 8600 0042 1466 411)
DATE & LIEU
21 mai 2026
9h00 - 17h30
EDF Lab Paris-Saclay
Amphithéâtre Marie Curie
SITUATION
Organisateurs et partenaires
PROGRAMME
08h30 – 08h50
Accueil & café
08h50 – 08h55
Mot d’accueil d’EDF
Stéphane DUPRE la TOUR
EDFlab Saclay
08h55 – 09h00
Présentation de la journée
David MENGA
Gérard MEMMI
Telecom Paris
09h00 – 10h00
IA informée par les structures symplectiques de la géométrie de l’information et la « thermodynamique des groupes de Lie »
Frédéric BARBARESCO
Responsable scientifique chez Thales pour la division quantique et l’IA embarquée.
10h00 -11h00
Topos et ‘ponts’ pour l’intelligence artificielle générale
Olivia CARAMELLO
Présidente de l’Institut Grothendiek à Mondovi, Italie
11h00 – 11h15
Pause café
11h15 – 12h00
De la perception au Topos
Patrick PIRIM
Directeur technique de la société Anotherbrain
12h00 – 12h30
Au-delà de l’apprentissage statistique, quelles directions prendre ?
Jean-Claude BELFIORE
Directeur du laboratoire « Advanced Wireless Lab » de Huawei à Boulogne Billancourt
12h30 – 14h00
Déjeuner buffet
14h00 – 15h00
Calculer avec les sous-espaces
Laurent LAFFORGUE
Médaille Fields 2002 et Mathématicien au Centre Lagrange de recherche Huawei en mathématiques à Paris
15h00 – 16h30
Table ronde
animée par Sylvain ALLEMAND,
avec le concours d’Alexandru DOBRILA
♦ Jean-Claude BELFIORE
♦ Olivia CARAMELLO
♦ Alexandru DOBRILA
♦ Martin GONZALEZ
♦ Laurent LAFFORGUE
♦ Patrick PIRIM
Journaliste et essayiste EPA Paris Saclay
Directeur de recherche Hivenet et PoliCloud
16h30
Cocktail
Résumé de la présentation
L’IA informée par la physique et la géométrie | Frédéric BARBARESCO
Les réseaux de neurones informés par la Physique (PINN « Physics-Informed Neural Network » et HNN « Hamiltonian Neural Network ») sont une alternative pour une IA plus frugale en données et en consommation énergétique en hybridant les modèles analytiques de la physique avec les techniques d’apprentissage. Nous présenterons des outils géométriques venant de la théorie des représentations des groupes de Lie (travaux de Alexandre Kirillov, Bertram Kostant et Jean-Marie Souriau), de la cohomologie des algèbres de Lie (travaux de Jean-Louis Koszul), des structures de feuilletage symplectique (travaux de Charles Ehresmann, Georges Reeb et Paulette Libermann) et de l’équation métriplectique (travaux de Baptiste Coquinot). La géométrie symplectique est la « grammaire » commune des systèmes dynamiques de la physique classique ou quantique. Nous commencerons par présenter des réseaux de neurones équivariants qui utilisent des convolutions sur les groupes de Lie non-compacts pour des applications radars ou caméra hémisphériques. Après avoir introduit le modèle symplectique de la mécanique statistique, appelée « Thermodynamique des groupe de Lie », nous l’interprétons comme une extension de la géométrie de l’information aux groupes de Lie qui donne une définition purement géométrique à l’Entropie. L’Entropie apparait ainsi comme une fonction de Casimir invariante en représentation coadjointe, sur les feuilletages symplectiques générés par les orbites coadjointes via l’application moment (l’application moment étant une géométrisation du théorème d’Emmy Noether). Sur la base des travaux de Paulette Libermann sur les feuilletages Lagrangiens transverses à connexion canonique plate, autour de ce qu’Élie Cartan appelait le « problème d’équivalence » pour s’affranchir du choix de tout système de coordonnées, nous étendons le modèle de Jean-Marie Souriau de la « Thermodynamique des groupes de Lie » au cas dissipatif via un feuilletage Riemannien, s’interprétant comme les courbes de niveaux de l’énergie, transverse au feuilletage symplectique précédent correspondant aux courbes de niveau de l’entropie ; donnant ainsi une interprétation géométrique au 2nd principe de la thermodynamique de Sadi Carnot. Nous illustrons ce modèle symplectique de la dissipation pour les réseaux de neurones informés par la thermodynamique (TINN « Thermodynamics Informed Neural Networks »). Nous montrerons comment ces modèle dissipatifs peuvent être utilisés par des réseaux de neurones informés par la physique pour le cas de la mécanique de vol des drones en modélisant le phénomène dissipatif de la trainée. Nous conclurons par une question ouverte « quel rôle joue la dissipation dans les processus d’apprentissage sachant que toutes les techniques existantes d’intelligence artificielle sont basées sur des gradients d’apprentissage non-dissipatifs ? ».
REFERENCES :
[1] Frédéric Barbaresco, Jean-Marie Souriau’s Symplectic Foliation Model of Sadi Carnot’s Thermodynamics. Entropy 2025, 27, 509. https://doi.org/10.3390/e27050509
[2] Frédéric Barbaresco, Transverse Symplectic Foliation Structure for Thermodynamics-Informed Neural Network and Lie-Groups Machine Learning; Erwin Schrödinger Institute, Vienne, Février 2025; https://www.esi.ac.at/events/t2213/
[3] Charles-Michel Marle, On Gibbs states of mechanical systems with symmetries. J. Geom. Symmetry Phys. 2020, 57, 45–85. ; DOI: 10.7546/jgsp-57-2020-45-85
[4] Charles-Michel Marle, Géométrie Symplectique et Géométrie de Poisson; Calvage & Mounet: Paris, 2nd édition augmentée, France, 2025
[5] Karl-Hermann Neeb, A classification of coadjoint orbits carrying Gibbs ensembles; https://doi.org/10.48550/arXiv.2601.04934
Frédéric BARBARESCO : Responsable du segment THALES “AI FOR SENSORS »
Diplômé de CentraleSupélec en 1991, Frédéric Barbaresco est responsable du segment THALES « AI FOR SENSORS » au sein de la Direction Technique. Il représente THALES auprès des clusters IA SEQUOIA et ANITI.
Au sein de la Direction Technique de THALES LAS, il coordonne les activités IA pour les lignes de métier Capteurs (radar et caméras EO/IR) et Systèmes (défense aérienne et contrôle du trafic aérien), et supervise la participation de THALES à la Chaire NAIADE d’IA pour les applications navales, en collaboration avec THALES DMS, l’École Navale, Naval Group et IMT Atlantique. Frédéric Barbaresco est membre du Conseil de recherche de l’ENAC (École nationale de l’aviation civile).
Il préside depuis plus de douze ans la conférence SEE GSI (Geometric Science of Information) avec la dernière édition en 2025. Il représente également la France au sein des initiatives européennes COST CaLISTA et MSCA CaLIGOLA, qui portent sur les réseaux de neurones informés par la géométrie. En 2020, il a organisé une école d’été à l’École de Physique des Houches sur le thème « Structures géométriques de la physique statistique, géométrie de l’information et apprentissage », qui a donné lieu à la publication d’un ouvrage chez Springer. En 2024, il a organisé la conférence GIML (Geometry-Informed Machine Learning) à Mines ParisTech – PSL.
Il est membre du conseil d’administration de la SMAI (Société Française de Mathématiques Appliquées et Industrielles) et membre émérite de la SEE, où il dirige le club technique SEE ISIC « Ingénierie des Systèmes d’Information et de Communication ». Il a reçu le prix Aymé Poirson 2014 de l’Académie des sciences pour l’applications des sciences à l’industrie, la médaille Ampère 2007, le prix Thévenin 2014 de la SEE et le SET Lecture Award 2012 de l’OTAN.
Topos et 'ponts' pour l’intelligence artificielle générale | Olivia CARAMELLO
Je montrerai que les topos de Grothendieck, la logique géométrique et les topos relatifs offrent un cadre conceptuel et formel idéal pour structurer le développement de l’intelligence artificielle générale. Ces outils permettent de penser l’information non plus comme un simple ensemble de données, mais comme une structure sémantique organisée par invariants, niveaux d’abstraction et relations internes – exactement les ingrédients qui caractérisent l’intelligence humaine.
L’approche topossique permet ainsi de dépasser les limites des fondements actuels de l’IA, basés sur des représentations essentiellement numériques. Les topos classifiants capturent le « noyau sémantique » d’une théorie indépendamment de ses présentations, et les ponts topossiques permettent de transférer propriétés, structures et méthodes entre descriptions hétérogènes. Cette capacité à relier des points de vue différents, à changer de base conceptuelle et à faire émerger des invariants constitue l’un des aspects clés de ce qui manque aujourd’hui aux systèmes d’apprentissage artificiels.
Nous verrons ensuite comment la logique géométrique et les théories relatives permettent de modéliser la connaissance sous forme stratifiée. Elles rendent possible une organisation hiérarchique des vocabulaires – du plus concret au plus abstrait – tout en préservant des propriétés essentielles de calcul, de preuve et d’interprétation. Cette stratification reflète la manière dont l’intelligence humaine apprend : en construisant des niveaux successifs de compréhension, chacun défini sur les précédents, et en opérant des changements de base qui simplifient localement les problèmes tout en enrichissant globalement la structure.
Pour illustrer ces idées, nous analyserons en détail le cas des matrices de Raven. Nous distinguerons quatre niveaux – structure interne, cellules, lignes, matrices – et nous montrerons comment les régularités pertinentes peuvent être exprimées comme des invariances formulées dans un langage géométrique adapté. Cette formalisation permet non seulement de guider l’apprentissage en réduisant drastiquement l’espace des paramètres à explorer, mais aussi de rendre les raisonnements explicables et formellement vérifiables. Nous discuterons enfin de l’intégration possible avec le deep learning et les grands modèles de langage, notamment via des mécanismes de « lifting » des invariances empiriques vers des séquents géométriques.
Olivia Caramello a obtenu une licence de mathématiques à l’Université de Turin ainsi qu’un diplôme de piano à l’âge de 19 ans, avant de poursuivre un doctorat en mathématiques au Trinity College de Cambridge. Elle a ensuite mené des travaux de recherche dans plusieurs institutions de premier plan : l’Université de Cambridge, la Scuola Normale Superiore de Pise, le Max-Planck-Institut für Mathematik de Bonn, l’Université Paris 7 et l’Institut des Hautes Études Scientifiques (IHES), où elle a occupé la chaire Gelfand entre 2020 et 2023. Lauréate en 2017 du concours « Rita Levi Montalcini » du Ministère italien de l’Éducation, de l’Université et de la Recherche, elle est aujourd’hui professeure à l’Université de l’Insubrie à Côme, et affiliée à l’École des Mines de Paris ainsi qu’à l’Université Paris-Saclay.
Caramello est particulièrement connue pour avoir introduit et développé la théorie unificatrice des « ponts » topossiques, présentée dans son livre Theories, Sites, Toposes: Relating and studying mathematical theories through topos-theoretic “bridges” (Oxford University Press, 2017). Cette approche novatrice exploite l’existence de représentations multiples d’un même topos pour établir des correspondances profondes entre des domaines mathématiques a priori éloignés, offrant un cadre conceptuel puissant pour faire émerger des analogies, transférer des résultats et révéler des structures cachées.
Depuis mars 2022, elle préside l’Institut Grothendieck, une fondation dédiée au développement et à la diffusion des mathématiques grothendieckiennes – en particulier la théorie des topos – dans une perspective unificatrice, interdisciplinaire et ouverte vers de nouveaux champs d’application.
De la perception au Topos | Patrick PIRIM
Patrick PIRIM : Directeur scientifique chez Anotherbrain.ai
Diplômé de l’ENSEA en 1977 .
En 1986, commence l’aventure autodidacte avec la création d’une SARL Imapply, convaincu que comprendre les solutions techniques de l’évolution simplifieraient la création de produits.
Je créée un attracteur dynamique qui se veut un traducteur universel de données en représentations sémantiques, il va être utilisé durant les 40 années suivantes, avec son intégration temporelle dans 7 circuits ASIC et un certain nombre de brevets associés concernant la perception du mouvement et des formes dans diverses applications outdoor, temps réel, et ce toujours avec l’intégration dans l’ASIC d’un µP 8bits n’excédant pas 27 MHz et d’une mémoire 16 KB contenant le programme applicatif, d’où l’efficience des produits.
Je migre naturellement vers le bio-inspiré avec un important contact académique qui se traduit par une participation active dans les GDR Biocomp, Robotique et électronique.
Aujourd’hui, après 9 ans dans la société Anotherbrain, j’ai mis en œuvre un procédé visant à l’unification fonctionnelle des différentes taches perceptives et leur compréhension en vue de reconstituer une colonne corticale, l’outil générique du cortex.
Au-delà de l’apprentissage statistique, quelles directions prendre ? | Jean-Claude BELFIORE
Les progrès récents de l’intelligence artificielle marquent une transition de l’IA générative simple (LLMs) vers des systèmes plus autonomes, capables de raisonnement complexe et d’intégration multisensorielle. L’émergence de modèles comme Claude 4.1 ou les versions avancées de GPT-5 d’OpenAI montre une capacité accrue à résoudre des problèmes logiques complexes grâce à des processus de réflexion interne plus longs. De plus, les IA ne se contentent plus de traiter du texte ou des images séparément. Elles intègrent désormais l’audio, la vidéo et les données sensorielles en temps réel, permettant une interaction beaucoup plus fluide et naturelle. En même temps, nous assistons au passage des chatbots aux « agents » capables d’exécuter des tâches complexes de bout en bout de manière autonome. Cependant, l’un des problèmes les plus importants posés par ces modèles reste leur consommation énergétique. Une seule requête d’un modèle tel que GPT-5 consomme en moyenne 3 Wh et poser une question complexe à un modèle de pointe consomme l’équivalent d’une ampoule LED allumée durant 3 heures. Cette année, la demande énergétique des centres de données pour l’IA devrait atteindre 2% de toute l’électricité mondiale consommée (un seul grand data center a besoin de l’équivalent de cinq tranches nucléaires). Comment arrêter ce processus ?
Des axes de recherche proposent des pistes très intéressantes pour obtenir des modèles beaucoup plus sobres. Ils sont essentiellement basés sur des approches structurelles à la fois topologiques et algébriques. Je montrerai, à travers plusieurs exemples, comment arriver à des modèles beaucoup plus sobres, capables de mieux généraliser, grâce à une approche modulaire et structurée utilisant les topos de Gothendieck comme guide.
Jean-Claude Belfiore est diplomé de Supelec, docteur de Telecom Paris est a reçu l’Habilitation à diriger des Recherches de l’Université Pierre et Marie Curie. Il a été professeur à Telecom Paris jusqu’en 2015, date à laquelle il a rejoint le centre de recherche parisien de Huawei. Depuis 2021, il dirige le laboratoire AWT de Huawei à Paris. En tant que professeur à Telecom Paris, il a fait des avancées importantes en modulation et codage pour les systèmes de communication sans fil en utilisant des outils issus de l’arithmétique. Il est, par exemple, l’un des inventeurs du « Golden Code » standardisé dans WiMax. Il est auteur ou co-auteur de plus de 200 publications et a dirigé plus de trente thèses de doctorat. Il a été éditeur associé, pour le codage, de la revue « IEEE Transactions on Information Theory » et a reçu la médaille Blondel en 2007. Au sein de Huawei, il a été l’un des artisans de la standardisation des codes polaires pour la 5G et travaille depuis sur la 6G en promouvant l’IA sans fil, les communications sémantiques et l’apprentissage structuré.
Calculer avec les sous-espaces | Laurent LAFFORGUE
De même que la notion classique d’espace se généralise en celle de topos de Grothendieck, la notion classique de sous-espace se généralise en celle de sous-topos.
Une notion tellement bien pensée que les sous-topos admettent un double type de présentations concrètes équivalentes, les unes en termes de topologies dues à Grothendieck, les autres en termes de systèmes d’axiomes considérés à équivalence démontrable près, selon un théorème d’Olivia Caramello.
Cette double équivalence permet en particulier de retraduire et d’étudier en termes topologiques tous les problèmes de démontrabilité en logique géométrique du premier ordre, et donc finalement tous les problèmes de démontrabilité en mathématiques.
D’autre part, les opérations géométriques naturelles sur les sous-espaces ou les sous-topos définissent via ces équivalences des opérations sur les topologies ou sur les systèmes d’axiomes qui se prêtent à des calculs approchés.
Ces opérations, qui ne sont ni plus ni moins abstraites que les opérations numériques classiques mais sont bien plus générales, peuvent servir à construire des « réseaux de neurones profonds topossiques ».
Laurent Lafforgue est un mathématicien. Il a reçu la médaille Fields en 2002 pour sa contribution à un grand programme proposé dans les années 1960 par le mathématicien canadien Robert Langlands pour relier deux parties des mathématiques a priori très éloignées, l’une algébrique qui remonte à Evariste Galois et l’autre analytique dont l’un des pères fut Henri Poincaré. Le lien entre ces théories s’établit par un pont géométrique auquel s’appliquent des techniques extraordinairement puissantes dues à Alexandre Grothendieck.
Depuis plus de dix ans, le principal intérêt de Laurent Lafforgue s’est progressivement tourné vers la théorie des « topos de Grothendieck », qui permet une vaste géométrisation des mathématiques.
Il a rejoint Huawei en 2021. Au Centre Lagrange à Paris, il collabore d’une part avec des scientifiques du monde universitaire et d’autre part avec des chercheurs de Huawei. Il travaille sur le développement de la théorie des topos, plus précisément sur la théorie des « topos comme ponts » d’Olivia Caramello, et sur l’élaboration de nouvelles formes d’intelligence artificielle basées sur celle-ci.
Table RONDE | Animée par Sylvain ALLEMAND

Diplômé de Science Po Paris et titulaire d’une maîtrise d’histoire, Sylvain Allemand suit depuis plus vingt ans l’actualité de la recherche, des initiatives et des débats relatifs au développement durable auquel il a consacré plusieurs ouvrages.
Il a rejoint l’EPA Paris-Saclay en 2012 pour y animer le site web Paris-Saclay Le Média qui avait vocation à rendre compte de la «sociodiversité » de l’écosystème à travers notamment des entretiens avec « celles et ceux qui font Paris-Saclay » : enseignants-chercheurs, étudiants, entrepreneurs, agriculteurs, artistes…
Il rend compte désormais de son actualité à travers le présent site.
Après un doctorat en systèmes distribués, portant sur l’ordonnancement et la tolérance aux pannes, j’ai évolué pendant treize ans dans l’industrie.
Chez Stellantis, j’ai contribué au développement de systèmes de stockage et de réseaux pour des datacenters hyperscale. À partir de 2018, j’ai dirigé des équipes d’infrastructure en charge des opérations réseau sur deux datacenters, ainsi que des équipes logicielles distribuées à l’échelle mondiale, développant des services connectés pour les véhicules.
En 2024, j’ai rejoint Hivenet en tant que Directeur de la Recherche. J’y pilote la stratégie scientifique autour du calcul et du stockage distribués à très grande échelle, en lien étroit avec les équipes produit et infrastructure. Mon rôle consiste notamment à transformer des verrous de recherche (résilience, orchestration, performance, passage à l’échelle) en solutions concrètes, tout en structurant des collaborations académiques, notamment avec Inria, et en contribuant à l’émergence de nouvelles architectures distribuées.
Martin Gonzalez est le référent scientifique de l’équipe Sciences de Données et IA chez IRT SystemX et membre scientifique de l’Association Européenne pour l’IA de Confiance (ETAIA). Docteur en mathématiques pures, ses travaux antérieurs portent sur l’algèbre quantique, la géométrie algébrique et différentielle, et la géométrisation de la physique mathématique.
Ses recherches interdisciplinaires couvrent la musique contemporaine, la philosophie et l’intelligence artificielle, avec un intérêt particulier pour l’intersection entre la théorie des topos et la philosophie hégélienne. Il organise le séminaire MAMUPHI sur les mathématiques, la musique et la philosophie depuis une dizaine d’années.
Ses recherches sur les équations différentielles neuronales, menées notamment avec le professeur Nader Masmoudi, lui ont valu le premier prix de l’innovation scientifique du programme Confiance.ai. Il a ainsi développé des outils désormais opérationnels dans les usines d’Air Liquide sur plusieurs continents.







