Google DeepMind : AlphaProof Nexus résout neuf problèmes d’Erdős pour quelques centaines de dollars

D'après The Decoder (25 mai 2026 à 12h41)

Résumé

Google DeepMind présente AlphaProof Nexus comme un système capable de résoudre de manière autonome neuf problèmes ouverts d’Erdős, dont deux restés sans réponse pendant 56 ans, pour quelques centaines de dollars par problème en coûts d’inférence. Le système s’appuie sur Lean pour vérifier chaque étape de preuve, tandis que son taux de réussite global atteint 2,5 %.

Les faits

Google DeepMind's AlphaProof Nexus has autonomously solved nine open Erdős problems, including two that stumped mathematicians for 56 years, for just a few hundred dollars per problem in inference costs. Le texte précise aussi que le système a utilisé le compilateur Lean pour vérifier automatiquement chaque étape de preuve, contrairement à une approche de type langage naturel. L’article indique qu’AlphaProof Nexus a résolu neuf problèmes d’Erdős sur 353 tentatives. Il a également prouvé 44 conjectures ouvertes sur 492 issues de l’Online Encyclopedia of Integer Sequences (OEIS), réglé une question vieille de 15 ans sur les fonctions de Hilbert en géométrie algébrique et amélioré une borne connue en optimisation convexe. Le système repose sur quatre variantes d’agents. La version la plus simple, Agent (A), fait tourner des sous-agents indépendants sur Gemini 3.1 Pro en boucle, tandis que les variantes plus avancées ajoutent AlphaProof, un composant évolutionnaire inspiré d’AlphaEvolve, et une version complète, Agent (D), utilisée pour les problèmes d’Erdős. L’analyse a toutefois révélé un point important : la version la plus simple, Agent (A), pouvait elle aussi démontrer les neuf problèmes d’Erdős résolus, même si elle coûtait plus cher sur les plus difficiles. L’extrait indique enfin que le taux de réussite global du système s’établit à 2,5 %.

Pourquoi c’est important

Cette publication montre qu’un système d’IA peut produire des résultats de recherche mathématique en s’appuyant sur une vérification formelle plutôt que sur une génération de raisonnement entièrement laissée au modèle. Le point clé n’est pas seulement la résolution de problèmes, mais la combinaison entre génération de preuves et contrôle automatique par Lean, qui réduit le risque d’erreur logique. L’autre enseignement stratégique tient au rapport entre performance et coût. Le fait d’avoir résolu neuf problèmes ouverts d’Erdős pour quelques centaines de dollars par problème, tout en affichant un taux de réussite global de 2,5 %, suggère un système encore très sélectif, mais potentiellement efficace sur certaines classes de questions. Cela illustre aussi que l’architecture multi-agents et la vérification formelle peuvent être plus déterminantes que la seule puissance du modèle.

Questions fréquentes

Combien de problèmes AlphaProof Nexus a-t-il résolus ?

Le système a résolu neuf problèmes ouverts d’Erdős, ainsi que 44 conjectures ouvertes de l’OEIS.

Quel est le coût annoncé par problème ?

Le texte parle de quelques centaines de dollars par problème en coûts d’inférence.

Comment les preuves sont-elles vérifiées ?

Le système génère des étapes de preuve en langage Lean, puis le compilateur vérifie automatiquement chaque étape.

Quel est le taux de réussite global ?

L’extrait indique un taux de réussite global de 2,5 %.

Quelle version du système a servi pour les problèmes d’Erdős ?

L’extrait précise que la variante Agent (D), la plus complète, a été utilisée pour les problèmes d’Erdős.

Source

The Decoder

Auteur

Rédaction IA-Medias

Rédaction spécialisée dans la veille et l'analyse de l'actualité de l'intelligence artificielle, des puces IA, des robots, des agents IA et de la recherche.