Google Research domine les benchmarks text-to-SQL
D'après The Decoder (13 juin 2026 à 14h32)
Résumé
Google Research dévoile Gemini-SQL2, un nouveau système text-to-SQL basé sur Gemini 3.1 Pro, qui transforme le langage naturel en requêtes SQL exécutables. Avec 80,04 % de précision d’exécution sur le benchmark BIRD, il devance nettement les modèles d’OpenAI et d’Anthropic et pourrait renforcer les fonctions en langage naturel des services de données de Google.
Les faits
Google Research a présenté Gemini-SQL2, un nouveau système de génération de requêtes SQL à partir de langage naturel, construit sur le modèle Gemini 3.1 Pro. Le système traduit des instructions en langage courant en requêtes SQL exécutables pour interroger des bases de données. Sur le benchmark BIRD, qui mesure la précision de ces traductions de texte en SQL, Gemini-SQL2 atteint une précision d’exécution de 80,04 %, ce qui le place en première position selon Google. OpenAI, avec GPT-5.5-xhigh, obtient environ 72,8 %, tandis que Claude Opus 4.6 d’Anthropic tourne autour de 70,9 %. Les modèles concurrents de Databricks, AWS, Tencent et Alibaba arrivent « nettement derrière », d’après l’article, ce qui confirme l’avance de Gemini-SQL2 sur ce benchmark text-to-SQL. Google souligne que la génération correcte de SQL à partir de langage naturel est particulièrement difficile, car les données sont souvent organisées en couches et les requêtes doivent intégrer une logique métier complexe. Selon Google, les requêtes SQL produites par Gemini-SQL2 semblent non seulement correctes sur le plan syntaxique, mais elles s’exécutent effectivement avec succès. Une meilleure compréhension du SQL par ce système pourrait améliorer plus largement les fonctions en langage naturel au sein des services de données de Google. L’équipe de recherche n’a toutefois rien communiqué pour l’instant sur une éventuelle mise à disposition publique du modèle et aucun article scientifique n’a encore été publié.
Pourquoi c’est important
L’avance de Gemini-SQL2 sur le benchmark BIRD, avec 80,04 % de précision d’exécution et une marge confortable sur les modèles d’OpenAI et d’Anthropic, repositionne Google Research comme un acteur central sur le créneau stratégique du text-to-SQL. Dans un contexte où la traduction fiable du langage naturel en requêtes SQL devient clé pour démocratiser l’analyse de données, cette performance confère à Google un avantage compétitif notable. En ciblant la difficulté spécifique de la logique métier et des schémas de données complexes, Google montre que la bataille de l’IA ne se joue pas seulement sur les assistants généralistes, mais aussi sur des capacités spécialisées à forte valeur pour les entreprises. Le fait que Gemini-SQL2 puisse à la fois produire des requêtes qui « ont l’air correctes » et s’exécutent avec succès ouvre la voie à une intégration plus profonde de fonctions en langage naturel dans les services de données de Google, tout en maintenant une part d’incertitude sur le calendrier et les modalités d’accès public.
Questions fréquentes
Qu’est-ce que Gemini-SQL2 de Google Research ?
Gemini-SQL2 est un système text-to-SQL qui transforme des requêtes en langage naturel en requêtes SQL exécutables, construit sur le modèle Gemini 3.1 Pro.
Quel score Gemini-SQL2 obtient-il sur le benchmark BIRD ?
Gemini-SQL2 atteint une précision d’exécution de 80,04 % sur le benchmark BIRD, ce qui le place en première position selon Google.
Comment Gemini-SQL2 se compare-t-il aux modèles d’OpenAI et d’Anthropic ?
OpenAI GPT-5.5-xhigh obtient environ 72,8 % sur BIRD et Claude Opus 4.6 d’Anthropic environ 70,9 %, contre 80,04 % pour Gemini-SQL2.
Pourquoi le text-to-SQL est-il considéré comme difficile par Google ?
Google souligne que transformer le langage naturel en SQL correct est difficile car les données sont souvent stratifiées et les requêtes doivent intégrer une logique métier complexe.
Gemini-SQL2 est-il déjà disponible publiquement ?
L’équipe de recherche n’a pour l’instant communiqué ni sur une mise à disposition publique de Gemini-SQL2 ni sur la publication d’un article scientifique détaillé.
Source
The DecoderAuteur
Rédaction IA-MediasRédaction spécialisée dans la veille et l'analyse de l'actualité de l'intelligence artificielle, des puces IA, des robots, des agents IA et de la recherche.