Z.ai lance GLM-5.2 avec un million de tokens
D'après MarkTechPost (14 juin 2026 à 02h00)
Résumé
Z.ai a lancé GLM-5.2, nouveau modèle de langage centré sur le codage, doté d’une fenêtre de contexte de 1 000 000 de tokens et de deux niveaux d’effort de raisonnement, High et Max. Le modèle est compatible dès le premier jour avec huit outils d’agents de codage, dont Claude Code, Cline, OpenCode et OpenClaw, mais aucun benchmark n’a été publié au lancement.
Les faits
Z.ai a livré GLM-5.2 comme dernière évolution de sa gamme de modèles GLM-5, présentée comme la troisième sortie majeure de cette ligne de modèles de langage pour le codage. La caractéristique mise en avant est une fenêtre de contexte de 1 000 000 de tokens, que Z.ai désigne dans sa propre configuration sous le nom « glm-5.2[1m] ». Chaque réponse peut retourner jusqu’à 131 072 tokens en sortie, soit un saut d’environ cinq fois par rapport à la fenêtre de 200 000 tokens de GLM-5.1. L’article souligne qu’une fenêtre de 1 million de tokens change concrètement la manière dont fonctionne un agent de codage. Un tel agent peut conserver en mémoire de travail un dépôt de taille moyenne, incluant les fichiers source, les tests, les configurations et l’historique de conversation, sans recourir en permanence à des résumés forcés par des fenêtres plus petites. GLM-5.2 introduit également deux niveaux d’effort de raisonnement, High et Max, avec une recommandation explicite de Z.ai d’utiliser le niveau Max pour les tâches de codage complexes et multi‑étapes. Par ailleurs, Z.ai n’a publié aucun score de benchmark au lancement : ni SWE-bench, ni Terminal-Bench, ni Code Arena, l’annonce mettant l’accent sur la disponibilité, le contexte étendu et la feuille de route open source. Enfin, GLM-5.2 est annoncé comme compatible dès le premier jour avec huit outils d’agents de codage. La liste citée inclut notamment Claude Code, Cline, OpenCode et OpenClaw, avec une intégration facilitée via un simple changement d’URL de base et d’identifiant de modèle pour les outils compatibles Anthropic.
Pourquoi c’est important
Avec une fenêtre de contexte d’1 million de tokens, GLM-5.2 repositionne la barre technique pour les modèles de codage, en permettant à un agent de travailler sur l’ensemble d’un dépôt de taille moyenne sans segmentation lourde ni résumés constants. Cette capacité à maintenir simultanément code, tests, configuration et historique de dialogue vise à fluidifier les workflows de développement pilotés par IA. La compatibilité annoncée dès le premier jour avec huit outils d’agents de codage, dont Claude Code, Cline, OpenCode et OpenClaw, montre une stratégie tournée vers l’usage immédiat plutôt que vers l’affichage de scores de benchmarks. L’absence volontaire de résultats SWE-bench, Terminal-Bench ou Code Arena au lancement, combinée à l’introduction de deux niveaux d’effort de raisonnement High et Max pour les tâches complexes, laisse entrevoir un positionnement axé sur la pratique et l’intégration dans les outils existants plutôt que sur la compétition métrique.
Questions fréquentes
Quelle est la principale nouveauté de GLM-5.2 ?
GLM-5.2 propose une fenêtre de contexte de 1 000 000 de tokens, identifiée comme « glm-5.2[1m] », avec jusqu’à 131 072 tokens en sortie, soit environ cinq fois plus que la fenêtre de 200 000 tokens de GLM-5.1.[2]
Comment GLM-5.2 améliore-t-il le travail des agents de codage ?
Une fenêtre d’1 million de tokens permet à un agent de codage de garder en mémoire un dépôt de taille moyenne, incluant code, tests, configuration et historique de conversation, sans résumés constants imposés par des contextes plus réduits.[2]
Quels niveaux d’effort de raisonnement propose GLM-5.2 ?
Le modèle introduit deux niveaux d’effort de raisonnement, High et Max, Z.ai recommandant le mode Max pour les tâches de codage complexes et multi‑étapes.[2]
Des benchmarks ont-ils été publiés pour GLM-5.2 au lancement ?
Non, Z.ai n’a publié aucun score de benchmark au lancement : ni SWE-bench, ni Terminal-Bench, ni Code Arena, l’annonce se concentrant sur la disponibilité, le contexte étendu et la feuille de route open source.[2]
Avec quels outils d’agents de codage GLM-5.2 est-il compatible ?
GLM-5.2 est compatible dès le premier jour avec huit outils d’agents de codage, dont Claude Code, Cline, OpenCode et OpenClaw, via un endpoint compatible Anthropic avec simple changement d’URL de base et de modèle.[2]
Source
MarkTechPostAuteur
Rédaction IA-MediasRédaction spécialisée dans la veille et l'analyse de l'actualité de l'intelligence artificielle, des puces IA, des robots, des agents IA et de la recherche.