Coinbase adopte l'IA chinoise et divise sa facture par deux

Publié le 28 juin 2026 à 18h30

D'après The Decoder (28 juin 2026 à 14h14)

Résumé

Coinbase migre vers des modèles IA chinois comme GLM 5.2 et Kimi 2.7, optimise le routage et le caching, et réduit ses dépenses IA de moitié malgré une hausse des tokens.

Les faits

Coinbase a profondément revu son infrastructure d’intelligence artificielle en basculant vers des modèles chinois bon marché. Brian Armstrong indique que la plateforme « fonctionne désormais avec des modèles comme GLM 5.2 et Kimi 2.7 », tout en observant que l’entreprise « utilise plus de tokens que jamais mais paie deux fois moins qu’avant ». Pour orchestrer ces modèles, Coinbase a mis en place un système automatique de routage qui « choisit le meilleur modèle pour chaque requête en fonction de la tâche, du prix et du potentiel de mise en cache ». Ce travail d’optimisation s’appuie fortement sur le caching : « une meilleure mise en cache à elle seule a fait passer le taux de succès de 5 à 60 pour cent ». Les équipes internes sont encouragées à adapter leurs usages. Les développeurs « peuvent toujours choisir le modèle qu’ils veulent, mais 91 pour cent n’atteignaient jamais leurs anciens plafonds d’utilisation ». Ils sont désormais « incités à garder un contexte léger et à démarrer de nouvelles sessions pour les nouvelles tâches », une approche rattachée à ce que l’article décrit comme « l’ingénierie du contexte ». Coinbase a aussi revu sa gouvernance des coûts. L’entreprise « rend l’utilisation de chaque développeur visible sans la plafonner », dans un écho au phénomène de « tokenmaxxing » observé chez Amazon et Meta, où les salariés sont félicités pour une consommation élevée de tokens. Armstrong ajoute toutefois une contrainte explicite : « plus vous dépensez pour l’IA, plus nous attendons d’impact ». Selon le dirigeant, « ces mesures ont réduit de moitié les dépenses d’IA de Coinbase alors même que l’utilisation des tokens continue d’augmenter ».

Pourquoi c’est important

Le choix de Coinbase de privilégier des modèles IA chinois comme GLM 5.2 et Kimi 2.7 illustre une inflexion stratégique majeure dans la concurrence mondiale des laboratoires d’IA. L’article souligne que « Snowflake teste aussi des modèles chinois comme alternatives meilleur marché à OpenAI et Anthropic », tandis que le fondateur de la start-up Lindy a également « basculé récemment sur Deepseek v4 ». Cette dynamique crée « une vraie pression sur les prix » pour les acteurs occidentaux. L’auteur parle d’« un test de résistance pour les chiffres de croissance » que les laboratoires américains doivent désormais afficher afin de « justifier l’argent qu’ils ont levé », au moment où certains envisagent une introduction en bourse. En parallèle, « une guerre des prix entre OpenAI et Anthropic serait en train de se préparer » : OpenAI propose ainsi GPT-5.6-Sol au même tarif que GPT-5.5, présenté comme « plus efficient en tokens que Claude Fable et Mythos », avec « deux variantes 5.6 plus faibles à des prix bien plus bas ». Ces mouvements confirment l’émergence d’une véritable économie du token, où le coût par requête devient un levier stratégique central.

Questions fréquentes

Quels modèles IA Coinbase utilise-t-il désormais par défaut ?

Brian Armstrong indique que Coinbase fonctionne avec des modèles chinois comme GLM 5.2 et Kimi 2.7.

Comment Coinbase choisit-il le modèle IA pour chaque requête ?

Un système de routage automatique sélectionne le modèle en fonction de la tâche, du prix et du potentiel de mise en cache.

Quel effet a eu l’optimisation du caching chez Coinbase ?

La mise en cache améliorée a fait passer le taux de succès de 5 % à 60 %.

De combien Coinbase a-t-il réduit ses dépenses d’IA ?

Brian Armstrong affirme que ces mesures ont réduit de moitié les dépenses d’IA de Coinbase, malgré la hausse des tokens.

Quel lien avec la guerre des prix entre OpenAI et Anthropic ?

L’article évoque une guerre des prix naissante, avec OpenAI qui propose GPT-5.6-Sol au même prix que GPT-5.5 mais plus efficient en tokens que Claude Fable et Mythos.

Source

The Decoder

Auteur

Rédaction IA-Medias

Rédaction spécialisée dans la veille et l'analyse de l'actualité de l'intelligence artificielle, des puces IA, des robots, des agents IA et de la recherche.