Meta : du "tokenmaxxing" au pilotage serré des coûts IA

D'après The Decoder (13 juin 2026 à 11h49)

Résumé

Un mémo interne adressé à 6 000 employés révèle que l’usage des modèles d’IA en interne pourrait coûter des milliards de dollars à Meta d’ici 2026. Face à cette « augmentation exponentielle », le groupe prépare pour 2027 un dispositif de budgets, d’allocations et un tableau de bord central, « AI Gateway », pour contrôler la consommation de jetons.

Les faits

Un mémo interne envoyé à environ 6 000 employés alerte sur une « augmentation exponentielle » de l’usage de l’IA chez Meta et prévient que le groupe se dirige vers des coûts de plusieurs milliards de dollars rien que pour les usages internes d’ici 2026. Selon ce document cité par The Information, les employés et équipes n’avaient jusqu’ici aucune visibilité ni contrôle sur leur propre consommation de ressources d’IA. Pour reprendre la main, Meta prévoit à partir de 2027 une gestion beaucoup plus encadrée des jetons, avec des budgets, des allocations et des outils dédiés. Des développeurs et ingénieurs ont conçu un tableau de bord central baptisé « AI Gateway », qui permet de suivre au même endroit la consommation et les dépenses liées à l’IA. Des alertes automatiques pour signaler des pics de coûts inhabituels doivent être ajoutées dans un second temps. Le mémo indique également que Meta veut détourner ses employés d’outils tiers comme Claude d’Anthropic, au profit de son propre assistant de programmation, MetaCode. Les autres modèles resteront accessibles, mais les modèles maison de Meta ne sont pas encore compétitifs à la frontière. Au sein d’une nouvelle division « Applied AI Engineering », des ingénieurs travaillent à l’amélioration de MetaCode en créant des tâches de programmation servant de données d’entraînement. Meta avait auparavant fait de l’usage de l’IA une « attente centrale » dans les évaluations de performance, ce qui a conduit au phénomène de « tokenmaxxing » : des employés gonflaient artificiellement leur consommation via un classement interne nommé « Claudeonomics », atteignant 73,7 billions de jetons en un peu plus de trente jours. Dans un mémo séparé, le directeur technique Andrew Bosworth a recadré cette logique : « Personne ne devrait utiliser des outils d’IA juste pour le principe de les utiliser. Tout mouvement n’est pas un progrès et la consommation de jetons seule n’est en aucun cas une mesure d’impact. » Les outils doivent être mobilisés lorsqu’ils « nous permettent réellement de faire un meilleur travail, plus rapidement ».

Pourquoi c’est important

Le cas Meta illustre la bascule en cours dans les grandes entreprises technologiques : après une phase d’adoption massive et parfois désordonnée des outils d’IA, la priorité devient la maîtrise fine des coûts et l’alignement de ces usages sur des gains réels de productivité. La mise en place de budgets, d’allocations et d’un tableau de bord comme « AI Gateway » marque le passage d’un enthousiasme sans compter au pilotage financier et opérationnel. Ce recentrage s’accompagne d’un repositionnement stratégique sur les outils maison, à l’image de MetaCode, et d’une remise en cause des indicateurs de succès basés sur le volume de jetons consommés. En dénonçant le « tokenmaxxing » et en rappelant que « tout mouvement n’est pas un progrès », Andrew Bosworth pose un cadre qui pourrait inspirer d’autres groupes confrontés à la même explosion des coûts et aux mêmes dérives d’usage interne des IA génératives.

Questions fréquentes

À combien se chiffrent les coûts internes d’IA chez Meta ?

Le mémo interne avertit que Meta est en passe d’atteindre des coûts de plusieurs milliards de dollars pour l’usage interne de l’IA d’ici 2026.

Qu’est-ce que le tableau de bord « AI Gateway » chez Meta ?

« AI Gateway » est un tableau de bord central qui suit en un seul endroit l’usage et les dépenses liées à l’IA, avec des budgets et allocations pour la consommation de jetons.

Quand Meta compte-t-elle renforcer la gestion de ses jetons d’IA ?

Meta prévoit qu’à partir de 2027, la consommation de jetons soit encadrée par des budgets, des allocations et des outils dédiés, dont le tableau de bord « AI Gateway ».

Qu’est-ce que le « tokenmaxxing » mentionné chez Meta ?

Le « tokenmaxxing » désigne le fait que des employés ont artificiellement gonflé leur consommation de jetons, notamment via un classement interne « Claudeonomics », atteignant 73,7 billions de jetons en un peu plus de trente jours.

Que dit Andrew Bosworth sur la consommation de jetons d’IA ?

Andrew Bosworth rappelle qu’« aucun outil d’IA ne doit être utilisé juste pour le principe de l’utiliser » et que la consommation de jetons n’est pas en soi une mesure d’impact.

Source

The Decoder

Auteur

Rédaction IA-Medias

Rédaction spécialisée dans la veille et l'analyse de l'actualité de l'intelligence artificielle, des puces IA, des robots, des agents IA et de la recherche.