Bridgewater bat les IA de pointe avec un modèle ajusté

Publié le 3 juillet 2026 à 14h07

D'après The Decoder (3 juillet 2026 à 13h16)

Résumé

Bridgewater et Thinking Machines Lab affirment qu’un modèle ouvert, affiné sur des données et jugements internes, surpasse Gemini, Claude et GPT pour analyser des documents financiers, à moindre coût.

Les faits

Le fonds spéculatif Bridgewater et Thinking Machines Lab affirment qu’un modèle « open-weight » finement ajusté dépasse les modèles d’IA les plus puissants pour l’évaluation de documents financiers, et cela « à une fraction du coût ». Les chiffres proviennent de leur propre analyse interne. Les équipes de Bridgewater AIA Labs et de Thinking Machines Lab expliquent que les investisseurs sont submergés chaque jour de nouvelles, d’analyses, de documents réglementaires et d’e-mails. Selon leur rapport, « lire n’est pas le vrai travail ». Le véritable enjeu serait la succession de petits jugements répétés sur ce qui compte réellement, un tri qu’ils ont cherché à automatiser en définissant six tâches inspirées du quotidien des investisseurs. Parmi ces tâches figure la décision de savoir si un article financier est pertinent pour un dirigeant, ou si un document de banque centrale indique la direction future des taux. Un exemple donné oppose un titre sur la revendication du Groenland par Donald Trump, marqué comme non pertinent, à une menace de nouveaux droits de douane sur la Chine, jugée très pertinente, alors que les deux sujets touchent à la géopolitique et à la finance. Les auteurs indiquent que des modèles dits « frontier » comme des variantes de Gemini, Claude et GPT n’atteignent qu’environ 50 % de précision avec un simple prompt. Des instructions rédigées par des experts et un système de notation en trois niveaux (« pertinent et intéressant », « pertinent mais inintéressant », « non pertinent ») permettent de monter dans le milieu des 70 %. Mais cela reste sous le seuil de 80 % fixé par les chercheurs pour un déploiement jugé fiable.

Pourquoi c’est important

Le rapport souligne que les modèles de dernière génération n’apportent que des gains limités par dollar dépensé : GPT 5.4 coûterait 43 % de plus que GPT 5.2 pour un gain de précision jugé marginal. Les chercheurs avancent que la solution réside dans le fine-tuning, en réentraînant un modèle ouvert sur des exemples propriétaires fondés sur le jugement d’investisseurs. Cette démarche illustre que les grands laboratoires d’IA n’ont pas capté toutes les données disponibles. Des volumes importants de données d’entreprise privées et d’expertise humaine non exploitée subsistent et offrent un potentiel réel d’amélioration, notamment lorsque les entreprises gardent volontairement leurs données les plus précieuses hors de portée des acteurs de l’IA de pointe, sous peine de se retrouver en concurrence avec des produits bâtis sur ces mêmes données.

Questions fréquentes

Que revendiquent Bridgewater et Thinking Machines Lab ?

Ils affirment qu’un modèle ouvert finement ajusté sur leurs données internes surpasse les modèles d’IA les plus puissants pour analyser des documents financiers.

Quels types de tâches les chercheurs ont-ils automatisées ?

Six tâches inspirées du quotidien des investisseurs, comme juger la pertinence d’un article ou interpréter un document de banque centrale.

Comment se comportent Gemini, Claude et GPT dans ces tests ?

Avec un prompt basique, ces modèles atteignent environ 50 % de précision, et montent seulement dans les 70 % avec des prompts experts et une notation à trois niveaux.

: quel seuil de précision jugent-ils nécessaire ?

Les auteurs fixent un seuil de 80 % de précision pour considérer un déploiement de ces systèmes comme suffisamment fiable.

Pourquoi la donnée propriétaire est-elle clé selon le rapport ?

Parce que de grandes quantités de données d’entreprise et d’expertise humaine restent privées et peuvent fortement améliorer les modèles lorsqu’elles sont utilisées pour le fine-tuning.

Source

The Decoder

Auteur

Rédaction IA-Medias

Rédaction spécialisée dans la veille et l'analyse de l'actualité de l'intelligence artificielle, des puces IA, des robots, des agents IA et de la recherche.