Des références inventées par l’IA infiltrent la recherche biomédicale et menacent les guides cliniques

Publié le 27 mai 2026 à 10h06 — Mis à jour le 27 mai 2026 à 10h15

D'après The Decoder (26 mai 2026 à 14h36)

Résumé

Une analyse de 2,47 millions d’articles biomédicaux révèle une explosion des références fabriquées depuis 2023, avec un taux multiplié par plus de douze. Les auteurs suspectent l’usage massif de modèles de langage et s’alarment du risque pour les revues de synthèse qui servent de base aux recommandations cliniques.

Les faits

Une vaste audit menée par des chercheurs de Columbia University et d’autres institutions sur 2,47 millions d’articles biomédicaux issus de l’archive ouverte PubMed Central, publiés entre janvier 2023 et février 2026, met en évidence une hausse spectaculaire des références inventées. Sur 97,1 millions de références vérifiées, 4 046 ont été identifiées comme fabriquées, réparties dans 2 810 articles. Les auteurs constatent que, tout au long de 2023, le taux restait stable autour de quatre références fabriquées pour 10 000 articles, avant de grimper rapidement à partir de la mi‑2024 pour atteindre 51,3 pour 10 000 à la fin 2025, puis 56,9 pour 10 000 au cours des sept premières semaines de 2026, soit plus de douze fois le niveau de base. Une référence était considérée comme fabriquée lorsque le titre indiqué ne pouvait être trouvé dans aucune des quatre grandes bases consultées : PubMed, Crossref, OpenAlex et Google Scholar. Les chercheurs suspectent un lien direct avec l’usage généralisé de modèles de langage comme ChatGPT, qui a décollé fin 2022, tout en rappelant qu’un article met typiquement 100 à 200 jours entre la soumission et la publication, ce qui expliquerait que le texte généré par IA n’apparaisse massivement dans PubMed Central qu’à partir de la mi‑2024. Ils n’excluent toutefois pas d’autres causes possibles, comme une activité accrue de « paper mills » ou des changements dans les pratiques d’indexation. Selon l’étude, le problème majeur tient au fait que ces références inventées sont extrêmement difficiles à repérer : elles correspondent au sujet de l’article, respectent les formats bibliographiques, citent de vrais chercheurs et affichent des années de publication plausibles. Dans un article de urologie, 18 des 30 références vérifiées se sont révélées fabriquées alors qu’elles correspondaient toutes étroitement à un sujet chirurgical très spécifique. Les auteurs ont également mis au jour des schémas suggérant une activité coordonnée de « paper mills », notamment deux auteurs apparaissant dans onze articles d’une même revue de chirurgie, avec au total 15 références fabriquées sur des thématiques comme le diagnostic CRISPR et le microbiome intestinal. Au moment de l’audit, 98,4 % des articles concernés n’avaient reçu aucune réponse de leurs éditeurs, et les articles de revue affichaient un taux de falsification 57 % plus élevé que les autres types d’articles, ce qui inquiète particulièrement les chercheurs.

Pourquoi c’est important

Les auteurs soulignent que les articles de revue sont les plus touchés par ces références inventées, avec un taux de fabrication supérieur de 57 % aux autres catégories. Cette vulnérabilité est critique, car ces revues servent fréquemment de socle aux guides cliniques qui orientent les décisions thérapeutiques. Si une recommandation clinique repose sur un article comportant des sources partiellement fabriquées, c’est toute la chaîne de preuves qui sous‑tend les choix de traitement qui se trouve fragilisée. L’audit montre que l’augmentation des citations fictives est désormais un phénomène systémique dans la recherche biomédicale, alors même que près de 98,4 % des articles identifiés n’ont suscité aucune réaction des éditeurs. La combinaison d’outils d’IA capables de produire des bibliographies plausibles, de « paper mills » organisées et d’une détection encore embryonnaire fait peser un risque direct sur l’intégrité de la littérature scientifique et, par ricochet, sur la qualité des soins lorsque ces travaux alimentent les recommandations médicales.

Questions fréquentes

Quelle est l’ampleur de l’audit réalisé sur les articles biomédicaux ?

L’audit porte sur 2,47 millions d’articles de l’archive ouverte PubMed Central, publiés entre janvier 2023 et février 2026, représentant 97,1 millions de références vérifiées.

Combien de références fabriquées ont été identifiées ?

Les chercheurs ont repéré 4 046 références fabriquées, réparties dans 2 810 articles biomédicaux.

De combien le taux de références inventées a-t-il augmenté ?

Le taux est passé d’environ 4 références fabriquées pour 10 000 articles en 2023 à 56,9 pour 10 000 début 2026, soit plus de douze fois le niveau initial.

Quel rôle soupçonné pour les modèles de langage comme ChatGPT ?

Les auteurs suspectent un lien évident avec l’usage généralisé de modèles de langage tels que ChatGPT, tout en n’excluant pas d’autres facteurs comme les paper mills ou des changements d’indexation.

Pourquoi les articles de revue sont-ils particulièrement préoccupants ?

Les articles de revue présentent un taux de références fabriquées 57 % plus élevé que les autres et servent souvent de base aux recommandations cliniques, ce qui menace la fiabilité des guides de traitement.

Source

The Decoder

Auteur

Rédaction IA-Medias

Rédaction spécialisée dans la veille et l'analyse de l'actualité de l'intelligence artificielle, des puces IA, des robots, des agents IA et de la recherche.