OpenAI dope ChatGPT santé avec GPT-5.5 Instant

D'après OpenAI (18 juin 2026 à 13h00)

Résumé

OpenAI annonce une nette amélioration des réponses santé de ChatGPT grâce à GPT‑5.5 Instant, désormais au niveau de ses modèles frontier pour les usages médicaux les plus difficiles. Porté par un réseau mondial de médecins et des évaluations spécialisées, le taux de réponses factuellement problématiques aurait chuté de 71 % en deux mois.

Les faits

OpenAI fait de la santé l’un des usages centraux de ChatGPT, affirmant que chaque semaine « plus de 230 millions de personnes se tournent vers ChatGPT pour obtenir de l’aide sur des questions de santé et de bien-être », qu’il s’agisse de comprendre des résultats d’analyses, préparer des rendez-vous ou naviguer dans l’assurance maladie. Avec GPT‑5.5 Instant, l’entreprise revendique « un progrès substantiel » dans la capacité du modèle à reconnaître les situations nécessitant des soins urgents, à demander un contexte pertinent, à expliquer l’incertitude et à rendre plus intelligible une information complexe. OpenAI indique que, sur ses évaluations de santé les plus exigeantes, GPT‑5.5 Instant atteint désormais « un niveau comparable à nos modèles frontier Thinking », tout en étant disponible pour tous les utilisateurs gratuits de ChatGPT, sous réserve de limites. Pour mesurer ces avancées, OpenAI s’appuie sur des évaluations dédiées à la santé, dont HealthBench et HealthBench Professional, basées sur des conversations réalistes et des grilles d’évaluation rédigées par des médecins pour juger l’exactitude, la sécurité, la communication, la prise en compte du contexte, l’exhaustivité et l’escalade appropriée. L’entreprise souligne que GPT‑5.5 Instant « atteint des performances santé similaires à nos derniers modèles frontier sur un ensemble d’évaluations », avec une amélioration substantielle par rapport à GPT‑5.3 Instant. OpenAI affirme en outre que GPT‑5.5 Instant a été comparé à des réponses rédigées par des médecins pour 3 500 conversations représentatives : ces réponses médicales, produites avec un temps illimité et un accès à Internet mais sans IA, ont été évaluées par un second panel de médecins, et GPT‑5.5 Instant « a été évalué plus favorablement que les réponses écrites par des médecins et celles des modèles plus anciens » sur des critères de précision, de communication, d’exhaustivité, de suivi des consignes et d’aide à la décision. Selon OpenAI, les médecins estiment aussi que GPT‑5.5 Instant présente moins de modes de défaillance que les modèles précédents et que les médecins eux‑mêmes, avec moins de cas de non‑prise en compte du contexte local des systèmes de santé, de signaux d’alerte ou de besoins d’orientation vers des soins, et moins d’oubli de demander des précisions à l’utilisateur. Sur le trafic de production en santé, l’entreprise affirme que le taux de réponses comportant au moins un problème factuel signalé a chuté de 71 % au cours des deux derniers mois. Ces améliorations s’inscrivent dans un effort plus large, soutenu par un réseau mondial de plus de 260 médecins répartis dans 60 pays, 49 langues et 26 spécialités médicales, qui ont déjà examiné plus de 700 000 réponses d’exemples pour définir ce qu’est une réponse « précise, claire, complète, suffisamment prudente et utile » dans les situations de santé du monde réel.

Pourquoi c’est important

En plaçant GPT‑5.5 Instant au cœur de ChatGPT, OpenAI cherche à rendre des capacités de raisonnement médical avancé accessibles à des centaines de millions de personnes, gratuitement. L’amélioration revendiquée de la précision, de la gestion de l’incertitude et de la reconnaissance des situations urgentes répond à un enjeu majeur de fiabilité pour les usages santé des grands modèles de langage. L’adossement systématique à des évaluations dédiées comme HealthBench, à un réseau de plus de 260 médecins et au suivi de milliards de messages hebdomadaires montre la volonté d’industrialiser la mesure de la qualité médicale des réponses. OpenAI présente ce chantier comme un socle pour ses autres outils orientés santé et affirme que l’amélioration de la santé humaine sera « l’un des impacts les plus personnels et les plus tangibles de l’AGI », avec l’objectif de rendre ChatGPT « plus précis, plus utile et plus impactant » dans ces moments sensibles.

Questions fréquentes

Combien de personnes utilisent ChatGPT pour la santé chaque semaine ?

OpenAI indique que chaque semaine, plus de 230 millions de personnes utilisent ChatGPT pour des questions de santé et de bien‑être.

Qu’apporte GPT‑5.5 Instant aux réponses santé de ChatGPT ?

GPT‑5.5 Instant améliore la capacité de ChatGPT à repérer les urgences, demander un contexte pertinent, expliquer l’incertitude et simplifier des informations médicales complexes.

Comment OpenAI évalue-t-il les performances santé de GPT‑5.5 Instant ?

OpenAI utilise des évaluations spécifiques comme HealthBench et HealthBench Professional, basées sur des conversations réalistes et des grilles rédigées par des médecins.

Quel est l’impact sur les erreurs factuelles dans les réponses santé ?

OpenAI affirme que, sur le trafic de production en santé, le taux de réponses comportant au moins un problème factuel signalé a diminué de 71 % en deux mois.

Quel rôle jouent les médecins dans l’amélioration de ChatGPT pour la santé ?

OpenAI collabore avec plus de 260 médecins dans 60 pays, 49 langues et 26 spécialités, qui ont déjà examiné plus de 700 000 réponses pour définir et évaluer la qualité des réponses santé.

Source

OpenAI

Auteur

Rédaction IA-Medias

Rédaction spécialisée dans la veille et l'analyse de l'actualité de l'intelligence artificielle, des puces IA, des robots, des agents IA et de la recherche.