NVIDIA lance Nemotron 3.5 Content Safety, un modèle de sécurité multimodal et personnalisable

Publié le 4 juin 2026 à 22h06

D'après Hugging Face (4 juin 2026 à 20h57)

Résumé

NVIDIA présente Nemotron 3.5 Content Safety, un modèle de sécurité multimodal qui unifie l’évaluation de texte, d’image et de réponse assistant dans un seul appel. Il ajoute l’enforcement de politiques personnalisées, des traces de raisonnement optionnelles et une couverture explicite de 12 langues.

Les faits

NVIDIA présente Nemotron 3.5 Content Safety comme l’aboutissement d’une évolution entamée avec un classifieur texte anglais, puis avec Nemotron 3, qui a combiné pour la première fois des capacités multimodales et multilingues dans un seul modèle de 4 milliards de paramètres. Le billet explique que Nemotron 3.5 « unifie l’entrée multimodale, la portée multilingue, l’application de politiques d’entreprise personnalisées et un raisonnement auditable dans un seul appel d’inférence ». Le modèle prend en entrée une invite utilisateur, une image optionnelle et une réponse assistant optionnelle, puis produit un verdict de sécurité sur l’ensemble du contexte. NVIDIA souligne que cette évaluation conjointe vise à corriger un angle mort connu de la sécurité multimodale, lorsque des violations n’apparaissent qu’à l’interaction entre texte et image, ou entre requête et réponse. Côté couverture linguistique, Nemotron 3.5 conserve la prise en charge explicite de 12 langues : English, French, Spanish, German, Chinese, Japanese, Korean, Arabic, Hindi, Russian, Portuguese et Italian. Le billet ajoute qu’il hérite aussi d’une généralisation zero-shot sur environ 140 langues grâce au modèle de base Gemma 3. La principale nouveauté architecturale est la prise en charge de politiques personnalisées. NVIDIA précise que le modèle « raisonne sur cette politique lorsqu’il produit son verdict » au lieu de s’en remettre entièrement à une taxonomie intégrée. Un mode THINK facultatif peut en outre générer une trace de raisonnement étape par étape, avant un label final safe/unsafe et, éventuellement, les catégories violées. NVIDIA annonce enfin la publication de son jeu de données de sécurité, multimodal et multilingue, incluant des traces de raisonnement utilisées pour l’entraînement du modèle.

Pourquoi c’est important

Cette annonce compte parce qu’elle rapproche la modération IA des besoins réels des entreprises. En unifiant texte, image, réponse assistant et politique métier dans un seul passage, NVIDIA cherche à rendre la sécurité plus simple à déployer et plus cohérente dans des environnements où les risques varient fortement d’un secteur à l’autre. Elle est aussi stratégique parce qu’elle combine trois éléments rarement réunis dans un même système : la couverture multilingue, l’évaluation multimodale et l’explicabilité via des traces de raisonnement. Pour les déploiements internationaux, l’association d’une couverture explicite de 12 langues et d’une généralisation zero-shot sur environ 140 langues ouvre la voie à des garde-fous plus homogènes sans multiplication de modèles spécialisés.

Questions fréquentes

Que fait Nemotron 3.5 Content Safety ?

Il évalue un prompt, une image optionnelle et une réponse assistant optionnelle pour produire un verdict safe/unsafe, avec catégories de sécurité si besoin.

Qu’apporte la nouvelle version par rapport à Nemotron 3 ?

Elle ajoute l’application de politiques personnalisées, un raisonnement auditable en mode THINK et une intégration multimodale plus poussée.

Combien de langues sont explicitement couvertes ?

Le modèle conserve une couverture explicite de 12 langues : English, French, Spanish, German, Chinese, Japanese, Korean, Arabic, Hindi, Russian, Portuguese et Italian.

Le modèle peut-il expliquer son verdict ?

Oui. En mode THINK, il peut fournir une trace de raisonnement étape par étape avant le verdict final.

NVIDIA a-t-elle publié un jeu de données ?

Oui. Le billet annonce la publication d’un jeu de données de sécurité multimodal et multilingue, avec des traces de raisonnement.

Source

Hugging Face

Auteur

Rédaction IA-Medias

Rédaction spécialisée dans la veille et l'analyse de l'actualité de l'intelligence artificielle, des puces IA, des robots, des agents IA et de la recherche.