Hugging Face dévoile la famille Ettin Reranker, six nouveaux modèles de reranking

Publié le 19 mai 2026 à 22h04 — Mis à jour le 20 mai 2026 à 10h09

D'après Hugging Face (19 mai 2026 à 02h00)

Résumé

Hugging Face présente la famille Ettin Reranker, six nouveaux modèles de reranking Sentence Transformers CrossEncoder, décrits comme « à l’état de l’art à leur taille », bâtis sur les encodeurs Ettin ModernBERT. Livrés avec données et recette d’entraînement par distillation, ils s’intègrent dans des pipelines de recherche « retrieve-then-rerank » optimisés.

Les faits

Hugging Face publie un billet intitulé « Introducing the Ettin Reranker Family », daté du 19 mai 2026 et signé par Tom Aarsen. L’auteur y annonce la mise à disposition de six nouveaux rerankers Sentence Transformers CrossEncoder, présentés comme « à l’état de l’art à leur taille » et construits à partir des encodeurs Ettin ModernBERT. Ces modèles sont accompagnés « des données et de la recette d’entraînement complète » qui ont permis de les produire. Ils ont été entraînés avec « une recette de distillation : MSE point à point sur les scores de mixedbread-ai/mxbai-rerank-large-v2 » appliquée au jeu cross-encoder/ettin-reranker-v1-data, lui-même décrit comme un sous-ensemble de lightonai/embeddings-pre-training mêlé à un sous-ensemble reranké de lightonai/embeddings-fine-tuning. L’auteur indique que ces six rerankers, couplés à google/embeddinggemma-300m, ont été évalués sur MTEB(eng, v2) Retrieval, et renvoie à la section « Results » pour cinq autres appariements entre embedders et rerankers. Il précise qu’un pipeline typique repose sur le schéma « retrieve-then-rerank », où un modèle d’embedding rapide récupère les top-K candidats avant que le cross-encoder ne réordonne ces K documents avec une forte précision. Le billet rappelle qu’un « reranker (également appelé cross-encoder point à point) est un modèle neuronal qui prend une paire (requête, document) et produit un score de pertinence unique ». Contrairement à un modèle d’embedding qui encode séparément requête et document, le reranker « permet aux deux textes de s’attendre mutuellement à chaque couche du transformeur ». Cette approche conjointe est plus précise, mais plus coûteuse, car le modèle doit être exécuté pour chaque paire (requête, document).

Pourquoi c’est important

La famille Ettin Reranker illustre la volonté de Hugging Face de « faire progresser et démocratiser l’intelligence artificielle par l’open source et la science ouverte », en publiant à la fois les modèles, les données et la recette d’entraînement. L’intégration à un pipeline retrieve-then-rerank répond à un besoin crucial : concilier précision élevée et coûts calculatoires maîtrisés. En se basant sur des encodeurs Ettin ModernBERT et une distillation depuis un modèle de reranking de référence, ces six cross-encoders visent des performances de pointe pour différentes tailles de modèles. Leur articulation avec des embedders comme google/embeddinggemma-300m sur MTEB(eng, v2) Retrieval offre un cadre reproductible pour améliorer la qualité de la recherche d’information dans des systèmes de production.

Questions fréquentes

Qu’est-ce que la famille Ettin Reranker annoncée par Hugging Face ?

Il s’agit de six nouveaux rerankers Sentence Transformers CrossEncoder, décrits comme à l’état de l’art à leur taille, construits sur les encodeurs Ettin ModernBERT et livrés avec les données et la recette d’entraînement complète.

Comment les Ettin Rerankers ont-ils été entraînés ?

Ils ont été entraînés par distillation avec une MSE point à point sur les scores de mixedbread-ai/mxbai-rerank-large-v2, à partir du jeu cross-encoder/ettin-reranker-v1-data dérivé de jeux lightonai.

Sur quel benchmark les Ettin Rerankers sont-ils évalués ?

L’article précise que les six rerankers, couplés à google/embeddinggemma-300m, ont été évalués sur MTEB(eng, v2) Retrieval, avec d’autres appariements présentés dans la section résultats.

Pourquoi utiliser un reranker avec un modèle d’embedding ?

Parce que le schéma « retrieve-then-rerank » permet à un embedder rapide de récupérer les top-K documents, puis à un cross-encoder de les réordonner avec une meilleure précision, en limitant le coût calculatoire global.

En quoi un reranker diffère-t-il d’un modèle d’embedding classique ?

Un reranker encode conjointement la requête et le document et produit un score de pertinence unique, alors qu’un modèle d’embedding encode séparément chaque texte et calcule leur similarité à partir de deux vecteurs distincts.

Source

Hugging Face

Auteur

Rédaction IA-Medias

Rédaction spécialisée dans la veille et l'analyse de l'actualité de l'intelligence artificielle, des puces IA, des robots, des agents IA et de la recherche.