Deepseek transforme sa remise de 75 % en offensive permanente contre GPT-5.5
D'après The Decoder (23 mai 2026 à 19h10)
Résumé
Deepseek rend permanente la remise de 75 % sur son modèle phare V4 Pro, ramenant le coût à 0,435 dollar par million de tokens en entrée et 0,87 dollar en sortie. Cela le rend jusqu’à 11,5 fois moins cher que GPT‑5.5 en entrée et plus de 34 fois moins cher en sortie, une pression directe sur les acteurs occidentaux.
Les faits
Deepseek a décidé de rendre permanente la remise de 75 % appliquée à son modèle phare Deepseek V4 Pro. La promotion, initialement prévue jusqu’au 31 mai 2026, est désormais intégrée à sa grille tarifaire, selon une annonce de l’entreprise sur X. Avec cette remise, un million de tokens en entrée sans cache est facturé 0,435 dollar, tandis qu’un million de tokens en sortie revient à 0,87 dollar. Les « cache hits » réduisent encore le prix d’entrée. En comparaison, GPT‑5.5 facture 5 dollars par million de tokens en entrée et 30 dollars par million en sortie, tandis qu’Opus 4.7 est positionné à 5 dollars pour l’entrée et 25 dollars pour la sortie. Cela rend Deepseek V4 Pro environ 11,5 fois moins cher que GPT‑5.5 sur le tarif standard d’entrée, et environ 34,5 fois moins cher sur les tokens de sortie. Sur la tarification long contexte de GPT‑5.5 au‑delà de 272 000 tokens, Deepseek V4 Pro serait environ 23 fois moins cher en entrée et 51,7 fois moins cher en sortie. Le modèle Deepseek V4 Flash est indiqué comme encore plus abordable. Les modèles Deepseek V4 Pro et V4 Flash offrent chacun une fenêtre de contexte d’un million de tokens et jusqu’à 384 000 tokens en sortie. Deepseek prend en charge les formats d’API d’OpenAI et d’Anthropic, afin de faciliter la transition pour les développeurs. L’article souligne que, si Deepseek V4 reste derrière les modèles de pointe GPT‑5.5 et Opus 4.7 en performance brute, l’écart de prix est qualifié de « massif », en particulier pour les systèmes d’IA agents qui consomment beaucoup plus de tokens qu’un chatbot standard.
Pourquoi c’est important
En rendant définitive une remise de 75 %, Deepseek transforme une promotion limitée dans le temps en véritable stratégie de guerre des prix. L’article y voit un tournant où la stratégie IA de la Chine devient une offensive tarifaire frontale contre les laboratoires occidentaux, en particulier sur les charges massives en tokens. Pour les systèmes agentiques et les applications gourmandes en tokens, l’écart de coût — jusqu’à 34,5 fois moins cher en sortie et plus de 50 fois moins cher en contexte long face à GPT‑5.5 — peut rebattre les cartes des choix technologiques. Même si Deepseek V4 n’égale pas encore les performances brutes de GPT‑5.5 ou d’Opus 4.7, une telle compression des coûts crée une pression significative sur les modèles économiques des grands acteurs américains et pourrait accélérer les migrations d’API vers des alternatives moins onéreuses.
Questions fréquentes
Quelle remise Deepseek rend-elle permanente sur V4 Pro ?
Deepseek rend permanente une remise de 75 % sur son modèle phare V4 Pro, une promotion initialement prévue jusqu’au 31 mai 2026.
Quels sont les nouveaux tarifs de Deepseek V4 Pro ?
Deepseek V4 Pro est facturé 0,435 dollar par million de tokens en entrée (sans cache) et 0,87 dollar par million de tokens en sortie, avec des prix d’entrée encore réduits en cas de cache hits.
Comment les prix de Deepseek se comparent-ils à GPT‑5.5 ?
Deepseek V4 Pro est environ 11,5 fois moins cher que GPT‑5.5 sur les tokens d’entrée standard et environ 34,5 fois moins cher sur les tokens de sortie, avec des écarts encore plus forts en contexte long.
Quelles capacités de contexte offrent les modèles Deepseek ?
Deepseek V4 Pro et Deepseek V4 Flash proposent une fenêtre de contexte d’un million de tokens et jusqu’à 384 000 tokens en sortie.
Deepseek est-il compatible avec les API des grands acteurs ?
Oui, Deepseek prend en charge les formats d’API d’OpenAI et d’Anthropic, ce qui facilite la bascule pour les développeurs.
Source
The DecoderAuteur
Rédaction IA-MediasRédaction spécialisée dans la veille et l'analyse de l'actualité de l'intelligence artificielle, des puces IA, des robots, des agents IA et de la recherche.