DeepSeek fixe les prix du V4-Pro avec une remise permanente de 75%

La développeuse d'intelligence artificielle DeepSeek a annoncé officiellement ce vendredi 22 mai 2026 (UTC) que la grille tarifaire temporaire avec une remise de 75% pour son modèle de langage principal DeepSeek-V4-Pro sera maintenue de façon permanente. Avec cette décision, les développeurs utilisant l'API de l'entreprise ne subiront pas le réajustement tarifaire prévu pour la fin de la promotion le 31 mai 2026 (UTC), consolidant l'une des options de traitement du langage les moins chères du marché technologique mondial. L'annonce officielle a été intégrée directement dans les canaux de communication de la marque et dans la documentation officielle de tarification.
Une rupture définitive des prix sur le marché des API
Lancé initialement en avril 2026 (UTC) avec des poids ouverts sous licence MIT, le DeepSeek-V4-Pro est un modèle de type Mixture-of-Experts (MoE) avec 1,6 trillion de paramètres au total, dont 49 milliards actifs pendant le traitement. L'architecture a été spécialement développée pour des tâches complexes de programmation, de raisonnement logique avancé et de flux de travail agentiques à haute densité. En pratique, la grille définitive établit une tarification extrêmement compétitive par million de tokens. Le coût d'entrée en cas d'échec de cache (cache miss) est fixé à 3 yuans, soit environ 0,435 USD, tandis que le coût de sortie (output) est fixé à 6 yuans, soit environ 0,87 USD par million de tokens. La plus grande économie réside cependant dans les réussites de cache (cache hit), qui ne coûtent que 0,025 yuan ou 0,0036 USD par million de tokens.
Derrière cela, le maintien de ces prix agressifs crée une barrière économique presque infranchissable pour les géants du secteur. Des analystes de marché comme @faraz0x et @hqmank indiquent que les nouveaux tarifs de l'API de l'entreprise asiatique sont entre 3 et 35 fois moins chers que les coûts estimés pour exécuter des tâches équivalentes sur le GPT-5.5 de OpenAI ou le tout nouveau Claude Opus 4.7 d'Anthropic. Le résultat de cette différence colossale devrait être l'accélération drastique de l'adoption de la technologie par les startups et les programmeurs indépendants qui construisent des systèmes avec un grand volume de contexte, car le modèle prend en charge des fenêtres de contexte allant jusqu'à 1 million de tokens.
Pression sur l'écosystème d'infrastructure de l'IA
La décision de l'entreprise chinoise de ne pas réajuster ses tarifs a provoqué une réaction immédiate dans toute la chaîne de distribution de l'intelligence artificielle. Des agrégateurs populaires d'APIs et des fournisseurs de cloud tiers, tels que OpenRouter et DeepInfra, ont commencé à mettre à jour leurs grilles de répartition respectives ces dernières heures pour refléter la nouvelle réalité des coûts du modèle. De plus, la compatibilité directe avec la bibliothèque d'OpenAI facilite la migration immédiate des systèmes hérités, permettant aux entreprises de remplacer leurs backends de traitement sans avoir besoin de réécrire de grands blocs de code.
Entre-temps, les experts de l'industrie projettent déjà les développements opérationnels pour le second semestre 2026 (UTC). Les nouveaux fournisseurs de matériel s'attendent à ce que les coûts de traitement diminuent encore dans les mois à venir avec la plus grande disponibilité locale des puces d'accélération graphique de la ligne Ascend fabriquées en Asie. Avec des serveurs plus efficaces et des coûts énergétiques optimisés, l'entreprise consolide son modèle économique basé sur un volume massif de requêtes, forçant les fournisseurs occidentaux à repenser leurs marges bénéficiaires pour conserver leurs clients corporatifs.
Ce contenu a été créé et révisé par notre équipe (iatoskill.com), si vous rencontrez un problème, contactez-nous


