DeepSeek fija precios del V4-Pro con un descuento permanente del 75%

Entorno de desarrollo real con una pantalla mostrando códigos y gráficos de precios de la API DeepSeek-V4-Pro.

La desarrolladora de inteligencia artificial DeepSeek anunció oficialmente este viernes, 22 de mayo de 2026 (UTC), que la tabla temporal de precios con un 75% de descuento para su modelo de lenguaje principal DeepSeek-V4-Pro se mantendrá permanentemente. Con esta decisión, los desarrolladores que utilizan la API de la empresa no sufrirán el reajuste tarifario previsto para el fin de la promoción el 31 de mayo de 2026 (UTC), consolidándose como una de las opciones de procesamiento de lenguaje más económicas en el mercado global de tecnología. El anuncio oficial fue integrado directamente en los canales de comunicación de la marca y en la documentación oficial de precios.

Una ruptura de precios definitiva en el mercado de APIs

Lanzado originalmente en abril de 2026 (UTC) con pesos abiertos bajo la licencia MIT, el DeepSeek-V4-Pro es un modelo del tipo Mixture-of-Experts (MoE) que cuenta con 1,6 billones de parámetros totales, siendo 49 mil millones activos durante el procesamiento. La arquitectura fue desarrollada específicamente para tareas complejas de programación, razonamiento lógico avanzado y flujos de trabajo de alta densidad. En la práctica, la tabla definitiva establece un cobro extremadamente competitivo por millón de tokens. El costo de entrada en caso de fallo de caché (cache miss) se fijó en 3 yuanes, el equivalente a aproximadamente US$ 0,435, pero el costo de salida se definió en 6 yuanes, alrededor de US$ 0,87 por millón de tokens. Sin embargo, el mayor ahorro está en los aciertos de caché (cache hit), que cuestan solo 0,025 yuanes o US$ 0,0036 por millón de tokens.

Detrás de esto, el mantenimiento de estos valores agresivos crea una barrera económica casi infranqueable para las grandes del sector. Analistas de mercado como @faraz0x y @hqmank señalan que los nuevos valores de la API de la empresa asiática son entre 3 y 35 veces más baratos que los costos estimados para realizar tareas equivalentes en el GPT-5.5 de OpenAI o en el recién lanzado Claude Opus 4.7 de Anthropic. El resultado de esta diferencia colosal debería ser la aceleración drástica de la adopción de la tecnología por startups y programadores independientes que construyen sistemas con gran volumen de contexto, ya que el modelo ofrece soporte para ventanas de contexto de hasta 1 millón de tokens.

Presión en el ecosistema de infraestructura de IA

La decisión de la compañía china de no reajustar sus tarifas provocó una reacción inmediata en toda la cadena de distribución de inteligencia artificial. Agregadores populares de APIs y proveedores de nube de terceros, como OpenRouter y DeepInfra, comenzaron a actualizar sus respectivas tablas de traspaso en las últimas horas para reflejar la nueva realidad de costos del modelo. Además, la compatibilidad directa con la biblioteca de OpenAI facilita la migración inmediata de sistemas heredados, permitiendo que las empresas sustituyan sus backends de procesamiento sin la necesidad de reescribir grandes bloques de código.

Mientras tanto, los expertos de la industria ya proyectan los desarrollos operativos para el segundo semestre de 2026 (UTC). Se espera que los nuevos proveedores de hardware reduzcan aún más los costos de procesamiento en los próximos meses con la mayor disponibilidad local de chips de aceleración gráfica de la línea Ascend fabricados en Asia. Con servidores más eficientes y costos de energía optimizados, la empresa consolida su modelo de negocio basado en volumen masivo de solicitudes, forzando a los proveedores occidentales a repensar sus márgenes de ganancia para retener a sus clientes corporativos.

Compartir

Este contenido fue creado y revisado por nuestro equipo (iatoskill.com), si encuentras algún problema, ponte en contacto con nosotros

¿Fue útil este contenido?
Aprende

Más Noticias

Ver Todo