DeepSeek fixa preços do V4-Pro com desconto permanente de 75%

Ambiente de desenvolvimento real com tela exibindo códigos e gráficos de preços da API DeepSeek-V4-Pro.

A desenvolvedora de inteligência artificial DeepSeek anunciou oficialmente nesta sexta-feira, 22 de maio de 2026, que a tabela temporária de preços com 75% de desconto para o seu modelo de linguagem principal DeepSeek-V4-Pro será mantida permanentemente. Com a decisão, os desenvolvedores que utilizam a API da empresa não sofrerão o reajuste tarifário previsto para o encerramento da promoção em 31 de maio de 2026, consolidando uma das opções de processamento de linguagem mais baratas do mercado global de tecnologia. O anúncio oficial foi integrado diretamente nos canais de comunicação da marca e na documentação oficial de precificação.

Uma quebra de preços definitiva no mercado de APIs

Lançado originalmente em abril de 2026 com pesos abertos sob a licença MIT, o DeepSeek-V4-Pro é um modelo do tipo Mixture-of-Experts (MoE) que conta com 1,6 trilhão de parâmetros totais, sendo 49 bilhões ativos durante o processamento. A arquitetura foi desenvolvida especificamente para tarefas complexas de programação, raciocínio lógico avançado e fluxos de trabalho agentic de alta densidade. Na prática, a tabela definitiva estabelece uma cobrança extremamente competitiva por milhão de tokens. O custo de entrada em caso de falha de cache (cache miss) foi fixado em 3 yuan, o equivalente a aproximadamente US$ 0,435, mas o custo de saída (output) ficou definido em 6 yuan, cerca de US$ 0,87 por milhão de tokens. A maior economia, porém, está nos acertos de cache (cache hit), que custam apenas 0,025 yuan ou US$ 0,0036 por milhão de tokens.

Por trás disso, a manutenção desses valores agressivos cria uma barreira econômica quase intransponível para as gigantes do setor. Analistas de mercado como @faraz0x e @hqmank apontam que os novos valores da API da empresa asiática são entre 3 e 35 vezes mais baratos do que os custos estimados para rodar tarefas equivalentes no GPT-5.5 da OpenAI ou no recém-lançado Claude Opus 4.7 da Anthropic. O resultado dessa diferença colossal deve ser a aceleração drástica da adoção da tecnologia por startups e programadores independentes que constroem sistemas com grande volume de contexto, já que o modelo oferece suporte a janelas de contexto de até 1 milhão de tokens.

Pressão no ecossistema de infraestrutura de IA

A decisão da companhia chinesa de não reajustar suas tarifas provocou uma reação imediata em toda a cadeia de distribuição de inteligência artificial. Agregadores populares de APIs e provedores de nuvem de terceiros, como OpenRouter e DeepInfra, começaram a atualizar suas respectivas tabelas de repasse nas últimas horas para refletir a nova realidade de custos do modelo. Além disso, a compatibilidade direta com a biblioteca da OpenAI facilita a migração imediata de sistemas legados, permitindo que empresas substituam seus backends de processamento sem a necessidade de reescrever grandes blocos de código.

Enquanto isso, especialistas da indústria já projetam os desdobramentos operacionais para o segundo semestre de 2026. A expectativa de novos fornecedores de hardware é que os custos de processamento caiam ainda mais nos próximos meses com a maior disponibilidade local de chips de aceleração gráfica da linha Ascend fabricados na Ásia. Com servidores mais eficientes e custos de energia otimizados, a empresa consolida seu modelo de negócios baseado em volume massivo de requisições, forçando provedores ocidentais a repensarem suas margens de lucro para reter seus clientes corporativos.

Compartilhe

Este conteúdo foi criado e revisado por nossa equipe (iatoskill.com), se encontrar algum problema, entre em contato conosco

Este conteúdo foi útil?
Aprenda

Mais Notícias

Ver Tudo