DeepSeek fixa preços do V4-Pro com desconto permanente de 75%

2026-05-22T15:35:22.224Z

Ambiente de desenvolvimento real com tela exibindo códigos e gráficos de preços da API DeepSeek-V4-Pro.

A desenvolvedora de inteligência artificial DeepSeek anunciou oficialmente nesta sexta-feira, 22 de maio de 2026, que a tabela temporária de preços com 75% de desconto para o seu modelo de linguagem principal DeepSeek-V4-Pro será mantida permanentemente. Com a decisão, os desenvolvedores que utilizam a API da empresa não sofrerão o reajuste tarifário previsto para o encerramento da promoção em 31 de maio de 2026, consolidando uma das opções de processamento de linguagem mais baratas do mercado global de tecnologia. O anúncio oficial foi integrado diretamente nos canais de comunicação da marca e na documentação oficial de precificação.

Uma quebra de preços definitiva no mercado de APIs

Lançado originalmente em abril de 2026 com pesos abertos sob a licença MIT, o DeepSeek-V4-Pro é um modelo do tipo Mixture-of-Experts (MoE) que conta com 1,6 trilhão de parâmetros totais, sendo 49 bilhões ativos durante o processamento. A arquitetura foi desenvolvida especificamente para tarefas complexas de programação, raciocínio lógico avançado e fluxos de trabalho agentic de alta densidade. Na prática, a tabela definitiva estabelece uma cobrança extremamente competitiva por milhão de tokens. O custo de entrada em caso de falha de cache (cache miss) foi fixado em 3 yuan, o equivalente a aproximadamente US$ 0,435, mas o custo de saída (output) ficou definido em 6 yuan, cerca de US$ 0,87 por milhão de tokens. A maior economia, porém, está nos acertos de cache (cache hit), que custam apenas 0,025 yuan ou US$ 0,0036 por milhão de tokens.

Por trás disso, a manutenção desses valores agressivos cria uma barreira econômica quase intransponível para as gigantes do setor. Analistas de mercado como @faraz0x e @hqmank apontam que os novos valores da API da empresa asiática são entre 3 e 35 vezes mais baratos do que os custos estimados para rodar tarefas equivalentes no GPT-5.5 da OpenAI ou no recém-lançado Claude Opus 4.7 da Anthropic. O resultado dessa diferença colossal deve ser a aceleração drástica da adoção da tecnologia por startups e programadores independentes que constroem sistemas com grande volume de contexto, já que o modelo oferece suporte a janelas de contexto de até 1 milhão de tokens.

Pressão no ecossistema de infraestrutura de IA

A decisão da companhia chinesa de não reajustar suas tarifas provocou uma reação imediata em toda a cadeia de distribuição de inteligência artificial. Agregadores populares de APIs e provedores de nuvem de terceiros, como OpenRouter e DeepInfra, começaram a atualizar suas respectivas tabelas de repasse nas últimas horas para refletir a nova realidade de custos do modelo. Além disso, a compatibilidade direta com a biblioteca da OpenAI facilita a migração imediata de sistemas legados, permitindo que empresas substituam seus backends de processamento sem a necessidade de reescrever grandes blocos de código.

Enquanto isso, especialistas da indústria já projetam os desdobramentos operacionais para o segundo semestre de 2026. A expectativa de novos fornecedores de hardware é que os custos de processamento caiam ainda mais nos próximos meses com a maior disponibilidade local de chips de aceleração gráfica da linha Ascend fabricados na Ásia. Com servidores mais eficientes e custos de energia otimizados, a empresa consolida seu modelo de negócios baseado em volume massivo de requisições, forçando provedores ocidentais a repensarem suas margens de lucro para reter seus clientes corporativos.

Compartilhe

Este conteúdo foi criado e revisado por nossa equipe (iatoskill.com), se encontrar algum problema, entre em contato conosco

Este conteúdo foi útil?

DeepSeek fixa preços do V4-Pro com desconto permanente de 75%

Uma quebra de preços definitiva no mercado de APIs

Pressão no ecossistema de infraestrutura de IA

Compartilhe

Mais Notícias

Startup Meng Xiaoyi lança colar de IA que 'traduz' latidos de pets

Casa Branca fecha acordo com Anthropic para uso de IA na NSA

SpaceX ativa Colossus II em tempo recorde para treinar o Grok 5