DeepSeek fissa i prezzi del V4-Pro con uno sconto permanente del 75%

La sviluppatrice di intelligenza artificiale DeepSeek ha annunciato ufficialmente venerdì 22 maggio 2026 (UTC) che la tabella temporanea dei prezzi con uno sconto del 75% per il suo modello di linguaggio principale DeepSeek-V4-Pro sarà mantenuta permanentemente. Con questa decisione, gli sviluppatori che utilizzano l'API dell'azienda non subiranno l'aumento tariffario previsto per la fine della promozione il 31 maggio 2026 (UTC), consolidando una delle opzioni di elaborazione del linguaggio più economiche nel mercato globale della tecnologia. L'annuncio ufficiale è stato integrato direttamente nei canali di comunicazione del marchio e nella documentazione ufficiale dei prezzi.
Una rottura definitiva dei prezzi nel mercato delle API
Lanciato originariamente nell'aprile 2026 con pesi aperti sotto licenza MIT, il DeepSeek-V4-Pro è un modello del tipo Mixture-of-Experts (MoE) che conta 1,6 trilioni di parametri totali, di cui 49 miliardi attivi durante l'elaborazione. L'architettura è stata sviluppata specificamente per compiti complessi di programmazione, ragionamento logico avanzato e flussi di lavoro agentici ad alta densità. Nella pratica, la tabella definitiva stabilisce una tariffa estremamente competitiva per milione di token. Il costo d'ingresso in caso di fallimento del cache (cache miss) è stato fissato a 3 yuan, l'equivalente di circa 0,435 USD, ma il costo di uscita è stato definito in 6 yuan, circa 0,87 USD per milione di token. Il maggiore risparmio, tuttavia, si trova negli accessi al cache (cache hit), che costano solo 0,025 yuan o 0,0036 USD per milione di token.
Dietro a questo, il mantenimento di questi valori aggressivi crea una barriera economica quasi insormontabile per i giganti del settore. Analisti di mercato come @faraz0x e @hqmank indicano che i nuovi valori dell'API della società asiatica sono tra 3 e 35 volte più economici dei costi stimati per eseguire compiti equivalenti sul GPT-5.5 di OpenAI o sul neorilasciato Claude Opus 4.7 di Anthropic. Il risultato di questa differenza colossale dovrebbe essere l'accelerazione drastica dell'adozione della tecnologia da parte di startup e programmatori indipendenti che costruiscono sistemi con un grande volume di contesto, dato che il modello offre supporto a finestre di contesto fino a 1 milione di token.
Pressione sull'ecosistema d'infrastruttura IA
La decisione della compagnia cinese di non rivedere le proprie tariffe ha provocato una reazione immediata in tutta la catena di distribuzione dell'intelligenza artificiale. Aggregatori popolari di API e fornitori di cloud di terze parti, come OpenRouter e DeepInfra, hanno iniziato ad aggiornare le proprie rispettive tabelle di trasferimento nelle ultime ore per riflettere la nuova realtà dei costi del modello. Inoltre, la compatibilità diretta con la libreria di OpenAI facilita la migrazione immediata dei sistemi legacy, permettendo alle aziende di sostituire i propri backend di elaborazione senza la necessità di riscrivere grandi blocchi di codice.
Nel frattempo, gli esperti del settore stanno già prevedendo gli sviluppi operativi per il secondo semestre del 2026. L'aspettativa di nuovi fornitori di hardware è che i costi di elaborazione diminuiscano ulteriormente nei prossimi mesi con la maggiore disponibilità locale di chip di accelerazione grafica della linea Ascend fabbricati in Asia. Con server più efficienti e costi energetici ottimizzati, l'azienda consolida il suo modello di business basato su un volume massiccio di richieste, costringendo i fornitori occidentali a ripensare i propri margini di profitto per mantenere i propri clienti aziendali.
Questo contenuto è stato creato e revisionato dal nostro team (iatoskill.com), se riscontri problemi, contattaci


