NVIDIA lancia Vera: il primo CPU su misura per agenti di IA

In un comunicato ufficiale pubblicato lunedì 18 maggio 2026 (UTC) sul blog di NVIDIA, il produttore di chip guidato da Jensen Huang ha annunciato la consegna delle prime unità di produzione del Vera CPU, il suo primo processore personalizzato progettato specificamente per l'ecosistema degli agenti autonomi di intelligenza artificiale. Il chip ad alte prestazioni è stato consegnato direttamente ai laboratori partner della Big Tech nelle città di San Francisco, Santa Clara e Palo Alto, in California, avviando la transizione di questa architettura dai laboratori di test al mercato aziendale su larga scala.
Il vicepresidente della divisione di calcolo iperscalare e ad alte prestazioni di NVIDIA, Ian Buck, ha effettuato personalmente la consegna tecnica ai leader delle infrastrutture delle maggiori aziende di IA del pianeta. Tra i primi a ricevere i server equipaggiati con il nuovo hardware ci sono Anthropic, OpenAI, la divisione di simulazione aerospaziale SpaceXAI di Elon Musk, oltre al ramo di infrastruttura cloud di Oracle Cloud Infrastructure (OCI). In pratica, OCI ha rivelato che prevede di implementare centinaia di migliaia di questi CPU nei suoi data center a partire dal secondo semestre del 2026.
Perché gli Agenti di IA Richiedono un Processore Dedicato?
Sebbene le GPU continuino a dominare il massiccio processamento delle reti neurali, le attività periferiche di un ecosistema agentico ricadono quasi interamente sul CPU tradizionale. Attività essenziali come l'orchestrazione di strumenti, l'esecuzione di codice Python in ambienti virtuali chiusi (sandbox), la gestione dello stato in finestre lunghe di contesto e l'apprendimento per rinforzo (RL) richiedono una bassa latenza di calcolo di uso generale. Il chip Vera è stato sviluppato per risolvere questo collo di bottiglia, offrendo una scheda tecnica progettata su misura per questi carichi complessi:
| Specifiche Tecniche | Metrica / Componente | Impatto Diretto sulle Applicazioni di IA |
|---|---|---|
| Core Personalizzati | 88 Olympus Cores | Elevata capacità di esecuzione simultanea per agenti multipli |
| Larghezza di Banda di Memoria | 1,2 TB/s | Alimentazione dati ultrarapida e riduzione drastica della latenza |
| Incremento di Prestazioni Monocore | 50% superiore | Conclusione rapida di compiti sequenziali complessi in sandbox |
| Efficienza Energetica | 2x più efficiente | Riduce il consumo e il riscaldamento nei data center iperscalari |
Integrazione con la Prossima Generazione di GPU Rubin
Dietro questo design di co-ingegneria estrema, il processore funziona non solo in modo isolato, ma anche come il cuore di sistemi integrati più complessi. Il chip è l'unità host del rack **Vera Rubin NVL72**, dove condivide dati con due schede grafiche della prossima architettura di GPU **NVIDIA Rubin** tramite bus di seconda generazione NVLink-C2C. Il risultato di questa architettura di memoria unificata è una continua utilizzazione delle GPU, evitando interruzioni nei flussi intensivi di ragionamento.
Mentre Anthropic inizia i test della nuova CPU su carichi di lavoro agentici dinamici, SpaceXAI studia il potenziale del chip per simulazioni massive di apprendimento per rinforzo nell'addestramento di modelli industriali. L'arrivo del Vera CPU nel mercato aziendale segna un punto di svolta nell'hardware di intelligenza artificiale, consolidando la percezione che la prossima ondata della rivoluzione agentica necessiti di un processamento specializzato in tutta la sua catena di silicio.
Questo contenuto è stato creato e revisionato dal nostro team (iatoskill.com), se riscontri problemi, contattaci


