NVIDIA lança Vera: o primeiro CPU feito sob medida para agentes de IA

Logotipo e design minimalista e abstrato do chip NVIDIA Vera em tons verde e prata centralizado em fundo preto sólido de alta resolução.

Em comunicado oficial divulgado nesta segunda-feira, 18 de maio de 2026, no NVIDIA Blog, a fabricante de chips liderada por Jensen Huang anunciou a entrega das primeiras unidades de produção do Vera CPU, seu primeiro processador customizado e projetado especificamente para o ecossistema de agentes autônomos de inteligência artificial. O chip de alta performance foi entregue em mãos a laboratórios parceiros da Big Tech nas cidades de São Francisco, Santa Clara e Palo Alto, na Califórnia, iniciando a transição dessa arquitetura dos laboratórios de testes diretamente para o mercado corporativo de escala.

O vice-presidente de hiperscala e computação de alto desempenho da NVIDIA, Ian Buck, realizou a entrega técnica pessoalmente aos líderes de infraestrutura das maiores companhias de IA do planeta. Entre os primeiros a receber os servidores equipados com o novo hardware estão a Anthropic, a OpenAI, a divisão de simulação aeroespacial SpaceXAI de Elon Musk, além do braço de infraestrutura de nuvem da Oracle Cloud Infrastructure (OCI). Na prática, a OCI revelou que planeja implantar centenas de milhares desses CPUs em seus data centers a partir do segundo semestre de 2026.

Por que Agentes de IA Exigem um Processador Dedicado?

Embora as GPUs continuem dominando o processamento massivo de redes neurais, as tarefas periféricas de um ecossistema agentic recaem quase por completo no CPU tradicional. Atividades essenciais como orquestração de ferramentas (tool calling), execução de código Python em ambientes virtuais fechados (sandboxes), gerenciamento de estado em janelas longas de contexto e aprendizado por reforço (RL) demandam baixa latência de computação de uso geral. O chip Vera foi desenvolvido para sanar esse gargalo, oferecendo uma ficha técnica desenhada sob medida para essas cargas complexas:

Especificação Técnica Métrica / Componente Impacto Direto nas Aplicações de IA
Núcleos Customizados 88 Olympus Cores Alto poder de execução simultânea para múltiplos agentes
Largura de Banda de Memória 1,2 TB/s Alimentação ultraveloz de dados e redução drástica da latência
Ganho de Performance Monocore 50% superior Conclusão ágil de tarefas sequenciais complexas em sandboxes
Eficiência Energética 2x mais eficiente Reduz o consumo e o aquecimento em data centers de hiperescala

Integração com a Próxima Geração de GPUs Rubin

Por trás desse design de co-engenharia extrema, o processador opera não apenas de maneira isolada, mas também como o coração de sistemas integrados mais complexos. O chip é a unidade host do rack **Vera Rubin NVL72**, onde compartilha dados com duas placas gráficas da próxima arquitetura de GPUs **NVIDIA Rubin** via barramento de segunda geração NVLink-C2C. O resultado dessa arquitetura de memória unificada é uma taxa de utilização contínua das GPUs, evitando interrupções em fluxos intensivos de raciocínio.

Enquanto a Anthropic inicia os testes da nova CPU em cargas de trabalho agentic dinâmicas, a SpaceXAI estuda o potencial do chip para simulações massivas de aprendizado por reforço no treinamento de modelos industriais. A chegada do Vera CPU no mercado corporativo marca um marco divisório no hardware de inteligência artificial, consolidando a percepção de que a próxima onda da revolução agentic necessita de processamento especializado em toda a sua cadeia de silício.

Compartilhe

Este conteúdo foi criado e revisado por nossa equipe (iatoskill.com), se encontrar algum problema, entre em contato conosco

Este conteúdo foi útil?
Aprenda

Mais Notícias

Ver Tudo