NVIDIA lance Vera : le premier CPU sur mesure pour les agents IA

Logo et design minimaliste et abstrait de la puce NVIDIA Vera en tons verts et argentés, centré sur un fond noir solide en haute résolution.

Dans un communiqué officiel publié ce lundi 18 mai 2026 (UTC) sur le NVIDIA Blog, le fabricant de puces dirigé par Jensen Huang a annoncé la livraison des premières unités de production du Vera CPU, son premier processeur personnalisé, conçu spécifiquement pour l'écosystème des agents autonomes d'intelligence artificielle. La puce haute performance a été remise en main propre aux laboratoires partenaires de la Big Tech dans les villes de San Francisco, Santa Clara et Palo Alto, en Californie, amorçant la transition de cette architecture des laboratoires de tests directement vers le marché d'entreprise à grande échelle.

Le vice-président de l'hyperscale et de la haute performance de NVIDIA, Ian Buck, a effectué la livraison technique personnellement aux dirigeants d'infrastructure des plus grandes entreprises d'IA du monde. Parmi les premiers à recevoir les serveurs équipés du nouveau matériel figurent Anthropic, OpenAI, la division de simulation aérospatiale SpaceXAI de Elon Musk, ainsi que la branche d'infrastructure cloud de Oracle Cloud Infrastructure (OCI). En pratique, l'OCI a révélé qu'elle prévoit de déployer des centaines de milliers de ces CPUs dans ses centres de données à partir du second semestre 2026.

Pourquoi les Agents IA Exigent-ils un Processeur Dédié ?

Bien que les GPU continuent de dominer le traitement massif des réseaux neuronaux, les tâches périphériques d'un écosystème agent reposent presque entièrement sur le CPU traditionnel. Des activités essentielles comme l'orchestration d'outils (tool calling), l'exécution de code Python dans des environnements virtuels fermés (sandboxes), la gestion de l'état dans des fenêtres contextuelles longues et l'apprentissage par renforcement (RL) nécessitent une faible latence de calcul d'usage général. La puce Vera a été développée pour pallier ce goulet d'étranglement, offrant une fiche technique sur mesure pour ces charges complexes :

Spécification Technique Métrique / Composant Impact Direct sur les Applications IA
Cœurs Personnalisés 88 Cœurs Olympus Grande capacité d'exécution simultanée pour plusieurs agents
Bande Passante Mémoire 1,2 To/s Alimentation ultrarapide des données et réduction drastique de la latence
Gain de Performance Monocœur 50% supérieur Achèvement rapide des tâches séquentielles complexes dans les sandboxes
Efficacité Énergétique 2x plus efficace Réduit la consommation et le chauffage dans les centres de données d'hyperscale

Intégration avec la Prochaine Génération de GPUs Rubin

Derrière ce design de co-ingénierie extrême, le processeur fonctionne non seulement de manière isolée, mais aussi comme le cœur de systèmes intégrés plus complexes. La puce est l'unité hôte du rack **Vera Rubin NVL72**, où elle partage des données avec deux cartes graphiques de la prochaine architecture de GPUs **NVIDIA Rubin** via le bus de seconde génération NVLink-C2C. Le résultat de cette architecture mémoire unifiée est un taux d'utilisation continu des GPUs, évitant les interruptions dans les flux intensifs de raisonnement.

Alors qu'Anthropic commence les tests du nouveau CPU sur des charges de travail agent dynamiques, SpaceXAI étudie le potentiel de la puce pour des simulations massives d'apprentissage par renforcement dans la formation de modèles industriels. L'arrivée du Vera CPU sur le marché d'entreprise marque un jalon dans le matériel d'intelligence artificielle, consolidant l'idée que la prochaine vague de la révolution agent nécessite un traitement spécialisé sur toute sa chaîne de silicium.

Partager

Ce contenu a été créé et révisé par notre équipe (iatoskill.com), si vous rencontrez un problème, contactez-nous

Ce contenu a-t-il été utile ?
Apprenez

Plus d'Actualités

Voir Tout
NVIDIA lance Vera : le premier CPU sur mesure pour les agents IA