NVIDIA lance Vera : le premier CPU sur mesure pour les agents IA

Dans un communiqué officiel publié ce lundi 18 mai 2026 (UTC) sur le NVIDIA Blog, le fabricant de puces dirigé par Jensen Huang a annoncé la livraison des premières unités de production du Vera CPU, son premier processeur personnalisé, conçu spécifiquement pour l'écosystème des agents autonomes d'intelligence artificielle. La puce haute performance a été remise en main propre aux laboratoires partenaires de la Big Tech dans les villes de San Francisco, Santa Clara et Palo Alto, en Californie, amorçant la transition de cette architecture des laboratoires de tests directement vers le marché d'entreprise à grande échelle.
Le vice-président de l'hyperscale et de la haute performance de NVIDIA, Ian Buck, a effectué la livraison technique personnellement aux dirigeants d'infrastructure des plus grandes entreprises d'IA du monde. Parmi les premiers à recevoir les serveurs équipés du nouveau matériel figurent Anthropic, OpenAI, la division de simulation aérospatiale SpaceXAI de Elon Musk, ainsi que la branche d'infrastructure cloud de Oracle Cloud Infrastructure (OCI). En pratique, l'OCI a révélé qu'elle prévoit de déployer des centaines de milliers de ces CPUs dans ses centres de données à partir du second semestre 2026.
Pourquoi les Agents IA Exigent-ils un Processeur Dédié ?
Bien que les GPU continuent de dominer le traitement massif des réseaux neuronaux, les tâches périphériques d'un écosystème agent reposent presque entièrement sur le CPU traditionnel. Des activités essentielles comme l'orchestration d'outils (tool calling), l'exécution de code Python dans des environnements virtuels fermés (sandboxes), la gestion de l'état dans des fenêtres contextuelles longues et l'apprentissage par renforcement (RL) nécessitent une faible latence de calcul d'usage général. La puce Vera a été développée pour pallier ce goulet d'étranglement, offrant une fiche technique sur mesure pour ces charges complexes :
| Spécification Technique | Métrique / Composant | Impact Direct sur les Applications IA |
|---|---|---|
| Cœurs Personnalisés | 88 Cœurs Olympus | Grande capacité d'exécution simultanée pour plusieurs agents |
| Bande Passante Mémoire | 1,2 To/s | Alimentation ultrarapide des données et réduction drastique de la latence |
| Gain de Performance Monocœur | 50% supérieur | Achèvement rapide des tâches séquentielles complexes dans les sandboxes |
| Efficacité Énergétique | 2x plus efficace | Réduit la consommation et le chauffage dans les centres de données d'hyperscale |
Intégration avec la Prochaine Génération de GPUs Rubin
Derrière ce design de co-ingénierie extrême, le processeur fonctionne non seulement de manière isolée, mais aussi comme le cœur de systèmes intégrés plus complexes. La puce est l'unité hôte du rack **Vera Rubin NVL72**, où elle partage des données avec deux cartes graphiques de la prochaine architecture de GPUs **NVIDIA Rubin** via le bus de seconde génération NVLink-C2C. Le résultat de cette architecture mémoire unifiée est un taux d'utilisation continu des GPUs, évitant les interruptions dans les flux intensifs de raisonnement.
Alors qu'Anthropic commence les tests du nouveau CPU sur des charges de travail agent dynamiques, SpaceXAI étudie le potentiel de la puce pour des simulations massives d'apprentissage par renforcement dans la formation de modèles industriels. L'arrivée du Vera CPU sur le marché d'entreprise marque un jalon dans le matériel d'intelligence artificielle, consolidant l'idée que la prochaine vague de la révolution agent nécessite un traitement spécialisé sur toute sa chaîne de silicium.
Ce contenu a été créé et révisé par notre équipe (iatoskill.com), si vous rencontrez un problème, contactez-nous


