NVIDIA、Veraを発表:AIエージェント向け初のカスタムCPU

2026年5月18日(UTC)、NVIDIAブログで公開された公式発表で、ジェンスン・フアン率いるチップメーカーNVIDIAは、Vera CPUの最初の生産ユニットの提供を発表しました。これは、人工知能の自律エージェントエコシステム向けにカスタム設計された最初のプロセッサです。高性能チップは、カリフォルニア州サンフランシスコ、サンタクララ、パロアルトのビッグテックパートナーラボに直接届けられ、テストラボから企業スケール市場への移行を開始しました。
NVIDIAのハイパースケールおよび高性能コンピューティング担当副社長であるイアン・バックは、世界最大のAI企業のインフラストラクチャリーダーに新しいハードウェアを搭載したサーバーを個人的に提供しました。最初にこのハードウェアを受け取ったのは、Anthropic、OpenAI、イーロン・マスクのSpaceXAI、およびOracle Cloud Infrastructure (OCI)のクラウドインフラストラクチャ部門です。OCIは、2026年後半からそのデータセンターに数十万のこれらのCPUを展開する計画を発表しました。
なぜAIエージェントには専用プロセッサが必要なのか?
GPUが依然としてニューラルネットワークの大規模な処理を支配している一方で、エージェントエコシステムの周辺タスクはほぼ完全に従来のCPUに依存しています。ツールのオーケストレーション(ツールコール)、閉じた仮想環境(サンドボックス)でのPythonコードの実行、長いコンテキストウィンドウでの状態管理、強化学習(RL)などの重要な活動には、低レイテンシの汎用コンピューティングが必要です。Veraチップはこれらの複雑な負荷に合わせて設計された技術仕様を提供することで、このボトルネックを解消するために開発されました:
| 技術仕様 | メトリック / コンポーネント | AIアプリケーションへの直接影響 |
|---|---|---|
| カスタムコア | 88 Olympusコア | 複数のエージェントに対する高い同時実行能力 |
| メモリ帯域幅 | 1.2 TB/s | 超高速データ供給とレイテンシの大幅な削減 |
| モノコア性能向上 | 50%向上 | サンドボックスでの複雑なシーケンシャルタスクの迅速な完了 |
| エネルギー効率 | 2倍の効率 | ハイパースケールデータセンターでの消費と加熱を削減 |
次世代GPU Rubinとの統合
この極限の共設計の背後には、プロセッサが単独で動作するだけでなく、より複雑な統合システムの中心として機能するという考え方があります。チップはVera Rubin NVL72ラックのホストユニットであり、次世代GPUアーキテクチャであるNVIDIA Rubinの2枚のグラフィックカードと第2世代NVLink-C2Cバスを介してデータを共有します。この統一メモリアーキテクチャの結果、GPUの継続的な利用率が確保され、集中的な推論フローに中断が生じません。
Anthropicは新しいCPUを動的なエージェント負荷でテストを開始し、SpaceXAIは産業モデルのトレーニングにおける大規模な強化学習シミュレーションの可能性を研究しています。Vera CPUの企業市場への登場は、人工知能ハードウェアにおける分水嶺であり、次のエージェント革命にはシリコンチェーン全体で専門的な処理が必要であるという認識を確立します。
このコンテンツは私たちのチーム(iatoskill.com)によって作成およびレビューされました。問題がある場合は、こちらからお問い合わせください


