黃仁勳開箱 Vera CPU:一款不給人類用、只為 AI 代理設計的處理器

人工智慧

「過去我們設計 CPU 是為了人類服務,全球需要電腦的人口不過十幾億。但未來將會有數十億、甚至數百億個 AI 代理(Agents),這些 AI 代理運作起來可是非常沒有耐心的。」輝達(NVIDIA)執行長黃仁勳在6月1日的主題演講中,正式發表了顛覆傳統晶片市場邏輯的全新產品—「Vera CPU」。這款處理器完全打破過去幾十年以人類操作為核心的設計框架,是一款純粹為「AI 代理(Agentic AI)」及其運作迴圈量身打造的地表最強硬體,標誌著運作型與實用型 AI 代理時代已全面到來。  

純為AI 代理打造的CPU
黃仁勳在演講一開始時就將「AI 將減少人類就業機會」的傳統論點斥之為無稽之談。他隨即以全球最龐大的軟體開發平台 GitHub 為例,指出從 2023 年到 2026 年初,平台上的代碼提交量(Commits)呈現接近三倍的爆發性成長。
黃仁勳強調,AI 代理不僅沒有縮減職缺,反而促使全球企業加速聘僱軟體工程師,原因在於 AI 的輔助讓原本 3 兆美元的工程師薪資投入,產出了價值高達 9 兆美元的超高生產力。
然而,這股驚人的代碼與數據吞吐量,卻暴露了傳統 x86 架構處理器的致命瓶頸—當 AI 代理需要以奈秒(Nanoseconds)為單位頻繁調用工具、進行沙盒代碼執行與資料庫檢索時,傳統 CPU 的多核心切割與虛擬化租賃模式已無法應付AI代理的超低延遲要求,進而拖累了高昂 GPU 的利用率。  

單顆晶片即高度整合了 88 個核心
為了解決這項痛點,黃仁勳揭曉了輝達專為 AI 代理設計的 Vera CPU新產品。該處理器採用輝達自主研發的「Olympus」資料中心處理器核心,單顆晶片即高度整合了 88 個核心。與傳統著重核心數堆疊的架構不同,Vera CPU 極度強化單執行緒性能(Single-threaded performance),其時鐘週期內的指令執行數量(IPC)居全球之冠,可同時進行高效率的解碼與神經分支預測。
此外,Vera CPU 也是全球首款全面導入 LPDDR5X 記憶體且能在不犧牲頻寬下進行多重錯誤校正的資料中心 CPU,使其內部核心對核心的通訊速度比傳統處理器快上 50%,記憶體延遲則降低了 40%。反映在實際工作負載上,Vera CPU 在執行沙盒代碼時的性能達傳統處理器的 1.8 倍,更讓全球使用最廣泛的結構化資料庫語言(SQL)處理速度暴增整整 3 倍。

 為全球 ODM 廠商開創出一個新規模硬體市場
除了Vera CPU之外,輝達在現場還同步亮相了另一款針對極致推論速度設計的硬體新產品—「Grok LPX」推論系統。該系統搭載了 256 個 Grok 3 LPU(推論處理器),擁有每秒高達 40 兆位元組(PB/s)的 SRAM 頻寬。
黃仁勳具體地形容並對比這兩款新晶片的戰略分工:當 Vera Rubin 機櫃系統在後端以最高吞吐量進行深度思考與上下文理解時,Grok LPX 則在前線以全球最低的延遲即時產出 Token,滿足對答絕不卡頓的極速互動場景。
輝達此次連續發布兩大硬體巨作,不僅成功擴展了運算版圖,也為全球 ODM 廠商與電腦製造商開創出一個規模遠超以往、專屬於 AI 代理的龐大藍海硬體市場。

back to top
navbar logo