CES 2026一開始的主題演講,輝達(NVIDIA)執行長黃仁勳再次語出驚人地宣示:「AI正在徹底革新整個運算堆疊,而現在輪到儲存空間了。」隨著生成式AI邁向具備長期推理能力的代理型系統(Agentic AI),傳統基於SQL的儲存架構已不敷使用,輝達正式推出的 BlueField-4 資料處理器(DPU) 與 推論情境記憶儲存平台(Inference Context Memory Storage Platform),宣告了「AI原生儲存」時代的來臨。
黃仁勳深入淺出地解釋了這一技術轉向的必要性。他指出,AI不像傳統軟體使用SQL資料庫,而是處理語義資訊(Semantics information),並在運行中產生所謂的KV快取(Key-Value Cache),這就是AI的「工作記憶體」。隨著對話輪次增加、模型規模擴大,這個工作記憶體會呈爆炸性成長,甚至超越單一GPU所能承載的HBM記憶體容量。
AI工作記憶體會呈爆炸性成長,甚至超越單一GPU所能承載的HBM記憶體容量
「我們希望AI能陪伴我們一生,記得每一次對話與研究成果,」黃仁勳感性地描述對長情境處理的願景,「但如果基礎架構不變,網路傳輸將無法支撐如此龐大的記憶流動。」為了突破這一瓶頸,BlueField-4被設計為直接駐留在機架中的儲存核心,將KV快取管理從傳統網路中分離,直接在機架級AI叢集間實現高效的情境共享。
這項被稱為「AI記憶體擴展」的技術,數據表現極為亮眼。透過BlueField-4驅動的新一代平台,每個GPU實質上能獲得額外16TB的記憶體支援。與傳統儲存設備相比,此架構能將每秒處理的詞元(Token)生成量提升多達5倍,且能源效率同樣提升5倍,大幅降低了多步驟推理的延遲與成本。
未來的AI不再僅是一次性使用的聊天機器人
輝達此次也展示了強大的生態系動員能力。包括戴爾科技集團(Dell)、慧與科技(HPE)、IBM、Pure Storage、Supermicro與VAST Data在內的多家儲存巨頭,皆已宣布將率先利用BlueField-4打造新一代AI儲存平台,並預計於2026年下半年陸續上市。這些合作夥伴的加入,顯示出儲存產業正集體從單純的「資料存放」轉向「情境記憶」的基礎架構轉型。
黃仁勳強調,未來的AI不再僅是一次性使用的聊天機器人,而是能理解物理世界、進行長期推理、並保留短期與長期記憶的「智慧協作夥伴」。BlueField-4的問世,不僅是晶片效能的提升,更是將儲存堆疊重新改造,為數兆參數規模的多代理系統提供了可擴展的記憶基石。隨著儲存空間正式轉變為AI的智慧大腦一部分,運算與儲存的邊界將變得更加模糊,共同開啟AI應用的下一個前沿。