黃仁勳表示,過去打造Hopper時,主要是為了預訓練(Pre-training);到了Grace Blackwell時代,市場一度認為推論(Inference)相對簡單,但如今隨著混合專家模型(MoE)與代理式AI興起,推論已成為AI產業真正的獲利核心。

他指出,這也是輝達打造NVLink 72的重要原因。透過硬體與軟體的極致共同設計(Co-design),目前輝達Token成本已是全球最低,「不是低10%,而是低了好幾個數量級」。

黃仁勳表示,Vera Rubin已不只是單純推論平台,而是專為自主代理系統打造的新世代AI基礎設施。整體架構整合Vera CPU、BlueField安全與儲存處理器、CX9網路與NVLink 72交換架構,同時搭配Mellanox高速網路技術。他透露,原本需要2小時組裝的Grace Blackwell機櫃,如今在Vera Rubin架構下已可縮短至5分鐘完成,大幅提升可靠性與量產效率。

輝達執行長黃仁勳。莊宗達攝
輝達執行長黃仁勳。莊宗達攝

黃仁勳花費大量篇幅談論Vera CPU。他指出,過去CPU是為人類設計,但代理(Agents)是「沒有耐心」的,它們不是活在以秒計算的世界,而是以奈秒(Nanoseconds)為單位。當代理存取資料庫、工具、記憶體或即時資料流時,任何延遲都會拖慢整體推理鏈。

因此,Vera CPU被設計成全球首款真正為代理式AI打造的CPU架構。黃仁勳指出,Vera CPU具備超高單執行緒效能、極高每核心頻寬與超高能源效率,每時脈可同時擷取、解碼並執行10個指令,同時具備每秒3.6TB橫截面頻寬、PCIe Gen 6與LPDDR/DDR5架構,整體頻寬是現有高效能CPU的2至3倍。

他強調,代理式AI本質上是解耦(Disaggregated)與分散式(Distributed)架構,因此CPU、GPU與儲存系統間必須高速協同運作,否則昂貴GPU等待CPU的時間,將直接造成成本浪費。

輝達執行長黃仁勳。莊宗達攝
輝達執行長黃仁勳。莊宗達攝

黃仁勳也透露,Grace與Vera已成為AI世界中獲得最高認證的CPU架構,全球資料中心、企業與雲端業者的軟體堆疊都已針對Grace最佳化,而未來也將全面轉向Vera。他坦言,當初從x86轉向Grace Blackwell是極高風險決策,但如今Grace Blackwell幾乎已成Blackwell代名詞。

在效能展示上,黃仁勳指出,Vera CPU在SQL資料庫工作負載上可提升3倍效能,在即時串流處理(Real-time Stream Processing)上更提升6倍。他舉例,Vera CPU目前已可用於紐約證券交易所(NYSE)等高頻即時資料分析場景。

黃仁勳認為,未來代理數量將遠超過人類,因此市場對CPU需求也將出現結構性改變。他直言,這不只是既有CPU市場的替代,而是全新的市場誕生,「為代理而生的CPU市場將比過去更大」。

輝達執行長黃仁勳。莊宗達攝
輝達執行長黃仁勳。莊宗達攝

除了硬體,黃仁勳也同步發表企業級「NVIDIA Agent Toolkit」代理工具包。他指出,企業若要真正部署代理式AI,需要四大核心,包括大型語言模型(LLM)、協調代理運作的Harness、安全執行環境(Runtime),以及可供代理調用的工具與函式庫。

其中,CUDA-X函式庫將成為未來AI代理的重要工具來源,而OpenSHell則是專為企業打造的開源安全執行環境,可保護代理權限、隱私與安全政策,目前包括Red Hat、Canonical與微軟(Microsoft)等業者都已投入採用。

黃仁勳指出,代理式AI將成為未來10年的核心運算模式,未來每家公司都將建立自己的AI代理系統。他也透露,輝達正與Cadence合作打造晶片設計「超級代理」,透過NeMoTron與CodeX等系統協助晶片架構、RTL與電路設計自動化,加速下一世代AI晶片開發。

作者簡介

呂承哲

壹蘋新聞網財經科技記者,專注半導體、AI與新能源產業,追蹤台積電、輝達及台廠電子供應鏈動態,並解析市場投資趨勢。


點擊閱讀下一則新聞 點擊閱讀下一則新聞
電腦展本週登場AI題材旺 台股大漲600點收4萬5創新高