隨著企業應用從單一聊天機器人,轉向由多個 AI 代理協作完成複雜任務,開發者面臨通訊成本、情境漂移(context drift)與推論費用快速攀升等挑戰,同時也需要更高透明度,才能信任 AI 自動化關鍵工作流程。NVIDIA 指出,Nemotron 3 正是針對上述痛點設計,兼顧效能、開放性與成本效率。

NVIDIA 創辦人暨執行長黃仁勳 表示,開放式創新是 AI 進步的基礎,透過 Nemotron,NVIDIA 正將先進 AI 技術轉化為開放平台,讓開發者能以更高透明度與效率,打造大規模代理型 AI 系統。

Nemotron 3 也成為 NVIDIA 主權 AI(Sovereign AI)策略的重要一環,已獲歐洲、南韓等地多個組織採用,協助各國與企業依自身資料、法規與價值觀建置 AI 系統。包括 ServiceNow、埃森哲、德勤、安永、Palantir、Perplexity、西門子、Oracle Cloud Infrastructure、CrowdStrike、Zoom 等,已開始將 Nemotron 系列模型整合至製造、資安、軟體開發與企業服務流程。

ServiceNow 董事長暨執行長 Bill McDermott 指出,ServiceNow 的智慧工作流程自動化結合 Nemotron 3,可在效率、速度與準確度上持續拉高企業 AI 的標準。

在多代理系統架構下,NVIDIA 強調「模型路由」的重要性,讓工作流程能在前沿級專有模型與 Nemotron 開放模型間動態分配任務,以兼顧推理能力與成本最佳化(token economics)。Perplexity 執行長 Aravind Srinivas 表示,透過代理路由機制,能在需要時使用 Nemotron 3 Ultra 等高階模型,同時確保整體系統維持高效率與可擴展性。

在模型規格上,Nemotron 3 Nano 為 300 億參數模型,單次任務僅啟用最多 30 億參數,主打低推論成本;Super 約 1,000 億參數,適用多代理推理;Ultra 則為約 5,000 億參數的高階推理引擎。Nano 已開放使用,相較前一代可提升最高 4 倍詞元輸送量、降低最高 60% 推論生成成本,並具備 100 萬詞元情境窗口。獨立機構 Artificial Analysis 亦評為同級模型中兼具開放性與效率的代表。

Nemotron 3 Super 與 Ultra 採用 NVIDIA Blackwell 架構的 4 位元 NVFP4 訓練格式,大幅降低記憶體需求並提升訓練效率,使更大型模型能在既有基礎設施上完成訓練,且準確度不遜於高精度格式。

除模型外,NVIDIA 同步釋出 3 兆詞元的 Nemotron 訓練與後訓練資料集,以及 NeMo Gym、NeMo RL、NeMo Evaluator 等開源工具,協助開發者客製化專業代理型 AI。Nemotron 3 Nano 已在 Hugging Face 上線,並透過多家推論服務與雲平台提供,Super 與 Ultra 則預計於 2026 年上半年開放。


點擊閱讀下一則新聞 點擊閱讀下一則新聞
外資單週賣超逾1700億居今年次高 法人:AI撐盤年底台股仍可表現