輝達發布 Nemotron 3 Super模型具備 1200 億參數的開放模型

LLM

鄭國強2026-03-12 22:35

NVIDIA Nemotron 3 Super模型，這是一款具備 1200 億參數的開放模型，其中包含 120 億個活躍參數（active parameters），專為大規模運行複雜的代理型 AI 系統而設計。（圖片來源／輝達提供）

NVIDIA 於12日推出 NVIDIA Nemotron 3 Super模型，這是一款具備 1200 億參數的開放模型，其中包含 120 億個活躍參數（active parameters），專為大規模運行複雜的代理型 AI 系統而設計。

此模型現已開放使用，結合先進推理能力，可讓自主代理以高效率完成任務並維持高準確度。

AI 原生企業：Perplexity 已為其用戶提供 Nemotron 3 Super，用於搜尋功能，並將其作為 Computer 產品中 20 個協作模型之一。提供軟體開發代理的公司，如 CodeRabbit、Factory 與 Greptile，也正將該模型與自家模型整合至 AI 代理中，以降低成本並同步提升準確度。此外，Edison Scientific 與 Lila Sciences等生命科學與頂尖 AI 機構，則將運用 Nemotron 3 Super 模型驅動其代理系統，用於深度文獻搜尋、資料科學研究，以及分子層級的理解任務。

企業軟體平台：Amdocs、Palantir、Cadence、達梭系統與西門子等業界領導廠商正在部署並客製化 Nemotron 3 Super 模型，用於電信、資安、半導體設計與製造等領域的工作流程自動化。

隨著企業從聊天機器人邁向多代理應用，正面臨兩大主要限制。

首先是情境膨脹（context explosion）問題。多代理工作流程所產生的詞元數量，可能是一般聊天互動的 15 倍，因為每次互動都必須重新傳送完整歷史紀錄，包括工具輸出與中間的推理過程。

在處理時間較長的任務中，龐大的情境資料量會增加成本，且可能導致代理偏離原始目標。

第二項是思考稅（thinking tax）。複雜代理需要在每個步驟進行推理，但若是每個子任務都使用大型模型，將使多代理應用成本過高且運行緩慢，難以在實務環境中部署。

Nemotron 3 Super 提供 100 萬個詞元的情境窗口，使代理能將完整工作流程狀態保留在記憶中，進而避免目標偏移。

Nemotron 3 Super 亦樹立全新效能標準，在效率與開放性方面於 Artificial Analysis 評比中排名第一，並在同級模型中展現領先的準確度。

該模型也同時讓 NVIDIA AI-Q 研究代理在 DeepResearch Bench 與 DeepResearch Bench II 排行榜上榮登榜首。這兩項基準測試皆用於衡量 AI 系統在處理大型文件集時，進行全面多步驟研究，並維持推理連貫性的能力。

輝達發布 Nemotron 3 Super模型 具備 1200 億參數的開放模型

NVIDIA Nemotron 3 Super模型，這是一款具備 1200 億參數的開放模型，其中包含 120 億個活躍參數（active parameters），專為大規模運行複雜的代理型 AI 系統而設計。（圖片來源／輝達提供）

社群評論

輝達發布 Nemotron 3 Super模型具備 1200 億參數的開放模型