輝達發布 Nemotron 3 Super模型 具備 1200 億參數的開放模型

LLM

NVIDIA 於12日推出 NVIDIA Nemotron 3 Super模型,這是一款具備 1200 億參數的開放模型,其中包含 120 億個活躍參數(active parameters),專為大規模運行複雜的代理型 AI 系統而設計。

此模型現已開放使用,結合先進推理能力,可讓自主代理以高效率完成任務並維持高準確度。

AI 原生企業:Perplexity 已為其用戶提供 Nemotron 3 Super,用於搜尋功能,並將其作為 Computer 產品中 20 個協作模型之一。提供軟體開發代理的公司,如 CodeRabbit、Factory 與 Greptile,也正將該模型與自家模型整合至 AI 代理中,以降低成本並同步提升準確度。此外,Edison Scientific 與 Lila Sciences等生命科學與頂尖 AI 機構,則將運用 Nemotron 3 Super 模型驅動其代理系統,用於深度文獻搜尋、資料科學研究,以及分子層級的理解任務。

企業軟體平台:Amdocs、Palantir、Cadence、達梭系統與西門子等業界領導廠商正在部署並客製化 Nemotron 3 Super 模型,用於電信、資安、半導體設計與製造等領域的工作流程自動化。

隨著企業從聊天機器人邁向多代理應用,正面臨兩大主要限制。

首先是情境膨脹(context explosion)問題。多代理工作流程所產生的詞元數量,可能是一般聊天互動的 15 倍,因為每次互動都必須重新傳送完整歷史紀錄,包括工具輸出與中間的推理過程。

在處理時間較長的任務中,龐大的情境資料量會增加成本,且可能導致代理偏離原始目標。

第二項是思考稅(thinking tax)。複雜代理需要在每個步驟進行推理,但若是每個子任務都使用大型模型,將使多代理應用成本過高且運行緩慢,難以在實務環境中部署。

Nemotron 3 Super 提供 100 萬個詞元的情境窗口,使代理能將完整工作流程狀態保留在記憶中,進而避免目標偏移。

Nemotron 3 Super 亦樹立全新效能標準,在效率與開放性方面於 Artificial Analysis 評比中排名第一,並在同級模型中展現領先的準確度。

該模型也同時讓 NVIDIA AI-Q 研究代理在 DeepResearch Bench 與 DeepResearch Bench II 排行榜上榮登榜首。這兩項基準測試皆用於衡量 AI 系統在處理大型文件集時,進行全面多步驟研究,並維持推理連貫性的能力。

back to top
navbar logo