《路透》報導,輝達 (NVDA-US) 周一 (15 日) 發布新一代開源人工智慧 (AI) 模型,推出第三代「Nemotron」大型語言模型系列,主打效能更快、成本更低、能力更強,正值中國 AI 實驗室的開源模型在全球科技圈迅速擴散之際。
輝達以提供 AI 訓練晶片聞名,相關晶片被 OpenAI 等公司用於訓練封閉式模型並進行商業化,但該公司同時也提供多款開源模型,涵蓋物理模擬、自動駕駛等應用,供研究人員或企業使用,包括 Palantir Technologies(PLTR-US) 等公司,已將輝達模型整合至自家產品中。
輝達表示,新一代 Nemotron 模型主要用於寫作、程式撰寫等任務,其中最小版本「Nemotron 3 Nano」已於周一釋出,另外兩個更大型版本預計於 2026 年上半年推出。輝達指出,Nemotron 3 Nano 相較前一代模型更有效率,意味執行成本更低,且在需要多步驟推理的長任務表現更佳。
輝達此次強化開源布局,正值中國科技公司如深度求索 (DeepSeek)、月之暗面(Moonshot AI) 與阿里巴巴 (09988-HK)(BABA-US) 推出的開源模型迅速普及之際,包括 Airbnb(ABNB-US)等企業已公開表示採用阿里巴巴的通義千問 (Qwen) 模型。與此同時,《CNBC》與《彭博》報導指出,Meta(META-US)正考慮轉向封閉式模型策略,使輝達成為美國少數持續大力投入開源模型的主要業者之一。
目前已有多個美國州政府與公共機構,基於安全疑慮,禁止使用中國 AI 模型。輝達企業生成式 AI 軟體副總裁布里斯基 (Kari Briski) 表示,公司希望提供「使用者可以信賴的模型」,並同步公開訓練資料與相關工具,讓政府與企業客戶能自行進行安全測試與客製化調整。她形容,輝達將這些模型視為一套可長期維護的「軟體函式庫」,並承諾持續投入工程資源。
