輝達 (NVDA-US) 執行長黃仁勳今 (2) 日表示,AI 正從雲端訓練與推論,邁向 Agent AI 時代。他強調,未來 AI 不只是在資料中心運行,也會進入個人電腦、自駕車、機器人、基地台、衛星與各式邊緣裝置,而 PC 作為全球最大規模的邊緣裝置,正迎來 40 年來最重要的一次重新發明。
黃仁勳指出,Agent AI 的核心在於 AI 不再只是被動回應指令,而是能理解情境、判斷意圖、進行推理、使用工具、存取記憶並完成任務。他形容,未來的 AI 系統會像數位機器人一樣,具備感知、理解、推理與行動能力;這套運算模式不只適用於雲端,也將部署到各種終端設備上。
在這樣的趨勢下,黃仁勳認為,PC 必須從傳統工具轉型為 Agentic Computer。他表示,今天的電腦只是坐在桌上等待使用者操作,但未來的電腦會主動與使用者互動,甚至透過 WhatsApp 等通訊軟體持續與使用者對話、協助完成工作。每個人的 Agent 可能都有自己的名字,能夠被呼叫、回覆訊息,甚至主動提醒或協助使用者。
黃仁勳形容,未來的個人電腦會像使用者的「R2-D2」,不再只是執行軟體的工具,而是能陪伴使用者、理解需求、主動完成任務的智慧助理,PC 是全球最大的邊緣裝置,過去 40 年已深刻改變人類工作與生活;如今在 Agent AI 時代,PC 有機會再次被重新定義。
為了支撐這個願景,輝達推出 RTX Spark,並與微軟 (MSFT-US) 及聯發科 (2454-TW) 共同打造新一代 AI PC 架構。RTX Spark 是一種全新的 Agent 電腦,也是輝達與聯發科合作近兩年的成果,開發代號為 N1X。該產品採用統一記憶體架構,整合 CPU、GPU、Tensor Core 與高速晶片互連,並具備 Windows、CUDA、Tensor Core 及專業應用程式相容性。
黃仁勳指出,Agent AI 對電腦架構提出全新要求。未來 Agent 若要在本地端運行,電腦必須能有效處理大量參數,因為參數就是 AI 的「大腦」大小;同時也要具備安全沙盒,讓 Agent 在受保護的環境中運作,避免任意存取使用者整台 PC 或網路資源。
他進一步說明,Agent 與人類不同,人類可以等待軟體慢慢執行,但 Agent 是「沒有耐心」的。若 Agent 要操作 Adobe、Premiere、AutoCAD、Blender 等應用程式,這些軟體都必須被加速,不能讓 Agent 等待。因此,未來 PC 不只需要 CPU,也需要 GPU、Tensor Core、統一記憶體與完整加速運算能力。
黃仁勳也強調,Agent AI 並不會取代既有軟體,而是會使用更多軟體工具。他以機器人加熱水作為比喻,使用者應該不會希望機器人的手變成微波爐,而是希望機器人閱讀微波爐說明書後,操作既有微波爐。同樣地,未來 Agent 不會取代 Excel、SQL、瀏覽器、創作工具或作業系統,而是會透過這些工具完成任務。
這也讓黃仁勳持續看好軟體產業。他表示,外界擔心 Agent 會衝擊 SaaS 或應用軟體,是錯誤理解;未來將會有更多 Agent 使用更多工具,反而可能帶動軟體使用量與需求上升。換言之,Agent AI 將成為軟體產業的新需求放大器。
除了 PC,黃仁勳也將 Agent AI 延伸到更廣泛的邊緣與實體世界。他指出,自駕車、人形機器人、基地台、衛星、工程機具甚至醫療影像設備,未來都會具備 Agentic AI 能力。例如自駕車不只需要感知環境,更要能像人類一樣用推理處理未見過的路況;工程車可以讀取技能檔案或教學影片後學習操作;醫療 AI 則能理解 CT、超音波等工具,並在發現可疑訊號時示警。
在資料中心端,輝達也為 Agent AI 打造新的基礎設施。黃仁勳指出,Vera CPU 是為 Agent 而生的 CPU,不是傳統用來讓人類租用核心的 CPU。過去雲端 CPU 的邏輯是核心數越多越好,但 Agent 的目標不是租核心,而是快速完成工作、產生 token,因此更需要低延遲、高單執行緒效能、高記憶體頻寬與高 I/O 頻寬。
黃仁勳也提到,Agent AI 的運算模式將是分散式與解構式的,不會全部集中在雲端,也不會全部放在終端。部分工作會在雲端執行,部分會在筆電、桌機、企業網路或家庭中的 RTX Spark 上持續運作。這樣可以降低成本、縮短延遲,也能讓 Agent 更貼近使用者需求。
他指出,這種分散式 Agent AI 將使網通變得與運算一樣重要。只要工作被拆解、分散、解耦,網路連結就會成為關鍵,這也是輝達多年前收購 Mellanox、並持續強化 AI networking 的原因。
黃仁勳表示,輝達從 GPU 公司走向 AI 基礎設施公司,並不是為了擴張產品線,而是因為 Agent AI 的運算需求極為複雜,必須同時處理短期記憶、工作記憶、長期記憶、資料安全、加密、機密運算、網路、CPU、GPU 與完整軟體堆疊。若要真正執行 Agentic Computing Pattern,已不可能只靠單一 GPU,而需要整套 AI 基礎設施。
