面對全球人工智慧(AI)賽道的激烈競爭,Google(GOOGL-US) DeepMind 核心團隊近期釋出了震撼業界的訊號:規模法則(Scaling Law)並未終結,而是正迎來一場前所未有的「範式轉移」。
Google 在大型語言模型領域正醞釀一場重磅變革。近日,Google DeepMind 的 Gemini 預訓練負責人 Sebastian Borgeaud 在首度接受採訪時釋出強烈訊號:未來一年,大模型將在「長上下文處理效率」與「長度擴展」兩大核心維度迎來技術重大創新。
Borgeaud 進一步分享,團隊近期在「注意力機制」上有了出乎意料的突破性觀察,這些發現很可能在接下來幾個月,重新定義他們的研究走向。
同時,他拋出一句令人印象深刻的觀點:「規模法則」並沒有走到盡頭,而是正在轉型進化。
Borgeaud 是 Gemini 3 預訓練階段的核心負責人,並在訪談中指出,Gemini 3 的巨大性能飛躍,並非源於單一的「秘密武器」,而是源自無數細微優化的聚合。
他強調,Google 的研究範式已發生根本性轉變:「我們不再僅僅是在構建一個模型,我們正在建構的是一個完整的系統。」
隨著 AI 發展進入「數據有限」的時代,過去那種單純依賴擴大數據集的粗放模式已走入瓶頸。未來的競爭焦點將轉向如何高效利用資源。
Gemini 3 採用的混合專家模型(MoE)架構,正是這一轉變的體現:從追求單純的「大」,轉向追求「大而高效」。
四大技術尖端重塑 AI 核心架構
展望未來幾個月的技術走向,Sebastian 點出了四個關鍵突破方向:
1. 長上下文的「工作台化」: Google 預計在未來一年內大幅提升長上下文的處理效率與長度。這將使模型從單純的「記憶」轉化為「數位工作台」,能同時分析整個代碼庫或海量科研論文,成為強大代理基礎。
2. 注意力機制的底層演進: Sebastian 爆料,研發團隊最近在注意力機制上有了「非常有趣的發現」,這可能在未來幾個月內重塑研究方向,顯著提升模型的推理與計算效率。
3. 檢索機制的原生回歸: 透過可微分的方式讓模型學會「查資料」,而非死記硬背。這能讓模型動態地從外部海量知識源獲取資訊,突破參數規模的限制。
4. 成本革命: 未來的研究將更加關注如何讓強大模型變得「便宜又好用」,以應對用戶激增帶來的部署成本挑戰。
Noam Shazeer 回歸後的冷思考:規模不再是神話
與此同時,Google 的工程師 Jeff Dean、Transformer 開創者 Noam Shazeer 與 Oriol Vinyals 也進行了對談。
其中, Shazeer 的觀點引發業界熱議。回歸 Google 後的他顯得更加冷靜,並為當前的 AI 熱潮潑了一桶冷水。
他幾乎不主動談「顛覆式創新」,也鮮少拋出令人熱血沸騰的宏大敘事;反而多次提到研發節奏的拿捏、系統運作的穩定性,以及如何讓模型能長時間、可靠地運行。
身為 Transformer 架構的關鍵奠基者,他曾親手推動大型模型從零開始的爆發式成長;然而在大型語言模型聲勢正盛之際,他卻選擇踩下煞車,提出警示:模型給出答案的速度越來越快,但自我檢查與反思的次數卻遠遠不夠。
他也曾在公開場合一再強調:「現在的模型並不缺乏『聰明』,真正不足的是持續推理、在複雜任務中反覆修正自身判斷的能力。」
換句話說,模型規模依然關鍵,但它已不再是左右一切的唯一指標。
當 Noam 談到「推理」時,焦點明顯從「能不能變得更強」轉向「能不能長期保持穩定」。
這也是他回到 Google 之後,首次在公開舞台上展現出這樣的判斷與立場。
這番話聽起來並非否定過去的路線,而更像是坦然承認一個現實:那條單靠不斷堆疊參數就能一路向前的成長曲線,正逐漸逼近它的極限。
頂尖科學家的共識:一次高分,無法定義 AI 的未來
Noam 在對談中提出了一個關鍵概念:慢思考(Slow Thinking)。
這並不只是把研發節奏放慢而已,而是要求團隊不斷回頭追問:這樣做值不值得?成本高不高?未來能不能被大規模複製與長期維持?
當討論走到這一步,所謂的「智慧」不再只是抽象的能力指標,而是一項必須長期投入的工程成本,需要像 CPU、儲存空間一樣,被正式納入帳本精算。
一旦跨出這道門檻,許多過去用來評估 AI 的指標,例如 Benchmark,也開始顯得力有未逮。
在整場會議中,三位頂尖科學家並沒有對排行榜表現出特別的興奮,也未曾用「誰贏了誰」來界定技術進展。
排行榜擅長捕捉瞬間的高光時刻,卻難以回答更關鍵的問題:系統能不能長時間穩定運作?
而 Noam 與 Jeff 反覆強調的,正是這些長期維度:模型是否可靠、是否具備遷移能力,以及能否在複雜任務中持續進行自我修正。
這些核心能力,很難被濃縮成一個漂亮、好看的數字,但它們,才是真正決定 AI 未來走向的關鍵。
Gemini 被視為一套系統,而不只是一個模型
在這場對談中,「系統」(System)一詞被反覆提及,顯然不是修辭上的巧合,而是一種刻意為之的定位。
Noam 與 Jeff 在談論 Gemini 時,刻意避開「更強大的模型」這類說法,反而一再強調,它是一個能長期運作、持續演進的完整系統。
乍聽之下,「系統」與「模型」似乎差別不大,但背後的思維邏輯卻截然不同。
所謂的「模型」,更像是一個階段性的成果,重視的是實驗室裡的即時表現;而「系統」則更接近基礎建設,關注的是穩定度、擴展性,以及在出錯時能否快速修復並持續運轉。
對 Noam 這類高度重視架構設計、研發節奏與工程限制的研究者而言,真正重要的從來不是某一次回應有多快,而是一個系統能否穩健地運行十年、甚至二十年。
在他們的視角裡,Gemini 不是用來證明勝負的戰利品,而是一種「可以長期使用」的智慧形態。
也因此,整場對談沒有急著端出產品式的宣傳語言,沒有劍拔弩張的「對標誰、打敗誰」。
它更像是一種對外釋放的訊號:Google 所追求的,並非短暫耀眼的完成品,而是一套能反覆部署、持續升級、不斷自我進化的智慧工業體系。
