2026年Google I/O大會:邁入「代理式 Gemini」的新紀元

Google 於 5 月 19 日至 20 日,在美國加州山景城舉辦了年度開發者大會 (I/O 2026),執行長 Sundar Pichai 在會中正式宣布,「我們已進入代理式 Gemini(Agentic Gemini)」時代,並將 AI 代理全面整合進搜尋、瀏覽器、手機、工作軟體甚至是智慧眼鏡中。

他強調,這場盛會象徵著一個重大的系統性轉向:AI 不再僅僅是「回答問題」的聊天機器人,而是進化為能「採取行動」的 AI 代理 (AI Agents)。

數據與基礎設施支撐 AI 的飛速增長

過去一年是 Google AI 技術飛速發展的一年。Pichai 指出,Gemini App 的月活躍用戶已突破 9 億,每日請求量增長了 7 倍。目前,Google 模型 API 每分鐘處理約 190 億個 Token,每月處理量更達到驚人的 3.2 千兆 (quadrillion) 個,同比增長 7 倍。

為了支撐如此龐大的算力需求,Google 宣布今年的資本支出將高達 1800 億至 1900 億美元。此外,Google 推出了第八代 TPU (TPU 8),包含針對大規模預訓練優化的 TPU 8t,以及專為推理設計、顯著降低延遲的 TPU 8i。

核心模型:Gemini 3.5 與 Gemini Omni

大會首日發布了 Gemini 3.5 Flash,這是 Gemini 3.5 系列的首款模型。它在編碼與代理任務上表現優異,且生成輸出 Token 的速度比其他前沿模型快約 4 倍,成本卻不到同級模型的一半。更強大的 Gemini 3.5 Pro 則預計於下個月推出。

另一亮點是影片生成模型 Gemini Omni。這是一款具備物理規律理解 (如重力、流體力學) 的「世界模型」,能實現多模態的互動與編輯。使用者可以透過自然語言對產出的影片進行對話式編輯,例如修改角色背景或場景,重新定義了視覺內容的創作方式。

代理式企業與個人助理:Gemini Spark 與 Antigravity

Google 正積極實踐「代理式企業 (Agentic Enterprise)」的願景。大會推出了 Gemini Spark,這是一款 24/7 全天候運行的個人 AI 代理。由於它運行在 Google Cloud 虛擬機器上,即便用戶合上筆記型電腦,它也能在背景持續執行任務,如自動寄信、追蹤活動細節、或跨應用程式協調工作流。

針對開發者,Google 升級了 Antigravity 2.0 平台。這是一個獨立的桌面應用程式,專為「代理優先」的開發而設計,能引導並協調多個自主代理執行複雜的工程任務。

搜尋與購物:重塑核心入口

Google 搜尋迎來了 25 年來最大的升級。全新的資訊代理 (Information Agents) 能在背景全天候監控特定主題,並在發現新資訊時主動更新結果。此外,Google 推出了 AI Mode,讓搜尋框支援多模態輸入,並能動態生成可互動的 UI 面面 (如周末旅行計畫表)。

購物體驗也因 Universal Cart(通用購物車) 而改變。這款 AI 代理驅動的購物車能跨平台追蹤優惠、價格歷史,並會主動提醒產品間的相容性問題 (例如組裝電腦時零件是否匹配)。

工作模式與硬體創新

在 Google Workspace 方面,Docs Live 實現了語音導向的文檔編輯,讓使用者能透過「腦力激盪」式的口述直接生成結構化文件。新工具 Google Pics 則讓使用者能精確掌控圖像中的單一物件進行編輯。

硬體方面,Google 預告了與 Gentle Monster 和三星等夥伴合作的 Android XR 智慧眼鏡。這款智慧眼鏡分為語音型與顯示型,能透過 Gemini 提供實時導航、翻譯,甚至能直接幫用戶下單咖啡,過程中手機完全無需拿出口袋。

安全與責任:SynthID 與 CodeMender

隨着生成式 AI 的普及,Google 擴展了其浮水印技術 SynthID,現已獲得 OpenAI 等多家企業採用,並整合進搜尋與 Chrome 中以識別 AI 生成內容。此外,AI 安全代理 CodeMender 能自主識別並修復程式碼中的漏洞,確保代理式企業的安全運作。