一人抵一支AI軍團!清華系「PilotDeck」橫空出世 Token成本暴省75%

在初代 Agent 集體卡關之際,清華團隊近期低調開源全新智能體作業系統「PilotDeck」,迅速成為 AI 圈焦點。這款由清華大學 THUNLP 實驗室、面壁智能、OpenBMB 與 AI9stars 聯手打造的開源工具,被視為真正面向生產力的「Agent 協作艙」。

而曾經在 2026 年初爆紅、創下 GitHub 最快奪星紀錄的 AI 開源專案 OpenClaw(俗稱小龍蝦),如今熱度卻面臨冰點。

相較 OpenClaw 偏向極客實驗性質,PilotDeck 更強調多智能體協作、自動分工與高強度任務執行,可同時調度多個 AI 代理完成複雜工作流程,因此被不少開發者形容為「AI 軍隊指揮中心」,也讓「1 個人操控 1 支 AI 團隊」的概念開始真正落地。

小龍蝦確實完成了它的歷史使命,像一場颶風般把「智能體」的概念吹進大眾視野,讓所有人驚覺 AI 原來能主動替人類幹活,而非只是個陪聊的聊天機器人。

然而,由於跑得太快,小龍蝦來不及建立起足夠深的代碼壁壘與生態圈,終究沒能成為智能體界的 Linux,迅速被拍死在沙灘上。

面對初代 Agent 難以落地、無法適應高強度生產力的困境,那些真正需要靠 AI 搞生產力的人,現在都在用什麼時髦的新工具?答案就在最近低調上線的智能體作業系統「PilotDeck」。

超狂跨界:一邊開奶茶店、一邊畫融資大螢幕

許多初代的 Agent 遇到複雜任務或跨領域工作就容易當機,但 PilotDeck 的表現卻好得離譜。在實際測試中,開發者同時開闢了 2 個完全不同方向的獨立 WorkSpace(工作艙)進行高負載運作。

在第 1 個工作艙裡,測試人員只輸入了 1 句簡單的指令,要求做 1 個模擬經營奶茶店的小遊戲,並包含進貨、定價、排隊系統,且顧客要能根據價格和口碑決定購買意願。

PilotDeck 隨即展現出驚人的規劃能力,不僅當場拆解出遊戲的核心循環,設計了 5 款奶茶的產品線,還自動寫出清新卡片風的 UI 佈局與關鍵的 JavaScript 模組。沒過多久, 1 個精緻且可線上試玩的奶茶遊戲就誕生了。

同一個時間,另 1 個工作艙,測試人員丟進了 1 組全球 AI 公司的融資數據,要求製作 1 個帶有動畫效果、滑鼠懸停可看詳情的互動式數據視覺化大屏。

PilotDeck 俐落地繪製出 4 個核心圖表,將融資總額前 10 名、北美與歐洲及亞洲的融資佔比、乃至通用與企業與生成式 AI 的賽道分佈展現得一清二楚。

兩個南轅北轍的任務同時在背景奔跑,1 個在寫遊戲代碼,1 個在畫數據圖表,彼此互不干擾,效率高到令人咋舌。

為了進一步試探極限,測試人員又加開了第 3 個任務,要求製作 1 個包含 10 道題目、擁有科技感 GitHub 暗色主題風格的「程式設計師性格測試」應用。

PilotDeck 不僅設計出極度貼近開發者真實場景的趣味題目,還劃分出架構師、搬磚俠、完美主義者等 6 種人格,甚至附帶了精美的分享卡片。

這 3 大工作艙的跨度大到不可思議,但 PilotDeck 卻能穩穩地各跑各的,展現出極強的多工協作實力。

給 AI 的「獨立生存太空艙」

為什麼 PilotDeck 能夠做到如此完美的任務隔離?這得歸功於它與市面上其他工具截然不同的 WorkSpace 架構。

雖然像 Claude Projects 或 Cursor Workspace 也有專案隔離的概念,但它們本質上只是「資料夾加上靜態規則」,AI 的記憶看不見也改不了,技能無法隨著使用而進化,甚至連 Token 成本也算不清。

PilotDeck 則是直接為每個專案建造了一個具備 3 層架構的完整「工作艙」。

底層是專屬的檔案系統,讓專案檔案與 AI 生成的內容擁有清晰的邊界;中間層是專屬記憶,包含了記錄專案定義與進度的項目記憶,以及專門儲存使用者交付偏好的協作反饋記憶,這一切都看得見、改得了,還能精準追溯來源。

最上層則是專屬技能,用戶可以在 Skill 應用程式商店中,1 鍵為做遊戲的工作艙安裝資源尋找工具,或為寫文檔的工作艙安裝 PDF 處理工具。

在 PilotDeck 裡,工作艙不再是死板的資料夾,而是 AI 賴以生存並持續進化的完整環境。

聰明路由讓 Token 帳單直接砍 7 成

使用過 Agent 的開發者都知道一個公開的秘密:雖然用起來很痛快,但每個月最強模型的 API 帳單一來,燒起錢來簡直比天天搭計程車還貴。

許多人為了省錢,不得不手動切換模型,簡單問題用便宜模型,複雜問題才換貴模型,但這種手動切換的成本極其繁瑣,還會嚴重干擾 AI 的上下文快取(KV-cache),導致推理效率不升反降。

為了解決這個硬核痛點,PilotDeck 開發了一套聰明的「智慧路由」機制。與市面上按單次請求切換模型的粗暴做法不同,PilotDeck 的路由是在「子 Agent」層級運作的。

當一個複雜任務被拆解成多個子任務後,負責該子任務的 Agent 會被分配到最合適的模型並 1 路跑到底。

這樣一來,子 Agent 內部的上下文快取就能保持連續,不僅省下了大筆 Token 費用,更避免了頻繁切換帶來的效能損耗。

這套路由的調度規則也極為靈活,支援使用者以自然語言或自訂規則進行調節,例如指定代碼相關任務走 Claude、文字處理走便宜模型。

在實際的「程式設計師性格測試」測試中,未開啟路由前需要花費近 11 美元,開啟路由後實際僅花費 1.42 美元,瞬間省下了高達 75% 的成本。在更大規模的社群媒體內容生成測試中,同樣也省下了近 7 成的費用。

而在多語言播客、金融分析等複雜場景下,這種「強模型帶弱模型」的組合,甚至能以 1/6 的價格跑出超越單一強模型的效果。

此外,它還支援接入本地部署的模型,確保敏感數據完全不出本機,兼顧了隱私與性價比。

撬開 AI 的腦袋 記憶不聽話就「手動修改」

在過去,Agent 的記憶對使用者而言就像黑盒子,AI 記住了什麼、什麼時候記的、記得到底對不對,通通無從得知。

PilotDeck 的記憶面板則徹底將記憶「白盒化」,每 1 條記憶都標註了時間戳記、來源路徑與類型。如果發現 AI 記錯了,使用者可以直接點進去修改,或是直接刪除發生衝突的記憶,完全不需要重新啟動對話或重新餵一遍偏好。

更受關注的是,PilotDeck 還引入了名為「Dream(夢境)」的後台整理機制。在系統空閒的時段,AI 會在後台自動回顧與整理自己的記憶,達到「白天工作、晚上消化」的效果。

如果 AI 在夢境整理中出現了差錯,使用者還能一鍵回滾到整理前的狀態。這種記憶透明化的設計,讓 AI 在使用過程中變得越來越聽話,使用者的偏好被實實在在地記錄在系統中,下次執行任務時便能精準照辦。

這款兼具獨立工作艙、白盒化記憶與精算智慧路由的「六邊形戰士」,並未被鎖在昂貴的付費牆後,而是大大方方地選擇了完全開源。

不論是底層的路由邏輯,還是優雅的 Workspace 架構,所有代碼都已毫無保留地呈現在開發者面前。

隨著 PilotDeck 的開源,開發者們終於有了能真正投入實際生產線的利器,接管專屬於自己的 AI 軍團。