一人抵一支AI軍團！清華系「PilotDeck」橫空出世 Token成本暴省75%

鉅亨網新聞中心2026年5月28號16點10分

在初代 Agent 集體卡關之際，清華團隊近期低調開源全新智能體作業系統「PilotDeck」，迅速成為 AI 圈焦點。這款由清華大學 THUNLP 實驗室、面壁智能、OpenBMB 與 AI9stars 聯手打造的開源工具，被視為真正面向生產力的「Agent 協作艙」。

而曾經在 2026 年初爆紅、創下 GitHub 最快奪星紀錄的 AI 開源專案 OpenClaw（俗稱小龍蝦），如今熱度卻面臨冰點。

相較 OpenClaw 偏向極客實驗性質，PilotDeck 更強調多智能體協作、自動分工與高強度任務執行，可同時調度多個 AI 代理完成複雜工作流程，因此被不少開發者形容為「AI 軍隊指揮中心」，也讓「1 個人操控 1 支 AI 團隊」的概念開始真正落地。

小龍蝦確實完成了它的歷史使命，像一場颶風般把「智能體」的概念吹進大眾視野，讓所有人驚覺 AI 原來能主動替人類幹活，而非只是個陪聊的聊天機器人。

然而，由於跑得太快，小龍蝦來不及建立起足夠深的代碼壁壘與生態圈，終究沒能成為智能體界的 Linux，迅速被拍死在沙灘上。

面對初代 Agent 難以落地、無法適應高強度生產力的困境，那些真正需要靠 AI 搞生產力的人，現在都在用什麼時髦的新工具？答案就在最近低調上線的智能體作業系統「PilotDeck」。

超狂跨界：一邊開奶茶店、一邊畫融資大螢幕

許多初代的 Agent 遇到複雜任務或跨領域工作就容易當機，但 PilotDeck 的表現卻好得離譜。在實際測試中，開發者同時開闢了 2 個完全不同方向的獨立 WorkSpace（工作艙）進行高負載運作。

在第 1 個工作艙裡，測試人員只輸入了 1 句簡單的指令，要求做 1 個模擬經營奶茶店的小遊戲，並包含進貨、定價、排隊系統，且顧客要能根據價格和口碑決定購買意願。

PilotDeck 隨即展現出驚人的規劃能力，不僅當場拆解出遊戲的核心循環，設計了 5 款奶茶的產品線，還自動寫出清新卡片風的 UI 佈局與關鍵的 JavaScript 模組。沒過多久， 1 個精緻且可線上試玩的奶茶遊戲就誕生了。

同一個時間，另 1 個工作艙，測試人員丟進了 1 組全球 AI 公司的融資數據，要求製作 1 個帶有動畫效果、滑鼠懸停可看詳情的互動式數據視覺化大屏。

PilotDeck 俐落地繪製出 4 個核心圖表，將融資總額前 10 名、北美與歐洲及亞洲的融資佔比、乃至通用與企業與生成式 AI 的賽道分佈展現得一清二楚。

兩個南轅北轍的任務同時在背景奔跑，1 個在寫遊戲代碼，1 個在畫數據圖表，彼此互不干擾，效率高到令人咋舌。

為了進一步試探極限，測試人員又加開了第 3 個任務，要求製作 1 個包含 10 道題目、擁有科技感 GitHub 暗色主題風格的「程式設計師性格測試」應用。

PilotDeck 不僅設計出極度貼近開發者真實場景的趣味題目，還劃分出架構師、搬磚俠、完美主義者等 6 種人格，甚至附帶了精美的分享卡片。

這 3 大工作艙的跨度大到不可思議，但 PilotDeck 卻能穩穩地各跑各的，展現出極強的多工協作實力。

給 AI 的「獨立生存太空艙」

為什麼 PilotDeck 能夠做到如此完美的任務隔離？這得歸功於它與市面上其他工具截然不同的 WorkSpace 架構。

雖然像 Claude Projects 或 Cursor Workspace 也有專案隔離的概念，但它們本質上只是「資料夾加上靜態規則」，AI 的記憶看不見也改不了，技能無法隨著使用而進化，甚至連 Token 成本也算不清。

PilotDeck 則是直接為每個專案建造了一個具備 3 層架構的完整「工作艙」。

底層是專屬的檔案系統，讓專案檔案與 AI 生成的內容擁有清晰的邊界；中間層是專屬記憶，包含了記錄專案定義與進度的項目記憶，以及專門儲存使用者交付偏好的協作反饋記憶，這一切都看得見、改得了，還能精準追溯來源。

最上層則是專屬技能，用戶可以在 Skill 應用程式商店中，1 鍵為做遊戲的工作艙安裝資源尋找工具，或為寫文檔的工作艙安裝 PDF 處理工具。

在 PilotDeck 裡，工作艙不再是死板的資料夾，而是 AI 賴以生存並持續進化的完整環境。

聰明路由讓 Token 帳單直接砍 7 成

使用過 Agent 的開發者都知道一個公開的秘密：雖然用起來很痛快，但每個月最強模型的 API 帳單一來，燒起錢來簡直比天天搭計程車還貴。

許多人為了省錢，不得不手動切換模型，簡單問題用便宜模型，複雜問題才換貴模型，但這種手動切換的成本極其繁瑣，還會嚴重干擾 AI 的上下文快取（KV-cache），導致推理效率不升反降。

為了解決這個硬核痛點，PilotDeck 開發了一套聰明的「智慧路由」機制。與市面上按單次請求切換模型的粗暴做法不同，PilotDeck 的路由是在「子 Agent」層級運作的。

當一個複雜任務被拆解成多個子任務後，負責該子任務的 Agent 會被分配到最合適的模型並 1 路跑到底。

這樣一來，子 Agent 內部的上下文快取就能保持連續，不僅省下了大筆 Token 費用，更避免了頻繁切換帶來的效能損耗。

這套路由的調度規則也極為靈活，支援使用者以自然語言或自訂規則進行調節，例如指定代碼相關任務走 Claude、文字處理走便宜模型。

在實際的「程式設計師性格測試」測試中，未開啟路由前需要花費近 11 美元，開啟路由後實際僅花費 1.42 美元，瞬間省下了高達 75% 的成本。在更大規模的社群媒體內容生成測試中，同樣也省下了近 7 成的費用。

而在多語言播客、金融分析等複雜場景下，這種「強模型帶弱模型」的組合，甚至能以 1/6 的價格跑出超越單一強模型的效果。

此外，它還支援接入本地部署的模型，確保敏感數據完全不出本機，兼顧了隱私與性價比。

撬開 AI 的腦袋記憶不聽話就「手動修改」

在過去，Agent 的記憶對使用者而言就像黑盒子，AI 記住了什麼、什麼時候記的、記得到底對不對，通通無從得知。

PilotDeck 的記憶面板則徹底將記憶「白盒化」，每 1 條記憶都標註了時間戳記、來源路徑與類型。如果發現 AI 記錯了，使用者可以直接點進去修改，或是直接刪除發生衝突的記憶，完全不需要重新啟動對話或重新餵一遍偏好。

更受關注的是，PilotDeck 還引入了名為「Dream（夢境）」的後台整理機制。在系統空閒的時段，AI 會在後台自動回顧與整理自己的記憶，達到「白天工作、晚上消化」的效果。

如果 AI 在夢境整理中出現了差錯，使用者還能一鍵回滾到整理前的狀態。這種記憶透明化的設計，讓 AI 在使用過程中變得越來越聽話，使用者的偏好被實實在在地記錄在系統中，下次執行任務時便能精準照辦。

這款兼具獨立工作艙、白盒化記憶與精算智慧路由的「六邊形戰士」，並未被鎖在昂貴的付費牆後，而是大大方方地選擇了完全開源。

不論是底層的路由邏輯，還是優雅的 Workspace 架構，所有代碼都已毫無保留地呈現在開發者面前。

隨著 PilotDeck 的開源，開發者們終於有了能真正投入實際生產線的利器，接管專屬於自己的 AI 軍團。