OpenAI推出全新GPT Image 1.5影像生成模型！數據第一、用戶實測卻被罵慘？

OpenAI 近日宣布推出全新版本的 ChatGPT Images：GPT Image 1.5，承諾提供更佳的指令遵循能力、更精準的影像編輯，以及最高 4 倍加速的影像生成速度。然而，儘管數據表現亮眼，用戶實測後卻給出了嚴厲的批評。

根據《TechCrunch》報導，GPT Image 1.5 是 OpenAI 在與 Google(GOOGL-US) Gemini 競爭中的最新舉措。這項更新自週二（16 日）起，已向所有 ChatGPT 使用者及 API 開放。

OpenAI 執行長奧特曼（Sam Altman）上個月曾在內部備忘錄中稱為「紅色警戒」，計畫在 Google 釋出 Gemini 3 及 Nano Banana Pro 後，重新奪回 AI 領導地位。

這兩款 Google 產品近期在 LMArena 多項指標排行榜上均名列前茅。

即便上週 OpenAI 推出 GPT-5.2，宣稱這是至今最先進、適合開發者與日常專業使用的模型，Google 仍保持領先地位。

據報導，OpenAI 原本計畫在明年一月初推出新影像生成器，但因本週的公告而加快發布進度。OpenAI 上一次影像模型的發布是今年四月的 GPT Image 1。

GPT Image 1.5 的推出，正值影像與影片生成工具逐步突破原型階段、進入更成熟的生產應用時期。

與 Nano Banana Pro 相似，ChatGPT Image 提供後製功能，能精細控制視覺一致性，例如面部特徵、光影、構圖與色調等。

過去多數生成式 AI 影像工具在更新調整時表現不佳，但 GPT Image 1.5 的精準控制功能，對用戶而言將是大幅提升的體驗。

使用者只要輸入指令，如「調整表情」或「讓光線更冷」，系統即可僅對指定部分進行修改，而不破壞整體畫面。

除了功能更新，ChatGPT Images 還將在側邊欄新增專屬入口，更像一個創意工作室，方便使用者快速瀏覽與影像編輯。

OpenAI 應用程式部門執行長 Fidji Simo 表示，新介面可幫助使用者更輕鬆創作符合心中構想的影像，並從熱門提示與預設濾鏡中獲取靈感。

Simo 在部落格中指出：「當你在創作時，你應該能看到並塑造你正在製作的作品。當視覺能比文字更好地講故事時，ChatGPT 應該將其呈現。」

OpenAI 同時計畫讓搜尋結果呈現更多附有來源的視覺元素，對於換算單位或查詢運動比分等日常任務尤其實用。

Simo 強調：「當你需要快速答案，或下一步需使用其他工具時，它應該隨手可得。我們希望逐步縮短使用者的想法與落實之間的距離。」

在 LMArena 競技場上， GPT Image 1.5 幾乎無敵：

文字生成圖片表現亮眼：以 1264 Elo 分登上榜首，成功壓過 Google 的 Nano Banana Pro。
圖像編輯：ChatGPT-image-latest 僅以 3 分優勢小勝 Nano Banana Pro 奪冠，而 GPT Image 1.5 則緊隨其後，位居第 4。

在 Artificial Analysis 測評中，更是一舉拿下「雙料第一」。

然而，這波熱潮很快被現實打破。有用戶實際測試結果顯示，這似乎又是一個典型的「高分低能」案例。

在一名用戶的對比中，GPT 的文生圖能力 Google Nano Banana Pro 相當，但在智力表現上卻大幅落後。

尤其在處理手寫筆記時，GPT Image 1.5 生成的圖像看似合格，但實際內容卻完全錯誤。

這種落差在社群中引起了激烈討論。有人直言：「Google Nano Banana Pro 仍是無可爭議的王者」；也有人批評：「這可能又是一個 OpenAI 尷尬且缺乏意義的發布。」

延伸閱讀