OpenAI推出全新GPT Image 1.5影像生成模型!數據第一、用戶實測卻被罵慘?

OpenAI推出全新GPT Image 1.5影像生成模型。(圖:Shutterstock)
OpenAI推出全新GPT Image 1.5影像生成模型。(圖:Shutterstock)

OpenAI 近日宣布推出全新版本的 ChatGPT Images:GPT Image 1.5,承諾提供更佳的指令遵循能力、更精準的影像編輯,以及最高 4 倍加速的影像生成速度。然而,儘管數據表現亮眼,用戶實測後卻給出了嚴厲的批評。

根據《TechCrunch》報導,GPT Image 1.5 是 OpenAI 在與 Google(GOOGL-US) Gemini 競爭中的最新舉措。這項更新自週二(16 日)起,已向所有 ChatGPT 使用者及 API 開放。

OpenAI 執行長奧特曼(Sam Altman)上個月曾在內部備忘錄中稱為「紅色警戒」,計畫在 Google 釋出 Gemini 3 及 Nano Banana Pro 後,重新奪回 AI 領導地位。

這兩款 Google 產品近期在 LMArena 多項指標排行榜上均名列前茅。

即便上週 OpenAI 推出 GPT-5.2,宣稱這是至今最先進、適合開發者與日常專業使用的模型,Google 仍保持領先地位。

據報導,OpenAI 原本計畫在明年一月初推出新影像生成器,但因本週的公告而加快發布進度。OpenAI 上一次影像模型的發布是今年四月的 GPT Image 1。

GPT Image 1.5 的推出,正值影像與影片生成工具逐步突破原型階段、進入更成熟的生產應用時期。

與 Nano Banana Pro 相似,ChatGPT Image 提供後製功能,能精細控制視覺一致性,例如面部特徵、光影、構圖與色調等。

過去多數生成式 AI 影像工具在更新調整時表現不佳,但 GPT Image 1.5 的精準控制功能,對用戶而言將是大幅提升的體驗。

使用者只要輸入指令,如「調整表情」或「讓光線更冷」,系統即可僅對指定部分進行修改,而不破壞整體畫面。

除了功能更新,ChatGPT Images 還將在側邊欄新增專屬入口,更像一個創意工作室,方便使用者快速瀏覽與影像編輯。

OpenAI 應用程式部門執行長 Fidji Simo 表示,新介面可幫助使用者更輕鬆創作符合心中構想的影像,並從熱門提示與預設濾鏡中獲取靈感。

Simo 在部落格中指出:「當你在創作時,你應該能看到並塑造你正在製作的作品。當視覺能比文字更好地講故事時,ChatGPT 應該將其呈現。」

OpenAI 同時計畫讓搜尋結果呈現更多附有來源的視覺元素,對於換算單位或查詢運動比分等日常任務尤其實用。

Simo 強調:「當你需要快速答案,或下一步需使用其他工具時,它應該隨手可得。我們希望逐步縮短使用者的想法與落實之間的距離。」

用戶實測痛批「高分低能」模型

在 LMArena 競技場上, GPT Image 1.5 幾乎無敵:

  • 文字生成圖片表現亮眼:以 1264 Elo 分登上榜首,成功壓過 Google 的 Nano Banana Pro。
  • 圖像編輯:ChatGPT-image-latest 僅以 3 分優勢小勝 Nano Banana Pro 奪冠,而 GPT Image 1.5 則緊隨其後,位居第 4。

在 Artificial Analysis 測評中,更是一舉拿下「雙料第一」。

然而,這波熱潮很快被現實打破。有用戶實際測試結果顯示,這似乎又是一個典型的「高分低能」案例。

在一名用戶的對比中,GPT 的文生圖能力 Google Nano Banana Pro 相當,但在智力表現上卻大幅落後。

尤其在處理手寫筆記時,GPT Image 1.5 生成的圖像看似合格,但實際內容卻完全錯誤。

這種落差在社群中引起了激烈討論。有人直言:「Google Nano Banana Pro 仍是無可爭議的王者」;也有人批評:「這可能又是一個 OpenAI 尷尬且缺乏意義的發布。」


延伸閱讀

相關貼文

prev icon
next icon