OpenAI發布多重模態模型GPT-4 直接讓ChatGPT升級

在 ChatGPT 引爆科技領域之後，人工智慧 (AI)「下一步」的發展會是什麼備受關注，很多學者都提到了多種模態。周三 (15 日) 凌晨，OpenAI 發布了多重模態訓練大模型 GPT-4。

GPT-4 實現幾個方面的飛躍式提升：強大的判圖能力、文字輸入限制提高至 2.5 萬字、回答準確度顯著提高、能夠生成歌詞、創意文本，實現風格變化。

OpenAI 工程師在介紹影音裡指出，「GPT-4 是全球第一款高體驗、能力強的先進 AI 系統，我們希望很快把它推向所有人，」

OpenAI 發布了技術報告形式論文、System Card，把 ChatGPT 直接升級成 GPT-4 版，也開放 GPT-4 的 API。

另外，微軟行銷主管在 GPT-4 發布後第一時間表示：「如果過去 6 周內任何時候曾經使用過全新的 Bing 預覽版，就已可提前了解 OpenAI 最新模組的強大功能。」

GPT-4 是一個大型多重模態模型，能接受圖像和文本輸入，再輸出正確的文本回覆。實驗證明，GPT-4 在各種專業測試和學術基準上的表現與人類水平相當。例如，它通過了模擬律師考試，且分數在應試者的前 10% 左右。相較之下，GPT-3.5 的得分在倒數 10% 左右。

OpenAI 花了 6 個月的時間使用對抗性測試程序和 ChatGPT 的經驗教訓，對 GPT-4 進行更新調整，從而在真實性、可控性等方面取得了歷來最好的結果。

在過去 2 年裡，OpenAI 重建了整個深度學習資料庫，並與 Azure 一起為其工作負載從頭開始設計了一台超級電腦。一年前，OpenAI 在訓練 GPT-3.5 時第一次嘗試運作該超級電腦系統，之後他們又陸續發現並修復了一些錯誤，改進了其理論基礎。

這些改進的結果是讓 GPT-4 的訓練運作獲得前所未有的穩定，以至於 OpenAI 能夠提前準確預測 GPT-4 的訓練性能，這也是第一個實現這個目標的大模型。OpenAI 表示將繼續專注於可靠的擴展，進一步完善方法，以幫助其實現更強大的提前預測性能和規劃未來的能力，這對安全至關重要。

OpenAI 正經由 ChatGPT 和 API 發布 GPT-4 的文本輸入功能。圖像輸入功能方面，為了獲得更廣泛的可用性，OpenAI 正與其他公司展開合作。

OpenAI 今天還公布 OpenAI Evals 的源代碼，這是其用於自動評估 AI 模型性能的框架。OpenAI 表示這是為了讓所有人都可以指出其模型中的缺點，以幫助 OpenAI 進一步改進模型。

有趣的是，GPT-3.5 和 GPT-4 之間的區別很微妙。當任務的複雜性達到足夠的門檻時，差異就會出現。GPT-4 比 GPT-3.5 更可靠、更有創意，並且能夠處理更細微的指令。

延伸閱讀