OpenAI推出新模型「GPT-4o」 人工智慧競賽升溫

OpenAI推出新模型「GPT-4o」 人工智慧競賽升溫(圖:REUTERS/TPG)
OpenAI推出新模型「GPT-4o」 人工智慧競賽升溫(圖:REUTERS/TPG)

OpenAI 周一 (13 日) 在線上發表會上推出新型人工智慧 (AI) 模型「GPT-4o」,該模型能進行語言、文本和視覺推理,而且在文本、影片和音頻方面的能力都有所提高,所有用戶將能免費使用。此外,該公司還推出桌上型電腦版本 ChatGP 和新的用戶介面,為擴大其廣受歡迎的聊天機器人做足準備。

OpenAI 科技長穆拉提 (Mira Murati) 在當天的直播活動中表示,此次更新將把 GPT-4o 帶給所有人,包括免費用戶,不過 GPT-4o 的付費用戶受的容量限制會比企業付費用戶更多。

值得一提的是,穆拉提在發表會尾聲還感謝輝達 (NVDA-US) 執行長黃仁勳及其公司替 OpenAI 的技術提供必要的圖形處理器 (GPU)。她說:「我只想感謝令人難以置信的 OpenAI 團隊,也感謝黃仁勳(Jensen Huang) 和輝達團隊為我們帶來最先進的 GPU,讓今天發表會的功能展示成真。」

新模型「GPT-4o」的特點方面,穆拉提表示其速度比 GPT-4 Turbo 快一倍,而且成本還只有後者的一半,在文本、影片和聲音方面的能力都有所提升,她稱這是該公司首次在使用方便方面邁出一大步。

穆拉提還說 GPT-4o 提高 ChatGPT 的品質以及 50 種不同語言的速度,新模型將透過 OpenAI 的 API 提供,如此一來軟體開發商就能使用新模型建構應用程式。

值得注意的是,OpenAI 研究員 Mark Chen 展示新模型的音頻功能,展現其感知使用者情緒功能,透過播放音樂舒緩情緒,而且還能處理被使用者突然打斷的狀況,甚至還能透過分析用戶臉部表評估當下情緒反應。

有趣的是,新模型能講睡前床邊故事,可以要求改變語調,使其更戲劇化或更機械式,或是以歌唱方式說故事。

不只如此,該模型的翻譯功能進一步延伸至聽聲翻譯。展示過程中,Mark Chen 與穆拉提分別講義大利文和英文,隨後新模型把雙方交談的內容翻譯成各自的語言。

另外,OpenAI 團隊成員也展示新模型解決數學方程式和輔助編寫程式碼的能力,並將其定位微軟 (MSFT-US) 自家 GitHub Copilot 的有力競爭對手。對於 OpenAI 來說,這是該公司自去年 8 月推出 ChatGPT Enterprise 以來向前邁出的最大一步。

微軟 (MSFT-US) 投資的 OpenAI,估值已超過 800 億美元,但這家成立於 2015 年的公司面臨著壓力,一方面要保持在生成式 AI 市場的領先地位,另一方面要想辦法賺錢,因為其在處理器和基礎設施投入大量資金構建和訓練其模型。

包含 OpenAI,微軟和 Google(GOOGL-US) 正引領著一場生成式 AI 淘金熱,似乎每個行業的公司都在競相將 AI 聊天機器人添加到關鍵服務中,以避免落後於競爭對手。本月早些時候,OpenAI 的競爭對手 Anthropic 宣布其首個企業產品和免費的 iPhone 應用程式。

PitchBook 的數據顯示,2023 年,近 700 筆生成式 AI 交易的投資額達到創紀錄的 291 億美元,比前一年成長 260% 以上,預估該市場的收入將在十年內突破 1 兆美元。

不過一些業內人士對未經測試的新服務進入市場的速度表示擔憂,學者和倫理學家對這項技術傳播偏見的傾向感到憂慮。


延伸閱讀

相關貼文

prev icon
next icon