OpenAI新推出ChatGPT高級語音模式 能說中文等逾50種語言

OpenAI新推出ChatGPT高級語音模式 能說中文等逾50種語言(圖:shutterstock)
OpenAI新推出ChatGPT高級語音模式 能說中文等逾50種語言(圖:shutterstock)

OpenAI 周二 (24 日) 宣布,將向 ChatGPT 的更多付費客戶推出高級語音模式 (AVM)。音訊功能使 ChatGPT 的交談更加自然,最初將向 ChatGPT Plus 和 Teams 級別的客戶推出,下周,這些功能將向 OpenAI 企業和教育客戶開放。

據報導,高級語音模式主要特點包括:

  • 改進的對話體驗:AVM 允許更流暢、響應更靈敏的對話,使用戶能夠中斷 AI 並收到對方向變化的即時反應。
  • 新聲音:增加了五種新聲音,分別為 Arbor、Maple、Sol、Spruce 和 Vale,使聲音總數達到九種。
  • 自訂指令和記憶體:使用者可以使用自訂指令和記憶體來個性化 ChatGPT 如何回應他們,從而允許 AI 記住對話並在以後引用它們。
  • 增強的口音和對話流暢性:口音識別和對話流暢性得到了改進,特別是在某些外語中。
  • 新設計:AVM 採用全新設計,帶有動畫藍色球體,取代了先前使用的動畫黑點。

全新的語音功能適用於 OpenAI 的 AI 模型 GPT-4o,不適用於最近發布的預覽模型 o1。

OpenAI 指出,先進的語音助理可以用超過 50 種語言說「對不起,我遲到了」,並在社群媒體的貼文中附上一段影音,演示用戶可以要求語音助手表達,因為讓奶奶等了很久,向奶奶致歉。影片顯示,AI 助理首先按照要求總結了用戶想要表達的意思,用英語說了一遍,而後,在用戶提示 AI 奶奶只會說中文之後,AI 助手又用標準的中文說了一遍。

這次發布中缺少的另一個功能是:ChatGPT 的影音和螢幕共享,這一功能 OpenAI 在 4 個月前的春季更新期間首次亮相,原本應該讓 GPT-4o 同時處理視覺和聽覺訊息。

儘管如此,OpenAI 表示,自從發布 AVM 的有限 alpha 測試以來,它已經做出了一些改進。據稱,ChatGPT 的語音功能現在可以更好地理解口音,該公司表示其對話也更加流暢和快速。

OpenAI 發言人表示,目前 AVM 尚未在歐盟、英國、瑞士、冰島、挪威和列支敦士登等多個地區推出。


延伸閱讀

相關貼文

prev icon
next icon