YouTube：OpenAI透過影片訓練Sora 違反平台規則

YouTube 執行長 Neal Mohan 週四 (4 日) 接受《彭博》專訪時表示，使用 YouTube 影片來訓練 OpenAI 的人工智慧 (AI) 模型 Sora ，將違反該平台的服務條款。

美國新創公司 OpenAI 今年 2 月公布 Sora 的人工智慧 (AI) 模型，只需隨意寫文字，Sora 就能轉化為栩栩如生、高度逼真的影片片段，導致許多 YouTuber 及內容創作者懷疑自己是否將成為被演算法取代的最新職業。

許多業內人士都在猜測 Sora 使用了哪些訓練數據，以實現如此高的生成品質，包括 YouTube、Facebook 和 Instagram 的用戶的影片，都成為人們臆測用來訓練 Sora 的來源。

不過，Mohan 週四受訪時警示，若使用 YouTube 影片來訓練 OpenAI 的文字到影片產生器，「明顯違反」了 YouTube 的使用條款。

Mohan 稱：「從創作者的角度來看，當創作者將其辛苦作品上傳 YouTube 平台時，他們有一定的期望，其中之一是服務條款將被使用者遵守。它不允許 (任何人任意) 下載文字記錄或影片片段等內容，這明顯違反 YouTube 服務條款。這些是我們平台內容的規則。」

Mohan 承諾，Google 在決定是否使用 YouTube 影片來訓練自家人工智慧模型 Gemini 之前，會遵守 YouTube 與創作者的個人合約。

Mohan 提到：「許多創作者在我們平台上的內容都有不同類型的授權許可，儘管 YouTube 語料庫的某些部分可能被用來訓練像 Gemini 這樣的模型，但 Google 和 YouTube 會事先確認使用這些影片作為 Google 人工智慧的訓練數據與創作者簽署的任何服務條款或合同一致。」

OpenAI 放出 Sora 生成影片的片段，憑藉超過一分鐘的生成影片長度和逼真的影片品質引發全球轟動，針對訓練模型的材料來源，OpenAI 技術長 Mira Murati 近期受訪時均迴避應答。

Murati 表示，她不確定 Sora 是否接受過來自 YouTube、Facebook 和 Instagram 的用戶生成影片的訓練，僅稱公司使用了公開可用的數據和獲得許可的數據。

儘管 OpenAI 尚未宣布 Sora 對公眾正式開放的日期，目前也只向安全團隊、一些視覺藝術家、設計師和電影製作人開放了 Sora 的使用權限。

而外媒近期引述消息人士報導，OpenAI 已經討論過將公開的 YouTube 影片裡所說的內容轉換成文本，並以此為基礎訓練該公司的下一個模型 GPT-5。

(本文不開放合作夥伴轉載)

延伸閱讀