YouTube 執行長 Neal Mohan 週四 (4 日) 接受《彭博》專訪時表示,使用 YouTube 影片來訓練 OpenAI 的人工智慧 (AI) 模型 Sora ,將違反該平台的服務條款。
美國新創公司 OpenAI 今年 2 月公布 Sora 的人工智慧 (AI) 模型,只需隨意寫文字,Sora 就能轉化為栩栩如生、高度逼真的影片片段,導致許多 YouTuber 及內容創作者懷疑自己是否將成為被演算法取代的最新職業。
許多業內人士都在猜測 Sora 使用了哪些訓練數據,以實現如此高的生成品質,包括 YouTube、Facebook 和 Instagram 的用戶的影片,都成為人們臆測用來訓練 Sora 的來源。
不過,Mohan 週四受訪時警示,若使用 YouTube 影片來訓練 OpenAI 的文字到影片產生器,「明顯違反」了 YouTube 的使用條款。
Mohan 稱:「從創作者的角度來看,當創作者將其辛苦作品上傳 YouTube 平台時,他們有一定的期望,其中之一是服務條款將被使用者遵守。它不允許 (任何人任意) 下載文字記錄或影片片段等內容,這明顯違反 YouTube 服務條款。這些是我們平台內容的規則。」
Mohan 承諾,Google 在決定是否使用 YouTube 影片來訓練自家人工智慧模型 Gemini 之前,會遵守 YouTube 與創作者的個人合約。
Mohan 提到:「許多創作者在我們平台上的內容都有不同類型的授權許可,儘管 YouTube 語料庫的某些部分可能被用來訓練像 Gemini 這樣的模型,但 Google 和 YouTube 會事先確認使用這些影片作為 Google 人工智慧的訓練數據與創作者簽署的任何服務條款或合同一致。」
OpenAI 放出 Sora 生成影片的片段,憑藉超過一分鐘的生成影片長度和逼真的影片品質引發全球轟動,針對訓練模型的材料來源,OpenAI 技術長 Mira Murati 近期受訪時均迴避應答。
Murati 表示,她不確定 Sora 是否接受過來自 YouTube、Facebook 和 Instagram 的用戶生成影片的訓練,僅稱公司使用了公開可用的數據和獲得許可的數據。
儘管 OpenAI 尚未宣布 Sora 對公眾正式開放的日期,目前也只向安全團隊、一些視覺藝術家、設計師和電影製作人開放了 Sora 的使用權限。
而外媒近期引述消息人士報導,OpenAI 已經討論過將公開的 YouTube 影片裡所說的內容轉換成文本,並以此為基礎訓練該公司的下一個模型 GPT-5。
(本文不開放合作夥伴轉載)