新聞 | iThome ( ) • 2024-04-08 10:43

Photo by Solen Feyissa on Unsplash

《纽约时报》(The New York Times)上周引述消息来源报导,OpenAI与Google都利用YouTube的影片内容来训练AI模型,尽管此举可能违反YouTube服务条款,但在业者急需大规模内容来训练AI模型之际,皆选择游走于灰色地带。

根据YouTube服务条款,它允许使用者存取、散布或播放YouTube内容,但并不允许使用者于YouTube平台之外使用其内容。

报导指出,当时OpenAI迫切需要更多的资料来开发GPT-4,内部所讨论的来源从播客、有声书到YouTube不等,还考虑买下那些搜集大量数位资料的新创公司,随后OpenAI打造了一款语音辨识系统Whisper,最终转录了超过100万小时的YouTube影片,把它们变成文本来训练GPT-4 。

纽时亦引用消息来源指出,有些Google员工即使知道OpenAI使用YouTube内容来训练它们的AI,却未加以阻止,因为Google自己也这样做。不过,Google发言人向该报表示,Google并不知道OpenAI做了什么,而且Google禁止未经授权抓取或下载YouTube内容。