IT之家 1 月 11 日消息,根據(jù) TechCrunch 9 日的報(bào)道,在一起針對(duì) Meta 的版權(quán)訴訟中,原告的律師表示,Meta CEO 馬克?扎克伯格批準(zhǔn)了公司 Llama AI 模型開發(fā)團(tuán)隊(duì)使用盜版電子書和文章的數(shù)據(jù)集來(lái)進(jìn)行訓(xùn)練。
當(dāng)?shù)貢r(shí)間周三晚些時(shí)候提交給美國(guó)加州北區(qū)法院的最新文件中,Kadrey 訴 Meta 案的原告(包括暢銷書作家莎拉?西爾弗曼和塔-內(nèi)希西?科茨)敘述了 Meta 去年晚些時(shí)候的證詞,證詞中透露扎克伯格批準(zhǔn)了 Meta 使用名為 LibGen 的數(shù)據(jù)集進(jìn)行 Llama 相關(guān)的訓(xùn)練。
IT之家注:LibGen 自稱為“鏈接聚合器”,提供包括 Cengage Learning、Macmillan Learning、McGraw Hill 和 Pearson Education 等出版商的盜版作品。LibGen 曾多次被起訴、關(guān)閉,并因版權(quán)侵權(quán)被罰款數(shù)千萬(wàn)美元。
根據(jù) Meta 的證詞,原告律師稱,扎克伯格在 Meta 的 AI 高管團(tuán)隊(duì)和其他員工提出擔(dān)憂的情況下,仍批準(zhǔn)使用 LibGen 數(shù)據(jù)集來(lái)訓(xùn)練至少一個(gè) Llama 模型。文件中引用 Meta 員工的話稱內(nèi)部“知道這是盜版”,并且指出使用該數(shù)據(jù)集“可能會(huì)削弱 Meta 與監(jiān)管部門的談判地位”。
該文件還引用了一份備忘錄,指出在“上報(bào)至 MZ”后,Meta AI 團(tuán)隊(duì)“獲準(zhǔn)使用 LibGen”。而此處的“MZ”,顯然是“馬克?扎克伯格”的簡(jiǎn)寫。
周三的文件還揭示了新的指控,稱 Meta 可能試圖通過(guò)去除 LibGen 數(shù)據(jù)中的版權(quán)標(biāo)記來(lái)掩蓋侵權(quán)行為。
原告律師表示,Meta 工程師尼古拉?巴什利科夫?yàn)?Llama 團(tuán)隊(duì)編寫了一個(gè)腳本,用于刪除電子書中的版權(quán)信息,并且 Meta 還涉嫌從“用于訓(xùn)練 Llama 的科學(xué)期刊文章和其他數(shù)據(jù)”中去除了版權(quán)標(biāo)記?!斑@一發(fā)現(xiàn)表明,Meta 不僅僅為了訓(xùn)練而刪除版權(quán)信息,可能還試圖掩蓋其侵權(quán)行為,因?yàn)閯h除版權(quán)信息可以防止 Llama 輸出可能揭露‘侵權(quán)’的版權(quán)信息?!?/p>
Meta 還在證詞中透露,它通過(guò) torrent 下載了 LibGen,部分 Meta 工程師對(duì)此表示擔(dān)憂。torrent 下載是一種通過(guò)網(wǎng)絡(luò)共享文件的方式,它要求下載者同時(shí)“做種”,即上傳他們?cè)噲D獲取的文件。
原告律師稱,Meta 通過(guò) torrent 下載 LibGen 實(shí)質(zhì)上又進(jìn)行了另一種形式的版權(quán)侵權(quán),幫助傳播盜版內(nèi)容。不僅如此,Meta 還通過(guò)減少上傳的文件數(shù)量來(lái)隱瞞其侵權(quán)行為。
文件中提到,Meta 生成式 AI 部門負(fù)責(zé)人艾哈邁德?阿爾-達(dá)赫勒批準(zhǔn)了通過(guò) torrent 下載 LibGen,忽視了巴什利科夫?qū)ζ淇赡堋胺缮喜缓弦?guī)”的擔(dān)憂。
原告律師表示:“如果 Meta 直接購(gòu)買或借閱原告的作品并未經(jīng)授權(quán)訓(xùn)練 Llama 模型,它將構(gòu)成版權(quán)侵權(quán)。Meta 選擇繞過(guò)合法途徑,加入非法 torrent 網(wǎng)絡(luò),證明其侵權(quán)行為。”
廣告聲明:文內(nèi)含有的對(duì)外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時(shí)間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。