宅中地 - 每日更新
宅中地 - 每日更新

贊助商廣告

X

Meta 被指控使用存在爭議的盜版內容訓練 AI 模型

2025年01月14日 首頁 » 熱門科技

 

Meta 被指控使用存在爭議的盜版內容訓練 AI 模型

 

根據最新的法庭文件顯示,Meta 被指控為了訓練其 AI 模型,從一個因侵犯版權而被起訴的在線資源庫下載了大量內容。

這項指控出現在 Richard Kadrey 等人訴 Meta Platforms 的案件文件中。小說家 Kadrey (以及包括喜劇演員 Sarah Silverman 在內的其他人) 聲稱他們的作品的盜版被用於訓練 AI 模型。目前已有多起類似訴訟,針對不同的 AI 企業。

文件稱,Meta 決定從 Library Genesis (簡稱 "LibGen") 下載文檔來訓練其模型。LibGen 正面臨教科書出版商的訴訟,這些出版商認為它隨意託管和分發盜版作品,甚至接受捐款來資助其運營。

Kadrey 案件原告提交的文件顯示,Meta 在證據開示過程中提供的文件描述了公司內部關於訪問 LibGen 的爭論,對在辦公室使用 BitTorrent 的些許顧慮,以及最終上報給 "MZ" 並獲得批准使用這個有爭議的資源。文件指出,有關使用 LibGen 的證據是新發現的,是 Meta 在證據開示過程後期才提供的。

另一份文件聲稱,Meta 的一份文檔描述了如何刪除從 LibGen 下載的材料中的版權聲明,並暗示公司這樣做是因為意識到包含此類文本可能會導致模型的輸出顯示它是用受版權保護的材料訓練的。

Meta 提交的第三份文件則辯稱,原告無理地聲稱使用 LibGen 是新材料,並堅稱這些資訊已在記錄中存在數月之久。

此事的關鍵似乎是原告試圖利用 Meta 使用 LibGen 的資訊,根據《加利福尼亞州綜合電腦數據訪問和欺詐法案》提起訴訟。該法律規定,未經許可訪問電腦或網路並意圖欺詐或實施其他犯罪行為屬於犯罪。Meta 認為這項額外的訴訟理由不成立。

Meta 的文件包含一份聲明,稱公司"拒絕接受其'分發'了 LibGen 的說法",似乎是為了回應原告認為僅使用 BitTorrent 就意味著傳播盜版內容的論點。但我們沒有找到否認訪問 LibGen 的聲明。

Meta 試圖以商業敏感性為由要求封存我們上面鏈接的文件。但案件的法官駁回了這一請求,認為 Meta 只是想避免公眾關注。

美國地方法院法官 Vince Chhabria 還指出,在 Meta 想要封存的一份文件中,一名員工寫道:

"如果媒體報道暗示我們使用了已知是盜版的數據集(如 LibGen),這可能會削弱我們在這些問題上與監管機構的談判地位。"

考慮到 Meta 的商業模式建立在用戶貢獻的免費內容之上,這個使用 LibGen 的指控與其品牌形象非常吻合。為什麼要對那些討厭的作者另眼相看呢?

宅中地 - Facebook 分享 宅中地 - Twitter 分享 宅中地 - Whatsapp 分享 宅中地 - Line 分享
相關內容
Copyright ©2025 | 服務條款 | DMCA | 聯絡我們
宅中地 - 每日更新