Reddit已對Perplexity及其他公司提起訴訟,理由是這些公司竊取其網站數據。據悉,被竊取的資訊未經Reddit許可,擬用於AI訓練。
Reddit已針對Perplexity AI採取法律行動,指控其未經授權獲取用戶評論。此外,Reddit還將其他公司列為追責對象,其中包括部分Perplexity的客戶。該案件凸顯了一個更廣泛的行業問題:AI訓練數據的獲取方式。被告方表示,計劃「為用戶自由、公平獲取公共知識的權利堅決辯護」。
 
本周三,Reddit在紐約聯邦法院對Perplexity、Oxylabs UAB、AWMProxy及SerpApi提起訴訟。據報道,SerpApi是Perplexity的客戶之一。Reddit在聲明中闡明了這些平台成為追責目標的原因:
「數據抓取工具繞過技術防護竊取數據,再將其出售給急需訓練素材的客戶。Reddit之所以成為主要目標,是因為它是全球規模最大、內容最活躍的人類對話資料庫之一。」
被告方否認了Reddit的指控,而Perplexity在回應中稱自身立場是維護網路社區利益:
「我們的做法始終秉持原則且負責任,通過AI提供真實準確的答案;對於損害資訊開放性與公共利益的威脅,我們絕不姑息。」
與此同時,Oxylabs提出觀點:任何企業都不應掌控公共數據,並暗示那些掌控公共數據的企業,可能在以虛高價格出售數據。
據Reddit透露,部分公司通過繞過谷歌安全防護、利用搜尋引擎記錄的方式抓取其數據,這種行為被比作「就像無法進入金庫,轉而搶劫運輸車隊一樣」。目前,谷歌與OpenAI已與Reddit簽署協議,獲准獲取其資料庫用於AI訓練。據悉,谷歌為此每年需支付6000萬美元費用——儘管並非所有公司都能承擔這一成本。
今年6月,Reddit已出於類似原因對Anthropic提起過訴訟。


 
             
             
                            




