Reddit起訴Perplexity稱其竊取網站數據用於AI訓練

Reddit已對Perplexity及其他公司提起訴訟，理由是這些公司竊取其網站數據。據悉，被竊取的資訊未經Reddit許可，擬用於AI訓練。

贊助商廣告

Reddit已針對Perplexity AI採取法律行動，指控其未經授權獲取用戶評論。此外，Reddit還將其他公司列為追責對象，其中包括部分Perplexity的客戶。該案件凸顯了一個更廣泛的行業問題：AI訓練數據的獲取方式。被告方表示，計劃「為用戶自由、公平獲取公共知識的權利堅決辯護」。

本周三，Reddit在紐約聯邦法院對Perplexity、Oxylabs UAB、AWMProxy及SerpApi提起訴訟。據報道，SerpApi是Perplexity的客戶之一。Reddit在聲明中闡明了這些平台成為追責目標的原因：

「數據抓取工具繞過技術防護竊取數據，再將其出售給急需訓練素材的客戶。Reddit之所以成為主要目標，是因為它是全球規模最大、內容最活躍的人類對話資料庫之一。」

被告方否認了Reddit的指控，而Perplexity在回應中稱自身立場是維護網路社區利益：

「我們的做法始終秉持原則且負責任，通過AI提供真實準確的答案;對於損害資訊開放性與公共利益的威脅，我們絕不姑息。」

與此同時，Oxylabs提出觀點：任何企業都不應掌控公共數據，並暗示那些掌控公共數據的企業，可能在以虛高價格出售數據。

據Reddit透露，部分公司通過繞過谷歌安全防護、利用搜尋引擎記錄的方式抓取其數據，這種行為被比作「就像無法進入金庫，轉而搶劫運輸車隊一樣」。目前，谷歌與OpenAI已與Reddit簽署協議，獲准獲取其資料庫用於AI訓練。據悉，谷歌為此每年需支付6000萬美元費用——儘管並非所有公司都能承擔這一成本。

今年6月，Reddit已出於類似原因對Anthropic提起過訴訟。