訓練大型語言模型所使用的數據很多都沒有公開,引來版權方面的爭議,最近加拿大多家主流媒體就對OpenAI提出訴訟,指控該公司「不當且非法」使用其新聞內容訓練GPT模型。
這次控告由《National Post》、《Toronto Star》、《The Globe and Mail》、Canadian Press和加拿大廣播公司 (CBC) 等媒體共同發起,《National Post》母公司Postmedia在聲明中表示:「OpenAI聲稱為公眾利益使用他人智慧財產權進行商業牟利是錯誤的。新聞報道是為了公眾利益,而OpenAI利用他人的新聞內容謀取商業利益則是非法行為。」訴訟要求OpenAI為每篇被使用的文章賠償最高2萬加幣,總額可能達數十億美元。
這次也並非首次有媒體與OpenAI的法律衝突。美國《ew York Times》等多家媒體已提起類似訴訟。不過另一方面也有媒體機構選擇與OpenAI合作,例如美聯社、Axel Springer和Vox Media等都已簽署內容授權協議。對此,OpenAI發言人表示,他們一直與新聞出版商密切合作,包括在ChatGPT搜索功能中顯示,標註和連接他們的內容,並提供機制保護不希望被引用的內容。