OpenAI開發的人工智慧聊天機器人ChatGPT最近在社會引起熱話,雖然有大批用戶支持,但同時也引發爭議,受到很多人批評和質疑。有媒體開始測試用ChatGPT寫新聞的可行性,但也有媒體擔心自己飯碗會被人工智慧機器人搶走。《華爾街日報》和CNN等主要新聞機構就炮轟OpenAI,稱OpenAI實驗室在沒有付費的情況下盜用他們的文章,以訓練ChatGPT。
事緣本月15日,曾任《華爾街日報》記者的Francesco Marconi在Twitter發文指,他曾問及ChatGPT以什麼新聞來源進行訓練,並要求它提供資料庫中的頂級新聞來源清單。ChatGPT回復有高達20家主流媒體在列,包括路透社、紐約時報、衛報、BBC、CNN、華盛頓郵報及彭博社等。
Francesco Marconi指,ChatGPT的人工智慧由大量高品質的新聞來源訓練,但不清楚OpenAI和這些傳媒機構有什麼協議。倘若OpenAI在未經傳媒同意下擅自提取數據,有違服務條款。
ChatGPT is trained on a large amount of news data from top sources that fuel its AI. It’s unclear whether OpenAI has agreements with all of these publishers. Scraping data without permission would break the publishers』 terms of service.pic.twitter.com/RXEjMHWXiI— Francesco Marconi (@fpmarconi)February 15, 2023
美國新聞集團(News Corp)旗下道瓊斯公司(Dow Jones)執行副總裁及總法律顧問Jason Conti在給予Bloomberg的聲明稿中稱:「任何想利用《華爾街日報》報道訓練人工智慧的人,事前都應該向道瓊斯公司取得相關授權,但道瓊斯公司並沒有和OpenAI完成任何協議。公司對有人濫用我們記者的文章一事十分認真,現在已著手展開調查。」Bloomberg已就事件向OpenAI查詢,OpenAI對此尚未作出回應。
據外媒引述知情人士透露,CNN也認為OpenAI濫用他們的文章去訓練ChatGPT,有違新聞網站服務條款。CNN打算與OpenAI洽談,向OpenAI收取盜用內容授權費。
除了新聞機構外,今年1月也有一群藝術家集體控告Stability AI、Midjourney和DeviantArt等AI繪圖工具,指控這些AI繪圖工具在未獲授權下,濫用數十億張受版權保護的圖片,用於訓練AI。
數據源:Bloomberg