宅中地 - 每日更新
宅中地 - 每日更新

贊助商廣告

X

放開那個藝術家!Glaze保護藝術免受AI窺探

2023年03月24日 首頁 » 熱門科技

放開那個藝術家!Glaze保護藝術免受AI窺探

人類藝術家需要耗費大量時間和精力創作原創藝術品,但AI模型卻能以極快的速度完成同一項任務。這種詭異的不對稱性,正是芝加哥大學學術研究項目Glaze的基本出發點。項目小組剛剛為藝術家們推出一款免費(非商業)應用程序,希望利用先進的「偽裝」技術打擊AI對於「藝術智慧財產權」的盜竊行為。

該團隊還發表一篇研究論文,解釋了這款beta版應用的工作原理——能夠向每件藝術品添加幾乎難以察覺的「擾動」,藉此干擾AI模型讀取風格數據的能力,使其更難以模仿目標作品及創作者的藝術風格。不止於此,這些擾動元素還能誘導系統輸出與原始藝術作品相去甚遠的其他常見風格。

Glaze的實際保護效果因具體創作者而異,某些藝術風格確實更適合「偽裝」、進而免受AI模型的窺探。此外,其他因素(如某些反制措施)也會影響其性能。總之,這款工具希望幫助藝術家們反抗數據挖掘者的入侵,讓大家既能在網上公開自己的作品,又保證自己辛勤摸索出的藝術風格不致被迅速吞噬。

放開那個藝術家!Glaze保護藝術免受AI窺探

作為該項目的教職帶頭人,芝加哥大學電腦科學教授Ben Zhao在採訪中解釋了這款工具的工作原理:

「我們所做的,就是嘗試理解AI模型如何以它的方式看待藝術風格。之後我們以這個維度為基礎,努力扭曲模型對於特定風格的認定結果。所以與其說我們是在隱藏或者阻止某些特徵資訊,倒不如說我們是在學習機器學習模型的語言,並用這種語言來扭曲模型對藝術圖像的看法,同時又儘量不影響人類的正常觀看。事實證明,AI模型與人類審視畫作的角度截然不同,我們完全可以在機器學習視角上實現顯著扭曲,但又不在人類視角上造成易於察覺的變動。」

「很明顯,AI感知世界的方式與人類存在根本差異,人們早就意識到了這種差異的存在。這種差異很難被輕易消除或迴避,所以我們才嘗試用『對抗性示例』來對抗機器學習。最近十年來,人們一直在努力解決這種對抗,但卻收效甚微。從目前的情況看,人類對現實世界的視覺觀察與AI模型對現實世界的數學觀察之間,似乎不可避免地存在差異。所以用純技術術語來講,我們採取的加擾方法其實是一種攻擊、而非防禦,但它起到的確實是防禦作用。」

另一個需要認真考慮的因素,就是人類創作者(也就是藝術家)的個體需求與AI模型間的不對等性。這些創作者往往以藝術創作為生,而生成式AI模型背後的商業參與者則是吸引了大量風險投資和個人數據的成熟機構,他們的目標就是讓機器獲得自動化(更直白地講,取代)人類創造力的能力。單就生成式AI藝術模型來講,這項技術確實通過自動模仿藝術風格威脅到了藝術家們的生計。

Stable Diffusion和Midjourney等生成式AI藝術工具的用戶無需掌握任何繪畫技巧,就能生成看起來相當合理(至少完全可以唬住外行)的圖像。只需要輸入幾個單詞來描述需要的內容,這些軟體就能快速生成圖像,甚至可以按用戶提示模仿特定藝術家的創作風格。整個輸出過程極快、視覺效果也相當獨特,反襯出這項技術的成熟和強大。

然而,生成式AI模型開發商一般並未獲得在公共網際網路上搜索數據以訓練模型的許可。在生態鏈的另一端,藝術家們仍然在開放平台上展示自己的作品,希望藉此提升技能、擴大個人的行業影響力。但正是這種常見的創意服務運作方式,讓大量作品被AI模型當成了訓練數據。就在生成式AI不斷藉此強化自身的同時,並沒有人打算問問受到影響的藝術家們到底願不願意。

在個別情況下,藝術家甚至發現自己的名字可以被直接作為提示詞,指示AI模型生成與其風格相近的圖像——同樣無需任何預先許可(也沒有相應的收入補償)。這可以說是赤裸裸的創意盜竊行為(但相信此類訴求很快就會得到司法部門的支持)。

由於法律法規嚴重落後於AI的發展速度,目前的權利與義務呈現出嚴重的失衡狀態。Glaze團隊的研究人員就是想解決這個問題——為藝術家們提供一款免費工具,藉此保護他們的工作和創造力不被AI模型簡單粗暴地拿去使用;同時也為立法者爭取更多時間,容他們思考如何調整現有規則和保護措施(例如版權條款)來跟上時代的腳步。

可遷移性與有效性

根據Zhao的介紹,因為各種系統在同一類型的基礎任務訓練中有著大量相似之處,所以Glaze能夠在一系列生成式AI模型中對抗風格訓練。Zhao認為,這跟機器學習領域的「可遷移性」概念基本一致。

「雖然我們還無法接觸當前所有生成式AI藝術模型,但這類模型之間已經表現出充分的可遷移性。我們能把加擾效果傳遞給無法觸及的其他模型。當然,實際效果不會非常完美,畢竟可遷移性本身也不完美。但事實證明,沒必要追求這種完美,風格遷移的效果已經足夠扭轉目前糟糕的行業風氣。我們不需要設置明確的邊界,而是把它視為一個高度連續的空間。這樣只要構建起一個具備風格偽裝效果的版本,在大多數情況下就可以將它遷移至其他沒有優化過的不同模型,保證對其他模型也產生類似的影響效果。」

Zhao還提到,具體藝術風格可能會對Glaze的功效產生很大影響,因為某些藝術風格確實特別難以保護。其本質在於,此類藝術風格給加擾技術留下的操作空間比較小——例如,他認為極簡主義/乾淨/純色風格的作品,在加擾效果上就不及視覺元素更豐富的作品。

「有些類型的藝術作品受風格所限,真的很難加以保護。大家可以想像一幅建築草圖,其中的線條既乾淨又非常精確,再加上大塊大塊的白色背景——這樣的風格我們就很難加擾,因為裡面可以用來操作的空間太小了。這類圖像要麼是空白、要麼是實線,幾乎沒有什麼過渡部分。所以對於這樣的藝術品來說,保護的難度肯定會更大,效果也會更差。但對於那些包含大量紋理、色彩和背景的油畫來說,情況就簡單多了。我們可以引入更高的加擾強度,而且幾乎不用擔心會影響到藝術品的肉眼觀看效果。」

那麼,Glaze處理過的藝術品跟原始作品之間到底有多少視覺差異?其實從成果來看,還是能感受到工具對圖像的加噪操作:團隊研究論文列出了以下樣本,展示了原始藝術品與Glaze處理後藝術品間的差異——後者明顯有某些部分更加模糊。但研究團隊覺得目前的差別已經相對有限,普通觀眾應該不會注意到這點細微區別(畢竟他們能看到的只有處理後的版本,而非「前後比較」)。

放開那個藝術家!Glaze保護藝術免受AI窺探

眼尖的藝術家自己肯定能發現這種細微變化,但付出這麼一點犧牲來換取風格保護應該也是物有所值——畢竟這樣既能讓藝術品繼續為受眾欣賞,也不必擔心成果被AI巨頭們據為己有。該研究小組一直在對藝術家群體開展調查,希望了解他們對AI藝術創作的整體看法以及Glaze的保護功效。

「我們正努力幫助藝術家們解決現實難題,希望讓他們能安心通過網路發布、推廣和宣傳自己的作品。特別是那些獨立藝術家,在AI生成模型的威脅下,他們已經不敢通過這些方式賺取佣金,日常生計也因此受到影響。現在他們切實感常見自己更加安全,AI對其藝術風格的模仿難度也越來越高,也就是說我們成功踐行了自己的承諾。對於我們接觸過的大部分藝術家來說,他們可以隨意使用這款工具、更好地推廣自己的作品,同時避免自己的風格被AI輕鬆模仿。雖然不敢說徹底解決了問題,但Glaze也在很大程度上緩解了他們的生存危機。」

一項新的關鍵指標:模仿度

但真的是「亡羊補牢、為時未晚」嗎?AI模型已經吸納了大量作品和藝術風格,相關創作者的權益已然遭受了損害。對此,Zhao倒是比較樂觀,認為大部分藝術家一直在不斷創作和推廣新作品。當然,AI模型自身也不會停滯不前,將長期保持訓練。在他看來,後續公開更多偽裝藝術品,將有望改變生成式AI模型對於特定藝術家風格的認知結論,進而改變之前學習到的特徵和基準。

「只要藝術家們開始使用像Glaze這類工具,那麼隨著時間推移,就一定會產生重大影響。不僅如此,使用這類工具還有額外的好處……藝術風格本身其實是有連續性的,所以不存在至少要保護大部分圖像才能達到預期效果這樣的說法。」

「就算是只有少部分圖像經過Glaze處理,在它們被納入訓練數據集之後,也會對AI模型的輸出產生一定程度的影響。所以可以肯定,AI模型將更多受保護作品納入訓練數據,模型生成的風格就會與原始作品相去更遠。而且即使只處理其中一小部分,這種影響仍然存在——只是相對稍弱。總之,Glaze技術絕不是非此即彼的二元工具,而是具備線性增益的有效保護方案。」

「我傾向於把它想像成一個三維空間,目前AI模型對於特定藝術家——比如畢加索——的理解就處於某個特定位置。隨著關於畢加索風格的受保護訓練數據逐漸湧入,AI模型就會把對畢加索風格的理解推向某個新位置。它吸納的素材越多,朝著該位置行進得就越遠,直到某個時候徹底偏離對原作風格的理解,以至於無法繼續生成任何跟畢加索聯繫得上的視覺成果。」這,也許就是AI對於藝術風格的認知模式。

這裡我們再考慮加一個有趣的元素,即Glaze如何選擇錯誤的風格來投餵AI——也就是如何選擇特定風格來對抗AI對藝術的自動模仿。這當然也需要做倫理層面的考量,畢竟如果這種方式真的可行,那麼未來肯定會出現更多人工注入手段,旨在把AI模型的理解方向重新恢復回正軌。

這個問題的答案並不複雜——Glaze會使用「廣為人知」的風格(例如「梵谷」式風格)來實現Zhao提到的「目標風格」,依靠技術明確改變AI的模仿傾向。

他強調,這款應用會努力將目標輸出設定為與原始作品截然不同,藉此切實保護藝術家權益。換句話說,寫實派畫家的作品在經過偽裝處理後可能輸出一些非常抽象的內容,保證結果跟原作根本沾不上邊。有趣的是,論文提到受訪藝術家們普遍認為,最終生成的模仿作品質量越差,就代表Glaze起到的保護效果就越好。

「我們也並不指望模型能把對於特定藝術家的風格理解得完全偏離軌道,就是說沒必要把現有風格完全轉化成其他風格。相反,只要能產生某種混合體,足以跟原作區分開來即可。因此我們希望找到一些既為公眾所熟知,又跟任何一位特定藝術家有所區別的風格。總之,只要能產生足夠明確的區分,也就可以了。」

「所以我們的軟體會在運行當中分析藝術家提供的藝術作品,粗略估算藝術家在當前風格表徵空間中的位置,再分配一種顯著不同的風格作為偏離目標,努力將AI模型引導過去。」

反制措施

該團隊的論文,還討論了AI模型開發者可能採取的一些反制措施,包括用圖像轉換來迴避加擾操作(在訓練前增強圖像內容以抵消加擾),還有穩健訓練(通過在正確輸出的同時引入某些偽裝圖像來增強訓練數據,確保AI模型能夠適應偽裝數據的影響)。

在這兩種情況下,研究人員發現反制措施並沒能破壞Glaze所實現的「藝術家認可保護」(ARP)這項成功指標(但論文也指出,穩健訓練技術確實會降低偽裝有有效性)。

在討論反制措施帶來的風險時,Zhao承認這可能在保護性偽裝與AI模型開發商的消除保護舉措、攫取有價值資訊之間掀起一輪軍備競賽。但他仍然信心滿滿,認定Glaze將產生積極的保護效果——至少能在一段時間內為藝術家爭取主動權,藉機遊說以建立相關法規,用以對抗貪婪的AI模型。例如通過這類工具提高受保護數據的破解成本,打消AI模型開發商免費利用的念頭。

「在機器學習領域,攻擊的難度總是遠遠低於防禦……在我們的案例中,這種加擾行為其實類似於傳統意義上對模型內部的數據投毒攻擊。而且總會有人想出更強大的反制措施,抵消掉Glaze帶來的保護效力,只是我不知道這到底需要多長時間。以往,研究領域一般需要一年或更長的時間才能建立起反制措施。考慮到Glaze本身確實是種富有成效的攻擊手段,所以我們應該還有空間進一步找到能夠反制『反Glaze措施』的辦法。」

「很多人可能覺得這就是場無休止的『貓鼠遊戲』。這種說法有一定道理,但我們希望把每一輪反制措施的疊代周期拉長一些。更重要的是,要確保任何針對Glaze的反制措施都成本高昂,這樣才能阻止其被大規模利用。因為對絕大多數藝術家來說,只要能把破壞這種保護體系的成本拉高一些,那攻擊者其實是不值得對他們的每幅作品進行單獨計算、構建更乾淨的圖像,藉此來模仿其藝術風格的。」

「這就是我們的目標所在——把標準儘可能拉高,讓藝術模仿者知難而退、轉而去做其他更有利可圖的事情。」

但即使成本提升,對於那些受到熱捧的藝術家來說,資金雄厚的AI巨頭可能仍然願意砸下重金模仿他們的創作風格。畢竟這幫企業掌握著極為豐富的資源,完全可以榨取出哪些一絲絲潛在的價值。但這至少會讓小作坊級別的模仿者望而卻步,因為Zhao認為「他們不太可能承受得起迴避Glaze所需要的巨大算力。」

「如果我們哪怕是在一定程度上緩解了這種對熱門藝術風格的模仿,都算是起到了非常積極的作用。」

而且對現金充裕的AI巨頭來說,哪怕資金成本不是問題,維持良好的聲譽也非常重要。如果他們真的出手破解藝術家們用來保護作品的技術,那「只抓取公開可用數據」的藉口將瞬間變得蒼白無力,相當於是豎起了一面「我們在盜取藝術成果」的大旗。

Zhao強調稱,「在這種情況下,無論是出於倫理還是道德,大多數人都能做出明確的判斷。一旦AI針對個別藝術家在未經許可和授權的前提下,帶著主觀意願去故意模仿其風格,這將成為明顯的道德污點和決策失誤。這對我們這一方其實相當有利。也就是說,任何反制措施都會天然站在不道德的一邊。這應該能夠阻止科技巨頭和某些大型企業走上這條道路,甚至促使他們也加入到保護個人創作的陣營中來。」

在他看來,Glaze給藝術家們提供的任何一點喘息之機「都很寶貴」,也讓社會能夠認真審視接下來的版權法規該如何設計。「包括我們該如何理解網路內容,該為網路內容設置怎樣的權限,以及如何處理通過網際網路傳播的模型等。不只是智慧財產權、不只是版權,一切都該得到重新審視。」

版權濫用

談到對可疑行為的監管時,Zhao強調稱某些生成式AI模型開發商曾經貪婪地吞噬各類創意數據,並認為他們的成果「明顯」就是這種惡劣行徑的產物。換言之,他們都在爭分奪秒地「掠奪」那些「或多或少應受版權保護的數據」,並至少在某些情況下「通過非營利組織的代理人」幫他們幹這些「髒活」。是的,一定要通過非營利組織這個中介,否則營利性組織直接下場搶數據會很快激發抗議。

他雖然沒有指名道姓,但2015年成立的OpenAI(ChatGPT生成式AI聊天機器人的開發商)在2019年轉向「利潤上限」模式之前,一直披著開放式非營利組織的外衣。最近他們終於露出赤裸裸的商業嘴臉,瘋狂利用技術成就掀起的炒作高潮——例如拒絕公布模型訓練所使用的數據細節(看來OpenAI已經不再Open)。

甚至連OpenAI的早期投資者、億萬富翁伊隆·馬斯克在最近的推文中,也質疑了這種模式轉換是否合法。

生成式AI領域的其他商業參與者顯然也在探索這條路線,想通過支持非營利性AI研究迴避監管壓力。

「所以我們才會陷入如今的困境。有相當明確的證據證明他們在濫用版權,侵犯了所有藝術家的版權。至於該如何制定追索權,我還不太確定。我不知道該不該把這些模型直接摧毀,或者說回滾到之前的某個狀態。這聽起來有點不切實際,但展望未來,我至少希望能有相關法規來約束這些模型的設計方式,以確保微軟、OpenAI或者是Stability AI之流能受到一點控制。」

「現在人們對道德問題的關注太少了。大家都狂熱了起來,想知道AI還能做出什麼大事。每個人,包括媒體和用戶,似乎都直接接受了AI帶來的突破性成果,卻忘記了它的學習過程其實就是踐踏很多人權益的過程。」

說起未來的計劃,我們詢問Zhao可不可能開發出一套能保護個人寫作風格的偽裝技術。畢竟寫作是跟繪畫類似的創造性領域,生成式AI在這裡同樣攪了個天翻地覆。OpenAI的ChatGPT這類工具能在短短几秒鐘、至多幾分鐘裡,輸出各種基本文本提示的作品——包括詩歌、散文、劇本乃至歌詞等。用戶甚至可以要求ChatGPT仿照某些知名作家的文風生成內容,儘管最終效果還比較拙劣。

生成式AI對作家群體構成的威脅,可能不像對視覺藝術家那樣直接和粗暴。但按狂熱者們的說法,這些模型只會變得越來越好、越來越強,所以這種威脅恐怕只是時間問題。另外,AI單在生產效率層面就贏麻了,畢竟自動化雖然很難產出最好的文本,但至少從產出速度的角度看沒有任何人類能夠與之匹敵。

Zhao提到,他們的研究小組正與來自不同領域的創意人士和藝術家交流,並發現配音演員、作家、記者、音樂家甚至是舞蹈編導也都有著類似的擔憂。而且跟藝術創作相比,風格模仿真的是個更複雜、也更可怕的命題。

「跟我們交流過的創意工作者,都很關心AI會不會竊取他們的風格、模仿他們在各自領域的創造性貢獻,然後抄個大概齊。總體來看,AI在不同領域對人類創意能力的取代有著很大差異。某些情況下,AI確實更善於捕捉並提取出人類創造力特徵,但在其他場景下則表現不佳。」

「寫作也是個重點。目前的AI還很難以鮮明的文風模仿一個人的寫作特點。它會嘗試模仿海明威、模仿喬叟,或者模仿莎士比亞。但我們還是很難根據一段文字就立刻認出這是喬叟或者海明威寫的。所以我覺得AI在寫作領域的威脅還不是特別強烈。但我們也在努力了解不同領域所面臨的威脅是什麼樣子。總之,我們會儘可能做點事情,看看能不能開發工具來幫助各個領域的創意工作者。」

值得注意的是,Zhao帶領的研究小組一直在探索「欺騙AI」這個課題。三年之前,該小組就開發出一種反制人臉識別的工具,名叫Fawkes。它能通過數據(自拍畫面)偽裝對抗那些識別人臉生物特徵的AI軟體。

現在,隨著Glaze的出現,研究小組希望能有更多研究人員受到啟發,加入到構建技術、捍衛人類創造力的行動中來。沒錯,我們應當抵制盲目而狂熱的自動化,認真考慮其中的危害和毫無意義的模仿。由AI生成的聲音和情緒哪怕再熾烈,也毫無意義。

Zhao最後建議稱,「我們希望能繼續為此努力,比如打造出比Glaze更好的成果,有力對抗未來可能出現的反制措施。這也是我們項目目標的重要一部分——我們呼籲大家關注這個問題,重視這類技術和研究工作,儘可能為參與者提供幫助。我們也要關注那些因為聲量不大,而無法在技術環境下發表自己觀點的群體。因此,我們希望整個研究界能更多關注這個由藝術家和創意人士組成的多元化社區,只有這樣這場旗幟鮮明的抗爭才會取得成功。」

宅中地 - Facebook 分享 宅中地 - Twitter 分享 宅中地 - Whatsapp 分享 宅中地 - Line 分享
相關內容
Copyright ©2025 | 服務條款 | DMCA | 聯絡我們
宅中地 - 每日更新