微軟聯合高校推出深度偽造檢測數據集，助力生成式AI內容鑑別

隨著AI生成內容在網路上的大量湧現，幫助公眾識別圖像、音頻或影片真偽的工作變得愈發困難，也愈發重要。為應對這一挑戰，來自微軟、美國西北大學以及非營利組織Witness的研究人員攜手合作，共同構建了一個全新的AI生成媒體數據集，旨在幫助開發更加強健的深度偽造檢測系統。Witness長期致力於協助活動人士和記者應對AI生成內容帶來的各類挑戰。

贊助商廣告

研究團隊將這一新數據集命名為微軟-西北大學-Witness深度偽造檢測基準（MNW），相關研究成果已於4月10日發表在IEEE Intelligent Systems期刊上。該數據集在構建時刻意納入了多樣化的AI生成媒體樣本，以儘可能真實地反映當前生成式AI的發展全貌。

微軟首席研究科學家Thomas Roca專注於生成式AI安全領域的研究。他指出，生成式AI所產出的媒體質量正在持續提升，如今幾乎任何人只需藉助手機上的一款應用，便能生成模仿他人聲音的語音消息，或偽造他人外貌的圖像與影片。

此類虛假媒體所造成的危害十分深遠，涵蓋身份欺詐、詐騙，乃至生成未經當事人同意的私密影像，甚至兒童性虐待材料。

然而，AI生成工具並非無懈可擊。在生成影片、圖像或音頻時，它們會留下所謂的"痕跡"——一些細微的信號或印記，可作為內容造假的佐證。"這些痕跡可能包括噪聲分布異常、像素塊之間的不一致性、音頻信號中的斷裂，以及其他各類不規則現象。"Roca說道。

當前檢測面臨的挑戰

全球各地的研究團隊一直在開發檢測器，其本質上是經過訓練、能夠識別AI生成媒體中痕跡的AI模型。然而，這場檢測與生成之間的軍備競賽中，生成工具始終占據上風。

"影片、圖像和音頻的真實性認定對社會來說至關重要，但現有檢測系統尚未能勝任這一挑戰。"Roca表示，"我們認為，這在一定程度上源於這些系統的評估方式存在問題。"

舉例而言，研究人員可能會使用來自少數幾個生成器的大量AI內容樣本來訓練檢測器，但這樣的檢測器往往難以有效應對新生成的內容。生成式AI的疊代速度極快，這一問題因此愈發突出。

贊助商廣告

正因如此，這些檢測系統在面對訓練數據集或成熟基準測試時表現尚可，但在真實環境中卻往往差強人意。"實驗室里的AI不等於現實世界中的AI。"Roca如是說。

MNW基準的構建思路

為了更全面地應對上述挑戰，微軟、西北大學和Witness的專家聯合開發了MNW基準。"這三方視角——學術界、產業界與面向實地的非營利組織——共同構成了一套更完整的方法論。單憑任何一方，都無法獨立完成這項工作。"西北大學博士後研究員Marco Postiglione說道。

該數據集旨在匯集來自不同生成器的多樣化AI生成素材，以提升檢測器在真實場景中的適用性。

Postiglione指出，網路上的虛假影片、音頻和圖像通常已經過後處理操作，例如調整尺寸、裁剪和壓縮。此外，也有人會刻意對內容進行處理，使其更難被檢測到。

MNW團隊致力於提供涵蓋不同生成器、經歷不同後處理操作的最全面樣本集，以確保該數據集能夠充分代表當前生成式AI的整體面貌。團隊還計劃每年春秋兩季對數據集進行更新，以體現最新的生成器痕跡特徵，以及試圖規避檢測系統的各類新手段。

研究人員也坦承，儘管該數據集的初衷是幫助開發者對其檢測器進行基準測試，但不排除有人將其用於探索規避檢測的新方法。儘管如此，他們仍認為應對深度偽造內容是當務之急。

"MNW的目標是為這項共同努力貢獻力量——提升行業標準，推動透明度，並確保隨著生成式AI的持續發展，我們評估內容真實性的能力也能同步跟上。"Roca說道。

Q&A

Q1：MNW深度偽造檢測基準數據集是什麼？有什麼特別之處？

A：MNW是由微軟、西北大學和非營利組織Witness聯合構建的深度偽造檢測基準數據集，全稱為Microsoft-Northwestern-Witness。它的特別之處在於納入了來自多種生成器的多樣化AI媒體樣本，並涵蓋了調整尺寸、裁剪、壓縮等各類後處理操作的內容，更貼近真實網路環境。此外，團隊每年春秋兩季更新數據集，以緊跟最新生成器技術的發展。

贊助商廣告

Q2：現有的深度偽造檢測系統為什麼在現實中表現不佳？

A：主要原因在於訓練數據來源單一，研究人員通常只用少數幾個生成器的樣本來訓練檢測器，導致模型泛化能力不足，難以應對來自新生成器或經過後處理的內容。加之生成式AI疊代速度極快，檢測系統的更新跟不上生成工具的進化節奏，使得在實驗室環境中表現良好的系統在真實場景下往往力不從心。

Q3：AI生成內容中的"痕跡"具體指什麼？

A：痕跡是指AI在生成圖像、影片或音頻時無意間留下的細微異常特徵，可作為判斷內容為AI生成的依據。這些痕跡包括：圖像中的噪聲分布異常、像素塊之間存在不一致性、音頻信號出現斷裂或間隙，以及其他各類難以被肉眼察覺的不規則現象。檢測器正是通過學習識別這些痕跡來判斷媒體內容的真偽。