清華大學與泉城實驗室聯手破解AI「千人一面」難題：當語言模型學會真正理解人類的多樣性

這項由清華大學數據科學與智能技術系及泉城實驗室聯合開展的研究，發表於2026年8月在韓國濟州島舉辦的第32屆ACM SIGKDD知識發現與數據挖掘大會（KDD '26），論文編號為DOI 10.1145/3770855.3817926，arXiv預印本編號為2603.16142。感興趣的讀者可通過上述編號查閱完整論文，代碼與數據已在GitHub公開。

贊助商廣告

**當AI開始扮演"普通人"，問題出現了**

假設你是一位民調機構的研究員，手頭有一個緊迫的任務：調查來自不同國家、不同文化背景、不同收入水平的數百萬人對某項政策的看法。按照傳統方式，你需要雇用調查員、設計問卷、挨家挨戶地收集數據——這個過程耗時數月，費用高達數百萬元，而且還得擔心受訪者給出"社會期待"式的虛假回答。

這就是為什麼越來越多的研究團隊開始把目光投向大型語言模型（也就是我們熟知的ChatGPT、文心一言這類AI）——讓AI扮演不同背景的人，替代真實的人類受訪者來回答社會調查問卷。理論上這個主意很美好：便宜、快速、可以無限複製。

然而，當研究人員真正開始嘗試時，他們發現了一個令人頭疼的問題。無論你告訴AI"你是一位50歲的巴西農民"還是"你是一位25歲的挪威大學生"，AI給出的回答往往出奇地相似，就像一個人穿了無數套不同的衣服，但說話方式、思維模式卻始終如一。來自清華大學與泉城實驗室的這支研究團隊，把這個現象命名為"多樣性崩塌"，並提出了一套名為"參數化社會身份注入"（PSII）的全新解決方案。

---

**一、AI"多樣性崩塌"：為什麼AI總是"千人一面"**

要理解這個問題，可以把AI的思考過程比作一條流水線上的加工廠。原材料（你輸入的問題和身份描述）從流水線的一端進入，經過三十幾道工序（也就是Transformer神經網路的"層"），最終在另一端輸出答案。

研究團隊做了一個很有意思的實驗：他們讓500個被設定了不同背景（性別、職業、收入、宗教等）的虛擬AI代理人回答同一批問題，然後追蹤這500個人的"內心想法"（也就是AI每一道工序結束後產生的隱藏狀態向量）在整個流水線上是如何演變的。

贊助商廣告

觀察的結果非常令人警醒。在流水線的早期階段，500個代理人的內心想法確實各有不同，就像500個形態各異的坯料。進入中間階段，差異甚至變得更加明顯，坯料之間的距離越來越遠。然而，一旦進入流水線的後期階段，一件詭異的事情發生了——這500個原本各不相同的坯料，開始神奇地向幾個固定形狀靠攏，最終擠成了幾堆密密麻麻的集合，彼此之間幾乎難以區分。

這就是"多樣性崩塌"的本質：AI在深層次的處理過程中，會系統性地抹平不同社會身份之間的差異，把一個巴西農民的思維和一個挪威學生的思維，都拉回到同一個"平均人"的軌道上。

為什麼會這樣？根源在於AI的訓練方式。當前的大型語言模型通常用"交叉熵損失"來訓練，簡單理解就是：模型被鼓勵儘可能預測最常見、最普遍的回答。這意味著少數群體的聲音、非主流的觀點，在訓練過程中天然處於劣勢，久而久之，模型就變得特別擅長表達"大多數人的平均想法"，而對少數群體的獨特立場則極度不敏感。

此外，即使研究者試圖通過在提示詞裡寫"你是一位50歲的巴西農民"來給AI貼上身份標籤，這種文字描述也只能影響流水線的早期階段。隨著AI一層一層地處理資訊，這個身份標籤的影響力會越來越弱，就像在一杯水裡滴了一滴墨水，隨著水被不斷稀釋，顏色也越來越淡，到最後幾乎消失不見。

---

**二、研究團隊的解題思路：與其"貼標籤"，不如"注射基因"**

既然文字描述的身份標籤會在AI處理過程中逐漸消散，研究團隊換了一個根本不同的策略——與其在流水線入口貼標籤，不如在流水線內部的關鍵節點直接注射"身份基因"。

這套策略的核心類比是：假設你想讓一塊麵團烤出不同的口感，普通的做法是在表面撒上不同的調料，但調料會在烘焙過程中蒸發消散。而研究團隊的做法，是直接在麵團的內部結構里揉入不同的成分——揉進橄欖油的麵團，無論經過多少道加工，都會保持那種獨特的質感，從裡到外都是如此。

贊助商廣告

這個方案被命名為"參數化社會身份注入"（PSII）。所謂"參數化"，是指他們把每一種社會身份特徵（比如"女性"、"高中學歷"、"信仰伊斯蘭教"）都轉換成一個具體的數字向量——可以理解為一組特定的"調音參數"，而"注入"則是指把這組參數直接插入AI內部某個關鍵處理節點，從那一刻起持續影響後續所有的處理過程。

整個系統由兩類核心"基因"構成。第一類叫做"人口統計學向量"，負責編碼性別、教育程度、婚姻狀況、職業、收入水平、宗教信仰等基本社會屬性。第二類叫做"價值取向向量"，負責編碼不同文化背景下的思維框架和世界觀——這是通過讓AI學習英語、中文、阿拉伯語、西班牙語、俄語這五種語言的大量文本來實現的，因為語言本身就攜帶著文化和價值觀的密碼。

---

**三、"身份基因"是怎樣製造出來的**

製造這些"身份基因"的過程，有點像製作一種特殊的染料。研究團隊先設計了40道與某個人口特徵高度相關的社會調查題目，比如針對"收入水平"這個特徵，就設計一批關於經濟政策、消費習慣、財務安全感的問題。然後，他們為每種可能的取值（比如低收入、中等收入、高收入）各寫5種不同措辭的角色扮演指令。

接著，他們把這些題目和指令兩兩組合，讓AI分別扮演不同收入水平的人來回答這些題目，並在AI處理每道題目時，把AI內部某一層的隱藏狀態向量記錄下來。"低收入者"在回答這批題目時，AI內部產生的平均狀態向量，與"所有收入水平者"在同樣題目下產生的平均狀態向量之差，就是"低收入者"的人口統計學向量。

這個差值向量的意義在於：它捕捉到了"低收入者"相對於"平均人"的獨特思維偏差。把這個向量注入AI的內部，就相當於把AI的認知基線從"平均人"拉向了"低收入者"的方向。

而價值取向向量的製造方式則更為巧妙。研究團隊讓AI學習不同語言的大量文本，但並不改變AI原有的任何參數，而是為每種語言單獨訓練一個輕量級的"附加向量"，優化目標是：在AI處理某種語言文本時，把這個向量加到最後一層的輸出上，能讓AI更準確地預測下一個詞。這個附加向量就學到了該語言文化圈特有的表達習慣和思維模式。

贊助商廣告

---

**四、把"基因"注射到哪裡：分層注射策略的學問**

確定了基因的內容之後，研究團隊面臨的下一個問題是：應該在流水線的哪個位置注射這些基因？

這個問題並不簡單，因為AI流水線的不同階段負責處理不同層次的資訊。研究團隊在Qwen2.5-7B模型上做了系統性實驗，把每種人口特徵分別注射到第1層到第28層的每個位置，觀察注射哪一層時對模擬結果的改善最大。

實驗結果揭示了一個規律：不同類型的身份特徵，在流水線的不同位置發揮作用效果最佳。負責"生活約束"類資訊的特徵，比如"是否與父母同住"、"是否是家庭主要收入來源"，最適合在流水線前段注射，因為這些資訊影響的是一個人的行為邊界和基本生活模式。反映"背景視角"的特徵，比如"宗教信仰"、"是否移民"，則在流水線中段注射效果最好，因為這些資訊塑造的是一個人理解世界的框架和參照系。至於最核心的社會身份特徵，比如"性別"、"婚姻狀況"、"教育程度"、"職業"、"社會階層"，則需要在流水線的後段注射，因為這些資訊直接影響一個人對具體問題的最終判斷和立場。

而價值取向向量（語言向量）則統一注射在流水線的最後一層，作為最終的文化錨點，給整個輸出再染上一層特定文化背景的色彩。

除此之外，研究團隊還在每次注射時加入了微量的隨機擾動——就像在染料里混入一點點隨機的顏色變化，使得同樣身份特徵的不同個體之間，也會產生細微的個體差異。這模擬了現實中同一群體內部成員之間的自然差異，避免了"所有50歲巴西農民都給出完全一樣答案"的機械化問題。這個擾動量的大小需要針對每個AI模型單獨校準：如果擾動太大，AI會開始說胡話；如果太小，則不足以產生足夠的個體差異。研究團隊設計了一套"模型敏感度"指標來自動確定最優的擾動量。

---

**五、在世界價值觀調查上的"大考"**

贊助商廣告

研究團隊選擇了"世界價值觀調查"（WVS）數據集來檢驗PSII的效果。這是一個覆蓋全球近百個國家、收集了97220名真實受訪者回答的大型社會調查，問題內容涵蓋個人信仰與生活態度、社會融合與信任感、政治參與與制度認同、經濟發展與科技態度四大類共259道題目。

實驗的邏輯很簡單：從97220名真實受訪者中隨機抽取100人，讓AI模擬這100個人回答全部259道問題，然後把AI的回答分布與真實人類的回答分布進行比較。比較的指標主要有兩個：一是KL散度（衡量AI分布與人類分布的偏差，越低越好）；二是熵偏差（衡量AI輸出的多樣程度與人類真實多樣程度之間的差距，越低越好）。

研究團隊將PSII與七種現有方法進行了對比。"直接問答"是最基礎的對照組，就是直接讓AI回答問題，不做任何干預。"高溫採樣"是一種通過提高AI的隨機性來增加輸出多樣度的技術手段，相當於讓AI"更隨機地猜測"。"多語言提示"是通過隨機切換提問語言來引入多樣性。"多樣性要求"是在提示詞裡直接寫上"請儘量給出多樣化的回答"。"提示工程"是把真實受訪者的人口統計資訊轉化為詳細的文字描述，作為AI的角色設定。"SimVBG"是一種通過為每個代理人編寫完整的人生背景故事來增強角色真實性的方法。"人格向量"則是另一種通過操控AI內部表示來控制角色特質的先前研究方法。

最終的成績單顯示，PSII在幾乎所有模型、所有題目類別上都取得了最優的綜合表現。以Llama-3.1-8B為例，使用直接問答時，AI與人類分布的KL散度為1.29，而使用PSII後下降到了0.40，降幅接近70%。與此同時，AI輸出的多樣性程度也與人類真實數據高度接近，熵偏差僅為0.004，而直接問答的熵偏差高達0.63。在經濟進步類問題上，PSII的表現尤為突出，而在信仰與生活類問題上，提升幅度相對小一些，這可能是因為信仰問題的個體差異更難通過人口統計特徵來捕捉。

贊助商廣告

在層級注射策略的具體驗證實驗中，研究團隊發現，把所有身份特徵同時注射在網路70%深度處，已經比絕大多數基線方法都要好，而採用分層精細注射策略後，效果進一步提升。隨機打亂注射層級會導致KL散度急劇惡化，這證明了分層策略不是隨意拍腦袋的設計，而是有據可查的有效選擇。

---

**六、拆解PSII：每個零件都不可或缺**

為了弄清楚PSII的哪些部分真正起到了關鍵作用，研究團隊做了一系列"拆零件"實驗：每次去掉一個組件，觀察整體性能如何變化。

去掉價值取向向量（語言向量）後，四個模型的KL散度平均上升了約10%~15%，說明文化語言背景對於模擬真實人類的觀點確實有不可忽視的貢獻。去掉人口統計學向量後，性能下降最為劇烈——KL散度幾乎翻倍，多樣性也大幅下滑，這說明人口統計學向量是整個系統的核心支柱，沒有它PSII就基本退化成了普通的提示工程。去掉提示詞層面的人口描述後，精度有所下降，但某些情況下多樣性反而略有提升，這揭示了一個微妙的權衡：文字描述的身份提示能幫助AI更準確地錨定目標分布，但也會在一定程度上壓縮AI的輸出空間，減少自發的多樣性。去掉隨機擾動噪聲後，多樣性受損最為嚴重，說明模擬群體內部的個體差異這件事，單靠身份向量本身是做不到的，必須輔以受控的隨機性。去掉分層注射策略（改為全部在70%深度注射）後，精度和多樣性均有所下滑，進一步驗證了分層策略的意義。

這些實驗的結論清晰地告訴我們：PSII的五個組件——人口統計學向量、價值取向向量、文字描述的提示詞、受控隨機擾動、分層注射策略——各自解決了不同層面的問題，缺一不可，彼此協同才能達到最優效果。

---

**七、AI內部的世界是什麼樣的：可視化實驗揭示的秘密**

研究團隊還做了一項非常直觀的可視化實驗。他們把500個模擬代理人在AI每一層處理結束後的內部狀態，投影到一個二維平面上，就像把高維空間裡密密麻麻的點雲，壓扁展示在一張紙上，讓我們能看到這500個代理人的"內心世界"在每一道工序後長什麼樣。

贊助商廣告

在基線方法（提示工程+多語言）下，可以清楚地看到"多樣性崩塌"的過程：早期層次，500個點散布在平面各處，分布還算分散；中間層次，點雲達到最大的分散程度；隨後，隨著層次加深，點雲迅速向幾個密集區域收縮，到了最後幾層，500個原本各有差異的代理人幾乎堆成了幾個沒有區別的團塊。

在使用PSII的情況下，畫面完全不同：點雲從始至終保持著相當的分散程度，甚至在最後幾層，分散程度反而有所增加，充分對抗了多樣性崩塌的趨勢。

研究團隊用一個叫做"k近鄰半徑"的指標來量化這種分散程度——簡單理解就是，平均來說，每個代理人的內心狀態距離它最近的鄰居有多遠，越遠說明代理人之間的差異越大。在Qwen2.5-7B模型的第28層，基線方法的分散度僅為2.44，而PSII達到了8.54；在最後一層（第32層），基線方法的分散度僅為1.73，PSII則達到了6.65。這個對比在Llama、Qwen-14B、Mistral等多個模型上均可重複驗證，充分說明PSII確實在AI的"內心世界"層面上產生了實質性的改變。

---

**八、這項研究的邊界：誠實地承認局限**

研究團隊在論文中相當坦誠地列出了自己方法的局限性。PSII能建模的身份特徵，目前仍局限於基本的人口統計學屬性和語言文化背景，對於更細膩的個性特質、動態變化的觀點立場、特定情境下的行為細節，現有方法還無法很好地捕捉。此外，如果某個群體在原始數據中本身就很稀少（比如某些小國家或特殊職業群體），由於樣本量不足，對應的人口統計學向量質量也會相應下降，進而影響該群體的模擬效果。

值得注意的是，研究團隊也認真討論了這項技術可能帶來的倫理風險。大規模模擬民意本身就是一把雙刃劍：用於社會科學研究、政策評估可以帶來巨大價值，但如果被濫用於製造虛假的輿論景觀或社會操控，則後果不堪設想。研究團隊明確強調，PSII僅適合在受控的學術研究環境中使用，不應直接用於現實決策，並呼籲相關機構建立訪問控制、透明度報告和使用審計等配套監督機制。

贊助商廣告

---

歸根結底，這項研究回答了一個看起來技術性很強、實則與每個人都息息相關的問題：當我們用AI來理解社會，AI是否能真正看見那些與"平均人"不同的聲音？

在傳統調查成本居高不下、數據收集越來越難的今天，AI模擬社會調查的需求會越來越迫切。但如果AI只會輸出千篇一律的"平均答案"，這種模擬就失去了意義——我們真正需要了解的，恰恰是那些不被平均數代表的人們在想什麼。PSII提供了一個有價值的技術方向：與其靠文字告訴AI"你是誰"，不如在AI處理問題的內部流程中，把身份的痕跡真正揉進去，讓它從骨子裡感受到那種差異。

這個思路本身也許不只適用於民調模擬，它揭示了一個更普遍的道理：在需要AI理解和呈現人類多樣性的任何場景中，僅僅在輸入端貼標籤是遠遠不夠的，真正的多樣性需要在AI的認知過程中得到持續的支撐和維護。這對於未來如何設計更公平、更具代表性的AI系統，或許能提供不少啟示。有興趣深入了解技術細節的讀者，可以通過DOI 10.1145/3770855.3817926查閱完整論文，或訪問arXiv編號2603.16142獲取預印本。

---

Q&A

Q1：參數化社會身份注入（PSII）和普通的角色扮演提示詞有什麼區別？

A：普通的角色扮演提示詞只在AI處理資訊的"入口"貼上身份標籤，這個標籤的影響力會隨著AI內部的逐層處理而不斷減弱，到最後幾乎消失。PSII則是把身份特徵轉化為具體的數字向量，直接插入AI內部某些關鍵處理節點，讓這種身份影響持續貫穿整個處理流程，不會在中途消散。

Q2：世界價值觀調查實驗中，PSII比傳統方法好多少？

A：以Llama-3.1-8B模型為例，直接問答方式的KL散度（衡量AI與真實人類回答的差距）為1.29，而使用PSII後降至0.40，下降幅度接近70%。在多樣性匹配方面，直接問答的熵偏差高達0.63，PSII則僅為0.004，幾乎與人類真實數據的多樣程度完全吻合。

Q3：PSII的"分層注射策略"是什麼意思，為什麼要分層？

贊助商廣告

A：AI的處理流水線不同階段負責不同層次的資訊處理：前期處理行為約束和生活結構類資訊，中期處理背景框架和視角類資訊，後期處理最終判斷和價值立場類資訊。PSII把不同類型的身份特徵注射到最能發揮其作用的對應層次，就像把不同的調料在烹飪的不同階段加入，比在任意一個固定時間點統一加入效果更好。實驗證明，隨機打亂注射層級會導致模擬效果大幅變差。