宅中地 - 每日更新
宅中地 - 每日更新

贊助商廣告

X

阿聯研究團隊打造AI「讀心術」:從照片和文字中破解人格密碼

2025年09月26日 首頁 » 熱門科技

你是否曾經看著某個人的照片,就能直覺地感受到這個人的性格特徵?或者從某人的說話方式中,隱約察覺到他們的內在品質?這種看似神秘的能力,現在被來自阿聯的科學家們用人工智慧技術實現了。這項由阿聯穆罕默德·本·扎耶德人工智慧大學的研究團隊發表於2025年1月的研究,首次創建了能夠同時分析面部特徵、個人背景和AI生成的行為特徵描述的大型資料庫。有興趣深入了解的讀者可以通過論文標題"PersonaX: Multimodal Datasets with LLM-Inferred Behavior Traits"在學術資料庫中找到完整研究。

這項突破性研究就像是給AI裝上了一雙"慧眼",讓機器能夠像人類心理學家一樣,通過觀察外在表現來推斷內在性格。研究團隊由Li Loka和Wong Yu Kang等多位來自不同機構的專家組成,他們來自阿聯穆罕默德·本·扎耶德人工智慧大學、美國卡內基梅隆大學、加州大學聖地亞哥分校以及澳大利亞國立大學。這個國際化的團隊就像是一支由不同專業背景組成的"性格偵探隊",每個成員都帶來了獨特的專業技能。

研究的核心創新在於創建了兩個前所未有的資料庫:一個包含9444名知名人士的CelebPersona數據集,另一個包含4181名職業運動員的AthlePersona數據集。這就好比建立了兩個巨大的"性格檔案庫",每個檔案都包含三個關鍵資訊:這個人的照片、基本背景資料,以及由三個不同的AI語言模型分析得出的性格特徵描述。

為了確保分析的準確性,研究團隊採用了"三重保險"的策略。他們讓ChatGPT、Gemini和Llama這三個頂級AI模型同時對每個人進行性格分析,然後將結果進行綜合比較。這就像是請三位不同的心理學專家同時為同一個人做性格測試,最後取他們意見的交集作為最終結論。這種做法大大提高了分析結果的可靠性。

更令人驚訝的是,研究團隊還開發了一套全新的分析框架,能夠從兩個不同層面來理解人格特徵。第一個層面就像是傳統的統計學方法,通過大量數據找規律。第二個層面則更加高級,它能夠發現不同資訊之間的因果關係,就像是能看透表面現象找到深層原因的"透視鏡"。

一、數據收集:打造史上最全面的性格資料庫

想要讓AI學會"讀心術",首先需要大量的訓練素材。研究團隊面臨的挑戰就像是要建造一座圖書館,但這座圖書館收藏的不是普通書籍,而是數萬人的"性格檔案"。

團隊選擇了兩個截然不同的群體作為研究對象。第一個群體是娛樂界和各行各業的知名人士,包括演員、歌手、商界領袖等9444個人。第二個群體是職業體育界的精英運動員,涵蓋籃球、足球、網球、高爾夫等七個主要聯盟的4181名男性運動員。選擇這兩個群體的原因很實際:他們都是公眾人物,有足夠多的公開資訊供AI學習分析。

對於每個人,研究團隊都收集了三類資訊。第一類是基本的生物統計資訊,包括出生日期、身高體重、國籍等,就像是身份證上的基本資料。第二類是面部照片,這些照片會被轉換成1024維的數字特徵向量,相當於用數字來描述一個人的面部特徵。第三類是最關鍵的性格分析,這部分完全由AI來完成。

為了確保AI分析的質量,研究團隊進行了一場"AI選秀大賽"。他們測試了10個不同的大語言模型,包括我們熟悉的ChatGPT、Gemini、Llama等。測試標準包括生成速度、準確率、一致性等8個方面。最終,ChatGPT-4o、Gemini-2.5-Pro和Llama-4-Maverick這三個模型脫穎而出,成為了"性格分析三劍客"。

每個AI模型都會根據收集到的公開資訊,對每個人進行詳細的性格分析。這個分析過程就像是讓AI扮演心理學家的角色,根據一個人的公開言論、行為表現、職業選擇等資訊,來推斷這個人在開放性、責任心、外向性、親和性和神經質這五個維度上的特徵。每個維度都會得到一個從0到3的評分,0表示資訊不足,1表示該特徵不明顯,2表示中性,3表示該特徵很明顯。

為了保護隱私,研究團隊採取了嚴格的數據處理措施。所有的原始照片和文字描述都被轉換成數字向量,並進行了額外的加密處理,確保無法逆向還原出原始資訊。這就像是把所有的個人資訊都裝進了一個密碼箱,只保留分析所需的數字特徵。

二、AI模型選擇:尋找最可靠的"性格分析師"

選擇合適的AI模型來進行性格分析,就像是在眾多心理學家中挑選最可靠的專家。研究團隊設計了一套嚴格的評估體系,從多個角度考察每個AI模型的表現。

生成速度是第一個考量因素。在實際應用中,沒有人願意等待幾分鐘才得到一個性格分析結果。團隊測試發現,不同模型的速度差異巨大,最快的只需要2-4秒,最慢的則需要40秒左右。ChatGPT和Gemini在速度方面表現優異,而一些較新的模型如DeepSeek阿聯研究團隊打造AI讀心術從照片和文字中破解人格密碼雖然功能強大,但速度相對較慢。

準確性是更重要的評判標準。研究團隊設計了一個巧妙的測試方法:讓四個不同的AI模型來評判其他模型生成的性格分析是否準確和一致。這就像是讓不同的專家互相檢查對方的工作質量。結果顯示,ChatGPT-4o在準確性方面表現最佳,幾乎所有的分析都能通過其他模型的檢驗。

一致性測試更加嚴格。研究團隊讓同一個模型對同一個人進行多次分析,然後比較結果的一致性。如果一個模型今天說某人很外向,明天又說這個人很內向,那顯然不夠可靠。測試結果表明,Llama-4-Maverick在一致性方面表現最佳,其分析結果的標準差通常低於0.2,意味著多次分析的結果基本一致。

更有趣的是關於評分方式的研究。團隊測試了不同的評分系統,包括3級評分(不同意-中性-同意)和5級評分(強烈不同意-不同意-中性-同意-強烈同意),還測試了數字評分和文字評分的差異。結果出人意料:簡單的3級數字評分系統反而比複雜的5級系統更加穩定可靠。這說明有時候簡單反而更有效。

基於這些綜合評估,研究團隊最終選定了三個最優模型作為"黃金組合":ChatGPT-4o負責主要分析,Gemini-2.5-Pro提供補充視角,Llama-4-Maverick確保結果穩定性。這三個模型就像是三位不同專長的心理學家,通過集體討論得出最終的性格判斷。

三、兩層分析框架:從表面規律到深層因果

擁有了高質量的資料庫之後,如何從中挖掘有價值的資訊成為了關鍵問題。研究團隊開發了一個雙層分析框架,就像是配備了兩種不同功率的顯微鏡來觀察同一個樣本。

第一層分析採用傳統的統計學方法,主要目的是找出不同特徵之間的關聯性。研究團隊使用了五種不同的獨立性檢驗方法,包括卡方檢驗、G方檢驗等傳統方法,以及基於核函數的現代方法如RCIT、HSIC和KCI。這就像是用不同的工具來測量同一個物體的尺寸,如果多個工具都給出相似的結果,那就說明測量結果是可信的。

在CelebPersona數據集的分析中,研究團隊發現了一些有趣的規律。性別和職業與幾乎所有性格特徵都存在顯著關聯,這並不意外,因為不同性別和職業的人確實可能表現出不同的性格傾向。更有趣的是,面部特徵如尖鼻子、拱形眉毛等與某些性格特徵存在關聯,這驗證了"相由心生"這一古老觀念可能確實有一定科學依據。

在AthlePersona數據集中,規律有所不同。運動員的性格特徵更多地與他們所屬的聯盟和出生年份相關,而與身高體重等身體特徵的關聯相對較弱。這可能反映了不同運動項目對性格的不同要求,比如團隊運動可能更需要合作性強的性格,而個人運動可能更偏愛獨立性強的性格。

第二層分析更加深入,它不滿足於僅僅找到關聯性,而是要探究因果關係。這就像是不僅要知道"雷聲總是跟著閃電出現"這個現象,還要理解"閃電導致雷聲"這個因果機制。

為了實現因果分析,研究團隊開發了一套專門針對多模態數據的因果表示學習算法。這個算法的核心思想是將複雜的觀察數據(如照片、文字)轉換為簡化的潛在變量,然後分析這些潛在變量之間的因果關係。這個過程就像是把一個複雜的機器拆解成基本零件,然後研究這些零件是如何相互作用的。

算法的設計基於幾個重要的理論假設。首先,真實世界中存在一些我們無法直接觀察的潛在因素,這些因素影響著我們能看到的表面現象。其次,不同模態的數據(如圖像和文本)可能共享某些潛在因素,同時也有各自獨特的因素。最後,這些潛在因素之間存在因果關係,理解這些關係有助於更好地預測和解釋觀察到的現象。

四、合成實驗驗證:用已知答案檢驗算法

在將算法應用到真實數據之前,研究團隊首先進行了一系列合成實驗來驗證算法的有效性。這就像是在真正的手術之前,先在模擬人體上練習操作技巧。

團隊創建了一個基於MNIST數字識別數據集的合成測試環境。他們構造了兩種不同的"模態":彩色MNIST和時尚MNIST。在彩色MNIST中,數字的水平位置會影響圖像的透明度;在時尚MNIST中,服裝的垂直位置會影響圖像的灰度。更重要的是,他們設計了跨模態的因果關係:彩色MNIST中的水平位置會影響時尚MNIST中的垂直位置。

這個設計看似簡單,但實際上包含了複雜的因果結構。算法需要同時處理模態內的因果關係(位置影響透明度)和模態間的因果關係(一個模態的位置影響另一個模態的位置),還要區分共享因素和模態特定因素。

實驗結果令人鼓舞。研究團隊的算法在R?(決定係數)方面達到了0.96,在MCC(馬修斯相關係數)方面達到了0.92,明顯超過了其他對比算法。特別是與最接近的競爭算法MMCRL相比,提升幅度達到了6-7個百分點。這說明新算法在識別和學習因果關係方面確實具有顯著優勢。

更重要的是,算法成功地識別出了預設的因果結構。它能夠正確區分哪些變量屬於共享因素,哪些屬於模態特定因素,以及這些因素之間的因果關係方向。這就像是在一個複雜的拼圖遊戲中,算法不僅能找到正確的拼圖塊,還能理解它們應該如何組合在一起。

五、真實數據分析:揭示隱藏的性格因果網路

經過合成數據的驗證後,研究團隊將算法應用到了真實的PersonaX數據集上。這就像是從實驗室走向了真實世界的考驗。

在AthlePersona數據集的分析中,算法識別出了一個包含12個潛在變量的因果網路。這些變量被分為三類:兩個共享變量代表所有運動員都具備的共同特徵,五個圖像相關變量反映面部照片中的資訊,五個行為特徵變量對應性格分析的結果。

最引人注目的是這些變量的具體含義。研究團隊通過與獨立性檢驗結果的對比,給每個潛在變量賦予了現實意義。兩個共享變量被解釋為"心態"和"文化背景",這確實是所有運動員都可能具備的基礎特徵。圖像相關變量包括膚色、修飾程度、面部表情、吸引力和面部結構,這些都是照片中能夠觀察到的特徵。行為特徵變量則包括自信心、成就導向、情緒穩定性、自我認知和積極性。

更有價值的是發現的因果關係。比如,自信心(行為特徵)會影響面部表情(圖像特徵),這符合我們的直覺理解。情緒穩定性會影響修飾程度,可能反映了情緒穩定的人更注重外在形象管理。在圖像特徵內部,也存在因果鏈:膚色影響吸引力,吸引力影響面部表情,形成了一個合理的因果序列。

在CelebPersona數據集的分析中,因果網路更加複雜。算法識別出了18個潛在變量,包括3個共享變量、10個圖像變量和5個行為特徵變量。共享變量被解釋為教育背景、文化背景和成長環境,這些確實是影響所有名人的重要因素。

特別有趣的是跨模態因果關係的發現。比如,表達能力(行為特徵)會影響親和力(圖像特徵),說明一個人的表達能力可能通過面部表情等方式體現出來。在圖像特徵內部,事件背景和光照條件會影響髮型,髮型進而影響面部可見度、整體風格和外貌吸引力,這反映了形象管理的複雜策略。

六、理論基礎:為什麼這套方法是可信的

研究團隊不僅提供了實用的算法,還建立了堅實的理論基礎來保證方法的科學性。這就像是為一座大樓打下了牢固的地基,確保上層建築的穩定性。

核心理論基於三個逐步深入的定理。第一個定理解決的是"子空間可識別性"問題。簡單來說,就是證明在滿足某些條件的情況下,算法能夠準確地識別出每個模態對應的潛在變量空間。這就像是證明了一個翻譯系統能夠準確地將不同語言的文本翻譯成統一的內部表示。

第二個定理進一步證明了"共享子空間可識別性"。在多模態數據中,不同模態可能共享某些潛在因素。這個定理證明了算法能夠準確識別出這些共享因素,而不會將模態特定因素誤認為是共享因素。這就像是在一個多語言會議中,翻譯系統能夠識別出所有語言都在討論的共同話題。

第三個定理是最強的結果,證明了"組件級可識別性"。這意味著算法不僅能識別潛在變量的整體結構,還能將每個潛在變量準確地分解為獨立的組件。這就像是不僅能理解一首交響樂的整體結構,還能識別出其中每個樂器的獨立貢獻。

這些理論結果的重要性在於,它們為算法的可靠性提供了數學保證。在滿足一定條件的情況下,算法的輸出不是隨機的猜測,而是對真實因果結構的準確估計。這些條件包括數據分布的良好性質、模態變異性、測量變化條件和可微性要求,都是在實際應用中可以驗證或近似滿足的。

理論分析還揭示了多模態資訊的獨特價值。與傳統的單模態方法相比,多模態方法能夠利用不同模態之間的互補資訊來增強識別能力。共享潛在因素就像是連接不同模態的橋樑,通過分析這些橋樑,算法能夠獲得比單獨分析每個模態更豐富的資訊。

七、實際應用價值:從學術研究到現實世界

這項研究的價值遠不止於學術層面,它開闢了多個實際應用的可能性。就像是發現了一種新的"透視鏡",讓我們能夠以全新的方式理解人類行為和性格。

在人力資源領域,這項技術可能革命性地改變招聘和人才評估的方式。傳統的招聘過程主要依賴簡歷、面試和心理測試,但這些方法都存在主觀性強、成本高、效率低等問題。基於PersonaX的技術可以通過分析候選人的照片和公開資訊,快速提供性格特徵的初步評估,幫助HR專業人士更有效地篩選和匹配人才。

在教育領域,這項技術可以幫助教育工作者更好地理解學生的個性特徵,從而提供更個性化的教學方案。比如,對於識別出具有高開放性特徵的學生,可以提供更多創新性和探索性的學習機會;對於具有高責任心特徵的學生,可以賦予更多自主學習的責任。

在醫療健康領域,性格特徵與心理健康狀況有著密切的關聯。這項技術可以作為心理健康篩查的輔助工具,幫助醫護人員早期識別可能存在心理健康風險的個體。當然,這種應用需要格外謹慎,必須在專業醫護人員的指導下進行。

在市場營銷和用戶體驗設計方面,理解用戶的性格特徵有助於提供更精準的個性化服務。比如,電商平台可以根據用戶的性格特徵調整商品推薦策略,社交媒體可以優化內容分發算法,讓用戶看到更符合自己性格偏好的內容。

研究團隊特別強調了數據使用的倫理規範。所有數據都來自公開、合法的渠道,並且採取了嚴格的隱私保護措施。更重要的是,他們制定了明確的使用指南,禁止將這項技術用於高風險決策場景,如保險理賠或放貸審批。這種負責任的態度為AI技術的健康發展樹立了良好的榜樣。

研究團隊還認識到當前數據集的局限性。AthlePersona目前只包含男性運動員,CelebPersona主要關注高知名度的公眾人物,這些群體可能不能完全代表普通人群。團隊計劃在未來擴展數據集的覆蓋範圍,包括更多樣化的人群和更長時間跨度的數據,以提高技術的普適性和可靠性。

說到底,這項研究為我們打開了一扇理解人類性格的新窗口。它不是要取代傳統的心理學研究方法,而是要為這個古老的領域注入新的科技動力。就像望遠鏡幫助我們看到了更遙遠的星系,這項技術幫助我們以全新的視角審視人類內心世界的複雜性。歸根結底,技術的價值在於服務人類,這項研究最終的目標是促進人與人之間更好的理解與溝通,推動社會的和諧發展。

對於普通人來說,這項研究提醒我們,我們的外在表現確實在某種程度上反映了內在性格,但這種反映是複雜和多層次的。我們不應該簡單地根據第一印象來判斷他人,而應該用更加科學和理解的態度來看待人與人之間的差異。同時,這項研究也讓我們意識到,在數字時代,我們的各種資訊都可能被用來推斷我們的性格特徵,這提醒我們要更加謹慎地管理自己的數字足跡和隱私保護。

有興趣深入了解這項研究的讀者,可以通過搜索"PersonaX Multimodal Datasets LLM-Inferred Behavior Traits"找到完整的研究論文,其中包含了更詳細的技術細節和實驗結果。這項研究代表了AI技術在理解人類行為方面的重要進展,值得我們持續關注其後續發展和應用。

Q&A

Q1:PersonaX資料庫包含哪些人群?它是如何收集這些數據的?

A:PersonaX包含兩個資料庫:CelebPersona收錄了9444名知名人士(包括演員、歌手、商界領袖等),AthlePersona收錄了4181名來自NBA、NFL、英超等七大聯盟的職業男性運動員。數據來源都是公開合法的渠道,包括官方網站、維基百科等,研究團隊嚴格遵循了各平台的使用條款。

Q2:AI如何從照片和背景資訊中分析出人的性格特徵?

A:研究團隊讓ChatGPT、Gemini和Llama三個頂級AI模型同時分析每個人的公開資訊,包括訪談言論、行為表現、職業選擇等,然後在開放性、責任心、外向性、親和性和神經質五個維度上進行評分。三個模型的結果會進行綜合比較,就像請三位心理學專家同時做診斷然後取交集。

Q3:這項研究發現了哪些有趣的性格與外貌或職業的關聯?

A:研究發現面部特徵如尖鼻子、拱形眉毛等與某些性格特徵存在關聯,驗證了"相由心生"的觀念。在運動員群體中,不同聯盟的運動員表現出不同的性格傾向,團隊運動可能更需要合作性強的性格。名人群體中,表達能力強的人通常看起來更親和,文化背景會影響語言使用風格。

宅中地 - Facebook 分享 宅中地 - Twitter 分享 宅中地 - Whatsapp 分享 宅中地 - Line 分享
相關內容
Copyright ©2025 | 服務條款 | DMCA | 聯絡我們
宅中地 - 每日更新