宅中地 - 每日更新
宅中地 - 每日更新

贊助商廣告

X

IEEE專家委員胡凝:消解AI幻覺「陰影」 ,洞見「超級個體」價值錨點

2025年05月13日 首頁 » 熱門科技

當前,大模型的『幻覺』問題備受關注,被視為技術落地的『陰影』。AI幻覺就像難以根治的頑疾,纏繞著大模型落地的每一步。然而,在這場技術與可靠性的較量背後,未來個體的生存法則,或許早已悄然改變,指向了新的價值坐標。

模型「幻覺」的消解路徑

與AI幻覺的較量,註定是一場「人機博弈」的持久戰。

AI在自然語言理解、內容生成等領域擁有了令人驚嘆的能力飛躍,但如影隨形的「幻覺」問題,始終像一團陰影,籠罩在AI可靠性與可信度提升的道路上,是將其從實驗室推向更廣闊應用場景時,必須直面的「深淵」。

Vectara的分析報告《DeepSeek-R1 hallucinates more than DeepSeek-V3》顯示,DeepSeek-R1在特定評估基準下的幻覺率高達14.3%,與其基座版本DeepSeek-V3IEEE專家委員胡凝:消解AI幻覺「陰影」 ,洞見「超級個體」價值錨點那相對克制的3.9%相比,簡直「畫風突變」。

 

IEEE專家委員胡凝:消解AI幻覺「陰影」 ,洞見「超級個體」價值錨點

 

圖片截取自:Vectara報告《DeepSeek-R1 hallucinates more than DeepSeek-V3》

專注於信任度評估的Vijil也發布報告稱,在其針對幻覺的專項測試中,DeepSeek-R1的"通過率"約為68.42%。換句話說,仍有約31.58%的回答存在幻覺。

 

IEEE專家委員胡凝:消解AI幻覺「陰影」 ,洞見「超級個體」價值錨點

 

圖片截取自:VIJIL信託報告

評估數據的背後,指向了大模型在控制幻覺方面的潛在挑戰。這場關於AI幻覺率的「羅生門」,無疑給模型的穩定性和可靠性打上了一個問號。

細究這一「頑疾」的根源,胡凝認為,以DeepSeekIEEE專家委員胡凝:消解AI幻覺「陰影」 ,洞見「超級個體」價值錨點為代表的推理模型,與傳統基礎模型相比,在核心的「思維鏈」構造上存在著本質差異,這決定了其產生幻覺的關鍵癥結也有所不同。

 

IEEE專家委員胡凝:消解AI幻覺「陰影」 ,洞見「超級個體」價值錨點

 

IEEE數字金融與經濟標準委員會專家委員、桐元軟體CEO 胡凝

事實上,對推理模型而言,為了實現模擬複雜的邏輯過程,會將思維鏈分解為多步驟的中間推理環節。這一設計本身是為了實現更精細的控制和更明確的執行指令。然而,風險也恰恰潛藏於此——每一步的「思考」和計算都可能引入微小誤差,並在鏈條的延伸中積累、放大,最終導致結論南轅北轍。

「DeepSeek使用MoE結合推理來節省算力,但如果對於領域專家定位出現錯誤,點亮的知識結構和原始語義不符,則會出現『張冠李戴』的幻覺問題。」胡凝如是說。

與此相對的是,基礎模型採用了更為內隱和整體的推理方式,其內部狀態相對集約。更關鍵的在於,其賴以訓練的數據規模通常極為龐大且多樣化,這使得它們在面對新穎或模糊查詢時,擁有了更強的泛化能力,並在推理過程中具備了一定的動態修正潛力。

當然,如同所有AI模型面臨的挑戰,基礎模型同樣無法完全避免「幻覺」現象。「其產生誘因或許更多地根植於從海量數據中習得的模式本身固有的偏差或噪聲,而非簡單的邏輯斷裂。」胡凝強調

數據的特性與處理方式本身,也是影響模型幻覺表現的另一個核心要素。

對此,他指出,推理模型在訓練時,往往依賴於針對特定領域或任務構建的高度相關的局部知識語料。而問題在於,如果這些語料在人工篩選、標註或結構化過程中本身就內含了邏輯跳躍或隱性錯誤,模型在學習時便可能將這些「瑕疵」內化。

除了數據內容本身的潛在瑕疵,推理模型的訓練方式及其數據特性,也影響著模型的表現。

推理模型在訓練階段有時會為了優化特定的「正確推理步驟」而進行「剪枝」,而一旦「剪枝」過度,便犧牲了模型在面對複雜、開放式問題時進行多路徑探索和驗證的靈活性。

「從數據量級上看,用於推理任務的數據集與基礎模型進行通用預訓練時接觸的海量知識相比,規模往往小得多。而這可能導致推理模型在覆蓋各種推理場景的多樣性和邊緣案例的全面性上存在先天不足,限制了其在特定情景下的魯棒性。」胡凝強調。

相比之下,基礎模型得益於其海量多樣化的訓練數據,更容易習得更全面和穩健的語言規律和知識體系。但即便如此,在其更整體化的推理過程中,如果某個中間步驟產生了貌似符合邏輯的「幻覺」,這個錯誤的「基石」也可能隨著推理鏈條的展開而進一步被強化和放大。

因此,「消滅」AI幻覺目前沒有一勞永逸的「靈丹妙藥」,其註定是一項系統性的、需要多條戰線協同推進的複雜工程。

這場「較量」力求從多個維度同時發力:

一方面,要深入改進模型本身的結構和算法,提升其內在的邏輯一致性和魯棒性。另一方面,不斷提升訓練數據的質量控制和多樣化水平。

更重要的是,需要引入外部的「裁判」和「知識庫」,通過RAG(檢索增強生成)等技術,讓模型在生成內容時能夠「查證」和「核驗」,而不僅僅是依賴「湧現」。

同時,持續優化和創新RLHF等強化學習微調技術,以更精細地引導模型生成符合事實和人類認知的內容。

此外,亦要發展更先進的評估方法和提升模型的可解釋性,幫助我們理解模型為何會「腦補」,才能更好地對症下藥。

「超級個體」的三重價值

隨著AI技術的普惠化與能力的持續增強,胡凝預見,一個以「超級個體」為標誌的新時代即將到來加速。

然而,這並不意味著個體之間將趨於同質化。

恰恰相反,「超級個體」之間的差異化將更為明顯。他指出,這種差異不再是簡單的體力或基礎技能的差異,而是更深層次的能力分層,其主要體現在個人對AI工具的整合能力、獨特思維模式的培養,以及專業領域深度三個方面。

如果探究細化胡凝提出三個維度,可以發現其是構築個體核心競爭壁壘、在AI時代塑造獨特價值的關鍵所在。

「AI工具的整合與協同能力」。其不僅僅是會使用AI工具,更是理解不同AI工具的優勢與局限,並能像指揮「交響樂團」一樣,將其無縫地融入到自己的工作流、學習過程和價值創造鏈中。這種能力考驗的是個體的學習適應性、系統思維以及將前沿技術轉化為實際生產力的智慧。其是將AI從「工具」升級為「協作夥伴」的關鍵。

「獨特思維模式的培養」。在資訊爆炸、AI能快速生成標準化內容的時代,真正有價值的是那些無法被輕易複製、帶有強烈個人烙印的思維方式。這包括批判性思維、創新性思維、跨領域聯想能力、以及構建自己獨特認知框架的能力。這種「人之所以為人」的深度思考和結構化認知,是應對複雜問題和產生原創見解的核心引擎。

「專業領域的深度與專精」。AI更多是一個「放大器」。其能極大提升效率、拓展能力邊界,但其所「放大」的內容,歸根結底取決於個體在特定專業領域內的積累和造詣。沒有深厚的專業基礎,AI即便強大,也如同無本之木、無源之水。只有在某一領域達到精深,才能有效地利用AI去解決該領域的難題,產生突破性的成果。

然而,這僅僅是構築個體核心競爭力的第一階段。

真正拉開「超級個體」之間差距,使其具備上述「三重」差異化價值的,並非AI工具本身,而是與個體深度綁定的、能夠反映和放大個人特質的AI輔助系統——即個性化Agent。胡凝強調,個性化Agent可以記錄個體的思考過程、學習偏好,並據此提供量身定製的輔助,使創造性思維和專業技能得到指數級放大。

這與紅杉 AI 峰會閉門會上紅杉合伙人Konstantine 提出的設想有著遞進式的呼應。Konstantine 認為,未來的 AI,不只是彼此通信,而是組成一個可以交換價值的系統網路。」

AI工具普及 用創意和「交付」建立價值「護城河」

紅杉資本近期那場為期6小時、雲集150位頂尖AI創始人的閉門峰會,恰好從商業視角,為胡凝的結構預判提供了註腳和證實。紅杉所描繪的,是具備身份、行動和信任契約的AI「代理人」,正在組成一個能夠彼此協作、完成複雜任務的「智能體經濟網路」。這或許就是胡凝所言,衝破組織邊界、由「網路節點」構成的未來協作圖景。

在智能體網路里,個體或是AI賦能下的「超級個體」——正轉型為任務的「編排者」和資源的「調度者」。而人的價值,則不再是設計指令讓AI服從,而變成了設計並啟動這個網路的協作流程。

超級個體崛起之下,經濟的底層邏輯也將被顛覆。

胡凝認為,其將從依賴規模走向依賴「創意」和「注意力」。獨一無二的思維和創造力,會成為新時代的「硬通貨」。

而這種路徑,目前已經逐漸顯現,「下一輪 AI,賣的不是工具,而是收益」紅杉資本的考量直戳人心。更多客戶不再為AI這個「工具」本身買單,他們只掏錢買AI實際「干出來」的、寫進報表里的「成果」。

這一趨勢下,胡凝的判斷給出了「解法」:當AI工具普及,其邊際價值遞減,真正的價值護城河,在於用AI創造出的、別人難以輕易複製的獨特「成果」。創意和如何實現創意,成了新的稀缺資源。

他還提出了未來超級個體的三條「生存之道」。

第一條路:提供他人難以複製的創造性內容和服務,而實現路徑則是把創意變成能端到端交付的「成果型產品」。

「成果型產品」的定義逐漸明確,其能跑完一個完整任務流程,結果可被度量和歸因,並且能越跑越好。創意不能是空中樓閣,而是能用AI或其他資源打包交付的「硬通貨」,市場只為可驗證的「交付」買單。

第二條路:成為特定知識領域的信任節點和驗證者。用戶不再是簡單「使用」工具,而是將任務「委託」給智能體,然後等待結果。這一過程中,誰能持續、可靠地交付高質量結果,誰就在這個委託網路中積累了寶貴的「交付記錄」。這些記錄構成了新時代的「信任背書」,更能成為驗證資訊、值得託付的「信任節點」。

第三條路:設計和優化AI系統本身。而這項工作的核心,已經不只是調參數、設計prompt,而是調「結構」。紅杉的觀點是,AI的瓶頸不在模型,而在如何把模型融入流程和工具鏈的「架構工程」。

這也正是胡凝所指的「設計和優化」工作的精髓。

值得注意的是,胡凝也提到了能耗和資訊繭房等伴生難題。AI能耗問題會形成新的資源競爭態勢,計算資源、電力和冷卻設施將成為限制性因素,可能導致"計算資源階層"的出現。

同時,AI形成的資訊繭房將對社會產生深遠衝擊。個性化agent在強化個人認知和能力的同時,也可能放大確認偏見,導致社會認知分化加劇。

「當每個人都沉浸在由AI精心打造的資訊環境中,社會共識形成變得更加困難,可能出現"平行現實"現象——不同群體生活在截然不同的資訊生態系統中,彼此間的基本事實認知都無法達成一致。」胡凝強調,這種資訊分層將進一步加劇社會極化,挑戰民主決策和社會治理的基礎。

解決這一問題需要開發「『認知多樣性(破繭房)』和「跨繭房對話」的系統或相關的協議,確保超級個體在獲得個性化增強的同時,仍能接觸到多元觀點和共享現實,維持社會凝聚力和集體決策能力。

「認知多樣性(破繭房),可維護和鼓勵社會中存在不同的觀點、思維方式和知識體系,並主動打破個體被困在單一資訊環境中的狀態;「跨繭房對話」則是要建立機制促進持有不同觀點、處於不同資訊繭房中的個體之間進行交流和對話,增進相互理解。

也是在此基礎上,胡凝從企業角度談及,未來的企業將不再是主要的生產或服務提供者,而是轉向為以個性化Agent為中心的生態系統和基礎設施提供者,以及環境培育者。

具體而言,包括構建支持個性化認知模型訓練的平台、開發用於映射和理解個體思維模式的工具,以及建立促進不同Agent之間有效協作的協議和標準。

宅中地 - Facebook 分享 宅中地 - Twitter 分享 宅中地 - Whatsapp 分享 宅中地 - Line 分享
相關內容
Copyright ©2025 | 服務條款 | DMCA | 聯絡我們
宅中地 - 每日更新