承認吧,你正在失去讀完一篇長文的能力。
面對一份五十頁的 PDF 報告,或者深度分析長文,你的肌肉記憶是不是已經變成了順手拖進 AI 對話框,讓它給你總結核心觀點。甚至連眼前這篇文章還沒讀完,就已經跑到留言區吐槽作者為什麽寫這麼長,然後 @ 元寶來份「省流版」了。

看著螢幕上元寶給出精煉總結,你感到一陣莫名的滿足,覺得自己已經充分駕馭了最前沿的 AI,但你有沒有想過,在這個看似高效的過程中,你的大腦像溫水煮青蛙一樣慢慢「退化」。

論文 : https://arxiv.org/abs/2604.04721v2
AI 正在「偷走」我們的思考力?
最近,卡內基梅隆大學、牛津大學、麻省理工學院和加州大學洛杉磯分校的研究團隊聯合發布了一項研究,通過三組隨機對照實驗,找來共計 1222 名受試者,系統地測量了 AI 輔助對人類獨立解題能力的影響。

實驗一:先甜後苦
第一組實驗招募了 354 名受試者,任務是做分數運算,總共 15 道題,難度從一步運算逐漸遞進到三步運算。
研究人員把受試者隨機分成兩組。AI 組在前 12 道題里可以隨意調用 AI 助手(GPT-5),界面側邊欄會彈出一個對話框,你甚至只需要打一句「答案是什麼」,它就會直接告訴你。對照組則全程只能靠自己,沒有任何輔助。
陷阱藏在第 13 題。做到最後 3 道題時,AI 組的側邊欄被突然撤掉,要求獨立作答。這 3 道題與對照組完全相同,是衡量真實獨立能力的核心指標。
一開始的劇本和我們預想的一模一樣:在 AI 的加持下,開掛組一路高歌猛進,他們能更快、更準確地得出答案,正確率碾壓了純人類組。AI 就像一個無所不知的學霸同桌,你把題目遞過去,它把完美答案遞迴來。

AI 會削弱人在沒有輔助時的表現和堅持完成任務的意願。(a) 按題目出現順序統計的參與者每題平均解答率和跳過率,並給出 95% 置信區間(CI)。灰色虛線表示學習題與測試題之間的分界。整個實驗中,題目難度逐步提升:依次為一步驟題(第 1—4 題)、兩步驟題(第 5—8 題)和三步驟題(第 9—12 題)。(b)圖為參與者在測試階段的平均解題率與跳過率,附 95% 置信區間。測試指標通過對每位參與者最後三道測試題的表現取平均值計算得出。
可一旦撤掉 AI,畫風就全變了。
習慣了 AI 輔助的受試者在獨立作答階段的正確率,從領先直接跌到了 0.57,顯著低於對照組的 0.73。跳過率也從原本的低位,急劇攀升到了 0.20,相比之下,對照組只有 0.11。
更關鍵的是,他們開始大量跳過題目,甚至直接放棄作答。
注意,這裡的跳過不是答錯,是主動選擇不作答。研究人員特意說明,這個實驗對答錯沒有任何懲罰,主動跳過是為了衡量一個人還有沒有意願繼續努力的真實指標。
研究人員在報告中寫下了一段十分令人感慨的結論:「如果這種依賴持續幾個月甚至幾年,我們可能會培養出整整一代喪失『獨立掙扎』能力的學習者。一旦沒有技術支持,他們根本不知道該如何有效地去思考。」

實驗二:排除干擾,結論依然成立
第一個實驗的結論雖然清晰,卻存在一個潛在的漏洞:AI 組裡可能混入了一些原本就不太會做分數運算的人,他們靠 AI 勉強通過了前 12 題,撤掉 AI 之後自然表現更差。
這個能力差異,會不會才是真正的原因?
為了排除這個干擾,研究團隊在第二組實驗裡做了兩處改進。第一處改進,是在正式實驗開始之前,先給所有 667 名受試者做一輪摸底測試,三道簡單的一步運算題,摸清每個人的初始水平。
之後的篩選和比較都以這個摸底成績為基準,不再依賴實驗中途的表現,從而確保兩組人一開始站在同一起點。
第二處改進,為了消除界面變化帶來的心理影響。
在第一組實驗裡,AI 組全程有側邊欄,到了最後 3 道題突然消失;而對照組從頭到尾都沒有側邊欄。這種界面上的落差,可能讓 AI 組在側邊欄消失的瞬間產生額外的心理波動,影響後續發揮。
為了讓兩組人經歷同樣的界面變化,研究人員給對照組也加了一個側邊欄,裡面放的是摸底測試的解題步驟。
這些內容受試者早就看過,不提供任何新資訊,純粹只是為了讓對照組在最後 3 道題時也經歷一次側邊欄消失的節點,排除界面突變本身對心態的干擾。

實驗二結果的重複驗證。(a)圖為參與者在題目呈現順序下的平均解題率與跳過率,附 95% 置信區間。題目難度依次遞增,從一步驟題(第 4—6 題)到兩步驟題(第 7—10 題)再到三步驟題(第 11—14 題)。(b)圖為參與者在測試階段的平均解題率與跳過率,附 95% 置信區間。
這樣一來,兩組之間唯一真正的差別,就只剩下有沒有用過 AI 這一件事,但最終結論依舊是成立的。AI 組的獨立作答正確率(0.71)仍然顯著低於對照組(0.77),跳題傾向也更高。
不過更關鍵的發現,來自研究人員對 AI 組內部使用習慣的拆解。實驗結束後,研究人員讓 AI 組的參與者自己匯報:你主要是怎麼用 AI 的?
結果分成了三類:
61% 直接管 AI 要答案
27% 把 AI 當導師,要提示或解題思路
12% 基本沒用過
在摸底測試階段,三組人的得分和跳過率幾乎沒有差異,說明大家進入實驗時的起點是一樣的。但到了獨立作答的測試階段,三組人的表現出現了明顯分化。

表現下滑與堅持度減弱,主要集中在直接從 AI 獲取答案的參與者身上。(a)各 AI 使用組在摸底測試階段的解題率與跳過率無顯著差異(單因素方差分析),表明各組初始技能水平與參與動機基本相當。(b)各組在測試階段存在顯著差異(單因素方差分析):直接使用 AI 獲取答案的參與者在測試時解題率最低、跳過率最高。(c)與自身摸底測試表現相比,直接使用 AI 獲取答案的參與者解題率下降,跳過率上升,表明其參與度有所降低。其他組的測試表現與前測相比持平或有所提升。
直接要答案的那組,後續獨立作答的正確率最低、放棄率最高,甚至連自己原本的水平都沒發揮出來。而用 AI 獲取提示、只是輔助理解的那組,表現則和對照組差不多,沒怎麼退步。
這個差異背後的邏輯其實不難理解。
直接要答案,意味著你全程沒有經歷任何推導。用 AI 索要提示則不同,你仍然需要自己判斷提示指向哪裡、下一步怎麼走、推導到哪裡出了錯,AI 只是在你卡住的地方遞了一塊墊腳石,思考的主體還是你自己。
所以,問題不在於用不用 AI,而在於你把哪個環節交給了它。如果你把「思考」本身讓位給了技術,認知就不會提升把「卡殼」的那一刻交出去,但保留前後的推導,損耗就小得多。
實驗三:換個場景,同樣的結論
為了驗證這個現象是否只在數學題里成立,研究人員又換了一個完全不同的認知領域,用閱讀理解做了第三組實驗。201 名受試者被分成兩組,任務是做 SAT(類似美國聯考)閱讀理解題。
AI 組在前 5 道題里可以調用 GPT-5,之後的 3 道題獨立作答;對照組全程自己完成 8 道題。同樣為了讓兩組都經歷側邊欄消失的節點,對照組的側邊欄里放了一些通用答題技巧,但在最後 3 道題時一併撤掉。

閱讀理解任務中表現與堅持度的下降。(a)圖為參與者在題目呈現順序下的平均解題率與跳過率,附 95% 置信區間。灰色虛線標示學習階段與測試階段的分界點。(b)圖為參與者在測試階段的平均解題率與跳過率,附 95% 置信區間,由各參與者數據匯總計算得出。
結果和前兩組實驗如出一轍。AI 組獨立作答的正確率(0.76)顯著低於對照組(0.89),跳過率(0.08)也顯著高於對照組(0.01)。
數學運算和閱讀理解,調動的是完全不同的認知機制,但結果驚人地一致:AI 輔助之後,獨立作答時,參與者不只是答錯更多,還更頻繁地選擇放棄。
守住那段「笨拙」的掙扎
為什麼僅僅 10 分鐘的 AI 體驗,就能輕易摧毀一個成年人的解題意志?
研究人員在論文裡給出了兩層解釋。
第一個機制是口味被養刁了(預期基準偏移)。當你的大腦習慣了「輸入提示詞 -> 3 秒後獲取完美答案」的多巴胺路徑後,你的效率閾值被無限拉高了。
此時,任何需要超過 3 分鐘專注力的無輔助工作,都會讓你產生一種強烈的「吃力感」——感覺自己付出了過多的額外努力,哪怕那些努力其實完全正常。
第二個機制是自我認知的空白。回想一下,你真正掌握某項技能的時刻,往往伴隨著痛苦和抓耳撓腮。那種從怎麼也想不通到豁然開朗的轉折,就是建設性掙扎,也正是大腦建立神經元連接的必經之路。

建設性掙扎給人帶來的不只是解題結果,還有對自己能力邊界的真實感知——知道自己哪行、哪不行、能扛多久。AI 抹掉了這個過程,你也就失去了校準自我的機會。你既不知道自己的極限在哪,也不知道自己其實有能力搞定。
麻省理工學院的另一項研究,從另一個側面證實了這個隱憂。
研究人員讓受試者使用 ChatGPT 來撰寫長篇論文。結果那些重度依賴 AI 寫出漂亮文章的人,在事後往往根本回憶不起來自己寫了什麼,甚至在測試時,連哪篇文章是自己交的都認不出來。
研究團隊為此創造了一個極其精準的詞彙:認知債務(Cognitive Debt)。就像刷信用卡。你用 AI 搞定了今天的工作總結、明天的策劃案、期末的論文,透支的是未來的認知能力,換來的是當下的舒適區。
債總是要還的,而且往往在你最措手不及的時候找上門來。

一開始,你只是用 AI 幫你潤色普通的文案;接著,你讓它幫你列一個會議提綱;後來,你連給親近的人寫句話都要先問問 AI 的意見。隨著時間的推移,你的獨立思考能力、深度閱讀能力、甚至組織長句子的能力,都在不知不覺中萎縮。你以為你在白嫖 AI 的算力,實際上,AI 正在「吃掉」你的腦力。
此外,研究人員還特意在報告中提到,學習資源越少的學生,受到的衝擊可能越大。對於本身就能接觸到大量優質教育資源、有老師有輔導的群體來說,AI 只是眾多工具之一;
對於依賴自學、缺乏外部支持的人來說,AI 很可能是他們接觸「即時幫助」的唯一渠道,依賴也會更深。
雖然加減乘除和基礎閱讀看起來是小事,但它們是通往高階能力的台階。如果基礎階段的練習意願被 AI 侵蝕掉了,後面的邏輯思維和批判性思考就成了無源之水,無本之木。
實驗概覽。上圖:實驗 1 表明,AI 會削弱個體獨立完成任務的表現和持續性。中圖:實驗 2 在更大規模的人群中重複驗證了這一效應,並排除了潛在的混雜因素。下圖:實驗 3 在閱讀理解任務中再次驗證了這一效應。
那麼,面對洶湧而來的 AI 浪潮,我們難道要退回 2021 年,拒絕使用一切大模型嗎?顯然不是。技術的車輪不會倒退。
研究人員認為,那些表面化的補救措施,比如把 AI 設計成蘇格拉底式問答、限制使用時長,解決不了根本問題,因為 AI 提供的誘惑是系統性的。真正的出路,在於從設計層面重新思考 AI 與人類的協作方式。
未來的 AI,在設計之初就必須考慮到人類的長期目標。這意味著,AI 應該被設計成一個懂得克制的「導師」,而不是一個有求必應的「保姆」。
一個真正優秀的 AI 導師,看到學生抓耳撓腮時,絕不會直接把答案甩過去。它會給出提示,引導方向,甚至刻意保持沉默,等學生自己跨過那道坎。

遺憾的是,目前市面上絕大多數 AI 產品都在瘋狂討好用戶。它們比拼的是誰生成得更快、誰能最大程度地幫用戶省掉思考時間,但作為用戶的我們,或許是時候在狂熱中保持一絲清醒了。
下次遇到不那麼緊急、需要動腦子的活兒,試著先關掉 AI 的對話框。拿出一張紙、一支筆,去體會那種絞盡腦汁、卡殼、最後豁然開朗的過程。
就算非要用 AI,也請讓它給你一點提示,而不是直接要一個結果。在這個答案可以瞬間生成的時代,那段看似笨拙、辛苦的掙扎,才是你作為人類最核心的競爭力,也是任何 AI 都無法替代的終極壁壘。






