斯坦福和根特大學聯合研發：一個AI大腦，同時讀懂你的腦子又能畫出你的腦子

這項由斯坦福大學醫學院生物醫學數據科學系、斯坦福大學電氣工程系以及比利時根特大學數學建模與生物資訊學系聯合完成的研究，以預印本形式發布於2026年6月17日，論文編號為arXiv:2606.19651，感興趣的讀者可通過該編號查詢完整原文。

贊助商廣告

腦子裡面到底發生了什麼？這是神經科醫生和腫瘤科醫生每天都要回答的問題。他們的主要工具是腦部磁共振成像，也就是我們俗稱的"核磁共振"或MRI——這種技術能把大腦的三維結構拍成一系列黑白切片，讓醫生看到腫瘤的位置、神經退化的程度、腦室是否異常擴大。然而，僅僅能"拍"還遠遠不夠。如果我們能讓電腦不僅讀懂這些圖像，還能憑空生成新的、真實可信的腦部圖像，那會打開一扇什麼樣的門？

這正是研究團隊要解決的問題。他們開發了一個叫做BrainG3N 斯坦福和根特大學聯合研發一個AI大腦同時讀懂你的腦子又能畫出你的腦子的系統，其核心是一種雙重用途的"語義令牌器"（tokenizer）。這個名字聽起來複雜，但背後的邏輯其實很直接：一個優秀的翻譯官，不僅要能把原文翻譯成另一種語言，還要深刻理解原文的含義。BrainG3N就是這樣一個翻譯官——它既能把三維腦部圖像壓縮成一組富含臨床資訊的"密碼"，又能憑藉這組密碼重新畫出逼真的腦部圖像，甚至能按照醫生的需求生成特定條件下（比如"70歲、阿爾茨海默病患者"）的腦部圖像。

接下來，我們就像打開一本偵探小說一樣，逐步拆解這項研究的每一個關鍵環節，看看研究團隊是如何一步步破解這道難題的。

一、問題的根源：兩個相互矛盾的需求

在醫學成像領域，"生成模型"是近年來的熱門方向。所謂生成模型，就是讓電腦學會"畫畫"——不是憑空亂畫，而是根據它從真實醫學圖像中學到的規律，生成新的、看起來像真實患者的圖像。這有什麼用？用處大了去了：可以用來擴充稀有病例的數據集（比如某種罕見腫瘤的案例太少，就讓AI多生成一些），可以模擬疾病隨時間的進展，還可以在不泄露真實患者隱私的情況下，把"合成患者數據"分享給其他醫療機構。

贊助商廣告

然而，三維腦部圖像有個讓人頭疼的特點：它太大了。一張標準的腦部MRI體積，包含了160×192×160個體素（voxel，也就是三維空間裡的像素點），總計接近500萬個數據點。直接讓AI在這個原始空間裡學習，計算代價高得離譜。於是，研究者們普遍採用一種叫做"潛在擴散"（latent diffusion）的策略：先用一個"編碼器"把原始圖像壓縮成一個小得多的"潛在表示"（latent representation），然後在這個壓縮後的小空間裡訓練生成模型，最後再用一個"解碼器"把生成的結果還原成真實圖像。

這個策略本身是合理的，但它給編碼器提出了兩個互相矛盾的要求。一方面，編碼器壓縮出來的"潛在表示"必須保留足夠豐富的臨床資訊，比如患者的年齡、疾病類型、腫瘤的基因特徵——只有這樣，生成模型才能根據這些條件生成對應的圖像。另一方面，解碼器必須能從這個壓縮表示里還原出像素級別精準的圖像，這要求壓縮表示保留大量細節資訊。

問題在於，這兩個需求往往是互相對立的。過去的方法通常把編碼器和解碼器捆綁在一起，用"重建誤差"（也就是還原後的圖像與原始圖像有多像）來訓練整個系統。這樣訓練出來的編碼器，會把注意力放在保留像素細節上，而不是保留臨床含義。就好比你讓一個畫家臨摹一幅畫，他的注意力全在"每一筆畫得像不像"，而不是"這幅畫表達了什麼主題"——結果他畫得很像，但你問他畫裡的人在想什麼，他答不上來。

研究團隊給出的解決方案，是徹底分離編碼器和解碼器的訓練目標。這就是BrainG3N的核心創新。

二、解決方案：讓"翻譯"和"繪畫"分開學習

研究團隊採用的核心技術是一種叫做"遮罩自編碼器"（Masked Autoencoder，簡稱MAE）的框架。這個技術的靈感來自一個非常樸素的想法：如果你能用一張圖的30%來猜出另外70%，你一定對這張圖的整體結構有非常深刻的理解。

贊助商廣告

具體來說，MAE的工作方式是這樣的：把一張腦部圖像切分成許多小塊（每個小塊是16×16×16個體素的正方體），總共產生1200個這樣的小塊。然後，隨機遮住其中70%的小塊，只把剩下30%（也就是360個小塊）送進編碼器。編碼器必須從這360個可見小塊里，儘可能多地提取資訊，然後讓一個單獨的解碼器去還原那840個被遮住的小塊。

這個任務的難度極高，遠比直接重建完整圖像要難。為什麼？因為被遮住的部分占了大多數，可見的部分只是零散的片段。要從這些零散片段推斷出整體結構，編碼器必須學會捕捉大腦的長程解剖結構——比如，左側海馬體的位置告訴你右側海馬體大概在哪裡，額葉的形態暗示了頂葉的結構。這種"從局部推斷整體"的能力，恰恰就是臨床醫生讀片時使用的核心技能，也是臨床資訊的真正來源。

整個訓練過程分為兩個階段，就像培養一個偵探需要先學理論再做實戰。第一階段是MAE預訓練：用35309張腦部MRI圖像（來自18個公開數據集，覆蓋17399名患者，涵蓋T1、T2、FLAIR、T1增強四種掃描模態，患者年齡從5歲到98歲，涉及健康對照、阿爾茨海默病、帕金森病、神經發育障礙、精神疾病、腦腫瘤等十大臨床類別）訓練MAE編碼器，讓它學會從殘缺的片段里推斷腦部的整體結構。這個編碼器的架構是一個12層的視覺Transformer（ViT），隱藏維度為1152，每張圖像產生1200個"令牌"（token，可以理解為每個可見小塊對應的特徵向量）。

第二階段是令牌器訓練：凍結第一階段訓練好的編碼器（所謂"凍結"，就是不再更新它的參數，讓它保持原有的能力），然後在編碼器輸出的1200個特徵向量上套一個線性壓縮層，把每個特徵從1152維壓縮到32維，得到一個1200×32的"潛在表示"矩陣。這個矩陣隨後被送進一個專門的三維卷積神經網路（CNN）解碼器，讓它學會從這個壓縮表示里還原出原始圖像體素。解碼器的訓練目標是最小化還原圖像與原始圖像的像素級誤差（L1損失）。

贊助商廣告

關鍵之處在於：編碼器在整個第二階段是被凍結的，它的參數不會因為解碼器的重建目標而改變。解碼器只是在學習"如何從編碼器已經提取的資訊里畫出圖像"，而不會反過來讓編碼器"忘記"臨床資訊。這就像讓一個已經深刻理解文學的翻譯家去學畫畫——他畫出來的東西可能不如專業畫家精細，但他對原著的理解絲毫不受影響。

在壓縮維度的選擇上，研究團隊也做了詳細的權衡實驗。他們測試了32、128、512三種壓縮維度，發現維度越高，重建質量越好，但生成模型的訓練代價也越高。在臨床資訊保留方面，32維的壓縮方案（IDH1突變預測AUC為0.861）與未壓縮的1152維（AUC 0.883）相比只下降了0.022，卻把參數量從140萬壓縮到3.8萬，不到3%的維度代價換來了高度壓縮的潛在空間。因此，32維成為最終的選擇。

三、數據基礎：3.5萬張腦部圖像構築的"偵探檔案庫"

一個好偵探需要大量案例積累經驗。研究團隊為MAE編碼器構建了一個涵蓋35309張腦部MRI圖像的預訓練數據集，覆蓋來自全球200多個採集站點的17399名獨立患者。

這35309張圖像來自18個公開數據集，其中最大的是阿爾茨海默病神經影像學倡議（ADNI），貢獻了10910張T1圖像，覆蓋2592名健康對照、輕度認知障礙（MCI）和阿爾茨海默病患者。帕金森病進展標誌物倡議（PPMI）貢獻了3908張T1/T2/FLAIR圖像，包括1484名健康對照和帕金森病患者。賓夕法尼亞大學膠質母細胞瘤數據集（UPENN-GBM）和加州大學舊金山分校瀰漫性膠質瘤數據集（UCSF-PDGM）合計貢獻了4424張多模態腫瘤圖像。此外還有來自兒童發育（HBN）、自閉症譜系障礙（ABIDE-I和ABIDE-II）、精神分裂症（SCHIZO）、注意力缺陷多動障礙（ADHD-200）等數據集的大量圖像。

所有這些圖像在進入模型之前，都經過了統一的預處理流程。具體來說，每張圖像先經過N4偏場校正，消除MRI掃描儀線圈不均勻產生的亮度偏差；然後用HD-BET工具自動去除顱骨、腦膜等非腦組織；接著通過ANTs工具進行仿射配准，把每張圖像對齊到標準的SRI24腦圖譜，最終生成160×192×160體素、1毫米各向同性解析度的標準化體積。對於同一患者的多模態圖像，T1圖像作為"中心"參考，其他模態通過T1的配准變換對齊，避免重複配准導致的跨模態對齊誤差。

贊助商廣告

在疾病分布上，健康對照貢獻了15274張圖像（占43%），輕度認知障礙5808張，膠質母細胞瘤4028張，帕金森病3381張，兒童混合類型2130張，阿爾茨海默病1458張，自閉症譜系障礙1061張，非膠質母細胞瘤膠質瘤396張，精神分裂症328張，注意力缺陷多動障礙247張。健康對照占比最大是有意為之：只有在充分理解"正常大腦"的基礎上，才能識別出"異常大腦"的細微特徵。

四、臨床資訊有多豐富：23項任務的大考

預訓練完成後，研究團隊對這個凍結編碼器進行了全面的"臨床資訊測試"，方法是線性探測（linear probing）——這是自監督學習領域的標準評估方法。

線性探測的邏輯很簡單：在編碼器的輸出特徵上面，只套一個最簡單的線性分類器（相當於一條直線的方程），然後看這條直線能不能把不同類別的圖像區分開來。如果能，說明編碼器已經把那些區分不同類別所需的資訊，整齊地排列在了特徵空間裡，讓一條直線就能切分它們。這就像偵探把案件線索整理得井井有條，讓任何人一眼就能找到關鍵證據。

研究團隊設計了23個臨床和採集相關的預測任務，覆蓋分類任務15個和回歸任務8個。在分類任務中，最有臨床價值的結果包括：IDH1基因突變狀態預測（AUC 0.937，使用T1增強模態），這是膠質瘤診斷和治療分層的關鍵基因組標誌物，傳統上需要腫瘤活檢才能檢測；WHO腫瘤分級預測（AUC 0.921，使用T1模態）；8類疾病分類（AUC 0.948，綜合所有模態）；臨床痴呆評定量表（CDR）分級（AUC 0.717，使用T1模態）；性別預測（AUC 0.967，使用T1模態）；四種掃描模態的分類（AUC 1.000，完美區分）；採集站點的19分類（AUC 0.998）；場強（1.5T還是3T）預測（AUC 0.986）。

在回歸任務中，最突出的是腦齡預測，使用T1模態時R?達到0.954，平均絕對誤差（MAE）僅4.43年。腦齡與實際年齡的差值（所謂"腦齡差"）是神經退化加速的重要生物標誌物，能在明顯症狀出現之前提示患者的大腦健康狀況。此外，簡易精神狀態檢查（MMSE）評分預測R?為0.427，臨床痴呆評定量表連續評分R?為0.316，蒙特婁認知評估（MoCA）R?為0.234。

贊助商廣告

在與三個已發表的3D腦部MRI基礎模型的正面對比中——BrainIAC、BrainSegFounder和MedicalNet——BrainG3N的編碼器在23個任務的8個代表性任務中贏得7個，第8個（掃描模態識別）四個模型都接近滿分。在全部23個任務中，BrainG3N贏得或持平21個，僅在老年抑鬱量表（GDS）和帕金森病統一評定量表第三部分（UPDRS-III）兩個任務上未能獲勝——而這兩個任務對所有編碼器來說都幾乎是"地板效應"，沒有任何模型能有效預測。

值得一提的是，為了確認對比的公平性，研究團隊還重現了BrainIAC在T1腦齡預測上的結果：他們復現出的MAE為7.33年，與BrainIAC論文中報告的7.51年非常接近，證實了對比實驗的實現細節是準確的。而BrainG3N在同一任務上達到4.43年，領先幅度超過2.9年。

五、生成圖像：按需定製的腦部圖像工廠

有了臨床資訊豐富的編碼器和能還原圖像的解碼器，研究團隊接下來訓練了一個條件生成模型：擴散Transformer（DiT）。

DiT的工作原理可以這樣理解：編碼器把真實圖像壓縮成的1200×32的"密碼"，就是DiT要學習的目標。DiT被訓練成從隨機噪聲出發，逐步"去噪"，最終生成符合指定條件的密碼。然後把這個密碼送進CNN解碼器，就得到了真實的三維腦部圖像。

這個條件生成支持六個維度的控制。疾病類型（8個類別：健康對照、阿爾茨海默病、輕度認知障礙、帕金森病、膠質母細胞瘤等）、性別、掃描模態（T1、T2、FLAIR、T1增強四種，這個條件從不被丟棄，因為推理時總是知道要生成哪種模態）、採集站點（19個站點）、年齡（連續值）、IDH1突變狀態（二值）。

訓練採用流匹配目標（flow matching），這是擴散模型的一種高效變體。訓練時，每個條件變量以10%的概率被隨機替換為"空條件"（null），這樣DiT同時學會了"條件生成"和"無條件生成"。推理時，通過"無分類器引導"（CFG）技術，把有條件生成和無條件生成的結果按比例混合，就能強化指定條件對生成結果的控制力。CFG放大係數默認設為2.0，實驗表明這是一個近似最優的選擇。

贊助商廣告

為了驗證生成圖像確實符合指定條件，研究團隊採用了一種叫做"探測-可控性轉移"的評估方法：先用真實圖像訓練一個屬性預測器（比如年齡預測器），然後把這個預測器應用到AI生成的圖像上，看預測出來的屬性是不是符合當初指定的條件。

結果非常清晰。在疾病控制方面，健康對照（HC）與阿爾茨海默病（AD）的區分任務中，有條件生成的圖像被正確分類為指定類別的概率達0.99，而無條件生成的圖像分類結果退回到數據集中健康對照占91%的先驗分布，兩者之間的差距證明了條件信號的有效傳遞。在性別控制方面，有條件生成的準確率達0.93，而無條件生成退回到數據集中女性占43%的先驗比例。在掃描模態控制方面（這個條件從不丟棄），四種模態的識別準確率均為1.00。在年齡控制方面，當分別要求生成"30歲、50歲、70歲"的大腦時，預測出的平均年齡為35.4歲、54.4歲、76.0歲，與Pearson r=0.93的相關係數對應，而無條件生成的大腦年齡集中在數據集均值55.5歲附近。

IDH1突變狀態的控制是最困難的，有條件生成的平均分類一致率只有0.52（相當於接近隨機）。這個結果並不令人意外，因為T1增強模態下的腫瘤病例在整個訓練集中只是少數，IDH1突變病例就更少了，CFG在這種極度不平衡的情況下很難把生成結果有效地推向稀有類別，而不是表現為整體分布的偏移。

在視覺驗證方面，研究團隊做了一個尤為直觀的實驗：固定隨機噪聲種子，然後只改變條件標籤，觀察生成圖像如何變化。結果顯示，當把年齡從30歲調到75歲時，腦室（大腦中儲存腦脊液的腔室）明顯擴大，皮層溝回變淺，與真實的老化特徵一致；當把疾病標籤從健康對照改為阿爾茨海默病時，腦室進一步擴大，與AD患者的典型腦萎縮特徵吻合；當把模態從T1改到T2、FLAIR時，圖像對比度按照各模態的物理特性發生改變；當指定為T1增強的膠質母細胞瘤時，圖像中出現了強化腫瘤的典型表現。

贊助商廣告

在生成保真度方面，研究團隊計算了三維Fréchet Inception Distance（3D-FID，一種衡量生成圖像與真實圖像分布差異的指標，數值越低越好）。在14個條件組合的綜合評估中，生成圖像與令牌器重建圖像的FID為34.4，生成圖像與原始真實圖像的FID為107.3。令牌器自身的重建誤差（重建圖像與原始真實圖像的FID）為77.4，這說明生成圖像與重建圖像之間的差距（34.4）已經明顯小於令牌器的重建誤差（77.4），即生成模型在令牌器的能力範圍內表現良好，gen-vs-real的較大差距主要來自令牌器的壓縮損失，而非生成模型本身的不足。這與已有文獻中報告的3D醫學圖像生成FID範圍（40至120）相比，具有競爭力。

此外，研究團隊還做了一個重要的安全檢查：驗證AI生成的圖像是否只是在"背誦"訓練數據中的真實圖像，而不是真正地泛化創造。他們計算了生成圖像與訓練集中每張真實圖像在38400維潛在空間中的最近鄰距離，發現生成圖像到最近真實訓練圖像的平均距離是真實圖像之間平均距離的1.55倍，而且1088張生成圖像中沒有一張落在真實圖像相互距離分布的最低5%閾值（14.4）以內。這意味著AI是在真正地"創造"，而不是"抄襲"。

六、時間維度：預測你的大腦未來長什麼樣

除了橫截面的條件生成，研究團隊還把同一個凍結令牌器用於縱向預測：給定一個患者今天的腦部MRI，預測若干年後這個大腦會變成什麼樣子。

這個縱向DiT使用了約25000對ADNI數據集中的"基線-隨訪"T1圖像對（按患者劃分訓練集和驗證集，驗證集包含2900對），學習如何從基線潛在表示和指定的時間間隔Δt，生成隨訪時的潛在表示。

訓練這種時間預測模型有一個技術上的陷阱：如果只是簡單地把基線圖像和隨訪圖像之間做線性插值（x_t = (1-t)·基線 + t·隨訪），模型會找到一個"捷徑"——它只需要在t=0時輸出基線，在t=1時輸出隨訪，中間階段線性過渡，完全不需要利用Δt的資訊。為了打破這個捷徑，研究團隊在插值公式里加入了一個"消失端點布朗包絡"：在基線（t=0）和隨訪（t=1）兩個端點上，包絡項為零，因此不會改變端點的值；但在中間時刻（比如t=0.5），包絡項加入了一定幅度的隨機性，使得模型必須把Δt作為條件來預測這個隨機性的模式，從而無法走捷徑。

贊助商廣告

在評估上，研究團隊從64個獨立驗證患者的基線圖像出發，預測Δt分別為0、1、2、5、10年時的圖像，然後用在真實ADNI數據上訓練的腦齡預測器來評估生成圖像的腦齡。結果顯示，生成圖像的腦齡與請求的Δt之間的Pearson相關係數為0.716，斜率為0.268——意味著每請求增加1年，生成的腦齡大約增加0.268年。這個斜率明顯小於1，說明模型傾向於向平均值靠攏，預測的變化幅度約為真實變化幅度的27%。這種向均值回歸的現象是隨機橋正則化斯坦福和根特大學聯合研發一個AI大腦同時讀懂你的腦子又能畫出你的腦子的固有特性，並不意味著模型無法感知時間方向，而是預測的幅度被壓縮了。

從視覺上看，預測圖像的差異圖（隨訪圖像減去基線圖像的絕對值）在腦室區域和腦溝邊緣最為顯著，與真實老化和痴呆進展中腦萎縮最先發生的解剖區域完全吻合——這說明模型不僅知道大腦會變化，還知道變化發生在正確的位置。

這個縱向預測模組使用的是第一階段和第二階段訓練出來的同一個凍結編碼器，沒有對編碼器進行任何再訓練。這說明這個編碼器學到的表示空間，不僅對橫截面的臨床屬性預測有用，也對時間動態的建模有用，是真正意義上的"雙重用途"。

七、與過去方案相比：為什麼先讀懂再畫很重要

在整個研究中，研究團隊有一個重要的架構選擇需要驗證：為什麼要用MAE+CNN的兩階段方案，而不是直接用傳統的CNN變分自編碼器（VAE）端到端訓練？

他們在一個由1100張腫瘤圖像組成的小規模數據集上進行了對比實驗，把標準的AutoencoderKL（AKL，即3D醫學生成領域的標準CNN-VAE令牌器）與MAE+CNN方案在匹配的計算量下進行比較。結果表明，在相同的潛在空間維度（614K元素）下，MAE在IDH1突變預測上領先AKL +0.064 AUC，在WHO腫瘤分級上領先+0.046 AUC。即使把MAE的潛在空間大幅壓縮到僅38K元素（AKL的6%），MAE在IDH1預測上仍然領先+0.060 AUC，在腫瘤分級上與AKL持平。與此同時，MAE在訓練效率上也更有優勢：70%的遮罩率意味著每次訓練步驟只需要處理1200個令牌中的360個，相同顯存預算下可以使用更大的批次尺寸。

贊助商廣告

這個結果印證了研究團隊的核心假設：編碼器學到什麼，比重建像不像更重要。MAE通過"從殘缺推斷整體"的自監督任務，學到了更豐富的臨床資訊；而AKL通過重建目標訓練的編碼器，把資源主要用於保留局部像素細節，臨床資訊反而流失了。

說到底，BrainG3N的故事可以這樣來理解。醫學影像領域有兩種人——放射科醫生和醫學插畫師。放射科醫生深刻理解每一張圖像背後的臨床含義，但他不一定能畫出一張精確的腦部圖像；醫學插畫師能畫出精確的圖像，但他未必理解每一個解剖結構對應什麼疾病。過去的AI系統往往只培養了"插畫師"，結果它能畫出看起來很像的腦圖，但問它這個腦是什麼年齡、是不是有腫瘤，它答不上來。BrainG3N的方案是：先用35000多張真實腦圖把"放射科醫生"培養好，然後再給他配一個專職"插畫師"——由放射科醫生告訴插畫師要畫什麼特徵，插畫師負責把細節畫出來。兩者分工明確，互不干擾。

這對普通人意味著什麼？歸根結底，這項技術可能會在未來改變神經科和腫瘤科的診斷方式。IDH1突變狀態目前需要開顱活檢才能確定，BrainG3N用MRI的AI分析就能達到0.937的預測準確率；腦齡差可以在明顯症狀出現前提示神經退化風險，而BrainG3N的預測誤差只有4.43年；對於數據稀缺的罕見疾病，系統能生成符合臨床規律的合成圖像來補充訓練數據；對於跨機構的數據共享，合成的"隱私保護圖像"可以在不泄露真實患者資訊的情況下，幫助其他醫療中心訓練AI模型。

當然，這項研究也有明確的局限。目前的驗證範圍僅限於腦部MRI，是否能遷移到CT、全身MRI、超聲等其他三維醫學影像，還有待進一步研究。縱向預測的幅度只恢復了真實變化的27%，仍有較大提升空間。在訓練規模對比上，與其他基礎模型的對比部分受到預訓練數據分布差異的影響，並非純粹的架構對比。此外，編碼器特徵中可以檢測到採集站點、場強、掃描儀廠商等"混雜因素"（相關AUC超過0.94），這意味著任何下游應用都需要謹慎地進行數據集匹配評估，以避免混雜因素干擾臨床預測。

贊助商廣告

有興趣深入了解研究細節的讀者，可以通過論文編號arXiv:2606.19651檢索完整論文，從數據集描述、預處理流程、超參數設置到生成結果的完整分解，原文均有詳細報告。

Q&A

Q1：BrainG3N的MAE編碼器是如何保留臨床資訊的？

A：MAE編碼器的核心訓練方式是"從殘缺推斷整體"：把一張腦部MRI切成1200個小塊，隨機遮住70%，讓編碼器僅憑剩下30%的可見塊推斷出被遮住的部分。這個高難度任務迫使編碼器學習大腦的長程解剖結構關係，而非局部像素細節，從而自然地積累了豐富的臨床資訊。在23項臨床任務的線性探測中，這種能力轉化為對腫瘤基因特徵、疾病類型、腦齡等臨床屬性的高精度預測。

Q2：BrainG3N生成的腦部圖像會不會只是抄襲訓練數據中的真實圖像？

A：研究團隊專門做了記憶化檢查。他們計算了1088張生成圖像與訓練集中33639張真實圖像在38400維潛在空間裡的最近鄰距離，發現生成圖像到最近真實圖像的平均距離是真實圖像相互距離的1.55倍，且沒有任何一張生成圖像落在真實圖像距離分布的最低5%閾值以內，說明生成圖像是真正意義上的"創造"，不是對訓練數據的記憶復現。

Q3：BrainG3N的縱向預測為什麼只恢復了約27%的真實變化幅度？

A：這是隨機橋正則化的固有特性。訓練中使用的"消失端點布朗包絡"讓模型在兩個端點（基線和隨訪）之間學習轉變過程，但這種隨機橋機制天然地讓模型傾向於向條件均值回歸，預測出的變化幅度被壓縮。簡單來說，模型能正確判斷大腦會"往哪個方向變"以及"在哪些區域變"，但對變化幅度的估計偏於保守，約相當於真實變化的27%。