相信很多人都有過搜索自己名字的習慣,但如今這種操作似乎已經不再像以前那麼有意義了。隨著越來越多的人開始通過聊天機器人了解他人,網路搜索已不再是獲取資訊的唯一權威來源。
正是基於這一觀察,Thomas Dimson 和 Joey Flynn 共同創建了一個名為 In the Weights 的網站。所謂"權重"(Weights),指的是決定 AI 模型訓練過程與輸出結果的數值參數。這個網站的目標,是衡量"一個 AI 模型在不藉助網路搜索工具的情況下,能夠在多大程度上回憶起某個人的資訊"。
正如該網站所言:"進入權重,意味著你的存在在構建超級人工智慧的過程中被認定是重要的。"
In the Weights 的運作方式是:向多個主流 AI 模型(包括 Grok
、Gemini、多個版本的 GPT、Claude、Llama 以及一些較為小眾的模型)提出類似這樣的問題:"某某是誰?請列出最多 10 條結果,每條附帶簡短描述和置信度。"隨後,網站會將相似的描述歸類合併,並生成一個綜合"強度評分"。
以文章作者本人為例,其強度評分為 641 分,位於所有被搜索名字的前 6%。不過,當他發現多位 TechCrunch 的同事得分更高時,這份自豪感便打了折扣。此外,排行榜也在不斷變動——《小鬼當家》主演麥考利·克金目前以 988 分的高分暫居榜首,與歌劇演唱家盧恰諾·帕瓦羅蒂幾乎並駕齊驅。
搜索結果還會顯示哪些模型對特定名字給出了哪些答案,並標註潛在的"幻覺"問題。例如,GPT-4.5 Mini 就將"Anthony Ha"解讀為"一個可能指多個姓名縮寫為 A.H.A. 的人的模糊名字形式"。
在回應 TechCrunch 的詢問時,Dimson 表示,他和 Flynn 在離開 OpenAI 之後(兩人均通過旗下設計初創公司 Global Illumination 被收購後加入 OpenAI),希望重新激發創作熱情,因此萌生了這一想法。
Dimson 提到,他一直在思考"隨著更多流量向大語言模型遷移,谷歌自我搜索在 2026 年已經不再是正確的目標",以及"無數人的生命以某種方式被編碼在 AI 大腦中的一堆浮點數里"。他還表示,網站的整體方向受到了一篇戲謔性部落格文章的啟發,該文章將 AI 權重與 Terry Bisson 的經典科幻短篇小說《他們是肉做的》相結合。
"目前的反響非常熱烈,我們原本以為這只是一個小眾的趣味項目,沒想到它觸動了很多人想知道自己是否在超級智能中'永生'的心理——當然,能和別人比較分數這一點也功不可沒!"Dimson 補充道。
儘管"被聊天機器人記住"是否真的等同於某種形式的永生仍存疑問,但不可否認的是,這個結果既令人著迷,又不免讓人產生攀比心理——尤其是當一切都被量化成一個便於對比的分數時。AI 評論人 Anthony Moser 則調侃說,這"實際上就是讓 13 個聊天機器人告訴你你是誰"。當然,網站採用的可愛復古任天堂風格設計,也為其加分不少。
Dimson 表示,他計劃進一步研究:為何同一系列的不同模型會給出不同結果、哪些模型對特定類型的人存在偏見,以及哪些人"應該擁有維基百科詞條卻還沒有"。
Q&A
Q1:In the Weights 是什麼網站,它是如何工作的?
A:In the Weights 是由 Thomas Dimson 和 Joey Flynn 創建的網站,用于衡量 AI 模型在不藉助網路搜索的情況下對某個人的"記憶程度"。網站會向 Grok、Gemini、GPT、Claude、Llama 等多個主流 AI 模型提問,詢問某人是誰,並將各模型返回的結果歸類合併,生成一個"強度評分",分數越高代表該人在 AI 模型中的"存在感"越強。
Q2:In the Weights 的強度評分是怎麼算出來的?
A:網站向多個 AI 模型提出"某某是誰?請列出最多 10 條結果,每條附帶簡短描述和置信度"這類問題,再將各模型返回的相似描述歸類合併,最終生成一個綜合強度評分。分數越高,說明該名字在 AI 模型的訓練權重中被記錄得越充分、越準確。目前排行榜實時更新,不同名字的排名會隨時變動。
Q3:In the Weights 為什麼會標註"幻覺"問題?
A:AI 模型有時會對同一個名字給出不準確或自相矛盾的描述,這種現象被稱為"幻覺"。In the Weights 會在結果中高亮標註這類情況,幫助用戶識別哪些模型對某個名字的理解存在偏差。例如,GPT-4.5 Mini 就曾將"Anthony Ha"描述為"可能指多個人的模糊名字形式",這顯然是一種典型的幻覺輸出。






