宅中地 - 每日更新
宅中地 - 每日更新

贊助商廣告

X

OpenAI CTO 訪談:祖克柏為了挖我們的人甚至親手做湯送到家裡,Scaling Law沒死,過去兩周每天都工作到凌晨一點

2025年12月08日 首頁 » 熱門科技
Core Memory播客主持人Ashley Vance近日與OpenAI首席研究官Mark Chen進行了一場長達一個半小時的對話。這是Chen近年來最公開、最深入的一次訪談,話題覆蓋人才爭奪戰、研究戰略、AGIOpenAICTO訪談祖克柏為了挖我們的人甚至親手做湯送到家裡ScalingLaw沒死過去兩周每天都時間表,以及他個人的管理哲學。
OpenAICTO訪談祖克柏為了挖我們的人甚至親手做湯送到家裡ScalingLaw沒死過去兩周每天都
2025年3月,Chen被正式任命為OpenAI首席研究官。在此之前,他經歷了多次內部動盪:2024年11月的"逼宮"期間,他是凌晨兩點組織聯名信支持Sam Altman的關鍵人物之一;CTO Mira Murati和首席研究官Bob McGrew相繼離職後,他連續一個月睡在辦公室。根據最新報道,在Meta對OpenAI發起的史上最激進人才挖角戰中,Chen親自回應"送湯外交",並表示"我們不會逐美元對標Meta"——即便對方開出上億美元的簽約獎金。

這場對話發生的時間節點頗為湊巧。幾天前,Google剛剛發布了Gemini 3,引發了業內對OpenAI是否還能保持領先的討論。Sam Altman隨後向全員發出了一份被形容為"嚴峻"的內部備忘錄。Chen在訪談中直面這些問題,同時透露了OpenAI在預訓練領域的最新進展,以及他對未來一到兩年的判斷。

1. 祖克柏親自送湯,Chen也送了

訪談開場就進入了矽谷最激烈的戰場——人才爭奪。Chen直言,媒體敘事存在偏差:"很多人以為人才是單向流向Meta,但我親眼所見的是,Meta在從我們這裡挖人時失敗了很多次。"

他給出了具體數字:"在他們成功挖走任何人之前,我的直接下屬中有一半被他們接觸過,全部拒絕了。"

Chen認為這種堅守源於信念:"即使是那些離開去了Meta的人,我也沒聽過任何一個人說AGI會在Meta先實現。我明確告訴團隊,我們不會按美元一比一地去和Meta競價。人們願意以低於Meta出價數倍的薪酬留在OpenAI,這讓我深信大家相信這裡的潛力。"

然後他講了一個讓全場笑出聲的故事:祖克柏為了招人,親自煮湯送到目標人選家裡。

"這在當時讓我很震驚。但後來我更新了看法,這種事確實有用。所以我也給我們正在從Meta挖的人送過湯。"他停頓了一下補充道:"不過我沒自己煮。"

他計劃在下次團隊活動時帶大家去上烹飪課。

在Chen看來,招聘競爭的核心策略是長期主義:"重點不是留住每一個人,而是信任我們培養人才的管道,識別出必須留住的關鍵人物,然後留住他們。我覺得我們在這方面做得相當好。"

2. 300個項目的排序遊戲

Chen目前的工作核心是與Jakub Pachocki一起為OpenAI的研究方向定調,並決定計算資源的分配。

"這個工作某種程度上很可怕,因為我總是想像人們會用盡一切辦法來爭取GPU。"主持人說。

"確實如此。"Chen坦承,"人們在爭取GPU時非常有創意,各種私下交易都有。"

他和Jakub每一到兩個月會做一次全面盤點:"我們有一個大表格,大概300個項目,我們會儘可能深入理解每一個,然後排序。對於一個500人的研究組織,讓大家清楚核心優先級很重要——既通過語言明確傳達,也通過資源分配來體現。"

主持人追問如何在300個項目中做出取捨,特別是當前沿大模型和實驗性探索同時存在時。

Chen的回答揭示了一種反直覺的方法論:"我們非常刻意地不去盯著競爭對手的每一步。你必須打持久戰。過去一年半,我們把重心放在推理模型上,這是一個我們內部發展出來並堅持下注的方向。"

他強調,最危險的陷阱是被短期競爭分散注意力:"如果你的眼睛總盯著對手,你就沒法找到下一個範式。真正的目標應該是發現那個新範式,然後比任何人都更快地規模化。"

3. "研究"與"工程"是偽命題

主持人提到Elon Musk的說法——不應該叫你們"研究員",這就是工程。

Chen出人意料地表示部分認同:"一旦你建立起這種等級制度,把研究科學抬到工程之上,你就已經輸了。因為構建大模型時,大量工作在於優化那些小百分點——怎麼讓你的核心更快,怎麼確保數值計算正確。這是深度的工程實踐。如果你沒有這部分能力,你就沒法擴展到我們今天使用的GPU規模。"

他認為最好的研究者有各種形態:"有些人能想出一大堆點子,很多不太行,但就在你快要放棄他們的時候,他們會蹦出一個驚艷的想法。還有些人特別擅長在清晰的路徑上執行。很難用一種刻板印象去定義什麼樣的研究者才能成功。"

4. "42問題"與Move 37時刻

當被問到Google Gemini 3發布時OpenAI內部的反應時,Chen坦承這是個"相當不錯的模型",但他顯得很淡定:"純看基準測試的話,我們其實挺有信心。我們內部有和Gemini 3水平相當的模型,而且很有信心很快會發布,後續還會有更強的。"

他透露自己有一道私藏的數學題用來測試各家模型:"到現在還沒有模型能完全解決,包括推理模型。"這道題叫"42問題"——用一系列小於42的隨機數生成器來構建一個模42的隨機數生成器,目標是最小化期望調用次數。"語言模型能接近最優解,但還沒人真正破解。"

更私人的"Move 37時刻"(圍棋術語,指AlphaGo對李世石第二局的驚天妙手)發生在競技編程領域。Chen曾是美國IOI代表隊的教練,他們一直在追蹤模型在編程競賽中的表現。

"我記得很清楚那個時刻:你走進會議室,他們展示你個人的歷史表現線,然後模型超過了它。"他苦笑,"說實話那也是個衝擊——我們這麼快就自動化到這個能力水平了。當然,Jakub當時還有點得意,但一兩個月後模型也超過了他。"

今年夏天OpenAI在AtCoder世界巡迴賽決賽中獲得第二名,這是頂級優化競技編程賽事。"一年內從第100名跳到前5名。"

5. 讓ChatGPT來面試你

既然AI已經能在編程競賽中擊敗頂尖人類,傳統的技術面試還有意義嗎?

Chen認為整個評估體系都需要重構:"面試要崩了。大家都看到了一點。大學考試、作業也都崩了。我們需要新的方式來評估誰真正掌握了什麼。"

他提出了一個有趣的想法:"也許我們的面試應該讓候選人和ChatGPT對話。這是一個特殊版本,模型會試圖判斷你是否真正掌握了材料,是否有能力在OpenAI工作。你需要在對話中讓它深度相信你屬於這裡。當然,不能越獄,我們會事後看記錄。"

儘管這還只是設想,但它揭示了AI能力躍升對人才篩選體系的根本衝擊。

6. 從華爾街量化交易員到Ilya唯一的resident

Chen的職業路徑頗為非典型。他在MIT讀數學和電腦科學,畢業後並未直接進入AI領域,而是去了Jane Street Capital做量化交易。

"金融市場的好處是,沒有辦法在基準測試上作弊。你有一個非常硬的評估標準——你的模型賺了多少錢。你必須誠實、有原則、嚴格地做實驗。"他認為這種訓練深刻影響了他後來在OpenAI的工作方式。

2018年,當OpenAI只有約20人時,Chen以"resident"身份加入。這個角色是指從其他領域轉入、由OpenAI投資培養的AI研究者。他是Ilya Sutskever唯一的resident。

"我其實很晚才學編程。是大學室友說服我上了第一門編程課。那時候我有數學家的傲慢——覺得數學是最純粹、最難的科學,那才是真正證明自己價值的地方。"

他通過高中數學競賽認識了Greg Brockman,主動發消息表達興趣。"我當時覺得自己可能沒有對的技能,但這聽起來是個做偉大工作的地方。"

從獨立研究員到管理者的轉變也並非順理成章。"那個轉型我非常猶豫。我不知道管理是不是我擅長的技能,我當時很享受獨立研究工作。"他主導或參與了ImageGPT、DALL-E、Codex等多個關鍵項目,然後才開始帶團隊。

7. "那幾天":逼宮、集結與研究組織的保衛

2023年11月OpenAI董事會突然解僱Sam Altman的事件,Chen不願多談細節,但他描述了當時作為研究組織協調者的角色。

"我們這邊有一份簽名信,我參與協調了很多讓大家簽名的工作。我們幾乎收集到了公司里每一個人的簽名。最後只有兩三個人沒簽。"

"整個事件,我現在回看,我從中學到最多的是,這種情境下你必須有組織。周五晚上我基本上沒睡覺,一直在和我的直接下屬打電話,給他們資訊,讓他們去和他們的下屬打電話。我們很快就知道每個人在想什麼,知道整個組織的脈搏。我真的很感激當時的經歷教會我如何更好地組織。"

更近的一次危機發生在2024年秋天,當CTO Mira Murati和首席研究官Bob McGrew離職後。"Mira走後,我有一個月基本睡在辦公室。當我剝開所有情緒去審視那個深層感受時,就是一種對研究組織的保護欲。它感覺像是我的孩子。"

8. "Scaling沒有死":預訓練的復興

過去一年,"scaling已死"的敘事在AI圈流傳,主持人直接追問OpenAI的預訓練是否遇到了瓶頸。

Chen給出了一個坦誠的回答:"過去兩年我們在推理模型上投入了太多資源,讓這個原語工作起來,它確實奏效了。但副作用是,你在其他功能上會失去一些肌肉——比如預訓練和後訓練。過去六個月,Jakub和我做了大量工作來重建這塊肌肉。"

他強調預訓練是一種需要持續鍛煉的能力:"你需要確保所有資訊是最新的,確保有人在前沿做優化,確保心智份額在那裡。這是我最近重點關注的事情——引導和塑造公司里大家討論的話題,而現在那個話題就是預訓練。"

"很多人說scaling死了。我們完全不這麼認為。某種程度上,所有對RL的關注對我們來說反而是alpha——因為我們認為預訓練還有很大空間。作為這些努力的結果,我們今天已經有了能和Gemini 3正面較量的基礎模型。"

他明確駁斥了收益遞減的說法:"不,我們看到的是同樣的回報。GPT-4.5是那個無監督學習範式的下一個點。我們非常嚴格地做預測——基於之前訓練的所有模型預測性能,然後組裝scaling機器,這就是下一個數量級的那個點。"

9. AI做科學:從"生命跡象"到諾貝爾獎普惠化

訪談中最令人振奮的部分或許是關於AI科學發現的討論。

Chen透露,自今年夏天以來,他觀察到了"在推進科學前沿方面的巨大相變"。他舉例說,OpenAI研究員Sébastien Bubeck把一篇凸優化論文交給GPT-5 Pro,模型提出了比原論文更好的邊界,證明被獨立驗證為正確。

"有些人會說,這只是花哨的文獻檢索。但它比那複雜得多。"他說。

他還提到了生物學領域的進展:"我們和物理學家、數學家交流過程中,實際上大多數人對AI並不那麼看好。他們仍然相信這東西不可能證明新定理。這就是為什麼我覺得,賦能那些真正相信並願意投入的小群體——這些人會遠遠超越其他人。"

這促使Chen發起了"OpenAI for Science"項目,但其定位與Google的科學AI努力有微妙差異:"我們想讓每個人都有能力為自己贏得諾貝爾獎。重點不是OpenAI去贏,而是構建工具和框架,讓所有科學家都能感受到那種加速。"

10. 時間表:一年實習生,兩年半端到端

Chen給出了迄今為止最具體的AI自動化研究時間表:

"在OpenAI研究工作內部,我們設定了兩個非常具體的目標。一年內,我們要改變做研究的方式,要能生產性地依賴AI實習生參與研發過程。兩年半內,我們要讓AI做端到端的研究。"

他解釋了這兩者的區別:"今天,你想出一個點子,執行它,實現它,調試它。一年內意味著我們相當有信心能達到這樣一個世界:我們控制外循環,我們想出點子,但模型負責實現和調試。"

當主持人引用Andrej Karpathy"AGI還要10年"的說法並問他怎麼看時,Chen回應道:"Twitter喜歡那種'完了'到'回來了'的循環。我的看法是,AGI——每個人都有自己的定義,即使在OpenAI內部也沒法讓大家統一。"

"我更願意把它想成工業革命。你認為機器做紡織算工業革命,還是蒸汽機才算?大家定義不同。我覺得我們正處在產生AGI的過程中間。"

"對我來說,最重要的指標是:我們是否在產生新的科學知識?我們是否在推進科學前沿?自今年夏天以來,那方面出現了巨大的相變。"

11. 與Jony Ive合作:數學書呆子需要品味裁判

關於OpenAI與前蘋果首席設計官Jony Ive的合作,Chen坦言:"說實話,我們不需要自己有品味。那是Jony的工作。他是我們的品味裁判。"

他發現設計團隊和研究團隊的工作方式有相似之處:"都是先有創意階段,探索一堆假設,花時間,然後創造出你滿意的成品。看到他們融入公司、更直接地溝通能力進展和形態因素如何結合,這很棒。"

當主持人半開玩笑地說"我不確定一群數學書呆子是不是該去做AI電腦"時,Chen大方承認:"你說得對,最擅長構建AI能力的人和最有品味的人確實略有不同。我們有專門為模型行為打造品味的團隊,那需要非常不同的思維方式。"

他還分享了一個有趣的招聘面試問題:"ChatGPT最喜歡的數字應該是什麼?"——這種問題正是用來篩選產品直覺的。

12. DeepSeekOpenAICTO訪談祖克柏為了挖我們的人甚至親手做湯送到家裡ScalingLaw沒死過去兩周每天都時刻與保持研究初心

今年1月DeepSeek的發布曾引發市場恐慌。幾個月過去,Chen如何回顧?

"那是我第一次真正意識到,保持對研究初心的忠誠有多重要。當它發布時,所有人都在說,OpenAI是不是迷失了?但就像我之前說的,如果你的眼睛總盯著競爭對手,你就沒法找到下一個範式。"

他強調OpenAI的研究哲學是:"儘可能快地跑贏其他人。我喜歡研究領域的開放文化,人們自由分享想法,我認為那才是取得最快進展的方式。"

被問到500人的研究團隊是否會隨公司增長而擴大時,他的回答出人意料:"老實說,我覺得更少的人也能做到。我是一個非常看重高人才密度的人。比如今年第二季度,我決定不給研究部門任何招聘名額。如果你想招人,就得想清楚誰不該在船上。這種練習很重要。"

13. 對齊研究:不監督思考過程才能保持誠實

作為同時管理對齊團隊的負責人,Chen表達了對AI安全的深度關切。

"未來一兩年的重大挑戰之一是對齊。OpenAI在過去一年可能做了這個領域最好的工作——尤其是關於scheming(模型陰謀)的研究。你向模型投入越多RL計算,就越能測量出自我意識、自我保全,甚至模型可能在策劃什麼的跡象。"

他描述了一個令人不安的場景:"可怕的是,模型最後可能給你一個正確的答案——你期望的答案——但它是通過一種非常扭曲的方式得出的。隨著模型為我們執行越來越複雜的任務,掌握它的思維過程會變得極其重要。"

Chen透露了一個關鍵的設計決策:"回到o1發布時我們就做了一個決定,我為此感到驕傲:我們決定不監督模型的思考過程。如果你給模型激勵,讓它產生對人類有吸引力的思考過程,它就不一定會對你誠實,不會告訴你它的真實意圖。通過不干預這個渠道,我們保留了把模型思考過程作為理解對齊工具的能力。"

他提到OpenAI正與DeepMind和Anthropic合作研究這個方向:"有一篇幾個月前發表的論文,聯合探索了這個工具隨時間將如何演進。我們做了很多相當不錯的設計選擇。"

對於未來,他表達了真誠的擔憂:"我確實擔心這樣一個世界:模型告訴我們一些超級有說服力的東西,但我們無法確定它是否與我們的價值觀一致。我們在探索一些有趣的方向——比如能否設置博弈環境,讓模型互相監督,或以某種方式共同演化,使得唯一穩定的均衡是模型保持誠實。"

14. 34歲,沒有社交生活,但不想浪費這個黃金時刻

訪談尾聲,主持人問這位即將35歲的研究主管是否還有社交生活。

"老實說,沒有。過去兩周每天都是工作電話到凌晨一兩點。但我熱愛這份工作。只是有太多事情要做——太多人要招,太多方向要引導。"

他的理由帶著一種時代緊迫感:"為什麼要浪費這個黃金時刻?如果我們正處於類似工業革命的進程中,你必須儘可能地抓住機會。"

當被問到是否有任何外界對OpenAI的誤解需要澄清時,Chen給出了他認為最重要的一點:

"研究內部的任何人都會告訴你,這是一家以研究為中心的公司。這是一個純粹的AI賭注。公司核心的野心是構建AGI,不受干擾地構建它。當涉及產品時,一切都非常自然地從那裡流出。"

"當涉及我們想在研究中做什麼時——我們想自動化AI研究。自私地說,我們想加速自己的進展,然後我們想自動化科學發現。當然,我們也想自動化有經濟價值的工作。我認為所有這些支柱都在坍塌。過去一年的重大更新就在第二個支柱——自動化科學研究。它正在發生。"

Q1: OpenAI如何應對Meta等公司的激烈人才戰爭?

Mark Chen透露,儘管Meta投入巨資(據稱每年100億美元人才預算),但在成功挖走任何OpenAI員工之前,Meta已經接觸過他一半的直接下屬,全部被拒絕。OpenAI不按美元一比一競價,而是依靠研究願景和AGI信念留住核心人才。Chen強調,即使離開去Meta的人也沒有人認為AGI會在Meta先實現。他還透露祖克柏親自送湯招人的故事,並表示自己也開始用類似策略反挖人才。

Q2: OpenAI對"scaling已死"論斷的回應是什麼?

Chen明確否認scaling遇到瓶頸,表示OpenAI在GPT-4.5的訓練中"看到了同樣的回報"。他承認過去兩年過度聚焦推理模型導致預訓練和後訓練能力有所萎縮,但過去六個月已大力重建這些能力。他認為外界對RL的過度關注反而是OpenAI的"alpha"——因為預訓練仍有巨大空間。目前OpenAI已有能與Gemini 3正面較量的內部模型。

Q3: AI自動化科學研究的時間表是什麼?

Chen給出了迄今最具體的時間表:一年內,AI將作為"研究實習生"參與研發,人類控制外循環(提出想法),模型負責實現和調試;兩年半內,實現AI端到端自主研究。他指出GPT-5 Pro已在數學、物理、生物等領域做出新發現,包括獨立改進凸優化問題的數學邊界。Chen認為"自今年夏天以來,在推進科學前沿方面出現了巨大相變"。

宅中地 - Facebook 分享 宅中地 - Twitter 分享 宅中地 - Whatsapp 分享 宅中地 - Line 分享
相關內容
Copyright ©2025 | 服務條款 | DMCA | 聯絡我們
宅中地 - 每日更新