Meta 的超級智能實驗室 Superintelligence 才剛剛拉開大幕,資金、算力應有盡有,CEO 小扎更是親自下場喊口號,勢必要讓「人人都有超級智能」。
可偏偏就在這個時候,Meta 研究科學家 Rishabh Agarwal 剛剛發推宣布——他要走人了。
來品品他的離職宣言:
「這是我在 @AIatMeta 的最後一周。是否繼續加入新的 Superintelligence TBD 實驗室對我來說是一個艱難的決定,尤其是在那樣的人才與算力高度集中的環境下。但在 Google Brain、DeepMind 和 Meta 度過了 7.5 年之後,我還是感受到一種驅動力——去承擔一種不同類型的風險。」
聽到這裡是不是覺得,噢,這就是常規離職套話?別急,他還補了一刀:
「Mark 和 Alexandr Wang 提出的加入 Superintelligence 團隊的願景極具吸引力。但最終我選擇遵循 Mark 本人的建議:『在一個變化如此之快的世界裡,你能冒的最大風險就是不冒任何風險。』」
笑死,沒想到原本祖克柏掏心掏肺的毒雞湯,直接成了 Rishabh 遞辭職信的理由。
而為了贏得 AI 競賽,最近的 Meta 的招聘節奏也是異常激進。
小扎向不少頂級研究員開出了高達九位數美元的薪酬,甚至親自通過電子郵件和 WhatsApp 等方式從 OpenAI、Google 等公司招募人才,開出的總薪酬有時能達到 1 億美元。
截至 8 月中旬,Meta 已成功從 OpenAI 挖走超 20 人,從 Google 挖走至少 13 人,3 名來自蘋果 ,3 名來自 xAI,2 名來自 Anthropic,總計新員工超過 50 名。
然而,最近有傳言稱,Meta 在持續數月大舉招攬了超過 50 名 AI 研究員和工程師後,已於上周開始凍結其 AI 部門的人員招聘,並全面縮減 AI 部門規模,重組 AI 團隊。
Meta AI 業務將被重組為研究、訓練(TBD Lab 待確定實驗室)、產品和基礎設施四個核心團隊 ,大部分團隊負責人都將直接向Wang匯報。此前負責 Llama 大模型的 AGI 基金會團隊也在此次重組中被正式解散。
或許 Rishabh 也受到了重組風波影響。
不過,Rishabh 在 Meta 的時候可不是混日子的。根據他的描述,在短短幾個月裡,他就和團隊折騰出了不少成果,比如推動了在「思考型」模型在後訓練方面的進展。
具體包括:
- 通過 RL 擴展,將一個 80 億參數的稠密模型推到了接近 Deepseek-R1 的性能。
- 在中期訓練中使用合成數據,以便更好地啟動 RL。
- 開發了更優的 on-policy 蒸餾方法。
細看 Rishabh 的履歷,在 AI 圈也算上實力派選手。
他本科畢業於印度理工學院孟買分校,主修電腦科學與工程。隨後他在加拿大魁北克人工智慧研究所 Mila 攻讀博士,論文方向是深度強化學習的突破性探索,師從 Aaron Courville 和 Marc Bellemare。
Google Scholar 顯示,他參與並發表了一系列有影響力的研究論文,包括 Gemini 1.5 與 Gemma 2 ,引用量分別超過 2500 和 1200 次;2021 年的《Deep Reinforcement Learning at the Edge of the Statistical Precipice》和《Neural Additive Models》也都有較高影響力。
整體來看,他的學術引用總數已超過 1 萬次,h-index 為 34,i10-index 為 41。研究領域也覆蓋得很全面——多模態理解、開放語言模型、可解釋性神經網路,還有離線強化學習,基本上把當下最熱門的幾個方向都摸了個遍。
工作經歷方面,他目前在麥吉爾大學擔任兼職教授,自 2024 年 9 月起任職至今,在加入 Meta 之前,他在 2023 年至 2025 年期間任職於 Google DeepMind,擔任研究科學家,研究內容聚焦於強化學習、自我改進與大語言模型的蒸餾。
此外,他在 Google Brain 工作了 5 年,擔任高級研究科學家,從事深度強化學習研究,並在 NeurIPS 2021 上獲得過最佳論文獎,再往前,他在 2018 年初曾在 Waymo 實習。
對於 Rishabh 來說,離職宣言裡的那句「去承擔一種不同類型的風險」,或許是真心話。
憑藉在 Google、Meta 等公司手裡攢下的履歷和影響力,已經足夠支撐他轉身去追求更自由的研究或者更大的舞台。