宅中地 - 每日更新
宅中地 - 每日更新

贊助商廣告

X

矽谷商戰變廚藝大賽?小扎親手煮湯挖人,OpenAI 說不慌都是演的

2025年12月03日 首頁 » 熱門科技

鷸蚌相爭,漁翁得利。有時候還挺希望我們用戶就是那個漁翁,模型廠商打得越厲害,我們就有機會越快用到更好的模型。

2022 年 12 月 22 號,在 ChatGPT 發布三周後,為了應對 OpenAI 的威脅,Google 成了第一個發布「紅色警報」的科技巨頭。

矽谷商戰變廚藝大賽?小扎親手煮湯挖人,OpenAI 說不慌都是演的

昨天,在 Gemini 3 發布兩周後,因為 Gemini 3 模型出現了大幅增長,OpenAI 發布了首個「紅色警報」。

看到消息的時候,我就覺得 OpenAI 是不是有點過度反應了,很快就看到了一些評論說「驕兵必敗」、還有「勝敗乃兵家常事」。

但轉念一想,所謂的「紅色警報」也許就是給投資人看的,畢竟 OpenAI 如果真的做不到第一,那個 2030 才能盈利的時間,只會拉得更長。

矽谷商戰變廚藝大賽?小扎親手煮湯挖人,OpenAI 說不慌都是演的

Gemini 的 App 下載量快要追上 ChatGPT

根據最新透露的消息,OpenAI 在下周即將推出一款新的推理模型,內部評估表現要比 Gemini 3 更好。此外,他們還計劃通過一個代號為「Garlic」的模型,來進行反擊。

但更現實的情況,是 OpenAI 必然會發布比 Gemini 3 更好的模型,而 Google 也還有 Gemini 4、Gemini 5。

其實,回看過去這一年來矽谷的新聞,完全算得上是一出跌宕起伏的抓馬大戲。年初被 DeepSeek R1 的橫空出世而感到壓力;年中則是小扎開啟的瘋狂「搶人模式」,天價薪酬刷新著所有人對 AI 人才的認知;到了年尾,又再次卷回到了樸素的模型比拼賽場。

矽谷商戰變廚藝大賽?小扎親手煮湯挖人,OpenAI 說不慌都是演的

在 OpenAI 研究主管 Mark Chen 的最新播客採訪中,矽谷的戰爭更是進化到了魔幻的程度,他說小扎為了挖走 OpenAI 的核心大腦,甚至開始做湯,真的能喝的湯,然後親自把湯送到研究員的家門口。

除了這些八卦,他也談到了 OpenAI 對於 Gemini 3 的看法、Scaling 是否已經過時、還有 DeepSeek R1 對他們的影響、以及公司內部的算力分配、實現 AGI 的時間表等。

Mark Chen 的背景非常有意思,數學競賽出身,MIT 畢業,去華爾街做過高頻交易(HFT),2018 年加入 OpenAI,跟著 Ilya 一起做研究。和奧特曼更偏向於商人屬性的特點不同,這些經歷,讓他身上也有一股非常明顯的特質,極度厭惡失敗,且極度信奉數學。

他坦言自己現在,完全沒有社交生活,過去兩周每天都工作到凌晨 1-2 點。

我們整理了這場長達一個半小時的採訪,總結了下面這些亮點,或許能更好的看清矽谷這一年來的各種「戰爭」、以及 OpenAI 會做些什麼努力,來繼續保持自己在 AI 時代的第一。

完整採訪影片:

關於 Gemini 3,我們真的「不慌」

OpenAI 真的怕 Google 嗎?Mark 的評價很客觀但也很犀利。他肯定了 Gemini 3 是個好模型,Google 終於找對路子了。

但是他說看細節,比如 SWE-bench(這也是 Gemini 3 刷榜那張圖片裡,唯一一個沒有拿到第一的基準測試)數據,Google 在數據效率上依然沒有解決根本問題。

矽谷商戰變廚藝大賽?小扎親手煮湯挖人,OpenAI 說不慌都是演的

Gemini 3.0 Pro 在 SWE-Bench 上的表現,比 GPT-5.1 還差了 0.1%

而他自己則是非常自信的表示,OpenAI 內部已經有了針對性的應對模型,而且他們有信心在數據效率上做得更好。

Mark 甚至說,奧特曼前幾天發那個說大家都要感到壓力的備忘錄,去嚇唬大家,其實更多的是為了注入緊迫感,他說這是管理層的慣用手段,備忘錄的目的在於管理層激勵團隊,而不是真的感到慌了。

我覺得Sam的工作之一就是要注入緊迫感和速度感。這是他的責任,也是我的責任。 作為管理者,我們的部分工作就是不斷給組織注入緊迫性。

矽谷商戰變廚藝大賽?小扎親手煮湯挖人,OpenAI 說不慌都是演的

此前 The Information 報道,奧特曼在 Gemini 3 推出時,在公司內部發備忘錄,提到會給 OpenAI 帶來困難

他們目前最大的問題,還是算力分配。作為 OpenAI 的研究主管,他的一項工作就是決定如何將算力分配到公司內部不同的項目。

他和 Jakub Pachocki(OpenAI 首席科學家)一起,負責制定 OpenAI 的研究方向,同時決定每個項目能拿到多少算力。為了這件事,他們每隔 1–2 個月,都會做一次盤點。

他們把 OpenAI 所有在做的項目,放進一張巨大的表格里,大概有 300 個;然後努力把每一個項目都看懂,給它們排優先級;再根據這個優先級表去分配 GPU。

矽谷商戰變廚藝大賽?小扎親手煮湯挖人,OpenAI 說不慌都是演的

英偉達和 OpenAI 的百萬 GPU 合作

他也提到,真正要用掉大部分的 GPU 的,甚至並不是訓練那個最重要發布的模型,而是他們內部在探索下一代 AI 範式的各種實驗。

所以,在他的眼裡,Gemini 3 發布了、某家開源模型刷榜了、某個思考模型又拿了新高分了;這些你追我趕的 benchmark 賽車一點都不重要。反而,最應該避免的,恰恰是被這場競賽牽著走。

他說,現在的模型發展,我們隨時可以靠一點「小更新」,就在榜單上領先幾周或幾個月但如果把資源都砸在這些短線疊代上,就沒有人去尋找下一代範式。

而一旦有人真的找到了,整個領域後面十年的路線,都要沿著那條新路走。

小聲嗶嗶幾句,預言 OpenAI 下周要發布的模型,我想就是在計劃之外,做了點小更新,然後刷新了幾個榜單而已吧,就這還沒慌嗎。

矽谷商戰變廚藝大賽?小扎親手煮湯挖人,OpenAI 說不慌都是演的

提到榜單的時候,他說他有自己的一套私房題,用來測試模型是不是真的具備了頂級數學直覺。他舉了一個 42 的數學難題,說目前的語言模型,包括 o1 這種思考模型能接近最優解,但從來沒有完全破解它。

你想創建一個模 42 的隨機數生成器。你手頭有一些質數,是模數小於 42 的質數的隨機數生成器。目標是,以最少的調用次數,組合出這個模 42 的生成器。

除了談到 Gemini 3,主持人也問了他對於 DeepSeek 的看法。

和 Gemini 3 一樣,Mark 承認 DeepSeek 的開源模型曾讓他們感到壓力,甚至懷疑自己是不是走錯了路。

但結論是堅持自己路線,不要被對手的動作打亂節奏,專注自己的路線圖。OpenAI 不會變成一個跟風的公司,他們要做的,就是定義下一個範式。

Ilya 的 Scaling 裡面還有很多潛力,OpenAI 需要大規模預訓練

近期關於 Scaling 失效的討論紛紛揚揚,Ilya 先是在播客採訪裡面說,Scaling 的時代已經結束了,後面又在社交媒體上澄清,Scaling 會持續帶來一些改進,並不是停滯不前。

 

所謂的 Scaling Law,就是按經典老故事走向,這幾年建了巨大的算力基建,模型每 10 倍算力,本該有一波明顯躍遷。

但從 GPT-4 到 GPT-5,外界並沒有看到預期中那種「質變式」的提升,所以才會有「Scaling Law 失效了」的討論;而 Ilya 前段時間的訪談,則是進一步放大了這種觀點。

Mark Chen 對這個觀點,給出了堅決的反駁,「我們完全不同意」。他透露,過去兩年 OpenAI 在推理上投入了巨量資源,導致預訓練這部分稍顯退化。之前關於 GPT-5 遇到了預訓練的問題,其實也是因為他們把重心放在了推理上,而不是 Scaling Law 已死。

工作就是分配算力資源的他,再次重申算力永遠不會過剩,如果今天多 3 倍算力,他可以立刻用完;如果今天多 10 倍算力,幾周內也能全部吃滿。對他來說,算力需求是真實存在的,看不到任何放緩跡象。

矽谷商戰變廚藝大賽?小扎親手煮湯挖人,OpenAI 說不慌都是演的

OpenAI 的計算成本,計劃到 2030 年花費約 4500 億美元租用伺服器,紅色為推理計算成本、藍色為研發(不包含現金業務)、黃色為可盈利的計算

他也提到,過去半年,他和 OpenAI 首席科學家 Jakub Pachocki 已經將重心重新拉回,要開始重塑預訓練的統治力

他明確說他們會繼續做規模化模型,而且已經有一批算法突破,專門就是為了讓 Scaling 更划算,在相同算力下挖出更多性能,在更高算力下保持數據效率。

小扎的送來的真湯,抵不過 OpenAI 的雞湯

最後就是訪談里提到的八卦了,Meta 今年沒有別的新聞,媒體渲染了一整個季度的「OpenAI 人才/Apple 人才/Google 人才大量流失到 Meta」,Mark Chen 在播客里正面回應了這個話題,細節簡直有點「顛」。

他說小扎真的很拼,為了挖人,小扎不僅手寫郵件,還親自去送雞湯。人才戰打到最後,居然演變成「誰煮的湯更好喝」的 Meta 遊戲。

矽谷商戰變廚藝大賽?小扎親手煮湯挖人,OpenAI 說不慌都是演的

Meta 花大價錢挖人組建的超級智能實驗室名單

不過,在他的直接下屬中,Meta 曾試圖挖角一半的人,結果全部選擇繼續留下來。為什麼不走?不是因為錢,因為Meta 給的錢顯然更多,而是因為信仰

Mark 說,即使是那些跳槽去 Meta 的人,也沒有一個人敢說「Meta 會比 OpenAI 先做出 AGI」。留在 OpenAI 的人,是因為他們真的相信這裡才是 AGI 的誕生地。

他也提到自己從華爾街和玩撲克的經歷裡面學到,真正要守住的是核心人才,而不是每一個人在搞清楚,必須留下的是哪類人後,再把資源和關注度,全部壓在這部分人身上。

他說他最強烈的情緒,其實就是想「保護研究的本能」。在 Barrett(OpenAI 研究副總裁)離職那陣子,他甚至直接睡在辦公室睡了一個月,只為把研究團隊穩住。

矽谷商戰變廚藝大賽?小扎親手煮湯挖人,OpenAI 說不慌都是演的

Barret 目前和 Mira(OpenAI 前 CTO) 都在 Thinking Machines

那麼 OpenAI 所信奉的 AGI 又是什麼,主持人問他,Andrej Karpathy 在最近的一個播客裡面說,AGI 大概還要 10 年,你是怎麼想的。

Mark 先是調侃了一番 X 現在「驚」的各種文案,一下子是「AI 完了」、一下子又是「AI 又可以了」。他覺得,每個人對於 AGI 的理解都不同,即便在 OpenAI 內部,也很難有一個一致的定義。但他相信的是,OpenAI 在 AGI 道路上設置的目標。

一年內: 改變研究的性質。現在的研究員是自己在寫代碼、跑實驗。 一年後,研究員的主要工作是管理 AI 實習生。AI 應該能作為高效的助手,承擔大部分具體工作。

2.5 年內: 實現端到端的研究自動化。這意味著:人類只負責提出 Idea(頂層設計),AI 負責實現代碼、Debug、跑數據、分析結果,形成閉環。

從 Copilot 到 Scientist,Mark 強調,OpenAI for Science 的目標不是自己拿諾貝爾獎,而是建立一套工具,讓現在的科學家能一鍵加速,哪怕這需要重構整個科學評價體系,因為未來可能很難分清是人還是 AI 做的發現。

2 年半的時間很快,但這對於現在看來,是以周為單位疊代的 AI 行業來說,又是一場漫長的馬拉松。

矽谷商戰變廚藝大賽?小扎親手煮湯挖人,OpenAI 說不慌都是演的

預測市場給出的,到 2025 年底前最好的 AI 模型會來自哪個公司,Google 排在第一名

無論是祖克柏那鍋真金白銀的雞湯,還是 OpenAI 想要定義未來的理想主義雞湯,這場矽谷的「煮湯大戲」還遠未結束。Mark Chen 播客里表現出來的從容,或許能消除一部分外界的焦慮,但用戶還是會用腳投票,好的模型自己會說話。

宅中地 - Facebook 分享 宅中地 - Twitter 分享 宅中地 - Whatsapp 分享 宅中地 - Line 分享
相關內容
Copyright ©2025 | 服務條款 | DMCA | 聯絡我們
宅中地 - 每日更新