「聰明得可怕」,這是馬斯克預告 Grok 3 時的說法,以至於今天一大早,全網都是下面這個樣子👇🏻
All of 𝕏 waiting for Grok 3 pic.twitter.com/RtFp3lDHFj
— TheÐogeGlory (@GloryDoge) February 18, 2025
在全網蹲點發布會時,App Store 先一步更新了。而在發布會進行過程中,Grok 網頁版也一度火到崩潰。
可以,看著很有信心的樣子。
Grok 3 不是一個簡單的產品疊代,在此之前,是馬斯克大手筆建設的數據中心、豪氣的顯卡配置,採用最佳的預訓練模型並繼續使用強化學習進行訓練,堪稱「富養」出來的新一代。

要點提煉如下:
美區賬號已經可以更新,英區、歐洲 2.28 推出
推出 SuperGrok 高級訂閱計劃,月費為 30 美元,年費為 300 美元,提供額外的推理和 DeepSearch 查詢功能,包含了無限量的圖像生成服務
Grok 3 推理能力領先 DeepSeek R1
在 Chatbot 競技場之稱的 LMSYS 盲測中,Grok 3 在代碼、指令響應等各個方面排名第一。

作為誕生於 20 萬張顯卡的產物,Grok 3 斷層級別的表現證明了 Scaling Law 仍在生效。

相比於 DeepSeek 以低成本創造高收益,Grok 3 主打一個「大力出奇蹟」。
Grok 3 seems very strong. Great proof that the scaling laws are not, in fact, over. Very bullish for the future of AI. pic.twitter.com/fDBTWGKnoI
— Aaron Levie (@levie) February 18, 2025
這次,引入推理能力的 Grok 3 的重點在於更靈活地進行實時計算資源分配,在保證推理質量的同時,最聰明的使用計算資源。
曾經 Grok 2 就已經達到過當時的 SOTA 水平。在經過多次疊代之後,模型的泛化能力有大幅提升。Grok 3 在最新的 AIME 競賽中則再次刷新了自己的記錄。

不過,僅僅只是推理能力強顯然是不夠的,快、狠、准才能參與大模型內卷。發布會現場,工程團隊展示了兩個案例。
一個是請求生成一個從地球發射到火星並返回地球的 3D 動畫代碼,Grok 思考了 19 秒,詳細描述了其思考過程,包括使用 Python 進行繪圖,以及使用 NumPy 進行計算。

另一個則是試圖讓 Grok 將《俄羅斯方塊》和《寶石迷陣》這兩款遊戲結合起來,創造出一個新的遊戲。
很遺憾,Grok 一上來就遭遇了連續兩次的翻車,連馬斯克回頭看了螢幕上糟糕的演示環節,也不免尷尬地發出了一句「oh man」。

不過,後續演示中,也端上了正常的案例(該不會準備好的 demo 吧)。
而一些幸運的網友已經玩上 Grok 3 了。

圖片來自 X 網友 @jesselaunz
DeepSearch 登場,要革搜尋引擎的命
作為這次更新的重磅產品,Grok 3 加持的 DeepSearch 號稱是下一代搜尋引擎。模型將自主像 agent 一樣運作,並且理解用戶提問背後的意圖,省下在 Google 花的時間。
現場展示的環節里,工程師給 Grok 3 出了一道有趣的題:預測 NCAA 「瘋狂三月」的勝負數,也就是所有層級里的比賽結果。
這是巴菲特在 2014 年發起的一個活動,賭注高達十億美元,賭得就是讓巴菲特破產。歷史上無人成功,甚至無人接近,因為即使專家預測,前幾輪後也會出現大量錯誤。

2023 年 NCAA 對陣圖
當年這就是一個營銷活動,畢竟贏下的概率之小,幾乎是千千億分之一的概率,基本等於不可能。把這個問題甩給 Grok 3,不可謂不大膽。
返送的答案中,除了援引的材料,還做了結構化處理。開頭介紹、背景知識、分析圖表、總結陳詞,相當完整。

檢索的重點在於,如何交叉核實各個資訊源。Grok 3 通過設計一個子任務面板來完成這個工作,用戶可以自己實時監測正在進行的任務,從而保證答案是可用的、可靠的。

在這個基礎上,agent 自主檢索十分鐘,抵掉自己摸索一小時,才是有效減少工作量。
最終 Grok 3 也給出了它認為的 2025 年 NCAA 冠軍,三月還沒來,讓我們拭目以待它的「神預言」會不會成真。
至於 Grok 3 的體驗方式,官方說了,X 的 Premium 訂閱用戶將率先體驗,而其他高級功能則被納入 xAI 推出的新計劃——SuperGrok 中。
SuperGrok 的月費為 30 美元,年費為 300 美元,僅提供額外的推理和 DeepSearch 查詢功能,還包含了無限量的圖像生成服務。

賈維斯來了?還沒完全來
就在昨晚,Shivon Zilis 路透了她和有 Grok 3 加持的人工智慧助理 Ara 的對談,並稱這是生命中最意想不到的收穫。
Woah! That was one of the most unexpectedly rewarding hours of my life.
— Shivon Zilis (@shivon) February 17, 2025
Instead of passively listening to an audiobook about physics while doing errands as usual I had an hour long back-and-forth conversation with Ara from Grok 3 about a bunch of scientific topics.
We started…
簡直是徒增大家對語音模式的期待,馬斯克在發布會召開前就已經宣布語音模式只會在一周內推出,這也意味著無緣演示環節。
不過,在現場直播環節,馬斯克也表示這將是 Grok 最好的體驗之一,在發布會的尾聲,語音模型也放出了一個男聲,聽著倒是挺有人味的。
這一點點的路透,激起了極大的好奇,到了QA環節關於語音模式的提問湧上來。
當然,還有現在必不可少的靈魂拷問:「開源否」。
我們節選了一部分👇🏻
QA
問:Grok 語音模式什麼時候推出;是基於文本轉語音,還是能理解人類說話並直接回應的模型?
答:Grok 基本上會理解人類所說的話,預計在一周內發布早期版本,後續將迅速疊代更新。
問:什麼時候推出 Grok API?
答:將在接下來的幾周內推出,包含推理模型和深度研究功能。
問:Grok 能記住互動的談話內容嗎?
答:正在努力開發這個功能,不過目前還沒有完全完成。
問:是否還會開源 Grok 模型
答:當 Grok 3 成熟穩定之後,大概幾個月將會開源 Grok 2。
問:做這個項目最困難的部分是什麼?
答:最大的挑戰是讓整個模型在海量的 H100 上進行訓練,並保持一致性。