馬斯克xAI Grok-1.5模型可處理128k上下文

今日（3月29日）消息，馬斯克旗下人工智慧公司xAI今天在官方部落格中宣布，正式推出Grok-1.5大語言模型。

贊助商廣告

Grok-1.5具有改進的推理能力和128k的上下文長度，其中最顯著的改進之一是其在編碼和數學相關任務中的表現。Grok-1.5將在未來幾天內在平台上向早期測試人員和現有的Grok用戶推出。

在官方測試中，Grok-1.5在MATH基準上取得了50.6%的成績，在GSM8K基準上取得了90%的成績，這兩個數學基準涵蓋了廣泛的小學到高中競賽問題。此外，它在評估代碼生成和解決問題能力的HumanEval基準測試中得分為74.1%。

附測試對比表如下：

長上下文理解方面，Grok-1.5能夠在其上下文窗口內處理多達128ktokens的長上下文。這使得Grok的記憶體容量增加到之前上下文長度的16倍，從而能夠理解更長文檔中的資訊。

贊助商廣告

據介紹，Grok-1.5構建在基於JAX、Rust和Kubernetes的自定義分布式訓練框架之上。自定義訓練協調器可確保自動檢測到有問題的節點並將其從訓練作業中剔除。xAI還優化了檢查點、數據加載和訓練作業重新啟動，以最大限度地減少發生故障時的停機時間。

馬斯克xAI Grok-1.5模型 可處理128k上下文