剛剛，OpenAI最強編程智能體上線ChatGPT！AI的「終極外掛」來了

Altman 昨天早上還在 X 上賣關子，說有個研究預覽版本快上線，要給它起個「如果它成了會很好記」的名字。

贊助商廣告

就在剛剛，OpenAI 正式發布 Codex。

這是一款基於雲端運行的軟體工程智能 Agent，能夠並行處理多個開發任務，協助開發者高效完成編程工作。

UI 設計沒整花活，Codex 提供一個輸入框和兩個按鈕——「Ask」（提問）和「Code」（編碼）。你只需明確描述任務，它就會開始執行。

興奮的 Altman 在 X 平台連發數條推文表示：

有了這樣的工具，一個人竟然能做出這麼多軟體，真的讓人驚嘆又振奮。「你直接去做就行了」一直是我很喜歡的一句流行語，沒想到這麼快就能在 AI 和它的使用者身上體現，而且意義還這麼大。

it is amazing and exciting how much software one person is going to be able to create with tools like this.

"you can just do things" is one of my favorite memes; i didn't think it would apply to AI itself, and its users, in such an important way so soon. https://t.co/6QrZkV4oo9
— Sam Altman (@sama) May 16, 2025

Codex 能勝任的工作不僅僅是編寫功能代碼，還包括理解代碼結構、回答關於代碼庫的問題、修復 bug，甚至直接提交可審查的拉取請求（Pull Request）。

每個任務都在雲端獨立的沙箱環境中執行，自動加載用戶的代碼倉庫。運行時長從 1 分鐘到 30 分鐘不等，取決於任務複雜度，同時用戶可以實時查看任務進度。

任務完成後，Codex 會輸出一整套可追溯的執行結果，包括終端日誌、測試記錄等驗證資訊。你可以對修改結果進行審查、提出建議，甚至直接在 GitHub 上發起 PR，或者合併進本地項目。

藉助項目中的 AGENTS.md 文件，用戶還可自定義 Codex 的行為，讓它更貼合具體項目的開發規範與測試標準。

贊助商廣告

Codex 的核心模型為 codex-1，這是 OpenAI o3 系列裡專為軟體工程微調過的版本。

基準測試結果顯示，codex-1 在 SWE-Bench 的得分為 72.1%，紙面參數優於 Claude 3.7 以及 o3-high。

OpenAI Codex 1 model reaching 72.1% on SWE-bench verified beating Sonnet 3.7 Thinking (70.3%)

At pass@8 Codex 1 achieves 83.86% https://t.co/bKUvANyYGA
— Lisan al Gaib (@scaling01) May 16, 2025

訓練方式也很「實戰」，通過在真實開發環境中進行強化學習訓練，Codex 能夠生成更符合人類編碼風格和審查偏好的代碼，嚴格按照指令執行，並不斷運行測試，直到測試通過為止。

從今天開始，Codex 將向 ChatGPT Pro、Enterprise 和 Team 用戶開放，而 Plus 和 Edu 用戶的支持也將很快上線。

安全性方面，Codex 做得也夠克制。執行任務時，它只會訪問你提供的代碼庫和預設依賴，不能聯網、不能訪問外部 API，遇到不確定問題會停下來提示你處理。

並且，Codex 經過專門訓練，能夠識別並拒絕與惡意開發相關的請求，避免被濫用於開發惡意軟體。

目前，OpenAI 已在內部廣泛使用 Codex，協助工程師完成重構、命名規範、編寫測試等重複性任務，顯著提升開發效率。一些外部合作團隊也給出了積極反饋，比如 Cisco 與 Temporal 藉助 Codex 加快了開發與調試節奏。

在深夜直播中，OpenAI 的員工展示了 Codex 更具實用性的能力：

它能夠理解整個代碼庫的結構，自動定位並修復 bug，處理超時設置或拼寫錯誤等常見問題。即使是在命令行報錯時，Codex 也能分析出錯原因，自動生成修復腳本和相應的測試用例。

此外，它還具備代碼審查功能，能梳理所有改動點，並指出可能導致測試失敗的風險。換句話說，Codex 正在逐步進化為一個真正可用的編程協作助手。

贊助商廣告

OpenAI 員工也分享了他們用 Codex 管理大型代碼變更的經驗，即使這些變更代碼從未跑過本地環境，也能順利合併、通過測試。

知名科技作者 Dan Shipper 提前體驗了 Codex，並用一篇博客分享了他的使用感受。

在他看來，通過 Codex，用戶可以像管理團隊一樣分配任務，而不需要編寫代碼。Codex 特別適合資深開發者，在執行任務時能夠產生簡潔高效的代碼變更，並自動生成 pull request 提交到 GitHub。

然而，Codex 也有一些局限性，比如對於新手工程師不太友好，不擅長處理後續的修改與補充任務，並且尚未完全整合到主流開發平台如 GitHub 和 Slack。

它的設計主要面向專業開發者，而不是那些喜歡邊聊邊編程的用戶。Codex 的核心優勢在於提高高級開發者的工作效率，使他們能夠同時管理多個任務，從而加速開發進程。

如果你是技術主管、需要在已有項目中添加功能或修復 bug，那麼 Codex 是你會常用的工具；但如果你是在從零開始搞一個「一人十億級美元 SaaS」，可能就用不上它。

簡單來說，如果你一個人做了一個網站或工具，用戶通過訂閱使用，每月收入達到幾百萬，年收入破千萬甚至過億，那麼你就是在做「一人十億級美元 SaaS」。

we have a day-0 review from @danshipper and @kieranklaassen here for the curious: https://t.co/N0Ox9lrZyg
— Every 📧 (@every) May 16, 2025

除了雲端主力模型之外，OpenAI 還同步推出了專為命令行優化的輕量模型 codex-mini-latest，支持開發者在本地環境快速接入 AI。

Codex CLI 登錄流程簡潔，可直接使用 ChatGPT 賬號接入，並享受基礎的免費 API 配額。目前已向全球範圍內的 Pro、Enterprise 和 Team 用戶開放，未來幾周內還將陸續支持 Plus 與 Edu 用戶。

對於接入 codex-mini-latest 的開發者，該模型可通過 Responses API 調用，價格為每百萬輸入 tokens 花費 1.5 美元、每百萬輸出 tokens 花費 6 美元，支持高達 75% 的提示緩存摺扣，進一步降低調用成本。

贊助商廣告

OpenAI 對 Codex 的長線願景很明確：

它不僅是一個寫代碼的工具，更是未來協作模式的雛形。多代理、異步執行、自動匯報進度，這一套邏輯未來可能內嵌進 IDE、Git 工具、甚至 Slack 里，成為開發者真正的「副駕駛」。

目前 Codex 仍處於研究預覽階段，圖像輸入等高級功能尚未開放。

但過去那些對 AI 編程助手的暢想，比如自動寫代碼、提 PR、修 bug，終於在 Codex 身上以可用工具的形式落地，成為真正能上手、能跑進實際工作流的產品。