思維鏈就是思維麼？OpenAI o1系列發布，開啟推理新範式

思維是什麼？AI具備思維了麼？著名的教育家約翰·杜威這樣定義思維：「以一種觀察到的事物為依據，去推測或判斷出其他的事物，然後將作為依據的事物當做後者推測數的事物的機遇或者基礎，從而產生信念。」

贊助商廣告

OpenAI的最新模型正向思維邁進，經過數月喧囂，OpenAI 終於揭開了「草莓」的神秘面紗——全新模型系列 o1 正式發布，主打「推理」能力。與以往追求快速響應的AI模型不同，OpenAI o1系列最大的特點在於其「慢思考」的模式。據OpenAI介紹，這些模型經過特殊訓練，能夠在回答問題之前花費更多時間進行思考，就像人類一樣。

通過模仿人類的思維過程，通過強化學習和「思維鏈」技術，引導模型自主解決問題。o1系列模型在解決複雜問題，尤其是在科學、編碼和數學等領域，展現出了超越以往模型的強大能力。例如，在國際數學奧林匹克資格考試中，o1系列最新版本o1正式版的準確率高達83.3%，而GPT-4o僅為13.4%，差距之大令人咋舌。

OpenAI o1系列的橫空出世，在業界引發了巨大震動。一些人歡呼雀躍，認為這是人工智慧發展史上的里程碑事件，預示著AI將具備更強大的推理能力，甚至接近人類思考水平；甚至直指垂直大模型將走向末路，而另一些人則持懷疑態度，認為這不過是OpenAI又一次的營銷炒作，新模型的實際能力還有待觀察；更有悲觀者認為：「一覺醒來，立刻就失業了！」

「慢思考」：通向類人智能的關鍵一步？

一直以來，大型語言模型（LLM）以其驚人的反應速度和資訊處理能力著稱。然而，這種「快」卻也伴隨著「不精確」的弊病。正如 OpenAI 研究負責人傑里·托雷克（Jerry Tworek）所言，現有的 LLM 往往會「產生幻覺」，即給出看似合理但實際錯誤的答案。

為了突破瓶頸，OpenAI 將目光轉向了人類的「慢思考」模式。o1 系列模型採用全新的訓練方法，不再局限於模仿訓練數據中的模式，而是通過強化學習和「思維鏈」技術，引導模型自主解決問題。

贊助商廣告

通過模仿人類的思維過程，o1系列模型在解決複雜問題，尤其是在科學、編碼和數學等領域，展現出了超越以往模型的強大能力。OpenAI 聲稱這種更強大的 o1-preview 「在物理、化學和生物學具有挑戰性的基準任務上的表現類似於博士生」。例如，在國際數學奧林匹克資格考試中，o1系列最新版本o1正式版的準確率高達83.3%，而GPT-4o僅為13.4%，差距之大令人咋舌。

o1 並非萬能：功能缺失與成本高企的挑戰

儘管在推理能力上取得了突破，但 o1 並非完美無缺。OpenAI研究負責人傑里·托雷克坦言：「我們不能說我們解決了幻覺。」，o1系列模型仍處於早期階段，存在諸多局限性。例如，它尚不支持網際網路搜索、文件和圖像上傳等功能，在許多常見應用場景下，GPT-4o仍是更優選擇。此外，o1 的運行速度較慢，且使用成本高昂。以 o1-preview 為例，其 API 調用費用為每 100 萬個輸入令牌 15 美元，每 100 萬個輸出令牌 60 美元，遠高於 GPT-4o 的 5 美元和 15 美元。

高昂的成本和有限的功能，勢必會限制 o1 的應用範圍。 OpenAI 首席運營官布萊德·萊特卡普（Brad Lightcap）也指出，對於許多常見應用場景，GPT-4o 在短期內仍將是更好的選擇。

商業化在提速：ChatGPT付費用戶突破1100萬

在技術不斷疊代的同時，OpenAI的商業化步伐也在加快。據報道，ChatGPT付費用戶數已突破1100萬。OpenAI首席運營官Brad Lightcap表示，其中100萬高端商業用戶每月為OpenAI帶來超過2.25億美元的收入，年化收入高達27億美元。

邁向自主代理，重塑人機交互模式

OpenAI o1系列模型的出現，標誌著人工智慧領域取得了新的突破。但我們仍需保持清醒的認識，不要將它們神化。o1系列模型本質上是通過學習大量數據，建立起複雜的數學模型。它們能夠生成看似智能的文本，但並不意味著它們真正理解了這些文本的含義。同時，o1系列模型雖然在特定領域表現出色，但它們缺乏常識和情感顯然無法形成某種信念。

贊助商廣告

儘管如此，o1 系列的發布依然意義重大。 OpenAI 創始人山姆·阿特曼（Sam Altman）將 o1 稱為「迄今為止最強大、最一致的一系列模型」，並將其視為邁向自主系統或代理的關鍵一步。

可以預見，隨著 o1 系列的不斷疊代和完善，其在科學研究、工程設計等領域將發揮越來越重要的作用。屆時，人機交互模式也將被徹底顛覆，AI 不再只是被動接受指令的工具，而是能夠自主「思考」、決策和行動的智能夥伴。

OpenAI 的 o1 系列，為我們打開了一扇通往未來 AI 世界的大門。在這扇門的背後，是速度與思考的博弈，是功能與成本的權衡，更是人類與機器關係的重塑。