思維是什麼?AI具備思維了麼?著名的教育家約翰·杜威這樣定義思維:「以一種觀察到的事物為依據,去推測或判斷出其他的事物,然後將作為依據的事物當做後者推測數的事物的機遇或者基礎,從而產生信念。」
OpenAI的最新模型正向思維邁進,經過數月喧囂,OpenAI 終於揭開了「草莓」的神秘面紗——全新模型系列 o1 正式發布,主打「推理」能力。 與以往追求快速響應的AI模型不同,OpenAI o1系列最大的特點在於其「慢思考」的模式。據OpenAI介紹,這些模型經過特殊訓練,能夠在回答問題之前花費更多時間進行思考,就像人類一樣。

通過模仿人類的思維過程,通過強化學習和「思維鏈」技術,引導模型自主解決問題。o1系列模型在解決複雜問題,尤其是在科學、編碼和數學等領域,展現出了超越以往模型的強大能力。例如,在國際數學奧林匹克資格考試中,o1系列最新版本o1正式版的準確率高達83.3%,而GPT-4o僅為13.4%,差距之大令人咋舌。
OpenAI o1系列的橫空出世,在業界引發了巨大震動。一些人歡呼雀躍,認為這是人工智慧發展史上的里程碑事件,預示著AI將具備更強大的推理能力,甚至接近人類思考水平;甚至直指垂直大模型將走向末路,而另一些人則持懷疑態度,認為這不過是OpenAI又一次的營銷炒作,新模型的實際能力還有待觀察; 更有悲觀者認為:「一覺醒來,立刻就失業了!」
「慢思考」:通向類人智能的關鍵一步?
一直以來,大型語言模型(LLM)以其驚人的反應速度和資訊處理能力著稱。然而,這種「快」卻也伴隨著「不精確」的弊病。正如 OpenAI 研究負責人傑里·托雷克 (Jerry Tworek) 所言,現有的 LLM 往往會「產生幻覺」,即給出看似合理但實際錯誤的答案。
為了突破瓶頸,OpenAI 將目光轉向了人類的「慢思考」模式。o1 系列模型採用全新的訓練方法,不再局限於模仿訓練數據中的模式,而是通過強化學習和「思維鏈」技術,引導模型自主解決問題。

通過模仿人類的思維過程,o1系列模型在解決複雜問題,尤其是在科學、編碼和數學等領域,展現出了超越以往模型的強大能力。OpenAI 聲稱這種更強大的 o1-preview 「在物理、化學和生物學具有挑戰性的基準任務上的表現類似於博士生」。例如,在國際數學奧林匹克資格考試中,o1系列最新版本o1正式版的準確率高達83.3%,而GPT-4o僅為13.4%,差距之大令人咋舌。
o1 並非萬能:功能缺失與成本高企的挑戰
儘管在推理能力上取得了突破,但 o1 並非完美無缺。OpenAI研究負責人傑里·托雷克坦言 :「我們不能說我們解決了幻覺。」,o1系列模型仍處於早期階段,存在諸多局限性。例如,它尚不支持網際網路搜索、文件和圖像上傳等功能,在許多常見應用場景下,GPT-4o仍是更優選擇。此外,o1 的運行速度較慢,且使用成本高昂。以 o1-preview 為例,其 API 調用費用為每 100 萬個輸入令牌 15 美元,每 100 萬個輸出令牌 60 美元,遠高於 GPT-4o 的 5 美元和 15 美元。

高昂的成本和有限的功能,勢必會限制 o1 的應用範圍。 OpenAI 首席運營官布萊德·萊特卡普(Brad Lightcap) 也指出,對於許多常見應用場景,GPT-4o 在短期內仍將是更好的選擇。
商業化在提速:ChatGPT付費用戶突破1100萬
在技術不斷疊代的同時,OpenAI的商業化步伐也在加快。據報道,ChatGPT付費用戶數已突破1100萬。OpenAI首席運營官Brad Lightcap表示,其中100萬高端商業用戶每月為OpenAI帶來超過2.25億美元的收入,年化收入高達27億美元。
邁向自主代理,重塑人機交互模式
OpenAI o1系列模型的出現,標誌著人工智慧領域取得了新的突破。但我們仍需保持清醒的認識,不要將它們神化。o1系列模型本質上是通過學習大量數據,建立起複雜的數學模型。它們能夠生成看似智能的文本,但並不意味著它們真正理解了這些文本的含義。同時,o1系列模型雖然在特定領域表現出色,但它們缺乏常識和情感顯然無法形成某種信念。
儘管如此,o1 系列的發布依然意義重大。 OpenAI 創始人山姆·阿特曼(Sam Altman) 將 o1 稱為「迄今為止最強大、最一致的一系列模型」,並將其視為邁向自主系統或代理的關鍵一步。
可以預見,隨著 o1 系列的不斷疊代和完善,其在科學研究、工程設計等領域將發揮越來越重要的作用。屆時,人機交互模式也將被徹底顛覆,AI 不再只是被動接受指令的工具,而是能夠自主「思考」、決策和行動的智能夥伴。
OpenAI 的 o1 系列,為我們打開了一扇通往未來 AI 世界的大門。 在這扇門的背後,是速度與思考的博弈,是功能與成本的權衡,更是人類與機器關係的重塑。