Gemini 3 還沒影子,GPT 5.1 已經在路上。7 號深夜,OpenRouter 平台上線了一個全新的隱名模型。已經有眼尖動作快的網友嘗鮮體驗,並且認為這就是披著馬甲的 GPT 5.1,暫名:Polaris Alpha。

目前提供 API 調用(包括 OpenRouter),知識庫截止時間為 2024 年 10 月,不支持推理模式。最大 context 容量 256K,單次最大輸出 128K。
一鍵直達👉🏻:https://openrouter.ai/chat
開發商資訊保密,但是在網友的不懈努力下,成功「越獄」,讓 Polaris Alpha 自曝了家門。

圖片來自 X 用戶 @LarryAtherton1
這倒也算不上實錘,可能只是訓練數據的問題——很多模型都會輸出來自專有供應商的數據。除非系統提示中明確說明,或者通過指令調優反覆灌輸,否則這些模型實際上並不「知道」自己是什麼。
無論如何,目前暫時沒有宣布,暫且就還是叫它 Polaris 吧。APPSO 也第一時間簡單試用了一下。由於是通過 API,部分功能比如處理語音素材暫時受限,除此之外,Polaris 的表現,讓人相當期待 GPT 5.1。
案頭工作:流暢,一如既往
首先是一些比較基礎的簡單任務:根據要求寫郵件。這是一封道歉郵件,跟嘉賓通報活動改期。我特地強調了口吻要既飽含歉意,又表示親近,讓 Polaris 感受一下。

算是中規中矩吧,資訊齊全,行文邏輯清楚,語氣不會有強烈的「人機感」。比較神奇的是,在打開 Search 模式的前提下,Polaris 會去檢索一些道歉信的寫法,而它的引用資訊里,居然有淘寶百科…… 看上去 Polaris 覆蓋的資訊源越來越多,也越來越冷門了。
然後是需要創意想法的文案寫作任務,prompt 我都給得很模糊,只要求有網感,適合在小紅書上傳播。

Polaris 給出了三種不同的風格,給出的文案非常完整。後面還給出了活動具體執行的方案。從這裡已經可以看出來,措辭上頗有 GPT 系才會有的文字風格,也有網友專門做了相似性統計——馬甲快要披不住了。
polaris-alpha on @OpenRouterAI is NOT gpt-5.1 --- its performance on the benchmarks is too weak.
— Clay Schubiner (@cschubiner) November 9, 2025
However, a similarity analysis of its responses shows it is indeed an openai model, perhaps a new open source model. It's quite comparable to oss-120b pic.twitter.com/TXMj4Jslcl
文字風格仍然是每一個大語言模型的立身之本,畢竟現在最主流的應用場景就是案頭工作。2026 年都快要來了,還給出「人機味」的文字,是不能被原諒的。目前 Polaris 的文風,有相當典型的「GPT」風味,很多網友都有同樣的感受。

同時,對於 chatbot、聊天、陪伴等應用場景里,文風能否快速適應用戶節奏,並且靈活「習得」個性化的口吻,也將是 GPT5.1 面臨的挑戰——全球用戶要求 4o 回來的盛況,OpenAI 應該不想再經歷一次了吧。
由於不能直接處理音頻文件,我上傳了轉錄後的播客文字稿,讓 Polaris 整理提煉資訊點,適當調整口語化的地方,重點是:根據不同的主題維度,拉出一個層次明確的提綱,同時保留時間戳。
輸入目前看來可以超過 1w 字(單條發送),受限於 OpenRouter 每個窗口只能保存八條記憶的限制,超長輸入會一定程度的影響輸出穩定性。不過自我糾正能力不錯,第一次跑的時候生造了並不存在的時間戳,重抽一次之後自行糾正了。

自從 GPT 5 之後,ChatGPT 的單個窗口容量明顯增大,從社交媒體上的反饋來看,最高的 token 總數可以去到 60 萬-80 萬才達到上限。這對於個性化用戶資訊而言是個非常好的信號,但不可避免的是,超長上下文額之後,會出現記憶調度的失序,以及輸出穩定性的下降。
這留給了 GPT 5.1 全新的挑戰,如何在進一步擴大窗口容量之後,依然保持靈活準確的記憶調度。對於用戶而言,幾乎是第一秒就能感受到的決定性體驗。
編程:超簡單,超順滑
OpenRouter 提供幾種基礎的編程工作實現和預覽。我快速用它測了一下 Polaris 寫小遊戲的本事。

最直觀的感覺是時間稍微有點久,差不多要個五分鐘了。不過倒是不需要我提供複雜的 prompt,「設計一個貪吃蛇遊戲代碼」,就足夠生成一個可以上手的小遊戲。
甚至還提供不同的模式、設置,在 preview 里的試玩都很順暢。另外又讓它跑了一個打地鼠遊戲,也是順利完成。

網頁設計也很 OK,我把上面生成出來的咖啡館文案,丟回給 Polaris,讓它設計一個活動的落地頁。

Polaris 研究了整個文案,並且加入了一些補充,最後出來的視覺效果也不錯,我挺喜歡它給按鈕設計的發光效果,這似乎是它的一個「獨家特色」,在其他網友的測試中也出現了:

圖片來自 X 用戶
從網上的其它測試是來看,它的美學表現值得期待。

圖片來自 X 用戶 @HarshithLucky3
這些基礎工作都沒有太大的問題,但老實說,現在 AI 編程的賽道堪稱白熱化,而 GPT 系產品在編程上,競爭力一直不算很強。GPT 5.1 實裝後,在編程上的表現能不能有大突破,只有繼續等待才能知道。
前陣子 Sam Altman 明確發話表示,年底時 ChatGPT 將推行 NSFW 模式(成人模式),在目前的 Polaris 上,似乎已經看得到苗頭了。
Polaris Alpha, possibly GPT 5.1 responding really well to jailbreaks that utilize adult mode
byu/Historical-Bar-8569 inChatGPT
如果是這樣,那 Polaris 是 GPT 5.1 的證據又多一條,尤其是考慮到最近 OpenAI 已經在小範圍內做年齡驗證,這並非全量行動,而是針對不確定實際年齡的用戶做定向推送。

成人模式的爭議很大,實際執行也並不如想像中簡單,除了驗證,還有隱私資訊識別、儲存等一系列麻煩。到底能不能有一個平衡多方訴求的解決方案,還得看真正的 GPT 5.1 如何應對。
眼瞧著年底又是一場血戰,Gemini 3 早就放出風聲(雖然一直跳票),Nano Banana 2 也突然冒頭。更別提前陣子 Kimi K2 Thinking 的發布,收穫了海內外一大波關注,訓練成本僅為 460 萬美元。
OpenAI 仍然有著驚人的支出,雖然也有著驚人的活躍用戶群,但盈利還看不到苗頭。在一系列又強又便宜的中國模型的狙擊下,GPT 5.1 能達到期望嗎?
快知道了,網傳 11 月中就將發布,到時或許會有答案。






