除夕夜,春晚還沒開始,AI 圈先炸了。
過去半個月,中文網際網路上演了最魔幻的一幕。上億人對著千問 APP
瘋狂輸出,只為薅那一杯免費奶茶。
瘋狂輸出,只為薅那一杯免費奶茶。30 億真金白銀砸下去,效果簡單粗暴:登頂 App Store,日活 7352 萬逼平豆包,6 天 1.2 億單 AI 訂單。阿里用一種最簡單粗暴的方式,完成了大模型在 C 端的一次全民普及。

但網際網路有一條鐵律:靠補貼拉來的用戶跑得比誰都快。當「一句話辦事」的新鮮感褪去,如何讓流量變留量?答案只能是更好的模型體驗。

沒有讓我們等待多久,阿里剛剛正式發布並開源了 Qwen3.5
系列模型,並迅速在 chat.qwen.ai 平台完成部署。
系列模型,並迅速在 chat.qwen.ai 平台完成部署。頁面顯示有兩款模型,分別為最新大語言模型的 Qwen3.5-Plus,以及定位為開源系列旗艦的 Qwen3.5-397B-A17B。兩者均支持文本處理與多模態任務。


流水的榜單,鐵打的千問
過去兩年開源模型界流傳著一個梗:「流水的榜單鐵打的千問」。從 Qwen 2.5 到 Qwen 3.5 每一代發布基本都是發布即霸榜,以至於開發者圈子處處流傳著那個傳說——「源神啟動
」。
」。基準測試結果顯示,Qwen 3.5 在多模態理解、複雜推理、編程、Agent 智能體等幾大核心能力維度都是領先於同級開源模型,多項基準媲美 Gemini-3-pro 等閉源第一梯隊。

同時以 4000 億參數的 Qwen3.5-Plus 性能超過了萬億參數的 Qwen3-max 模型。小馬拉大車,還能跑得比高鐵快。這是怎麼做到的?我們找到了幾個關鍵要素:
混合注意力機制:實現算力動態分配,讓模型學會「有詳有略」地提升長文本效率
極致稀疏 MoE 架構:總參數 397B 激活僅 17B,是同等性能參數量最小的模型,也就是說僅需激活不到 5% 的參數,即可調動全量知識大幅降低推理成本
原生多 Token 預測:將逐字生成改為多步聯合預測,實現推理速度翻倍
系統級穩定性優化:精準調控資訊流,確保模型在超大規模訓練中不崩盤、不跑偏
除了這些,Qwen3.5 和字節的豆包大模型 2.0 都在嘗試解決同一個問題:讓 AI 真正理解圖像、文字和影片。
Qwen3.5 通過早期文本-視覺融合與擴展的視覺/STEM/影片數據實現原生多模態,在相近規模下優於 Qwen3-VL。
Qwen3.5 通過異構基礎設施實現高效的原生多模態訓練:在視覺與語言組件上解耦並行策略,避免統一方案帶來的低效。
利用稀疏激活實現跨模塊計算重疊,在混合文本-圖像-影片數據上相比純文本基線達到近 100% 的訓練吞吐。





向左滑動查看更多內容

在此基礎上,原生 FP8 流水線
對激活、MoE 路由與 GEMM 運算採用低精度,並通過運行時監控在敏感層保持 BF16,實現約 50% 的激活顯存降低與超過 10% 的加速,並穩定擴展至數萬億 token。
最終做出來的效果是,Qwen3.5 支持圖像與影片輸入,上下文窗口擴展至 1M tokens
,可直接處理長達 2 小時的影片內容,還能像人一樣操作手機和電腦,完成跨應用的複雜任務。
,可直接處理長達 2 小時的影片內容,還能像人一樣操作手機和電腦,完成跨應用的複雜任務。當然,最讓開發者心動的,永遠是價格。Qwen3.5-Plus 的 API 價格每百萬 Token 低至 0.8 元,同等性能下,價格僅相當於 Gemini-3-Pro 的 1/18。
這次跑分沒輸過,體驗也沒輸過
話不多說,直接開測。我們先甩給它一張發票,提取內容輕鬆拿捏,準確無誤。

上下滑動查看更多內容
接著加大難度,來個「找茬遊戲」,讓它圈出兩張圖的不同。雖然沒有直接在圖上畫圈,但它精準地指出了所有不同之處。這眼神,確實可以。

GPT-4o 前陣子正式「退役」,於是我把一個梗圖甩給了它,它不僅看懂了圖,還讀懂了背後的嘲諷和情緒。這種對「潛台詞」的理解,才是多模態的真正門檻。

遺憾的是,Qwen3.5 Plus 的寫作能力並未得到較大提升,雖然邏輯通順,但 AI 味還是肉眼可見,轉折生硬,缺乏人類寫作者的靈氣與細膩。

上下滑動查看更多內容
編程能力或許是 Qwen3.5 給我的最大驚喜。恰逢春節,先來一個春節煙花模擬器,代碼一次跑通,不僅視覺元素齊備,連音效都配齊了。這已經不是簡單的代碼補全,而是完整的代碼生成。

再來一個年獸闖關塔防遊戲,鞭炮防禦,紅色減速,NPC 互動,Q 版畫風也都輕鬆拿捏。

我們也順手做了一個給各位拜年的網頁,提前祝大家新年快樂。

不吹不黑,就體感而言,Qwen 3.5 的編程能力,無論是代碼的審美、完成度,還是出錯後的自動修復能力,絕對處於當前開源模型的第一梯隊,甚至可以媲美頂尖閉源 AI 模型。
是的,春節的假期總會結束,薅來的奶茶也總有喝完的一天。
30 億的補貼或許能換來一時的數據狂歡,但無法築起真正的護城河。在這個模型疊代以月為單位的周期,唯有硬核的模型能力和極致的性價比,才是留住開發者和用戶的根本。
除夕夜的這顆「源神」炸彈,或許正是 2026 年 AI 競爭格局的預演。
去年,DeepSeek V3 用一場「以小勝大
」的奇襲,徹底改寫了全球 AI 敘事,今年 Qwen3.5 再次證明了另一條路的可能性——用技術創新,而不是參數堆砌,來實現更強的智能。
而這個除夕夜,春晚的舞台上或許有精彩的表演,但真正的「年度大戲」,正在 AI 賽道上演。






