大會還在進行中,AI已經開始「交作業」了。
在2026騰訊雲AI產業應用大會直播期間,留言區不斷有人@元寶,讓它實時整理會議紀要。
元寶也非常給力。面對騰訊集團高級執行副總裁、雲與智慧產業事業群CEO湯道生與騰訊AI首席科學家姚順雨的對談,不僅迅速生成了會議摘要,還順手列出了待辦事項。
去年年底,原OpenAI的研究員姚順雨加入騰訊,成為繼元寶出圈之後,騰訊最受關注的話題。
此前,姚順雨在2025年曾經發表部落格《The Second Half》談論AI下半場,AI發展重心已從「刷榜沖參數」轉向「真實場景價值與可評估的任務解決」,強調「評估優於訓練」「上下文學習」「深度協同(co-design)」與「實用主義模型落地」。
這次對談,話題又聚焦了一些,聊的是「騰訊AI下半場」。

AI下半場最重要的是什麼?
騰訊雲這次沒有講概念也沒有講敘事,只是想給聽眾講講,騰訊AI要做什麼。
姚順雨感覺最近「下半場」有點被濫用,他先解釋了一下,過去AI發展了幾十年,現在方法論已經非常成熟,但尋找問題變得更加困難。
之前AlphaGo可以下圍棋,翻譯模型可以做翻譯,但是有了預訓練和後訓練之後,我們好像有了一個萬能的錘子,它是一個通用方法論,可以解決各種各樣的問題,反而更困難的是怎麼尋找好的問題去解決。
姚順雨坦言來到騰訊,很重要的一點就是這裡有很多好問題、好產品。
所以AI下半場最重要是什麼?他個人覺得是,應該在中國建立一個長期基於AGI
的組織。今天的AI,Foundation(地基)+Product(價值)+ Frontier(前沿)三足並重。
Co-Design,模型和產品如何相互成就
騰訊平時在開會時,通常會提到Co-Design,怎麼把產品與模型緊密地結合起來。姚順雨給出了三個判斷。
首先,Co-Design的前提是模型本身足夠紮實。
大模型能力建設依然要回到基礎層面。預訓練是一個相對獨立於具體產品的過程,其價值在於構建通用能力底座。由於預訓練本質上是一種泛化學習過程,每一次能力提升都能夠持續傳導到不同的下游場景和任務中。
「很多人喜歡關注排行榜,但更重要的是基於真實產品和真實應用場景,構建能夠反映實際價值的評估體系。」姚順雨說。真正有效的Eval(評估)應該服務於產品,不是服務於榜單。
其次,「實用性」價值是大於刷榜價值。
模型團隊與產品團隊的深度Co-Design,本質上是在共同尋找技術能力與用戶需求之間的最佳結合點,這一過程的關鍵是雙方建立起足夠的信任機制。只有形成互信,產品側的數據反饋、用戶行為數據以及場景需求才能有效回流到模型疊代過程中,進而形成評估、優化和產品落地的正向循環。
最後,LLM時代最大的不同是泛化能力。
這是LLM與過去AI技術最顯著的區別之一。過去的AI系統大多圍繞單一任務構建,任務邊界清晰,能力建設也相對垂直。
但大模型時代已經完全不同。即便只是打造一個Coding Agent,背後也不僅僅需要代碼數據。它同時需要優秀的對話能力、搜索能力、指令遵循能力以及推理能力。換句話說,一個看似單一的應用場景,實際上依賴於多種能力的協同構建。
姚順雨認為,這意味著大模型產品的構建越來越像一項系統工程。除了模型本身,如何理解能力組合、數據結構以及場景需求之間的關係,同樣決定著最終的產品效果。
擁有完整產品體系的平台會具備一定優勢。以騰訊內部的Co-Design為例,模型在與元寶的協同過程中形成了較強的聊天和搜索能力,這些能力隨後也能夠遷移到ima、Workbuddy
等其他產品中。
不同產品能夠提供不同的數據,這些數據之間又具備一定的泛化能力。最終,產品、數據和模型會形成一個類似網路的體系。在姚順雨看來,這種體系化能力的價值正在變得越來越重要。
Hy3 preview沒有秘密,三件事見真章
Hy3 preview是騰訊混元團隊重組後於2026年4月23日發布並開源的新模型。大家都說Hy3 preview是姚順雨在騰訊的首秀,他認為這沒有什麼秘密。
第一,在基礎設施層面做了重建,無論是預訓練還是強化學習階段,都進行了系統性的重構。
第二,在數據和評估體系上也做了較大調整,包括如何定義更貼近真實的問題、如何擴展數據的分類,以及如何持續提升數據質量。
第三,在很多關鍵決策上,比如團隊如何招聘、模型疊代節奏如何安排、以及日常大量需要權衡的選擇,其實都缺少統一公式,更偏向經驗與判斷驅動。
不同時代,做產品的第一性原理是否變了
姚順雨在對談中還反客為主,向湯道生拋出了一個關於產品的「第一性原理」問題。
從QQ秀、QQ空間、QQ音樂,到騰訊雲,再到今天的元寶,湯道生幾乎完整經歷了騰訊從消費網際網路到產業網際網路,再到AI時代的產品演進,也橫跨了To C與To B兩大市場。
自稱「老登」的湯道生回答是:產品首先要回答一個問題,究竟在解決用戶什麼需求。
無論時代如何變化、技術如何疊代,產品最終都要為用戶創造價值。只有價值成立,用戶才會選擇並使用。
AI時代也是一樣。
但現在做產品也有了很多之前沒有的要求和挑戰。AI產品面對的是開放式需求,用戶很多時候只需用自然語言表達意圖。產品需要充分利用大模型的理解、推理和工具調用能力,將用戶需求轉化為具體行動,並通過豐富的工具體系完成任務交付。
與此同時,AI也在重塑產品研發流程本身,設計、研發、測試整個流程需要重新設計,所以今天做產品要求的能力更全面了。
2022年那盞微弱的燈,今天已成萬億賽道
姚順雨回憶博士期間的兩個研究方向,一是構建Agent的方法論,嘗試把一個將Next-token Prediction的機器,逐步變成能夠執行任務的Agent或自動化系統,其中關鍵工作之一就是ReAct框架。
他印象很深的一次實驗發生在2022年7月的一個夜晚。當時他第一次將Pump two的API與一個手寫的Wikipedia API連接起來,讓模型第一次能夠基於網頁資訊回答問題,並支持多輪交互。
他形容那一刻像「微弱的電燈突然被點亮」,這可能是最早將LLM與網際網路連接並用於交互式任務的嘗試之一。
當時他的感覺,這類能力可能在5到10年內改變行業,但實際演進速度明顯更快。
另一個重要節點是SWE-bench的提出。在他看來,如果模型能夠在真實軟體工程任務中取得進展,其價值是顯著的。當時的預期可能在百億到千億級別,而隨著能力快速提升,這一規模判斷也被不斷上調到萬億級別,甚至仍然顯得保守。
博士期間另一個研究方向則是對「數字自動化任務」的定義,比如WebShop是較早的基於網際網路環境的Web Agent任務,而InterCode和SWE-bench則代表了早期Coding Agent任務的探索。
從今天回頭看,Agent方向逐漸收斂為兩個核心領域:面向外部環境的通用Agent,以及面向代碼任務的Coding Agent。
他提到,前段時間在群里交流時重新翻看自己的博士論文,尤其是2024年寫下的未來工作部分,包括四個方向:為Agent訓練模型、魯棒性與部署、科學發現,以及如何更好地輔助人類。
Token消耗太大,中國語境下都在討論「性價比」
「毫無疑問今天Agent或者Coding Agent有點像預訓練一樣,是不得不做的事情。」姚順雨說。這是最基礎的能力。
但是他做的方法會有幾個不同之處。
第一,即使在今天,Coding依然是最重要的方向之一,但整體能力仍然需要體系化構建。要做好Coding,依賴的不只是代碼數據本身,還包括對話能力、推理能力等多種能力的協同,因為大模型的核心特徵在於泛化性。
第二,產品的作用正在變得越來越關鍵。如何利用線上回流數據,已經成為幾乎所有模型廠商都在重點思考的問題。在這一過程中,前期積累的Co-Design經驗顯得尤為重要。
第三,仍然需要更多想像力。不論是技術演進、產品演進,還是下一階段可能出現的範式變化,都需要持續進行探索性、甚至帶有不確定性的嘗試。
他認為,在中國語境下討論「性價比」,往往更多停留在模型架構層面,但實際這是一個更複雜的系統問題。
第一層是性能本身。性能是性價比的前提條件,很多人後來會發現,用更強的模型反而更省錢,因為它能更快把事情做對,也減少了人的干預成本。尤其在今年,簡單任務的穩定性和魯棒性變得更加重要,一次做對相對簡單的任務,本身就是性價比的一部分。
第二層是成本控制。在性能成立之後,成本優化才有意義。從中國實踐來看,這一環節的工程化推進相對領先。更核心的問題,是如何用更小的模型承擔更高價值的任務。在此基礎上,還涉及架構創新,包括長上下文管理、以及各種工程化「腳手架」能力的設計與優化。
騰訊在AI上掉隊了嗎?
很多人都會說騰訊在AI上沒有及時抓住機會。姚順雨的理解是,今天AI有兩個重要判斷。
第一,是把AI視為短期遊戲還是長期遊戲。矽谷當前確實存在一種情緒:認為未來兩年窗口期內會迅速完成財富積累,隨後行業格局基本定型。但他的判斷恰恰相反,AI是一個長期過程,下半場才剛剛開始。
他說,ChatGPT或Claude Code不太可能成為唯一的「超級應用形態」。如果未來世界只剩少數幾個中心化入口,反而是一種相對收斂甚至停滯的狀態。更合理的圖景是,隨著技術演進,會持續湧現新的應用形態與產品機會。
從這個角度看,當前階段更像是上世紀70年代PC剛剛興起的早期階段,很多基礎能力與應用空間仍未被充分展開。
第二,是AI發展路徑會趨向單一還是多元。在過去幾年,從預訓練、後訓練到Agent、Coding Agent,行業確實呈現出一條相對清晰的主線,也帶來一定程度的同質化趨勢。
但他認為,未來更可能走向多元化演進。一方面,Coding Agent作為生產力工具的重要性仍在提升,但整體仍處於早期階段;另一方面,多模態、具身智能
等方向也在同步發展,更多新的應用形態正在出現或剛剛起步。
因此,如果將AI視為一個「下半場剛開始」,那麼當下遠未到終局,更像是一個持續擴展的起點。
在湯道生看來,騰訊是一個多業態公司,產品分布在不同賽道,同時也有多個團隊在推進不同項目。在這樣一個複雜體系中,不同環節的推進速度並不一致,有的快,有的相對滯後,也有一些仍處在探索階段甚至可能經歷失敗。
但整體來看,這是一場長跑,更接近馬拉松式的過程。騰訊擁有相對豐富的應用場景,這一點也為持續疊代提供了基礎條件。
湯道生在最後還談了騰訊背後的三個核心能力。
第一是場景聯接的能力,通過騰訊的微信、企業微信、元寶等等高頻的場景觸點,來把大模型嵌到真實的業務流,跟用戶、數據、生態能夠深度聯接。
第二是工程的駕馭能力,通過完整的Harness
體系,讓Agent能夠穩定、可信、可持續運行,具備強大的AI Infra,讓包括高速的網路、高吞吐的儲存,還有高性能的Agent Runtime來保證GPU的高利用率。
第三是模型驅動力,依託混元大模型和模型產品 Co-Design ,兼顧實用性、性價比和 ROI。
同時 ,啟動「騰訊AI共創營(二期)」, 攜手ISV、MSP夥伴,一起共創行業解決方案,打造更多的標杆案例。






