微信的 AI,終於動了。
就在蘋果 WWDC 的同一天,微信做了一件可能比蘋果更重要的事,發布了一份樸實無華的公告:《關於開發者接入微信 AI 生態的指引》。

從今天起,小程序開發者可以給出授權,讓微信 AI 完成讀取、操作和調用小程序的功能。
微信給了兩種接入方式,一「自動模式」,門檻幾乎為零,開發者打開一個開關,平台自己讀源碼、分析頁面、搞懂小程序能幹什麼,然後 AI 就能直接上手操作,一行代碼不用寫。
另一種叫「開發模式」,開發者自己開發定製化的 Skill,通過審核後被 AI 調用。兩種可以同時開啟。美團已經宣布接入。
這不能只是理解成又一個新功能上線,而是要看到,微信正在把它的整個生態——數百萬小程序、微信支付、服務通知、公眾號——變成 AI 的執行層。
扒一扒 Skill 文檔,微信 AI 是怎麼調小程序的
微信開放文檔里公開了小程序接入 AI 的 Skill 技術規範,仔細看,裡面藏著很多設計細節。
官方 skill 文檔指路👇🏻:
https://developers.weixin.qq.com/miniprogram/dev/ai/best-practices.html

從架構上看,做過 AI 開發的人會立刻認出來,本質上就是 MCP
。mcp.json 聲明每個原子接口的功能和參數,SKILL.md 描述整個業務流程怎麼跑,這和 Claude、Cursor
、VS Code 里的 MCP+Skills 架構幾乎一模一樣。微信沒有另起爐灶,直接採用了行業正在收斂的標準。
。mcp.json 聲明每個原子接口的功能和參數,SKILL.md 描述整個業務流程怎麼跑,這和 Claude、Cursor
、VS Code 里的 MCP+Skills 架構幾乎一模一樣。微信沒有另起爐灶,直接採用了行業正在收斂的標準。在指導方案里,微信給了一套很清晰的「注意力權重」體系。AI 在決定調用哪個接口、生成什麼參數的時候,最優先看的是接口返回的 content(五星),其次是 mcp.json 里的接口 description(四星)和參數 description(四星),SKILL.md 排最後(三星)。這意味著開發者寫在哪裡比寫了什麼更重要——同樣的一條規則,寫在接口返回里和寫在 SKILL.md 里,AI 給的權重完全不同。

接口返回層面有一條核心規範:「事實+動作」兩段式。先告訴 AI「發生了什麼」,再告訴它「下一步做什麼」。如果只寫動作不寫事實,AI 可能把「展示卡片」理解成「準備調下一個接口」而跳過用戶確認。這是一個踩過很多坑之後才會總結出來的規則。

第四,參數傳遞優先用 ID 而非自然語言。以圖中的「咖啡點單」場景為例子,用戶提出需求後,AI理解模糊意圖以及選項、改規格、處理支付,全程不出對話框。
這套設計透露的信號是:微信已經在實戰中跑過足夠多的 case,知道 AI 調用外部服務的坑在哪裡,並且把這些經驗固化成了開發者規範。
實際上,如果對比同樣以「生態」著稱的微信小程序和蘋果應用,微信對自家生態有一種「上帝視角」,這是一切實現的前提。
怎麼比蘋果 AI 還重要
今年蘋果在 WWDC 上發布的新版 Siri AI,儘管底層接入了 Google Gemini,Shortcuts 支持自然語言創建,卻沒有引起太多討論。

細看就會發現差距:蘋果做的是讓 AI 在 iOS 系統內協調一些原生功能,一旦涉及到第三方應用、那些裝在你手機上的 App,它就會捉襟見肘。
比如餓了麼,它的代碼跑在餓了麼自己的伺服器上,蘋果讀不了。Siri 想調用餓了麼,必須餓了麼的工程師主動來對接 App Intents 這套接口,一個一個談、一個一個接,中間耗時耗力。

而微信做的是讓 AI 直接操作數百萬個第三方服務,因為小程序不一樣。每一個小程序的代碼,從開發者提交、到微信審核、到最後在用戶手機上運行,全程都在微信的技術體系里。微信在審核階段就能把代碼掃一遍,自動分析「這個小程序有哪些頁面,能幹什麼事,輸入輸出是什麼」。
所以「自動模式」才能成立——開發者一行代碼不用寫,開個開關,微信自己就能把你的小程序翻譯成 AI 可以調用的工具。微信的基礎架構天然支持這樣做,它擁有「上帝視角」,能夠基於中心化實現調度。
這個架構優勢,蘋果沒有,Google 也沒有。
同樣值得注意的,還有前陣子傳出來,微信正在與華為、榮耀、小米、OPPO、vivo 合作推出 A2A(Agent-to-Agent)助手能力,用戶可以通過手機語音助理直接發起微信音影片通話或發消息。

對內,微信 AI 可以調用數百萬小程序;對外,手機廠商的 AI 助理可以調用微信。微信正在成為 AI 時代的超級連接器,讓所有 AI 都能接入的服務中樞。
「微信 OS」的舊預言
小程序推出的時候,很多人戲稱微信要做「微信 OS」。當時這更像是一個修辭——小程序替代了一部分 App 的功能,但本質上還是一個「輕應用平台」。
更偶然的是,當時設計的中心化審核機制,是出於控制質量和安全。但九年後,這個當初被批評為「管控過度」的設計,意外地成了 AI 時代的基礎設施優勢。分布式的 App 生態(蘋果/Android)當時看起來更「自由」,現在反而成了 AI 接入的障礙。

一個舊的預言,由於新時代的技術——AI——的出現,有了顛覆性的變化。
之前寫 OpenClaw 和飛書的時候
,我提過一個判斷:IM 是 AI Agent 最天然的入口,因為對話本身就是人與 AI 最自然的交互方式,而 IM 自帶的服務生態(機器人、支付、小程序)讓 AI 不只能「聊」還能「做」。飛書已經在往這個方向走,上線了 Bot API 增強和 AI Agent 節點。
,我提過一個判斷:IM 是 AI Agent 最天然的入口,因為對話本身就是人與 AI 最自然的交互方式,而 IM 自帶的服務生態(機器人、支付、小程序)讓 AI 不只能「聊」還能「做」。飛書已經在往這個方向走,上線了 Bot API 增強和 AI Agent 節點。
不過,飛書是企業協作工具,覆蓋的是辦公場景。微信有著截然不同的廣度——14.32 億月活,數百個細分領域的小程序,從點外賣到掛號到買機票到繳水電費,幾乎覆蓋了一個人日常生活的全部服務需求。

如果微信 AI 真的能流暢地調用這些小程序完成任務,那么正如預言說的,它成了個用自然語言操作的作業系統。
用戶說一句「幫我訂明天下午三點從北京到上海的高鐵」,AI 拆解意圖,調用 12306 小程序查票、選座、微信支付完成下單,全程不出微信。這條鏈路理論上今天就可以跑通。
當然,理論和現實之間還有距離。AI 調用涉及支付場景的服務,容錯率接近零——點錯一杯咖啡是小事,買錯一張機票就是大事。底層模型的準確性要求遠高於對話場景。這也是全球 AI Agent 落地面臨的共同瓶頸:從「能聊天」到「能辦事」,中間隔的不是技術指標,是信任。

但微信至少做對了一件事:它沒有從零搭建服務網路。這些年來,ChatGPT 在做的事是先有一個聰明的腦子,再一個一個去接 Shopify、DoorDash、Stripe,每一個都是從零建立的連接,到今天交易相關查詢的占比還不到 3%。
真正將要發生的變化,對大多數用戶來說,可能是悄無聲息的。某一天你在微信里敲打一句「幫我訂今晚九點去上海的票」,然後它就訂好了,你甚至不知道背後調了哪個小程序,走了什麼支付流程。
這種「無感知的完成」,才是AI Agent真正成熟的標誌,微信離這一步,比任何人都近。






