最先把 AI OS 帶給 14 億人的，居然是微信？

微信的 AI，終於動了。

就在蘋果 WWDC 的同一天，微信做了一件可能比蘋果更重要的事，發布了一份樸實無華的公告：《關於開發者接入微信 AI 生態的指引》。

贊助商廣告

從今天起，小程序開發者可以給出授權，讓微信 AI 完成讀取、操作和調用小程序的功能。

微信給了兩種接入方式，一「自動模式」，門檻幾乎為零，開發者打開一個開關，平台自己讀源碼、分析頁面、搞懂小程序能幹什麼，然後 AI 就能直接上手操作，一行代碼不用寫。

另一種叫「開發模式」，開發者自己開發定製化的 Skill，通過審核後被 AI 調用。兩種可以同時開啟。美團已經宣布接入。

這不能只是理解成又一個新功能上線，而是要看到，微信正在把它的整個生態——數百萬小程序、微信支付、服務通知、公眾號——變成 AI 的執行層。

扒一扒 Skill 文檔，微信 AI 是怎麼調小程序的

微信開放文檔里公開了小程序接入 AI 的 Skill 技術規範，仔細看，裡面藏著很多設計細節。

官方 skill 文檔指路👇🏻：

https://developers.weixin.qq.com/miniprogram/dev/ai/best-practices.html

從架構上看，做過 AI 開發的人會立刻認出來，本質上就是 MCP 最先把AIOS帶給14億人的居然是微信

。mcp.json 聲明每個原子接口的功能和參數，SKILL.md 描述整個業務流程怎麼跑，這和 Claude、Cursor 最先把AIOS帶給14億人的居然是微信

、VS Code 里的 MCP+Skills 架構幾乎一模一樣。微信沒有另起爐灶，直接採用了行業正在收斂的標準。

在指導方案里，微信給了一套很清晰的「注意力權重」體系。AI 在決定調用哪個接口、生成什麼參數的時候，最優先看的是接口返回的 content（五星），其次是 mcp.json 里的接口 description（四星）和參數 description（四星），SKILL.md 排最後（三星）。這意味著開發者寫在哪裡比寫了什麼更重要——同樣的一條規則，寫在接口返回里和寫在 SKILL.md 里，AI 給的權重完全不同。

贊助商廣告

接口返回層面有一條核心規範：「事實+動作」兩段式。先告訴 AI「發生了什麼」，再告訴它「下一步做什麼」。如果只寫動作不寫事實，AI 可能把「展示卡片」理解成「準備調下一個接口」而跳過用戶確認。這是一個踩過很多坑之後才會總結出來的規則。

第四，參數傳遞優先用 ID 而非自然語言。以圖中的「咖啡點單」場景為例子，用戶提出需求後，AI理解模糊意圖以及選項、改規格、處理支付，全程不出對話框。

這套設計透露的信號是：微信已經在實戰中跑過足夠多的 case，知道 AI 調用外部服務的坑在哪裡，並且把這些經驗固化成了開發者規範。

實際上，如果對比同樣以「生態」著稱的微信小程序和蘋果應用，微信對自家生態有一種「上帝視角」，這是一切實現的前提。

怎麼比蘋果 AI 還重要

今年蘋果在 WWDC 上發布的新版 Siri AI，儘管底層接入了 Google Gemini，Shortcuts 支持自然語言創建，卻沒有引起太多討論。

細看就會發現差距：蘋果做的是讓 AI 在 iOS 系統內協調一些原生功能，一旦涉及到第三方應用、那些裝在你手機上的 App，它就會捉襟見肘。

比如餓了麼，它的代碼跑在餓了麼自己的伺服器上，蘋果讀不了。Siri 想調用餓了麼，必須餓了麼的工程師主動來對接 App Intents 這套接口，一個一個談、一個一個接，中間耗時耗力。

贊助商廣告

而微信做的是讓 AI 直接操作數百萬個第三方服務，因為小程序不一樣。每一個小程序的代碼，從開發者提交、到微信審核、到最後在用戶手機上運行，全程都在微信的技術體系里。微信在審核階段就能把代碼掃一遍，自動分析「這個小程序有哪些頁面，能幹什麼事，輸入輸出是什麼」。

所以「自動模式」才能成立——開發者一行代碼不用寫，開個開關，微信自己就能把你的小程序翻譯成 AI 可以調用的工具。微信的基礎架構天然支持這樣做，它擁有「上帝視角」，能夠基於中心化實現調度。

這個架構優勢，蘋果沒有，Google 也沒有。

同樣值得注意的，還有前陣子傳出來，微信正在與華為、榮耀、小米、OPPO、vivo 合作推出 A2A（Agent-to-Agent）助手能力，用戶可以通過手機語音助理直接發起微信音影片通話或發消息。

對內，微信 AI 可以調用數百萬小程序；對外，手機廠商的 AI 助理可以調用微信。微信正在成為 AI 時代的超級連接器，讓所有 AI 都能接入的服務中樞。

「微信 OS」的舊預言

小程序推出的時候，很多人戲稱微信要做「微信 OS」。當時這更像是一個修辭——小程序替代了一部分 App 的功能，但本質上還是一個「輕應用平台」。

更偶然的是，當時設計的中心化審核機制，是出於控制質量和安全。但九年後，這個當初被批評為「管控過度」的設計，意外地成了 AI 時代的基礎設施優勢。分布式的 App 生態（蘋果/Android）當時看起來更「自由」，現在反而成了 AI 接入的障礙。

一個舊的預言，由於新時代的技術——AI——的出現，有了顛覆性的變化。

之前寫 OpenClaw 和飛書的時候最先把AIOS帶給14億人的居然是微信

，我提過一個判斷：IM 是 AI Agent 最天然的入口，因為對話本身就是人與 AI 最自然的交互方式，而 IM 自帶的服務生態（機器人、支付、小程序）讓 AI 不只能「聊」還能「做」。飛書已經在往這個方向走，上線了 Bot API 增強和 AI Agent 節點。

贊助商廣告

不過，飛書是企業協作工具，覆蓋的是辦公場景。微信有著截然不同的廣度——14.32 億月活，數百個細分領域的小程序，從點外賣到掛號到買機票到繳水電費，幾乎覆蓋了一個人日常生活的全部服務需求。

如果微信 AI 真的能流暢地調用這些小程序完成任務，那么正如預言說的，它成了個用自然語言操作的作業系統。

用戶說一句「幫我訂明天下午三點從北京到上海的高鐵」，AI 拆解意圖，調用 12306 小程序查票、選座、微信支付完成下單，全程不出微信。這條鏈路理論上今天就可以跑通。

當然，理論和現實之間還有距離。AI 調用涉及支付場景的服務，容錯率接近零——點錯一杯咖啡是小事，買錯一張機票就是大事。底層模型的準確性要求遠高於對話場景。這也是全球 AI Agent 落地面臨的共同瓶頸：從「能聊天」到「能辦事」，中間隔的不是技術指標，是信任。

但微信至少做對了一件事：它沒有從零搭建服務網路。這些年來，ChatGPT 在做的事是先有一個聰明的腦子，再一個一個去接 Shopify、DoorDash、Stripe，每一個都是從零建立的連接，到今天交易相關查詢的占比還不到 3%。

真正將要發生的變化，對大多數用戶來說，可能是悄無聲息的。某一天你在微信里敲打一句「幫我訂今晚九點去上海的票」，然後它就訂好了，你甚至不知道背後調了哪個小程序，走了什麼支付流程。

這種「無感知的完成」，才是AI Agent真正成熟的標誌，微信離這一步，比任何人都近。