微軟和 OpenAI 的蜜月期,曾經是整個 AI 行業最重要的聯盟。
一方握著模型,另一方手握雲服務、辦公軟體、開發者工具和企業客戶,雙方互相成就,幾乎讓微軟在 AI 時代提前拿到一張頭等艙門票。但即便聯盟再緊密,微軟也不能永遠把最關鍵的 AI 想像力寄托在別人身上。
尤其是在雙方關係開始脫鉤之後。

剛剛召開的 Build 2026 因此變成一場特殊的發布會。微軟比以往任何時候都需要一場酣暢淋漓的 AI 勝利,向外界證明自己究竟是 AI 時代的主角,還是依舊只是 OpenAI 的雲服務商?
從 MAI 模型、Azure AI Foundry、到量子計算以及本地智能體能力,再加上黃仁勛和龍蝦之父的相繼站台,微軟展示了一整套覆蓋開發、模型、數據、算力和治理的完整生態,其目標也很清晰:將 AI 從 OpenAI 主導的模型紅利,轉變為微軟主導的平台生意。
微軟自研模型發布, MAI 補上 AI 供應鏈最關鍵一環
相比去年,微軟這次把模型放在了更重要的位置。微軟 CEO 納德拉稱,Microsoft Foundry 目前已有超過 11000 個模型,覆蓋 OpenAI、Anthropic 和微軟自研 MAI 模型。
微軟的判斷是,企業和開發者不會只依賴一個模型完成所有任務。不同任務會對應不同模型,也會受到延遲、成本和能力邊界的約束。因此,模型目錄、模型選擇、運行環境和企業治理,會一起構成新的平台競爭點。
今天,微軟自研模型家族正式一口氣推出了七款新模型,覆蓋推理、代碼、圖像、語音和轉錄等方向。

MAI Thinking 1 是其中的推理模型。它採用稀疏 MoE 架構,35B active 參數,總參數規模約 1T,支持 256K token 上下文,足以容納大約 600 頁文檔。
微軟 AI 負責人穆斯塔法·蘇萊曼強調,這個模型沒有使用第三方模型蒸餾,訓練數據來自乾淨且合規授權的數據,並在預訓練中排除了 AI 生成內容。它已在 Microsoft Foundry 私有預覽,之後會進入 MAI Playground 公測。

代碼模型 MAI Code 1 Flash 面向日常開發工作流。它由微軟端到端訓練,使用乾淨且合規授權的數據,正在向 Visual Studio Code 中的 GitHub Copilot 個人用戶推出,入口包括模型選擇器和默認自動選擇器。

微軟稱,這個模型針對 GitHub Copilot harness 做了訓練和適配,支持 Agentic coding,也支持 adaptive thinking。簡單請求保持簡潔,複雜任務會投入更多推理預算。
微軟把 MAI Code 1 Flash 直接拿來和 Claude Haiku 4.5 比較。
MAI Code 1 Flash 在 SWE Bench Pro 上達到 51.2%,高於 Claude Haiku 4.5 的 35.2%;在 IF Bench 精確指令跟隨上領先 28.9 分,在 Advanced IF 上領先 14.5 分。它將支撐微軟 GitHub Copilot 的常見編碼場景,尤其是代碼修改、多輪指令和真實開發環境裡的 Agent 任務。
圖像和語音模型也被納入 MAI 體系。
MAI Image 2.5 和 Flash 版本支持文本生成圖像和圖像編輯,已經進入 PowerPoint,並會擴展到 OneDrive 和 Foundry。

MAI Transcribe 1.5 支持 43 種語言,微軟稱其速度達到競品 5 倍,正在集成到 GitHub、Teams、Copilot 和 Dynamics 365 Contact Center。

MAI Voice 2 支持 15 種語言,可通過短樣本適配聲音,同時內置防濫用保護;低成本版本 MAI Voice 2 Flash 也在計劃中。

微軟還把 MAI 模型和自己的晶片聯繫起來。MAI Thinking 1 已針對 Maia 200 優化,端到端運行 MAI 模型時,還能獲得 1.4 倍每瓦性能提升。

企業定製也是 MAI 模型的重要方向。未來所有企業不僅會調用模型,也會把自己的流程訓練進模型。
為此,微軟還發布了 Microsoft Frontier Tuning,核心是 reinforcement learning environments。企業可以把真實工作軌跡、任務步驟、決策、工具調用和評價標準變成訓練環境,讓模型學習組織內部的工作方式。
PC 變成 Agent 工位,你的桌面就是數據中心
除了模型,微軟也把重點轉向本地算力。

Surface RTX Spark Dev Box 是這部分最值得一提的產品。納德拉把它稱為面向開發者的「dream machine(夢中神機)」。這台設備提供 1 petaflop AI 算力、20 個 CPU 核心和 128GB 統一內存,計劃在今年秋季推出。

Surface RTX Spark Dev Box 基於 Nvidia RTX Spark 平台。正如 APPSO 前幾天所報道的,RTX Spark 是面向 PC 的下一代 SoC,把 CPU、GPU 和 AI 能力整合到一顆晶片中,並支持統一內存架構和集成 DRTM。
英偉達 CEO 黃仁勛在影片連線中表示,PC 正在從個人電腦走向個人 AI。他舉例稱:用戶外出時,可以給自己的 PC 發消息,讓本地 Agent 調用工具、修改代碼、推進設計,再和用戶繼續疊代。

PC 不再只是一個被人操作的工具,也開始變成可以持續運行任務的 AI 助手。
此外,微軟還為 Surface RTX Spark Dev Box 預裝開發優化的 Windows 11 Pro,內置 VS Code、WSL、PowerShell 7、GitHub Copilot、Coreutils for Windows 等工具。

現場演示中,這台設備默認沒有新聞流、組件彈窗和通知,使用深色模式;Windows Insider 版本還加入了縱向任務欄,不僅開發工具被進一步系統化,命令行和容器體驗也更接近 Linux。

硬體上,它採用陽極氧化鋁 3D 列印一體機身,擁有 1000 個通風孔,熱設計功耗 100W,接口包括 USB-C、USB-A、HDMI、以太網和耳機接口。
Windows 將在 AI 時代大有作為。本地 AI 要讓 PC 成為 Agent 工作流的一部分:開發者可以在本地調試、運行模型、調用工具、看日誌、開容器、跑子 Agent,再把更大規模任務交給雲端。
Agent 需要新入口,微軟探路下一代 AI 終端
相比 Surface RTX Spark Dev Box 面向開發者,Project Solara 更像微軟對 Agent 設備形態的提前試探。下一台電腦不會只是一台設備,而是一組協同工作的設備。
微軟展示了兩類參考設備。
第一類是固定在桌面上的工作終端,基於聯發科晶片。

用戶走近後,系統會安全識別身份,並讓用戶進入自己的 Agent 工作環境,訪問基於 Work IQ 的 Microsoft 365 Copilot。
它可以顯示當天重要事項,也支持點按或語音交給 Agent 處理任務,還能作為 Windows PC 伴侶,或通過 Windows 365 接入 Cloud PC。它更像企業辦公桌上的 Agent 控制終端,負責身份識別、任務提醒、語音交互、Copilot 調用和 Cloud PC 接入。

第二類是可佩戴數字工牌,使用 Qualcomm 可穿戴晶片,面向移動工作場景。

演示中,用戶通過指紋解鎖後,要求 Copilot 為社交媒體帖子收集現場素材。工牌負責拍攝畫面,Agent 負責挑選鏡頭、清理畫面,並發送給本人和團隊審閱。發布會還展示了醫療場景:護士可用它進行免提語音記錄、區分說話人、核驗生命體徵、掃描藥物並驗證護理流程。

這兩類設備只是參考形態。
手機和 PC 仍然重要,但一些工作場景需要更靠近人、空間和傳感器的硬體。面對未來的 Agent 時代,企業可以更換 Agent,調整外觀、螢幕、傳感器和輸入方式,在同一硬體和軟體基礎上適配不同垂直行業。
龍蝦之父站台,微軟給個人 Agent 加上企業護欄
Surface RTX Spark Dev Box 講的是本地算力,Project Solara 講的是新設備形態,OpenClaw on Windows 則把焦點轉到個人 Agent 如何安全進入企業。

微軟展示了適用於 OpenClaw 的 Windows 套件,可以幫助用戶設置自己的 OpenClaw,或連接已經託管在 Windows 和 WSL 中的 OpenClaw。

應用里可以查看 gateway、參與 OpenClaw 的其他機器、會話和使用情況,也能快速進入 chat、canvas 和主控制台。
安全演示圍繞文件權限展開。
OpenClaw Windows Companion app 允許用戶控制 Agent 能訪問哪些文件夾,以及這些文件夾是只讀、可寫還是隱藏。它也可以配置剪貼板訪問、聯網權限等細粒度選項。
微軟在現場要求 OpenClaw 刪除桌面上的所有文件,並臨時關閉 OpenClaw 自身的安全層,只保留 MXC 的系統級限制。由於桌面文件夾被設置為只讀,OpenClaw 多次嘗試刪除和檢查目錄,最後仍無法刪除文件,桌面上的 94 張 JPG 得以保留。

龍蝦之父 Peter Steinberger 也透露,過去幾個月 OpenClaw 與 Microsoft、GitHub、OpenAI、Nvidia 等團隊合作,增加了可觀測性、自動權限模式,並重新設計訪問控制。現在權限不再只有全部允許或全部禁止,用戶可以指定哪些文件夾只讀、哪些可寫、哪些對 Agent 隱藏。

他還宣布,OpenClaw 可以在公司內部運行,harness 本身已經插件化。企業可以接入自己信任的 Copilot、Codex 或其他系統,把已有規則帶進 OpenClaw,再獲得持續記憶、heartbeat,以及在 Slack 或 Teams 中使用 OpenClaw 的能力。
AI 下半場,微軟盯上企業平台入口
除前述硬體和 Windows 更新外,微軟還發布了更多產品。
開發工具方面,微軟發布新的 GitHub Copilot app。它更像一個 Agent 編碼會話管理器,開發者可以同時啟動多個 issue 會話,並用 Git worktree 隔離,讓多個 Agent 並行工作。

Agent Merge 則負責跟蹤 PR 的 CI 檢查、代碼審查和合併衝突。微軟還發布 Raven,這是一個 Agent first SDK,用於連接 backend as a service,處理身份、儲存和資料庫 schema 等後端問題。
上下文能力由 Web IQ 承擔。
Agent 要進入企業流程,需要連接網路新資訊、企業業務對象、實時運營狀態、人員關係和組織流程。Web IQ 負責外部網路資訊,支持網頁、新聞、圖片和影片,模型無關、MCP native,可接入任意 Agent runtime,讓 Agent 的回答建立在更新、可驗證的內容上。

Copilot 也在升級為更複雜的工作入口。
納德拉稱,今年夏天會把 chat、cowork 和 code 放入同一個 Copilot,並發布 Autopilots。首個 Autopilot 名為 Scout,面向 Copilot Frontier 用戶開放,可在 Teams 群聊和 Outlook 線程中工作。

企業治理層面,微軟發布 Agent 365。它為 Agent 提供身份、權限、訪問控制和合規管理,並接入 Entra、Defender 和 Purview。Agent 365 可管理託管在 Azure、AWS、GCP 或其他環境中的 Agent,也支持不同框架構建的 Agent。
科研方向則是 Microsoft Discovery。納德拉把它定義為面向科學發現的 Agent 平台,希望把論文研究、候選方案生成、仿真計算、實驗設計和自動化實驗室連接成連續流程。
發布會最後,微軟還正式發布了新一代量子晶片 Majorana 2,其量子比特平均壽命可達 20 秒,最高接近 1 分鐘,比 Majorana 1 高約 1000 倍;操作時間為 1 微秒,尺寸仍為 0.01 毫米量級,並採用全數字控制。

至此,這場拼圖龐大且野心勃勃的發布會終於完整。AI 的第一階段,主導行業敘事的是模型公司;第二階段,主導產業落地的可能是平台公司。
誰來選擇模型,誰來分配任務,誰來管理 Agent,誰來定義權限和審計,誰就更接近企業 AI 的核心入口。當模型逐漸成為標準能力之後,真正決定價值歸屬的,將是承載這些模型運行的系統。
如果說當年那張 AI 時代的頭等艙門票,很大程度上是藉助盟友 OpenAI 的力量搶下的;那麼現在,微軟已經坐進了駕駛艙,並打算親自接管這架飛機的航向。






