微軟在一年一度的Build開發者大會上正式拉開帷幕,公司在主題演講中宣布推出七款全新AI模型,其中包括微軟首款推理模型。演講中,微軟AI首席執行官穆斯塔法·蘇萊曼在介紹新模型時,再次強調了其實驗室"人文主義超級智能"的發展理念。
以下是各款模型的功能詳情。
MAI-Thinking-1:微軟首款推理模型
微軟AI首款推理模型MAI-Thinking-1在官方部落格公告中表示,該模型基於"企業級、乾淨且已獲商業授權的數據"進行訓練。鑑於版權與AI使用問題引發的廣泛爭議(以及持續推進中的相關訴訟),此番聲明對微軟客戶而言意義重大,不過這並非首家作出此類承諾的企業。
微軟表示,這款擁有350億參數的模型在獨立評審員進行的盲測中超越了Anthropic的Sonnet 4.61,並在SWE Bench Pro編程基準測試中與Anthropic Opus 4.6持平。順應當前AI領域盛行的智能體熱潮,MAI-Thinking-1專為多步驟任務設計,目前已在微軟Foundry平台以私人預覽形式上線。
MAI-Code-1:專為GitHub調優的編程模型
與此同時,MAI-Code-1也正式加入微軟AI產品家族,參與市場上頂尖編程模型的競逐。微軟將其描述為"超高效率"且"專為GitHub調優"的模型。MAI-Code-1已於同日上線Copilot和VS Code。
MAI-Image-2.5:首款圖像生成模型
MAI-Image-2.5及其Flash版本是微軟首款面向文本生成圖像與圖像轉換圖像任務的模型。據微軟介紹,該模型在借鑑西洋棋評分體系改編而成的ELO評級系統中超越了Nano Banana Pro。MAI-Image-2.5系列模型現已上線PowerPoint和Foundry,並正在OneDrive中陸續推出。蘇萊曼在主題演講中介紹該模型時,其LM Arena排行榜排名已升至第三位,僅次於Nano Banana。
MAI-Transcribe-1.5及語音模型系列
MAI-Transcribe-1.5"在43種語言中實現了最先進的識別精度,流式傳輸功能也即將推出"。微軟還同步發布了MAI-Voice-2及其Flash版本,新版本相較前代MAI-Voice-1新增了15種語言支持。這些模型的早期版本僅在兩個月前才以預覽形式發布,充分體現了今年AI新模型發布周期之快。
安全性與成本效益
蘇萊曼特別強調:"所有內容從一開始就加入了水印。"他在提及新模型安全框架時作出上述表態,同時提到各模型在成本效率方面均有提升,部分模型相較同類競品成本降低幅度高達10倍。微軟表示,所有新款MAI模型均可在Fireworks AI上使用——該平台現已在Foundry上正式開放,同時支持Baseten和Open Router平台。
與梅奧診所合作布局醫療AI
蘇萊曼在AI模型發布環節的壓軸介紹中,宣布與梅奧診所開展合作,共同研發麵向醫療領域的新一代前沿模型。這一項目加入了包括OpenAI和谷歌在內的眾多企業打造醫療專屬AI應用的行列。微軟已推出Copilot Health,但數據隱私、安全性和模型幻覺問題,在醫療AI領域仍是不容忽視的隱患。
Q&A
Q1:MAI-Thinking-1推理模型有哪些技術優勢?
A:MAI-Thinking-1是微軟首款推理模型,擁有350億參數,基於企業級商業授權數據訓練。在獨立盲測中超越Anthropic的Sonnet 4.61,並在SWE Bench Pro編程基準測試中與Anthropic Opus 4.6成績持平。該模型專為多步驟任務設計,符合當前智能體發展趨勢,目前在微軟Foundry平台以私人預覽形式開放使用。
Q2:MAI-Image-2.5支持哪些功能,已經在哪些平台上線?
A:MAI-Image-2.5是微軟首款支持文本生成圖像與圖像轉換圖像任務的模型,在ELO評級系統中超越了Nano Banana Pro,發布時即登上LM Arena排行榜第三位。目前該模型已在PowerPoint和Foundry上正式上線,並陸續向OneDrive用戶推出,同時提供Flash版本以滿足不同需求。
Q3:微軟新發布的MAI模型在成本和安全性方面有哪些改進?
A:蘇萊曼表示,所有新款MAI模型均從底層引入水印機制,強化安全框架。在成本效率方面,部分模型相較同類競品降幅高達10倍。所有MAI模型均可通過Fireworks AI、Baseten和Open Router平台訪問,Fireworks AI現已在微軟Foundry平台正式開放。






