奧特曼向馬斯克服軟,稱 AGI 更重要
在長期不和之後,OpenAI CEO Sam Altman(山姆·阿特曼)近日向馬斯克伸出橄欖枝,呼籲雙方擱置爭議,共同推進 AGI 發展。
事件始於馬斯克引用了奧特曼近十年前發布的一些批評現任美國總統唐納·川普的言論。
5 月 10 日,馬斯克轉發了 Y Combinator 聯合創始人 Paul Graham 的一則推文,內容為「很少有人比山姆·阿特曼做得更多來擊敗川普」,奧特曼當時回復道:「謝謝你,保羅」。
作為回應,奧特曼隨後發布了馬斯克 2022 年曾說過的一句話:「我不討厭這個人(川普),但現在是川普掛上帽子並駛向日落的時候了。」
we were both wrong, or at least i certainly was 🤷♂️ but that was from 2016 and this was from 2022https://t.co/WNPd2jsDBc
— Sam Altman (@sama) May 10, 2025
anyway, see you next week, let’s be friends
— Sam Altman (@sama) May 10, 2025
🥺
👉👈
agi too important to let a lil feud get in the way
並且,奧特曼承認:「我們倆都錯了,或者至少我肯定是錯的,但那是 2016 年,這是 2022 年的事情。」
值得注意的是,奧特曼在同一條推文中表示:「總之,下周見,讓我們成為朋友吧。通用人工智慧(AGI)太重要了,不能讓小小的恩怨成為阻礙。」
👀 英偉達計劃推出降級版 H20 晶片
據路透社引述三位知情人士消息,英偉達計劃在兩個月內向中國市場推出 H20 AI 晶片的降級版本,預計 7 月發布。這是英偉達為應對美國最新出口限制、維持中國市場份額的策略。
原版 H20 曾是獲准在華銷售的最強大 AI 晶片,但上個月被美國要求申請出口許可證,實際阻斷了市場准入。

新版晶片將大幅降低性能規格,包括顯著減少內存容量,但下遊客戶可能通過模塊配置調整性能。報道指出,中國市場對英偉達至關重要,去年貢獻 170 億美元收入,占總銷售額 13%。
在美國宣布新限制後,英偉達 CEO 黃仁勛迅速訪華,強調中國市場重要性。截至發稿前,英偉達拒絕置評。
🔗 https://www.reuters.com/world/china/nvidia-modifies-h20-chip-china-overcome-us-export-controls-sources-say-2025-05-09/
🔨 OpenAI 宣布調整公司結構,史上最大收購敲定
Sam Altman 在公開信中強調,公司堅持「確保 AGI 造福全人類」的使命不變,將繼續推動 AI 民主化,並計劃開源強大模型。
此外,OpenAI 將放棄原有的「利潤上限結構」,改為常規股權架構。
值得一提的是,OpenAI 還宣布一項關鍵人事任命:Fidji Simo 將出任 OpenAI 應用業務的 CEO,並直接向現任 CEO Sam Altman 匯報。

外媒 The Information 指出,Simo 在電商與廣告業務的豐富經驗,將被視為推動 OpenAI 商業化的關鍵補充。
與結構調整同步進行的是,OpenAI 據報道已同意以約 30 億美元收購 AI 編程工具 Windsurf,該筆交易也將是 OpenAI 迄今為止最大的一筆收購。
在此之前,OpenAI 曾試圖與 Windsurf 競爭對手 Cursor 的母公司 Anysphere 洽談合作但未成功,而後者近期獲得了 Thrive Capital 領投的 9 億美元融資,同時吸引了 a16z 等著名風險投資機構加入。
🔗 https://openai.com/index/evolving-our-structure/
🐧 DeepSeek 致謝騰訊技術團隊

日前,騰訊技術團隊針對 DeepSeek 開源的 DeepEP 通信框架進行深度優化,使其在多種網路環境下均實現顯著性能提升。
經測試,優化後的通信框架性能在 RoCE 網路環境提升 100%,IB 網路環境提升 30%,為企業開展 AI 大模型訓練提供更高效的解決方案。
該技術方案獲得了 DeepSeek 公開致謝,稱這是一次「huge speedup」代碼貢獻。
🔗 https://mp.weixin.qq.com/s/2MmSrPOCWLwPHo8kJLbUyg
💰 OpenAI 計劃重組後削減微軟的收入分成
據 The Information 消息,為安撫投資者和監管機構,OpenAI 正加速推進於上年 12 月提出的公司重組方案,但方案須獲得其最大股東兼合作夥伴——微軟的同意。
據悉,OpenAI 方案計劃中,其中一項為大幅下調微軟所獲的收入分成。
根據 OpenAI 向投資者披露的財務測算,目前與微軟簽訂的「2030 年前共享 20% 收入」協議,將在 10 年後減半,最終或僅剩 10% 左右。
對此,OpenAI 擬說服微軟放棄未來利潤分成權,改由傳統股票形式持有,屆時微軟將在 OpenAI 重組計劃的「公共利益公司」中持有股權,而非直接獲取利潤。但據知情人士透露,微軟目前尚未允許 OpenAI 對上述內容進行變動。

去年 12 月底,OpenAI 宣布重組公司結構,計劃將從營利性公司轉變為德拉瓦州公共利益公司。報道中提到,OpenAI 原計劃將營利業務獨立,但因多州慈善監管機構反對,已於 5 月 5 日暫時擱置。
據了解,OpenAI 與微軟從 2019 年開始建立合作關係。微軟先後對 OpenAI 投資超 130 億美元並獲取後者的技術授權和技術服務,而 OpenAI 也每年以數十億美元的價格租用微軟的 Azure 伺服器。
目前,OpenAI 現有投資將獲得傳統股票,並且不再受制於「未來利潤分成」的條款。但報道指出,現有投資者之一的軟銀似乎對此條件較為滿意,並且在 5 月 5 日重申了其承諾向 OpenAI 投資的 300 億美元。
儘管投資金額更多,但微軟目前仍掌握實質的否決權,因此 OpenAI 是否能對當前公司結構做出改變,依然需要微軟的同意。
另外,OpenAI 與微軟的拉鋸不只有上述的收入分成問題,雙方智慧財產權使用期限、未來新產品是否納入分成等關鍵問題仍在持續磋商。
🔗 https://www.theinformation.com/articles/openai-plans-slash-revenue-share-microsoft-restructuring?rc=qmzset
🏃🏻 世界人形機器人運動會將於 8 月北京舉行
據網路媒體和新京報消息,首屆世界人形機器人運動會將於今年 8 月 15 日至 17 日,在北京國家體育場(鳥巢)和國家速滑館(冰絲帶)舉辦。
本次世界人形機器人運動會由北京市人民政府、中央廣播電視總台、世界機器人合作組織、亞太機器人世界盃國際理事會聯合主辦,中央廣播電視總台北京總站參與聯合承辦。
據悉,這是全球首個以人形機器人為參賽主體的綜合性運動會,通過體育競賽形式展示人形機器人標誌性應用成果,推動產業加速發展。本屆人形機器人運動會比賽項目總體設計為主體賽事 外圍賽事:
主體賽事包括競技賽(參考人類傳統體育項目)、表演賽(單機舞蹈、群體舞蹈)和場景賽,共 19 個項目,展示機器人應用技術的多樣性、創新性與實用性。
外圍賽事共 3 個項目,包括非人形機器人參與的羽毛球、籃球和桌球,側重表演及與觀眾互動。

對於參加本次人形機器人運動會的機器人,則需滿足以下條件:
參賽機器人是參賽隊自研或採購的機器人。
機器人是一個獨立整體,不得分離為多個子單元,或是用軟纜連接的子單元,不得在比賽場地內設置標記物。
機器人應具有軀幹、上肢、雙足。其中,場景賽比賽項目機器人的下肢可採用輪式或雙足式。
機器人控制方式可以選擇手動遙控(含半自動,需無線遙控,且操作人員只能在指定區域操作)或完全自主控制(計時階段不允許任何人工介入)。
上個月,全球首屆人形機器人半程馬拉松在京開跑。其中北京人形機器人創新中心研發的「天工 Ultra」憑藉 2 時 40 分 42 秒的成績獲得冠軍。
🔗 https://mp.weixin.qq.com/s/aA4pz8-3aC0lUL6ny8naBA
🍎 蘋果多款晶片遭曝光
據彭博社消息,蘋果目前正在開發多款晶片,涵蓋智能眼鏡、新款 Mac 和 AI 伺服器,具體來看:
智能眼鏡晶片:
蘋果正在為其智能眼鏡研發專用晶片,目前取得一定進展。據悉,該款產品與 Meta 的 Ray-Ban Meta 智能眼鏡類似,並直接成為競爭對手。
智能眼鏡晶片將基於 Apple Watch 的 S 系列晶片打造,為了功耗表現優秀,蘋果還將部分晶片單元進行移除。另外,該晶片將支持智能眼鏡實現多攝影機調用。報道透露,該晶片由台積電代工,預計 2026 年底或 2027 年實現大規模量產,因此推測蘋果的智能眼鏡也將要在近兩年內推出。
報道還指出,蘋果 CEO 庫克目前決心要在智能眼鏡市場擊敗目前的巨頭 Meta,而帶攝影機的智能眼鏡也被蘋果視為下一個 AI 入口。為了分擔眼鏡產品線的風險,蘋果還計劃在 Apple Watch 中添加攝影機,並且專門為帶攝影機版本的 Apple Watch 開發名為「Nevis」的晶片,而帶攝影機的 AirPods 則擁有名為「Glennie」的配件。

M 系列晶片:
蘋果 Mac 晶片—M 系列處理器也有了新的進展,目前 M6(Komodo)和 M7(Borneo)兩款處理器或已在開發。還有另一款更先進的 Mac 晶片也在同步開發中,名為「Sotra」。
另外,蘋果計劃在今年年底之前將 M5 處理器帶到 iPad Pro 和 MacBook Pro 上。
AI 伺服器晶片:
報道提到,這是蘋果首次專門為 AI 伺服器設計處理器,此類處理器將用作 Apple Intelligence(蘋果智能)的雲端計算。據悉,蘋果目前使用的是 M 系列的高端型號處理器進行上述雲端運算。
蘋果首款 AI 伺服器晶片代號為「Baltra」,計劃於 2027 年完成。同時,該晶片還將擁有多個版本,性能或將是目前蘋果最強晶片 M3 Ultra 的兩倍、四倍,甚至是八倍。
🔗 https://www.bloomberg.com/news/articles/2025-05-08/apple-is-developing-specialized-chips-for-glasses-new-macs-and-ai-servers?srnd=phx-technology
Hunt for Tools|先進工具
👏 OpenAI 為 ChatGPT 深度研究工具添加 GitHub 連接器
OpenAI 於 5 月 8 日宣布為 ChatGPT「深度研究」功能推出首個外部連接器,使 ChatGPT 能夠分析 GitHub 上的代碼庫。
據介紹,這一新功能將允許開發者針對代碼庫和工程文檔提出問題,獲取相關分析和解答。
OpenAI 業務產品負責人 Nate Gonzalez 在 LinkedIn 上表示:「我經常聽到用戶反饋,他們發現 ChatGPT 的深度研究功能非常有價值,希望它能連接到他們的內部資源,而不僅僅是網路。這就是我們今天推出首個連接器的原因。」

除了回答關於代碼庫的問題外,新連接器還能將產品規格分解為技術任務和依賴項、總結代碼結構和模式,並幫助用戶理解如何使用真實代碼示例實現新的 API。
同日,OpenAI 還為開發者推出了模型強化微調(Reinforcement Fine-Tuning),允許開發者根據特定應用微調其 o4-mini 推理模型,該技術使用特定任務評分來提高模型性能。GPT-4.1 nano 模型的微調功能也已推出。
🔗 https://techcrunch.com/2025/05/08/chatgpts-deep-research-tool-gets-a-github-connector-to-answer-questions-about-code/
👍 Mistral Medium 3 正式發布
Mistral AI 本周推出了最新語言模型 Mistral Medium 3。
該模型在維持高性能的同時,將成本降至同類產品八分之一,並簡化了企業部署流程。
它在性能測試中達到 Claude Sonnet 3.7 的 90% 表現水平,價格卻更優惠,每百萬 token 輸入成本僅 0.4 美元,輸出成本 2 美元。

與市場上其他模型相比,Mistral Medium 3 超越了 Llama 4 Maverick 等開源模型和 Cohere Command 等企業模型,在價格上也擊敗了 DeepSeek v3。
據悉,該模型可部署在任何雲平台或四個以上 GPU 的自託管環境中,適應各種企業部署需求,在編碼和 STEM 領域表現尤其出色,提供了持續預訓練、完全微調和知識庫整合等企業級解決方案。
目前該 API 已在 Mistral 平台和 Amazon Sagemaker 可用,即將登陸其他主流雲服務。此外,Mistral AI 還暗示將在未來幾周內推出一款更大型的開源模型。
🔗 https://mistral.ai/news/mistral-medium-3
🧑💻 Google 發布 Gemini 2.5 Pro(I/O 預覽版)
本周,Google 發布了旗下 Gemini 2.5 Pro 模型的 I/O 預覽版。
據官方介紹,該版本專為即將到來的 Google I/O 大會準備,重點提升了編碼能力,專注於前端開發、UI 構建、代碼轉換/編輯、函數調用等方面。

具體來看:
前端與 UI 開發能力升級:Gemini 2.5 Pro 在網頁基準測試 WebDev Arena 排行榜上排名第一,超越 Anthropic 的 Claude 3.7 Sonnet;支持設計樣式自動匹配,保持風格一致;
影片理解能力提升,在 VideoMME 基準測試中得分 84.8%;支持通過影片內容(如 YouTube 影片)生成交互式應用;
應用構建落地速度加快:通過簡單的提示,即可快速生成具有美觀 UI 和動效的可用 App。
價格方面,Gemini 2.5 Pro I/O 預覽版與此前 3 月發布的版本價格一致。
使用方面,用戶現在即可通過 Google AI Studio 中的 Gemini API 選擇上述版本的 Gemini 2.5 Pro 進行使用,系統默認將接口接入最新版本,用戶無需額外遷移。
🔗 https://developers.googleblog.com/en/gemini-2-5-pro-io-improved-coding-performance/
Hunt for Fun | 先玩
😄 樂高也有大模型了?
卡內基梅隆大學朱俊彥助理教授團隊最近開發了 LegoGPT。
LegoGPT 是全球首個能根據文本提示詞生成物理穩定樂高結構的 AI 系統。該模型不僅能設計出符合描述的樂高作品(如日式書櫃、電馭叛客沙發和吉他),還確保這些設計在現實世界中可穩定搭建。
LegoGPT 通過精確計算每塊積木位置,確保無碰撞且適合搭建空間,再用數學模型驗證物理穩定性。

若發現不穩定,系統會重新調整設計,將穩定比例從 24% 提升至 98.8%。研究團隊使用機器人手臂和人工測試驗證了這些設計的可行性。
該項目基於團隊構建的 StableText2Lego 數據集(包含 47000 多個樂高結構)和經微調的 LLaMA-3.2-1BInstruct 模型。除基本結構外,系統還能添加紋理和顏色。雖然目前僅支持 21 個類別和常用積木。
目前,該團隊已公開發布全部代碼和數據。
🔗 https://arxiv.org/pdf/2505.05469
Hunt for Insight|先知
🕶️ 祖克柏:AR 眼鏡會是未來的手機,VR 則是未來的電視
Meta 創始人兼 CEO 馬克·祖克柏近日接受 Stratechery 記者本·湯普森專訪,詳細闡述了公司以開源大語言模型 Llama 為核心的 AI 戰略,以及未來在多個業務領域的布局規劃。
在訪談中,祖克柏預測,社交媒體將進入 AI 生成內容大爆發的第三階段——在朋友分享和創作者內容基礎上,AI 將根據用戶喜好生成大量個性化內容。第三個方向是將消息類應用打造成商業平台。第四個方向則是開發專門由 AI 驅動的新業務,如 Meta AI 獨立應用和元宇宙內容生成服務。
談及開源戰略,祖克柏批評了蘋果公司對開發者的限制:「蘋果公司直接表態不允許在一個已有的平台上再構建一個具有獨立平台功能的生態系統,這種限制性政策導致了我們兩家公司之間的深層矛盾。」

祖克柏還特別按贊了 DeepSeek 的發展:「現在這個領域已經不光是 Llama 一家獨大,像 DeepSeek 這些 AI 模型也做得風生水起。」他預測到 2025 年,開發者主要都會使用開源模型。
在談到 AI 與人際關係的結合時,祖克柏表示,AI 未來將在朋友關係維護中發揮重要作用,如幫助用戶記憶社交細節和規劃活動。
祖克柏認為 AR 眼鏡會是未來的手機,VR 則是未來的電視,兩者將共同發展。祖克柏透露,Meta 正在開發的先進 AR 眼鏡 Orion 計劃在未來幾年內推出,這將是 AI 助手與用戶全天候互動的理想載體。
🔗 https://stratechery.com/2025/an-interview-with-meta-ceo-mark-zuckerberg-about-ai-and-the-evolution-of-social-media/
🚗 理想 CEO:開源自家 OS 是為了感謝 DeepSeek
本周,理想 CEO 李想現身最新一期《理想 AI Talk》,並透露了部分自己對於 AI 領域的想法。
主持人談及「從 DeepSeek 身上學到什麼」時,李想回答:「第一步一定要先搞研究」。李想進一步分析,研究跑通了以後研發效率會變得非常的高。
對於 DeepSeek 創始人梁文鋒,李想則認為自己從前者身上學到了自律,並且能夠堅守自己相信的東西、最佳實踐。李想還透露,因為理想的 AI 團隊擁抱 DeepSeek 速度很快,同時 DeepSeek 的開源加快了理想自研模型的步伐,DeepSeek 的出現給理想帶來了巨大的收益和幫助。

對於 DeepSeek 的幫助,李想也公布了理想自研汽車作業系統「星環 OS」的開源想法:通過 DeepSeek 的幫助,理想的團隊也想為社會做出貢獻,並且感謝 DeepSeek。
🔗 https://mp.weixin.qq.com/s/6oeabjZQDXC_9EismmhWqQ?scene=1
📱 Figma CEO:軟體創作將因 AI 迎來爆發
在舊金山舉行的 Config 設計大會上,Figma CEO Dylan Field 宣布了公司歷史上最重大的產品擴張計劃,並在會後接受了 The Verge 記者 Alex Heath 的專訪,詳細闡述了 Figma 如何重新定位 AI 戰略以及公司的未來發展方向。
四款新產品包括:類似 ChatGPT 的原型設計工具、網站構建和託管平台、AI 品牌廣告工具以及一款與 Adobe Illustrator 競爭的矢量設計軟體。
Field 表示 Figma 現在採用了全新的模型驅動方法。
「我們使用了Claude Sonnet 3.7模型。顯然它是模塊化的,未來我們可以使用其他模型。在模型開發方面,唯一不變的就是變化,你無法必然預測這些模型會輸出什麼。」

當被問及這種「即插即用」的模型方法是否將責任從 Figma 轉移到了模型提供商時,Field 回應道:
「我們儘可能做好歸因工作。例如,如果你使用來自社區的設計,我們能夠檢測到它來自社區,我們會在代碼中放置歸因鏈接。但同時,我們無法判斷模型何時可能『記住』了某些內容。」
對於 AI 模型提供商是否會蠶食 Figma 的業務,Field 顯得信心十足:「回顧 Figma 過去十年,令我不斷驚嘆的是,我們確實處於軟體創造的指數增長曲線上。因為 AI,我們將看到比以往任何時候都更多的軟體被創造出來。」
「我堅信設計和工藝是讓產品和品牌脫穎而出的關鍵因素。你能通過代碼或黑客方式創造出賺錢的產品嗎?當然可以。但這會是一個持久的產品嗎?如果有任何程度的競爭,你需要真正出色的設計、觀點、用戶體驗和品牌。考慮到大語言模型不具備的所有人類背景,我不認為模型能完全替代人類。」
關於 AI 是否會取代當今的數字廣告,Field 持謹慎態度:「我認為 AI 在生成營銷資產方面有一席之地。在 Buzz 中,你可以生成圖像和文本。但我還沒有看到模型能生成品牌團隊真正引以為豪的內容。也許這一天會到來,但似乎比你預期的要遠。」
🔗 https://www.theverge.com/command-line-newsletter/664444/figma-ceo-ai-config-interview
🤯 Jim Fan:物理 API 將直接操作現實世界的物質
英偉達機器人部門主管 Jim Fan 在紅杉資本 AI Ascent 大會上提出了「物理圖靈測試」概念,指人類無法區分是人還是機器人完成的家務整理工作。Fan 指出,當前機器人技術仍存在明顯差距,如機器狗遇香蕉皮會摔倒,機器人做早餐顯得笨拙。
機器人領域面臨的最大挑戰是數據匱乏。
Fan 形象地比喻,大語言模型研究人員抱怨數據耗盡,而機器人研究者「連化石燃料都沒有」。目前英偉達通過 VR 遙操作收集數據,但這一過程被形容為「拿人力當燃料」,難以擴展。

為突破瓶頸,Fan 介紹了兩代模擬解決方案:模擬 1.0 採用數字孿生方法,以超過實時 10000 倍的速度進行多樣化環境模擬;模擬 2.0 則利用生成式AI創建模擬場景,通過 RoboCasa 框架生成家居環境和機器人操作影片。
Fan提出「具身Scaling Law」理論,認為神經世界模型中的物理智能將隨計算規模指數增長。基於這些技術,英偉達已訓練出 GR00T N1 模型,能在實際機器人上實現倒香檳等任務。
類似於大語言模型 API 處理數字資訊,Fan 認為物理 API 將直接操作現實世界的物質。「過去 5000 年,儘管人類文明有了巨大進步,但處理物質世界的方式基本沒變。未來的物理 API 將徹底改變這一點。」
🔗 https://www.youtube.com/watch?v=_2NijXqBESI
彩蛋時間


作者:@Artedeingenio
工具:Midjourney v7
Prompt:science fiction storyboard frame, hand-drawn in pencil and marker, cinematic composition, annotations in the margins, old-school animation prep --ar 7:3 --raw --p --v 7
鏈接:https://x.com/Artedeingenio/status/1920759331814834565