最近小米最讓人驚喜的新品,不是汽車,也不是手機,而是一款還沒正式發布的人形機器人,小米 CyberOne V2。
在前天的小米投資者大會上,它第一次公開亮相。

不跑不跳,也沒有表演後空翻,只是安靜地站在那裡,像一位訓練有素的工作人員,給與會嘉賓遞上伴手禮,和人握手、擊掌。
小米官方目前還沒有發布正式的參數,根據網上的爆料資訊,小米 CyberOne V2 這款人形機器人身高 178cm、體重約 52kg。

其他的參數像是機器人的步行速度,大約為 0.98m/s,單臂的舉重能力可以支撐 3kg 的重量。對比早前宇樹發布的 H2 機器人,其最快行走速度是 3.3m/s,手臂最大負載 15kg,額定 7kg。
小米 CyberOne V2 的重點,很明顯沒有放在走路和舉重上,這次最值得關注的,是小米機器人重新設計的手部。

這雙手是按照成年男性的手 1:1 比例製作,具有 22-27 個自由度,不僅能做到快速擰螺絲、掌內轉螺柱這些精細工業化場景的任務,還能捏羽毛和觸碰氣球。
更意外的是,這雙手竟然還有人類的「汗腺」。
其他的爆料還提到,小米 CyberOne V2 依靠背後的情感 AI 模型,能夠識別面部表情和聲音,從而給出恰當的互動反饋。
但也有美國網友在下面評論說,小米 CyberOne V2 的樣子和特斯拉 Optimus 也太像了,馬斯克選擇不提前展示 Optimus 的任何資訊是對的。

此前馬斯克有說過,推遲展示 Optimus V3,是為了防止競爭對手抄襲,並認為在大規模量產前,應儘可能將其藏在門後。
靈巧手是機器人的硬體瓶頸
從技術和資本市場,機器人這段時間的發展都很迅猛,幾乎每天都有一個具身智能的融資。
在腳上的功夫,機器人半馬刷新了人類紀錄,來到了一小時內。
但在「用手操作」上,翻書、繫鞋帶,這些人類雙手的日常操作,對機器人來說卻還是天方夜譚。

具身智能的核心,其實就在於機器人的大腦如何通過物理軀體與現實世界交互,而靈巧手成了實現完美交互最大的硬體瓶頸。
多家機器人公司都曾專門研究過靈巧手的問題,強腦科技此前發布了 BrainCo Revo 3 智能靈巧手;21 個自由度,集成了全掌觸覺和指尖視觸覺,並且兼容開源生態。
在官方發布的演示影片裡,這隻手超越了人手的活動空間,並且覆蓋了 33 種抓握手勢,能雙手解魔方,使用剪刀,和盤手串等。

靈巧手之所以成為一項難題,是難在軟體和硬體同時卡住。
軟體上,人手到機器人手的動作需要重定向;硬體上,手指內部的小型執行器又很難同時做到有力、靈敏、可靠。
這裡的「重定向」可以理解為:把人手的姿態、指尖軌跡和接觸關係,轉換成機器人手能執行的關節角和控制命令。

但人手和機械手的尺寸、關節數量、運動範圍都不完全一樣。人類做起來很自然的動作,直接映射到機器人手上,可能會變成不可達、穿模,或者接觸點不對。
在硬體上,腿部關節通常有更多空間,可以放更大半徑、更高扭矩密度的電機,因此更容易採用低減速比或準直驅方案。
比如 6:1 減速比,意思是電機轉 6 圈,輸出軸轉 1 圈;速度降下來,輸出扭矩放大上去。

腿部電機(齒輪比:6)與手指(齒輪比:288)。扭矩隨r³縮放。
手指沒有這種空間。電機必須縮到能塞進指節的尺寸,而在幾何相似的情況下,電機扭矩大致隨特徵長度的三次方下降。線性尺寸縮小到 1/10,扭矩可能只剩原來的 1/1000 量級。
扭矩不夠時,常見做法是靠更高減速比補回來,比如 100:1、200:1,甚至 288:1。
高減速比的代價也很直接:摩擦、齒隙、效率損失和反射慣量都會變得更難處理。
仿真里很輕巧的手指,到了現實里可能變得又硬又鈍,接觸時不夠柔順,精細操作也就難了。
根據小米技術此前發布的全掌觸覺仿生手探索文章,為了能 100% 復用人類的數據,小米對 CyberOne V2 的仿生手這次也進行了大刀闊斧的重構。
1:1 極致仿生: 將仿生手體積大幅壓縮了 60%,尺寸與成年男性手部完全一致。同時增加了 64% 的自由度,具有 22-27 個自由度 DoF,可達空間、慣量分布都無限逼近真實人手。

全掌觸覺覆蓋: 機器人如果視覺一旦被遮擋,基本上就無法正常運作。小米引入了觸覺手套方案,將全掌觸覺傳感器覆蓋面積提升至 8200 平方毫米。人類穿上它打樣,機器人就能完美繼承「手感」。
15 萬次耐久拉鋸: 在實驗室里、演示影片裡捏個杯子很簡單,但在工廠里連續打一萬次螺絲,機器人的腱繩、彈簧和套管就會斷裂。小米這雙仿生手目前在實際抓握中,突破了 15 萬次的循環壽命。
而最特別的細節,是靈巧手的「汗腺」。
為了實現這雙高自由度的靈巧手,小米也必須在機器人的單手小臂內塞滿各種電機。
而在實際應用中,單手電機功率超 100W,其中 30W 會直接轉化為廢熱,極易燒毀線路。在沒有外掛大型風扇的狹小空間裡,他們從人類「出汗散熱」中找到了靈感。
小米使用金屬 3D 列印,在緊湊的小臂結構中製作了微型液冷循環通道。利用微泵將熱量轉移,再通過水分蒸發吸熱降溫。
在實測中,這套仿生汗腺系統,每分鐘僅需蒸發 0.5mL 水,就能提供約 10W 的主動散熱能力。
手之外,還有機器人的大腦
硬體在疊代,模型也在同步推進。
兩個月前,小米開源了 Xiaomi-Robotics-0,一個面向具身智能的 VLA(視覺-語言-動作)模型。
在小米技術的官方推文里,他們進一步開源了真機後訓練(Post-training)的完整流程。

最直觀的數據是,基於預訓練基座,用 20 小時的任務數據進行真機後訓練,Xiaomi-Robotics-0 模型就能學會「把耳機放進耳機盒」這個高難度任務,並且能連續完成多個耳機的收納。
這套後訓練流程里有一個值得關注的技術細節:「偷懶效應」的解決方案。
為了讓機器人動作不卡頓,業界通常採用異步推理和「動作前綴」技術,即讓新動作順著上一個動作的慣性自然過渡。但這會導致 AI 開始「偷懶」:過度依賴動作慣性,選擇性無視攝影機傳來的實時視覺反饋。
小米用了三種機制來對抗這個問題:自適應加權損失、Λ 型注意力掩碼、前綴動作隨機遮蔽。簡單說,就是在訓練里故意給模型製造「答案殘缺」的情況,強迫它不得不去看當前的視覺信號。

軟硬體能力的綜合,也讓小米機器人已經在汽車工廠里搬磚了。在自攻螺母上件工位,做到了 3 小時持續無干預作業,安裝成功率高達 90.2%,能配合生產線 76 秒的高速節拍。
開始大規模交付的機器人
特斯拉此前把 Model S/X 的整條生產線砍掉,騰位置給機器人。
在一季度財報會上馬斯克宣布,第三代 Optimus V3 預計年中亮相,7 月下旬至 8 月在加州弗里蒙特工廠啟動生產,2026 年下半年向企業客戶交付,規劃年產能 100 萬台。

但就像馬斯克之前在播客里承認的一樣,手部精細操作是「整個項目最難的環節」。
特斯拉的 Optimus 還沒量產,美國另一家人形機器人公司 Figure 機器人,今天在 X 上宣布生產規模擴大了 24 倍,從每天生產一個機器人,變成 1 小時生產一個機器人。

在官方新聞稿里,Figure 提到他們已經交付了超過 350 個機器人。
對小米來說,做機器人,可能不會很快像 Figure、宇樹、甚至是特斯拉一樣,賣出一台消費級通用人形機器人。
但從 CyberOne V2 的方向也能看出來,小米真正想解決的,除了要讓機器人跑得更快、舉得更重,還有要讓它更像一個能真正幹活的手。






