近日,蘋果發布了關於機器人及其訓練方法的最新研究成果。此前,蘋果在機器人領域已有過探索,像研發過機器人檯燈等產品,而此次研究則聚焦於人形機器人這一更具挑戰性的方向。
名為《Humanoid Policy ~ Human Policy》的研究報告,深入剖析了傳統人形機器人培訓方法的弊端。傳統方法過度依賴機器人演示者,不僅過程「勞動密集型」,還需要投入大量資金用於「昂貴的遠程操作數據收集」。針對這些問題,蘋果提出了一種可擴展且經濟高效的新型解決方案。
蘋果建議採用綜合訓練方法,將人類教練與機器人演示者相結合應用於訓練過程。這種做法的優勢在於能夠有效降低培訓成本。蘋果利用改進的消費產品來製作人形機器人培訓材料。
例如,對 Apple Vision Pro 進行改裝,使其僅通過左下方攝影機進行視覺觀察,同時藉助 Apple ARKit 獲取 3D 頭部和手部姿勢資訊。此外,還使用了配備迷你 ZED 立體攝影機的改裝 Meta Quest 頭顯,打造出低成本的培訓方案。
在具體訓練操作中,這些改裝後的頭顯主要用於訓練人形機器人的手部動作。人類教練按照要求坐直,雙手執行抓取、舉起特定物體以及倒出液體等一系列動作。在錄製動作過程中,頭顯會同步提供語音指令。錄製完成後,將畫面放慢,以便用於人形機器人的訓練。
蘋果還構建了一個處理培訓材料的模型,即「物理人機數據(PH2D)」。與之配套的「人機動作轉換器(HAT)」模型,能夠同時處理人類和機器人創造的輸入數據。蘋果研究人員成功將人類和機器人演示源整合到一個「可泛化的策略框架」中。
研究報告顯示,蘋果這種獨特方法相較於僅使用真實機器人數據訓練的方法,在策略魯棒性和泛化性方面有了顯著提升。
從實際效果來看,使用這種綜合訓練策略優勢明顯。不僅具有成本效益,而且訓練出的機器人在特定任務,如垂直物體抓取上,表現優於僅使用機器人演示器的機器人。不過,目前這種優勢僅體現在特定任務領域。
展望未來,蘋果很可能會在後續產品中應用這種訓練方法。儘管目前蘋果僅展示了機器人燈的原型,但有消息稱,蘋果正在為終端消費者開發一款能夠執行家務和簡單任務的移動機器人,這無疑讓人對蘋果在機器人領域的未來發展充滿期待。