從早稻田大學1972年研發的WABOT,到特斯拉2022年首秀的Optimus,人類科學家對人形機器人的研發走過了半個世紀。在這半個世紀裡,人形機器人的發展已經從本田ASIMO、波士頓動力Atlas代表的技術驗證期,過渡到了以特斯拉Optimus為代表的商業試水期,一個新的機器人時代正在開啟。
為此,至頂科技特別策劃推出《機器人新紀元》專題報道,旨在探尋全球機器人團隊的技術變遷和創新故事。
本篇為《機器人新紀元》專題報道第三篇深度文章。
作者| 金旺
欄目| 機器人新紀元
前不久WRC 2023上,在眾多人形機器人中,有一台人形機器人在展廳一隅一直忙碌地為駐足圍觀的觀眾做著拉花咖啡。
機器人做咖啡,在過去幾年裡並不少見,但多為基於機械臂形態的機器人來做咖啡,例如獵戶星空在2020年推出的智咖大師。
用人形機器人做咖啡實際上並不多見,非設定程序的執行,存在較大挑戰是一方面原因,也有人認為這多少有些大材小用。
而這款人形機器人背後,是在掃地機器人領域,乃至整個家庭清潔領域已經位列行業頭部的追覓。
做咖啡為什麼會成為追覓人形機器人學習的第一個場景化技能?
當我們來到蘇州,拜訪這家機器人公司的人形機器人團隊時,我們從追覓科技人形機器人負責人Albert(化名)那裡找到了這個問題的答案。
在追覓內部,人形機器人商業化路徑排序是:商用、工廠、家庭。
這其中,情緒價值更高的商用場景是追覓人形機器人將最先嘗試商業化落地的場景。
正因如此,也就有了追覓人形機器人做咖啡的故事。
不過,追覓做人形機器人還要從三年前說起,那時Albert剛到追覓,開始參與追覓第一個仿生機器人項目。
01 一代機器狗的台前幕後
2020年,Albert來到追覓,著手負責追覓與小米合作的機器狗項目,這是追覓第一次涉足仿生機器人領域。
不過,這卻不是Albert第一次接觸仿生機器人。
在此之前,Albert已經從事人形機器人項目研髮長達四年之久,在馬斯克還沒有闖入這一領域,在波士頓動力還是人形機器人領域唯一網紅時,Albert就已經在另一個機器人團隊從事人形機器人研發工作。
那四年的機器人項目研發經歷,讓Albert逐漸成長為一位對機器人行業技術趨勢有敏銳判斷力的江湖老手。
憑藉在人形機器人領域多年的研發經驗和敏銳嗅覺,Albert發現,仿生機器人的本體和控制方案在2020年開始收斂,整體方案開始走向成熟。
這其中,MIT和斯坦福兩個全球頂級高校是這樣的機器人技術收斂背後的主要推動力。
2018年9月,MIT機器人實驗室的Benjamin Katz在他的論文中,開源了MIT Mini Cheetah電機驅動器的代碼。10月,他再次將Mini Cheetah上運行的所有代碼對外開源。
這讓四足機器人,乃至仿生機器人領域有了一個公版硬體方案,而且是一個質量相當不錯的公版硬體方案。
和MIT開源經歷類似的是,斯坦福大學人工智慧實驗室孵化了另一個對於機器人行業至關重要的開源項目——ROS,這相當於為機器人領域提供了一個公版的機器人(軟體)作業系統。
這兩個開源項目奠定了仿生機器人領域的發展基礎,在之後幾年裡,仿生機器人領域湧現出了越來越多的項目和公司。
追覓和小米在這一年著手聯合研發的機器狗,同樣是一個基於MIT Mini Cheetah ROS開源項目的方案。不同的是,追覓需要將這樣一個學術研究項目產品化,並實現量產。
在第一代機器狗產品化過程中,Albert和他的團隊遇到的第一個問題是,MIT Mini Cheetah原有的電機方案提供的動能不夠,因而整機負載在真實應用場景中明顯不夠。
Albert和他的團隊通過對這一方案拆解研究發現,之所以動能不夠,是因為原有方案霍爾額定值為6,減速比為1:6,Albert告訴我們「按這一參數造出的機器狗,想要進行一個後空翻都有很大難度。」
於是,追覓機器人團隊嘗試用6個霍爾提供1:9的減速比,將整機動能提升到了一個新的高度。
正是通過諸如此類的方案優化,追覓僅用了4個月,在2021年年初就做出了一代機器狗的工程樣機。
接下來則是更富有挑戰性的批量化生產。
一款機器人,在真正進入市場之前,批量化是最難的關卡。
Albert解釋稱,「在考慮批量化時,我們不僅需要考慮霍爾磁鐵的距離、強度,以及算法邏輯強度,還需要考慮整體產品的公差。」
很多在實驗室表現良好的機器人,正是因為無法克服公差、保證良率,遲遲無法進入商用市場。
為了確保當時需要交付的機器狗產品一致性,Albert親自下到工廠產線上監控生產工藝、卡工位標準。
也是在解決了這款機器狗的批量化問題,完成了量產交付後,Albert覺得,之前一直有規劃、想做卻沒做的人形機器人,現在是時候提上日程了。
02 大模型帶來第二個技術收斂
2021年7月,在開源MIT Mini Cheetah後,MIT的研究人員又研發了一款酷似Mini Cheetah的人形機器人MIT Humanoid。
這款人形機器人不僅在電機性能上得到了極大的改善,也再次為整個機器人行業,尤其有意研發人形機器人的團隊提供了一個思路。
「實際上,在MIT Humanoid面世之前,包括追覓在內的很多機器人公司已經推演出了人形機器人的發展路徑,」Albert告訴科技行者。
尤其是機器人技術在硬體本體和控制技術上,已經明顯在向高透明度的MPC WBIC這一方向收斂。
於是,2022年年中,追覓正式立項了人形機器人項目。
對於同樣從機器狗賽道進入人形機器人賽道的追覓來說,首先需要克服的是兩個難題:
第一個難題是更複雜的整機系統。
人形機器人無論是在電機數量上,還是整機系統的複雜程度上,都要比機器狗更為複雜,要想研發出具有量產能力的人形機器人,追覓的團隊顯然需要考慮更多因素。
第二個難題是機器人本體的平衡控制。
人形機器人的平衡控制同樣比機器狗更難實現,也是現在人形機器人團隊在花大量精力優化、攻克的一項基礎能力。
不過,Albert指出,雖然從行業平均水平來看,現在人形機器人的運動能力還沒有進化完全,但對於追覓等機器人公司而言,這已經是一個沒有阻力、一定能夠解決的問題。
之所以有這樣的自信,是因為大模型的出現。
2022年11月30日,ChatGPT正式發布,這標誌著人工智慧進入到了一個以大模型為代表的新時期。
大模型的出現,也為人形機器人運動過程中的泛化能力提供了一個很好的解決思路。
Albert指出,人形機器人能夠在2023年這麼火,有三分之一的原因是因為大模型的出現,而大模型的出現讓仿生機器人在軟體技術上得以進一步收斂。
更為重要的是,「未來人形機器人批量落地,特別是在相對複雜場景中落地,將會對強化學習和大模型有強依賴性。」
正因如此,追覓早早就從算法團隊中抽調工程師研究強化學習和大模型策略,並嘗試將相關算法與追覓仿生機器人研究相結合。
通過與強化學習、大模型結合,Albert認為,經過半年時間打磨,人形機器人整體運動能力可以達到及格水平。
接下來在進入產業化之前,更重要的將會是實際操作能力。
03 追覓機器人的終局思維
在追覓立項人形機器人這一年,公司內部也在進行著一次架構調整。
2020年,在搭建仿生機器人研發團隊時,Albert從追覓原吸塵器和掃地機器人業務線抽調了電機、驅動、結構、算法、工程幾個方向的工程師,外加新招聘的工程師,組成了一個二三十人的研發團隊。
這樣組建起來的研發團隊,在追覓內部仍以傳統的項目制運作。
2022年5月,也就是在人形機器人立項前,追覓廣義機器人戰略進一步明晰,於是成立了與以往項目團隊風格截然不同的技術研究機構——追覓創新機器人研究院。
「成立創新機器人研究院的另一個原因,是想要通過這一組織實現底層技術能力的復用,」Albert進一步解釋稱。
以自研伺服電機為例。
追覓早年間以高速電機起家,持續的技術投入讓追覓在高速電機領域建立起了領先優勢。
然而,高速電機與伺服電機並不相同,例如高速電機只有一對磁極,伺服電機有多對磁極;高速電機更強調動力平衡,伺服電機則對扭矩有較高要求。
不過,Albert解釋稱,「從高速電機跨到伺服電機,只是電機需要優化的技術指標會有一定差異,對在高速電機領域有深厚技術積累的追覓來說,挑戰並不大。」
Albert還特別指出,「對於原來研發高速電機的工程師而言,90%以上技術能力可以拿來復用,其中沒有辦法直接復用的部分,比如伺服電機相對於高速電機多了一節行星齒,我們也從掃地機器人的一個平衡齒輪技術上找到了相似方案。」
就這樣,追覓自研的第一代伺服電機,在最大扭矩、電機重量等參數上已經達到了行業的領先水平。
另一個技術復用體現在追覓今年新一代掃地機器人X20系列上。
2023年4月,追覓對外發布了新一代掃地機器人X20,這代掃地機器人的一大特性是借鑑了機器人的機械臂技術,加入了仿生外擴的機械臂,在沿邊清潔時,通過將帶有拖布的機械臂外擴,實現了更好的沿邊清潔能力。
在Albert看來,這是機器人技術在實用場景的落地,為掃地機器人增加了關節與自由度,未來,追覓掃地機器人會增加更多的自由度,來實現更豐富的功能。
據Albert介紹,追覓一直以來的目標是要成為一家廣義機器人公司。
為此,追覓也形成了兩條技術路線:
一條是自下而上的技術路線。
基於現在商業化能力較強的掃地機器人、洗地機等產品繼續進行技術研發、產品疊代,並逐步滲透到更多機器人產品品類中。
另一條是自上而下的技術路線。
通過對通用人形機器人這一機器人終極品類的整體技術規劃,結合當下最先進的技術理念進行研發,並將在這個過程中積累的基礎技術成果應用到已有商業化產品中。
Albert表示:「最終我們希望通過兩條路線並行,實現雙向收斂,成為一家廣義機器人公司。」
不過,這是一個以十年為計量單位的企業成長之路,對於追覓而言,更重要的是探索出一條更符合自己的機器人商業化之路。
04 商業化路線:商用、工業、進家庭
2023年8月,在WRC 2023上,追覓通用人形機器人展示了第一個應用場景——做咖啡。
為什麼會先結合靈巧手讓人形機器人學咖啡?
這是因為Albert看到了工業機械臂在實際商業化場景中遇到的一個問題。
中國製造業產能分散,中小型工廠眾多,在這些工廠中,往往存在潮汐現象,在旺季往往有需要通過機械臂提升產能的需求,但如果購入機械臂改造工廠,在淡季往往又會因產能過剩導致機械臂閒置,這些閒置機械臂又因沒有通用性難以轉手。
這是Albert看到現在國內中小型工廠普遍存在的一個問題,也讓他意識到了通用人形機器人的實際操作能力的重要性。
追覓人形機器人的「拉花咖啡」想法由此誕生。
不過,Albert告訴我們,後續追覓還會基於靈巧手的兩個方向繼續深入:
第一,加入感知能力,與人形機器人其他部位的感知進行協同,做聯合算法研發;
第二,基於感知能力,在完成「拉花咖啡」的一期項目基礎上,二期項目要讓它進入更多商用場景,完成更多實際任務。
Albert也指出,由於人形機器人在環境感知和理解上仍有一定難度,追覓會首先選擇環境更加結構化,但擁有更高情緒價值的商用場景來落地,之後才是比商用場景落地更簡單的工廠場景。
至於人形機器人的終極場景——家庭場景,由於涉及大量交互,以及安全問題,追覓會放到商用、工廠之後去研發。
而要讓人形機器人進入家庭場景,Albert認為,至少還需要十年。
不過,關於人形機器人,Albert還有另一個預判:
由於人形機器人技術和產品的收斂,明年將會開啟人形機器人的商業化元年。