仿人機器人若要在人類身邊安全運作,無論是在醫院還是家庭環境中,都仍有很長的路要走。攝影機和雷達雖然能提供良好的視覺感知,但容錯空間極為有限,尤其是在兒童和老人附近。隨著自動駕駛汽車已在城市道路上部署,機器人開發者正在汲取其邊緣案例中的經驗教訓,構建更完善的視覺與運動技術以規避事故。
仿人機器人是物理AI的一種形態,從高級計算到微型傳感器,各個層面的技術都在持續推進,以期這些系統能儘快實現大規模部署。
英飛凌科技電源與傳感器系統部門總裁Adam White指出:"機器人可以拆解為許多組成部分,從主計算單元到區域控制、電機控制、電池、充電及環境感知系統。機器人與汽車有若干相似之處,包括區域控制架構。例如,微控制器可能需要滿足功能安全(FuSa)要求,可能還需要特殊的以太網接口。電機控制方面,使用氮化鎵(GaN)器件可以縮小關節尺寸,同時延長電池續航。在環境感知領域,我們正在大量開發參考設計,為集成商和機器人公司提供最優傳感器方案——無論是雷達這類視覺傳感器,用於氣體檢測的CO?或其他傳感器,還是觸覺感知用的電容式傳感器。"
機器人的系統級架構在很大程度上借鑑自自動駕駛汽車,前端是感知套件,通常至少包含攝影機。
Cadence Tensilica產品汽車產品管理總監Amit Kumar表示:"大多數整車廠會額外集成雷達,以彌補攝影機在夜間或低光照條件下的局限,部分車型還會引入雷射雷達。展望未來,熱成像傳感器也將被引入以增強夜間駕駛的冗餘性。機器人與此類似,同樣需要在複雜的天氣和光照條件下運行,因此這些傳感器不可或缺。不過,當機器人採用仿人形態時,還需要考慮更多感知維度。"
這些額外維度涵蓋麥克風(語音)、觸覺/觸力感知,以及未來可能出現的氣味傳感器陣列。
安全性是汽車與機器人領域最重要的交匯點之一。Imagination Technologies產品管理總監Matthew Bubis表示:"無論是工業機器人、仿人機器人、機械臂,還是外形與人類毫無相似之處的複雜機器人,都有安全方面的影響。這些機器體型較大、存在一定危險性,需要處理來自多種攝影機輸入和雷射雷達類技術的複雜數據。這使得機器人與汽車晶片設計高度重疊。我們看到客戶從汽車晶片設計起步,為機器人應用做準備,同時也在思考是否需要基於大語言模型構建鏈式推理系統,以及是否需要沿用汽車GPU的安全標準。"
目前,機器人行業正在觀察哪種形態和應用場景會率先普及。Bubis表示,晶片設計企業一邊通過汽車業務維持運營,一邊期待與之合作的機器人初創公司在解決機械與AI軟體挑戰後迎來量產訂單,這一過程可能需要五年時間。
視覺感知
儘管工程界已在自動駕駛視覺領域投入了大量研發資源,但仍存在持續改進的空間,仿人機器人因與人類距離更近而有其特殊需求。
Synaptics物聯網與邊緣AI處理器業務副總裁John Weil表示,消費級視覺系統正在引領方向,工業領域將快速跟進。多攝影機融合是當前的重要趨勢:"最簡單的方式是用低解析度攝影機持續掃描,快速處理大量數據,一旦識別到重要目標,再同步至高解析度攝影機進行精細分析。你可以用一台攝影機快速檢測物體,再用另一台在同一視野內以不同色彩空間、更高解析度拍攝。"
多攝影機協同工作的邏輯與人眼感知機制高度相似——人眼中心區域解析度高,周邊視野較低。Weil指出:"我們將看到大量寬視野、低精度的攝影機與高精度、小範圍攝影機並存的方案。多模態意味著多個攝影機以不同精度對齊融合各類資訊。"
工業機器人方面,攝影機是檢測、質量控制和計數的主要感知手段,但也存在局限性。德州儀器機器人與工業自動化總經理Giovanni Campanella指出:"在黑暗環境、煙霧或粉塵環境,或對超高速運動物體拍攝時,攝影機表現不佳。引入雷達等傳感器並進行傳感器融合,可以彌補這些盲點,ASIL認證的雷達設備能夠以故障安全的方式,在機器人周圍創建一個安全泡,準確探測兒童等易受傷害群體。"
Synopsys產品管理總監Matt Commens補充道,機器人視覺還借鑑了汽車的電磁雷達技術:"當攝影機因強光無法正常工作時,電磁波仍能'看清'周圍環境。此外,視覺仿真工具不僅能模擬光照物理特性,還能模擬人眼對光的非線性感知,幫助設計者預判真實場景下的視覺效果。"
運動控制
仿人機器人從自動存取系統(ASRS)進化到自主移動機器人(AMR),下一階段是通用型機器人。AI與邊緣計算的結合,正在推動機器人實現更自然的運動。
Addverb傑出科學家Tapan Pattnayak描述了這一挑戰:"人類撿起物體時,並不會顯式計算正運動學、逆運動學、距離和深度,而是憑藉持續的直覺性智能來調整身體姿態。這正是我們現在要攻克的物理AI核心問題。"
德州儀器的Campanella認為,硬體與軟體各占50%的重要性:"硬體包括傳感器、電機驅動和執行器,尤其是手部可能有多達30個執行器;軟體則將一切整合在一起。"
能效管理
為機器人提供高效的能源供應是另一大挑戰。Siemens EDA產品負責人Sathishkumar Balasubramanian指出:"如果機器人每運行10分鐘就需要更換電池,這顯然不可行。能源將是最大的問題。"
Synaptics戰略與業務發展高級總監Nebu Philips表示,機器人最大的功耗來源是電機而非晶片:"在這類設備上,矽片本身並非主要功耗驅動。但對於觸覺等感知功能,低功耗非常重要,高效的傳感可以延長機器人續航。"
Imagination的Bubis也指出,低功耗需求甚至影響到數據類型的選擇:"更低精度的數據類型意味著更低的功耗、更小的內存和更小的晶片。"
嗅覺與味覺
人類的嗅覺和味覺不僅帶來感官享受,更是判斷食物安全和規避有毒氣體的重要工具。這些場景正是機器人大有用武之地的領域。
Cadence的Kumar展望道:"隨著機器人更深度地融入日常生活,嗅覺傳感模態將逐步興起。具有多樣化靈敏度特徵的氣體傳感器陣列,結合針對人類常見氣味訓練的神經網路模型,有望在機器人中實現基本的嗅覺功能。"
哈佛大學工程與應用科學學院研究生Haritosh Patel的團隊開發了一款電子鼻,能夠檢測多種氣體,通過CPU上的微型風扇"主動嗅探",並利用MCU進行AI/ML處理。Patel介紹了其應用場景:"這種電子鼻可以引導消防員找到被困人員,規劃化學風險更低的安全路徑,而這條路徑未必是最短路徑。"
在工業環境中,移動機器人搭載氣體傳感器後,可以比固定傳感器或人類更安全地靠近泄漏點。至於味覺傳感,目前相關研究主要集中於咖啡、葡萄酒、奶酪等高價值食品的品質分析,以及醫藥配方領域。
結語
要與人類安全共存,仿人機器人需要出色的視覺感知、精準的運動計算,以及在不過度消耗電能的前提下實現自然流暢的動作。仿人機器人與自動駕駛汽車有諸多相似之處,但其複雜度更高。
Synopsys的Commens總結道:"汽車接收大量傳感器資訊後只需控制剎車和轉向,機器人面臨同樣的決策需求,卻有更多運動自由度,且工作環境比道路複雜得多。"隨著運動能力的成熟和全維度感知的逐步實現,仿人機器人的應用場景將從工業檢測一路延伸至品酒師、老人護理等更廣泛的領域。
Q&A
Q1:仿人機器人的視覺系統是如何實現的,為什麼要用多個攝影機?
A:仿人機器人通常採用多攝影機融合方案,模仿人眼的感知特性。低解析度寬視野攝影機負責快速掃描環境,識別到重要目標後再調用高解析度攝影機進行精細分析。此外,在黑暗或煙霧等攝影機失效的場景下,還會引入雷達傳感器進行補充,形成多模態感知融合,確保機器人在各種複雜環境下都能"看清"周圍世界。
Q2:仿人機器人的運動控制為什麼那麼難實現?
A:仿人機器人實現自然運動需要實時計算正運動學、逆運動學、距離和深度,同時還要高效使用電能,不能快速耗盡電池。更深層的挑戰在於,人類的運動依靠的是持續的直覺性智能,而非逐步的數學計算。如何讓機器人像人類一樣"感知—判斷—行動",是物理AI目前正在攻克的核心難題。
Q3:仿人機器人的電子鼻技術現在發展到什麼程度了,有哪些實際應用?
A:哈佛大學研究團隊已開發出能檢測多種氣體的電子鼻原型,通過微型風扇主動採樣,結合MCU進行AI/ML處理。目前已驗證的應用場景包括:協助消防員在危險建築中找到被困人員,並規劃化學風險更低的營救路徑;在工業環境中探測氣體泄漏。未來結合神經網路模型,電子鼻有望在機器人中實現接近人類水平的嗅覺識別能力。






