仿人機器人視覺與運動技術的精細調校

仿人機器人若要在人類身邊安全運作，無論是在醫院還是家庭環境中，都仍有很長的路要走。攝影機和雷達雖然能提供良好的視覺感知，但容錯空間極為有限，尤其是在兒童和老人附近。隨著自動駕駛汽車已在城市道路上部署，機器人開發者正在汲取其邊緣案例中的經驗教訓，構建更完善的視覺與運動技術以規避事故。

贊助商廣告

仿人機器人是物理AI的一種形態，從高級計算到微型傳感器，各個層面的技術都在持續推進，以期這些系統能儘快實現大規模部署。

英飛凌科技電源與傳感器系統部門總裁Adam White指出："機器人可以拆解為許多組成部分，從主計算單元到區域控制、電機控制、電池、充電及環境感知系統。機器人與汽車有若干相似之處，包括區域控制架構。例如，微控制器可能需要滿足功能安全（FuSa）要求，可能還需要特殊的以太網接口。電機控制方面，使用氮化鎵（GaN）器件可以縮小關節尺寸，同時延長電池續航。在環境感知領域，我們正在大量開發參考設計，為集成商和機器人公司提供最優傳感器方案——無論是雷達這類視覺傳感器，用於氣體檢測的CO?或其他傳感器，還是觸覺感知用的電容式傳感器。"

機器人的系統級架構在很大程度上借鑑自自動駕駛汽車，前端是感知套件，通常至少包含攝影機。

Cadence Tensilica產品汽車產品管理總監Amit Kumar表示："大多數整車廠會額外集成雷達，以彌補攝影機在夜間或低光照條件下的局限，部分車型還會引入雷射雷達。展望未來，熱成像傳感器也將被引入以增強夜間駕駛的冗餘性。機器人與此類似，同樣需要在複雜的天氣和光照條件下運行，因此這些傳感器不可或缺。不過，當機器人採用仿人形態時，還需要考慮更多感知維度。"

這些額外維度涵蓋麥克風（語音）、觸覺/觸力感知，以及未來可能出現的氣味傳感器陣列。

安全性是汽車與機器人領域最重要的交匯點之一。Imagination Technologies產品管理總監Matthew Bubis表示："無論是工業機器人、仿人機器人、機械臂，還是外形與人類毫無相似之處的複雜機器人，都有安全方面的影響。這些機器體型較大、存在一定危險性，需要處理來自多種攝影機輸入和雷射雷達類技術的複雜數據。這使得機器人與汽車晶片設計高度重疊。我們看到客戶從汽車晶片設計起步，為機器人應用做準備，同時也在思考是否需要基於大語言模型構建鏈式推理系統，以及是否需要沿用汽車GPU的安全標準。"

贊助商廣告

目前，機器人行業正在觀察哪種形態和應用場景會率先普及。Bubis表示，晶片設計企業一邊通過汽車業務維持運營，一邊期待與之合作的機器人初創公司在解決機械與AI軟體挑戰後迎來量產訂單，這一過程可能需要五年時間。

視覺感知

儘管工程界已在自動駕駛視覺領域投入了大量研發資源，但仍存在持續改進的空間，仿人機器人因與人類距離更近而有其特殊需求。

Synaptics物聯網與邊緣AI處理器業務副總裁John Weil表示，消費級視覺系統正在引領方向，工業領域將快速跟進。多攝影機融合是當前的重要趨勢："最簡單的方式是用低解析度攝影機持續掃描，快速處理大量數據，一旦識別到重要目標，再同步至高解析度攝影機進行精細分析。你可以用一台攝影機快速檢測物體，再用另一台在同一視野內以不同色彩空間、更高解析度拍攝。"

多攝影機協同工作的邏輯與人眼感知機制高度相似——人眼中心區域解析度高，周邊視野較低。Weil指出："我們將看到大量寬視野、低精度的攝影機與高精度、小範圍攝影機並存的方案。多模態意味著多個攝影機以不同精度對齊融合各類資訊。"

工業機器人方面，攝影機是檢測、質量控制和計數的主要感知手段，但也存在局限性。德州儀器機器人與工業自動化總經理Giovanni Campanella指出："在黑暗環境、煙霧或粉塵環境，或對超高速運動物體拍攝時，攝影機表現不佳。引入雷達等傳感器並進行傳感器融合，可以彌補這些盲點，ASIL認證的雷達設備能夠以故障安全的方式，在機器人周圍創建一個安全泡，準確探測兒童等易受傷害群體。"

Synopsys產品管理總監Matt Commens補充道，機器人視覺還借鑑了汽車的電磁雷達技術："當攝影機因強光無法正常工作時，電磁波仍能'看清'周圍環境。此外，視覺仿真工具不僅能模擬光照物理特性，還能模擬人眼對光的非線性感知，幫助設計者預判真實場景下的視覺效果。"

贊助商廣告

運動控制

仿人機器人從自動存取系統（ASRS）進化到自主移動機器人（AMR），下一階段是通用型機器人。AI與邊緣計算的結合，正在推動機器人實現更自然的運動。

Addverb傑出科學家Tapan Pattnayak描述了這一挑戰："人類撿起物體時，並不會顯式計算正運動學、逆運動學、距離和深度，而是憑藉持續的直覺性智能來調整身體姿態。這正是我們現在要攻克的物理AI核心問題。"

德州儀器的Campanella認為，硬體與軟體各占50%的重要性："硬體包括傳感器、電機驅動和執行器，尤其是手部可能有多達30個執行器；軟體則將一切整合在一起。"

能效管理

為機器人提供高效的能源供應是另一大挑戰。Siemens EDA產品負責人Sathishkumar Balasubramanian指出："如果機器人每運行10分鐘就需要更換電池，這顯然不可行。能源將是最大的問題。"

Synaptics戰略與業務發展高級總監Nebu Philips表示，機器人最大的功耗來源是電機而非晶片："在這類設備上，矽片本身並非主要功耗驅動。但對於觸覺等感知功能，低功耗非常重要，高效的傳感可以延長機器人續航。"

Imagination的Bubis也指出，低功耗需求甚至影響到數據類型的選擇："更低精度的數據類型意味著更低的功耗、更小的內存和更小的晶片。"

嗅覺與味覺

人類的嗅覺和味覺不僅帶來感官享受，更是判斷食物安全和規避有毒氣體的重要工具。這些場景正是機器人大有用武之地的領域。

Cadence的Kumar展望道："隨著機器人更深度地融入日常生活，嗅覺傳感模態將逐步興起。具有多樣化靈敏度特徵的氣體傳感器陣列，結合針對人類常見氣味訓練的神經網路模型，有望在機器人中實現基本的嗅覺功能。"

哈佛大學工程與應用科學學院研究生Haritosh Patel的團隊開發了一款電子鼻，能夠檢測多種氣體，通過CPU上的微型風扇"主動嗅探"，並利用MCU進行AI/ML處理。Patel介紹了其應用場景："這種電子鼻可以引導消防員找到被困人員，規劃化學風險更低的安全路徑，而這條路徑未必是最短路徑。"

贊助商廣告

在工業環境中，移動機器人搭載氣體傳感器後，可以比固定傳感器或人類更安全地靠近泄漏點。至於味覺傳感，目前相關研究主要集中於咖啡、葡萄酒、奶酪等高價值食品的品質分析，以及醫藥配方領域。

結語

要與人類安全共存，仿人機器人需要出色的視覺感知、精準的運動計算，以及在不過度消耗電能的前提下實現自然流暢的動作。仿人機器人與自動駕駛汽車有諸多相似之處，但其複雜度更高。

Synopsys的Commens總結道："汽車接收大量傳感器資訊後只需控制剎車和轉向，機器人面臨同樣的決策需求，卻有更多運動自由度，且工作環境比道路複雜得多。"隨著運動能力的成熟和全維度感知的逐步實現，仿人機器人的應用場景將從工業檢測一路延伸至品酒師、老人護理等更廣泛的領域。

Q&A

Q1：仿人機器人的視覺系統是如何實現的，為什麼要用多個攝影機？

A：仿人機器人通常採用多攝影機融合方案，模仿人眼的感知特性。低解析度寬視野攝影機負責快速掃描環境，識別到重要目標後再調用高解析度攝影機進行精細分析。此外，在黑暗或煙霧等攝影機失效的場景下，還會引入雷達傳感器進行補充，形成多模態感知融合，確保機器人在各種複雜環境下都能"看清"周圍世界。

Q2：仿人機器人的運動控制為什麼那麼難實現？

A：仿人機器人實現自然運動需要實時計算正運動學、逆運動學、距離和深度，同時還要高效使用電能，不能快速耗盡電池。更深層的挑戰在於，人類的運動依靠的是持續的直覺性智能，而非逐步的數學計算。如何讓機器人像人類一樣"感知—判斷—行動"，是物理AI目前正在攻克的核心難題。

Q3：仿人機器人的電子鼻技術現在發展到什麼程度了，有哪些實際應用？

A：哈佛大學研究團隊已開發出能檢測多種氣體的電子鼻原型，通過微型風扇主動採樣，結合MCU進行AI/ML處理。目前已驗證的應用場景包括：協助消防員在危險建築中找到被困人員，並規劃化學風險更低的營救路徑；在工業環境中探測氣體泄漏。未來結合神經網路模型，電子鼻有望在機器人中實現接近人類水平的嗅覺識別能力。

贊助商廣告