宅中地 - 每日更新
宅中地 - 每日更新

贊助商廣告

X

同濟大學研發的「地空協作機器人」:如何讓無人車和無人機在黑暗隧道里默契配合?

2026年07月03日 首頁 » 熱門科技

這項由同濟大學多個研究團隊聯合完成的研究,於2026年6月發表在arXiv預印本平台(編號:arXiv:2606.25393v2),參與機構涵蓋同濟大學上海智能自主系統研究院、自主智能無人系統全國重點實驗室以及電子與資訊工程學院。有興趣深入了解的讀者可以通過上述編號在arXiv平台上查閱完整論文。

說到水電站,大多數人腦海中浮現的是巍峨的大壩和奔騰的江河。然而在大壩背後,隱藏著綿延數公里的引水隧道——這些黑暗、潮濕、空間狹窄的地下管道,是整個水電系統的"血管"。這些隧道需要定期檢查,以確認管壁是否出現裂縫、滲水或結構損壞。然而,派人進去檢查既危險又耗時,而且人眼很容易遺漏隱患。

於是,用機器人代替人類去執行這項任務,成了工程師們的目標。問題是:隧道里沒有GPS信號,光線極度不足,隧道壁面千篇一律毫無特徵,地面還可能覆蓋著淤泥。這樣的環境,就像讓機器人在完全陌生的黑暗迷宮裡獨自行走,既不能看地圖,也不能依賴手機定位。

研究團隊提出了一個叫做FLISP(快速雷射雷達-慣性同步路徑規劃器,Fast LiDAR-IMU Synchronized Path Planner)的系統,讓一輛地面無人車和一架無人機協同工作,共同完成隧道的全面檢查。這套系統最獨特的地方在於:它不需要提前建好地圖,也不依賴GPS,只靠安裝在地面車上的一套雷射雷達和慣性傳感器,就能同時為地面車和飛行器實時規劃出安全路徑,而且每次規劃只需約7毫秒——相當於眨眼時間的七十分之一。

一、黑暗迷宮裡的導航難題:為什麼普通方法行不通

理解FLISP的價值,首先要明白在這種極端環境中導航究竟有多難。

以目前機器人領域最主流的導航方案為例:通常的做法是讓機器人先"建圖"再"導航",也就是先用傳感器掃描周圍環境,把所有資訊整合成一張精確的地圖,然後在地圖上規劃路線。這套方法在室內倉庫或結構化工廠里運行得很好,但在水電隧道里卻頻頻"翻車"。

原因出在隧道的物理特徵上。水電隧道的截面是規整的圓弧形,內壁光滑均勻,無論走到哪裡看起來都一模一樣。這對負責"建圖"的算法來說是一場噩夢,因為算法需要識別環境中的"地標"來判斷自己走了多遠、轉了多少角。當四面八方都長得一樣時,算法就會逐漸迷失,積累誤差,最終地圖越畫越歪。研究團隊用實驗驗證了這一點:他們測試了兩種當前主流的建圖+導航組合方案,兩者都在隧道深處因為"迷路"而徹底失效。

其中一種方案(LIO-SAM加上Informed RRT*)的失敗方式尤為戲劇化:建出來的地圖會出現"重疊",彎曲的隧道壁疊加到路徑中間,機器人以為前方有障礙物,實際上那只是地圖錯亂產生的幻覺。更糟糕的是,在某些測試中,這套系統的位置估算會完全失控,計算出機器人已經"飛到"了完全不存在的位置。另一種方案(Fast-LIO2加上Grid A*)則陷入了另一種困境:建圖程序在隧道深處"卡住",虛擬位置停止前進,但機器人本體還在物理上移動,導致實際位置和地圖記錄的位置越來越偏,最終在地圖上製造出一個"幽靈堵塞",讓路徑規劃系統誤以為前方已經無路可走。

研究團隊還測試了一種完全不建圖的"純本地規劃"方案,用一種叫做TEB的彈性帶算法來實時規避障礙。這種方案雖然繞過了建圖失效的問題,卻遭遇了三種新的困境。

第一個困境叫做"屋頂陰影盲區陷阱"。地面車頂部安裝的雷射雷達有一個固有缺陷:正前方上方有一片它掃描不到的盲區。在這個盲區里,算法認為"沒有障礙物",於是本能地生成一條筆直穿過盲區的路徑。在直線隧道里這沒問題,但一旦進入彎道,這條"筆直捷徑"會把地面車直接開向彎道外側的隧道壁,引發碰撞風險。

第二個困境叫做"拓撲死鎖"。如果地面車因為地面不平而稍微側傾,滑上了隧道的弧形側壁,二維平面規划算法就會把周圍的弧形壁投影成"前方有牆",徹底封死機器人的前進方向。即使用IMU(慣性測量單元,類似手機里的陀螺儀)修正了車體傾斜資訊,二維規劃器也無法從這種拓撲死鎖中自救。

第三個困境研究團隊稱之為"異構視野悖論"。對於地面車和飛行器組成的協作團隊,規劃視野的長短是個兩難困境。如果規劃視野設得很短(比如5米),飛行器在寬闊的隧道上空會頻繁生成鋸齒形路徑,引發劇烈震盪;如果規劃視野延長到10米,在非凸形的彎道中,優化算法會陷入相互衝突的軟約束,生成突兀的折角路徑,這對笨重的地面車而言在動力學上根本無法執行。更根本的問題是,地面車和飛行器用不同長度的視野,會讓兩者的空間同步徹底崩潰。

FLISP正是為了一次性解決這所有問題而生的。

二、FLISP的核心哲學:用幾何直覺代替精確地圖

FLISP的思路可以用一個比喻來理解:一個經驗豐富的礦工不需要精確的洞穴地圖,只需要用手電筒照亮前方幾十米,通過觀察隧道壁面的弧度和走向,就能判斷路怎麼走,哪裡該轉彎,哪裡該注意頭頂高度。FLISP做的就是把這種"經驗判斷"用數學語言寫成代碼。

具體來說,FLISP採用"無圖規劃"策略:它完全不試圖建立一張全局地圖,而是每次從雷射雷達獲取的原始點雲(可以理解為雷射掃描出來的三維點陣,每個點對應環境中的一個位置)中,直接提取出足夠導航的幾何資訊,立刻生成路徑,然後丟掉這批數據,等下一幀數據到來時重新計算。整個過程像是一位導航員不斷用望遠鏡瞭望前方,根據實時看到的地形即時調整方向,而不是依賴一張可能過時的地圖。

這套方案在整個系統架構上是高度非對稱的:地面車扮演"大腦"角色,承擔所有的感知和計算任務;飛行器扮演"執行者"角色,只接收地面車算出來的飛行路徑並執行,本身不需要獨立處理複雜的感知數據。兩者之間的通信通過無線網路完成,地面車上的工業路由器為飛行器提供局域WiFi,同時通過另一台中繼路由器與隧道入口的地面控制站保持連接。

三、地面車的路徑規劃:三個遞進步驟

地面車的路徑規劃是整個系統的核心,分三個遞進的步驟完成,每一步都在上一步的基礎上把路徑磨得更精準、更安全。

第一步叫做"建立基礎廊道",目標是從原始的雷射點雲中快速提取出隧道的基本幾何結構。

由於在磁場複雜的隧道環境裡,六軸慣性測量單元(可以感知加速度和角速度,但無法感知絕對方向)無法直接給出準確的偏航角(即機器人朝向相對於隧道軸線的偏轉角度),系統需要先估算車體相對於隧道壁的偏向。具體做法是從點雲中提取隧道側壁的法向量(垂直於壁面的方向向量),通過計算這個法向量與車輛前進方向的夾角,得到偏航角偏差,再把這個角度融合進慣性測量單元的姿態數據,得到完整的車體位姿資訊。

有了車體姿態之後,系統按照一種"動態步長分箱"策略來生成初始路徑中心線。通俗地說,就是把雷射掃描到的點雲沿前進方向切成一段一段的"箱子",在每個箱子裡找出最左邊和最右邊的壁面點,取兩者中點作為路徑點。箱子的大小不是固定的:在直線段,步長較大,路徑點稀疏,計算快;在彎道處,步長自動縮小,路徑點更密,確保彎道的曲率被精確捕捉。

在彎道部分還有一個額外的挑戰:當地面車尚未完全轉入彎道時,雷射雷達會被彎道外壁遮擋,掃不到內側壁面,導致邊界點數據殘缺。系統通過分析路徑點斜率序列的方差來判斷當前是否處於彎道,一旦確認是彎道,就切換為多項式擬合模型,用已知的點位推斷被遮擋的壁面位置,從而"腦補"出完整的隧道邊界,保證路徑連續。這個推斷功能還有一個額外好處:隧道地面有時會積水,雷射照射到水面會產生鏡面反射,出現點雲空洞;多項式擬合可以自動跨越這些空洞,保持路徑完整。

第二步叫做"路徑魯棒化與精煉",專門對付傳感器噪聲產生的異常路徑點。

雷射雷達在實際工作中難免受到震動、反射異常等因素干擾,產生少量"離群點"——位置嚴重偏離正常軌跡的錯誤路徑點。如果直接用這些點導航,機器人會出現莫名其妙的突然偏轉。系統採用貝葉斯推斷方法來識別並修正這些離群點:對每一個路徑點,用前後相鄰點做線性插值預測其"應該在的位置",再計算實際位置與預測位置的偏差,通過貝葉斯概率公式判斷這個點是否異常。一旦判定為異常點,就用預測位置替換實際位置。這就像批改試卷時,如果某道題的答案與學生整體水平嚴重不符,就推斷可能是筆誤,用最合理的答案替代。

完成二維路徑的精煉後,系統還需要把路徑"貼"到真實的三維地面上。隧道地面並不是水平的,有時會有坡度和起伏,路徑需要沿著真實地面走,而不是懸在空中或鑽入地下。系統從點雲的高度資訊中擬合出地面的海拔輪廓,把二維路徑投影到這個三維曲面上,得到真正可以行駛的三維路徑。

第三步叫做"動態安全與避障",解決路上突然出現障礙物的問題。

系統採用一種"路徑中心檢測"策略:不是掃描整個空間尋找障礙物,而是只在規劃路徑周圍構建一個安全走廊(地面車用矩形走廊,飛行器用圓柱形走廊),只檢查走廊範圍內是否有威脅。檢測時用了一個兩階段過濾機制:第一階段是"粗篩",用快速整數索引把點雲按路徑方向分格,只把落在路徑格子裡的點送入第二階段;第二階段是"精檢",對篩出來的點做精確的幾何包含判斷。這種分層機制大幅降低了計算量,確保整個檢測過程在10毫秒的控制周期內穩定完成。

一旦檢測到障礙物,系統啟動改進版螢火蟲算法(一種受螢火蟲群體發光吸引行為啟發的優化算法)來尋找繞行路徑。由於隧道截面是圓形的,繞行本質上只需要在側向找一個合適的偏移量,所以優化問題被簡化為一維的橫向搜索。搜索時受到兩個約束:路徑必須在物理隧道邊界內,且偏移量不能讓車輛側傾角超過安全閾值(防止在圓弧形地面上翻車)。評分函數同時考慮與障礙物的距離(越遠越好)、偏離中心的程度(越近中心越好)和側傾風險(越接近壁面,傾斜懲罰越大,形成一道"軟牆")。螢火蟲算法中的隨機探索因子隨疊代次數指數衰減,確保初期廣泛搜索、後期穩定收斂到最優解。

經過這三步處理,系統還會對最終路徑進行姿態修正和平滑處理:用一個收縮因子衰減測量到的傾斜角,減少翻車風險;根據偏航角的大小自適應插入過渡路徑點,讓車輛在轉彎時有足夠多的中間步驟緩慢調整朝向,而不是突然大幅轉向——這對那輛轉向響應遲鈍、依靠可伸縮輪臂行走的重型地面車來說至關重要。

四、飛行器的路徑規劃:站在巨人肩膀上的輕盈飛翔

飛行器的路徑規劃建立在地面車路徑的基礎上,思路是:既然地面車已經把隧道的幾何結構摸清楚了,飛行器就不必再重新做一遍,直接從地面車的路徑"衍生"出自己的飛行路徑即可。

首先,系統從地面車路徑生成飛行器的"最低安全飛行路徑",這是飛行器在與地面車保持通信安全距離的前提下能飛的最低高度軌跡。然後,從隧道中心線投影出一條"期望飛行高度路徑",作為飛行器的目標高度參考。每一個路徑點都會檢查:如果該點在通信安全球(以最低安全路徑對應點為球心、以安全通信距離為半徑的球形區域)之內,就直接使用;否則就向安全球表面拉取,確保飛行器始終在通信覆蓋範圍內。

初始飛行路徑生成後,系統用一種"動態採樣疊代優化"方法打磨路徑質量。對每個路徑點,系統在其周圍用極坐標方式撒出一批候選點,用一個包含四項指標的綜合代價函數評分:安全代價(如果某候選點附近有障礙物,且與路徑段的距離小於安全半徑,就施加二次懲罰)、平滑代價(越偏離起終點連線的直線方向,懲罰越大)、前進獎勵(越靠近目標點,獎勵越高)和高度一致性代價(與起始點高度差越大,懲罰越大,以節省能量)。找到每個路徑點的最優候選點後,拼接成最終的優化飛行路徑。

五、軌跡執行:從路徑點到實際運動

FLISP生成的是路徑點序列,還需要轉換成機器人能直接執行的連續時間軌跡。研究團隊特別強調,正是因為FLISP生成的路徑本身已經具備良好的運動學質量,不需要像很多其他規劃器那樣在後端再做複雜昂貴的軌跡優化,只需用標準的輕量方法就能滿足需求。

地面車的軌跡用五次多項式插值生成,確保加速度和抖動連續,並通過動態時間重新分配確保不超過速度和加速度上限。飛行器的軌跡用非均勻B樣條表示,在急轉彎處通過一個曲率感知的時間縮放因子自動降速,保證安全。兩者的外環控制器都是標準的前饋比例微分(PD)控制器,根據當前狀態與期望狀態的偏差生成速度指令,分別發送給地面車的電機控制器和飛行器的MAVLink接口。

六、仿真驗證:在數字孿生隧道里的百次考驗

在實際部署之前,研究團隊在Gazebo仿真平台上構建了一個高保真的虛擬隧道環境,復現了直徑13米、有不同彎曲度和閘門的真實水電隧道幾何形態,在其中進行了大量測試。

仿真中測試了九種典型場景,每種場景獨立運行100次,統計平均指標。結果顯示,在無障礙的直線段,系統運行最快,僅需約3.5毫秒;在彎道和連續彎道場景,由於需要多項式擬合,時間略增至約5毫秒。引入障礙物(模擬維修人員)後,計算時間僅小幅增加到6至8.8毫秒,這點增量主要來自仿真平台自身的物理引擎開銷,而非算法本身變複雜。閘門穿越場景對飛行器的規劃時間要求稍高(約1.5毫秒),因為需要在垂直方向做額外的三維分割來規劃"俯衝-恢復"路徑。所有場景的計算時間均顯著低於10毫秒的安全控制周期閾值。

在路徑質量方面,飛行器路徑始終比地面車路徑更短、路徑點更少,體現了飛行器三維機動自由度的優勢——它可以在空中"抄近道",而地面車必須老老實實跟著地面走。

七、實地部署:在真實水電隧道里的1.2公里考驗

仿真成功之後,研究團隊把系統部署到了一座真實運營中的水電站泄洪隧道里,進行了覆蓋全隧道縱向範圍的實地測試。整條隧道全長1.2公里,從入口閘門開始經過一段彎道,進入長達約1公里的直線段,最終在另一座閘門處終止。地面車成功自主行駛了1公里,最後200米因為深厚淤泥堆積超過了底盤通行間隙而停止,這是物理機械限制,與算法無關。

實地測試揭示了一些仿真中沒有出現的問題。地面車在不平整地面上行進時產生的震動會傳遞給雷射雷達,導致遠端點雲不穩定,偶爾把隧道壁面的點錯誤分類為障礙物,觸發不必要的避障動作。震動還會讓每次規劃的最遠探測範圍稍短,導致實際規劃出的路徑略短於預設的50米視野(實際約47至48米),但由於系統高頻重規劃,這點截斷無關大局,有效前瞻距離始終保持在45米以上,完全足夠安全駕駛。

在多障礙場景測試中,為了安全起見,研究人員採用了手持雷射雷達模擬地面車行進的方式,這實際上給系統帶來了比真實車輛行進更劇烈的抖動——相當於一次意外的極端壓力測試。結果顯示,儘管劇烈抖動影響了路徑點數量和總長,偏航角估算模組因為對多個壁面法向量取平均,成功過濾了高頻干擾,始終保持了穩定的朝向參考,系統沒有因此失效。

八、與主流方案的正面比較:數字會說話

研究團隊對三種方案進行了系統性的標準化離線評測,使用相同的1.2公里隧道傳感器數據作為輸入,消除物理隨機誤差。為確保公平,兩種基於地圖的對比方案均在其能正常工作的有效定位區間內計算性能指標,而不把失效區間的超時數據算進去——也就是說,對比方案是在"最有利於自己"的條件下被評測的。

系統延遲方面的差距最為懸殊。FLISP的平均延遲為7.05毫秒,而基於Grid A*的方案平均需要49.93毫秒,基於Informed RRT*的方案平均竟然需要6492.61毫秒(約6.5秒)。為什麼差距如此巨大?研究團隊做了計算延遲分解分析:對於Grid A*方案,整個流程中實際做路徑搜索的時間只占很小一部分,超過80%的時間消耗在"柵格化"(把稀疏點雲轉換為密集體素網格)和"障礙膨脹"(把障礙物在地圖上"胖化"以確保安全間距)兩個地圖維護步驟上。而FLISP完全省去了這個中間表示層,直接在稀疏點雲上做幾何擬合,天然地繞過了這兩個最耗時的步驟。對於RRT*方案,問題更根本:隨機採樣算法在狹長的隧道空間裡需要極其漫長的時間才能找到滿足約束的路徑,統計顯示它平均只能以0.16赫茲的頻率完成一次規劃,也就是說在兩次規劃之間機器人要"盲飛"長達6秒,根本無法實現閉環控制。

路徑平滑度方面,FLISP生成的路徑累積角偏差僅為0.016弧度,接近完美直線;Grid A*為6.068弧度,Informed RRT*高達9.638弧度,充斥著"鋸齒"和"折角"。路徑迂迴度(路徑實際長度與理論直線距離之比)方面,FLISP為1.03,Grid A*為1.02,極為接近;Informed RRT*為1.42,繞了不少彎路。

資源占用方面,FLISP的CPU占用僅為1.37%,內存占用僅39.7兆字節,留下充足的計算餘量供數據採集和飛行控制使用;Grid A*需要1037.3兆字節內存(主要是全局柵格地圖和膨脹層的儲存開銷),Informed RRT*需要760.5兆字節。在資源緊張的機載計算平台上,這個差距的意義非常直接:FLISP的輕量級設計讓它可以與高清攝像和飛行控制程序和平共存,而地圖方案可能引發"資源爭奪",影響整個系統穩定性。

成功率方面,FLISP在全程1.2公里測試中保持100%成功率;Grid A*為99.6%,Informed RRT*為98.5%,偶發失敗均源於建圖退化導致的無效定位。

九、系統的邊界與未來:哪裡還有提升空間

FLISP並非毫無局限。研究團隊坦率地指出了幾個現階段的限制。

FLISP依賴地面車的短期輪式里程計(輪編碼器加慣性測量單元)做本地狀態估計。在深厚泥漿或積水中,輪子打滑會導致里程計暫時失效。好在系統的高頻重規劃架構會在下一幀雷射數據到來時隱式"復位",不會像全局地圖方案那樣發生災難性的全局飄移,但短暫的狀態估計失准仍然存在。

當前系統為線性隧道優化,遇到複雜的岔路口或網狀結構時,缺乏拓撲決策能力——不知道該走哪條岔路。研究團隊將這列為未來工作的首要方向,計劃引入拓撲決策層來處理更複雜的地下結構。

此外,當前的軌跡執行控制器屬於標準的比例微分控制,在面對極端動態干擾時,安全保障的理論嚴格性有限。研究團隊的另一項並行工作開發了基於控制障礙函數(CBF)的共識追蹤控制器,從理論上保證了安全性邊界;下一步計劃將FLISP與這個控制器結合部署在真實平台上,進行聯合驗證。

說到底,FLISP的核心價值不僅僅在於一組漂亮的性能數字,而在於它用一種出人意料的簡潔思路,解決了一個看似需要複雜全局建圖才能處理的問題。它證明了:對於幾何形態高度規律的線性基礎設施,與其費力維護一張總是可能出錯的全局地圖,不如直接相信傳感器當下看到的幾何現實,用幾十毫秒做一次乾淨利落的局部決策,循環往復,反而走得更穩更快。這種"活在當下"的規劃哲學,或許也適用於地鐵隧道、礦山巷道、海底管道等諸多類似場景,值得關注這一領域的人們進一步思考和探索。有興趣深入了解完整技術細節的讀者,可以通過arXiv:2606.25393查閱原論文,代碼和數據集也已在GitHub公開(倉庫名:ArchibaldGuo/FLISP)。

Q&A

Q1:FLISP系統是什麼?

A:FLISP是同濟大學研發的一套面向水電隧道檢查的無圖路徑規劃系統,全稱"快速雷射雷達-慣性同步路徑規劃器"。它讓地面無人車和無人機協同工作,只靠安裝在地面車上的雷射雷達和慣性傳感器,就能在沒有GPS、沒有預先建圖的條件下,同時為兩個機器人實時規劃安全路徑,平均規劃延遲約7毫秒。

Q2:FLISP比傳統建圖導航方案快在哪裡?

A:傳統建圖導航方案的計算時間主要消耗在把稀疏點雲轉換為密集柵格地圖、再對障礙物做膨脹處理這兩個步驟上,光這兩步就占了超過80%的計算時間。FLISP完全跳過了建圖這個中間層,直接對原始點雲做幾何擬合得到路徑,因此比基於Grid A*的方案快約7倍,比基於RRT*的方案快了三個數量級。

Q3:FLISP能用在其他隧道或地下空間嗎?

A:目前FLISP專門為截面規整、形態線性的隧道(如水電引水隧道)優化,在這類環境中表現突出。對於有複雜岔路口或網狀結構的地下空間,現階段系統缺乏拓撲決策能力,不知道該走哪條岔路。研究團隊已將拓撲決策模組列為未來工作重點,完成後有望擴展到礦山巷道、地鐵隧道等更多類似場景。

宅中地 - Facebook 分享 宅中地 - Twitter 分享 宅中地 - Whatsapp 分享 宅中地 - Line 分享
相關內容
Copyright ©2026 | 服務條款 | DMCA | 聯絡我們
宅中地 - 每日更新