近日, GSXR重要成員NOLO在其自媒體賬號發布了其關於手勢識別技術的演示片段。從影片內容可以看出,工作人員佩戴NOLO即將發售的設備NOLO SONIC 2,裸手流暢的進行點、按、捏、拖拽、滑動等動作。NOLO官方表示該項技術不僅搭載於NOLO SONIC 2設備,還將對外開發合作。憑藉更加自然和直觀的操作方式,NOLO的手勢識別技術將作為GSXR標準下交互輸入的技術方案的新範式補充。
2021年3月,由中國移動牽頭,聯合產業夥伴發起的中國XR通用標準(GSXR)正式對外發布,並在CCSA擴展現實產業及標準推進委員會引領下在產業中快速推廣,該標準旨在構建起中國的XR跨平台互通體系,使得行業參與者基於該標準開展硬體、平台、內容開發,即可確保所開發的軟體應用均可運行在針對該標準做過適配的硬體上。此標準的正式施行極大的降低了XR軟硬體適配難度,加速推動了行業發展。
GSXR標準的正式實施,不僅為XR行業提供了通用接口規範,降低了開發者接入成本;同時將軟體功能集成SDK的形式,服務於XR行業。
騰訊搜狗輸入法正是通過此種路徑成為GSXR標準內首個『中文輸入』解決方案,也是標準內重要的人機交互解決方案之一。騰訊搜狗輸入法為XR系統提供專屬、智能和高效的語音輸入和鍵盤輸入模式,還能能根據系統輸入框類型匹配多形態鍵盤。其中行業首創的語音輸入,讓用戶解放雙手,動動嘴就能打字;搜狗通過軟硬體結合的方式進行創新,優化手柄輸入體驗,提升輸入效率;結合手勢算法能力,還可進行裸手輸入,讓用戶體驗到更沉浸,更智能的輸入方式。當下搜狗VR輸入法已服務於中國XR行業的硬體產品,並在中國移動 x NOLO聯合品牌VR終端中作為首個基線產品實現應用落地。
NOLO發布的手勢追蹤技術同樣基於GSXR標準協議研發,開發者可以通過GSXR的通用API接口,使用XR特性模塊中的手勢識別、骨骼節點、捏合姿態、手部追蹤等功能用於XR應用開發。同時,為了方便開發者快速上手開發XR應用,GSXR提供了Unreal SDK、Unity SDK詳細的說明文檔以及論壇討論功能。對接完畢後,用戶可在XR設備內實現裸手進行點、按、選擇、拖拽等更加自然和沉浸的操作。
提及該項技術的研發過程,NOLO相關技術負責人表示:「NOLO技術團隊憑藉人工智慧的深度學習技術,藉助真實手部圖像和3D生成手部圖像進行數據融合訓練。用數百萬張手部圖像訓練了一個專門的深度神經網路,其中手腕和手指擁有3D空間位姿;由此生成的手勢數據通過GSXR協議傳輸到3D圖形引擎渲染,再顯示到VR眼鏡中,最終達成了現實世界和VR世界的手勢同步。同時為了保證識別的實時性,NOLO深度優化網路結構,保障在驍龍XR2晶片上單幀識別速度達到5ms以下;深度學習算法通過動態提取多幀數據中的手勢資訊,提高動作連貫性,以此達到流暢絲滑的識別效果。」
對於該項技術是否對外開放,NOLO相關負責人表示:「該項手勢追蹤技術除了用於NOLO SONIC 2,以不斷豐富用戶的體驗感受。作為GSXR工作組的一員,我們持開放的態度,將此技術合作開放給CCSA擴展現實產業及標準推進委員會的成員,助力中國XR產業的快速發展。」
GSXR標準已執行2年,CCSA擴展現實產業及標準推進委員會將進一步推動擴展現實標準實施與落地,研發適合產業發展的測試解決方案,開展產品的測試認證,探索新應用模式,服務應用開發者,建設健康可持續的產業生態。接下來,中國移動(終端公司及咪咕文化)將依託GSXR統一標準,匯聚全領域內容,提供「標準-內容(應用)-平台」的一站式服務,打造「一個平台、N個內容資源、N個應用服務」的「1 N N」服務體系,對外開放XR通用能力,提供端到端的解決方案。從標準、內容、終端等多方面,構建全領域XR矩陣,將XR技術賦能應用在教育、醫療、工業、體育、演藝等多個領域與場景。並以開放的態度,與產業夥伴一道共同建設健康的XR大生態,助力中國XR產業快速發展。