近期,Snap 提交了一項名為「增強現實可穿戴設備語音輸入」的專利申請,旨在解決可穿戴設備在界面操作空間受限的普遍難題。
Snap 在文件中提到,傳統可穿戴設備往往受限於其微小的物理尺寸,難以容納複雜的用戶界面控制元素,利用語音作為主要的交互方式,用戶能夠以更人性化的方式操作這些設備。
與其他語音助手類似,Snap 的技術需要依靠特定的喚醒詞或命令(如「Hey,Spectacles」)來激活系統,但也在此基礎上進行了優化。
具體而言,該技術將語音輸入功能分為兩大模塊:一是關鍵字識別模塊,專門負責監聽並準確識別用戶的喚醒短語,提升了設備的響應速度,降低了不必要的能耗;二是智能語音處理模塊,該模塊在用戶發出具體命令後,會迅速捕捉並分析語音數據,對於複雜指令,系統還能智能地將音頻資訊轉發至外部伺服器進行深度處理,以確保指令的準確執行。
此外,Snap 還引入了「應用程序註冊表」機制,該機制能夠智能地將用戶的語音命令與各類應用程序進行無縫對接。無論是沉浸在音樂應用的旋律之中,通過簡單的語音指令如「播放」或「下一首」來控制播放列表,還是在 AR 遊戲中利用語音命令進行精準的操作,都能讓用戶的每一次語音指令都直接作用於相應的應用程序。