近日,美國專利商標局公示的一項蘋果專利引發了科技界與音頻愛好者的廣泛關注,該專利核心聚焦於空間音頻技術領域,帶來了一項極具創新性的自適應頭部追蹤技術,有望為空間音頻體驗帶來革命性升級。
在專利背景介紹部分,蘋果對空間音頻技術的原理和應用場景進行了深入剖析。空間音頻技術通過精心構建 3D 虛擬聽覺空間,讓用戶藉助配備慣性傳感器的輔助設備,在觀看電影、沉浸於影片遊戲,或是在平板電腦等源設備上與 AR、VR 內容互動時,能夠精準感知聲源在三維虛擬聽覺空間中的具體方位,帶來身臨其境的聽覺享受。
目前,部分空間音頻平台主要依靠攝像機與面部檢測器協同工作來實現頭部跟蹤。具體而言,頭部跟蹤器藉助攝像機捕捉用戶頭部的動態變化,面部檢測器則從攝像機獲取的圖像中提取面部參考幀,頭部跟蹤濾波器再依據這些參考幀對慣性傳感器測量過程中產生的漂移誤差進行校正。但在實際應用場景中,這種傳統方式面臨著諸多挑戰。通信錯誤引發的丟包現象、低光照環境等不利因素,都可能導致頭部跟蹤濾波器無法順利獲取面部參考幀,進而嚴重影響空間音頻的精準定位效果。
此次獲得授權的蘋果專利提出了空間音頻應用中用於頭部追蹤的自適應音頻定心技術。以其中一個具體的實施例為例,該技術的實現流程清晰且高效。
首先,系統會從與源設備通信連接、用於播放空間音頻內容的輔助設備處,獲取第一組運動數據;與此同時,從源設備配備的一個或多個運動傳感器採集第二組運動數據。接著,基於這兩組運動數據,系統會精準判斷源設備與輔助設備是否處於相對靜止狀態。一旦確定二者處於相互靜止期,系統便會迅速將空間音頻重新定心於三維虛擬聽覺空間之中,確保聲源定位的準確性。最後,系統完成三維虛擬聽覺空間的渲染工作,讓用戶能夠在輔助設備上享受到高質量的空間音頻播放體驗。
從蘋果公布的專利圖來看,圖 1A 詳細呈現了用於實現空間音頻應用程序的系統架構,展示了各個組件之間的連接關係和工作流程;圖 1B 則生動展示了居中狀態下的 3D 虛擬聽覺空間,讓用戶能夠直觀地理解聲源在虛擬空間中的分布情況;圖 1C 重點介紹了使用 bleed - to - zero(BTZ)技術進行瞄準線校正的原理與效果,這一技術能夠有效減少音頻失真,提升空間音頻的沉浸感。