在今天舉行的Google I/O大會上,儘管AI是全場最大的關注點,也還是有一系列AR相關技術和應用更新,比如:ARCore進行更新、推出新的Geospatial Creator等等。
ARCore面世已有5年時間,谷歌每年都在持續推動AR技術的發展。相比於早期簡單的AR圖像疊加效果、AR面部濾鏡,現在谷歌開始探索更大規模的LBS AR應用場景,比如去年融合谷歌地球和街景數據的Geospatial API。同時,支持ARCore的安卓設備已達到14億台。
硬體方面,自谷歌收購North Focals以來,外界一直在期待該公司推出新款AR眼鏡,但顯然沒有那麼快。今年2月,谷歌將AR業務拆分為軟硬體兩大部分,還宣布為三星XR設備開發基於安卓的作業系統,由此來看軟體依然是谷歌AR業務的重頭戲。
重點摘要:
- ARCore新功能:平面檢測優化、EIS防抖、支持Vulkan
- Geospatial API新工具:街景幾何圖形、屋頂錨點、空間深度、場景語義
- 可視化AR創作工具Geospatial Creator
- 與三星合作XR設備
- 谷歌地圖Immersive View更新
- Project Starline更新
- 與新加坡旅遊局、Taito、Gensler、Quintar等合作
ARCore底層技術提升
ARCore作為谷歌AR的地基,每年都在優化和更新,本次發布的更新包括:
- 更準確的平面識別效果;
- 電子圖像穩定技術(EIS);
- 支持Vulkan。

谷歌指出,ARCore識別物理平面的錯誤率下降了52%,這意味著AR可以和物理空間更好的融合,正確的固定在地面、桌面等表面上,避免穿模。
而EIS的主要作用是減少相機抖動,不僅可以帶來更好的影片拍攝效果,也可以優化LBS AR的穩定性。其工作原理是先檢測相機中的細微移動,然後再移動圖像來進行補償。
此前,ARCore應用已經支持OpenGL圖形接口,而接下來也將支持Vulkan,帶來更好的跨平台能力。
地理空間API新功能
在I/O 2023期間,谷歌為ARCore Geospatial API推出了更多AR工具,旨在優化LBS AR開發的沉浸感和逼真感。這些新工具包括:街景幾何圖形API、屋頂錨點API、地理空間深度API和場景語義API。
1)街景幾何圖形API
可對真實場景的地形、建築物等結構進行建模,讓AR內容與物理環境可以準確遮擋和交互,或是為建築物重新蒙皮。
據悉,該API兼容安卓和iOS系統。
2)屋頂錨點API
該工具允許開發者將AR內容固定在建築物頂層,尊重建築物的實際高度。此前,谷歌曾推出地理空間錨點,允許開發者將AR精準定位在特定的坐標,而屋頂錨點API,則允許開發者設定精準的高度。
該工具同樣同時兼容安卓和iOS系統。
3)地理空間深度API
在2019年時,谷歌為ARCore推出簡易場景深度識別工具Depth API,特點是基於動態深度算法,只用一顆RGB攝影機就能生成3D深度地圖,適用於廣泛的手機配置。而空間深度API是在此基礎上的擴展,當啟用街景幾何圖形時,空間深度API將自動擴大Depth API的適用範圍和掃描速度。
比如,當AR街景幾何圖形所處位置在VPS覆蓋範圍,那麼Depth API就會將本地捕捉到的3D深度地圖與檢索到的街景幾何數據結合,宣稱最遠可識別65米深度。
據悉,地理空間深度API可在所有支持Depth API上的設備上使用,不需要ToF等深度傳感器。不過,該工具目前僅支持安卓設備。
4)場景語義API
可在AR應用中提供基於機器學習模型的實時語義資訊,允許AR內容理解周圍的環境,對天空、建築物、樹、道路、人行道、車輛、人等不同的元素進行標記,併疊加不同類型的互動。值得注意的是,該工具僅支持安卓系統。
為了展示上述新工具,谷歌發布了一款開源的AR demo應用:Mega Golf,特點是利用街景幾何API將城市轉變成迷你高爾夫球場,允許你在城市打巨型高爾夫球,球在碰到建築物後會反彈,甚至還能躲開3D虛擬障礙物。
Geospatial Creator
Geospatial Creator是一種無代碼、可視化的AR開發工具,它的優勢是更容易使用,直接在3D場景圖塊上直觀創作,並支持Geospatial API的多項強大的AR功能,如:地理空間錨點、地形錨點、屋頂錨點等等。
相比於ARCore面向專業開發者來看,Geospatial Creator則是面向創意工作者、普通用戶、企業或品牌,讓更多人能進行AR內容創作。谷歌宣稱,任何人使用它只需要幾分鐘就能設計、發布LBS AR內容。
目前,該工具已經集成到Adobe Aero和Unity兩款應用中,當然這裡也有個矛盾,前者算是to B兼to C類App,後者就是to B類應用,因此這兩者還是不夠貼近普通用戶和消費者,仍具有一定的創作門檻。
實際創作起來也很簡單,你可以通過搜索地點、地址或坐標(覆蓋49個國家),就能調出特定位置的高解析度3D圖塊,並在此基礎上開發LBS AR內容,比如給一家咖啡店創作AR導航或店招等等。
與三星合作XR設備
在去年I/O上,谷歌曾公布一段AR眼鏡demo,而今年則似乎未有AR硬體亮相,而是再次確認為三星的XR設備開發作業系統,並計劃在今年內公布更多資訊。
Immersive View for Routes
這是一種結合AI的沉浸式視圖導航預覽功能,也是在此前推出的Immersive View上的一個擴展,特點是允許你以3D街景的形式查看規劃好的路線。據悉,該功能將於夏天開始向15個城市推送(包括倫敦、紐約、東京、舊金山)。
據了解,該功能的原理是利用AI和電腦視覺,將數十億張街景和航拍圖融合,生成沉浸的3D地圖路線,允許你直觀查看自行車道、人行道、十字路口、停車場等資訊。你還可以查看這些路線在一天中不同時間段的視覺變化(路況、景色等等),以及空氣氛量資訊、天氣。
除此之外,谷歌還將推出Map Tile API和Aerial View API(預覽版),其中Aerial View API允許開發者調用谷歌地圖的鳥瞰街景模型,用於開發應用或電影拍攝。而Map Tile又稱3D圖塊,指的是基於谷歌地球數據的高解析度3D場景圖,特點是基於Google Maps平台和ARCore,數據來自谷歌街景和谷歌地圖,紋理基於高解析度RGB光學圖像,它可以看作是組成地球數字模型的組成部分(每一個圖塊對應特定的坐標)。此外,Map Tile基於Cesium地理空間聯盟的3D Tiles開放標準,可兼容CesiumJs等渲染器和可視化庫。
據了解,Map Tile覆蓋了49個國家的2500多個城市,可將城市街區的交通、環境環境等細節可視化(數字孿生),還能通過API引入到各種3D、AR應用中。
在3D圖塊上,你可以疊加3D內容,還可以創作AR應用。比如在Geospatial Creator中,你可以引入3D圖塊,並在此基礎上進行開發。
此外,Map Tile還可以用於可視化旅遊、城市規劃、建築可視化、3D敘事、3D遊戲和場景開發等場景。
體積更小的裸眼3D影片系統
在Google I/O 2021大會上,谷歌首次公布基於光場顯示和3D實時影片的通訊系統:Project Starline,特點是支持裸眼3D效果,讓影片通話看起來更身臨其境,缺點是硬體笨重,占據空間大,不便攜。而在今天舉辦的Google I/O 2023上,谷歌公布了體積更小的Starline原型,特點是使用了AI來簡化硬體設計,更適合辦公等日常應用。
據了解,早期的Starline原型依賴複雜的多相機、IR傳感器陣列來捕捉/生成3D圖像。相比之下,AI技術可合成3D影片數據,並投射到光場顯示器中,因此只需要幾個標準攝影機就能實現高質量3D通話。從外形來看,上一代Starline體積與梳妝檯差不多,顯示部分看著就像是一面大鏡子,而新款Starline則更像是常見的顯示屏大小,可放在桌面上。
相比於2D影片通話,利用Starline通話更接近線下面對面交流,通話者以逼真尺寸、外貌參與對話,並使用手勢、眼神來交流。簡單來講,它仿佛是一扇窗口,可以將不同地點的人聚在一起。
合作案例
去年,谷歌曾與Nexus Studios合作,基於Geospatial API為虛擬樂隊Gorillaz舉辦LBS AR演唱會。該演唱會只能在紐約、倫敦等特定地點觀看,特點是將樂隊成員放大成巨人大小,並以交互式AR形式顯示,AR可與周圍的建築互動,比如允許樂隊成員坐在高樓上等等,視覺效果足夠震撼。
在今天的I/O大會上,谷歌又公布了與Gap、美泰、Global Street Art、新加坡旅遊局、Gensler(金斯勒)、Taito等合作夥伴,一起打造的AR應用和案例。
比如,Gap和美泰(Mattel)利用Adobe Aero和Geospatial Creator工具,打造了一個芭比聯名服裝AR快閃廣告,在紐約廣場上直接部署虛擬的廣告大牌。
AR體育方案商Quintar也與谷歌就AR展開合作,將ARCore Geospatial API、StreetView與Quintar的Q.reality平台結合,打造交互式AR解決方案,並在PGA巡迴賽的官方App中引入AR導航功能:Quintar Places,允許觀眾用攝影機對準現實場景查看視覺方向指示,並對比自己和目的地相差的距離,宣稱精準度足夠好(誤差在幾厘米以內)。
而在墨西哥城、倫敦和洛杉磯也有一些基於谷歌Geospatial API製作的LBS AR街頭藝術應用。比如谷歌藝術與文化和Global Street Art合作,邀請三位知名藝術家用LBS AR來創作壁畫,讓傳統的壁畫形式變得更加生動。
此外,谷歌還與新加坡旅遊局合作,在VisitSingapore官方app中引入AR導覽功能(預計夏天上線),不同於基礎的AR指示,該功能採用可愛的吉祥物來介紹景點、文化和歷史,並為遊客提供交互式AR交響樂表演。
Gensler是國際著名的建築諮詢公司,該公司使用Geospatial Creator創建了一個公益的AR可視化項目,旨在幫助決策者設想新城市項目對於無家可歸者的影響。
谷歌還與Taito合作推出LBS AR遊戲《太空侵略者:World Defense》,該作基於Geospatial API、Streetscape Geometry API開發,可在真實建築上固定傳送門,釋放太空侵略者,這些侵略者可能出現在天空中等任意地點,動作還能適應周圍的環境(比如躲在建築後面)。
總之,Geospatial API可為各種不同的場景開發AR導航系統,比如主題公園、音樂會、市集、體育賽事、戶外藝術館、購物中心等等。
谷歌還承諾,將Google Map和Google Earth平台的3D數據開放給開發者,用於開發LBS AR,探索AR的潛在應用場景。更重要的是,這些LBS AR應用在未來可以在同一個基於地圖的界面中相互關聯,比如在谷歌地圖中幫助用戶發掘周圍可體驗的LBS AR應用。
在谷歌地圖基礎上,谷歌正在為無處不在的AR生態提供支持,其打造的不是特定的應用,而是包括大量內容的AR平台。谷歌AR工具的優勢是支持跨平台,其中部分功能還支持iOS系統,兼容性好。與此同時,結合谷歌地球和街景數據的Geospatial API更被看作是谷歌AR的殺手鐧,在未來戶外LBS AR大背景下的一大剛需。在AR方向上谷歌看似「不緊不慢」,實則在整合全公司的技術能力來告訴大家:Geospatial或許就是AR的殺手級場景之一。參考:Google