宅中地 - 每日更新
宅中地 - 每日更新

贊助商廣告

X

斯坦福與Meta聯合研發AI全息眼鏡,突破VR顯示技術桎梏

2025年07月29日 首頁 » 熱門科技

最近,斯坦福大學與 Meta 合作,憑藉人工智慧優化的 3D 全息技術,成功研發出一款輕巧如普通眼鏡的 3D 頭戴設備,被研究人員視為邁向通過「視覺圖靈測試」的關鍵一步。

這款新型 VR 頭顯原型極為輕薄,從透鏡到螢幕,整個顯示器的厚度僅 3 毫米。斯坦福大學電氣工程學教授戈登·韋茨斯坦手持原型表示:「未來,大多數 VR 顯示器都將是全息的。全息技術具備其他類型顯示器無法企及的功能,而且其封裝尺寸遠小於當今市場上的任何產品。」

斯坦福與Meta聯合研發AI全息眼鏡突破VR顯示技術桎梏

MR 技術致力於無縫銜接物理與數字空間,為用戶帶來超越現實世界限制的獨特體驗。相關的沉浸式平台在培訓、通信、娛樂和教育等眾多領域展現出變革性的潛力。要實現用戶與虛擬環境之間無縫且舒適的交互,近眼顯示器必須具備可穿戴的外形設計,既時尚又能全天使用,同時還要提供與真實世界相媲美的真實感知體驗,且易於操作。

在眾多技術中,基于波導的全息顯示器被視為解決設計緊湊型近眼顯示器並生成感知真實圖像這一難題的最有前途的技術之一。它基於全息原理,能夠編碼出與現實難以區分的 3D 場景,還能將光學堆棧的功能高度壓縮到輕薄、輕量的全息光學設計中。全息顯示器為近眼顯示器帶來了獨特的能力,包括像素級深度控制、高亮度、低功耗以及光學像差校正能力。

然而,儘管基於輕薄光學波導的全息近眼顯示器在實現緊湊外形方面展現出巨大潛力,但目前仍面臨諸多限制。圖像質量、生成 3D 彩色圖像的能力以及光學擴展量等方面都受到嚴重製約。數字全息顯示器的一個根本問題在於當前空間光調製器提供的有限空間帶寬積或光學擴展量,小光學擴展量從根本上限制了視場角範圍和可能的視窗範圍。

要應對這一挑戰,需要從兩個方面入手。一方面,必須以極高的精度對光的傳播進行建模;另一方面,模型需要高效且能擴展到大光學擴展量設置。計算光學的最新進展顯示,人工智慧方法可用於學習相干波通過全息顯示器的精確傳播模型,從而顯著提高圖像質量。

斯坦福與Meta聯合研發AI全息眼鏡突破VR顯示技術桎梏

相關模型通常採用卷積神經網路,並通過實驗捕獲的相位-強度圖像對進行訓練,比純模擬模型能更準確地模擬特定顯示器的光電特性。但傳統的卷積神經網路模型存在不足,無法準確預測大光學擴展量波導中的複雜光傳播,原因在於錯誤地假設光源是完全相干,同時還存在模型效率以及在大光學擴展量設置下的可擴展性問題。

斯坦福大學和 Meta 團隊另闢蹊徑,基於部分相干理論,將波傳播學習問題重新表述為相干性重建。他們推導出一個基於物理的波傳播模型,參數化了波導內波傳播算子的互強度的低秩近似,並考慮了部分相干性,從而比現有的相干模型更準確地模擬全息顯示器。

此外,所提出的方法通過新興的連續隱式神經表示來參數化光通過波導的傳播,能夠高效地學習一個模型,並用於在大光學擴展量範圍內任意空間和頻率坐標的部分相干波前傳播。與現有方法相比,隱式模型實現了卓越的質量,需要的訓練數據和時間比現有的卷積神經網路模型架構少一個數量級,其連續性特性還能更好地泛化到未見過的空間頻率,同時提高了波前未觀測部分的準確性。

除了創新的模型,研究人員還設計並實現了一個全息顯示系統。該系統包含一個全息波導、一個全息透鏡和一個微機電系統反射鏡,光學架構通過轉向照明提供了大的有效光學擴展量,且具有超緊湊的外形。

最終,他們將新穎且緊湊的大光學擴展量波導架構與 AI 驅動的全息算法相結合,原型機在比現有技術大兩個數量級的 3D 眼動範圍內展示了高質量的 3D 圖像。這使得顯示器既擁有較大的視場,又具備較大的視窗,而且這種眼鏡可以連續佩戴幾個小時,不會造成脖子或眼睛疲勞。

當然,這僅僅是團隊科研征程中的階段性成果。韋茨斯坦介紹,他們的科研分為三部曲:第一部是介紹可以在小巧外形中實現高圖像質量的全息波導;第二部是建立這個工作原型;而第三部則是推出真正商業化產品,將工程的精細細節完美呈現。雖然韋茨斯坦承認真正實現商業化可能尚需數年時間,但他堅信這一天終會到來。

宅中地 - Facebook 分享 宅中地 - Twitter 分享 宅中地 - Whatsapp 分享 宅中地 - Line 分享
相關內容
Copyright ©2025 | 服務條款 | DMCA | 聯絡我們
宅中地 - 每日更新