想像一下,你只是默默地用嘴型說出某些內容,你的AI助手就能知道你想表達什麼。這可能通過你的眼鏡、耳機或手機攝影機實現。蘋果剛剛收購了一家名為Q.ai的公司,該公司正致力於實現這一目標。這聽起來既怪異又充滿科幻色彩,但對於我這樣長期關注智能眼鏡和可穿戴設備的人來說,這一切又顯得非常熟悉。
蘋果對這家以色列初創公司的投資規模相當可觀。據英國《金融時報》以及路透社等新聞機構的原始報道,此次收購耗資約20億美元。這是自十年前蘋果高調收購Beats以來規模最大的一次收購行動。但與Beats不同的是,幾乎沒有人知道Q.ai。至少目前還不為人所知。儘管如此,這項技術在新型交互界面方面的潛力非常強大。這是未來個人技術交互界面這個不斷擴展的拼圖中又一塊關鍵拼圖。
Q.ai並不是我曾經接觸或演示過的公司,但其創始人之一阿維亞德·邁澤爾斯也創立了PrimeSense——這項基於紅外線的技術曾為微軟Xbox的Kinect攝影機提供房間掃描3D功能。PrimeSense於2013年被蘋果收購。該技術後來成為Face ID的TrueDepth攝影機陣列,目前也應用於蘋果Vision Pro的近距離手部追蹤。
從相關專利報道來看,Q.ai能夠通過光學傳感器追蹤細微的面部動作和情緒表達,可以實現向AI界面的靜默命令輸入,或識別其他微妙的面部線索。以色列網站GeekTime進一步詳細介紹說,該技術將測量肌肉和嘴唇運動,可能需要靠近口部。
CNET已向蘋果和Q.ai尋求置評,但雙方均未立即回應。
可穿戴設備和眼鏡新交互系統的一部分?
我剛剛撰文指出,蘋果已經顯示出向互聯AI可穿戴設備生態系統發展的跡象:徽章、眼鏡、耳機、手錶或這些設備的某種組合。任何這些可穿戴設備都可能使用Q.ai正在開發的技術。不過看起來耳機和眼鏡是兩個最有可能的應用領域,而根據下一代AirPods將配備紅外攝影機的報道,這些部件看起來更加準備就緒。
即使是像Vision Pro這樣的混合現實頭顯也可以利用Q.ai的技術。Vision Pro已經可以通過其眼球追蹤攝影機、向下的攝影機和紅外傳感器識別面部表情。但與Vision Pro的交互對我來說仍然有點笨拙。我用眼睛注視,用手捏取物體,但必須說"嘿Siri"才能進行音頻請求。我更希望我的交互感覺更自然、更微妙。也許這次新收購能有所幫助。
正如著名增強現實藝術家和研究員海倫·帕帕吉安尼斯在她最近的時事通訊中指出的:"蘋果傳聞中的AI徽章作為獨立產品意義不大,但作為蘋果生態系統中的一個節點則更有意義,它可以利用跨設備的共享感知、智能和上下文,與AirPods協同工作,最終還會與眼鏡配合。"
現有的智能眼鏡(如Meta的產品)以及即將推出的谷歌智能眼鏡主要依靠語音進行交互。能夠靜默完成這一操作將是一個巨大的優勢,但除了語音之外,其他方面也在出現。Meta擁有腕戴式神經帶,最終目標是為眼鏡添加眼球追蹤功能。谷歌的眼鏡也將與基於手錶的手勢配合使用。
我對隱私問題也非常擔憂。任何能夠唇讀和識別微妙表情的技術都可能被用來遠距離追蹤和監聽你的意圖。這項技術將如何私密可靠地使用?或者,能夠悄悄用嘴型發出請求是否比我現在使用的語音命令更私密?
唇讀之外的更多可能?
我仍然希望有完全不需要說話的交互界面。Meta基於肌電圖的神經帶技術指向了腕部手勢與眼鏡和耳機配合工作的更複雜方式。另一家以色列公司Wearable Devices擁有自己的神經帶,名為Mudra,旨在擴展其從運動神經元電脈衝中獲得的微妙輸入能力。
腦電圖(測量腦信號)是另一個方向。雖然一些公司正在探索腦電圖用於腦機接口
,但它目前仍主要是專注於健康和醫療應用的傳感器系統。
將Q.ai的技術算作可能讓我們使用的可穿戴電腦與我們感覺更緊密連接的交互界面之一。這既怪異又令人毛骨悚然,但我認為這也是大多數眼鏡、可穿戴設備和VR/AR公司已經在前進的方向。這並非異類。蘋果的這一舉措是這一趨勢的又一部分。
Q&A
Q1:蘋果收購的Q.ai公司是做什麼的?
A:Q.ai是一家以色列初創公司,專注於開發唇讀和面部微表情識別技術。該技術能夠通過光學傳感器追蹤細微的面部動作和情緒表達,可以實現向AI界面的靜默命令輸入,讓用戶只需用嘴型默念就能與AI助手交互,無需發出聲音。
Q2:蘋果收購Q.ai花了多少錢?這在蘋果收購史上處於什麼水平?
A:根據英國《金融時報》和路透社的報道,蘋果此次收購Q.ai耗資約20億美元。這是自十年前蘋果高調收購Beats以來規模最大的一次收購行動,顯示出蘋果對這項唇讀技術的高度重視。
Q3:唇讀技術會應用在蘋果哪些產品上?
A:這項技術最有可能應用在AirPods耳機和未來的蘋果智能眼鏡上。此外,Vision Pro混合現實頭顯也可能利用這項技術來改善交互體驗。報道顯示下一代AirPods將配備紅外攝影機,這為應用唇讀技術提供了硬體基礎。






