
編者按:
當 AI 開始尋找自己的形狀,有些選擇出人意料。
AI 在智慧型手機上生出了一顆獨立按鍵,似乎讓智慧型手機找回了久違的進化動力。眼鏡憑藉著視覺和聽覺的天然入口,隱隱有了下一代個人終端的影子。一些小而專注的設備,在某些瞬間似乎比 All in one 的設備更為可靠。與此同時,那些寄望一次性替代手機的激進嘗試,卻遭遇了現實的冷遇。
技術的落地,從來不只是功能的堆疊,更關乎人的習慣、場景的契合,以及對「好用」的重新定義。
推出「AI 器物志」欄目,想和你一起觀察:AI 如何改變硬體設計,如何重塑人機交互,以及更重要的——AI 將以怎樣的形態進入我們的日常生活?
臨近年底,此前名不見經傳的創業公司光帆科技,發布了一款看起來有些「反直覺」的產品:Lightwear AI 全感智能套裝(以下簡稱 Lightwear)
籠統地講,這玩意是智能耳機+手錶的套裝。但具體細節更加有趣:
首先,每隻耳機上,各裝了一枚有 200 萬像素的攝影機,單耳重量 11g,因為要確保視覺功能的續航夠用;智能手錶是顯示終端,也是額外的交互輸入工具;但這個套裝的智能中樞不一定是手機,而是內置了 eSIM 能力和 GPS 晶片的耳機盒,智能手錶都可以直接與之相連接——
這意味著,Lightwear 能夠徹底脫離手機,獨立存在、工作。

這種獨特的設計理念實踐,在行業前所未有。裸露的攝影機掛在耳機上,放在耳邊,比帶攝影機的智能眼鏡還要挑戰普遍審美,更是撞上了隱私的敏感神經。
但如果我們將視野放到整個科技和消費電子行業在未來 5-10 年即將去往的方向,你會發現 OpenAI、Meta、阿里夸克、 理想、蘋果,在類似的產品定義上是有共識的——而光帆科技搶在這些巨頭和大公司之前,把這個共識給首先產品化了。
即是:AI 需要真的理解世界,光靠麥克風已經不夠了。
而這個共識的另一面是:模型的多模態能力,正在倒逼產品設計去滿足模型的需求。
也即,無論是光帆這種帶攝影機的耳機,還是接受度相對更高但仍然爭議不斷的智能眼鏡——這些產品形態都是模型能力倒逼出來的結果,與審美無關。

一家脫胎於小米的 AI 硬體公司
光帆科技成立於 2024 年 10 月,創始人董紅光是小米集團初創團隊成員、89 號員工。在小米任職的 14 年間,他先後以核心身份參與 MIUI、快應用、自研手機、汽車 OS 等高級別項目的研發工作。
按照該公司的官方介紹,創始團隊屬於典型的「高P團隊」,除了小米之外還匯集來自華為、字節、阿里、騰訊等企業的資深專家,具有深厚的軟硬體、AI 開發能力。
更值得注意的是資本累積的速度。光帆科技在三個月內迅速完成兩輪累計 1.3 億元融資,投後估值超 5 億元。投資方包括柏睿資本(寧德時代副董事長李平創辦)、韶音、同歌創投(歌爾升學旗下)、清輝投資、鼎暉投資、阿爾法公社、英諾天使等知名基金與機構。
這其中的產業資本頗為矚目,多為音頻和高新製造巨頭:韶音在骨傳導及開放式耳機市場占據 50% 以上份額,歌爾則是可穿戴設備的 ODM 龍頭,清輝投資背後是兆易創新這一存儲頭部企業,寧德時代更無需多提。
這些產業資本的加入,既為這家公司和這個尚未成熟的形態提供試錯空間,更是彰顯了產業巨頭們提前布局的動作。
攝影機的存在,是讓 AI 能看見你看見的
過去 20 年的時間裡,人機交互的主線其實清晰無比:打字、觸屏、拍照、上傳,然後等待設備反饋。雖然設備本身所內置的軟體與服務在今天能做的非常多,能力很強,但交互的邏輯是沒有變的:你控制設備,設備給你反饋。
而最近 3-5 年裡基於大語言模型的 AI 新浪潮,徹底改變了這個邏輯。由於模型具備處理多模態資訊的能力,能夠理解圖像、聲音、文字之間的關係,且具備了更加接近「人類直覺」的能力。因此,由大模型驅動的 AI 產品,能夠更加積極主動地對用戶以及用戶所處的數字世界——甚至真實世界——發起交互。
從矽谷的 OpenAI、蘋果、Meta,到國內的各家大廠,搭載攝影機的 AI 設備已經成為一個共識方向。這背後的原因並不複雜:語音能捕捉到的是「你所描述的世界」,而加上攝影機,AI 才能真正理解「你身處何處」「面前何物」「世界正在發生什麼」

問題來了:難道每次 AI 需要理解的時候,我都要掏出手機來嗎?攝影機沒有更好的安身之處嗎?
只剩下兩個現實選擇:帶
在頭上,或者貼在身體上。
在 2025 的年底,這兩者我們早已見過了無數嘗試者、失敗者、領先者與落後者。
在貼身設備上,Humane AI Pin 和 Rabbit R1 一度被矽谷奉為「the next iPhone」,然而卻因為到得太早,且效果太糟而早早收場,但在這個領域仍然不斷有人推陳出新,比如近期出口轉內銷的 Looki。
人們又想起了十多年前曾經流行的 Google Glass 和 VR 頭顯,將兩者合在一起,造出了新一代的智能眼鏡。目前,這個品類被矽谷奉為圭臬,且由於能夠和日常佩戴的眼鏡有機結合,接受度相對更高。但仍然有人覺得,智能眼鏡並不理想,不會成為手機的真正替代品。
緊接著,耳機來了。在手機、穿戴設備、智能眼鏡中間,耳機卡在了一個微妙的位置:它已經被社會默許可以長期佩戴,同時又天然接近「視」與「聽」這兩個核心感官的位置。這讓它成為了 AI 感知計算能力的合理載體,下一個 AI 硬體的試錯空間。
耳機離眼睛和耳朵更近,且消費者心智教育完成,佩戴接受度廣泛。更重要的是,相比眼鏡的顯眼和沉重(最少也要 40 多克),Lightwear 耳機不僅輕(Lightwear 單耳 11g), 雖然加了攝影機讓它看起來有些「異物感」,但至少在社交場合的存在感比眼鏡更低。

從用戶優先,到模型優先的產品邏輯
單純依靠語音識別的 AI 耳機,市場相對飽和,已經明顯進入瓶頸階段了。根據的觀察,當前市場上大部分所謂的 AI 耳機,定價都在千元左右或以下,主要圍繞 AI 翻譯場景展開,功能趨於同質化。
而光帆想的、在 Lightwear 上做的,跟那些普通耳機都非常不一樣。普通耳機像是被鎖死在「聽覺」的範疇內,但光帆多想了一步,它想的是一個更深層的問題:AI 需要更多的上下文,我用耳機能不能獲得?
這個問題的答案,其實藏在 AI 時代交互方式的根本轉變中。
從電腦到手機,目前為止都是 GUI(圖形用戶界面)的時代,螢幕、按鈕、圖標缺一不可,因為我們精準控制每一個操作對象。
但生成式 AI 改變了這個邏輯:交互可以完全依靠自然語言,你給系統的是模糊描述的指令,系統反饋的是並不精確但可用的結果,高頻溝通和反饋變得更重要,精準度反而沒那麼關鍵——也就是 NUI(自然用戶界面)。說和聽,反而成了更自然的方式。圖形界面變得非必要了。
這樣的新交互範式,落在耳機上是很合理的:耳機可以做到 10g 甚至更低,佩戴無負擔,續航長,可以全天候在線。相當於人體有了一個智能外掛,一直在線,隨時待命。
但這個智能外掛還缺一樣東西:和人類一樣,接收足夠多的資訊。而在所有感知維度中,視覺是資訊最豐富、最重要的一種。
於是結論很清晰——要給耳機加上一個攝影機。
在發布會現場,光帆展示了 Lightwear 感知能力結合的實際應用。這些場景覆蓋了日常生活與工作中的高頻需求:
O2O 場景:用戶喚醒設備,問「幫我看下這家怎麼樣」,耳機通過攝影機識別面前的餐館店面招牌,結合 GPS 定位確認位置,結合 AI 產品積累的記憶,進行個性化口味比對、附近更優餐廳推薦,進行主動取號、智能提醒到號等。
差旅:收到出差簡訊/郵件,Lightwear 可以主動為你安排日程,發現日程衝突並解決衝突、智能回復簡訊/郵件,搜索並下單機酒,完成最後一公里叫車環節
購物:用戶看到感興趣的商品,只需提問,耳機即可直接視覺識別,在線比價,加購甚至直接下單。
日常提醒:根據日程安排,主動喚醒並提醒用戶(比如重要紀念日)
整個過程中,用戶不需要打開手機,不需要進入 App 操作,甚至不需要明確說出自己想要的是什麼—— AI 將視覺、地理資訊結合,自己就補全了需要的上下文。

這類設備天生適合以下幾種場景:你說不清楚的東西(「就這個」「不是,是旁邊內個」);不值得專門掏出手機拍一張,或者掏出手機很打斷「心流」的場景(走路、逛展、炒菜等等)等等。
200萬像素夠用嗎?夠了,因為照片是給模型看的
如果以傳統消電產品的眼光去審視 Lightwear,槽點確實很多:攝影機外露,隱私壓力大;比一般耳機重,全天候佩戴未必屬實;社交壓力;很容易聯想到 Google Glass、AI Pin 等失敗案例,等等……
然而這純粹是 missing the point. 給耳機加上攝影機,其實服務的是 AI 的理解效率。攝影機,根本不是給人用的。這個設計的出發點是服務模型的。模型需要更連續、更及時的視覺流,更真實的 FPV。
這裡有個關鍵設計值得注意:Lightwear 的攝影機採用了「閱後即焚」的影像處理機制。
在 Lightwear 系統設計中,你無法以「拍照」為目的去命令耳機拍照片。這是因為攝像完全服務 AI,用於即時性的視覺上下文理解。照片文件不會在本地或雲端保存,可以理解為「用後即焚」。這個設計背後有幾層考慮:
顯然,這個設計的首要考慮是保護隱私。不保存影像文件,就能從根本上杜絕隱私泄露,用戶無需擔心自己的生活細節被拍下,甚至在意外情況中被「偷拍」保存。
以及,不保存照片也能夠顯著優化成本:既然是給美胸看的,畫質就完全不需要達到人眼標準。200 萬像素對於物體識別、場景理解早已足夠,而且像素越低,處理速度越快、功耗越低,存儲和流量成本越小。目前設備做到 9 – 15 小時續航,足以實現全天候伴隨。
當然,關於這個產品「模型優先、用戶靠後」的論斷,只是我的主觀認為。其他人包括光帆可能和我都有不一樣的看法。在發布會上董紅光強調,AI 硬體應該「讓技術退後一步,讓人站在中心」,但實際產品所呈現出來的,至少在我的邏輯里,恰恰是技術先行。
但這年頭,又有哪個 AI 硬體能免除這樣的矛盾感呢?
在這裡我們可以大膽地拋出一個論斷:當下和未來一段時間內所有的 AI 硬體,都應該是以模型優先,以滿足模型需求為第一出發點的產品定義。
因為我們遠未探到 AI 模型與電子硬體產品結合的能力邊界在哪裡。所以毫無疑問,我們未來還會看到更多像 Lightwear 這樣,你甚至可以說有點像「縫合怪」一樣的東西。
只有做更多的嘗試,儘管其中大部分是試錯,這些產品公司才能真正摸到邊界在哪裡,才能帶來更加優秀的體驗。

說在最後
當然,Lightwear 還是一個正經要發售的產品。這個套裝的價格並不便宜,在這裡我無意給 Lightwear 過高的評價,免得大家形成錯覺。
在發布會現場我們上手的是「工程樣機」,包括日程管理、消息提醒轉述、差旅預定、叫車、餐廳點評資訊和排號、視覺搜索/商品加購物車等高頻剛需場景,體驗起來均流暢運行。
但由於耳機直連耳機盒 (eSIM 4G 網路)加之現場網路一般,對話的時延還是比較明顯,距離《Her》電影裡那種理想化的對話節奏還是有距離的。現場工程師透露,工程樣機的體驗距離明年 Q1 發售的市售版,大約實現了 7-8 成水平。
但實話來說,體驗過 Lightwear 後,我覺得它已經足夠令我滿意。我覺得,OpenAI 和蘋果籌劃中的,可能會在 26 或 27 年正式發售的「帶攝影機的 AI 耳機」產品,體驗不會比光帆的方案好出太多——
這和產品力、工程能力無關,純粹在於這個產品形態目前的想像空間也就這樣了。這些功能誰都能做,像光帆這樣的,脫胎於小米的中國團隊,應該只會做的更好。

如果問我怎麼看這種形態的 AI 硬體,我的回答是:高度合理、不夠優雅、大概率不是最終形態。
高度合理:因為它準確的解決了多模態 Agent 與硬體結合時的上下文痛點。AI 如果需要理解真實世界,不能沒有視覺感知;
不夠優雅:產品機身大於 AirPods,會帶來一定的社會壓力。對於普通用戶來說,甚至可能成為購買後吃灰的理由;
不是最終形態:接上一條,目前的 Lightwear 更像是初步和過渡性的產物。我們可以想像成熟產品應有的樣子:攝影機進一步縮小到難以察覺,從而讓整個產品更像 AirPods——被社會廣泛接受的產品形態。這方面我們無需擔心,參考智能眼鏡和錄音卡片的經驗,一開始都相當笨重,後面隨著市場火熱、供應鏈進步,方案也會日趨成熟。
以及目前 Lightwear 搭載的是一個自研的 AI 作業系統 Lightware OS,它背後能接多類大語言模型/多模態模型、MCP、API,具備 Phone/Browser Use 能力等等——所以,就算未來攝影機耳機這個形態被證明不可行,光帆的 OS 也可以快速遷移到眼鏡或其它的載體上。
從 AI AirPods,到 Meta 據傳幾年前就有立項的 Camerabuds 耳機,再到 OpenAI 找來前蘋果設計傳奇 Jony Ive 做的神秘新硬體——這些產品的傳聞都不謀而合地提及了搭載攝影機的耳機方案。這絕對不是簡單的巧合,更像是「英雄所見略同」。

而在這樣一個非常早期但已強敵環伺的市場,光帆率先發布了一個高度可用的產品,這本身就是一件值得興奮的事情。
從技術演進的必經之路來看,在一個劃時代的革命性產品書寫全新定義之前,各種新東西、「怪東西」此起彼伏是必然的。當 AI 開始主動理解世界時,設備形態一定會變得有些奇怪——任何事物在早期階段都是這樣,別忘了小汽車在最一開始也被當成馬戲一樣看。
當然,從用戶接受的角度,社會規範、隱私邊界、審美偏好等等軟性因素的轉變,往往比技術進步要慢得多。真正的臨界點在哪裡,現在還不太看得清。
但可以確定的是,我們已經經過了一個朦朧的新起點。未來會有越來越多被 AI 徹底改變設計、重塑人機交互的新形態產品。透過《AI 器物志》這個專題,將持續觀察它們如何進入、改變我們的生活。






