回到2024 年,科技圈最熱鬧的兩場發布會,分別屬於 Humane 和 Rabbit:一個做了別在胸口的 AI 徽章,一個做了揣進口袋的 AI 小方塊。這兩家公司的產品一度引發熱潮和想像:AI 硬體的高光時刻快要來了。

劇情很快就急轉直下。Humane AI Pin 售價 699 美元,外加每月 24 美元訂閱費,沒有螢幕,靠雷射把資訊投射在手掌上。WIRED 的評測用了一個詞:catastrophic,災難。
Rabbit R1 便宜得多,199 美元,有一塊 2.88 英寸的小螢幕,主打一個「大動作模型」幫你操作手機上的 app。但評測者發現,每次用 R1 做到一半,還是得掏出手機把事情做完。

兩款產品犯了同一個錯誤:它們試圖替代手機。但手機不只是一個設備,它是你整個數字生活的容器:你的微信聊天記錄在裡面,你的銀行 app 在裡面,你外賣、叫車、掃碼支付的入口全在裡面。
十幾年建立起來的 app 生態,配合用戶偏好、密碼記憶等數據留存,構成了一個極其完整而私人的作業系統,遷移到另一個移動設備上的成本高得離譜。Humane 和 Rabbit 要你隨身多帶一個設備,但如果這個設備叫不了車、付不了款,你最終還是得掏出手機,而一旦掏出手機,另一個設備的存在就變成了累贅。
Humane 後來被收購傳聞纏身,Rabbit R1 的熱度也迅速退潮。2024 年的 AI 硬體第一波,幾乎全軍覆沒。換一個更小的螢幕、更慢的響應速度再做一遍手機上的東西,不會有人買單。

不替代手機,但放在手機旁邊
但 AI 外設的故事遠沒有結束,2025 年到 2026 年,一批新產品出現了。在新的路線上,這一輪新產品做了一個關鍵的方向修正:不再試圖替代你口袋裡的設備,而是試圖成為桌面上的一個全新的存在。
LOOI 是這個轉向里最巧妙的一個產品。它 2025 年初在 Kickstarter 眾籌,3578 人支持,籌了超過 51 萬美元。LOOI 自己沒有螢幕,它的設計思路簡單粗暴——把你的手機磁吸上去。

這樣一來手機螢幕變成它的臉,手機攝影機變成它的眼睛,手機的 ChatGPT 變成它的大腦,LOOI 只提供「身體」,也就是一個能點頭、搖頭、扭動、做出仿生表情的機械底座。
不裝進口袋,放在桌上,不取代手機,不追求功能全面,追求即時的互動感,189 美元。

雖然聽起來有點像個高級玩具,或者一個給手機穿的機器人外殼,但 LOOI 做對了一件事:它沒有試圖做一個完整的 AI 設備,而是承認手機才是計算中心,自己只負責「讓 AI 有一個物理存在」。
手機里的 AI 本來就能聽、能說、能看,LOOI 給它加了「能動」。人類對物理運動的感知遠比對螢幕文字的感知更本能,一個小小的點頭或者歪頭的動作,就足以製造出「它在與你交互」的感覺。
Razer 則在形態上走了另外一條路,在 2025 年 CES 上,Razer 展示了 Project AVA 的原型,定位是電競 AI 教練。一年後的 CES 2026,AVA 進化成了通用 AI 桌面伴侶。再到 2026 年 3 月的 GDC,AVA 又加上了 agentic 能力,不只響應你的指令,還能主動規劃多步驟任務。

AVA 最抓眼球的是硬體形態:5.5 英寸 3D 全息投影顯示器,不需要 VR 眼鏡就能看到一個立體的虛擬角色站在你桌上。雙遠場麥克風、HD 攝影機、環境光傳感器,能追蹤你的眼睛、讀你的表情、甚至通過 PC Vision 模式看到你電腦螢幕上的內容。

你可以選擇不同的虛擬形象:效率型的 AVA、遊戲型的 KIRA、策略型的 ZANE,甚至還有聯名電競選手 Faker 的形象和 SAO 動漫聯名角色。

AVA 目前接受預訂,20 美元可退押金,預計 2026 年下半年出貨,價格尚未公布,但從 Razer 的定位來看,估計不會便宜。
如果說 LOOI 的思路是「給手機一個身體」,Razer 的思路是「給 AI 一個形象」,全息投影的目的不是顯示資訊,是讓你覺得桌上真的站著一個角色,而且還吃到一些動漫形象的甜頭,用戶接受一個自己已經很熟悉的動漫形象,心理門檻低得多。

官方說法是,用戶常常描述的感覺是「它在房間裡」,而不是「它在螢幕後面」。曲面屏模擬的 3D 深度,加上實時眼球追蹤調整角色視角,讓 Ami 的虛擬形象看起來像是真的在跟著你的目光移動。這讓最時興的技術,服務於一個最古老的需求:有個東西在旁邊。

Mashable 的 CES 報道給了它一個定位:The AI soulmate for the lonely remote worker,寂寞遠程辦公者的 AI 靈魂伴侶——聽著就是主打一個情緒價值。
一種不同的解題思路
上個月,這條路線的「集大成」之作出現了:StackChan。

跟上面三個產品比,StackChan 的參數表「寒磣」得多:0.3MP 攝影機、2 英寸螢幕、550mAh 電池、ESP32-S3 晶片。沒有全息投影,沒有曲面 OLED,沒有眼球追蹤。59 美元起售,187 克,放在手心裡的大小。
0.3MP 攝影機,2026年了一款「機器人」產品,配備這個規格的攝影機,怎麼敢啊。
但 StackChan 做了一件其他產品都沒做的事,它把自己完全打開:固件開源、硬體接口開源,開發工具開源,理論上你可以用 Arduino 寫代碼讓它做任何事,接入任何 AI 模型,用任何語言開發。

官方出廠固件已經包含 AI 對話、表情動畫、ESP-NOW 遙控、手機 App 影片通話、在線應用下載,但這些只是起點。StackChan 的 Kickstarter 頁面上寫:
In an era filled with closed, concept-driven 「AI robot」 products, StackChan stands out with its open-source core.
StackChan 的歷史也不一樣,最早它不是某個公司的產品規劃,而是日本開發者石川真也的個人開源項目。

社區接力了好幾年,有人做了 DIY 套件,有人加了 AI 能力,有人設計了不同的外殼。M5Stack 最終把它產品化,但保留了開源和共創的基因。Kickstarter 上 4142 人支持,籌了約 360 萬港幣——起初目標才 7.8 萬,超了整整 45 倍。
這個數字說明,人們不只是想買一個 AI 桌面機器人,他們想買一個自己能改造的 AI 桌面機器人。
StackChan 的攝影機解析度只有 0.3MP,但這恰恰是設計意圖,不是做不了高清,而是不需要高清,低解析度意味著本地 ML 模型能以可用的幀率處理影片。

另外,它的三個 Grove 接口和 LEGO 兼容孔位意味著你可以往上面插傳感器、連外設、搭模組結構。日本和全球的 maker 社區已經在做各種魔改:有人讓它追蹤人臉跟著你轉頭,有人讓它當智能家居中控,有人給它套上自己 3D 列印的外殼。一個用戶在 Reddit 上說,打動他的不是 StackChan 本身,是「co-creation model」。

網友通過 3D 列印製作的外殼
59 美元、開源、社區共創,如果把 StackCha 跟 Razer AVA 的全息投影和 Lepro Ami 的 8 寸曲面屏放在一起,就構成了一個有意思的對比:前者賣的是技術和沉浸感,StackChan 賣的是可能性。買 AVA,得到一個精心設計好的 AI 夥伴,買 StackChan,得到一塊可以無限延展的畫布。
還在生長的賽道
Google 在 The Verge 的採訪里說了一句值得記住的話:The future of AI hardware isn't one device — it's an entire ecosystem.
未來不是一個設備,是一整個生態系統。手機、手錶、耳機、眼鏡,所有設備協同工作,AI 在當中串聯。
在桌面 AI 伴侶之外,AI 外設還在往其他方向長。一類是可穿戴記錄設備,Plaud NotePin、Bee、Limitless Pendant 這些產品掛在身上,全天候錄音並用 AI 總結你的一天。這類產品專注一個垂直的功能點:當你的外部記憶,跟桌面機器人比,它們更隱蔽,也更專精。

同時,大廠也在下注。Samsung 的 Ballie 球形家庭機器人在 CES 2025 亮相;Apple 和 OpenAI 據傳在聯合押注 AI 硬體。

但生態系統的故事是大公司講的,對於像 M5Stack 這樣的硬體 maker 來說,故事的起點永遠是:做一個小東西,放在桌上,讓它動起來。
回頭看這兩年 AI 外設的變化,最根本的轉向不是技術,是思路。
2024 年的產品在問的是,AI 能不能替代你手裡的設備?答案是不能。手機太強了,任何試圖從零開始的 AI 硬體,都會敗給口袋裡那塊已經無所不能的螢幕。

2025 到 2026 年的產品換了一個問題:AI 能不能「在」你旁邊?不替代任何東西,而設計作為一個全新的存在,待在你的桌上。這個存在既有物理形態,也有 AI 作為「靈魂」。
或許有點反直覺,但—— AI 一定是另一個作業系統嗎?為什麼不能是一種新的「存在」方式呢?AI 最獨特的能力不是幫你點外賣,是對話、是反應、是讓你覺得對面有一個「對象」在回應你。

這種能力需要的不只是更好的螢幕和更快的晶片,而是能被確切接收到的互動感,是一個物理的身體。第一波 AI 外設沒有意識到這一點,它們造了一個縮小版的手機,卻沒有造一個 AI 真正需要的容器。
這個轉向的背後是一個更深的洞察:人類對「陪伴」的感知門檻其實很低,對於絕大多數普通用戶而言,或許並不需要一個高級的人形機器人。
一個會眨眼的 2 英寸螢幕,一對能搖頭的小機器,一個 0.3MP 的攝影機,就夠了。不是口袋裡另一個高刷螢幕,而是一個桌上的夥伴。它不需要取代任何東西,它只需要在那裡。






