
Marble,終於來了。
沒錯,就是兩個月前在 AI 圈刷屏的那個 3D 世界生成模型。李飛飛旗下的 World Labs 剛剛宣布向全體用戶開放,還一次性放出了一大波新功能。
- 多模態生成:支持文本、單圖、多圖/影片、3D 布局等多種輸入方式
- AI 原生編輯:可對生成的 3D 世界進行局部替換和結構調整
- 世界擴展與組合:自動填充邊緣區域,拼接多個場景
- Chisel :用方塊搭框架,AI自動填充風格細節
- 全格式導出:支持高斯點雲、三角網格、影片等多種格式,可直接導入遊戲引擎

現在的使用門檻已經相當低。輸入一段描述性文本,或者上傳一張照片,AI 就能生成一個完整的 3D 世界。一套連招打下來,傳統 3D 建模師可能得重新思考職業規劃了……
附體驗地址:https://marble.worldlabs.ai/
李飛飛放大招,一句話生成完整 3D 世界
先直接上案例,看看 Marble 在文本生成上的真實水平。

▲ 文本提示詞:一個住過人的霍比特廚房,擺滿了編織籃子和銅壺,沐浴在寧靜的淺藍色日光中
如圖所示,一個完整的 3D 廚房場景就這樣呈現在我們面前,木質家具、銅製器皿、光影細節,一應俱全。
更考驗理解能力的來了。看看這個抽象描述:

▲文本提示詞:一個融合中世紀餐廳美學與軌道科技的空間站廚房,擁有棋盤格地板和不鏽鋼裝置,在柔和的水綠色燈光下熠熠生輝
面對這種跨越時空的混搭風格,AI 依然能準確拿捏。
我自己也做了一輪測試。嘗試生成一個森林場景後發現,雖然苔蘚貼圖略顯重複,但樹幹紋理細節清晰,林間若隱若現的霧氣也營造出了應有的氛圍感。

除了純文本,Marble 還支持更豐富的創作方式:
- 單圖生成:丟一張圖片進去,AI 自動補全 360 度全景視角
- 多圖/影片生成:從不同角度拍幾張照片,AI 自動拼接成完整 3D 空間
- 3D 布局生成:用基礎幾何體搭建框架,AI 負責填充所有細節

我也測試了單圖生成功能,上傳一張普通房間的照片後,大約 6 分鐘得到成品,仔細觀察可以發現,和預覽版一樣,邊緣形變問題還是比較嚴重,希望後續能夠得到優化,但就作為一個初期產品來說,目前的完成度已經相當能打。

從靈活性來看,這套多模態輸入的設計思路已經遠超市面上大多數同類工具。
而生成只是第一步,更值得關注的是後續的編輯能力。
Marble 還是業內首款原生集成 AI 編輯工具的模型,可以對生成的世界進行深度改造。比如在局部替換中,想移除垃圾桶?一句話搞定,AI 會自動處理場景和光影變化。

如果想大幅調整結構,比如要把餐廳後牆改造成舞台,把桌子換成面向舞台的矮凳?也能輕鬆實現。換句話說,這種編輯不是簡單的圖片處理,而是真正理解 3D 空間結構之後的智能調整。

除此之外,「世界擴展」功能同樣強大。生成的場景邊緣部分有些模糊?點擊「擴展」按鈕,AI 會自動生成更多內容來填充那片區域。想要更大的空間?用「組合模式」把多個世界拼接起來。

官方演示里就拼出了一整列火車車廂。這套工具鏈用下來,從創意概念到成品交付的周期被大幅縮短。

如果說生成和編輯功能還算意料之中,那 Chisel 這個工具就有點降維打擊的味道了。
簡單來講,Chisel 把「結構」和「風格」徹底分離:
- 第一步:用立方體、平面等基礎幾何體搭建空間框架(就像玩樂高)
- 第二步:寫一段文本描述視覺風格(比如「現代藝術博物館」或「斯堪地那維亞風格臥室」)
- 第三步:AI 自動將框架填充成完整的 3D 世界
更厲害的操作是,同一套框架,換個文本提示,能生成完全不同風格的場景。比如框架保持不變,提示詞改為「現代藝術博物館」,得到的是極簡白牆配抽象畫作。

▲ 一個美麗的現代藝術博物館,鋪有木質地板,館內陳列著色彩斑斕的畫作和曲線優美的雕塑。
又或者,框架保持不變,提示詞改為「北歐臥室」,呈現的是溫馨木質家具配冰川窗景。

▲ 一個寧靜的斯堪地那維亞風格客房臥室,窗外可欣賞到壯麗的冰川景色。
這種玩法有點像前端開發里 HTML 定結構、CSS 定樣式的邏輯,但應用到 3D 建模領域就顯得格外高效。正如 World Labs 聯合創始人 Justin Johnson 在採訪演示時說:「我可以直接選中代表沙發的 3D 塊,拖動到別的位置。」
傳統建模軟體里需要調整許久的操作,在 Marble 里變成了拖拽方塊……
此時此刻,建模師們的心情想必很複雜。
那麼,創建完成的 3D 世界該如何使用?Marble 提供了三種導出方案:
- 高斯濺射 (Gaussian Splats):最高保真度的表示方式,適合實時渲染,可以直接在瀏覽器里運行。
- 三角網格 (Triangle Meshes):分為低精度碰撞網格和高精度渲染網格,可以直接導入 Unity、Unreal Engine 等遊戲引擎。
- 影片格式:支持像素級鏡頭控制,還能用 AI「增強」——自動添加煙霧、火焰、水流等動態效果。

▲ Marble 可以將生成的世界導出為高斯點雲或三角網格模型。
官方新聞稿里的大部分影片,都是直接用 Marble 渲染生成的。通過串聯這整套工具鏈串聯,從概念到可用資產的流程被極大簡化。

▲增強後的影片能夠清除畫面瑕疵,並為場景加入動態效果。注意煙囪上方的煙霧、跳動的火焰,以及流動的水面。
遊戲開發者可以用 Marble 生成背景環境,導出到引擎里再添加交互邏輯;影視團隊可以用它快速搭建場景預覽,進行鏡頭規劃;VR 內容創作者甚至可以直接把生成的世界放進 Vision Pro 或 Quest 3 里體驗。
好傢夥,兜兜轉轉我們還是回到了元宇宙。
定價策略方面,Marble 採用了分級訂閱制:
- 免費版:每月 7000 點數,最多生成 4 個世界,支持文本/圖像/全景輸入。適合嘗鮮用戶,但高級功能都被鎖定。
- 標準版(20 美元/月):每月 20000 點數,12 個世界,解鎖多圖/影片輸入、Chisel 模式、基礎導出功能。
- 專業版(35 美元/月,首月1 美元):40000 點數,25 個世界,支持場景擴展、影片增強、高解析度網格導出,附帶商業使用授權。
- 旗艦版(95 美元/月):120000 點數,75 個世界,全功能解鎖。

顯而易見,免費版的門檻足夠低,能吸引大量用戶試用。但想真正用於生產環境,基本上得選專業版。首月 1 美元的限時優惠也很有誘惑力,明擺著就是想讓你先上車體驗。
Marble 發布後,各方反應相當兩極化。
Y Combinator CEO Garry Tan 在推特上直言:「李飛飛是一個傳奇人物,而這次發布意義重大。」一些獨立遊戲開發者和 VR 創作者也在社交媒體上表態,認為 Marble 大幅降低了 3D 內容製作的門檻。

不過質疑聲也不少。
最近的遊戲開發者大會(GDC)調查顯示,三分之一受訪者認為生成式 AI 對遊戲行業帶來負面影響,比前一年上漲了 12%。關注點包括:智慧財產權侵權、能源消耗過高、AI 生成內容質量下降、導致行業裁員等。《
Wired》此前報道,包括 Activision Blizzard 在內的遊戲公司,正在用 AI 壓縮成本和應對人員流失。
面對這些質疑,Justin Johnson 的回應是:「Marble 不是用來完全替代遊戲製作流程,而是為你提供可以直接使用的資產。」但實際情況會不會如他所說,還得看市場怎麼用。
李飛飛的北極星:空間智能
就在 Marble 發布前幾天,李飛飛專門發表了一篇長文闡述她的願景——空間智能(Spatial Intelligence)。
核心觀點可以總結為:
大語言模型雖然語言能力很強,但對物理世界幾乎一無所知。它們無法準確估計距離、方向,無法在腦中「旋轉」物體,也無法預測基本的物理規律。
對比之下,人類智能的核心不是語言,而是對三維空間的理解和操作能力。從駕駛汽車到接住鑰匙,從設計建築到發現 DNA 雙螺旋結構——都依賴空間智能。

按照李飛飛的規劃,空間智能的應用將分三個階段:
- 近期(創造力):遊戲、電影、建築設計(Marble 目前在做的)
- 中期(機器人學):通過模擬環境訓練機器人,讓它們學會在真實世界中行動
- 長期(科學突破):藥物研發、材料科學、醫療診斷、沉浸式教育
博客中,李飛飛明確表達:「如果沒有空間智能,我們對真正智能機器的夢想就無法實現。」
願景是宏大的,但現實更複雜。
世界模型這個賽道,也不止 World Labs 一家在較勁。
目前市面上還有這麼幾位選手:Decart 推出了免費演示版,主打實時生成;Odyssey 同樣提供免費試用,但功能較基礎;Google Genie 還在研究預覽階段,尚未商業化。

對比之下,Marble 的核心優勢說起來也挺明顯。它生成的是持久化的完整 3D 世界,不是那種邊探索邊生成的模式,可以大幅減少變形和不一致的問題。
更關鍵的是,Marble 率先實現了商業化落地,免費版加付費訂閱的模式已經開始變現。從工具鏈的完整度來看,Marble 也是最全面的,從生成到編輯再到導出,整個流程一氣呵成,不需要在多個平台之間倒騰。
從 ImageNet 到空間智能,李飛飛的學術生涯一直在做同一件事:讓機器理解視覺世界。ImageNet 教會了 AI「這是什麼」。而 Marble 想教會 AI「這在哪裡、如何運動、怎麼交互」。
前者催生了深度學習革命。後者會不會引爆下一場範式轉移?現在下結論還太早。但至少目前看來,這個方向足夠性感,也足夠硬核。
OpenAI 繼續卷 LLM,李飛飛押注空間智能……這場技術路線的豪賭,勝負或許就在這幾年揭曉。






