AI 影片新王全球爆火，威爾·史密斯終於可以好好吃麵（附大量實測演示）

上一代，寂寂無名，這一代，全球爆火——說的就是 Veo3。

贊助商廣告

這周過去的 Google I/O 大會，帶來的最驚艷的更新，莫過於 Veo3。上一個版本，也就是 Veo2 出來時，正好是 OpenAI 用生圖魔法咔咔亂殺的時候，Veo2 就這麼被遺忘在角落。

這一次在谷歌以 Gemini 為主角，全系大升級的情況下，Veo3 終於揚眉吐氣了一把。它的強大也毋庸置疑，金標準就是「史密斯吃麵條」。

史密斯不再是手指亂飛、五官猙獰的樣子，而是慢條斯理地吸溜義大利麵。從拿起叉子，到送入口中，整個過程流暢絲滑。食物的物理特性表現也很好，義大利麵的纏繞和拉伸效果很寫實。

而 Veo3 本次的更新最大的亮點，在於可以同步生成符合影片內容的音效。史密斯「吸溜」麵條的聲音，跟畫面完全一致。

Veo3 作為影片生成模型，搭載於 Google 全新推出的整合型影片平台 Flow 和 Whisk。目前對美區用戶開放，需要訂閱 Google AI Ultra，價格為每季度 124.99 美元。

毫不費力，實現音畫同步

看看這個水波紋的動態效果，渲染得非常真實細膩，水面反射的效果也很自然。紙船在水面上的漂浮狀態、隨著水流的波動輕微晃動，符合實際物理規律。

其是最後鏡頭切換到排水口時，水流的湍急程度和漩渦的形成，以及水花的飛濺都被表現得極為生動和真實。

這種複雜的流體動力學效果通常需要高精度的物理模擬。更重要的是，所有的聲音也完全按照紙船的運動軌跡，毫不出戲。

生成式影片的物理邏輯問題，無限趨近於解決，除了不夠穩定之外。除了紙船流水，這支影片裡的奶茶還在鍋中時，液體細節比如氣泡、流動等，表現得非常細膩。

從鍋中液體到倒入杯子的過程中，泡沫的形成和擴散也很自然。這種細膩的表現力是 Veo3 無比強大的地方。特殊畫幅也不在話下。像這個魚眼鏡頭，同時又保持了貨架上的商品細節，以及人物動作的連貫。伸手拿取商品、觀察貨架等動作，都毫無瑕疵。

贊助商廣告

甚至，這個仿監控攝像的畫面，還有時間戳，相當有迷惑性。AI 生成的魅力在於能夠組合各種意想不到的元素，比如這個應用了老式錄像帶的畫風，但卻是一個蜥蜴人？恐龍人？作為主角。

雖然有點詭異，恐龍角色的動作細節毫不馬虎，例如握持吉他時的手部姿勢和彈奏動作，以及手持飲料罐時的細節處理，都很到位。而恐龍的外形還是栩栩如生，皮膚紋理、眼睛的動態效果以及整體的表情變化都非常靈動。

還有一個切開毛氈奇異果的影片，羊毛球柔軟、蓬鬆的質感，表面的纖維紋理和刀刃的反光都處理得非常好，剖面展示出來那一刻相當流暢。

配套的音效，完全不是常規水果的聲音，而是硬羊毛和金屬摩擦的聲音——太準確了。Veo3 的聲音生成包括非語言類的元素，以及語言類的台詞、旁白，同時支持非英語的旁白生成。

像這支影片裡，青蛙的表情和動作變化非常連貫，從眼神的轉動到嘴巴的微動，都跟台詞保持高度同步。

這個角色是青蛙，不僅在外形上高度擬真，皮膚質感、眼睛的動態效果以及表情的變化都非常寫實。尤其是觸手緊握吧檯邊緣，甚至能讓人感覺到重量感和摩擦力。

畫面能跟音樂結合嗎？安排。這支影片裡，Rap 與動作的高度同步，節奏和強度與人物的動作完美結合，使整個場景充滿了活力和動感。鏡面反射的效果不僅增加了視覺上的複雜性，還使得動作顯得更加立體和富有層次感。

仔細看，人物的動作非常連貫，從一個動作到下一個動作的過渡自然，顯示出高水平的動畫控制能力。

最讓人震撼的是一個車展的影片，背景中的汽車展示區、展位標識以及人群活動都幾乎毫無瑕疵——盯著看了老半天，也沒看出什麼錯處來。連展台設計和擺放位置跟三次元的車展，不說是一模一樣，簡直是毫無區別。主持人在介紹時的手勢引導，與他人互動時的身體語言，包括專業的語調專業和感染力都無可挑剔。

贊助商廣告

這麼複雜的畫面，大量的人像，而且是運動人像，複雜的音效，Veo3 全都 hold 住了，是非常震撼的一個用例。

車展這個影片已經非常完備了，還有沒有更完備的？

Veo3 很認得清自己的位置：創意工具。所有的 AI 生成工具都是這樣，應該是為了實現創意而服務，而非喧賓奪主。所以有網友通過 Veo3，打造了一條「打破第四堵牆」的 AI 控訴。

這，才是《黑鏡》該有的樣子。目測有一定拼接剪輯工作，但是，不妨礙展示 Veo3 在電影風格方面的實力。

人物的表情和動作非常逼真，尤其是情緒激動時的細節處理。環境和背景的設計也體現了 AI 的強大能力，例如廢墟街道的破敗景象和醫院的安靜氛圍，都表現出高度的還原。

每個場景都通過細膩的表情、動作和環境設計，實現了多層次的情感表達和氛圍渲染，雖然台詞是諷刺，但品質上來看，可以說是接近電影級的出品。

One More Thing

Veo3 的爆火也迅速吸引了渾水摸魚的樂子人，拿著明明是真人影片，假裝炸裂地高呼：天吶！AI 都這樣了可怎麼辦吶！

比如用電影段落來混淆視聽的，像《頭號玩家》，視覺效果拉滿的段落，人很難記得細節，只能記得一些感受。偷來搞樂子，確實很容易讓人中招。

I just tested Google's #Veo3 AI and it is insane! 🤯 pic.twitter.com/D0tXYQZoio
— Rishi (@ri5hitripathi) May 22, 2025

而人物方面，祖克柏是最容易中槍的——不是因為別的，而是因為他本人「偽人感」也太重了。

Veo3 is insane! At this rate, Veo4 will be indistinguishable from human-made videos pic.twitter.com/ylCPjMLVlR
— Bilal (@deepwhitman) May 20, 2025

贊助商廣告

無論是表情，還是肢體語言，仿佛跟人類剛馴服四肢……

小扎，被當作 AI 樣片掛出來，要反思一下是誰的問題啊！