上一代,寂寂無名,這一代,全球爆火——說的就是 Veo3。

這周過去的 Google I/O 大會,帶來的最驚艷的更新,莫過於 Veo3。上一個版本,也就是 Veo2 出來時,正好是 OpenAI 用生圖魔法咔咔亂殺的時候,Veo2 就這麼被遺忘在角落。
這一次在谷歌以 Gemini 為主角,全系大升級的情況下,Veo3 終於揚眉吐氣了一把。它的強大也毋庸置疑,金標準就是「史密斯吃麵條」。
史密斯不再是手指亂飛、五官猙獰的樣子,而是慢條斯理地吸溜義大利麵。從拿起叉子,到送入口中,整個過程流暢絲滑。食物的物理特性表現也很好,義大利麵的纏繞和拉伸效果很寫實。
而 Veo3 本次的更新最大的亮點,在於可以同步生成符合影片內容的音效。史密斯「吸溜」麵條的聲音,跟畫面完全一致。
Veo3 作為影片生成模型,搭載於 Google 全新推出的整合型影片平台 Flow 和 Whisk。目前對美區用戶開放,需要訂閱 Google AI Ultra,價格為每季度 124.99 美元。
毫不費力,實現音畫同步
看看這個水波紋的動態效果,渲染得非常真實細膩,水面反射的效果也很自然。紙船在水面上的漂浮狀態、隨著水流的波動輕微晃動,符合實際物理規律。
其是最後鏡頭切換到排水口時,水流的湍急程度和漩渦的形成,以及水花的飛濺都被表現得極為生動和真實。
這種複雜的流體動力學效果通常需要高精度的物理模擬。更重要的是,所有的聲音也完全按照紙船的運動軌跡,毫不出戲。
生成式影片的物理邏輯問題,無限趨近於解決,除了不夠穩定之外。除了紙船流水,這支影片裡的奶茶還在鍋中時,液體細節比如氣泡、流動等,表現得非常細膩。
從鍋中液體到倒入杯子的過程中,泡沫的形成和擴散也很自然。這種細膩的表現力是 Veo3 無比強大的地方。特殊畫幅也不在話下。像這個魚眼鏡頭,同時又保持了貨架上的商品細節,以及人物動作的連貫。伸手拿取商品、觀察貨架等動作,都毫無瑕疵。
甚至,這個仿監控攝像的畫面,還有時間戳,相當有迷惑性。AI 生成的魅力在於能夠組合各種意想不到的元素,比如這個應用了老式錄像帶的畫風,但卻是一個蜥蜴人?恐龍人?作為主角。
雖然有點詭異,恐龍角色的動作細節毫不馬虎,例如握持吉他時的手部姿勢和彈奏動作,以及手持飲料罐時的細節處理,都很到位。而恐龍的外形還是栩栩如生,皮膚紋理、眼睛的動態效果以及整體的表情變化都非常靈動。
還有一個切開毛氈奇異果的影片,羊毛球柔軟、蓬鬆的質感,表面的纖維紋理和刀刃的反光都處理得非常好,剖面展示出來那一刻相當流暢。
配套的音效,完全不是常規水果的聲音,而是硬羊毛和金屬摩擦的聲音——太準確了。Veo3 的聲音生成包括非語言類的元素,以及語言類的台詞、旁白,同時支持非英語的旁白生成。
像這支影片裡,青蛙的表情和動作變化非常連貫,從眼神的轉動到嘴巴的微動,都跟台詞保持高度同步。
這個角色是青蛙,不僅在外形上高度擬真,皮膚質感、眼睛的動態效果以及表情的變化都非常寫實。尤其是觸手緊握吧檯邊緣,甚至能讓人感覺到重量感和摩擦力。
畫面能跟音樂結合嗎?安排。這支影片裡,Rap 與動作的高度同步,節奏和強度與人物的動作完美結合,使整個場景充滿了活力和動感。鏡面反射的效果不僅增加了視覺上的複雜性,還使得動作顯得更加立體和富有層次感。
仔細看,人物的動作非常連貫,從一個動作到下一個動作的過渡自然,顯示出高水平的動畫控制能力。
最讓人震撼的是一個車展的影片,背景中的汽車展示區、展位標識以及人群活動都幾乎毫無瑕疵——盯著看了老半天,也沒看出什麼錯處來。連展台設計和擺放位置跟三次元的車展,不說是一模一樣,簡直是毫無區別。主持人在介紹時的手勢引導,與他人互動時的身體語言,包括專業的語調專業和感染力都無可挑剔。
這麼複雜的畫面,大量的人像,而且是運動人像,複雜的音效,Veo3 全都 hold 住了,是非常震撼的一個用例。
車展這個影片已經非常完備了,還有沒有更完備的?
Veo3 很認得清自己的位置:創意工具。所有的 AI 生成工具都是這樣,應該是為了實現創意而服務,而非喧賓奪主。所以有網友通過 Veo3,打造了一條「打破第四堵牆」的 AI 控訴。
這,才是《黑鏡》該有的樣子。目測有一定拼接剪輯工作,但是,不妨礙展示 Veo3 在電影風格方面的實力。
人物的表情和動作非常逼真,尤其是情緒激動時的細節處理。環境和背景的設計也體現了 AI 的強大能力,例如廢墟街道的破敗景象和醫院的安靜氛圍,都表現出高度的還原。
每個場景都通過細膩的表情、動作和環境設計,實現了多層次的情感表達和氛圍渲染,雖然台詞是諷刺,但品質上來看,可以說是接近電影級的出品。
One More Thing
Veo3 的爆火也迅速吸引了渾水摸魚的樂子人,拿著明明是真人影片,假裝炸裂地高呼:天吶!AI 都這樣了可怎麼辦吶!
比如用電影段落來混淆視聽的,像《頭號玩家》,視覺效果拉滿的段落,人很難記得細節,只能記得一些感受。偷來搞樂子,確實很容易讓人中招。
I just tested Google's #Veo3 AI and it is insane! 🤯 pic.twitter.com/D0tXYQZoio
— Rishi (@ri5hitripathi) May 22, 2025
而人物方面,祖克柏是最容易中槍的——不是因為別的,而是因為他本人「偽人感」也太重了。
Veo3 is insane! At this rate, Veo4 will be indistinguishable from human-made videos pic.twitter.com/ylCPjMLVlR
— Bilal (@deepwhitman) May 20, 2025
無論是表情,還是肢體語言,仿佛跟人類剛馴服四肢……
小扎,被當作 AI 樣片掛出來,要反思一下是誰的問題啊!