該圖片疑似AI生成
今年幾乎天天都能看到各路 AI 影片大神刷屏,什麼奧特曼對波馬斯克,雪王大戰東方明珠,切金屬切玻璃 ASMR……看得人心痒痒。
但真輪到自己上手,你就會發現,這玩意兒純屬「開盲盒」,而且是成本巨高的那種。排隊幾小時是家常便飯,積分燒得比紙快,結果出來的影片要麼人物畸變、畫風詭異,要麼乾脆就把你的提示詞當成耳旁風。
面對「AI 影片刺客」,還真有「卷王」站了出來。
去年靠「毒液特效」出圈的 PixVerse,今天悄咪咪地放了個大招——PixVerse V5。
他們這次號稱搞了一套「准實時生成」的狠活,全面優化了動態、清晰度、一致性和指令理解能力。
▲ PixVerse 國內版首頁
PixVerse V5 這次不光是小修小補,他們直接端出了三個硬菜:
1. 快速生成
這一直是 pixVerse 最大亮點, 他們通過極致的技術蒸餾,把影片生成壓縮到了「秒級」。5秒鐘出一段360p短片,1 分鐘搞定 1080p高清影片。
2. 更少 AI 味兒
V5 通過擴展美學數據和人類偏好擬合(RLHF),讓模型更懂「好看」和「真實」。無論是複雜的人物運動,還是光影的真實感,都大幅提升,生成效果更接近真實拍攝。
3. 指哪打哪
最讓人頭疼的「AI聽不懂人話」問題,他們用「統一特徵空間」技術來解決。簡單說,就是不管你餵給它的是一句話、一張圖,還是一段參考影片,它都能更準確地理解你的意圖,實現圖、文、影片多模態的複雜創意,讓你真正做到精準控制。
話是這麼說,是不是吹牛還得拉出來遛遛。我第一時間搞到了內測資格,替大家給它上上強度。
快到離譜,價格感人
快,是 V5 給我的第一印象。
實測下來,一段 8 秒帶聲音的 360p 影片,從排隊到生成完畢,基本都在 30 秒以內,包含排隊時間和生成時間;而 1080p 的超高清影片,所需要的時間會長一點,但是基本上也在 2 分鐘左右。
▲ 拿可靈生成影片來對比下,排隊的時間是 3 個小時
除了快到離譜,V5 也便宜到感人。每天登錄就送 60 積分(生成一段 5 秒 360p 無聲影片僅需 20 積分),會員選項也很多,讓「抽卡」的成本大大降低。
作為對比,可靈是每個月提供 166 積分,生成一段 5s 標準模式的影片也是 20 積分。目前可靈添加音效是限免,PixVerse 需要再加 10 積分。
時間和金錢這兩大核心痛點,PixVerse V5 算是給出了一個相當漂亮的解決方案。 那麼,最重要的質量如何?
強度實測:從「開盲盒」到「半開卷考試」
我們直接上硬菜,用幾個熱門案例來測試它的真實水平。
先來個簡單的,生成廣州塔的航拍鏡頭。
該圖片疑似AI生成
▲ 提示詞:電影般的航拍無人機鏡頭,聚焦廣州塔。使用柯達 35 毫米膠片拍攝,帶有膠片顆粒感。動態航拍鏡頭,攝像機環繞移動。保留參考圖像的構圖、框架和結構細節。
PixVerse 做的確實很好,而且速度還快。此外,不像 Veo 3 目前還是只能生成 16:9 的影片,PixVerse 則可以根據上傳的圖片自動適應生成影片的比例。
接下來,上點難度,測試它的人物一致性和場景理解能力。
最近 nano-banana 非常火,我們前幾天用它生成了非常多有意思的照片,社交媒體上也很多人用它來實現一個完整的故事,憑藉著它強大的人物、環境、照片風格內容等一致性保持。
我們找了幾組有意思的照片,看看 PixVerse V5 是否有能力可以生成一個影片。
首先是這兩個打檯球的女生,他們先是站在前面自拍,然後我想讓他們走到後面,拿著檯球桿開始玩。
該圖片疑似AI生成
結果有點意外。 場景保持得很好,走路動作和表情也到位。但……它莫名其妙給我多塞了一個路人女孩進來!
看來在理解複雜的雙人交互和空間關係上,AI 還是會犯迷糊。不過對比 V4.5(之前會生成一些意義不明的慢鏡頭),V5 至少更懂「走路」這個意圖了。
還有最近非常火的用 nano banana 來做手辦圖片,有了圖片之後,我們又可以生成非常多有意思的影片。
▲ 提示詞:將這張照片製作成一個角色模型。其後放置一個印有該角色圖像的盒子,以及一台螢幕顯示Blender建模過程的電腦。在盒子前方添加一個圓形塑料底座,角色模型站立在上面。使PVC材質看起來透明,並儘可能設置為室內場景。
我們先用 nano banana 製作了一個像是自己 3D 列印出來的 labubu,接著把這張圖片丟給 PixVerse。
該圖片疑似AI生成
▲ 提示詞:棕色的實體手辦開始在桌面上探險,它左邊走走,右邊看看,最後跳回到了原來它旁邊的盒子裡面;盒子上的 labubu 不要動,保持靜態的;電腦上顯示的 3d 手辦動畫處於預覽的狀態,自動的旋轉播放。
還有最近非常火,以假亂真的 AI 夜視鏡頭影片,我們也用 PixVerse 檢驗了一下。不得不說,這個效果很真實,小貓趴在熊背上,小心翼翼地跳來跳去,和熊的接觸、跳躍的動作,都像是真的。
如果是處理這種簡單的動作還不夠上難度,我們直接給他一張滑板的腳步特寫,讓他完成這些複雜的滑板動作。
該圖片疑似AI生成
PixVerse V5 也能精準地生成腳部動作,並且不出現差錯。 我們用 V4.5 試了一下,有時候是會出現鞋子反穿,還有一些很搞笑的是,看起來滑板很燙,不知道怎麼下腳的奇怪動作。
可以說,PixVerse 確實在生成質量上有了很多方面的提升。整體感覺是,V5 版本在一致性和寫實感上的提升非常明顯,看起來更像真實拍攝,而不是帶著濃重 AI 味的畫面。
One More Thing,還有 Agent 創作助手
除了圖生影片,PixVerse V5 還提供了續寫、多主體、Agent 智能體等一堆花哨但實用的功能。
我最喜歡的是「續寫」。目前大部分 AI 影片一次只能生成幾秒,想做長影片就得手動截取最後一幀再生成,非常繁瑣。
而續寫功能可以相對絲滑地延長影片,支持 30s 內長度的影片,我用它做了個「貓貓做夢當大廚」的短片,效果很萌。
看這小貓最後滿足的笑容!
而為了解決「不會寫提示詞」這個終極難題,V5 還上線了 Agent 智能體。這玩意兒就像個創意模板庫,你只需要找到喜歡的模板,填入關鍵詞,它就能自動完成意圖理解、腳本生成、影片生成等一系列流程。
目前在 PixVerse 的智能體裡面,提供了超過十個的項目。有前段時間很火的兔子蹦床、給角色或物體更換材質、結合多個物體生成一個新物種、甚至還有給寵物穿上蟑螂套裝跳芭蕾這樣的智能體。
我就把之前我們用的那張 Labubu 的照片上傳給它,智能體的流程和模板還是不太一樣,模板只是單純的套用一套提示詞,而 PixVerse 的智能體就像我們用 ChatGPT agent 一樣,自動化全部的操作,像是省去了我們先去 nano banana 裡面生成圖片的流程。
雖然它偶爾也會犯傻,比如把我的 Labubu 手辦識別成「穿著棕色蟑螂服裝的形象」(我對不起 Labubu!)
但這跳得還不錯的芭蕾舞,確實展示了 Agent 功能的潛力——大大降低了普通人的創意實現門檻。
該圖片疑似AI生成
目前,PixVerse V5 和 Agent 創作助手已經在國際版 PixVerse(https://app.pixverse.ai/)與國內版拍我 AI(https://pai.video/)的網頁端、App 及開放平台 API 全面上線。
AI 影片,終於從「豪賭」變成了「刮刮樂」
綜合體驗下來,PixVerse V5 的這次更新可以清晰地總結為兩個詞:更快、更好。
它或許還不是最完美的影片模型,處理複雜的多人交互時依然會犯迷糊。但這讓我想起了豆包生圖,質量可能不如 Midjourney,但它免費、量大、管飽,你可以隨便試。
▲ 豆包一次性能生成 20 張圖
PixVerse V5 走的也是這條路。它用「准實時」的生成速度和極低的試錯成本,徹底改變了創作的心態。
過去,花幾小時排隊,燒掉大把積分,最後開出一個不滿意的「盲盒」,那種感覺是痛苦和沮喪的。現在,幾十秒就能看到結果,不滿意就立刻重來,這種體驗更像是「刮刮樂」——輕鬆、高頻,且總期待著下一張能中獎。
從這個角度看,PixVerse V5 的核心競爭力,或許不是生成了多麼驚艷的影片,而是在於提供了一種無負擔、高頻率的創作體驗。
當開盲盒的成本變得足夠低,當 AI 的不穩定不再讓你心疼時間和金錢時,AI影片創作,才算真正從少數大咖的神壇,走到了我們每個人的日常里。
文|李超凡、張子豪
:https://mp.weixin.qq.com/s/Q0_1JM-2tJa9VyMP0LYUBQ