宅中地 - 每日更新
宅中地 - 每日更新

贊助商廣告

X

AI 穿越 vlog 刷爆全網!我用這些影片模型「親歷」玄武門之變

2025年06月21日 首頁 » 熱門科技

最近,一類「穿越 vlog」爆火了。

有人讓 Veo 3 變成「時間機器」,將人們帶回歷史事件中進行現場直播。

有戰地記者在赤壁之戰的大火中報道——

AI 穿越 vlog 刷爆全網!我用這些影片模型「親歷」玄武門之變

(@ YouTuber 「nowsmon」)

也有人在戰爭空隙八卦曹操的私生活——

AI 穿越 vlog 刷爆全網!我用這些影片模型「親歷」玄武門之變

(@ X 推主「KellyV」)

還有人進入王者榮耀對后羿貼臉開大——

AI 穿越 vlog 刷爆全網!我用這些影片模型「親歷」玄武門之變

(@ 影片號博主「靈感不正經」)

這些腦洞大開的影片再次讓人們驚呼,Veo 3 還能這麼玩!導致 GoogleDeepMind 的總訪問量從 4 月到 5 月 直接增長 162%。

 

前幾天,我們也看得手痒痒,就用 Veo 3 做了兩個穿越回「玄武門之變」現場的影片,效果很不錯。

Prompt 如下:
「Scene 1: Under a sky heavy with storm clouds at dawn, dust swirls in front of the towering Xuanwu Gate. A young Asian woman in a battlefield reporter’s jacket stands on the right side of the frame, earpiece in place, her expression tense as chaos unfolds behind her. In the distance, Li Shimin’s forces charge through the gate—arrows fly and war drums thunder. She dodges debris and speaks into the camera in a low, urgent voice: This is Xuanwu Gate. Li Shimin’s troops have launched a sudden assault. The situation is extremely dangerous!   Scene 2: After the bloody battle at Xuanwu Gate, early morning sunlight falls across bloodstained stone tiles. The same Asian woman stands in front of a collapsed palace gate. Behind her, soldiers raise banners that read Prince Qin Ascends. Her face is solemn as she speaks firmly into the camera: We are now at the heart of the conflict. Li Jiancheng and Li Yuanji have been slain. Li Shimin is taking control. The Tang Dynasty’s history is being rewritten.」

那麼其他 AI 是否也能做出這種效果?

給可靈輸入同樣的中文版提示詞,看看可靈版的「玄武門之變」:

「畫面一(衝突初現):
烏雲壓頂的黎明,玄武門城牆前塵土飛揚,一位身穿戰地記者夾克的亞洲女性站在視角右前方,耳邊掛著通訊耳機,表情凝重地注視著遠處混亂的人馬衝突;背景中,李世民率軍破門而入,箭矢飛射、鼓聲如雷,她一邊躲避碎石,一邊面向鏡頭低聲播報:這裡是玄武門,目前李世民軍隊已發起突襲,情況危急!

畫面二(權力更替):
玄武門血戰過後,清晨的陽光斜灑在血跡斑斑的石板上,一位亞洲女性站在倒塌的宮門前,身後士兵正高舉「秦王即位」旗幟;她神情肅穆、語氣堅定地對鏡頭說道:我們現在所在的是事變核心地,李建成與李元吉已被擊殺,李世民正在掌控全局,唐王朝的歷史正被改寫。」

(by Kling 2.1 大師版)

畫面質感不錯,背景里的光影處理很細膩,塵土飛揚以及地面上的血跡效果做的都挺逼真。

相較於 Veo 3 能直接讓人物說台詞,可靈則需要額外選擇「對口型」特效再添加配音和環境音效,導致面部細節有些時候不夠自然。但整體來看還是很過關的。

不過,要想做出網路爆火的那種手持自拍杆的第一人稱 vlog 效果,就需要琢磨一下新的 prompt 了。

我們分別用可靈、海螺、即夢、Vidu 和 Sora 做了一些好玩的影片(也翻車了不少),終於總結出一些這類「穿越 vlog」的玩法以及好用的 prompt 分享。

自拍杆是翻車重災區?

我們先讓 Sora 試了一下穿越到古代中國建造長城的大場面。

(by Sora)

效果有點翻車,主要問題出現在這個自拍杆上。

儘管提示詞中寫了「他手持自拍杆,直視鏡頭」, 但似乎 Sora 沒能理解自拍杆的作用,於是就出現了自拍杆脫手懸浮的詭異畫面。

Prompt: A modern male journalist is transported to the ancient construction site of the Great Wall of China. Holding a selfie stick, he looks directly into the camera and says, "I've arrived at the Great Wall construction site!" In the background, the Great Wall is being built, with workers and soldiers transporting stones. The sound of hammering and shouting fills the air. The distant mountains serve as the backdrop, showcasing the grand scale of the construction.

對其他 AI 來說,自拍杆同樣也是重災區:

可靈直接把自拍杆變成了指揮棒。

(by Kling 2.1 大師版)

Vidu 做的穿越回《紅樓夢》場景中,更是把自拍杆變成了一個類似 GoPro 的設備,顯然也沒能準確理解指令。

而且,記者對著鏡頭說完一轉身,竟然憑空消失了,屬實是有點幽默了。

提示詞:
「一位現代女記者來到《紅樓夢》中的古典園林場景。女記者手持自拍杆,她直視鏡頭進行直播。她穿著白T恤牛仔褲,先露出微笑的臉,對著鏡頭講話,然後展示身後場景。
場景:古典園林,有一座風景如畫的拱橋和一條緩緩流淌的小溪。背景點綴著鮮艷的桃花,花瓣在春風中飛舞,營造出寧靜而迷人的氛圍。一位年輕男子(賈寶玉),身穿紅色長袍,頭戴金冠,與身著淡粉色長袍、頭戴玉簪的女子(林黛玉)並肩而坐。兩人一起捧著一本書全神貫注地閱讀,神情專注而略帶羞澀。陽光穿過樹枝,將溫暖的光芒灑在書頁上,增強了唯美的氛圍。」

(by Vidu Q1)

將同樣的提示詞給海螺 AI,雖然場景、運鏡、人物表情都挺唯美自然,但自拍杆仍然是 bug。

(by Hailuo 02)

即夢做的「花果山尋找猴哥」,小女孩的真實度很讓人驚喜,可自拍杆呈現效果依然不盡如人意。

(by Seedance 1.0 mini)

而且等等……背景里這個真的是美猴王嗎?怎麼看著那麼像景區里「十元合影」的山寨版呢?這種「大家來找茬」時刻真的很容易讓人出戲。

AI 穿越 vlog 刷爆全網!我用這些影片模型「親歷」玄武門之變

「穿越咒語」要念對,我們總結了好用的 prompt

所以,為了避免出戲,我們試了很多次,終於總結出能較好地呈現出手持自拍杆直播效果的 prompt,發現「穿越成功」的關鍵在於加上這些詞語:

中文:「真實自拍鏡頭」「第一人稱視角」「自拍杆延伸到手中」
英文:「first-person perspective」「real footage selfie video」「handheld selfie with extended arm」

其他的場景就可以自由發揮想像力啦!

比如,可以穿越到秦始皇陵修建現場去直播:

Prompt:
「First-Person View: A Chinese girl wearing a white T-shirt, holding a selfie stick extended in her hand, stands in front of the construction site of the Terracotta Army near the Qin Shi Huang Mausoleum. The surroundings are filled with workers wearing traditional ancient Chinese clothing, such as tunics and straw hats. They are busy sculpting terracotta figures, shaping clay statues, and transporting construction materials. The air is thick with dust, and faint light from hanging oil lamps casts shadows on the walls, creating a mysterious atmosphere. The camera extends the selfie stick, showing the girl's excited face, and then rotates to capture a scene where workers are carefully placing the first few terracotta warriors into the ground, their faces focused and determined. The girl's voice breaks through the atmosphere, saying happily, "I can’t believe I’m here at the Qin Shi Huang Mausoleum construction site!"In the background, the sounds of hammering, workers shouting instructions, and the clattering of tools create a cinematic atmosphere.」

翻譯成中文提示詞:
「第一人稱視角:一位穿著白色T恤的中國女孩,手持自拍杆,杆子伸展到她的手中,站在秦始皇陵附近兵馬俑工地前。周圍是穿著傳統古代中國服飾的工人們,身著長袍,戴著草帽。他們忙著雕刻兵馬俑、塑形泥像和搬運建築材料。空氣中瀰漫著塵土,懸掛的油燈散發出微弱的光,投下陰影,營造出一種神秘的氛圍。相機伸展自拍杆,展示女孩興奮的臉龐,然後旋轉鏡頭,捕捉到工人們小心翼翼地將第一批兵馬俑放入地下的場景,他們的表情專注且堅定。女孩的聲音打破了這份氛圍,高興地說道:我真不敢相信我在秦始皇陵的工地上!背景中,錘擊聲、工人們的喊叫聲和工具的碰撞聲交織在一起,營造出一種電影般的氛圍。」

(by Sora)

也可以進入《聊齋志異》中探險:

Prompt:
「The video is presented in the first-person selfie perspective, with a girl traveling back to the fantastical world of Liaozhai Zhiyi. She wears a simple long dress, holding a selfie stick extended in her hand, broadcasting live. The camera first focuses on her face as she nervously yet excitedly says, "I can’t believe I』ve traveled to the world of Liaozhai Zhiyi!" Then, she slowly turns, and the camera reveals the strange scene behind her.
Scene: Surrounded by an ancient mountain village shrouded in mist, a quiet river flows gently, with occasional eerie bird calls. In the distance, an old temple is faintly visible, its upturned eaves giving off a mysterious aura. Suddenly, a white fox quietly steps out from the trees, appearing in her camera frame.」

翻譯成中文提示詞:
「影片以第一人稱自拍視角呈現,女孩穿越回《聊齋志異》的奇幻世界。她身穿簡單的長裙,手握自拍杆,杆子伸展至她手中,正對著鏡頭進行直播。鏡頭先聚焦在她的臉上,她有點害怕又興奮地對著鏡頭說道:我居然穿越到了《聊齋志異》的世界!然後,她緩緩轉身,鏡頭展示出身後的奇異景象。
場景:四周是迷霧籠罩的古老山村,幽靜的河流緩緩流淌,偶爾傳來幾聲怪異的鳥鳴。遠處,一座古老的廟宇隱約可見,屋頂上飛檐翹角,散發出一股神秘的氣息。突然,一隻白色狐狸悄悄地從樹叢中走出,出現在她鏡頭裡。」

(by Sora)

總之,加上這些關鍵「咒語」之後,Sora 能夠較為理想地呈現出想要的影片,而且第二段影片中也做出了手持鏡頭的那種很晃的感覺,有幾分偽紀錄片的味。

接下來,用可靈跟著天津姐姐穿越到大宋汴京城,身臨《清明上河圖》中的景象:

提示詞:
「第一人稱 Vlog影片:現代女記者穿越到宋代汴京城,出現在《清明上河圖》的街市中。她穿著T恤、牛仔褲和運動鞋,手裡拿著自拍杆,直視著鏡頭說:「我現在在北宋汴京,站在傳說中的《清明上河圖》里,這邊有賣燒餅的,那邊還有變戲法的,真熱鬧!」背後是擁擠熱鬧的古代街景:拱橋上人來人往,有人挑擔子,有人在擺攤賣點心,有說書藝人和馬車經過。畫面中現代記者與古代場景形成鮮明對比,畫面中有真實聲音:叫賣聲、人聲嘈雜。」

(by Kling 2.1 大師版)

雖然可靈的文生影片是沒有聲音的,但可以通過「對口型」 「文本朗讀」 「背景音效」來進一步優化,讓影片更加生動有沉浸感。

而且對口型的過程中似乎還會根據文本內容進行調試,肢體動作和文本內容是的對應效果自然流暢。

AI 穿越 vlog 刷爆全網!我用這些影片模型「親歷」玄武門之變

從這些 AI 影片的新玩法,我們看到一個有趣的現象:AI 強大到足以構建宏大逼真的歷史場景,但在理解人類習以為常的簡單物件和行為時,顯得有些呆萌。

但有時候利用這種「缺陷」反而會創造出意想不到的效果,比如最近爆火的「AI 切玻璃水果ASMR」,成了社交媒體一個新的流行賽道。

當我們嘗試如何用更精準的語言去「教會」AI 理解我們的意圖,如何巧妙地規避它的認知盲區,這可能才是過程中最有意思的事情。

就像 AI 大神 Andrej Karpathy 說的,現在最火的編程語言是英語。我們用自然語言輸出的 prompt ,也正在成為現在最受歡迎的影片創作能力。

 

所以,別被那些「翻車集錦」勸退,也別因為 prompt 複雜而卻步。 這些 AI 影片工具的真正價值,並不僅僅在於生成一個完美的大片,更在於它給了所有人前所未有的創作自由和敘事可能。

宅中地 - Facebook 分享 宅中地 - Twitter 分享 宅中地 - Whatsapp 分享 宅中地 - Line 分享
相關內容
Copyright ©2025 | 服務條款 | DMCA | 聯絡我們
宅中地 - 每日更新