近兩年生成AI技術發展迅猛,從兩年前最開始的AI圖,到今年年初的sunoAI音樂,最後終於到了這幾個月新鮮的AI生成影片。許多專家學者曾經在兩年前預言,AI是未來的希望是提高生產力的重要工具,那想必現代的人類一定在好好利用AI提高生產力吧,讓我們看看他們在用最新的AI影片做什麼:

(慈禧玩手機)
人類的創造力和想像力被嚴重低估了,當有人覺得AI可以取代人類的時候,不妨看看人類最近在整什麼活:

(模仿AI)
AI不能理解人類的抽象,一點都不能。
人類有三大欲望,食慾,x欲和睡眠欲,而其中「吃」是把AI的CPU給干燒了的罪魁禍首。當人們看到AI出的圖裡有五根手指握筷子,甚至關節錯位,手伸到湯里吃麵條的時候,AI技術發展疊代其中的一個目標,便是有必要讓AI充分理解吃是怎麼一回事。


很快,各個AI領域的專家用了一年多的時間終於讓AI初步理解了「吃」,AI生成的圖終於好看了那麼一點,但今年是2024年,圖已經out了,該煉煉影片了。
無論AI的圖多麼精美,「吃」永遠才是人們判斷AI是否牛x的標準,當6月快手的國產可靈影片生成大模型橫空出世,人們先質疑再質疑,你有本事來段吃飯的影片呢?面對質疑,他們端出了一段吃漢堡的影片。

雖然有些許瑕疵,還是能看出有些假的,但不仔細看確實不會在意,這下人們終於對AI徹底放下了心,也徹底放飛了自我:看來AI已經完全理解「吃」了,那我們整點平時吃不到的,來盤涼拌見手青嘗嘗鹹淡:

吃電子菌子,中賽博病毒,幾萬人一同見小人想想還是挺帶感的,最關鍵的是這玩意還是安全的。

當然人類對吃的探索肯定不僅限於這些簡單的東西,只不過因為各種各樣的原因,人類無法去嘗試,AI的出現終於讓人們吃到那些以前吃不到的東西了,比如義大利麵拌42號混凝土:

目前的影片生成大模型主要玩法基本一致,可以選擇一張圖或者一段影片作為素材,然後通過文字描述讓AI在素材基礎上生成符合文字描述的影片,即便是AI不理解,也會按照人類的要求把義大利麵和42號混凝土放一起。
AI表示雖然我不能理解你們人類的抽象,但反正我不吃。

(口 感 極 差)
食慾之後是睡眠欲,人類的夢有很多,如果問最大的夢是什麼,恐怕還得回到最開始。無論是最開始的文字,還是後來的圖片,直到影片,人們總希望過去的時光能夠倒流。21年左右,人們用現在更先進的AI技術修復照片和影片,最好……讓他們動起來。

到了今年可靈AI出現後,最開始流行的,同樣是把老照片當素材,讓裡面的人活過來。對於人來說,AI一開始的用處也許就是「讓人復活」。chatgpt對話模型訓練加上聲音模型訓練再加上如今的影片,數字生命的構想確實一點一點在變成現實,但是……

接下來還有很長的路要走,這種東西起碼現階段還是自欺欺人的,是一個遙不可及的夢,所以不如讓它別太嚴肅傷感回歸娛樂吧。於是老照片還是那個老照片,但裡面的人會幹什麼就由不得他了。什麼慈禧?慈禧也得跟著我們吃麵玩手機。
AI影片生成模型其實並不是新鮮玩意了,2023年就已經有Runway模型,和Stable AI本家的Stable video diffusion,但那時的模型還並未成熟,彼時的AI只能進行圖像識別,應用領域主要在摳圖這塊。

直到2023年底,RunwayGen2模型推出,不僅能識別圖像還能讓圖像動起來,AI生成影片的雛形出現。
三個月後,OpenAI的Sora
文生影片大模型推出,可以通過純字符生成影片,我們如今熟悉的AI生成影片才算是真正開始了它的故事,如今國外的AI生成影片工具五花八門,後來的Pika,Wonder Studio等等,都是相當不錯的工具。

也許你會問,既然年初就有了,怎麼感覺這段時間才火起來呢?那畢竟在這之前上述這些模型都是國外的,語言問題不談,翻牆和會費的門檻對於國人來說開始太高了。
一直到今年6月6日,快手的可靈影片生成大模型才橫空,不僅基本功能和國外的模型幾乎相同,使用門檻相對低很多,最重要的是它和後來抖音的dreamina一樣,大部分功能都是免費的,雖然可生成的影片時長較短,但也足夠讓人玩出花了。
隨著AI影片逐漸火熱,如今人們需要讓AI理解的不再僅僅是吃和老照片「復活」這種簡單的東西,而是人類抽象的本質,就像泛式與瓶子在AI中的激情戰爭。

讓原本打的不可開交的人瞬間回歸相親相愛,最後大家坐一起吃麵條,AI不能理解但只能硬著頭皮按照需求生成影片,最終的成品中的人們打到一半的憤怒臉瞬間變成笑臉,虛空中掏出一碗不知道哪來的麵條,帶著假的不能再假的表情吃下了麵條。
這種雖然我不知道為什麼,但甲方要求了,只能硬著頭皮做,最後做出來一個抽象產品的感覺很是奇妙,尤其是當你看到了影片最後由於無法理解,沒辦法用邏輯去串,只能從虛空中拿出麵條的時候,這種詭異又抽象的搞笑感讓人慾罷不能。

正當我饒有興趣地刷著這類短影片時,更加抽象的東西來了……人類開始反向故意模仿AI生成影片。
雖然你很清楚這就是史,但這種吃了拉又吃下去再拉一次的產物遠比原來的AI影片更加抽象,人們也紛紛開始模仿起這種AI影片,甚至在為了怎麼看起來更像AI上較起了勁,衝突更強的反轉,更加毫無邏輯的展開,各種虛空出現的物品……

看到這我相信,接下來的AI無論怎麼發展,是不是人們提高生產力的工具已經不重要了,它能讓人類腦子裡那些更抽象的想法變成現實這就夠了。不過這回又該輪到AI不理解了,人類到底為什麼閒著沒事要幹這種沒營養的事呢?其實人類自己也不理解。