宅中地 - 每日更新
宅中地 - 每日更新

贊助商廣告

X

Sora 首批專業級影片公布!OpenAI 要給好萊塢億點點震撼

2024年03月26日 首頁 » 熱門科技

隨著生成式 AI 的浪潮洶湧而至,即使是好萊塢這個長久以來被視為電影夢工廠的聖地,也迎來了變革的十字路口。

幾天前,據彭博社報道,OpenAI 計劃與好萊塢達成合作,鼓勵電影製作人將 Sora 整合到工作流中,以此來拓展 OpenAI 在娛樂行業的影響力。

而在今天,一群與 OpenAI 合作的藝術家們用七部超現實主義大片給好萊塢的導演們「打了個樣板」,並向整個影視行業發出了一次強有力的呼籲:

是時候該正視 AI 在藝術創作中的角色了。

教好萊塢導演「拍」短片

shy kids ,「空中夢想家」

位於多倫多的 shy kids 是一家多媒體製作公司,他們利用 Sora 講述了一個關於氣球人的故事。

短片的三位核心成員 Walter Woodman、Sidney Leeder 和 Patrick Cederberg 表示,Sora 的到來讓他們能夠將那些難以實現的故事變為現實。

影片來自 @dotey(已翻譯),下同

導演 Walter 對 Sora 在創作過程中的表現給予了高度評價,「Sora 在創造看似真實的作品方面表現得非常出色,但更興奮的是,它能夠帶來超越現實的創意。這不僅僅是技術上的突破,更是抽象表現主義進入一個全新階段的標誌。」

對整個行業來說,「來自世界各地、內心充滿著想要迸發的故事的人們,終於有了一個機會,向世界展示他們心中的宇宙。」

Paul Trillo,導演

Paul Trillo 是一位跨領域的藝術家、作家及導演,他的作品獲得《滾石》和《紐約客》等權威媒體的高度評價。

Paul 榮獲 19 次 Vimeo Staff Picks 獎項,這是Vimeo 平台對其頂尖短片的認可。

「與 Sora 合作,我首次感受到了作為電影製作人的絕對自由,」他表示。「不再受時間、財力或他人意見的束縛,我可以更加大膽且充滿激情地探索和實驗。」

Sora 的力量在於,當我們不再複製舊有的東西,而是創造出全新的、以往我們無法想像的可能時,它能展現出驚人的能力。

Nik Kleverov,創意總監 / Native Foreign

坐落於洛杉磯的加州,Native Foreign 是一家獲得艾美獎提名的創意機構,以精湛的品牌敘事、動效與標題設計,以及生成式 AI 的工作流程方面的專長而聞名。

作為聯合創始人的 Nik Kleverov 正在利用 Sora「將概念視覺化,並為品牌夥伴的創意快速打磨疊代」,在他看來,預算將不再限制創意的敘事。

Nik 還分享了他的製作體驗:「我是那種習慣於動態思維的創意工作者,因此當我在 Sora 中工作時,感覺就像能夠將任何想法變為現實。」

August Kamp, 藝術家/音樂家

August Kamp 是一位多才多藝的藝術家,身兼音樂家、研究者、創意倡導者和跨學科藝術家多重身份。

對於 August 而言,Sora 的出現標誌著一個歷史性的突破。她曾感受到自己的藝術創作受限於想像力與現實可能性之間的張力,而 Sora 為她提供了一個全新的解決路徑。

能夠如此直接地打造和精煉電影級視覺效果,為我開闢了前所未有的藝術創作道路……

我真的非常期待,隨著這些工具的未來發展,我們還能接觸到哪些新的故事講述形式。

Josephine Miller, 創意總監

Josephine Miller 是倫敦 Oraar Studio 的聯合創始人及創意總監,她領導的工作室擅長 3D 視覺、增強現實和數字時尚的設計。

Josephine 對於 Sora 帶來的影響同樣有著深刻的體會:「Sora 為我開啟了一個全新的領域,讓那些我多年夢想中的構思成為可能,這些構思以往因為技術壁壘而難以實現...

這種快速將想法以高品質概念化的能力,不僅對我的創意過程構成了挑戰,也促進了我的故事講述技巧的成長。它使我能夠在更少的技術束縛下,將我的想像力轉化為現實。」

Don Allen Stevenson III, 數字增強現實/混合現實藝術家

Don Allen III 是一位在夢工廠動畫開始其職業生涯的多領域創作者,演說家和顧問,一直專注於探索混合現實、虛擬現實和人工智慧的應用,不斷推動創意和技術的界限。

我一直有個念頭,創造一些我腦海中覺得有趣的增強現實異種生物。

有了 Sora,我現在能更簡便地對這些構思進行初步實現,再進一步完善出 3D 角色,將它們置入增強現實環境中。

Don 特別強調了 Sora 的特別之處:「它打破了傳統的物理定律和思維框架的束縛。」

他認為使用 Sora 可以使得他能夠從技術的限制中解放出來,轉而專注於無拘無束的創造性思考。「開啟了即刻呈現想像和快速打造原型的新世界。」

同時,Don 也提到:「這讓我能更有效地分配我的時間和精力,在正確的方向上深入挖掘,進一步增強我創作的角色想要傳達的情感深度。」

Alex Reben, 雕塑家/藝術家,OpenAI 的駐地藝術家

Alexander Reben 這十年來致力於創作探討 AI 中人性幽默與荒謬的藝術作品。

他通過手工將 AI 生成的圖像轉換成三維模型,並將這些模型具象化於現實世界中,創造出一系列引人深思的雕塑作品。

亞歷克斯分享了他對 Sora 的看法:「我開始將 Sora 作為開發三維雕塑的新起點。我深入研究了攝影測量學及其在雕塑創作中的應用潛力,這一探索過程讓我感到無比興奮。

特別是,將影片轉換成三維模型的可能性,讓我意識到我們有能力將 AI 系統的應用推向一個全新的維度。」

Hollywood?Sorawood!

一周前,Factorial Funds 發布了一篇深入分析的文章,對 Sora 的運行成本進行了詳細估算。

儘管有關 Sora 技術的詳細信息雖然有限,但 Factorial Funds 研究人員認為可以將 Sora 看作是 DiT(Diffusion Transformers)在影片生成方面的擴展,並在推算過程中參考了 DiT 論文的數據。

DiT-XL 模型有 675M 參數,使用了大約 1021 FLOPS 的總計算量,相當於大約 0.4 個英偉達 H100 運行一個月。

Sora 首批專業級影片公布!OpenAI 要給好萊塢億點點震撼

假設影片以 24fps 編碼,1 分鐘的影片包含 1440 幀。考慮到 Sora 的空間和時間壓縮的技術特性,如果按 DiT 論文的 8 倍壓縮率,原本 1440 幀的影片在潛在空間中可能只需要 180 幀來表示。因此,相較於 DiT 處理圖像,處理影片的計算量至少增加了 180 倍。

由於估計 Sora 的模型參數數量可能遠超 675M,所以假設該模型為 20B 參數的模型,這意味著相比於 DiT,Sora 的計算需求增加了 30 倍。此外,Sora 訓練的數據集比 DiT 也要大,這進一步增加了計算需求,乘數在 4 到 10 倍之間。

綜合考量上述各項因素之後,研究人員估算出 Sora 訓練一個月所需的計算資源大約在 4211-10528 塊 H100 之間。

訓練計算是一次性的大量計算,而推理計算雖然較小,但隨著模型的廣泛應用,會被頻繁調用。

Sora 首批專業級影片公布!OpenAI 要給好萊塢億點點震撼

平衡點是指花費在推理上的計算量超過訓練所需計算量的時刻。基於 DiT 到 Sora 的推算,Sora 每生成一段影片的計算成本約為 708×10^15 FLOPS,相當於每塊 H100 GPU 大約每小時能生成 5 分鐘影片。

在生成 1530 萬 到 3810 萬分鐘影片後,推理計算將超過訓練計算。考慮到 YouTube 每天上傳的影片量約為 4300 萬 分鐘,這個平衡點在實際應用中很快就會達到。

不過,需要說明的是,上述許多數字都是估計值,並且依賴於簡化的假設,並不一定為準確的數據。例如,它們沒有考慮 GPU 的實際 FLOPS 利用率、內存容量和內存帶寬的限制以及推測解碼等先進技術。

研究人員估算了使用 Sora 生成覆蓋一些主流影片平台內容所需 H100 GPU 的數量。由上文推算可知,每塊 H100 每小時能製作 5 分鐘的影片,也就意味著每塊 H100 每天能製作大約 120 分鐘的影片。

TikTok 每天總影片數大約為 3.4 億,平均時長約為 30 秒,那 TiKtok 每天大約產生約 1.7 億分鐘的影片,同理,YouTube 每天產生的影片總時長約為 4.3 億分鐘。

假設 AI 參與影片生成的比例為 15%(大部分影片時長低於 2 分鐘),那麼 AI 每天產生的影片時長:8500 萬 6500 萬 = 1.07 億分鐘。

也就是說,僅僅為了支持 Tiktok 和 YouTube 上的創作者社區,所需英偉達 H100 GPU 的總量約為 89000 塊。

然而上述的推算還算偏保守,因為還需要考慮其他因素:

首先,在實際情況中,GPU 的計算能力可能會受到內存限制和通信瓶頸的影響,導致實際可用的計算能力低於理論最大值。因此,認為 50% 的利用率更為現實,這意味著為了達到相同的計算效果,所需的 GPU 數量需要增加一倍。

其次,影片製作的需求在一天中不是均勻分布的,而是集中在某些高峰時段。在這些高峰時段,由於需求激增,需要更多的 GPU 來處理這些額外的計算任務,這可能導致所需的 GPU 數量再次翻倍。

在製作影片時,創作者通常會製作多個候選版本,然後從中選擇最佳的一個上傳。研究人員估計,平均每上傳一個影片,會製作兩個候選影片。這意味著實際的影片製作過程需要的計算資源是單個影片的三倍,因此所需的 GPU 數量也還需要增加一倍。

綜合考慮這些因素,研究人員得出了一個保守的估計,即在高峰時段,大約需要 72 萬塊 H100 GPU 來滿足實際需求。

Sora 首批專業級影片公布!OpenAI 要給好萊塢億點點震撼

作為對比,Meta CEO 祖克柏曾宣布為了推進 AGI,將豪砸上百億美元購買 35 萬個有價無市的 H100 GPU,而這一數字還只是覆蓋 Tiktok 和 YouTube 所需計算資源的一半。

不久前,好萊塢知名製片人兼導演泰勒·派瑞在接觸 Sora 沒幾天後,突然宣布擱置籌備了長達四年的 8 億美元製片廠擴建計劃,成了 Sora 誕生的首個受害者。

由於 Sora 和我看到的東西,所有這一切都被無限期擱置。

這一表態在影視行業引起了不少的恐慌,如今看來,倘若上文推算的數據屬實,那麼 Sora 要想短時間搶走影視工作者的飯碗,似乎還有一段長路要走。

此外,美國《紐約客》雜誌的一篇報道指出,ChatGPT 每天用電量是美國家庭平均用電量的 1.7 萬多倍。並且隨著生成式 AI 的進一步普及,耗電量還會持續攀升。

馬斯克也曾發出警告,未來兩年內,行業的主要障礙將由「缺矽」轉為「缺電」,並或將成為 AI 發展的新瓶頸。

Sora 首批專業級影片公布!OpenAI 要給好萊塢億點點震撼

但這些只不過是技術發展道路上的短暫性難題,隨著時間的推移,算力的限制和資源等外在因素的桎梏也是最容易被攻克的一環。

就 Sora 目前展現出的技術成果來看,生成畫面的震撼足以掩蓋音效上的瑕疵,而且我們至今仍未窺見 OpenAI 的彈藥庫里是否還藏著音效界的 ChatGPT。

即使 OpenAI 尚未發展此類技術,市場上先進的 ElevenLabs、以及近日爆火的 Suno 等音效工具也完全有能力填補 Sora 在工作流中的最後一塊空白。

因此,可預見的是,在不遠的將來,影視製作將變得前所未有的簡單——僅需一部劇本,就能一鍵生成一部完整的電影作品。

而劇本創作的門檻,早在 ChatGPT 問世之後,就已經成了生成式 AI 最先顛覆的領域。

宅中地 - Facebook 分享 宅中地 - Twitter 分享 宅中地 - Whatsapp 分享 宅中地 - Line 分享
相關內容
Copyright ©2025 | 服務條款 | DMCA | 聯絡我們
宅中地 - 每日更新