澎湃新聞報道,近日有傳言稱,字節跳動在Sora引爆文生影片賽道之前,已經在研發「中文版Sora」:一款名為Boximator的創新性影片模型。
2月20日,字節跳動相關人士告訴澎湃新聞記者,Boximator是影片生成領域控制對象運動的技術方法研究項目。目前還無法作為完善的產品落地,距離國外領先的影片生成模型在畫面質量、保真率、影片時長等方面還有很大差距。
這款影片模型的特點是什麼?與Runway推出的Gen-2、Pinka等市面上主流模型不同的是,Boximator可以通過文本精準控制生成影片中人物或物體的動作。Boximator的數據來源是WebVid-10M數據集,研究人員從中過濾出110萬段動態明顯的影片片段,並為其注釋220萬個對象的邊界框,在PixelDance和ModelScope這兩個模型上訓練了Boximator。
字節跳動的研究人員表示,目前這款模型仍然處於研發階段,預計將在2-3個月內發布測試網站。