昨晚,阿里雲正式發布全新多模態影片生成模型通義萬相Wan2.2-S2V,並宣布開源。
Wan2.2-S2V極大地簡化了影片製作過程,僅需提供一張靜態圖片和一段音頻,模型便能生成面部表情自然、口型與音頻高度一致、肢體動作流暢絲滑的電影級數字人影片。
支持分鐘級長影片穩定生成,不止嘴動,手勢、表情、姿態都能動。
而且模型在訓練中充分挖掘跨域泛化能力,可自然驅動卡通人物、動物形象、二次元角色、藝術風格化人像,不再局限於真人肖像。
無論是萌寵說話,還是動漫角色唱歌,Wan2.2-S2V都能精準還原音畫同步效果。
其提供480P與720P兩檔解析度,兼顧效率與畫質,適用於短影片、數字人、輕量影視等場景。
