多模態影片生成模型通義萬相Wan2.2-S2V正式發布

昨晚，阿里雲正式發布全新多模態影片生成模型通義萬相Wan2.2-S2V，並宣布開源。

贊助商廣告

Wan2.2-S2V極大地簡化了影片製作過程，僅需提供一張靜態圖片和一段音頻，模型便能生成面部表情自然、口型與音頻高度一致、肢體動作流暢絲滑的電影級數字人影片。

支持分鐘級長影片穩定生成，不止嘴動，手勢、表情、姿態都能動。

而且模型在訓練中充分挖掘跨域泛化能力，可自然驅動卡通人物、動物形象、二次元角色、藝術風格化人像，不再局限於真人肖像。

無論是萌寵說話，還是動漫角色唱歌，Wan2.2-S2V都能精準還原音畫同步效果。

其提供480P與720P兩檔解析度，兼顧效率與畫質，適用於短影片、數字人、輕量影視等場景。