阿里万相视频生成大模型正式开源

2月26日,阿里巴巴集团宣布,其自主研发的视频生成大模型万相 2.1(Wan)正式开源。据发布会介绍,万相模型在指令遵循、复杂运动生成、物理建模以及文字视频生成等方面表现优异。在Vbench权威评测集中,万相2.1以86.22%的综合得分遥遥领先于国内外其他模型,位居第一。

1.3B参数版本的万相模型不仅在性能上超过了其他开源模型,甚至在某些指标上接近了闭源模型的水平。同时,该模型在硬件资源上的需求相对较低,仅需8.2GB显存即可生成480P视频,这一特点使其既适用于二次模型开发,也适用于学术研究。

此次开源采用了Apache2.0协议,14B和1.3B两个参数规格的模型推理代码和权重已全部公开,并支持文生视频和图生视频的任务。全球开发者可以通过GitHub、HuggingFace和魔搭社区下载并体验万相模型。

万相模型的开源,不仅展示了阿里巴巴在人工智能领域的领先技术,也为全球开发者提供了一个强大的视频生成工具,有望推动视频生成技术在各个行业的应用和发展。