阿里通义万相2.1模型升级：中文文字视频生成功能重磅推出

4周前

随着科技的不断进步，人工智能（AI）技术在各个领域的应用日益广泛。近日，阿里旗下通义万相模型宣布了2.1版本的重大升级，此次升级不仅显著提升了视频生成和图像生成两大核心能力，还首次实现了中文文字视频生成功能，这一突破性进展使其在VBench榜单上荣登榜首。

在视频生成方面，通义万相2.1模型通过自主研发的高效变分自编码器（VAE）和双线性变换（DiT）架构，增强了时空上下文建模能力，实现了无限长1080P视频的高效编解码。这一技术的突破，使得用户能够通过简单的文字描述，生成高质量、高清晰度的视频内容，为内容创作和视频制作领域带来了革命性的变化。

通义万相2.1模型不仅支持中文视频生成，还支持英文视频，并且能够一键生成艺术字，为视频内容增添更多个性化元素。同时，模型提供了多种视频特效选项，如过渡、粒子效果、模拟等，这些功能将极大地增强视频的视觉表现力，满足用户多样化的创作需求。

在图像生成方面，通义万相2.1模型采用了IC-LoRA图像生成训练方法，结合DiT架构，显著提升了文本到图像的上下文理解能力。模型支持文生组图，用户可以通过对多张图像进行拼接与联合描述，实现图像间的组合生成，并且保持特征的稳定连续，为创意设计和平面广告制作提供了新的可能。

此次通义万相2.1模型的升级，不仅展示了阿里在AI技术研究上的深厚积累，也为各行各业的应用提供了更为强大的工具。随着技术的不断迭代和优化，我们有理由相信，AI技术将在未来创造出更多令人惊喜的应用场景，为我们的生活带来更多便利和惊喜。

阿里通义万相2.1模型升级：中文文字视频生成功能重磅推出

最新内容