多模理解
上传图片素材,大模型完成识别理解,返回关于图片的准确描述
视觉问答
围绕上传图片素材,响应用户的问题,大模型完成回答
多模生成
根据用户的描述,生成符合期望的合成音频和视频
虚拟人视频
描述期望的视频内容,整合AI虚拟人,快速生成匹配视频

相关导航