豆包实时语音大模型正式发布,升级用户体验
近日,豆包大模型团队宣布,豆包实时语音大模型已正式推出,并全面开放给豆包APP的用户。此次升级至7.2.0版本后,用户将享受到更加智能化和流畅的语音交互体验。
豆包实时语音大模型是一款集语音理解和生成于一体的先进模型,它实现了端到端的语音对话功能。相较于传统的级联模式,该模型在语音表现力、控制力和情绪承接方面表现出色,同时具有低时延和对话中可随时打断的特点。根据用户的真实反馈,该模型在满意度上较GPT-4有显著提升,尤其是在语音的自然度和情绪的饱满度上,远超后者。
团队认为,豆包实时语音大模型的推出具有里程碑式的意义。它不仅紧密结合了中国用户的实际需求,而且其发布即意味着立即可用,有能力为亿万用户提供直接服务,而不仅仅是停留在演示阶段。这一升级将极大地提升用户体验,并为智能语音技术的发展树立新的标杆。