阿里云通义开源推理大模型

阿里云通义团队于11月29日宣布,正式发布名为QwQ-32B-Preview的AI推理模型,并将其源代码公开。QwQ(Qwen with Questions)是通义千问团队基于Qwen大模型开发的一种实验性研究模型,同时也是阿里云首个向公众开放源代码的AI推理模型。通义千问团队的研究表明,当AI模型被赋予足够的时间进行思考、提问和自我反思时,其对数学和编程问题的理解能够得到显著提升。基于这一发现,QwQ模型在解决复杂问题方面取得了突破性的进展。根据官方公布的数据,QwQ模型在GPQA(科学推理)、AIME(美国数学邀请赛)、MATH-500(数学问题)以及LiveCodeBench(代码编写)等测试中表现出色,与o1-preview和o1-mini等其他模型相比,整体水平相当。这一开源举措不仅展示了阿里云在AI技术研究上的最新成果,也为全球AI开发者提供了一个新的学习和创新的平台。