加州大学发布高性能推理模型Sky-T1-32B-Preview,模型已开源

加州大学伯克利分校的NovaSky团队近日宣布推出一款名为Sky-T1-32B-Preview的高性能推理模型,并已将其源代码公开。据团队介绍,他们首先使用阿里巴巴的QwQ-32B-Preview模型生成了初始训练数据,然后对这些数据进行了整理,并通过OpenAI的GPT-4o-mini模型将数据转换为更适用于训练的格式。在8个Nvidia H100 GPU机架的支持下,Sky-T1模型经过19个小时的训练,成功学习了320亿个参数。NovaSky团队表示,Sky-T1模型在MATH500数学挑战和LiveCodeBench编码评估项目中的表现均超过了早期版本的o1模型。这一研究成果不仅展示了NovaSky团队在人工智能技术上的突破,也为学术界和工业界提供了宝贵的开源资源。