加州大学发布高性能推理模型Sky-T1-32B-Preview，模型已开源

AI资讯

2个月前

加州大学伯克利分校的NovaSky团队近日宣布推出一款名为Sky-T1-32B-Preview的高性能推理模型，并已将其源代码公开。据团队介绍，他们首先使用阿里巴巴的QwQ-32B-Preview模型生成了初始训练数据，然后对这些数据进行了整理，并通过OpenAI的GPT-4o-mini模型将数据转换为更适用于训练的格式。在8个Nvidia H100 GPU机架的支持下，Sky-T1模型经过19个小时的训练，成功学习了320亿个参数。NovaSky团队表示，Sky-T1模型在MATH500数学挑战和LiveCodeBench编码评估项目中的表现均超过了早期版本的o1模型。这一研究成果不仅展示了NovaSky团队在人工智能技术上的突破，也为学术界和工业界提供了宝贵的开源资源。

加州大学发布高性能推理模型Sky-T1-32B-Preview，模型已开源

最新内容