360gpt2-o1: 360 智脑自研 AI 大模型的最新进展

360 智脑官方于 12 月 16 日宣布,其自研 AI 大模型 360gpt2-o1 正式发布。该模型在数学和复杂逻辑推理任务上的表现有了显著提升,这是继今年 10 月推出 360gpt2-pro 后的又一重要更新。360gpt2-o1 使用树搜索构建思维链,并引入了反思机制,通过强化学习进行训练,使其具备自我反思和纠错的能力。在多项基础数学评测和权威数学竞赛中,360gpt2-o1 的表现不仅超越了前代模型 360gpt2-pro,也优于 GPT-4。这一进展标志着 360 智脑在 AI 大模型技术上的又一重要里程碑。