AI资讯

Meta 发布 CGPO:克服奖励欺骗,提升多任务学习效率

近年来,随着大规模语言模型(LLMs)的发展,特别是通用大模型的应用场景愈发广泛,RLHF 逐渐成为调整和优化语言模型输出的主流方法。尽管 RLHF 在处理复杂任...

智谱AutoGLM 技术:革新手机与网页交互的AI助手

智谱AutoGLM 技术是一项创新的AI解决方案,它能够通过接收简单的文字或语音指令,模拟人类操作手机,从而实现一系列自动化任务。AutoGLM 的核心能力在于其能...
1 30 31 32