大模型之家讯 12月31日,GLM技术团队,今日宣布发布其年度最后一个模型——GLM-Zero的初代版本GLM-Zero-Preview。这是智谱首个基于扩展强化学习技术训练的推理模型,标志着GLM技术团队在通往AGI(人工通用智能)的道路上又迈出了重要一步。
GLM-Zero-Preview专注于增强模型的推理能力,尤其擅长处理数理逻辑、代码和需要深度推理的复杂问题。与基座模型相比,它在不显著降低通用任务能力的情况下,在专家任务能力方面实现了大幅提升。在AIME 2024、MATH500和LiveCodeBench等评测中,其表现与OpenAI的o1-Preview相当。
用户现已可以通过「智谱清言」(chatglm.cn)中的「Zero推理模型」智能体免费使用GLM-Zero-Preview,支持上传文字或图片,并输出完整的推理过程。同时,开发者也可以在「智谱开放平台」(bigmodel.cn)中通过API进行调用。
GLM-Zero-Preview的发布,不仅展示了GLM技术团队在人工智能领域的最新研究成果,也为其未来的发展奠定了坚实基础。尽管目前的GLM-Zero-Preview与OpenAI的o3模型仍存在一定差距,但团队表示将持续优化迭代强化学习技术,并计划尽快推出正式版GLM-Zero,将深度思考的能力从数理逻辑扩展到更多更通用的技术领域。
实测案例展示:
逻辑推理: GLM-Zero-Preview能够识别逻辑漏洞,模拟多种假设和可能性。例如,在处理特定图片时,它不仅能识别其中的数字,还能通过反思发现答案的关键在于“9”可以倒置为“6”。
数学能力: 在数学方面,GLM-Zero-Preview具有强大的归纳与演绎能力,能快速处理复杂数学运算,解答包括代数、微积分、概率统计等领域的问题。其在2025年考研数学一中的表现为126分,达到优秀研究生水平。
代码编写: GLM-Zero-Preview能熟练使用多种编程语言,帮助开发者快速编写代码。例如,根据指令“帮我用html写一个有趣的第一人称射击游戏”,它能迅速独立完成游戏编写,并在代码调试方面提供详细修复建议。
随着2024年的行将结束,GLM技术团队通过发布GLM-Zero-Preview,展现了其在人工智能领域的创新实力和对AGI的坚定追求。2025年,团队将继续迭代优化,为AGI的发展贡献更多力量