glm-4.7 是智谱ai最新发布的开源大语言模型,重点强化了代码生成、逻辑推理以及与外部工具协同工作的能力。该模型在多语种编程支持、高阶任务分解、前端界面美学设计等方面具备突出表现,兼容主流开发框架(如claude code等)。在多项权威基准测试中,其编程能力位居当前开源模型前列,推理性能亦实现跨越式提升。模型创新性地融合交错式思考、保留式思考与轮级思考三种机制,显著增强复杂任务执行过程中的稳定性与可控性。目前,glm-4.7已通过bigmodel平台开放api调用,并已在z.ai全栈开发环境中上线skills功能模块,为开发者提供更智能、更高效的编程辅助体验。
☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

GLM-4.7的核心能力亮点
- 高性能编码能力:支持Python、JavaScript、Rust、Go等多种编程语言,在终端命令执行与工程级代码生成任务中表现优异;采用“先规划、后执行”策略,有效提升长流程任务的鲁棒性与输出质量。
- 前沿前端设计能力:可生成符合现代设计规范的网页页面与演示文稿,兼顾功能性与视觉表现力,大幅降低UI样式调试与迭代成本。
- 强健的工具调用能力:在交互式工具使用与网页信息检索类任务中展现出色效果,τ²-Bench达87.4%,BrowseComp达67.5分(启用上下文管理时),工具链整合效率和响应精度同步跃升。
- 进阶复杂推理能力:数学建模与多步逻辑推演能力显著增强,HLE基准得分达42.8%,相较GLM-4.6提升12.4个百分点,可胜任高难度算法题与跨领域分析任务。
- 动态化思考架构:引入交错式、保留式及轮级三种思考范式,使模型在长时间对话或深度任务链中保持上下文一致性与决策连贯性。
- 多模态协同与全栈支持:支持文本、代码、结构化数据等多类型输入输出,无缝集成Skills模块,助力构建端到端可运行、交互自然的应用系统。
GLM-4.7的关键性能指标
-
核心编码能力(Core Coding):
- SWE-bench Verified:73.8%,较GLM-4.6提升5.8%,刷新开源模型在真实软件修复任务上的最高纪录;
- SWE-bench Multilingual:66.7%,较GLM-4.6提升12.9%,多语言代码理解与生成能力全面跃升;
- Terminal Bench 2.0:41%,较GLM-4.6提升16.5%,终端环境下的指令解析与操作执行更加精准高效。
-
工具调用能力(Tool Using):
- τ²-Bench:87.4%,较GLM-4.6提升12.2%,成为当前开源体系中工具交互能力最强的模型之一;
- BrowseComp(基础网页浏览):52.0%,较GLM-4.6提升6.9%;在增强版BrowseComp(含上下文感知)中达67.5%,较前代提升10.0%,展现更强的信息定位与任务衔接能力。
-
复杂推理能力(Complex Reasoning):
- HLE(人类最后的考试):42.8%,较GLM-4.6提升12.4%,对抽象概念建模与跨学科推理的支持更上一层楼;
- MMLU-Pro:84.3%,较GLM-4.6提升1.1%,在专业领域知识覆盖与综合判断方面持续保持领先;
- GPQA-Diamond:85.7%,较GLM-4.6提升4.7%,面对高难度科学与工程问题展现出更高准确率与严谨性。

GLM-4.7官方资源入口
- 项目主页:https://www.php.cn/link/81474f79718fc0fa25ba9433b0838612
- GitHub源码仓库:https://www.php.cn/link/ffd0757ba0b05ad5f5b022217163f75a
- HuggingFace模型页:https://www.php.cn/link/4c1c58fb02a71eed1ab630821df3bf5a
GLM-4.7的典型应用场景
- 智能编程助手:面向软件工程师提供高质量、可运行的多语言代码片段,加速原型开发与Bug修复流程。
- UI/UX快速构建:辅助前端开发者与设计师快速产出响应式网页、PPT模板及交互原型,缩短视觉落地周期。
- 自动化任务编排:依托保留式与轮级思考机制,完成跨应用、多步骤的业务流程调度,如数据采集→清洗→分析→可视化全流程闭环。
- 编程教学与能力训练:为学习者提供带注释的示例代码、错因分析与解题思路引导,同时支撑数学建模、算法训练等教育场景。
- 智能办公提效:自动撰写会议纪要、生成数据分析脚本、整理结构化报告,显著减少重复性文档工作负担。










