时事快闻

智谱GLM-4.7来袭：代码工具推理全升级，国产开源模型迈向新高度

时间：2025-12-23 23:15 来源：快讯作者：智东西

在人工智能领域，国产大模型正以惊人速度追赶国际顶尖水平。智谱最新发布的GLM-4.7开源模型，凭借在代码生成、工具调用和复杂推理等核心指标上的突破性表现，成功跻身全球开源模型第一梯队。根据Code Arena全球开发者盲测榜单，该模型在Web开发方向排名第六，超越GPT-5.2与Claude Sonnet 4.5，成为当前全球排名最高的开源模型，同时稳居国产模型榜首。

技术突破体现在多维度的性能跃升。在代码能力方面，GLM-4.7在SWE-bench Verified基准测试中取得73.8%的准确率，LiveCodeBench V6测试达84.9%，整体水平对齐Claude Sonnet 4.5。复杂推理任务中，HLE（人类水平考试）成绩在工具辅助条件下提升至42.8%，较前代提升超12个百分点，超越GPT-5.1 High版本。工具调用能力成为最大亮点，在τ²-Bench测试中取得87.4%的优异成绩，BrowseComp在开启上下文管理后提升至67.5%，展现出稳定的多轮交互能力。

这些提升源于内部思考机制的革新。模型在原有"交错思考"基础上，引入保留式思考与轮级控制机制。每次生成或调用工具前，系统会先进行独立推理，并在多轮任务中自动保留历史思考结果，避免重复推导。开发者可根据任务复杂度选择是否启用完整推理流程，在简单请求中降低延迟，在复杂任务中确保稳定性。这种设计显著提升了长任务执行的一致性，为代码智能体、终端任务和工具协同等场景提供技术支撑。

真实任务测试验证了模型的工程价值。在覆盖前端开发、后端逻辑和指令遵循的100个编程任务中，GLM-4.7前端任务胜率达64.6%，指令遵循场景胜率58.3%，后端复杂任务胜率稳定在46.7%。更值得关注的是多模态技能调度能力，通过全新Skills模块，模型可统一调度ASR语音识别、TTS语音合成和GLM-4.6V视觉模型，实现跨模态工具链的完整闭环。

在Z.ai平台的实测中，模型展现出惊人的交互创造力。测试人员要求生成"3D圣诞树炸开成照片墙"的交互场景，模型输出完整HTML代码，构建出由5000多个粒子组成的立体圣诞树，顶部带有辉光星星。通过摄像头识别手势动作，用户张开手掌时圣诞树炸开为悬浮照片墙，握拳时重新收缩为树形，整个过程伴随流畅的粒子动画和UI反馈。更令人惊喜的是，代码中集成了InstancedMesh渲染优化技术，在不依赖构建工具的情况下保持高帧率运行。

另一个测试案例中，模型1:1复刻iOS主界面，不仅实现Safari、健康等图标的点击交互，日历、计算器等功能页也能正常操作。在双人格斗游戏测试中，生成的界面高度还原Switch手柄配色布局，左侧蓝色手柄对应键盘AD移动、JK攻击，右侧红色手柄对应UIO技能释放，中间主屏幕显示动态血条和波次信息，完整构建出游戏框架。

开源社区的热烈反响印证着模型的市场价值。GLM系列代码全球下载量已突破6000万次，付费API使用量长期位居OpenRouter全球前十。随着智谱即将登陆港交所，这款模型的发布不仅标志着技术实力的突破，更成为国产大模型从实验室走向产业应用的关键转折点。当开源模型开始主导开发者工具链，当国产技术开始定义行业标准，人工智能领域的竞争格局正在发生深刻变革。

更多>同类天脉资讯

便携学习机怎么选？听力熊T8、海尔听力宝等四款热门产品深度测评来助力

音悦宝则适合希望多样化学习方式的家庭，但在音质和续航上需要进一步提升。综合来看，听力熊T8在各个方面的表现相对均衡，是一款非常适合孩子的学习机。家长在选择时，可以根据孩子的具体需求进行权衡，但听力熊T8无疑…

02-26

监管正式批复！王付彪获任长城华西银行董事及董事长一职

02-26

2月27日晚7点半，雷军携研发团队直播，揭秘小米汽车安全设计

02-26

恒生科技ETF半日成交活跃，电网设备概念持续升温3只相关ETF涨超3%

02-26

A股通信电子领涨多股涨停新股通宝光电大涨港股万咖壹联业绩飙升

02-26