阿里千问Qwen3.7-Max发布:国产模型登顶,35小时自主完成硬核硬件优化

   时间:2026-05-21 05:49 来源:快讯作者:PConline太平洋科技

阿里巴巴在近期举办的阿里云峰会上,正式发布了其千问大模型系列的最新旗舰版本——Qwen3.7-Max。这一版本在智能体能力与推理性能方面实现了全面提升,并在Arena全球大模型盲测总榜中荣登国产模型榜首,综合实力已接近国际顶尖模型如GPT、Claude和Gemini。这标志着千问系列在近三个月内完成了第三次重大迭代,进一步巩固了其在全球人工智能领域的地位。

Qwen3.7-Max作为一款专为智能体场景优化的大模型,在多个权威测评中取得了突破性进展。在编程领域,该模型在SWE-Pro、SWE-Multilingual等智能体测评中表现卓越,Terminal Bench 2.0-Terminus得分高达69.7,超越了DeepSeek-v4-pro-Max、Claude-Opus4.6等国际主流模型。在通用智能体能力方面,Qwen3.7-Max在MCP-Atlas、MCP-Mark、Skillbench等贴近真实场景的测试中,表现优于GLM5.1、Kimi-K2.6等模型,刷新了国产模型的最佳成绩。

在推理与通用能力方面,Qwen3.7-Max同样表现亮眼。在高难度推理测评如GPQA Diamond、HLE、HMMT 2026 Feb中,该模型超越了Claude-Opus4.6及所有国产模型。在指令遵循测试IFBench中,Qwen3.7-Max斩获79.1分,同时在多语言测评WMT24++、MAXIFE中保持领先地位,展现了其强大的语言理解和处理能力。

尤为引人注目的是,Qwen3.7-Max成功完成了35小时的全自主硬件优化任务。在全新平头哥真武M890芯片平台上,该模型从零开始独立完成内核编写、编译、性能分析与迭代优化,全程执行了432次内核评估和1158次工具调用。最终,Qwen3.7-Max实现了较官方参考实现10倍的性能提升,并自主发起了关键架构重构,展现出接近人类工程师的长期自主工作能力。

Qwen3.7-Max还具备优秀的跨框架泛化能力,支持多智能体协同工作。在办公自动化场景SpreadSheetBench-v1中,该模型取得了87分的顶尖成绩,进一步证明了其在复杂任务处理中的高效性和可靠性。阿里云透露,Qwen3.7-Max的API即将登陆百炼平台,未来还将推出Qwen3.7-Plus等版本,全面覆盖编程、视觉、办公等全场景智能体需求,为用户提供更加全面和高效的人工智能解决方案。

 
 
更多>同类天脉资讯
全站最新
热门内容
媒体信息
新传播周刊
新传播,传播新经济之声!
网站首页  |  关于我们  |  联系方式  |  版权隐私  |  RSS订阅  |  违规举报 鲁公网安备37010202700497号