阿里Qwen3.6-Plus实测:8分钟建站显实力,复杂路径规划待优化

   时间:2026-04-03 11:51 来源:快讯作者:智东西

阿里正式推出新一代大语言模型Qwen3.6-Plus,作为Qwen3.6系列的首款产品,该模型在编程能力、智能体构建和工具调用方面实现显著提升,并支持100万上下文窗口的默认配置。这一模型已适配主流智能体框架,包括OpenClaw、Qwen Code等工具链,为开发者提供更灵活的集成方案。

在编程能力测试中,Qwen3.6-Plus在SWE-bench Verified、Terminal-Bench 2等基准测试中超越GLM-5和Kimi K2.5,但部分指标仍落后于Claude Opus 4.5。实测显示,该模型可在8分钟内完成AI眼镜独立站开发,消耗2.5万token,成本约0.15元。生成的网页设计规避了传统AI风格,但在字体选择上仍显保守。

多模态能力方面,Qwen3.6-Plus重点优化了推理与指令实用性。在北京地铁路径规划测试中,模型成功规划大兴机场至首都机场的最优路线,与高德地图结果一致。当模拟某线路因极端天气停运时,模型虽给出换乘建议,但存在昌平线与19号线换乘时间错误的技术瑕疵。

该模型还展示了视觉编程能力,可根据界面截图或设计稿自动生成前端代码。在《潜水员戴夫》游戏开发测试中,模型拒绝直接生成可执行文件,但提供了包含美术设计、开发指南和基础代码的完整方案。通过API调用时,模型设计了森林主题模拟经营游戏,但可玩性仍需迭代优化。

Qwen3.6-Plus的API已开放调用,输入/输出token价格分别为4元/百万和12元/百万,当前享受五折优惠。新引入的"preserve_thinking"功能可保留多轮对话的思维链,特别适用于智能体任务。企业级应用"悟空"已第一时间接入该模型,阿里云百炼平台同步上线相关服务。

据研发团队透露,Qwen3.6系列后续将开源更小规模版本,并推出性能更强的旗舰模型Qwen3.6-Max。自Qwen3.5发布以来,团队已将主力模型全面转向原生多模态架构,致力于构建能在真实环境中持续感知、推理和行动的智能体系统。

 
 
更多>同类天脉资讯
全站最新
热门内容
媒体信息
新传播周刊
新传播,传播新经济之声!
网站首页  |  关于我们  |  联系方式  |  版权隐私  |  RSS订阅  |  违规举报 鲁公网安备37010202700497号