阿里Qwen3.5马年首发三款中型模型,35B以小博大,开发者成本直降

   时间:2026-02-26 00:10 来源:快讯作者:孙明

阿里近日正式推出Qwen3.5中型模型系列,包括Qwen3.5-122B-A10B、Qwen3.5-35B-A3B和Qwen3.5-27B(Dense)三款开源模型,同时Qwen3.5-Flash(基于35B-A3B的生产版本)API已在阿里云百炼平台上线。这一系列模型的发布,标志着阿里在大模型领域持续发力,进一步缩小了中型模型与前沿模型的差距。

在12项核心能力测评中,Qwen3.5系列模型在通用推理、数学、智能体和多模态等多个维度展现出强劲实力,整体表现可与国际一流模型如GPT-5 mini和Claude Sonnet 4.5相媲美。其中,Qwen3.5-35B-A3B尤为引人注目,其性能超越了参数规模大数倍的Qwen3-235B-A22B-2507和Qwen3-VL-235B-A22B,证明了架构优化和数据质量的重要性。

开发者社区对这一系列模型给予了高度评价。多位开发者指出,这些模型尺寸适中,非常适合本地推理,实现了“更小模型、更强性能”的目标。有开发者估算,使用Qwen3.5-35B-A3B可将每月成本从2000欧元(购买Gemini服务)大幅降低至50欧元,显著节省了开支。Qwen3.5-Flash作为托管生产版本,主打快速响应和强大性能,每百万Token价格低至0.2元,支持1M超长上下文长度,满足了长文档和复杂任务处理的需求。

具体来看,Qwen3.5-122B-A10B是一个综合能力突出的模型,适合多模态、视频和多语言场景。在知识维度上,它在专业领域知识与推理、多语言与多领域知识以及研究生级知识与推理三项测评中均取得最高分。Qwen3.5-35B-A3B则专注于智能体深度能力,适用于智能体规划、深度推理和任务调度,尤其在空间智能方面表现出色。Qwen3.5-27B(Dense)主打轻量化部署,工程实用度高,在交互、编程、长文本和数学方面表现优异。

在编程能力方面,Qwen3.5-27B在SWE-bench Verified测评中取得最高分,展示了其在真实软件工程问题解决上的强大能力。而在通用智能体维度上,Qwen3.5系列在多项测评中取得领先成绩,特别是在智能体任务执行与适配能力以及智能体深度规划与逻辑推演能力方面表现突出。

多语言能力是Qwen3.5-122B-A10B的另一大亮点。在多模态能力方面,该模型在通用VQA领域表现强势,拿下了多项最高分。Qwen3.5-27B则在多模态幻觉抑制与事实一致性能力以及学术文档的理解与检索能力等评测中表现最佳。在空间智能和视频理解方面,Qwen3.5系列同样实现了全维度领跑,特别是在带字幕的视频多模态理解能力和视频与语言结合的跨模态理解能力方面表现尤为出色。

与上一代旗舰模型Qwen3相比,Qwen3.5在多个方面进行了增强。它采用了统一视觉语言基础,实现了跨代对等,并在推理、编码、Agent和视觉理解基准测试中优于Qwen3-VL模型。高效混合架构和可扩展的强化学习泛化技术使得Qwen3.5在保持高吞吐量推理的同时,最大限度地减少了延迟和成本开销。Qwen3.5还扩展了全球语言覆盖范围,支持201种语言和方言,并具备细致入微的文化和区域理解能力。下一代训练基础设施的引入则进一步提高了多模态训练效率,支持大规模代理支架和环境编排。

 
 
更多>同类天脉资讯
全站最新
热门内容
媒体信息
新传播周刊
新传播,传播新经济之声!
网站首页  |  关于我们  |  联系方式  |  版权隐私  |  RSS订阅  |  违规举报 鲁公网安备37010202700497号