MiniMax启动上市辅导又推M3大模型,自研架构助力性能与性价比双提升

   时间:2026-06-02 22:49 来源:快讯作者:上观新闻

上海科技企业MiniMax近日成为行业焦点,这家同时已在港交所上市、且不久前启动A股上市辅导的公司,于6月1日正式推出新一代通用大模型MiniMax M3。该模型以解决长文档处理、复杂代码推理等场景中的效率痛点为目标,成为国内首个同时具备超长上下文、原生多模态与前沿编程能力的"三合一"模型。

在核心能力构建上,M3展现出显著技术突破。其100万token的上下文窗口容量可容纳两部中文长篇小说,通过自研的稀疏注意力架构MSA(MiniMax Sparse Attention),将长文本处理成本降低至传统模型的二十分之一。这种技术架构创新使模型在处理法律文书、科研论文等长文本时,能保持更完整的信息链路,同时支持多轮任务协作与复杂代码仓库管理。

多模态能力成为M3的显著优势。不同于传统模型后期叠加视觉功能的开发路径,该模型从训练阶段就实现文字、图像、视频的混合训练,形成原生多模态处理能力。在编程能力评测中,M3在SWE-Bench Pro基准测试中超越GPT-5.5与Gemini 3.1Pro,与Anthropic公司4月发布的Claude Opus 4.7形成直接竞争态势。尽管尚未在综合性能上实现全面超越,但其开源策略与成本优势已引发行业关注。

全球大模型竞争已进入深水区,智能体任务复杂度提升带来的技术挑战愈发凸显。行业观察指出,当Agent需要处理跨领域、长周期任务时,模型的长上下文记忆能力、稳定推理性能与成本控制成为关键竞争要素。M3通过MSA架构实现的百万级上下文窗口,配合显著降低的计算成本,为复杂任务处理提供了新的技术路径。

这家上海企业的研发节奏持续加快。自2023年6月发布M1模型后,公司保持每季度迭代新版本的频率,相继推出M2、M2.1及今年2月的M2.5模型。此次M3的发布,不仅延续了高频迭代策略,更在核心技术指标上实现跨越式发展。其自研的稀疏注意力架构已形成技术壁垒,为后续模型升级奠定基础。

 
 
更多>同类天脉资讯
全站最新
热门内容
媒体信息
新传播周刊
新传播,传播新经济之声!
网站首页  |  关于我们  |  联系方式  |  版权隐私  |  RSS订阅  |  违规举报 鲁公网安备37010202700497号