小米MiMo大模型三连更!神秘模型现真身,还能免费体验养虾新玩法

   时间:2026-03-20 00:18 来源:快讯作者:智东西

小米公司今日宣布,其自主研发的MiMo大模型系列迎来重大更新,推出旗舰基座大模型MiMo-V2-Pro、全模态Agent模型MiMo-V2-Omni以及语音合成大模型MiMo-V2-TTS。此次更新聚焦于提升智能体能力,旨在为用户提供更高效、更智能的交互体验。

MiMo-V2-Pro作为旗舰基座模型,总参数量超过1T,激活参数量达到42B,支持100万上下文长度。该模型在编程Agent、通用Agent和工具使用方面展现出强大能力,性能与Claude Sonnet 4.6、GPT 5.2、Gemini 3.0 Pro等国际领先模型相近。在OpenClaw标准评测榜单PinchBench和Claw-eval上,MiMo-V2-Pro排名第三,仅次于Claude Sonnet 4.6和Claude Opus 4.6。MiMo-V2-Pro的API定价仅为Claude Opus 4.6的1/5,具有显著的价格优势。

全模态基座模型MiMo-V2-Omni则专注于多模态交互与执行场景,支持文本、视觉、语音全模态输入。该模型在音频理解、图像理解和视频理解方面均表现出色,能够跨模态理解复杂环境、自主制定并执行计划,并在遇到异常时实时修正策略。例如,MiMo-V2-Omni可以像人一样操控浏览器,根据用户指令在小红书查找信息、在京东比价下单,甚至与客服砍价。该模型还支持接入WPS Office,通过自然语言指令直接生成Word、Excel、PPT和PDF等文档。

语音合成大模型MiMo-V2-TTS则致力于让智能体拥有更自然、更富有情感的声音。该模型基于小米自研的Audio Tokenizer和多码本语音-文本联合建模架构,经过上亿小时语音数据的大规模预训练和多维度强化学习,实现了高度可控的多粒度语音风格控制。MiMo-V2-TTS支持多方言、多角色、多语气生成,能够智能识别文本中的标点符号、语气词和强调标记,并将其转化为恰当的语音表达。该模型还支持高质量的歌声合成,让智能体既能说、能演,也能唱。

据悉,MiMo-V2-Pro和MiMo-V2-Omni的早期测试版曾以匿名模型Hunter Alpha和Healer Alpha的身份在全球最大API聚合平台OpenRouter上引发热议,其API调用量多天登顶日榜。目前,这两个匿名模型仍在OpenRouter向开发者免费开放。MiMo-V2-Pro和MiMo-V2-Omni还将联合OpenClaw、OpenCode、KiloCode、Blackbox及Cline等智能体开发框架团队,为全球开发者提供为期一周的限时免费接口支持。

 
 
更多>同类天脉资讯
全站最新
热门内容
媒体信息
新传播周刊
新传播,传播新经济之声!
网站首页  |  关于我们  |  联系方式  |  版权隐私  |  RSS订阅  |  违规举报 鲁公网安备37010202700497号