小米机器人团队开源Xiaomi-Robotics-0模型,多场景测试成绩领先且动作连贯

   时间:2026-02-12 16:33 来源:天脉网作者:顾青青

小米机器人团队近日宣布,正式开源其研发的具身智能VLA模型——Xiaomi-Robotics-0。该模型以47亿参数的规模,通过MoT混合架构设计,将多模态VLM大模型与多层DiT结构深度融合,实现了通用理解能力与精细控制能力的平衡。这一技术突破为机器人领域带来了新的可能性。

在性能测试中,Xiaomi-Robotics-0展现了显著优势。该模型在Libero、Calvin和SimplerEnv等主流测试集上,与30种同类模型对比后均取得最优成绩,并首次在消费级硬件上实现了实时推理能力。这一成果意味着机器人无需依赖高端计算设备即可流畅运行复杂任务,大幅降低了技术落地门槛。

针对传统VLA模型普遍存在的推理延迟问题,研发团队创新性地采用异步推理模式与Λ-shape Attention Mask机制。这些技术使机器人在执行积木拆解、叠毛巾等精细操作时,能够保持动作连贯性并快速响应环境变化。例如,在叠毛巾任务中,模型通过实时调整抓取力度和路径规划,成功完成了传统算法难以实现的柔性物体操作。

该模型还保留了物体检测、视觉问答等跨模态预训练能力。通过统一架构设计,机器人既能理解自然语言指令,又能精准感知三维空间信息。这种多任务协同处理能力,为家庭服务、工业制造等场景的智能化升级提供了技术支撑。目前,相关代码已通过开源平台向全球开发者开放,有望推动具身智能技术的快速发展。

 
 
更多>同类天脉资讯
全站最新
热门内容
媒体信息
新传播周刊
新传播,传播新经济之声!
网站首页  |  关于我们  |  联系方式  |  版权隐私  |  RSS订阅  |  违规举报