在工业自动化领域,机器人能否胜任高精度操作一直是制约其广泛应用的关键瓶颈。近日,具身智能领域传来突破性进展:Physical Intelligence团队研发的RLT技术,通过为机器人添加"精细动作外挂",成功实现用十几分钟真实数据攻克拧微型螺丝、插网线等毫米级精度任务,部分场景效率甚至超越人类操作水平。
传统机器人训练面临两难困境:重新训练整个大模型需要海量算力和漫长周期,而直接部署又难以应对工厂场景中"差之毫厘谬以千里"的精度要求。以拧M3螺丝为例,螺丝刀尖与抓取点存在10厘米距离,手腕微小偏移都会导致刀尖产生数倍误差,更遑论从摄像头视角难以捕捉的接触过程。研究团队创新性地采用"主脑+外挂"架构,在保留VLA大模型通用能力的同时,通过RL token技术实现精准动作的局部强化。
这套系统的工作原理犹如为机器人配备"智能手术刀"。VLA大模型首先生成包含任务全局理解的RL token,这个高度压缩的信息摘要被输入到专门训练的Actor-Critic网络中。这两个轻量级神经网络采用off-policy强化学习,每秒可更新数百次,能根据实时试错数据快速调整动作策略。研究者特别设计了"动作块预测"机制,使强化学习策略与VLA的原始动作空间保持一致,通过"编辑修改"而非"推翻重建"的方式优化关键动作。
实验数据验证了技术的有效性。在拧螺丝、系扎带、插网线、插电源线四项任务中,装备RLT的机器人仅需15分钟真实数据训练,关键步骤速度提升300%,整体任务吞吐量(每10分钟成功次数)显著提高。特别在插网线任务中,强化学习策略完成的操作有一半速度超过人类远程操控记录,训练总时长2小时中仅有15分钟用于实际动作数据采集。
技术突破的关键在于三大创新设计:参考动作dropout机制防止模型过度依赖VLA原始输出,人类干预接口允许直接注入纠正动作,以及动作块预测确保策略调整与任务时序匹配。这种模块化设计使RLT成为可复用的"通用插件",无需针对不同任务重新设计,为工业机器人提供了"边干边学"的进化能力。当被问及技术落地前景时,研究团队展示的测试视频显示,机器人已能稳定完成亚毫米级精度的螺丝拧入动作,这标志着自动化设备向取代人类精密操作迈出关键一步。












