机器人麻将高手亮相,灵初智能展现具身智能新突破
在科技日新月异的今天,一场别开生面的麻将对局引发了广泛关注。与人类同桌竞技的,并非普通牌友,而是一台由灵初智能公司研发的机器人。在长达30分钟的比赛中,这台机器人不仅动作灵巧,能够精准完成摸牌、翻牌等操作,更凭借自主构建的出牌策略,与人类对手斗智斗勇,场面令人叹为观止。
这场对局的背后,是灵初智能强化学习算法模型Psi R1的强大支撑。作为全球首个支持“动作感知-环境反馈-动态决策”全闭环的端到端具身VLA(视觉语言动作)模型,Psi R1展现了机器人在开放场景下处理长程复杂任务的能力。从春晚的丢手绢表演,到地库中的自行车骑行,再到如今的麻将对局,具身智能领域不断传来令人振奋的消息。
灵初智能的创始人兼CEO王启斌,在近期的一次访谈中分享了对公司发展方向的独到见解。他表示,灵初智能并不追求表面的光鲜亮丽,而是致力于用稳定、低价的产品解决实际问题。成立于2024年的灵初智能,汇聚了一支由王启斌、斯坦福大学访问学者陈源培,以及拥有丰富机器人及无人驾驶算法经验的柴晓杰博士组成的精英团队。
尽管在具身智能领域的“群雄逐鹿”中,灵初智能看似姗姗来迟,但王启斌却对此持乐观态度。他强调,灵初早在2022年便开始布局相关技术,且针对VLA模型和灵巧手操作的定位,此时入局并不算晚。作为硬件领域的资深专家,王启斌凭借在京东和云迹机器人等公司积累的产业经验,为灵初智能选择了“双臂轮式机器人”这一务实的产品形态。
在访谈中,王启斌还透露了灵初智能的海外拓展计划。他表示,公司目前已与多家海外物流客户建立合作,并计划在半年内将产品交付至欧美仓库。这一消息无疑为灵初智能的国际化进程注入了强劲动力。
具身智能的浪潮中,操作技术一直是机器人领域的难点。从简单的视觉语言模型(VLM)到如今的视觉语言动作模型(VLA),机器人从能看懂、能听懂,逐渐迈向了能做好。VLA模型不仅能够解析图像和文本信息,还能通过动作解码器直接输出动作路径,使机器人具备了类人推理和全局理解能力。王启斌认为,正是这种长程操作的机制和能力,让机器人在半开放、动态变化的环境中能够观察、决策、判断并执行操作,最终达到人类期望的结果。
谈及麻将对局的意义,王启斌表示,这不仅是展示灵初智能技术实力的一种方式,更是向外界传达了公司有能力在开放环境中进行长程操作的信号。他强调,无论是麻将机器人还是未来的陪伴型机器人,其本质都是为了解决商超、物流等场景中的实际问题。
面对资本市场的变化,王启斌坦言,相比去年,当下投资人对具身智能的商业化期待更加明确。灵初智能正站在风口浪尖,以稳健的步伐推动具身智能技术的落地和应用。