在探讨人工智能(AI)未来发展方向的高端对话中,商汤科技领军人物徐立在2025世界人工智能大会(WAIC)上发表了深刻见解。
徐立以“人工智能的十年演进”为主题,深入剖析了AI从感知智能迈向生成式智能的关键跨越。他指出,人类智能的核心在于与物理世界的不断交互,而机器智能的发展长期受限于人类知识的有限输入。
回顾历史,徐立提到,2011至2012年间,深度学习算法如CNN和ResNet的兴起,推动了感知智能的爆发。然而,这些模型高度依赖人工标注数据,泛化能力有限。随后,2017至2018年,Transformer架构的出现,让AI学会了从自然语言中提取知识,其中GPT-3处理的文本量惊人,相当于人类十万年的创作积累,这一突破成为通用AI发展的关键。
然而,徐立也提出了当前的危机:自然语言数据可能在2027至2028年间耗尽,而视觉数据虽然丰富,但难以有效提炼知识,其产生速度远落后于算力的增长,形成了数据需求的“倒挂”现象。
面对这一挑战,徐立将目光投向了人类的学习方式——通过与物理世界的交互获得认知。他认为,AI的下一阶段发展,需要突破“主动交互数据稀缺”的瓶颈,而这一点正是当前机器人和具身智能发展的关键障碍。
徐立进一步解释,真实环境的交互成本高昂,传统解决方案依赖模拟器,但存在模拟与现实之间的差距。例如,当前视频生成模型可能产生违反物理规律的画面,如车辆“幽灵穿越”等,这些缺陷使得生成数据难以直接应用于现实场景。
为了解决这个问题,商汤科技推出了“开悟”世界模型。徐立表示,“开悟”不仅是一个视频生成模型,更重要的是它考虑了时间和空间的一致性,能够为AI训练提供高质量模拟数据,从而帮助AI更好地理解现实世界。
徐立强调,AI的发展需要经历从感知世界到理解世界,再到生成世界,并最终与现实硬件交互的过程。他呼吁业界共同努力,推动AI技术的不断进化,以改变我们的世界。
徐立的演讲不仅为AI的未来指明了方向,也激发了与会者对AI技术发展前景的深刻思考。