商汤科技董事长兼CEO徐立博士在近期的一次行业演讲中,深入剖析了当前人工智能领域的发展态势与未来走向。他指出,人工智能的最新发展浪潮主要得益于生产方式的重大变革,具体体现在从GPT到scaling law的演进、复杂任务的精细化分解以及推理成本的显著降低。
徐立博士强调,过去两年中,每个token的推理成本以惊人的280倍速度下降,这一变化为人工智能的广泛应用奠定了坚实基础。然而,他也坦诚地指出,当前AI行业正面临着专业思维数据稀缺的挑战。随着互联网语料价值的逐渐耗尽,模型能力的提升愈发依赖于高质量的思维数据,但这类数据的获取不仅困难且成本高昂。AI在处理长链条、复杂任务时,仍存在幻觉和逻辑错误的问题,即便是最先进的模型,其实际幻觉率也超过10%,这在严肃的应用环境中构成了难以忽视的障碍。
对于大模型的发展前景,徐立博士认为,2025年将是一个关键转折点,原有的发展路径已接近极限,而新的机遇正悄然浮现。他预测,未来两年将是AI竞争的决定性时期,AI的成熟度能否突破工业红线、成功落地生产环境并实现规模化商业闭环,将成为衡量其成功与否的重要标准。
在演讲中,徐立博士还详细阐述了商汤科技在应对这些挑战方面的策略与布局。他强调,芯片与模型的深度联动将是推动AI商业化闭环的关键。通过算法与芯片的联合优化,国产化芯片有望迅速缩小与世界领先水平的差距。
徐立博士进一步解释了AI研究范式的转变。他指出,从GPT到scaling law的演进,使得人们能够在训练时预测不同资源投入下模型的性能,从而引发了大规模的资本投入竞争。然而,随着这条路径性价比的逐渐降低,人们开始发现,在推理时刻引入激励模型能够继续推动测试的扩展,进而引发应用推理架构、训推配比以及CPU、GPU和内存配比的深刻变化。
尽管如此,徐立博士也承认,这一部分的红利很快被消耗殆尽,因为行业内能够提供优质激励模型的场景并不多见。因此,他预测未来AI的发展将呈现两条分化路径:一条是在垂直产业中寻找优质的激励模型,形成价值闭环;另一条则是探索新的架构,以更好地利用现有数据。
在谈到AI在行业应用中的渗透时,徐立博士表示,随着生成式人工智能的兴起,AI的赋能边界得到了极大拓展,其成长速率也显著加快。然而,这也带来了新的挑战,即在行业应用急速增长、渗透率快速迭代的情况下,如何实现推理的高效性成为了一个亟待解决的问题。
针对这一挑战,徐立博士提出了AI in行业的新融合方法,强调AI与行业生产过程的紧密耦合。他认为,通过构造新的强化学习逻辑,使AI与行业生产紧密结合,能够完成用户价值闭环的叠加。而这一过程对AI基础设施的建设提出了更高要求。
在演讲的最后部分,徐立博士还分享了商汤科技在多模态模型研发方面的最新进展。他介绍说,商汤的日日新模型从底层解决了模态融合的问题,通过将语言、文本、图像、视频和3D信息融合到神经元中,实现了跨模态数据之间的联合分布红利。这一创新不仅提升了模型的融合度,还为AI在视频生成、空间智能等领域的应用开辟了新的道路。












