在国际消费电子展(CES)这场全球瞩目的“科技盛宴”上,英伟达创始人黄仁勋抛出了一个引发广泛讨论的观点:物理AI的“ChatGPT时刻”即将来临。这一论断并非孤立存在,北京智源人工智能研究院发布的《2026人工智能十大趋势》报告也给出了相似判断——人工智能的发展重心正从单纯追求语言模型的参数规模,转向对物理世界底层规律的理解与建模,行业技术范式迎来重大变革。
智源研究院院长王仲远在发布会上强调,基础模型竞争的焦点已从“参数规模”转变为“对世界运行规律的理解”。AI正从“预测下一个词”向“预测世界下一个状态”跨越,这意味着AI的演进方向正发生结构性转变。以“下一状态预测”(NSP)为代表的新机制,正推动AI从感知数字世界,迈向理解并规划物理世界的因果变化。
在这份指引行业未来的报告中,蚂蚁集团作为产业实践的典型代表被多次提及。其在AI大模型、超级应用、AI安全等关键领域的系统性布局和扎实成果,为报告所预测的未来提供了生动的实践案例。
报告指出,2026年将成为AI从数字世界向物理世界拓展、从技术演示走向规模应用的关键转折点。这一转变背后,有三条主线值得关注:首先是AI的认知方式发生了变化。过去,AI主要擅长处理静态的语言和图像数据,如今则开始尝试预测“下一步会发生什么”。以世界模型和NSP为代表的新方向,让AI不再局限于识图识话,而是要理解物体的运动规律和行为演化,为自动驾驶仿真、机器人学习等物理任务提供“预判力”。
其次是AI的形态发生了改变。AI正从代码形态转变为能走能动的机器人形态,从单打独斗的智能体转变为可以分工协作的“AI团队”。通用人形机器人开始走进工业场景,不再局限于实验室研究。在软件层面,多智能体(MAS)之间的标准化通信协议逐渐成型,使得AI之间能够像人类团队一样完成科研、工业等复杂任务。
最后是AI创造价值的方式发生了变化。在消费端,一个集多种功能于一体的超级应用入口正在形成,成为科技巨头竞争的焦点。在企业端,AI正凭借完善的数据治理和行业标准接口,在垂直领域孕育出真正具有商业价值的产品(MVP),越过早期概念验证的“幻灭期”。
从技术前沿来看,四大趋势正在重塑AI的基础能力。一是世界模型成为通用人工智能(AGI)的共识方向,NSP有望成为新的技术范式。行业共识正从语言模型转向能够理解物理规律的多模态世界模型,NSP标志着AI开始掌握时空连续性和因果关系,从感知走向认知。二是具身智能迎来行业洗牌,产业应用进入广泛工业场景。具身智能正从实验室演示阶段进入产业筛选和落地阶段,随着大模型与运动控制、合成数据的结合,人形机器人有望在2026年突破演示阶段,进入真实的工业和服务场景。三是多智能体系统决定应用上限,Agent时代的“TCP/IP”初具雏形。复杂问题的解决依赖多智能体协同,随着MCP、A2A等通信协议趋于标准化,智能体之间拥有了通用“语言”,多智能体系统将突破单体智能的局限,在科研、工业等复杂工作流中发挥关键作用。四是AI Scientist成为AI for Science(AI4S)的核心目标,国产科学基础模型正在孕育。AI在科研中的角色正从辅助工具升级为自主研究的“AI科学家”,构建自主的科学基础模型体系已成为紧迫的国家战略需求。
在产业落地方面,AI时代的“新BAT”格局逐渐清晰,垂直赛道仍存在高盈利机会。C端AI超级应用的“All in One”入口成为巨头竞争的焦点。海外以OpenAI的ChatGPT和Google Gemini为代表,通过深度集成各类服务,塑造了一体化智能助手的新范式。国内字节、阿里、蚂蚁等企业也依托自身生态积极布局。蚂蚁推出的“灵光”和“阿福”分别成为通用入口和垂类场景的典型案例。“灵光”是一款全模态AI助手,精准解决了AI应用“重聊天、轻行动”的痛点。上线首周下载量突破200万,其核心功能“闪应用”允许用户通过自然语言快速生成可交互的轻应用,大幅降低了开发门槛,推动了“全民手搓AI应用”的风潮。其全模态信息生成能力提升了交互效率和体验的“信息美感”,满足了用户对AI实用性的需求。“阿福”则聚焦医疗健康领域,定位为“AI健康朋友”。目前,其App月活用户已突破3000万,单日健康问答量超过1000万。为了让健康服务更专业、可信,阿福自研专用底座大模型,并与全国院士、名医深度合作,连接了超5000家医院资源、50万真人医生和500位名医AI分身,形成了从专业问答到医疗服务的完整闭环。
企业级AI应用在经历概念验证热潮后,正因数据、成本等问题进入“幻灭低谷期”。但随着数据治理和工具链的成熟,预计2026年下半年将迎来转折,一批真正具有商业价值的MVP产品将在垂直行业实现规模落地。
在关键支撑领域,蚂蚁集团在推理和安全方面进行了系统性布局。合成数据占比不断攀升,有望解决高质量真实数据枯竭的问题。修正扩展定律为合成数据提供了理论支持,尤其在自动驾驶和机器人领域,由世界模型生成的合成数据将成为降低训练成本、提升性能的关键资产。推理优化仍有很大提升空间,“技术泡沫”的说法并不成立。推理效率仍是AI大规模应用的核心瓶颈和竞争焦点,通过算法创新和硬件变革,推理成本持续下降,能效比不断提升,使得在资源受限的边缘端部署高性能模型成为可能,这是AI普惠的关键前提。蚂蚁百灵大模型体系就是这一趋势的典型代表,其涵盖了Ling(语言)、Ring(思考)、Ming(多模态)三大系列。语言模型Ling系列采用高稀疏度MoE等高效架构,基于二十万亿Tokens语料训练,并推出了包含万亿参数模型Ling-1T与Ring-1T在内的完整产品矩阵。蚂蚁团队首创的“棒冰算法(icepop)”有效提升了模型稳定性,百灵大模型在Hugging Face等社区榜单上表现优异,其中Ling-1T曾持续登顶总榜,展现了强大的工程实力和社区认可度。
为打破算力垄断和供应风险,构建兼容异构芯片的软件栈至关重要。繁荣的算子语言和趋于收敛的编译器技术正在降低开发门槛,以智源FlagOS为代表的平台致力于构建软硬解耦、开放普惠的AI算力底座。AI安全风险已从“幻觉”演变为更隐蔽的“系统性欺骗”。技术上,Anthropic的回路追踪研究致力于从内部理解模型机理,OpenAI推出自动化安全研究员。产业上,智源研究院联合全球学者发布AI欺骗系统性国际报告,警示前沿风险,安全正成为AI系统的内在属性。蚂蚁集团在此领域构建了贯穿线上与终端的立体防线,其推出的大模型安全解决方案“蚁天鉴”已升级为面向智能体时代的一体化安全解决方案,基于“以攻促防”的安全理念,构建了“对齐-扫描-防御”技术栈,形成全流程防护体系。面对AI眼镜等新一代智能终端快速增长带来的安全挑战,蚂蚁发布的全球首个智能终端可信连接技术框架gPass,具备“安全、交互、互连”三大核心能力,支持AI眼镜与智能体之间的实时可信通信,打通用户与设备、模型与服务之间的安全连接链路,为AI眼镜厂商与开发者提供统一、安全的底层架构,构建面向个人智能体时代的安全AI数字服务生态。













