时事快闻

邬贺铨：2026年推理算力将占主导，智能体驱动云网算全面升级

时间：2026-04-17 21:32 来源：快讯作者：周琳

随着人工智能与大模型技术的飞速发展，智能体正成为科技界和产业界的焦点。中国工程院院士邬贺铨指出，到2026年，全球推理算力将占据AI算力总负载的70%至80%，而中国的推理需求预计将达到训练需求的8倍。这一趋势标志着算力的应用正从训练主导转向推理和智能体主导，推动算力架构、应用场景和商业模式发生深刻变革。从单轮生成到多步规划，从被动问答到主动任务执行，智能体正在重新定义AI的应用边界。

智能体并非传统意义上的主机，而是一种基于大模型的能力和资源。单个智能体通过感知、记忆、规划、工具调用和行动执行形成闭环，能够独立完成特定任务的决策和操作。然而，单一智能体的应用边界和能力上限较为有限，难以处理复杂目标。为突破这一局限，多智能体协同系统应运而生。在统一协调器的调度下，相关智能体可以共享记忆、进行高级规划和反思，从而涌现出集体智能，处理更复杂的任务。

多智能体的规模化互联进一步催生了智能体互联网（IoA）。与传统互联网实现主机和信息互联不同，IoA扩展为智能体和能力的互联。它以IPv6+为基础，叠加新应用层协议，实现智能体的唯一标识、自主发现、可信交互和协同执行。智能体互联网的顶层支撑是智能体即服务（AaaS），它将智能体和智能体群的能力云化封装，通过API、SDK和低代码平台对外提供服务，支持租户化、弹性调度和按需计费。

在面向消费者的（To C）领域，智能体主要有三种应用模式。第一种是云上APP寄生智能体，它强依赖微信、钉钉等宿主APP，依托云端算力运行，断网后不可用。这类智能体作为APP内的AI插件，能够基于用户偏好自动完成操作，将聊天工具升级为具备“思考、写作、读文件、控设备”能力的智能助手。第二种是终端OS原生智能体，预装于手机操作系统，如中兴通讯与字节跳动联合推出的豆包手机。它采用端云协同模式，可按用户意图调度APP并自动执行业务流程，但可能因过度主动而违背用户临时意愿。第三种是本地自治+云端辅助的智能体，如以“龙虾”为代表的AI私人管家。它不依赖APP，但需手动安装独立PC软件，决策和权限管理本地化，通过云上AaaS发现并协同其他智能体。

在面向企业（To B）的领域，智能体的应用模式更为多样。流程自动化智能体通过复刻人工逻辑，替代生产、运维等标准化流程，提升效率。行业专家智能体依托行业知识库和知识图谱，为企业提供决策参谋方案。多智能体协同模式整合供应链、生产和物流等领域的智能体，实现跨环节协同。具身智能则支撑工业机器人等实体设备，完成感知、推理和物理执行的闭环。

智能体的发展对算力、云和网络提出了颠覆性要求。与传统互联网业务相比，智能体业务的驱动主体从人工操作变为机器自主循环，运行时间从昼夜分明变为7×24小时不间断，空间分布从集中式变为多点网状调用。智能体的会话从短对话变为长上下文，流量从平稳变为“Token核爆”式增长，单智能体的Token消耗可达普通用户的10至1000倍。

邬贺铨表示，智能体对算力的需求推动了专用加速器的普及，如GPU和NPU。多智能体需同时占用多个隔离的“沙箱/进程”，并发密度激增，对显存和带宽提出极高要求。尽管Token流量年增速高达330%，但通过小模型普及、极致压缩和长上下文优化，未来5年算力增速可控制在41%左右，实现效率与成本的平衡。

在云服务领域，智能体时代要求构建智能体原生云，优先布局智能体原生架构，构建全局智能调度，搭建分布式记忆和向量引擎，深化“云—边—端”协同。这一趋势正在重塑中国云服务格局，AI云全栈服务迎来爆发，市场向智算融合、绿色低碳和国产深化升级。

网络层面，智能体的长会话持续交互、多智能体协同通信等特征，使网络流量从南北向为主转为东西向占比80%，QPS提升10至100倍。网络架构需从行政区组网转向智算中心—区域云—边缘—终端四级架构，采用SRv6、云网虚拟化与编排技术、流量AI预测与调度等技术，保障确定性与高可靠性。

更多>同类天脉资讯

液冷概念热度攀升！多家公司透露布局进展，部分产品配套英伟达产业链引关注

07-13

品牌营销新变革：从定位广告到思想传播，精准触达消费者灵魂

07-12

195亿拆分背后：必胜客全球与中国“分道扬镳”，中国市场新故事启幕

07-12

美光CEO深度剖析：AI时代存储器如何成为智能进化的核心引擎

07-12