随着人工智能与大模型技术的飞速发展,智能体正成为科技界和产业界的焦点。中国工程院院士邬贺铨指出,到2026年,全球推理算力将占据AI算力总负载的70%至80%,而中国的推理需求预计将达到训练需求的8倍。这一趋势标志着算力的应用正从训练主导转向推理和智能体主导,推动算力架构、应用场景和商业模式发生深刻变革。从单轮生成到多步规划,从被动问答到主动任务执行,智能体正在重新定义AI的应用边界。
智能体并非传统意义上的主机,而是一种基于大模型的能力和资源。单个智能体通过感知、记忆、规划、工具调用和行动执行形成闭环,能够独立完成特定任务的决策和操作。然而,单一智能体的应用边界和能力上限较为有限,难以处理复杂目标。为突破这一局限,多智能体协同系统应运而生。在统一协调器的调度下,相关智能体可以共享记忆、进行高级规划和反思,从而涌现出集体智能,处理更复杂的任务。
多智能体的规模化互联进一步催生了智能体互联网(IoA)。与传统互联网实现主机和信息互联不同,IoA扩展为智能体和能力的互联。它以IPv6+为基础,叠加新应用层协议,实现智能体的唯一标识、自主发现、可信交互和协同执行。智能体互联网的顶层支撑是智能体即服务(AaaS),它将智能体和智能体群的能力云化封装,通过API、SDK和低代码平台对外提供服务,支持租户化、弹性调度和按需计费。
在面向消费者的(To C)领域,智能体主要有三种应用模式。第一种是云上APP寄生智能体,它强依赖微信、钉钉等宿主APP,依托云端算力运行,断网后不可用。这类智能体作为APP内的AI插件,能够基于用户偏好自动完成操作,将聊天工具升级为具备“思考、写作、读文件、控设备”能力的智能助手。第二种是终端OS原生智能体,预装于手机操作系统,如中兴通讯与字节跳动联合推出的豆包手机。它采用端云协同模式,可按用户意图调度APP并自动执行业务流程,但可能因过度主动而违背用户临时意愿。第三种是本地自治+云端辅助的智能体,如以“龙虾”为代表的AI私人管家。它不依赖APP,但需手动安装独立PC软件,决策和权限管理本地化,通过云上AaaS发现并协同其他智能体。
在面向企业(To B)的领域,智能体的应用模式更为多样。流程自动化智能体通过复刻人工逻辑,替代生产、运维等标准化流程,提升效率。行业专家智能体依托行业知识库和知识图谱,为企业提供决策参谋方案。多智能体协同模式整合供应链、生产和物流等领域的智能体,实现跨环节协同。具身智能则支撑工业机器人等实体设备,完成感知、推理和物理执行的闭环。
智能体的发展对算力、云和网络提出了颠覆性要求。与传统互联网业务相比,智能体业务的驱动主体从人工操作变为机器自主循环,运行时间从昼夜分明变为7×24小时不间断,空间分布从集中式变为多点网状调用。智能体的会话从短对话变为长上下文,流量从平稳变为“Token核爆”式增长,单智能体的Token消耗可达普通用户的10至1000倍。
邬贺铨表示,智能体对算力的需求推动了专用加速器的普及,如GPU和NPU。多智能体需同时占用多个隔离的“沙箱/进程”,并发密度激增,对显存和带宽提出极高要求。尽管Token流量年增速高达330%,但通过小模型普及、极致压缩和长上下文优化,未来5年算力增速可控制在41%左右,实现效率与成本的平衡。
在云服务领域,智能体时代要求构建智能体原生云,优先布局智能体原生架构,构建全局智能调度,搭建分布式记忆和向量引擎,深化“云—边—端”协同。这一趋势正在重塑中国云服务格局,AI云全栈服务迎来爆发,市场向智算融合、绿色低碳和国产深化升级。
网络层面,智能体的长会话持续交互、多智能体协同通信等特征,使网络流量从南北向为主转为东西向占比80%,QPS提升10至100倍。网络架构需从行政区组网转向智算中心—区域云—边缘—终端四级架构,采用SRv6、云网虚拟化与编排技术、流量AI预测与调度等技术,保障确定性与高可靠性。













