在2026年Create百度AI开发者大会上,百度创始人李彦宏提出,人工智能的发展已进入新阶段,AI不再局限于单一模型,而是演变为一个完整的系统,成为新一代计算架构的核心。为应对即将到来的亿级智能体(Agent)时代,百度正全力构建覆盖“芯片-AI云-模型-智能体”的全栈能力,为智能体的广泛应用提供底层支撑。
据国际市场调研机构IDC预测,全球活跃智能体数量将从2025年的2860万激增至2030年的22.16亿,五年内增长近80倍。与此同时,国家数据局数据显示,中国日均Token调用量已突破140万亿,较2024年初增长1400倍。这一趋势表明,智能体的普及正推动Token消耗量呈指数级上升,AI产业正迈向“亿级智能体”时代。
面对这一变革,百度重新定义了AI基础设施的内涵。传统认知中,AI基础设施仅包含芯片、服务器等硬件,而百度将其扩展为涵盖基础模型、智能体平台等软硬件的完整生态。百度智能云AI与大模型平台总经理忻舟指出,企业落地大模型的速度远落后于模型能力提升,核心障碍在于缺乏完整的智能体运行环境。
为解决这一问题,百度推出“千帆平台”,实现从模型服务(MaaS)到“模型+智能体”服务的升级。该平台提供沙箱系统、工具调度、长上下文管理等工程能力,并构建丰富的技能插件生态。通过动态路由任务至不同模型、优化推理引擎,千帆平台可降低23%的Token消耗,同时将任务成功率提升至95%以上。
在硬件层面,百度昆仑芯P800通过真实场景锤炼,单卡Token吞吐效率居国产AI芯片前列。IDC数据显示,其出货量已跻身国产市场前三。该芯片支持超万卡集群部署,在招商银行等客户中承载超50%的AI应用。2026年4月,百度点亮256卡超节点产品,推理效率较国产主流模型提升50%,通过集群化设计减少通信损耗,进一步压缩单位Token成本。
百度同步推进数据中心系统优化,升级GW级算力集群建设方案。1GW数据中心可容纳10万级AI芯片协同运行,通过潮汐调度实现资源动态分配,P/D分离技术分离计算与带宽任务,KVCache技术缓存上下文减少重复计算。这些措施共同构建起降低Token成本的系统工程。
业务结构调整印证了百度的战略转型。自2025年三季度起,百度财报按“AI新业务+传统业务”划分收入,其中AI新业务涵盖智能云基础设施、AI应用、Robotaxi等板块。2025年,该业务营收达400亿元,同比增长48%,在核心业务中占比39%。智能云基础设施以198亿元营收领涨,同比增长35%;AI原生营销服务增速达301%,成为新增长极。
这场转型背后是百度对技术壁垒的持续强化。过去五年,百度将传统广告业务的现金流投入智能云、芯片、自动驾驶等领域,将搜索推荐能力迁移至AI推理基础设施。这种资源配置优先级的转变,使其在AI产业分层中逐渐向基础设施层靠拢,形成与模型公司、应用公司差异化的竞争路径。












