时事快闻

面向亿级Agent时代，百度“芯云模体”全栈布局如何站稳脚跟？

时间：2026-05-14 15:06 来源：快讯作者：吴俊

在2026年Create百度AI开发者大会上，百度创始人李彦宏提出，人工智能的发展已进入新阶段，AI不再局限于单一模型，而是演变为一个完整的系统，成为新一代计算架构的核心。为应对即将到来的亿级智能体（Agent）时代，百度正全力构建覆盖“芯片-AI云-模型-智能体”的全栈能力，为智能体的广泛应用提供底层支撑。

据国际市场调研机构IDC预测，全球活跃智能体数量将从2025年的2860万激增至2030年的22.16亿，五年内增长近80倍。与此同时，国家数据局数据显示，中国日均Token调用量已突破140万亿，较2024年初增长1400倍。这一趋势表明，智能体的普及正推动Token消耗量呈指数级上升，AI产业正迈向“亿级智能体”时代。

面对这一变革，百度重新定义了AI基础设施的内涵。传统认知中，AI基础设施仅包含芯片、服务器等硬件，而百度将其扩展为涵盖基础模型、智能体平台等软硬件的完整生态。百度智能云AI与大模型平台总经理忻舟指出，企业落地大模型的速度远落后于模型能力提升，核心障碍在于缺乏完整的智能体运行环境。

为解决这一问题，百度推出“千帆平台”，实现从模型服务（MaaS）到“模型+智能体”服务的升级。该平台提供沙箱系统、工具调度、长上下文管理等工程能力，并构建丰富的技能插件生态。通过动态路由任务至不同模型、优化推理引擎，千帆平台可降低23%的Token消耗，同时将任务成功率提升至95%以上。

在硬件层面，百度昆仑芯P800通过真实场景锤炼，单卡Token吞吐效率居国产AI芯片前列。IDC数据显示，其出货量已跻身国产市场前三。该芯片支持超万卡集群部署，在招商银行等客户中承载超50%的AI应用。2026年4月，百度点亮256卡超节点产品，推理效率较国产主流模型提升50%，通过集群化设计减少通信损耗，进一步压缩单位Token成本。

百度同步推进数据中心系统优化，升级GW级算力集群建设方案。1GW数据中心可容纳10万级AI芯片协同运行，通过潮汐调度实现资源动态分配，P/D分离技术分离计算与带宽任务，KVCache技术缓存上下文减少重复计算。这些措施共同构建起降低Token成本的系统工程。

业务结构调整印证了百度的战略转型。自2025年三季度起，百度财报按“AI新业务+传统业务”划分收入，其中AI新业务涵盖智能云基础设施、AI应用、Robotaxi等板块。2025年，该业务营收达400亿元，同比增长48%，在核心业务中占比39%。智能云基础设施以198亿元营收领涨，同比增长35%；AI原生营销服务增速达301%，成为新增长极。

这场转型背后是百度对技术壁垒的持续强化。过去五年，百度将传统广告业务的现金流投入智能云、芯片、自动驾驶等领域，将搜索推荐能力迁移至AI推理基础设施。这种资源配置优先级的转变，使其在AI产业分层中逐渐向基础设施层靠拢，形成与模型公司、应用公司差异化的竞争路径。

更多>同类天脉资讯

智元机器人携手地铁设计等在穗布局新公司聚焦智能机器人研发销售

天眼查App显示，近日，智合广行（广州）科技有限公司成立，法定代表人为邓一帆，注册资本3000万人民币，经营范围包括智能机器人的研发、服务消费机器人销售、智能机器人销售等，由广州智运科技投资合伙企业（有限合伙…

05-29

量子科技大揭秘：从微观原理到三大硬核赛道的未来图景

这正是量子计算的核心优势所在——传统计算机1个比特只能处于1种状态，而1个量子比特可同时处于多种状态；量子计算正是利用这种叠加特性，使由N个量子比特组成的系统能够同时表征2的N次方个基态的组合状态，算力呈指数…

05-29

友邦吊顶2025年研发投入与人员减少，但智能化产品与专利成果显著

05-29

美亚光电2025年营收净利双增研发投入加码推出多领域研发新成果

05-29