天脉网 | 天脉新媒体中心主办！
手机版
二维码

时事快闻

百度开源ERNIE-4.5-21B-A3B-Thinking模型助力复杂推理与长文本任务自动化处理

时间：2025-09-09 17:47 来源：天脉网作者：苏婉清

在WAVE SUMMIT深度学习开发者大会2025现场，百度宣布开源新一代深度思考模型ERNIE-4.5-21B-A3B-Thinking，引发行业广泛关注。这款基于混合专家架构（MoE）构建的模型，总参数规模达210亿，通过动态激活30亿参数的子网络实现高效推理，在逻辑推理、数学计算、科学分析等需要专业知识的领域展现出显著性能提升。

技术团队透露，该模型在ERNIE-4.5-21B-A3B基础上进行深度优化，通过指令微调与强化学习相结合的训练方式，显著增强了工具调用能力。其128K的上下文窗口长度，可支持需要长文本理解的复杂推理任务，在代码生成、多轮对话等场景中表现尤为突出。目前，FastDeploy、vLLM、Transformers等主流开源框架已实现对该模型的完整支持。

开源生态建设方面，百度采用Apache License 2.0协议开放模型使用权，允许商业场景下的自由应用。HuggingFace模型库与星河社区同步上线了完整版本，开发者可通过预训练权重与推理代码直接部署。这种全链条开源模式延续了百度6月30日发布文心大模型4.5系列时的策略，当时发布的10款模型（涵盖47B/3B MoE架构及0.3B稠密模型）已形成行业影响力。

同期发布的文心大模型X1.1深度思考版，在事实准确性、指令响应度及智能体协作能力上实现突破性进展。该模型通过文心一言官网、文小言APP向公众开放，企业用户可通过百度智能云千帆平台获取完整服务。技术文档显示，X1.1在医疗咨询、法律文书生成等垂直领域展现出专业级应用潜力。

行业分析师指出，百度此次双模型发布标志着大模型技术进入"深度思考"与"场景落地"并重的新阶段。ERNIE-4.5-21B-A3B-Thinking侧重复杂任务自动化处理，文心X1.1则强化垂直领域专业能力，二者形成技术互补。开源社区的快速响应显示，开发者对高效能、低门槛的AI工具存在持续需求。

点赞 0反对 0举报 0 收藏 0

更多>同类天脉资讯

短视频营销总没效果？闫宝龙矩阵营销：从流量到转化，为企业装上“增长引擎”！

闫宝龙短视频矩阵营销从一开始就把服务写进合同：每个客户配专属运营顾问，每周出数据报告，每月调整策略。闫宝龙短视频矩阵营销从流量获取到转化变现，用矩阵策略+ 智能工具 + 全程服务搭起完整体系，就像给企业装…

09-09

星巴克牵手小红书打造1800余家兴趣空间，宠物手工骑行跑步爱好者有新去处！

目前共开放10个兴趣友好领域的门店合作，在全国共覆盖多个品牌的近万家门店，通过日常兴趣友好服务和举办兴趣友好活动，创造属于兴趣人群的小天地。小红书将为优质的线下活动与兴趣内容提供更多流量和曝光，也让不同的兴趣…

09-09

拼多多“千亿扶持”助力破局同质化，“新品”浪潮开启电商新篇章

从市场反馈上看，拼多多的精准洞察与运营，不仅为这一场场“爆款实验”提供了成功的保障，更帮助伊利和蒙牛拓展了市场增量。 “持续创新与打造爆款——开拓新市场——有更多的钱投入研发”，在正向循环的商业运作下，伊利…

09-09

《智算产业发展研究报告（2025）》出炉！洞察新动向、趋势与技术关键词

《智算产业发展研究报告（2025）》由中国电信研究院（天翼智库）发布，围绕2025年智算产业发展新动向、趋势预判、技术关键词及各省发展潜力展开分析，为产业高质量发展提供参考。报告指出，2025年是AI规模应…

09-09

百度Wave Summit发布文心X1.1，性能比肩GPT-5，AI开发迎来新突破！

智东西9月9日报道，今天上午，在百度Wave Summit深度学习开发者大会上，百度正式发布深度思考模型文心大模型X1.1、大模型开发框架飞桨框架V3.2、智能代码助手文心快码3.5S以及一系列开发组件更新…

09-09

从零起步到带货达人！抖音快手视频号AI无人直播全流程实操指南

下次把“互动促单素材”的播放间隔从20分钟缩短到15分钟，话术里增加“稀缺感”，比如“库存只剩10件了，下播后恢复原价”“今天是专属活动，明天就没这个价了”，同时检查产品链接是否放在“1号车”（观众最容易找到…

09-09

从地市货架到全国舞台，河南商超如何用“本土哲学”掀起零售业新浪潮？

河南超市品牌正在全国掀起一场实体零售的革命，从胖东来、蜜雪冰城到洛阳大张、信阳西亚，河南商超群体用自己独特的商业模式证明：在这个电商肆虐的时代，线下零售不仅依然充满活力，甚至还可以成为网红打卡地。一位在河南…

09-09

百度WAVE SUMMIT大会发布文心X1.1模型，多项能力提升，已全面开放应用

据王海峰现场介绍，文心大模型X1是基于文心大模型4.5训练而来的深度思考模型，升级后的X1.1主要采用了迭代式混合强化学习训练框架，一方面通过混合强化学习，同时提升通用任务和智能体任务的效果；另一方面通过自…

09-09

京东超市11周年发布五大战略举措未来三年用户规模剑指5亿目标

五项举措包括，通过用户洞察、产品打造、新品引爆实现商品爆发；通过用户渗透、打造用户心智，实现品牌用户规模增长；通过品类管理、制定品类策略、构建品类心智；通过省区仓店、B端客户、秒送O2O、跨境出海，打造全渠…

09-09

沈阳“工业风”吹旺文商旅融合之火，消费活力释放引客来！

京东MALL的重装升级，也是沈阳持续推动文商旅融合、广辟“工业风”场景，工业文旅的蓬勃活力与创新魅力不断展现的缩影。在京东MALL，通过设置专业的电竞比赛、专业衣物洗护，咖啡烘焙课程以及“金榜题名”等特色…

09-09

原快手AI核心人物张迪转战B站，技术大咖再启新程出任技术条线负责人

2010年毕业后加入阿里，离职前身份为阿里资深技术专家，阿里妈妈大数据与机器学习工程架构负责人。2025年8月15日，快手内部宣布人事调整，由高级副总裁盖坤兼任可灵AI技术负责人，张迪正式卸任并离职。在…

09-09

长沙富力万达文华酒店5.14亿起拍，仅1人报名，富力酒店业务何去何从？

9月8日，广东省广州市中级人民法院在京东拍卖平台公开拍卖长沙富力万达文华酒店，起拍价5.14亿元，评估价约6.42亿元。2017年7月19日，万达商业、富力地产在北京签订了战略合作协议。今年4月及5月，广…

09-09

多个视频平台广告时长“超标”引争议，律师：虚标倒计时或侵害公平交易权

9月7日，有媒体发布报道称，爱奇艺、优酷、芒果TV等主流视频平台的广告实际播放时长，比页面标注的倒计时时长多出2～3秒。 9月8日下午，九派财经记者在稳定网络环境下对三大平台进行实测发现，爱奇艺剧集《生万物》…

09-09

陈石磊：从斯坦福博士到产业AI践行者，推动大模型技术落地多领域

长期致力于人工智能、大模型与多模态技术在公共健康、工业制造、智慧城市等领域的应用推广与产业化落地。 - 参与“百度智能云”AI服务平台的基础架构搭建他提出的“行业大模型+交互智能”产品体系，为多个领域提供了新…

09-09

优衣库携手京东深化线上布局，以创新服务共绘中国消费市场新图景

为了让消费者更好地感受“LifeWear服适人生”美好购物体验，9月8日，优衣库与京东宣布达成全新合作：打开京东APP搜索“优衣库”，即可在“优衣库UNIQLO京东小程序”购买到自己喜爱的服饰，同时享受京东优…

09-09

点击查看更多 +

全站最新

短视频营销总没效果？闫宝龙矩阵营销：从流量到转化，为企业装上“增长引擎”！

星巴克牵手小红书打造1800余家兴趣空间，宠物手工骑行跑步爱好者有新去处！

海淀三山五园迎近现代中国画大师展，30件精品共绘“世世太平”

16本2025年完结的高口碑长篇佳作，网文老饕认证，书荒必看！

拼多多“千亿扶持”助力破局同质化，“新品”浪潮开启电商新篇章

小米王腾因泄密及违规被辞退，曾被雷军直播中点名“泄密常客”

热门内容

媒体信息

新传播周刊

新传播，传播新经济之声！

本栏最新

拼多多“千亿扶持”助力破局同质化，“新品”浪潮开启电商新篇章

《智算产业发展研究报告（2025）》出炉！洞察新动向、趋势与技术关键词

百度Wave Summit发布文心X1.1，性能比肩GPT-5，AI开发迎来新突破！

从零起步到带货达人！抖音快手视频号AI无人直播全流程实操指南

从地市货架到全国舞台，河南商超如何用“本土哲学”掀起零售业新浪潮？

百度WAVE SUMMIT大会发布文心X1.1模型，多项能力提升，已全面开放应用

​百度开源ERNIE-4.5-21B-A3B-Thinking模型 助力复杂推理与长文本任务自动化处理​

百度开源ERNIE-4.5-21B-A3B-Thinking模型助力复杂推理与长文本任务自动化处理