百度文心大模型4.5 Turbo技术创新揭秘:吴甜详解最新进展

   时间:2025-05-20 19:52 来源:天脉网作者:赵云飞

在北京举行的百度AI Day活动中,中国信息通信研究院揭晓了大模型推理能力的评估结果,引发业界关注。结果显示,百度文心X1 Turbo在评估中大放异彩,以16项5分、7项4分和1项3分的优异成绩,荣获当前最高评级“4+级”,成为国内首个通过该测评的大模型。文心X1 Turbo在逻辑推理、代码推理以及推理效果优化等方面均展现出了卓越的能力,工具支持度和安全可靠度也均获得满分。

活动现场,百度技术专家吴甜深入介绍了文心大模型的最新版本。她指出,文心大模型4.5是一款多模态基础大模型,而文心4.5 Turbo则在其基础上进行了优化,实现了效果更佳、成本更低的突破。基于文心4.5 Turbo,文心X1也迎来了升级,不仅性能大幅提升,还配备了更先进的思维链,进一步增强了问答、创作、逻辑推理、工具调用和多模态能力。

文心4.5及4.5 Turbo在多模态学习方面取得了显著进展,实现了文本、图像和视频的混合训练。针对模态数据间的差异,通过一系列创新技术,如多模态异构专家建模、自适应分辨率视觉编码等,大幅提升了跨模态学习效率和多模态融合效果,学习效率提高了近2倍,多模态理解效果也提升了超过30%。

在后训练阶段,百度研发了自反馈增强的技术框架,利用大模型自身的生成和评估能力,形成了“训练-生成-反馈-增强”的闭环迭代机制。这一机制不仅解决了数据生产难度大、成本高、速度慢等问题,还显著降低了模型幻觉,提升了模型理解和处理复杂任务的能力。

在训练阶段,百度通过融合偏好学习的强化学习技术,实现了对结果质量判别的准确率提升。通过离线偏好学习和在线强化学习的统一优化,进一步提高了数据利用效率和训练稳定性,并增强了模型对高质量结果的感知能力。通过偏好信号与奖励信号的融合运用,模型的理解、生成、逻辑和记忆等能力得到了全面提升。

在深度思考方面,百度突破了传统思维链优化的范式,构建了融合思考和行动的复合思维链。这一创新使得模型在解决问题时能够结合工具调用,从而显著提升问题解决能力。模型输出结果思路清晰、逻辑严密,表达自然。同时,结合多元统一的奖励机制,实现了思考和行动链的端到端优化,大幅提升了跨领域的问题解决能力。

在数据方面,百度构建了“数据挖掘与合成-数据分析与评估-模型能力反馈”的数据建设闭环,为模型训练提供了源源不断的高质量数据。这一数据建设流程具备良好的可扩展性,能够轻松适应全新的数据类型,实现快速、高效的数据生产。

吴甜还指出,随着大模型能力的拓展和效率的提升,百度正在探索更多前瞻性和富有想象力的创新应用。以数字人为例,百度通过“剧本”驱动多模协同的超拟真数字人技术,实现了语言、声音、形象的协调一致。目前,该技术已支持超过10万数字人主播,直播转化率达31%,显著降低了直播开播成本。在代码场景上,百度基于文心大模型的语言和代码能力,研制了代码智能体和智能代码助手——文心快码。文心快码已广泛应用于百度内部代码生成,并向全社会开放,累计服务了760万开发者。

文心大模型的能力拓展和效率提升,得益于飞桨文心的联合优化。通过训练和推理的技术创新,文心4.5 Turbo的训练吞吐达到文心4.5的5.4倍,推理吞吐达到8倍。飞桨文心已吸引了超过2185万的开发者,服务了67万家企业,创建了110万个模型。基于飞桨深度学习平台和文心大模型,百度在多个城市落地了产业赋能中心、数据生态中心和教育创新中心,以科技+人才+创新的模式推动区域人工智能公共技术服务平台的建设,助力本地AI产品研发和产业升级。

 
反对 0举报 0 收藏 0
 
更多>同类天脉资讯
全站最新
热门内容
媒体信息
新传播周刊
新传播,传播新经济之声!
网站首页  |  关于我们  |  联系方式  |  版权隐私  |  网站留言  |  RSS订阅  |  违规举报