百度文心大模型4.5系列重磅开源,10款模型及API服务齐上线

   时间:2025-07-02 00:48 来源:天脉网作者:杨凌霄

百度文心大模型4.5系列正式宣告开源,为开发者带来全新选择。

近日,百度官方宣布,备受瞩目的文心大模型4.5系列现已全面开源,并同步推出API服务,以满足广大开发者的需求。

本次开源,百度慷慨地推出了10款模型,覆盖了从47B参数的混合专家(MoE)模型到轻量级0.3B的稠密型模型,广泛适用于文本、多模态等多种任务场景。这些模型不仅权重与代码完全开放,还通过飞桨星河社区、HuggingFace及百度智能云千帆平台等多个渠道,供开发者直接下载使用。

值得注意的是,文心大模型4.5系列遵循的是Apache 2.0协议,为学术研究和产业应用提供了极大的便利。此次推出的模型在多个关键维度上均展现出百度的诚意,包括独立自研模型的数量占比、模型类型的多样性、参数的丰富度,以及开源的宽松度和可靠性。

尤为文心大模型4.5系列在MoE架构上提出了一种创新性的多模态异构模型结构。这一结构不仅能够保持甚至提升文本任务的性能,还显著增强了多模态理解能力。其优越的性能得益于多模态混合专家模型的预训练技术、高效训练推理框架,以及针对模态的后训练等关键技术。

文心大模型4.5系列均使用飞桨深度学习框架进行训练、推理和部署,模型FLOPs利用率(MFU)高达47%。在多个主流基准测试中,这些模型均表现出色,尤其在指令遵循、世界知识记忆、视觉理解和多模态推理任务上,效果尤为突出。

在文本模型方面,文心大模型4.5系列在多个主流基准评测中超越了DeepSeek-V3、Qwen3等模型,展现出强大的竞争力。而在多模态模型方面,基于强大的视觉感知能力和丰富的视觉常识,文心大模型4.5系列在视觉常识、多模态推理、视觉感知等评测中,表现优于闭源的OpenAI模型。

在轻量模型方面,文心大模型4.5系列同样表现出色。例如,文心4.5-21B-A3B-Base文本模型的效果与同量级的Qwen3相当,而文心4.5-VL-28B-A3B多模态模型在同量级开源模型中达到最优水平,甚至能与更大参数的Qwen2.5-VL-32B模型相媲美。

为了进一步提升开发者的使用体验,百度还同步发布了文心大模型开发套件ERNIEKit和大模型高效部署套件FastDeploy。这些工具链为文心大模型4.5系列及开发者提供了开箱即用的便捷工具和全流程支持。文心大模型4.5系列的开源,也标志着百度在框架层和模型层实现了“双层开源”的新格局。

 
反对 0举报 0 收藏 0
 
更多>同类天脉资讯
全站最新
热门内容
媒体信息
新传播周刊
新传播,传播新经济之声!
网站首页  |  关于我们  |  联系方式  |  版权隐私  |  网站留言  |  RSS订阅  |  违规举报