百度自研视频生成模型“绘想”亮相,为何突然改变主意?

   时间:2025-07-05 19:12 来源:天脉网作者:顾青青

在近日举办的百度AI DAY科技开放日上,百度移动生态商业研发团队隆重推出了其自主研发的视频生成模型MuseSteamer,以及配套的视频产品平台“绘想”。MuseSteamer采用了DIT架构,其参数规模与业界顶尖的视频生成模型相当,能够生成连续10秒的动态视频,并支持最高1080P的高清分辨率。

值得注意的是,这款视频生成模型的诞生并非出自百度研发文心大模型的技术中台部门TPG,而是由移动生态商业研发团队独立打造。去年10月,百度CEO李彦宏曾在内部表示,由于视频生成模型的研发周期长,投入大,百度暂不考虑涉足该领域。然而,仅仅数月之后,百度便推出了MuseSteamer,这一转变令人颇感意外。

在随后的媒体沟通会上,百度副总裁、移动生态商业体系负责人陈一凡解释了这一决策背后的原因。他表示,为了提升代理商和广告主广告制作的效率,百度移动生态商业体系去年推出了擎舵平台。然而,在实际应用中,一些代理商和广告主反映,某些科幻场景难以通过实拍实现,希望能借助大模型进行生成。基于此反馈,移动生态商业体系决定自研视频生成模型,以满足市场需求。

据一位百度内部人士透露,李彦宏在去年内部讲话中虽然提到了视频生成模型的研发周期长,但也指出,针对多模态需求,可以探索一些特定场景的视频生成。此次发布的MuseSteamer,以及之前推出的罗永浩数字人,都是基于特定场景和需求的创新尝试。

与市场上大多数技术驱动型的视频生成模型不同,MuseSteamer采用了商业驱动的研发模式。即先明确商业需求,再结合需求进行模型研发。这种模式的优势在于,能够确保模型在实际应用中发挥最大效用。百度商业体系商业研发总经理刘林透露,MuseSteamer项目自今年春节后开始立项,研发团队仅用了3个月时间便实现了有效上线。

刘林进一步解释称,MuseSteamer之所以能够在短时间内上线,得益于擎舵平台在多模态生成上的技术积累,以及百度商业体系在模型训练、框架推理、卡片调优等方面的经验。这些积累为MuseSteamer的快速研发提供了有力支持。

 
反对 0举报 0 收藏 0
 
更多>同类天脉资讯
全站最新
热门内容
媒体信息
新传播周刊
新传播,传播新经济之声!
网站首页  |  关于我们  |  联系方式  |  版权隐私  |  网站留言  |  RSS订阅  |  违规举报