百度蒸汽机视频生成模型迎来重大升级,仅50天实现技术飞跃。
近日,百度旗下的蒸汽机视频生成模型宣布完成了一次重大升级,距离其初次上线仅过去短短50天。此次升级不仅带来了技术上的显著进步,还伴随着使用成本的大幅下降。
蒸汽机模型此次升级的最大亮点在于实现了多人有声视频的一体化生成。以往,模型生成的视频往往需要进行后期配音才能实现声音与画面的同步,而现在,蒸汽机模型能够直接生成人物声音、表情、动作以及嘴型完美同步的视频,即便在复杂场景下也能保持稳定。视频的画面清晰度和流畅度也得到了显著提升,运镜方式更加丰富多样。
更令业界瞩目的是,百度此次大幅降低了蒸汽机模型的使用价格。据百度商业体系商业研发总经理介绍,使用蒸汽机模型Turbo版生成一段5秒720p的一体化有声视频,仅需1.4元。而行业中同类模型生成无声视频的价格普遍在2元左右。这意味着,百度蒸汽机模型的价格已经降到了行业平均水平的70%左右。
百度蒸汽机模型的更新迭代速度之快、价格降幅之大,均超出了业界的预期。百度副总裁、移动生态商业体系负责人表示,蒸汽机模型的研发始终以满足客户需求为导向。从1.0版本到2.0版本,不仅在技术上进行了优化,还更加注重大模型工程方面的改进,从而在短时间内实现了技术能力的提升和成本的降低。
与百度旗下的文心系列大模型不同,蒸汽机模型是由MEG(移动生态事业群)旗下的移动生态商业体系研发的。它主要服务于广告主和代理商,满足他们制作视频营销素材的需求。由于蒸汽机模型从立项之初就明确了服务对象,因此在上线后的一个月内,迅速收集到了大量客户反馈,并根据反馈进行了针对性的改进。
在发布会上,好莱坞视效指导姚骐展示了其团队使用蒸汽机模型制作的短片《归途》。这部短片通过大模型生成了40多个镜头、120段素材片段,包括20个10秒一体化有声片段和100个5秒有声片段,整个制作过程仅用了一周时间。按照蒸汽机模型的最新定价计算,这部短片的制作成本仅为330.6元。
百度方面表示,使用蒸汽机模型可以大幅降低营销成本。以往,客户拍摄一个宣传片可能需要花费20万元左右,而且最终制作出来的片子还不一定能满足需求。而现在,客户可以先花费几百元使用AIGC方式制作出自己想要的内容,这对营销成本的降低效果十分显著。
随着视频生成模型在营销素材生成等领域的商业价值逐渐显现,越来越多的企业开始关注并投入这一领域。例如,快手在近期发布的财报中透露,其视频生成模型可灵AI在今年第二季度的营收已经达到了2.5亿元,营收能力较几个月前提升了数倍。可以预见,未来视频生成模型将在营销领域发挥更加重要的作用。