天脉网 | 天脉新媒体中心主办！
手机版
二维码

时事快闻

当前位置：首页 > 天脉资讯 > 科技数码 > 正文内容

百度自研视频生成模型MuseSteamer：中文音视频一体化，一图秒变电影级有声视频

时间：2025-07-03 00:49 来源：天脉网作者：赵云飞

百度商业研发团队近期宣布了一项重大技术突破，正式推出了自研的视频生成模型“MuseSteamer”及其配套的创作平台“绘想”。这一创新之举标志着全球首个能够实现中文音视频一体化生成的视频模型的诞生。

与传统的AIGC视频制作流程相比，MuseSteamer打破了“先画面后配音”的传统模式，实现了画面、音效与人声台词的协同创作，极大地提升了视频制作的效率与创意空间。

MuseSteamer的技术实力不容小觑。该模型支持从一张图片生成长达10秒、分辨率达到1080p的电影级画质视频。更令人惊叹的是，视频中的人物微表情与运镜效果均达到了专业影视制作的水准。这一成就的背后，是百度商业研发团队在亿级中文多模态数据清洗、精细化视频结构化描述语言以及多目标强化学习等关键技术上的深厚积累与优化。

为了满足不同创作者的需求，MuseSteamer模型家族推出了多个版本，包括Turbo、Lite、Pro及全系列有声版。这些版本覆盖了从普通视频创作者到专业影视制作机构的广泛需求。目前，Turbo版已在绘想平台上限时免费开放公测，而其他版本也将在8月陆续与公众见面。

百度商业研发团队的这一创新之举，无疑为视频创作领域带来了新的活力与可能。随着MuseSteamer的广泛应用，我们有理由期待更多富有创意与想象力的视频作品涌现，为观众带来更加丰富的视听盛宴。

点赞 0反对 0举报 0 收藏 0

更多>同类天脉资讯

百度AI Day：百度搜索十年大改版，智能框引领搜索新时代！

百度搜索框升级为“智能框”，支持超千字的文本输入，拍照、语音、视频等能力也全面加强，支持直接调取AI写作、AI作图等工具。百度搜索全新升级“百看”功能，不仅能图文、音视频并茂地直接输出结构化内容，还将陆续接…

07-03

斑头雁获超亿元B轮融资，阿里领投，AI智能体赛道迎新高峰？

目前，斑头雁已服务了近10万家企业团队，包括联想、百丽、科沃斯、添可、苏泊尔、鲁花、FESCOAdecco等在内的行业领军企业，该平台月度AI任务调用量已达400倍。根据官网介绍，斑头雁主要产品包括智能…

07-02

亚马逊机器人大军破百万，新AI模型DeepFleet再提速仓储效率

近日，亚马逊宣布其仓库中的机器人数量已达到惊人的100万台，这一里程碑标志着公司在过去13年里不断提升的自动化能力。除了机器人数量的增长，亚马逊还宣布推出了新的生成式 AI 模型 ——DeepFleet，旨…

07-02

蚂蚁国际发布金融AI驾驶舱，东南亚客户6月已率先体验

目前，蚂蚁国际已在四大核心业务板块中全面应用了“驾驶舱”，包括创新跨境支付和数字化解决方案（Alipay+）、商户支付服务（Antom）、全球企业账户服务（万里汇），以及场景金融服务（全球资金管理及信贷科技…

07-02

百度搜索大变身！智能框、百看功能革新，打造全新AI生态体验

此外，百度搜索全新升级智能创作能力，一句话就能生成三分钟创意视频，视频生成后，支持分镜编辑，自定义画面内容，提供「从灵感捕捉、内容生成到全平台发布」一站式服务，大大降低了创作门槛，用户无需辗转多个平台，也无…

07-02

百度CFO大换血：前金山云CFO何海建接任，何俊杰转岗HR及行政

百度集团资深副总裁何俊杰（Jackson）不再担任代理CFO职务，轮岗负责集团人力资源及行政管理。 2024年10月，百度集团执行副总裁罗戎（Julius）轮岗担任移动生态事业群组（MEG）负责人，不再担任…

07-02

华为重磅！盘古7B稠密与720B混合专家模型及推理技术全面开源

6月30日，华为正式宣布开源盘古70亿参数的稠密模型、盘古Pro MoE 720亿参数的混合专家模型和基于昇腾的模型推理技术。华为表示，此举是华为践行昇腾生态战略的又一关键举措，推动大模型技术的研究与创新发…

07-02

互联二维码神器：多样化生成，高效管理新体验

为此，互联二维码生成器应运而生，为了满足不同用户不同场景的使用需求，互联二维码生成器提供了音视频二维码、文件二维码、图片二维码、网址二维码、文本二维码、微信活码等多种类型的二维码生成服务，并实现了在线生成和一…

07-02

亚马逊云科技总裁详解：千亿美金投资云与AI，企业出海该如何选云？

在储瑞松看来，AI现在各方面的因素都具备了，从生成式AI进入到Agentic AI时代，虽然具体做事的还是AI智能体，但由于单个AI智能体做的更多是比较简单的事情，涉及比较复杂的任务，就需要多智能体去协同，而…

07-02

百度文心大模型4.5系列重磅开源，10款模型及API服务齐上线

在多模态模型方面，文心大模型4.5开源系列基于强大的视觉感知能力和丰富的视觉常识，实现了思考与非思考统一，在视觉常识、多模态推理、视觉感知等主流的多模态大模型评测中优于闭源的OpenAIo1。其中，飞桨…

07-02

5G+工业互联网赋能！国内农机行业智慧工厂新标杆落成

2024年，湖南省农友机械集团开始对物料仓库与产线实施5G+工业互联网升级，规划采用自动化立库与AGV运输系统，达到提升生产效率及产线融合改造建设的目的。借助社会组织的推动力，将成熟且可靠的技术引入农业相关…

07-01

AI浪潮来袭，知乎周源：开发者正迎来属于他们的璀璨时代

周源回顾到，问答社区伴随中国开发者成长、见证技术浪潮变迁的历程。他透露，知乎上目前每月有超过5000万的活跃用户关注科技互联网和AI的相关内容，并已经形成一个庞大的科技领域专家网络，其中包括1600万参与科…

07-01

饿了么前CEO韩鎏陨落：寒门逆袭终章，利益输送毁所有

当然，这无可厚非，当人们在聊他这点时，我们更愿意聊聊他的逆袭历史。在阿里巴巴，他的晋升速度如同坐上了火箭一般迅猛：先是担任共享零售事业部总经理，随后又成为同城物流事业部的负责人，接着又荣升为饿了么资深副总…

07-01

科技巨头纷纷布局，能否打破英伟达AI芯片垄断格局？

“谷歌或助力OpenAI降低对英伟达的依赖”《印度时报》28日以此为题报道称，OpenAI首次采用谷歌人工智能（AI）芯片为其ChatGPT及其他产品提供算力支持。据路透社报道，超威半导体公司CEO苏姿丰表示…

07-01

阿里魔搭：7万模型汇聚1600万开发者，共筑中国AI开源新生态

为了方便大家使用模型，魔搭社区提供部分免费算力，让大家能够在云上做一些调试，甚至一些应用，“这一切的背后，离不开工具链的整合与支持。” 2023年，业界第一个文生视频开源模型在魔搭社区发布；到今年，Dee…

07-01

点击查看更多 +

全站最新

百度AI Day：百度搜索十年大改版，智能框引领搜索新时代！

雷军直播力挺小米YU7，推荐用户考虑Model Y，SU7转单率曝光

聊城富豪弃政从商，卖宠物粮攒下171亿身家！

袁富根家族财富飙升，苏州富豪榜排名跃升，东山精密业绩能否跟上节奏？

雷军直播谈小米YU7爆单，回应友商“截胡”：各有优势，不必诋毁

雷军直播回应小米YU7热销质疑，透露2027年考虑汽车出口

热门内容

媒体信息

新传播周刊

新传播，传播新经济之声！

本栏最新

百度AI Day：百度搜索十年大改版，智能框引领搜索新时代！

斑头雁获超亿元B轮融资，阿里领投，AI智能体赛道迎新高峰？

亚马逊机器人大军破百万，新AI模型DeepFleet再提速仓储效率

蚂蚁国际发布金融AI驾驶舱，东南亚客户6月已率先体验

百度搜索大变身！智能框、百看功能革新，打造全新AI生态体验

百度CFO大换血：前金山云CFO何海建接任，何俊杰转岗HR及行政