时事快闻

字节Seedance 2.0论文亮相：170人团队署名，多模态生成能力全面升级

时间：2026-04-17 15:19 来源：快讯作者：陈阳

字节跳动旗下的AI视频生成技术Seedance 2.0近日在学术平台arXiv发布技术论文，详细阐述了其多模态生成能力与核心技术创新。该论文不仅公开了26页的基准测试数据，还首次完整披露了170人的研发团队名单，引发行业对技术突破与团队架构的双重关注。

此次升级的Seedance 2.0通过原生统一模型架构，实现了视频与音频的同步生成能力。技术团队突破了传统工具依赖单文本输入的局限，支持文本、图像、视频、音频四种模态的混合输入与融合处理。例如在人物动作生成方面，系统可精准模拟跑步、舞蹈等复杂运动轨迹，确保多人互动场景中的物理合理性；音频模块则能自动生成双耳立体声，实现口型同步与背景音效的精准匹配。更引人注目的是其"导演模式"，用户输入剧情脚本后，系统可自动完成分镜设计、运镜切换与剪辑节奏控制。

在基准测试环节，Seedance 2.0在VBench等主流评测体系中全面领先。论文数据显示，其在运动质量、语义一致性等核心指标上较同期竞品提升显著，特别是在长视频生成稳定性与多模态交互精度方面表现突出。目前该技术已通过Byteplus平台向全球100余个国家的企业客户开放，提供4-15秒、最高720p分辨率的视频生成服务，但美国市场暂未纳入首批开放名单。

团队架构方面，论文披露的170人名单显示，与前代197人团队相比，核心成员经历近半数更替。其中基础研究负责人吴永辉持续担任技术决策者，直接向CEO汇报；预训练模块负责人曾妍驻扎美国帕洛阿尔托，主导核心技术路线执行。值得注意的是，团队在薪资结构上采用"现金+字节期权+豆包期权"的复合模式，期权四年全部归属。针对近期传闻的"亿元年薪挖角"事件，抖音副总裁李亮回应称薪资体系统一，但承认优秀技术人员若业务达标，四年后期权收益可能达数亿元级别。

此次技术发布与商业化落地同步推进，显示出字节跳动在AI视频生成领域的双重布局。论文中展示的26页测试数据与实际应用案例，既是对技术实力的证明，也为行业提供了多模态生成的新参考标准。随着团队架构的持续优化与薪酬激励机制的公开，这场AI技术竞赛正从单纯的产品比拼，延伸至人才储备与生态建设的深层较量。

更多>同类天脉资讯