阿里巴巴近日正式推出其视频生成模型HappyHorse的升级版本1.1,在多个关键维度实现突破性优化。该版本针对1.0版本存在的动作流畅度不足、主体稳定性欠佳等问题,通过技术革新显著提升了视频生成质量,为内容创作者提供更高效的工具支持。
动态表现力升级是本次迭代的核心亮点。研发团队通过优化运动建模算法与时序一致性模块,有效解决了此前版本中动作迟缓、节奏断层的问题。升级后的模型能够生成更具力量感的肢体动作与更连贯的场景转换,特别在打斗、运动等高强度动态场景中,仅需简洁提示词即可实现复杂动作的精准还原。
针对内容生产领域的主体一致性难题,1.1版本创新性地支持同时输入9张角色参考图。该技术通过增强多分镜理解能力与N宫格参考解析,确保商品细节、品牌标识及角色特征在复杂场景中的稳定呈现。这项突破使得多角色短剧制作、直播带货等场景中的"角色错位"现象得到根本性改善,显著降低创作过程中的重复抽卡率。
在指令响应层面,新版本展现出更强的语义理解能力。无论是简短描述还是复杂叙事,模型都能准确捕捉创作意图。对于包含多场景切换的复杂提示词,系统通过强化镜头编排稳定性,可实现角色、场景、运镜的连贯演绎。测试数据显示,在处理包含5个以上场景切换的指令时,生成成功率较前代提升42%。
视觉与听觉的双重优化带来更真实的沉浸体验。通过专项算法调整,模型有效解决了"油光过曝""过度锐化"等用户集中反馈的问题,在保留皮肤纹理、毛孔等微观细节的同时,实现更自然的画面质感。音频系统升级则使台词表达更具情感张力,语速、停顿、语调可根据场景情绪动态调整,创作者还可在提示词中指定环境音效与背景音乐。
技术参数方面,1.1版本延续了3-15秒的单段生成时长,支持720p/1080p分辨率及自由宽高比设置。该模型已广泛应用于短剧制作、电商广告、品牌营销、游戏CG等领域,服务场景覆盖超过20个细分行业。据开发团队透露,后续版本将持续迭代长视频生成能力与实时交互功能。
伴随新版本发布,阿里巴巴同步启动"Horsepower"AI影像创作大赛。即日起至报名截止,创作者可通过HappyHorse官网提交作品,优秀创作者将获得价值百万元的商业合作机会。赛事评委团由知名导演张纪中领衔,涵盖影视制作、数字艺术等领域权威专家。













