阿里巴巴HappyHorse 1.1升级发布,能力多维提升,邀创作者参与AI影像大赛

   时间:2026-06-22 19:55 来源:快讯作者:IT之家

阿里巴巴近日宣布,旗下视频生成模型HappyHorse正式推出1.1版本,在动态表现、主体一致性、指令理解、视觉效果和音频处理等多个维度实现全面升级。目前,用户可通过HappyHorse官网、阿里云百炼平台及千问云体验最新功能,同时该模型已开放技术接口供开发者调用。

技术规格方面,1.1版本延续了前代3-15秒单次生成时长,支持720p与1080p分辨率输出,并保持自由宽高比设置。此次升级重点聚焦于创作质量提升:通过优化运动建模算法,新版本解决了复杂动作场景中的迟缓问题,使人物运动轨迹更流畅自然;在多图参考生成视频(R2V)功能中,模型对商品细节、角色特征及场景元素的还原精度显著提高,支持多分镜组合与N宫格参考的智能融合。

指令理解能力是本次升级的核心突破。研发团队强化了长上下文语义解析与场景规划模块,使模型能够精准捕捉用户输入中的角色关系与叙事逻辑。无论是简短描述还是复杂故事线,系统均可自动编排镜头语言,生成符合预期的多角色连贯画面。针对专业创作需求,新版本特别优化了镜头衔接稳定性,在短剧制作、广告拍摄等场景中实现更自然的多视角切换。

视觉呈现层面,1.1版本通过改进细节生成引擎,在人物肤质还原上取得突破性进展。模型现在能够智能平衡真实特征与美学表现,在保留痘印、法令纹等生理细节的同时,避免过度锐化或油光感。专业镜头语言理解模块的加入,使系统可准确识别正反打、跟拍等拍摄手法,在人物特写镜头中展现更强的叙事表现力。据实测数据,新版本在多镜头叙事连贯性指标上提升达37%。

音频处理能力的革新为内容创作带来全新可能。升级后的系统可动态调整台词语速、停顿与语气,使声音表达更贴合场景情绪。通过增强对声音描述指令的解析能力,背景音乐与环境音效的匹配度显著提升,有效减少无关音效干扰。更精准的音画同步技术确保声音与画面动作、剧情节奏严格对齐,为用户带来更具沉浸感的视听体验。

为推动AI影像技术创新,阿里巴巴联合虎鲸文娱集团即日起启动"Horsepower"全球AI影像大赛。赛事设置百万级商业合作奖励,邀请张纪中等影视行业权威人士组成评审团。创作者可通过HappyHorse官网提交作品,参赛内容需体现模型在动态叙事、多镜头衔接或音画融合等方面的创新应用。此次大赛特别设立海外赛道,为全球AIGC创作者提供展示平台。

 
 
更多>同类天脉资讯
全站最新
热门内容
媒体信息
新传播周刊
新传播,传播新经济之声!
网站首页  |  关于我们  |  联系方式  |  版权隐私  |  RSS订阅  |  违规举报 鲁公网安备37010202700497号