蔡浩宇新加坡再创业:LPM 1.0让AI虚拟角色“活”起来

   时间:2026-04-15 15:21 来源:快讯作者:吴婷

在AI视频生成赛道上,一场关于技术路线的分野正在悄然形成。当行业普遍聚焦于画面精度提升时,Anuttacon公司推出的LPM 1.0模型却以"无限时长"交互能力引发关注。这款由米哈游前董事长蔡浩宇主导研发的模型,通过重构视频生成的技术范式,在实时交互领域开辟出全新战场。

传统AI视频生成模型长期受困于"表演三难困境":在追求画面真实度(表现质量)、即时响应速度(实时推理)和持续稳定性(长程稳定性)时,三者往往难以兼得。主流模型在生成30秒以上视频时,常出现角色面部特征突变、身份错乱等"自回归漂移"现象。LPM 1.0通过引入在线流式生成架构,将170亿参数的扩散模型压缩为"主干-精炼器"双层结构,在内存占用恒定条件下实现身份一致性突破。

技术突破的核心在于分布匹配蒸馏训练法。该模型将视频生成过程分解为粗粒度轨迹控制与高保真细节还原两个阶段,主干网络确保角色身份持续稳定,精炼器则负责捕捉微表情变化。在官方演示中,系统成功生成45分钟连贯视频,角色在持续对话中始终保持身份统一,这在现有技术体系中堪称革命性进展。

交互能力的升级同样引人注目。LPM 1.0首次实现全双工音视频对话,通过双路音频流处理技术,使AI既能根据自身话语驱动口型同步,又能实时响应用户语音。当检测到用户语气变化时,系统可自动生成挑眉、点头等28种微表情,配合呼吸频率调整,使虚拟角色呈现出近似真人的交互质感。尽管当前画面分辨率仍存在提升空间,但这种"数字生命"的进化方向已清晰可见。

支撑技术突破的,是米哈游积累的独特数据资产。不同于短视频平台的海量泛化数据,Anuttacon构建了包含78种情感类别、5000个动作描述符的结构化表演数据库。其"身份感知参考图像管线"要求输入全局外观、多视角图像及8类表情范例,这种工业级品控标准源自游戏开发中对角色塑造的严苛要求。在训练阶段,系统对倾听行为进行350万次标注,使AI掌握对话间隙的呼吸节奏与犹豫停顿,精准命中行业痛点。

商业化路径选择凸显战略考量。Anuttacon明确拒绝开源模型权重,将LPM定位为虚拟角色交互领域的视觉引擎。在算力成本方面,虽然单GPU可实现0.35秒处理1秒视频,但大规模并发场景仍面临硬件压力。其首款买断制游戏《星之低语》以33.99元定价试水C端市场,虽因上下文衔接问题暂未引爆市场,却验证了技术可行性。当前重点转向B端场景,虚拟主播、AI客服等需要24小时稳定运行的领域,成为模型落地的首要突破口。

这项技术对内容创作生态的潜在影响正在显现。当用户仅需提供照片和文本描述即可驱动AI完成表演,传统UGC平台的建模门槛将被彻底打破。Anuttacon的野心不止于技术供应商,其构建的"照片-对话-表演"创作链条,正在为新型互动媒体形态奠定基础。在蔡浩宇的布局中,这场关于数字生命的竞赛,或许才刚刚拉开序幕。

 
 
更多>同类天脉资讯
全站最新
热门内容
媒体信息
新传播周刊
新传播,传播新经济之声!
网站首页  |  关于我们  |  联系方式  |  版权隐私  |  RSS订阅  |  违规举报 鲁公网安备37010202700497号