AI“世界模型”新角逐:Runway携GWM-1入场,开启物理世界模拟新征程

   时间:2025-12-15 09:14 来源:快讯作者:华尔街见闻

AI视频生成领域正经历一场深刻变革,从单纯追求画质提升转向对物理世界运行规律的深度模拟。近日,行业独角兽Runway推出首款通用世界模型GWM-1,正式加入由谷歌、英伟达等科技巨头主导的"世界模拟"竞争赛道。这款新模型通过构建对物理规律的认知体系,实现了视频生成技术在连贯性与交互性层面的重大突破。

区别于传统视频生成工具,GWM-1采用自回归架构构建模拟系统,其核心能力体现在对环境动态的实时推演。该模型通过逐帧预测技术,能够模拟物理世界随时间演变的完整过程,支持长达数分钟的连续交互操作。Runway技术团队透露,模型在训练阶段融入了大量物理引擎数据,使其在处理几何结构、光影变化等复杂场景时表现出显著优势。

这个通用模型体系实际由三个专业子模型构成:面向数字环境的GWM-Worlds、专注机器人训练的GWM-Robotics,以及整合语音交互的GWM-Avatars。三个模块均基于最新发布的Gen-4.5基座模型开发,该基座在本次升级中新增原生音频生成与多镜头编辑功能,视频生成时长扩展至60秒,角色一致性表现获得显著提升。

在交互界面设计上,GWM-Worlds提供24帧/秒、720p分辨率的实时渲染能力。用户可通过文本指令或参考图像快速构建虚拟场景,并在模拟过程中动态调整视角、环境参数甚至物体状态。这种设计不仅适用于游戏开发预览和VR内容制作,更被视为训练AI智能体的重要试验场。某科技评论人士指出:"该模型让智能体能在虚拟环境中反复试错,这种训练方式可能彻底改变自动驾驶等领域的研发模式。"

针对工业机器人领域,GWM-Robotics通过生成合成数据解决真实场景采集难题。该模块能够模拟极端天气、突发障碍等罕见情况,帮助机器人在虚拟空间完成策略验证。据Runway披露,已有多家机器人企业通过SDK接入测试,这种B端服务模式或将开辟新的收入增长点。技术白皮书显示,其合成数据生成效率较传统方法提升80%,且能精准复现真实物理参数。

在人机交互维度,GWM-Avatars实现了视频与语音的深度融合。生成的数字人支持长时间连续对话,画面质量在交互过程中保持稳定。教育科技领域专家分析称,若该技术实现规模化应用,可能重塑在线教育与客户服务行业的交互模式。目前模型已支持40种语言实时交互,唇形同步精度达到98.7%。

为支撑模型训练的庞大算力需求,Runway与云服务商CoreWeave达成战略合作。双方将利用英伟达GB300 NVL72机架集群构建训练基础设施,这套系统可同时处理72块GPU的并行计算任务。公司CTO在技术分享会上强调:"世界模拟需要跨越从像素到物理规律的认知鸿沟,这要求我们在算法创新与算力储备上同步突破。"

随着GWM-1的发布,Runway的商业版图从影视特效领域延伸至智能制造、虚拟仿真等重工业场景。但行业观察者指出,在通用世界模型赛道,该公司将面临来自科技巨头的激烈竞争。能否将影视特效领域的技术优势转化为物理世界模拟能力,将成为决定其估值跃升的关键因素。当前模型在复杂场景下的物理推演仍存在0.3秒延迟,这项指标的优化进度或将影响其市场拓展速度。

 
 
更多>同类天脉资讯
全站最新
热门内容
媒体信息
新传播周刊
新传播,传播新经济之声!
网站首页  |  关于我们  |  联系方式  |  版权隐私  |  RSS订阅  |  违规举报