AI 视频公司 Runway 发布世界模型 GWM‑1
ai 视频技术公司 runway 最近正式发布其通用型“世界模型”系列——gwm-1,并同步升级旗下核心视频生成模型 gen‑4.5。

GWM-1 以 Gen‑4.5 为底层基础,支持逐帧生成与实时推理,具备通过摄像机位姿、机器人控制指令、音频信号等多种模态输入进行交互式操控的能力。该模型家族包含三大专业化后训练分支:「GWM Worlds」「GWM Avatars」与「GWM Robotics」:
- GWM Worlds 聚焦于长时序动态场景下的空间一致性建模,允许用户显式设定环境的几何结构、光照条件及物理行为规则,并对输入动作做出高保真响应;
- GWM Robotics 是一款依托真实机器人数据训练而成的“可学习模拟器”,能生成受动作条件约束的连续视频流,同时支持“反事实推演”——即在虚拟环境中快速尝试多种执行路径与结果,从而显著减少对高成本真实世界数据采集和实体测试的依赖;
- GWM Avatars 是面向语音驱动的交互式人物视频生成模型,可在长时间对话中持续输出自然流畅的人体动作与微表情(包括面部神态、眼球转动、唇形匹配及手势表达),适用于实时教学辅导、智能客服系统、职业培训仿真、沉浸式娱乐及游戏交互等多元应用场景。
Runway 在线上发布会上指出,公司技术布局正加速从传统影视内容创作向机器人控制、物理系统建模与生命科学交叉领域延伸。官方强调,世界模型代表了当前人工智能发展的关键前沿:单纯依赖语言模型已难以应对机器人操作、疾病机制解析、基础科学突破等复杂挑战;真正的范式跃迁,需让AI模型如同人类一般,在高度拟真的模拟世界中感知、试错并自主演化。


Gen‑4.5 的本次迭代重点强化了画面细节还原度与创作者自由度,新增原生音频合成与精细化编辑功能,以及多视角镜头协同剪辑能力;同时,Runway 坦言当前视频生成技术仍面临因果逻辑推理薄弱、物体恒常性保持困难、结果偏差倾向明显等共性瓶颈,这些正是世界模型后续研发将持续攻坚的核心课题。
源码地址:点击下载
网友留言(0 条)