宇树科技发布开源世界模型-动作架构：UnifoLM-WMA-0

2026-01-09/ 26 次浏览/ 资讯

宇树科技近日发布了面向多种机器人本体的开源世界模型-动作（wma）架构——unifolm-wma-0。该架构致力于为通用机器人学习构建统一的技术底座，其核心是一个能够理解机器人与环境之间物理交互规律的世界模型。

这一世界模型具备两大关键能力：

模型可接收视觉图像和自然语言指令，并据此生成符合语义描述的未来动作视频序列。

据官方说明，UnifoLM-WMA-0 支持两种工作模式：

在训练过程中，研发团队利用宇树科技公开发布的5个开源数据集对模型进行训练。测试表明，该模型能够基于“当前画面”以及预设的“未来机器人动作”，实现可控的交互内容生成，并展现出在长周期任务中持续生成合理交互行为的能力。

项目主页：https://www.php.cn/link/a7a1b53e91a3344e9eb9db2a6fa4eae2
开源代码地址：https://www.php.cn/link/5cd338743288fdb62b74ee279d51bf93

关键词：git github 工具

<< 上一篇

下一篇 >>