智源开源 RoboBrain-X0,打破机器人跨本体泛化困境
北京智源人工智能研究院正式宣布开源 robobrain-x0 —— 一款具备零样本泛化能力,并可在少量样本微调下驱动多种真实机器人完成复杂操作任务的跨本体基座大模型。

该模型继承自 RoboBrain 的多模态基础架构,在 RoboBrain 2.0 数据集之上,进一步融合了来自真实机器人系统的动作执行数据。通过统一建模视觉、语言与动作信号,RoboBrain-X0 实现了从环境感知到行为决策的一体化处理,支持在不同机器人形态间的高效迁移与适配。

其核心设计理念在于:将高阶任务(例如“清理书桌”)自动拆解为不依赖特定机器人结构的通用语义动作序列,并借助统一映射机制,将高层指令精准转化为各类机器人可执行的具体动作。这一机制使 RoboBrain-X0 能够摆脱对单一机器人平台的绑定,实现异构本体的统一建模,同时展现出强大的零样本迁移能力和复杂任务分解性能。
此外,智源同步发布了支撑模型训练的核心数据资源——RoboBrain-X0-Dataset。该数据集覆盖“感知-认知-行动”全流程,致力于打破数据壁垒,为研究者提供即拿即用的高质量开发素材。其主要内容包括四大类:
- 多模态VQA数据:结合视觉问答与逻辑推理任务,显著增强模型对视觉语言信息的理解及空间交互响应能力。
- 精选开源动作数据:整合多个公开场景下的优质动作轨迹数据,提升模型在多样化任务中的理解与迁移表现。
- 产业合作采集数据:联合星海图、松灵机器人等行业伙伴,在真实设备上收集并标注的丰富应用场景数据,强化模型在实际工业环境中的适用性。
- 自研高质量采集数据:建立标准化采集流程,构建大量精细化标注的“指令-动作”配对样本,显著优化模型在动态决策与任务分解方面的性能。

目前,RoboBrain-X0 已全面开放,包含预训练权重、完整数据集和技术文档,并已深度集成至智源 RoboBrain 2.0 工具链体系中,助力开发者快速开展机器人智能研发。
下一篇 >>
网友留言(0 条)