理想自动驾驶负责人回应宇树王兴兴对 VLA 质疑

今年8月举行的2025年世界机器人大会上,宇树科技ceo王兴兴公开指出,当前备受关注的vla模型(视觉-语言-动作)属于一种相对“傻瓜式”的系统架构,并坦言对此类技术路径持保留和审慎态度。

理想自动驾驶负责人回应宇树王兴兴对 VLA 质疑

针对这一观点,理想汽车自动驾驶负责人郎咸朋于昨日发布回应。

理想自动驾驶负责人回应宇树王兴兴对 VLA 质疑

郎咸朋解释称,自己在8月并未第一时间表态,主要原因在于理想自研的VLA司机大模型尚未正式对外发布,缺乏实际成果支撑,不便空谈;同时,他对具身机器人领域也始终处于深度观察与持续跟踪阶段。

他进一步强调,自己与王兴兴的核心分歧在于:王兴兴更看重模型本身的架构设计,而他则认为,模型的价值不在于孤立的结构先进性,而在于能否深度嵌入并协同整个具身智能系统;在此前提下,高质量、大规模、闭环演进的数据才真正起决定性作用。

理想自动驾驶负责人回应宇树王兴兴对 VLA 质疑

郎咸朋分别从VLA与具身智能两个维度展开阐述:

VLA方向:

  • 在部分真实场景中,理想的VLA模型已展现出对物理世界的“认知涌现”能力,典型表现为用户频繁观察到此前端到端方案难以实现的类人驾驶行为。
  • 世界模型更适合作为「考场」,而非「考生」——其高昂的算力开销(涵盖训练与推理全过程)决定了它更适合部署于云端,用于生成高保真仿真数据、开展极限环境下的强化学习与验证测试。
  • 在自动驾驶实践中,脱离海量真实道路数据去讨论模型架构,无异于纸上谈兵。理想坚持VLA路线,正源于其依托数百万辆在途车辆构建的高效数据闭环体系,使公司在现有算力条件下,即可将智驾能力逼近人类驾驶员水平。

具身智能方向:

  • 实现高水平自动驾驶的前提,是将其视为一个完整的具身智能系统来统筹研发,软硬件各模块需在开发早期就深度耦合、协同进化,才能最大化系统整体效能。这要求企业必须走全栈自研之路——不仅覆盖软件层,更要贯通感知、决策、执行、硬件平台等全链条。
  • 模型成败的关键,在于与具身智能系统的整体适配度;而数据,则是驱动适配落地的根本燃料。尽管机器人领域普遍存在数据获取难、标注成本高等瓶颈,但在自动驾驶赛道,尤其是已建成成熟数据闭环的车企手中,这一挑战已被显著弱化。

此外,郎咸朋还援引理想CEO李想近期观点:未来五至十年,具身机器人的主流形态将聚焦于两大方向——以汽车为载体的移动型具身机器人,以及以人形为形态的服务型具身机器人。而理想的VLA大模型,不仅服务于当前全系智能电动车产品,也将成为未来汽车类具身机器人核心智能底座的重要组成部分。

源码地址:点击下载

网友留言(0 条)

发表评论