Meta 杨立昆团队最新开源项目:代码世界模型 (Code World Model)

杨立昆领衔的 meta fair 团队推出了全新 ai 研究成果:代码世界模型(code world model,cwm),这是全球首个系统性将世界模型应用于代码生成任务的大语言模型。

Meta 杨立昆团队最新开源项目:代码世界模型 (Code World Model)

Meta 杨立昆团队最新开源项目:代码世界模型 (Code World Model)

该模型的核心理念正如杨立昆所强调:在生成代码的过程中,预先模拟和预测每条代码指令可能引发的行为与结果,从而更精准地规划出符合用户预期功能的程序逻辑。因此,CWM 不仅能生成代码,还能逐步“执行”并理解代码运行过程中的状态变化。

Meta 杨立昆团队最新开源项目:代码世界模型 (Code World Model)

核心特性

  • 模型规模:拥有320亿参数,支持长达131,000 tokens 的上下文,可处理复杂项目级代码与长文档。
  • 技术突破:通过建模变量演化、环境反馈与程序状态流转,实现对代码行为的动态模拟,具备代码生成、调试、推理与任务规划能力,逼近人类开发者思维模式。
  • 训练数据构成:涵盖大量Python代码执行轨迹及Docker环境中的交互记录,充分捕捉真实编程场景下的动态行为。

Meta 杨立昆团队最新开源项目:代码世界模型 (Code World Model)

Meta 杨立昆团队最新开源项目:代码世界模型 (Code World Model)

性能表现亮点

  • 在SWE-Bench Verified基准测试中取得65.8%的成绩,接近GPT-4表现,显著优于同规模开源模型。
  • LiveCodeBench得分达68.6%,Math-500高达96.6%,AIME 2024达到76.0%,体现其强大的多领域泛化能力。

Meta 杨立昆团队最新开源项目:代码世界模型 (Code World Model)

典型应用场景

  • 支持端到端代码生成、自动调试、测试用例构建与程序自我修复,完整复现人类开发流程。
  • 适用于高复杂度编程任务、数学问题求解以及需多轮迭代的软件工程场景。

开源信息与当前限制

  • 模型权重、训练方法与检查点已全面开源,限于非商业研究用途。
  • 目前仅支持Python语言,团队计划后续扩展至更多编程语言。

GitHub:https://www.php.cn/link/c42af68f28d516c05caf4ef35a6c4b0c
Hugging Face:https://www.php.cn/link/50a0eaaf3cd93fa86551c7112c259a3a

网友留言(0 条)

发表评论