Salesforce 开源深度研究 Agent:SFR-DeepResearch (SFR-DR)

salesforce 推出了全新的开源深度研究智能体:sfr-deepresearch(简称 sfr-dr)。该模型基于 openai 开源的小型权重模型,采用强化学习技术进行训练,具备自主推理、网络搜索与代码执行能力,能够独立完成复杂的深度研究任务。

Salesforce 开源深度研究 Agent:SFR-DeepResearch (SFR-DR)

在仅使用网页搜索、浏览器环境和 Python 解释器的情况下,SFR-DR-20B 在纯文本版本的 Humanity's Last Exam 基准测试中达到了 28.7% 的得分,展现出强大的自主研究潜力。

Salesforce 开源深度研究 Agent:SFR-DeepResearch (SFR-DR)

SFR-DR 的核心亮点包括:

  • 核心能力:一个通过强化学习(RL)训练而成的全自主研究代理,可自行完成问题分析、信息检索、逻辑推理与代码编写,实现端到端的研究闭环。

  • 性能表现

    • SFR-DR-20B 在 Humanity's Last Exam(纯文本模式)中取得 28.7% 的成绩
    • 完全依赖在线搜索、网页浏览与 Python 执行环境
    • 表现优于 OpenAI 的 o3 DeepResearch 以及 Kimi Researcher
  • 训练方法

    • 采用端到端的强化学习框架,从具备基础推理能力的模型出发
    • 在保持原有推理水平的同时,显著增强实际研究执行能力
  • 高度自主:无需人为设计多代理协作流程,能自主制定研究计划、推导假设、生成解决方案并执行具体操作

论文链接:https://www.php.cn/link/55f16320eb523947f12d2e94d9630c6e

网友留言(0 条)

发表评论