Salesforce 开源深度研究 Agent:SFR-DeepResearch (SFR-DR)
salesforce 推出了全新的开源深度研究智能体:sfr-deepresearch(简称 sfr-dr)。该模型基于 openai 开源的小型权重模型,采用强化学习技术进行训练,具备自主推理、网络搜索与代码执行能力,能够独立完成复杂的深度研究任务。

在仅使用网页搜索、浏览器环境和 Python 解释器的情况下,SFR-DR-20B 在纯文本版本的 Humanity's Last Exam 基准测试中达到了 28.7% 的得分,展现出强大的自主研究潜力。

SFR-DR 的核心亮点包括:
核心能力:一个通过强化学习(RL)训练而成的全自主研究代理,可自行完成问题分析、信息检索、逻辑推理与代码编写,实现端到端的研究闭环。
-
性能表现:
- SFR-DR-20B 在 Humanity's Last Exam(纯文本模式)中取得 28.7% 的成绩
- 完全依赖在线搜索、网页浏览与 Python 执行环境
- 表现优于 OpenAI 的 o3 DeepResearch 以及 Kimi Researcher
-
训练方法:
- 采用端到端的强化学习框架,从具备基础推理能力的模型出发
- 在保持原有推理水平的同时,显著增强实际研究执行能力
高度自主:无需人为设计多代理协作流程,能自主制定研究计划、推导假设、生成解决方案并执行具体操作
论文链接:https://www.php.cn/link/55f16320eb523947f12d2e94d9630c6e
网友留言(0 条)