2月4日,权威测评榜单DeepResearch Bench公布了最新结果,百度千帆深度研究Agent(Qianfan-DeepResearch Pro)把榜单头名的宝座给抢占了。在“全面性、洞察力、指令遵循度和可读性”这四大核心维度上,它给用户呈现了行业领先的表现。这个Agent在做复杂研究的时候,能像人类专家那样上手,能把传统需要几天干的活儿压缩到分钟级里搞定,现在已经在学术、金融和商业分析领域遍地开花。 百度千帆深度研究Agent把端到端的研究能力发挥得淋漓尽致。相比起以前那种只能干单一活儿的评测体系,DeepResearch Bench算是填补了一个空白。这份榜单邀请了领域专家设计了100个博士级别的任务,覆盖了22个学科。评测里不光要考察报告写得好不好,还得看看引用是不是准确,这套标准在全球范围内是最硬核的。 这个Agent能把任务做得那么漂亮,全靠背后的技术底子扎实。它采用了Agentic架构,靠着“任务理解-规划-执行”这一套循环机制干活。要给它找点保障的话,百度的搜索技术和RAG技术提供了海量的信息来源。为了让任务执行更稳当,系统先粗后细地展开工作,还会随时反思调整策略,这样就不容易走弯路或者产生幻觉了。 到了报告生成这一步,它用了个两阶段的渲染机制。先产出一个pivot报告保证逻辑通顺内容全,再拿这个报告去渲染出各种格式的文档,最后就能实现一次研究多个报告的交付了。这个深度研究Agent已经上架了百度千帆平台。用户只要输入调研需求,它就能在十几分钟内产出带引用的专业级报告。 这一次拿奖其实是百度千帆 Agent Infra强大实力的一次集中展示。这个平台提供模型、工具、Agent开发等一站式服务。它已经积累了超130万个Agents,像“百度AI搜索”这样的独家工具每天被调用的次数都破了千万。