全球每年新增学术论文超过300万篇,研究人员平均需要花费30%的工作时间进行文献筛选与分析;传统文献处理工具虽然有所帮助,但普遍存在引文准确率不足、归因能力有限的问题,其中引文幻觉尤为严重——部分测试中错误率甚至高达90%。
面对"文献爆炸"与"证据核验"的挑战,真正有价值的工具不在于制造更多文字,而在于把结论建立在可核查的证据之上。开源模型与公开基准的出现,为学界提供了共同校正、共同提升的路径。把效率建立在可靠之上,才能让科研人员从信息洪流中更稳地获取有用的信息,并将精力回归到提出好问题与实现新发现的本质工作中。