清华团队开源40亿参数智能体模型 性能比肩300亿级闭源大模型

全球人工智能技术加速竞跑的背景下,模型规模与算力消耗之间的矛盾越来越突出。传统大模型依赖参数堆叠,带来部署成本高、能效偏低等问题,进而影响其在移动终端等场景的落地。围绕该痛点,我国产学研联合团队提出“能力密度提升”的技术路径。通过优化模型架构与训练策略,AgentCPM-Explore在参数量保持极小的情况下,在GAIA等8项国际评测中取得了更有竞争力的成绩。尤其是在Xbench-DeepResearch测试中,其表现超过多款国际主流闭源产品,验证了“小模型也能实现高性能”的可行性。技术分析认为,这一突破主要来自三上创新:一是引入动态任务分解机制,提高长程任务的处理效率;二是改进知识蒸馏方法,提升参数利用效率;三是采用混合精度训练方案,降低计算资源消耗。上述改进提升了模型在终端设备部署的可行性,为智能制造、移动医疗等应用提供了新的技术选择。行业专家表示,该成果说明了我国在高效能人工智能方向的阶段性突破。开源策略有望加快技术迭代,预计未来12个月内将推动轻量化模型在工业质检、智慧城市等场景的规模化应用。工信部涉及的人士指出,此类技术与“十四五”人工智能发展规划中关于绿色计算的方向一致,具备纳入新一代人工智能产业创新重点方向的潜力。

从“做大参数”转向“做高效率”,反映了技术走向应用时必须面对的现实选择。小模型能否在复杂任务中更稳、更省、更安全,将决定其发展空间。开放共享带来的不只是代码,更是一套可验证、可迭代的创新机制。把能力做实、把边界守牢、把应用落细,才能让新技术更扎实地服务经济社会高质量发展。