清华团队开源40亿参数智能体模型性能比肩300亿级闭源大模型

全球人工智能技术加速竞跑的背景下，模型规模与算力消耗之间的矛盾越来越突出。传统大模型依赖参数堆叠，带来部署成本高、能效偏低等问题，进而影响其在移动终端等场景的落地。围绕该痛点，我国产学研联合团队提出“能力密度提升”的技术路径。通过优化模型架构与训练策略，AgentCPM-Explore在参数量保持极小的情况下，在GAIA等8项国际评测中取得了更有竞争力的成绩。尤其是在Xbench-DeepResearch测试中，其表现超过多款国际主流闭源产品，验证了“小模型也能实现高性能”的可行性。技术分析认为，这一突破主要来自三上创新：一是引入动态任务分解机制，提高长程任务的处理效率；二是改进知识蒸馏方法，提升参数利用效率；三是采用混合精度训练方案，降低计算资源消耗。上述改进提升了模型在终端设备部署的可行性，为智能制造、移动医疗等应用提供了新的技术选择。行业专家表示，该成果说明了我国在高效能人工智能方向的阶段性突破。开源策略有望加快技术迭代，预计未来12个月内将推动轻量化模型在工业质检、智慧城市等场景的规模化应用。工信部涉及的人士指出，此类技术与“十四五”人工智能发展规划中关于绿色计算的方向一致，具备纳入新一代人工智能产业创新重点方向的潜力。

从“做大参数”转向“做高效率”，反映了技术走向应用时必须面对的现实选择。小模型能否在复杂任务中更稳、更省、更安全，将决定其发展空间。开放共享带来的不只是代码，更是一套可验证、可迭代的创新机制。把能力做实、把边界守牢、把应用落细，才能让新技术更扎实地服务经济社会高质量发展。

清华团队开源40亿参数智能体模型 性能比肩300亿级闭源大模型

清华团队开源40亿参数智能体模型性能比肩300亿级闭源大模型