智能体应用与编程热潮推高Token消耗,中国算力服务商迎机遇亦承压

当前,人工智能产业正处于应用快速迭代的关键阶段。中国大模型厂商密集推出新产品,算力需求呈现爆发式增长。根据AI模型聚合平台OpenRouter公布的最新数据,中国人工智能模型的Token总消耗量达5.3万亿,占全球消耗总量的61%,此数据反映了中国全球AI应用市场中的重要地位。 从应用结构看,Token消耗的快速增长主要由两上驱动。其一是大模型性能持续提升,模型能力增强后,处理复杂任务所需计算量随之增加。其二是应用场景发生结构性转变。编程已成为Token消耗的最大应用类别,而以OpenClaw为代表的智能体应用消耗了该平台输出Token总量的一半以上。这些新型应用对算力的需求显著高于传统问答场景。 在编程领域,Token消耗量尤为突出。AI编程模型需要处理极长的上下文以确保代码准确性,开发者与模型之间反复沟通、调试和优化,带来大量Token消耗。相比之下,传统问答应用的Token消耗量较低。数据显示,MiniMax M2.5因其在编程场景中的优异表现,单周Token消耗量激增近200%,达到2.45万亿,位居全球前列。Kimi K2.5和智谱GLM-5分别以1.21万亿和7800亿Token的消耗量排名第二、第三。 智能体应用的兴起继续放大了算力需求。与单次API调用不同,智能体执行一项任务往往需要多次调用MaaS或API接口。以智能体点外卖为例,系统需要多次调用不同的API完成搜索、下单、支付等多个步骤,每一步都产生额外的Token消耗。这种多层级、多轮次的交互模式使算力需求呈指数级增长。 产业链各环节正在积极应对这一变化。作为算力服务商,派欧云计算等企业在春节前后进入“备战”状态,为模型厂商提供充足的算力弹性以应对流量冲击。中兴通讯等硬件厂商也在加快布局,其2025年算力业务营收同比增长约150%,显示出市场需求的强劲。,算力价格面临上行压力。业内人士指出,至少在未来两到三年内,MaaS领域将保持高增长态势,算力供应趋紧。 从产业发展的长期趋势看,算力需求增长可预见。清华系算力软件企业的联合创始人表示,行业共识是2026年MaaS领域Token需求量至少有十倍增长。这意味着现有算力供应体系需要大规模扩容。然而,产能提升需要时间,短期内供不应求难以避免。但随着产业发展,新的算力基础设施优化,市场最终会趋于平衡。 有一点是,算力服务的内涵也在发生变化。传统算力服务主要聚焦模型训练和科学计算,而当前推理服务与Token消耗已深度绑定,成为体量最大、增长最快的场景。用户需求正从单纯的算力资源转向Token服务,这要求服务商不仅提供充足的计算能力,还要优化Token消耗效率,帮助用户在有限成本下获得更好的应用效果。

这场由技术创新驱动的算力革命,既检验着中国数字经济的韧性,也考验着产业界的战略定力。当算力如同电力般成为基础生产要素,如何平衡短期爆发与长期可持续、市场活力与资源效率,将成为决定我国能否赢得新一轮科技竞争的关键命题。历史经验表明,每一次基础设施的升级换代,都会催生新的经济形态与发展范式。