智能体应用与编程热潮推高Token消耗，中国算力服务商迎机遇亦承压

当前，人工智能产业正处于应用快速迭代的关键阶段。中国大模型厂商密集推出新产品，算力需求呈现爆发式增长。根据AI模型聚合平台OpenRouter公布的最新数据，中国人工智能模型的Token总消耗量达5.3万亿，占全球消耗总量的61%，此数据反映了中国全球AI应用市场中的重要地位。从应用结构看，Token消耗的快速增长主要由两上驱动。其一是大模型性能持续提升，模型能力增强后，处理复杂任务所需计算量随之增加。其二是应用场景发生结构性转变。编程已成为Token消耗的最大应用类别，而以OpenClaw为代表的智能体应用消耗了该平台输出Token总量的一半以上。这些新型应用对算力的需求显著高于传统问答场景。在编程领域，Token消耗量尤为突出。AI编程模型需要处理极长的上下文以确保代码准确性，开发者与模型之间反复沟通、调试和优化，带来大量Token消耗。相比之下，传统问答应用的Token消耗量较低。数据显示，MiniMax M2.5因其在编程场景中的优异表现，单周Token消耗量激增近200%，达到2.45万亿，位居全球前列。Kimi K2.5和智谱GLM-5分别以1.21万亿和7800亿Token的消耗量排名第二、第三。智能体应用的兴起继续放大了算力需求。与单次API调用不同，智能体执行一项任务往往需要多次调用MaaS或API接口。以智能体点外卖为例，系统需要多次调用不同的API完成搜索、下单、支付等多个步骤，每一步都产生额外的Token消耗。这种多层级、多轮次的交互模式使算力需求呈指数级增长。产业链各环节正在积极应对这一变化。作为算力服务商，派欧云计算等企业在春节前后进入“备战”状态，为模型厂商提供充足的算力弹性以应对流量冲击。中兴通讯等硬件厂商也在加快布局，其2025年算力业务营收同比增长约150%，显示出市场需求的强劲。，算力价格面临上行压力。业内人士指出，至少在未来两到三年内，MaaS领域将保持高增长态势，算力供应趋紧。从产业发展的长期趋势看，算力需求增长可预见。清华系算力软件企业的联合创始人表示，行业共识是2026年MaaS领域Token需求量至少有十倍增长。这意味着现有算力供应体系需要大规模扩容。然而，产能提升需要时间，短期内供不应求难以避免。但随着产业发展，新的算力基础设施优化，市场最终会趋于平衡。有一点是，算力服务的内涵也在发生变化。传统算力服务主要聚焦模型训练和科学计算，而当前推理服务与Token消耗已深度绑定，成为体量最大、增长最快的场景。用户需求正从单纯的算力资源转向Token服务，这要求服务商不仅提供充足的计算能力，还要优化Token消耗效率，帮助用户在有限成本下获得更好的应用效果。

这场由技术创新驱动的算力革命，既检验着中国数字经济的韧性，也考验着产业界的战略定力。当算力如同电力般成为基础生产要素，如何平衡短期爆发与长期可持续、市场活力与资源效率，将成为决定我国能否赢得新一轮科技竞争的关键命题。历史经验表明，每一次基础设施的升级换代，都会催生新的经济形态与发展范式。