一、问题:免费时代落幕,大模型调用成本大幅攀升 腾讯云于2026年3月11日正式宣布,将于两日后对其智能体开发平台(Tencent Cloud ADP)的计费规则实施调整。此次调整涉及两个层面:一是GLM 5、MiniMax 2.5、Kimi 2.5等第三方主流模型将正式结束免费公测阶段,进入商业化计费轨道;二是腾讯云自研的混元系列模型价格出现较大幅度上调。 具体来看,Tencent HY2.0 Instruct模型的输入价格由每千Token 0.0008元调整至0.004505元,涨幅约为4.6倍;输出价格由0.002元上调至0.01113元,涨幅约为4.6倍。Tencent HY2.0 Think模型的输入价格由0.001元调整至0.0053元,输出价格由0.004元上调至0.0212元,涨幅均超过4倍。对于已购买平台套餐的用户,腾讯云表示可按调整后价格继续抵扣,未使用额度不受影响。 二、原因:成本压力多点叠加,供需失衡推动价格重构 此轮涨价并非孤立事件,而是多重结构性因素共同作用的结果。 从需求端来看,生成式智能技术与智能体应用的爆发式增长,使公有云平台上的大模型调用量呈现指数级扩张态势。据IDC数据,2025年上半年中国公有云大模型调用量已达536.7万亿Tokens,较2024年全年增长近400%。调用量的急剧攀升直接带动了以GPU为核心的高端算力需求持续走高,供需矛盾日趋突出。 从供给端来看,上游硬件与能源成本的持续上涨构成了另一重压力。存储芯片领域,SK海力士明确表示2026年存储芯片价格将延续上行趋势,当前DRAM及NAND整体库存处于历史低位,供需失衡更强化了价格上涨预期。另外,数据中心电力成本占运营总成本的比例高达40%至60%,全球电力供应缺口的持续扩大,进一步加剧了云服务商的运营负担。上述成本压力沿产业链逐级传导,最终体现在终端云服务的定价调整上。 三、影响:行业涨价浪潮蔓延,"只降不升"惯例被打破 腾讯云的调价举措并非行业个例,而是2026年以来全球云计算行业新一轮涨价浪潮的缩影。 在国际市场,亚马逊AWS率先于今年1月宣布将面向大模型训练的EC2机器学习容量块服务价格上调约15%,打破了云计算行业长期以来"价格只降不升"的惯例。谷歌云随即宣布自今年5月1日起上调全球数据传输服务价格,北美地区每GB费率由0.04美元翻倍至0.08美元。 国内市场同样感受到这股涨价压力。中小云计算厂商优刻得于3月1日宣布对全线云产品与服务价格进行上浮;专注大模型服务的智谱云也于今年2月将其GLM Coding Plan套餐价格整体上调30%。阿里云、百度智能云、腾讯云三大头部厂商则采取了更为精细的"分层定价"策略,在高端算力服务上调价的同时,仍通过低价套餐维系市场份额与开发者生态,以期在商业化转型与用户留存之间寻求平衡。 四、对策:分层定价成主流,存量用户权益有所保障 面对成本压力,各云服务商普遍采取了差异化的应对策略,而非简单的全线提价。腾讯云此次调整保留了套餐抵扣机制,对存量用户的权益给予一定保护,体现出平台在商业化转型过程中对用户体验的兼顾考量。 分层定价策略的广泛采用,意味着云服务商正在尝试将高价值用户与价格敏感型用户进行有效区分,通过产品结构的精细化设计来实现收益最大化,同时降低用户流失风险。该策略在短期内或能缓解成本与市场之间的矛盾,但能否在激烈竞争中持续奏效,仍有待市场检验。 五、前景:算力需求持续上行,行业定价体系面临深度重塑 中信证券在近期研究报告中指出,海外推理与训练算力需求持续旺盛,是推动亚马逊云和谷歌云提价的直接动因。该机构同时预判,随着推理端智能应用的密集落地与训练端模型的持续迭代,算力需求在未来3至6个月内仍有望进一步上行,云服务定价的上行压力短期内难以根本缓解。
云服务价格调整反映供需变化与成本传导,也标志生成式AI产业从扩张转向价值深化;企业需平衡成本与技术投入,行业需优化资源配置,推动数字经济健康发展。