就在3月24日的新闻发布会上,国家数据局局长刘烈宏透露了一个惊人的数据:截至今年3月,我国的日均Token调用量已经突破140万亿。官方直接把这个长期困扰翻译界的术语“Token”翻译成了“词元”,业内人士觉得这个名字既准确又好记。按照这个数据来看,中国已经连续两周在全球大模型的Token调用榜上排名第一。要知道,OpenRouter在3月15日发布的最新数据显示,国内的周调用量达到了4.69万亿。摩根大通那边也预测得很乐观,说中国在AI推理上消耗的Token量会从2025年的约10千万亿猛增到2030年的约3900千万亿,五年时间里涨幅差不多有370倍。 说白了,“词元”就是大模型处理信息时最小的单位。不管是你提个问题还是让AI写段代码,最终都得被拆分成一个个词元去运算。跟AI说一句话通常要花几百到几千个词元,这意味着AI已经渗透进了我们的日常生活,只不过大家可能还没完全意识到这一点。DeepSeek解释说,可以把词元看成是模型世界里的积木块——你的提问和AI的回答都是用这些积木搭起来的。 现在市面上的大模型API收费方式都变成按词元计价了,输入输出多少词元都明码标价。这就导致调用量成了衡量模型价值的关键指标。业内人士觉得,随着AI越来越普及,“词元”很快就会变成一种必须的能源。 最近Agent开发工具火起来了,像OpenClaw和Claude Code这类工具越来越多。国内的厂商为了争夺开发者市场,正大打Token订阅服务的争夺战。像“沪生沪长”的阶跃星辰就在本周推出了月度订阅方案Step Plan,专门针对OpenClaw和Coding场景设计的。它首发支持的Step 3.5 Flash模型在OpenRouter总调用周榜上可是全球第一。特别值得一提的是,Step Plan所有档位都提供高速推理速度,没设什么普通版和极速版的区分。在别人还把高速体验当收费升级项的时候,阶跃星辰把极速体验做成了标配。 作为大模型的领军企业,MiniMax也宣布把Coding Plan升级成了Token Plan。升级之后的Plus及以上套餐用户在继续用M2.7编程模型的基础上,还能免费获赠海螺视频、语音合成等多模态模型的调用额度。