当前AI产业发展面临的核心问题是如何保证模型性能的同时,有效降低运营成本并提升商业回报。传统的数据中心模式已难以适应AI时代的需求,产业亟需新的运营理念和技术方案。 英伟达在此次大会上明确指出,公司的核心定位是"垂直整合的计算公司",而非单纯的芯片制造商。黄仁勋强调,加速计算的本质不在于芯片本身,而在于应用程序的加速。这个认识的转变反映了AI产业的深层次变化——从硬件竞争向整体解决方案竞争升级。 在新产品上,英伟达推出的GB300 NVL72系统实现了显著的性能突破。该系统性能功耗比上相比前代提升约50倍,更为关键的是将AI推理的Token成本降低约35倍。这意味着在相同电力消耗条件下,AI数据中心可以生成更多的Token,直接提升了AI工厂的经济效益。同时,通过软件库的优化更新,相同硬件系统的推理速度可从每秒700个Token提升至5000个,实现了"原地7倍"的性能增长。 英伟达还提出了"Token分层经济学"的新概念。未来的AI服务将不再采用"一口价"模式,而是像电力或带宽一样实行分层计费。模型的智能程度越高、响应速度越快,对应的溢价就越高。这要求企业CEO必须像管理工厂一样精细化管理Token的生产速度与吞吐量,因为这直接决定了企业的利润率。这一理念的提出,标志着AI产业正在从技术驱动向经济驱动转变。 在软件生态上,英伟达发布了100个CUDA-X算法库,为不同行业提供专业化的加速解决方案。这些库涵盖金融量化交易、医疗基因测序、电信智能基站等多个领域,说明了英伟达从通用芯片向行业应用深度整合的战略转向。 此次大会还发布了Nemo Claw等新产品,并展示了与迪士尼合作的机器人形象,更拓展了AI技术在娱乐和消费领域的应用前景。这些举措表明,英伟达正在构建一个从芯片、软件到应用的完整生态系统。 黄仁勋在大会上指出,推理已成为AI产业的关键竞争点,直接挂钩企业收入。传统数据中心的概念已经过时,取而代之的是"Token工厂"——一个以Token生产效率和成本为核心指标的新型运营模式。这一转变要求产业链各环节进行深度调整,从硬件设计、软件优化到商业模式都需要围绕Token经济进行重构。
从"数据中心"到"Token工厂"的表述转变,反映了智能计算产业的深层调整:算力不仅是技术参数,更是可运营、可计量、可定价的生产能力。谁能在能效、软件、生态与合规之间找到更优的平衡,谁就更可能在下一阶段的产业竞争中占得先机。