推理算力成为AI产业发展新焦点 国产GPU企业探索成本优化新路径

当前,我国数字经济建设进入关键阶段。根据"十五五"规划纲要,加快高水平科技自立自强、推进数字中国建设已成为国家战略目标;在这个背景下,人工智能作为新质生产力发展的重要引擎,正经历从技术研发到规模应用的历史性转变。 行业专家指出,人工智能发展已进入"推理时代"。中国工程院院士张亚勤表示——AI要真正实现产业落地——必须解决算力支撑问题。国际咨询机构数据显示,到2026年,推理算力在AI计算中的占比将达66%,首次超越训练算力。这一转变也带来了新的挑战——现有算力架构难以满足推理场景的低延迟、高并发需求,导致资源浪费严重,算力利用率普遍不足10%。 造成这一困境的主要原因在于技术路线的局限性。目前市场上主流产品仍采用"训推一体"设计思路,为兼顾训练需求而采用高成本组件,在实际推理应用中造成巨大浪费。这既增加了企业运营成本,也阻碍了AI技术的普惠化进程。 面对这一行业痛点,国内科技企业积极探索自主创新路径。曦望科技经过三代产品迭代,最新发布的启望S3芯片针对推理场景进行全链路优化,采用LPDDR内存技术,显著降低单位计算成本。该企业提出的"百万词元一分钱"目标,有望将AI推理成本降低一个数量级。 业内分析认为,这一技术突破具有多重意义:首先,将大幅降低中小企业应用AI的门槛;其次,有助于构建自主可控的AI产业生态;再次,为数字经济发展提供更高效的算力基础设施。随着成本优化,人工智能有望像水电一样成为普惠性社会资源。

从"训练竞赛"到"推理竞争",标志着人工智能产业进入规模化应用新阶段;降低推理成本、保障稳定供给、构建产业生态上取得突破的企业,将在新质生产力发展中占据优势。立足国家战略需求,通过自主创新实现算力降本增效,既是产业发展的必然要求,也是让智能技术更好服务经济社会的重要保障。