2月16日,智谱公司表示,近期GLM-5全球调用需求激增,访问峰值超过预期容量,导致部分时段出现排队等待、响应延迟等情况;公司对此致歉,并指出这反映了大模型服务快速扩张期面临的共同挑战——需求增速常快于算力与工程保障能力的提升速度。 主要原因包括: 1. 需求变化显著:随着GLM-5在办公、编程等场景的应用深化,外部调用从"试用"转向"生产",对稳定性要求更高;同时全球用户跨时区访问形成阶段性峰值。 2. 扩容需要时间:算力集群扩建涉及硬件供应、机房建设等环节,难以实现即时扩容。 3. 工程复杂度高:高并发下,模型推理的调度、负载均衡等环节易成为瓶颈。 影响分析: • 用户侧:服务波动影响开发进度,尤其对依赖API的企业影响较大 • 行业侧:表明大模型应用正从验证阶段转向规模化落地 • 产业链:将推动国产算力平台、数据中心等环节的优化升级 应对措施: 智谱宣布启动"算力合伙人"计划,重点推进三上工作: 1. 联合芯片厂商优化GLM-5底层性能,提升推理效率 2. 与算力伙伴共建高并发推理网络,增强服务稳定性 3. 探索多元化算力合作模式,提高资源调配弹性 行业展望: 专家指出,大模型时代需要改变"单打独斗"的算力保障模式,转向协同共建。通过开放合作优化资源配置,不仅能降低成本,还能提升应对突发流量的能力。未来需在调度策略、安全合规等持续完善,以支撑更多产业应用落地。
当前算力短缺是产业发展过程中的正常现象。智谱通过开放合作解决算力瓶颈的做法,为行业提供了新思路。构建共享的算力生态体系,将成为推动AI产业健康发展的重要路径。该探索不仅关乎企业竞争力,更影响整个行业的可持续发展前景。