当地时间3月2日,中国移动在西班牙巴塞罗那世界移动通信大会上发布原创Scale-Across技术体系——GSE-DCI(全调度以太网智算中心互联)技术,并展示全球首台吞吐量超过115.2Tbps的智算互联路由器样机。
这一成果标志着我国在跨智算中心互联网络核心技术领域取得重大突破,为全球算力基础设施建设提供了中国方案。
随着人工智能技术快速发展,算力需求呈现爆发式增长态势。
单一智算中心受制于电力供应和物理空间限制,已难以满足日益增长的算力需求。
业界普遍认为,通过多智算中心互联构建超级集群,已成为继卡间互联和机间互联之后的第三大网络支柱。
当前,国内外科技企业纷纷加大在跨区域智算互联领域的技术投入,相关竞争日趋激烈。
在技术层面,跨智算中心互联面临诸多挑战。
多波长传输中的负载均衡问题、长距离传输导致的拥塞控制响应延迟、安全保障机制带来的性能开销,以及算力与网络资源的协同调度难题,成为制约技术发展的四大瓶颈。
针对这些痛点,中国移动研发团队经过深入研究,提出了GSE-DCI技术解决方案。
该技术方案具有显著的技术优势。
发布的智算互联路由器样机集高密度、长距离传输、高效率、超宽带宽、无损传输和安全保障等能力于一体。
实测数据显示,该设备可将跨百公里分布式训练的算力效率提升至单节点集群的98%以上,能够支撑十万亿级参数规模的模型训练与推理任务。
这为跨区域协同训练、存算分离等新型智算应用场景的落地提供了坚实的技术基础。
值得关注的是,中国移动在该领域的技术积累和标准引领作用日益凸显。
此前,该公司已在IEEE802.3国际标准组织主导完成800G以太网20公里标准立项工作,并率先完成业界首个800G以太网城市群智算中心分布式训练现网技术验证。
在多个省市开展的技术试点表明,新技术可将大模型训练时长缩短约20%至40%,在网络无拥塞状态下达到最优算力效率。
从产业发展角度看,这一技术突破对我国算力基础设施建设具有重要意义。
当前,我国正加快推进"东数西算"工程,构建全国一体化算力网络体系。
跨智算中心互联技术的成熟,将有效打破地域限制,实现东西部算力资源的高效协同,推动算力资源的优化配置和集约化发展。
同时,该技术也为人工智能产业发展提供了新的可能性。
超大规模模型训练对算力的需求持续攀升,单一数据中心已难以满足需求。
通过智算互联技术构建的分布式训练环境,可以突破物理空间限制,支撑更大规模、更复杂的模型研发,加速人工智能技术创新和应用落地。
从“单体中心扩张”迈向“跨域协同增效”,是智算基础设施演进的必然选择。
面向更大规模、更高效率、更可持续的算力供给体系,关键不仅在于设备带宽的跃升,更在于网络能力与算力调度、标准体系、安全治理的同频共振。
谁能率先打通跨区域协同的技术与工程闭环,谁就更有可能在下一阶段的智算产业竞速中赢得主动。