昇腾全系算力完成MiniMax M2.5开源大模型适配,现网试用同步开启

一、背景:国产大模型生态加速构建,算力适配成关键环节 近年来,随着人工智能技术快速演进,大模型工业、金融、政务等领域的应用需求持续增长;但模型能力的发挥高度依赖底层算力基础设施支撑。如何让国产大模型与国产算力平台高效协同,已成为推动人工智能产业自主可控的重要课题之一。 ,稀宇科技于2月13日正式发布并开源新一代旗舰模型MiniMax M2.5。该模型在编程开发、工具调用及办公生产力三大场景实现突破,被视为国内大模型能力升级的重要进展。 二、进展:昇腾团队数小时内完成全系硬件适配 华为随后宣布,昇腾团队基于AI基础软硬件与智能体涉及的技术,在MiniMax M2.5开源后数小时内完成对昇腾Atlas 800 A2及A3全系列硬件的适配与部署,并已在多个现网局点启动试用,为模型后续规模化落地提供算力支撑。 在技术实现上,昇腾采用TP与EP混合并行策略,原生支持192K上下文长度,无需截断即可承载代码仓库级的复杂分析任务。同时通过ACLGraph加速、专家并行调度以及FlashComm1通信优化等手段,提升多卡并行效率。FP8权重原生加载功能也已实现,用户可直接部署官方模型权重,降低工程部署门槛。 三、能力:三大场景实现技术突破,编程思维达架构师级别 在编程开发上,MiniMax M2.5显示出较强的综合能力,具备架构师层级的编程思维,可编写代码前主动完成需求拆解、结构设计与界面规划,提升前期规划效率。语言支持覆盖Go、C++、Python等十余种主流语言,能够支持从系统设计、功能开发到测试验证的完整流程,并适配Web、Android、iOS等多平台的全栈项目开发。 在工具调用与搜索上,MiniMax M2.5对决策逻辑进行了优化,以更少的搜索轮次和更高的令牌利用率解决问题。在BrowseComp、Wide Search及RISE等专家级搜索评测中,M2.5相较上一代M2.1约减少20%的轮次消耗,在保持准确率的同时提升推理效率。这表明模型进步不仅体现在“能否答对”,也体现在“能否用更高效的路径得到答案”。 在办公生产力场景中,MiniMax M2.5可输出更贴近实际工作的结果。在金融建模、文档排版、数据分析等任务中,模型平均任务胜率达59.0%,具备一定落地价值。 四、意义:国产算力与大模型协同提速,自主可控能力持续增强 此次华为昇腾对MiniMax M2.5的快速适配,既是一次工程能力验证,也反映出国内人工智能产业链上下游协同效率的提升。从模型开源到完成硬件适配仅用数小时,该进展对行业具有一定示范意义。 从更宏观角度看,国产大模型与国产算力平台的深度融合,是提升产业自主可控能力的关键路径。随着更多国产模型与昇腾等平台建立高效适配机制,国内AI基础设施的整体竞争力有望更增强,为各行业数字化转型提供更稳定的技术底座。

从技术适配到场景落地,此次合作展示了中国企业在人工智能领域的研发与工程能力,也反映了产业协同带来的潜力。在数字经济加速发展的背景下,如何把技术优势持续转化为产业动能,仍需要业界在应用与实践中不断推进。