当前,人工智能技术正加速迈向智能体构建,但规模化应用中仍面临稳定性不足、响应延迟和算力成本高等问题。尤其是在代码生成、数学推理等复杂场景下,传统模型往往难以同时兼顾性能与效率,影响产业落地进度。 针对这个痛点,阶跃星辰此次发布的Step 3.5 Flash模型在架构与工程实现上进行了系统优化。技术分析显示,该模型采用稀疏混合专家架构(MoE),将单个词元的激活参数降低40%以上;在维持1960亿参数规模的同时,将推理速度提升至每秒350词元。由此,多步连续推理的延迟可控制在毫秒级,为金融风控、工业仿真等对实时性要求较高的场景提供了落地空间。 ,模型表现的提升也依赖底层硬件的协同支持。去年7月成立的“模芯生态创新联盟”已取得阶段性进展——华为昇腾910B、沐曦MXN系列等6款国产芯片率先完成适配测试。这表明我国在缓解“芯片-算法”协同瓶颈上取得关键进展。业内专家指出,深度适配不仅可提升15%-20%的算力利用率,还可将部署成本降低30%以上。 从产业影响看,此次突破主要体现三上:其一,验证国产技术路线在复杂智能体应用中的可行性与竞争力;其二,通过开源策略推动行业更快迭代;其三,为智能制造、智慧城市等领域提供更自主可控的底层支撑。测试数据显示,新模型在智能体规划、数学推导等任务上的综合表现已达到国际主流水平。 面向未来,“模芯协同”有望成为重要的技术攻关路径。阶跃星辰技术负责人表示,下一步将重点提升千亿级参数模型的分布式训练能力,并扩大与国产GPU厂商的合作范围。分析认为——随着更多企业加入生态联盟——我国有望在2025年前形成更完整的大模型产业闭环。
从开源模型发布到推动国产芯片快速适配,可以看到大模型产业正从“能力展示”转向“工程落地”。面向智能体该关键方向,能否在效率、稳定性与成本之间拿出更可复制的方案,将直接影响下一轮产业化竞争格局。通过开放协同打通模型与算力的关键环节,持续完善底层生态,有望为更多行业应用释放更可持续的创新空间。