问题——随着城市道路参与者更加多样、道路要素更密集,自动驾驶从“能跑”走向“跑得稳、跑得安全”仍面临多重瓶颈:感知环节对距离与速度的准确判断容易受光照、遮挡影响;决策环节对短时变化预判不足,难以及时应对并线加塞、行人突然横穿等不确定事件;训练环节长期依赖实路数据积累,成本高、周期长,且难以覆盖长尾场景;同时,大模型能力增强也推高车端算力需求并拉长部署链路,影响量产节奏; 原因——业内普遍认为,这些难题的共同根源于对“物理世界”的建模不够深入:一上,以二维图像为主的处理方式难以稳定表达空间几何关系;另一方面,决策系统往往基于当前观测被动响应,缺少对未来几秒演化的可计算推演;此外,训练与验证难以形成高效闭环,算法迭代速度跟不上场景复杂度提升;同时,算法与芯片协同不足,使先进模型难以可控成本下落到车端。 影响——因此,理想汽车在大会上发布MindVLA-o1,尝试以“模型能力—训练体系—端侧部署”的一体化方案抬升系统上限。其一,模型强调三维空间理解,通过融合摄像头与激光雷达等信息,并引入三维编码机制,强化对目标深度、相对距离与运动趋势的刻画,使车辆对立体交通环境形成更稳定的几何认知。其二,在决策与规划层面引入“隐世界模拟”思路,在动态预测框架下推演未来3至5秒的可能变化,为风险规避与策略选择提供更充足的提前量。其三,在行为生成上采用混合专家机制,将“动作生成”模块化并进行约束优化,同步输出连续轨迹点,减少抖动与突兀操作。企业披露的测试结果显示,这些改进可使驾驶平顺性提升四成以上。其四,训练环节构建闭环强化学习平台,借助高保真仿真环境开展大规模回放与对抗训练,将更多场景学习转移至虚拟环境,据称训练效率较实路测试提升约20倍。其五,面向量产部署推进软硬协同优化,通过调整模型结构与计算精度策略、匹配芯片时延特性,将部署周期从以往的数月压缩到数天,降低工程落地门槛。 对策——业内人士指出,智能驾驶竞争正从单点能力比拼转向体系化建设:一是以多源融合与三维表征提升感知可靠性,降低复杂光照和遮挡条件下的误判漏判;二是以可预测、可解释的短时推演增强决策前瞻性,减少“临近才刹、临近才变”的被动操作;三是以闭环训练提升对长尾场景的覆盖,在守住安全边界的前提下加快迭代;四是以工程化与端侧部署能力保障规模交付,避免先进模型停留在演示或小规模试运行阶段。同时,行业还需完善安全评测体系与数据合规边界,用标准化方法验证模型在极端场景与边界条件下的可控性。 前景——从产业趋势看,基础模型与世界模拟、闭环训练的结合,正推动自动驾驶向更强的物理理解、更快的迭代效率、更低的落地门槛演进。未来,决定技术扩散速度的关键不仅是一次发布的参数与指标,更在于能否在真实道路长期稳定运行、能否形成持续学习与安全验证机制,以及能否在算力受限的车端实现可靠的实时推理。随着软硬协同、仿真训练与安全评测体系深入成熟,智能驾驶有望在更多城市道路与复杂气候条件下提供更稳健的体验;同时也需要在法规、责任界定与数据治理等同步推进,使技术进步与公共安全相匹配。
理想汽车此次发布的技术成果,说明了我国新能源汽车产业在智能化方向的探索进展,也传递出智能驾驶即将进入新阶段的信号。在全球汽车产业加速迈向智能化的过程中,持续创新仍是企业保持竞争力的关键。随着对应的技术逐步落地应用,更安全、更智能的出行体验有望加快走向大众。