最近,蚂蚁集团旗下的蚂蚁灵波科技给业界带来了一个好消息,他们把两个关键模型给开发者和科研机构全面开放了。这俩模型一个是LingBot-VLA,专门负责处理机器人在复杂环境中的动作,另一个是LingBot-Depth,给机器人提供高精度的空间感知能力。这个决定不仅分享了技术,也为中国的人工智能生态做了贡献。 具身智能让机器像人一样在物理世界里行动,感知、理解和决策。LingBot-VLA用海量的真实操作数据进行训练,让机器人能跨本体完成任务。他们还发现了模型性能随数据增长的规律:数据越多,模型越厉害。基于这个发现,他们搞出了一个20,000小时的训练集,给模型的泛化能力打下了基础。 在上海交通大学开源的GM-100测试中,LingBot-VLA在真实机器人上表现得特别好,成功率比国际先进模型还高。而且他们配套开源了高效的训练工具链,让开发成本降低了不少,更多团队能用上这个模型搞创新。 LingBot-Depth解决了深度传感器噪声干扰和数据不完整的问题。它利用奥比中光等合作伙伴采集的高质量数据,把不完整的深度图转成高质量的信息。实验显示它在深度精度和像素覆盖率上都超过了业界顶级工业相机。在NYUv2、ETH3D这些基准测试中表现得也非常好,而且能在视频流里保持时间一致性。 技术的价值在于应用。LingBot-VLA已经跟国内几家知名厂商的产品适配好了,证明了跨本体迁移能力强。这次全面开源预计能吸引更多厂商、高校和开发者参与进来。“核心模型开源+产业生态共建”这种模式能汇聚创新力量,加速技术落地。 蚂蚁灵波开源这两大核心模型是具身智能发展中的一个重要节点。他们不仅突破了性能瓶颈还进行了产业验证,用开源策略降低了门槛。这些举措推动了技术普惠和产业化。 未来随着生态的繁荣和更多场景融合,具身智能有望给实体经济注入动力。这个领域还有很大潜力等待挖掘。