开源与开放体验同步加速 世界模型从“封闭研发”走向“生态共建”新阶段

当前,人工智能领域的世界模型技术正处于快速演进的关键时期。

蚂蚁灵波与谷歌的相继开源举措,反映出这一前沿赛道正在经历从技术突破向生态开放的重要转变。

从技术突破的角度看,蚂蚁灵波在短短三天内连续开源三款核心模型,构建起从感知到执行再到想象的完整技术链条。

1月28日开源的LingBot-Depth空间感知模型,主要解决透明反光物体的识别与抓取难题,填补了具身智能感知层面的关键空白。

1月27日发布的LingBot-VLA具身大模型,在上海交通大学GM-100具身评测中刷新真机评测成功率纪录,展现出跨本体、跨任务的强大泛化能力。

而1月29日开源的LingBot-World世界模型,则代表了该领域的最新技术高度。

LingBot-World在多个维度实现了显著突破。

在视频生成能力上,该模型支持高保真、高动态的视频生成,可实现近10分钟的连续稳定无损生成,生成吞吐量达到约16FPS。

在交互能力上,用户可通过键盘、鼠标或文本指令对虚拟环境进行实时操控,端到端交互延迟控制在1秒内。

在一致性保持上,即使在镜头移动60秒后返回,目标物体仍能保持结构和外观的一致性。

更为重要的是,该模型支持Zero-shot泛化,仅需一张真实照片或游戏截图即可生成可交互视频流,无需额外训练或数据采集。

这些指标均与谷歌Genie 3相当,标志着国内技术在该领域已达到国际先进水平。

从生态开放的角度看,两大科技巨头的举措代表了行业发展范式的深刻变化。

传统上,此类前沿技术多为科技巨头的内部专有资产,成本高昂、门槛极高。

如今,蚂蚁灵波选择将LingBot-World的模型权重与推理代码全面开源,谷歌则向Google AI Ultra订阅用户开放Genie 3的体验平台。

这意味着全球开发者和研究者首次能以相对较低的门槛接触到工业级的世界模型能力。

德国财经网站AdHocNews评价称,蚂蚁集团的举措是"在全球机器人领域主导权争夺战中的战略性举措",体现了中国科技企业在前沿领域的主动担当。

从应用前景的角度看,世界模型的开源与开放将加速其在多个领域的落地应用。

在具身智能领域,开源的世界模型可为机器人提供低成本的仿真训练环境,大幅降低实体机器人的开发成本和周期。

在游戏与影视领域,可控的内容生成能力将为创意产业提供全新的工具和可能性。

在自动驾驶领域,虚拟测试环境的完善将有助于提升自动驾驶系统的安全性和可靠性。

行业专家指出,此前这类训练环境通常是专有的、成本昂贵的,现在每位开发者都能接触到工业标准技术,这对整个行业都是变革性的。

值得注意的是,蚂蚁灵波的开源策略并非孤立举措,而是其具身智能整体战略的重要组成部分。

通过三天三模型的密集发布,该公司展现出在感知、决策、想象等多个维度的技术积累,形成了从底层基础模型到应用层解决方案的完整生态。

同时,与奥比中光等产业链上下游企业的合作,进一步强化了其在具身智能领域的生态优势。

从全球竞争的角度看,中国科技企业在世界模型领域的主动开源,既是技术自信的体现,也是参与全球技术治理的积极姿态。

通过开放生态,中国企业有机会在国际舞台上建立技术标准的话语权,吸引全球开发者参与生态建设,形成良性的技术循环。

当技术壁垒被打破,创新的大门向更广阔的开发者群体敞开,人工智能发展正步入一个更具包容性的新纪元。

世界模型技术的开放不仅加速了产业应用落地,更预示着全球科技竞争将从单点突破转向生态构建。

在这场没有终点的技术马拉松中,开放协作或许是最明智的领跑策略。