大晓机器人最近把开悟世界模型3.0 开源了,这东西有六大优势,帮助解决现在行业里的数据难、部署

大晓机器人最近把开悟世界模型3.0开源了,这次更新系列叫做Kairos 3.0-4B,是专门给机器人设计的原生大脑,能让它直接干活。它是第一个把多模态理解、生成还有预测都连在一起的开源世界模型。这东西有六大优势,帮助解决现在行业里的数据难、部署贵的问题。以前大家都觉得让机器人大脑模型聪明就得靠堆参数,Kairos 3.0-4B却不一样。它从底层开始设计,用自然的物理规律和因果关系来打基础,还把机器人家伙真动手、人怎么做事还有怎么想这些数据都融合起来,让它真正能懂事儿。而且这个模型能直接跑在Jetson Thor T5000这样的端侧平台上,能跑到517 TFLOPS的算力。这次在THOR平台上跑出来1:1.5的实时生成效果,也就是视频生成时间和实际视频时长几乎一样。它把机器人的控制指令直接给输出出来,不用再折腾中间环节。在仿真环境里规划机械臂路线没问题,到了真实世界也能干活。物理规律方面也是最强的。倒水、叠石头这些事做得特别真,水流得稳、重量也准;不像别的模型老是出现逻辑不对的情况。另外它还能和Agent智能体技术配合,把复杂指令拆分开来预测和反思,生成长达7分钟的连贯视频。在家庭演示里就很明显了,机器人可以一直拍下去整理桌子、洗衣服、准备早饭这些全流程的活儿。模型虽然参数不大只有4B但特别轻量级,占用的显存只有23.5GB左右。在A800 GPU的测试里比Cosmos 2.5快了72倍。做一个10秒的生成任务只花了9.5秒;和Lingbot比的话更是快了151倍。它还能在云侧实现1:1实时推理,适配好多款GPU,让部署变得更容易。还有一点特别厉害的是它能适配不同的机器人本体,无论是单臂还是双臂、灵巧手这种不同形态的机器人都能用。智元-精灵G1或者宇树G1这些主流硬件都支持。不用再为每个不同的机器人单独训练了。