具身智能的发展正面临几个绕不开的难题:训练数据稀缺、质量不稳定,现有模型大多只能做视频生成,对物理世界的理解停留在表面。这直接导致机器人在实际使用中暴露出交互中断、算力消耗过高、物理状态判断失准等问题,距离真正落地还有相当距离。
具身智能的竞争重心正在转移——从"看起来能做"到"做得稳、做得久、做得安全"。世界模型在端侧实现实时推理与可执行预测,为机器人进入真实生产和生活场景提供了新的技术支撑。接下来的关键在于:能否把开源带来的协同优势转化为可复制的产品能力,把演示中的连贯动作变成复杂环境下的可靠作业。这将是行业走向规模化落地的真正考验。