星知

logo
logo
登录

机器人告别"逐帧学动作"!全球首个事件级具身智能世界模型发布

自变量机器人发布WALL-WM,以事件级预测取代逐帧动作学习,提升具身智能机器人对复杂任务的理解、泛化与真实执行能力。
发布时间:2026/05/30 03:23|分类:机器人
机器人告别"逐帧学动作"!全球首个事件级具身智能世界模型发布
5月29日,自变量机器人团队发布全球首个基于“事件级预测”的具身智能世界模型WALL-WM。该模型不再沿用传统视觉-语言-动作(VLA)模型逐帧预测固定动作块的方式,而是将预测单位切换为语义事件,让机器人先理解“下一个事件会如何改变世界”,再生成机械臂运动轨迹。WALL-WM将复杂任务按动作边界切分为伸手、抓取、移位等事件,提升机器人在换杯子、换桌子等场景中的泛化能力。为实现真实落地,自变量机器人团队支持“事件模式”和“统一模式”切换,引入视频模型与动作模型单向耦合、视锥掩码与管状掩码,以及“阶梯式思维链解码”以降低延迟。团队还构建了“数据金字塔”,底层使用百万级网络通用视频补足视觉先验,顶层聚焦真机接管与纠错数据,并结合四级标注、双聚类采样、分布式“Muon”训练系统和FP8量化。WALL-WM在具身视频生成、三维空间感知和真机Core15L1泛化测试中表现领先,目前项目代码及主页已公开。
机器人星知