机器人告别"逐帧学动作"！全球首个事件级具身智能世界模型发布

自变量机器人发布WALL-WM，以事件级预测取代逐帧动作学习，提升具身智能机器人对复杂任务的理解、泛化与真实执行能力。

发布时间：2026/05/30 03:23|分类：机器人

5月29日，自变量机器人团队发布全球首个基于“事件级预测”的具身智能世界模型WALL-WM。该模型不再沿用传统视觉-语言-动作（VLA）模型逐帧预测固定动作块的方式，而是将预测单位切换为语义事件，让机器人先理解“下一个事件会如何改变世界”，再生成机械臂运动轨迹。WALL-WM将复杂任务按动作边界切分为伸手、抓取、移位等事件，提升机器人在换杯子、换桌子等场景中的泛化能力。为实现真实落地，自变量机器人团队支持“事件模式”和“统一模式”切换，引入视频模型与动作模型单向耦合、视锥掩码与管状掩码，以及“阶梯式思维链解码”以降低延迟。团队还构建了“数据金字塔”，底层使用百万级网络通用视频补足视觉先验，顶层聚焦真机接管与纠错数据，并结合四级标注、双聚类采样、分布式“Muon”训练系统和FP8量化。WALL-WM在具身视频生成、三维空间感知和真机Core15L1泛化测试中表现领先，目前项目代码及主页已公开。

机器人星知

星知

机器人告别"逐帧学动作"！全球首个事件级具身智能世界模型发布

最近发布

智能体个人信息保护自律公约正式发布，腾讯百度等31家企业首批签署

微软全面引入AI挖掘Windows漏洞，后续安全补丁修复数量将大幅增加

AI日报：GPT5.6系列模型发布 Codex消失;腾讯拟接盘Manus成最大股东；MiniMax创始人宣布零薪酬直至实现AGI

快手 KwaiKAT 发布 KAT-Coder-Pro V2.5:告别"补代码"，首个能端到端跑通完整工程的国产 Agentic 编程模型