EN
返回资讯列表
模型

隐空间世界模型新范式:无界动力MWA与脸谱心智LoopWM分别发布

近日,两家中国初创公司分别发布了面向具身智能的隐空间世界模型新范式。无界动力(Boundless Dynamics)推出全球首个“长时序双向物理因果链”隐空间世界模型MWA™,在RoboCasa GR1 TableTop榜单中以75.2%平均任务成功率登顶,超越英伟达GR00T-N1.6等模型。脸谱心智(FaceMind)则发布Looped World Model(LoopWM),提出“迭代潜深度”作为新的扩展轴,在ScienceWorld和AlfWorld任务上以约1B参数取得超越大模型的结果,并宣称最高可达100×参数效率。

无界动力MWA:长时序双向物理因果链

MWA™全程在隐空间(Latent Space)内推演,跳过像素级冗余计算,提炼出“潜动作(Latent Action)”作为场景交互变化的底层表征,摆脱对人工动作标签的依赖,可直接利用互联网海量无标签视频训练。

其核心架构为“双向动力学”:逆动力学模型(IDM)负责“由果推因”,正动力学模型(FDM)负责“由因及果”,两者通过“正逆互审机制”协同。MWA™首创时序Chunk级逆向动力学建模,打破传统单步瞬时推理局限,可稳定规划10秒以上长周期连续动作序列,形成多步潜动作块(Latent Action Chunk),大幅减弱误差累积。

在推理阶段,MWA™引入三重梯度约束:FDM预判未来变化、策略输出与冻结的IDM基准对齐、潜动作映射为硬件控制序列。通过正负反馈闭环,在隐空间内划定动作禁区与推荐区间。

此外,无界动力首创AnyPhys负样本核心数据体系,将深层负样本、边界失稳样本等与正样本交织,为强化学习提供稠密训练所需的全维度样本。公司已完成超2亿美元天使轮融资,Pre-A轮近2亿美元接近尾声,投资方包括红杉中国、线性资本、京东关联基金等。

脸谱心智LoopWM:循环式架构与迭代潜深度

LoopWM采用参数共享的循环Transformer块作为动力学核心,通过反复迭代精炼潜状态,而非堆叠更多参数。架构分为Prelude、Recurrent Block和Coda三部分:Prelude整理输入,Recurrent Block用共享参数多次更新潜状态,Coda输出最终表示。

关键设计包括:

  • 谱稳定性约束:对状态保持矩阵特殊参数化,限制特征值在稳定区间,保证长程rollout不失控。
  • Deferred Decoding(延迟解码):多步rollout时先在潜空间连续推演,需要输出时再解码,降低推理成本。
  • Early Exit(早退机制):轻量门控动态判断状态是否“想够”,简单转移提前结束循环,复杂转移多迭代,实现“按需思考”。

实验结果显示,约1B参数的LoopWM在ScienceWorld上取得68.4% EM、85.3% Token F1,显著超过Claude-opus-4-6-max(47.2% EM、72.8% F1);在AlfWorld上取得51.6% EM、80.4% Token F1。论文指出,LoopWM通过迭代潜深度实现了最高100×参数效率,为资源受限场景提供了新路径。

影响与行业意义

两项工作共同指向隐空间世界模型的新方向:MWA™强调长时序因果链与强化学习结合,LoopWM则探索循环计算与参数效率的平衡。它们均试图解决传统世界模型在长程推演中的误差累积和计算冗余问题,为具身智能的泛化与部署提供了不同技术路线。无界动力侧重工业落地与融资能力,脸谱心智则通过开源论文推动学术探索。

2026年6月30日来源:综合整理