智源发布世界模型Kairos,多项基准测试领先
智源世界模型 Kairos 发布:4B参数模型在四项国际评测中夺冠
近日,智源研究院(北京智源人工智能研究院)在2026年智源大会上发布了其世界模型系列成果,其中开悟世界模型 Kairos 在四项国际权威评测中取得第一名,引发行业关注。Kairos 由智源孵化企业大晓机器人研发,以4B参数规模在多个维度超越更大参数量的模型,展示了世界模型技术路线的潜力。
技术架构:从视频生成到统一预测
Kairos 采用原生统一世界模型架构,将多模态理解、视频生成与状态预测整合到同一模型体系中,而非基于视频生成模型的后训练改造。其核心包括自研混合线性注意力机制和全局状态共享机制,使模型能同时完成理解、生成和预测。这一方向与英伟达 Cosmos 3.0 等国际主流模型一致。训练数据方面,Kairos 使用了超过十万小时 human-centric 真实场景数据和数百万小时互联网视频,结合显式模仿学习与隐空间强化学习,以增强对物理规律和因果关系的理解。
评测表现:四项第一,覆盖操作、泛化与物理建模
Kairos 在以下四个评测中均取得第一名:
- RoboTwin 2.0:双臂操作基准,包含50项复杂协同任务。Kairos 平均成功率达96.1%(Clean场景96.9%,Randomized场景95.2%),超过G0.5(93.2%)、starVLA(88.3%)等模型。
- LIBERO-Plus:场景泛化基准,通过光照、背景、噪声等七类变量模拟真实环境。Kairos 以89.0分排名第一,超过ACoT-VLA(88.0)、Pi 0.5(85.7)等。在光照(97.7)、背景(95.8)、噪声(96.8)、相机视角(95.5)等子项表现突出。
- WorldModelBench Robot:物理建模评测,由伯克利、英伟达等机构推出。Kairos-4B 以9.30分总成绩排名第一,超过28B参数的Lingbot(未公布分数)、16B的Cosmos3等。在指令遵循(2.36,并列第一)、物理遵循(4.96)等子项领先。
- DreamGen Bench:泛化能力评测,由英伟达等机构提出。Kairos 在平均物理遵循(AVG_PA:0.538)和总平均分(AVG_Score:0.618)上均列第一,在新行为执行(PA:0.489)和新环境适配(PA:0.581)等子项领先。
行业影响与智源布局
Kairos 的发布标志着世界模型从实验室走向实际部署。其4B参数规模在端侧直接驱动机器人本体,减少了中间转换延迟,提升了响应速度。智源研究院在大会上同时发布了悟界·Physis-v0.1(通用世界基座模型)和悟界·RoboBrain Orca(具身大脑),并系统梳理了世界模型四大分类:以语言、像素、三维结构、视觉表征为中心。智源认为,真正的世界模型应能感知、理解、推理物理状态,并具备主动交互能力。
智源研究院自2018年成立以来,已开源超200个模型,全球下载量超10亿次。其悟界·Emu3于2026年1月登上Nature正刊,是中国大模型成果首次在Nature发表。此次大会汇聚了Meta、英伟达、哈佛、MIT等国际机构,以及阿里、腾讯、清华等国内力量,围绕世界模型、智能体、AI安全等前沿议题展开讨论。
相关资讯
6月13日 · 综合整理
5月4日 · Figure AI
7月18日 · SpaceX
7月20日 · NVIDIA
8月5日 · Waymo
5月23日 · TechCrunch