返回资讯列表
行业

2026北京智源大会开幕:智源研究院发布世界模型,定义AI从“预测下一个词元”到“预测下一个物理状态”的范式跃迁

2026年6月12日,第八届北京智源大会在中关村国际创新中心开幕。本届大会以“技术前沿、国际视野、青年人才”为特色,汇聚两位图灵奖得主、40余位AI企业CEO与首席科学家、200余位顶尖专家学者及30余位30岁以下青年科学家。中国AI产业世界模型与Agent领域最具代表性的创新力量首次集中同台。

核心发布:世界模型与范式跃迁

智源研究院院长王仲远在开幕式上发布2026年进展报告,系统阐述人工智能正从“预测下一个词元”向“预测下一个物理状态”的范式跃迁。智源研究院是国内最早提出并开展世界模型研究的机构,2023年杨立昆在智源大会阐述世界模型概念,2024年智源明确世界模型为下一代大模型技术。

本届大会发布两大世界模型:

  • 悟界·Physis-v0.1:全球首个通用世界基座模型,以物理隐空间表征替代传统像素、帧级预测方案,支持50+复杂物理场景长程推理,具备物理一致性、动作因果性、长程可推演性、通用泛化性四大核心能力,可应用于严肃工业、具身智能、物理仿真、科学研究等场景。
  • 悟界·RoboBrain Orca(研发中):以下一个物理状态预测为核心的具身大脑,实现“想、看、动”三位一体,可同时生成语言思考、视觉预测与动作决策,支撑物流、酒店服务等真实环境长期自主作业。

智源将现有世界模型技术路线分为四类:以语言为中心(如VLM/VLA)、以像素为中心(如Sora)、以三维结构为中心(如World Labs Marble)、以视觉表征为中心(如JEPA)。智源认为,真正的世界模型应以“预测下一物理状态”为核心,涵盖全模态数据并具备主动交互能力。

其他重要成果

  • 悟界·Emu3:2026年1月登上Nature正刊,是中国科研机构主导的大模型成果首次在Nature正刊发表。Emu3.5完成关键升级,从“预测下一个词元”扩展到跨视觉与语言序列的“下一状态预测”。
  • 悟界·Brainμ1.0:全球首个理解与生成统一的多模态神经科学大模型,可将跨物种、全模态脑信号统一编码为标准Token,已支撑“记忆-睡眠”调控机制研究成果登刊Science。
  • 悟界·OpenComplex2.5:可泛化、物理真实的下一代AI驱动药物发现模型,统一覆盖口袋识别、反向筛选、结构预测和亲和力预测四个关键步骤。
  • FlagOS2.1:支持18家芯片厂商的32款芯片,是全球覆盖芯片数量最多的计算系统软件栈,生态成员超80家,全球下载量超37.5万次。

嘉宾阵容与核心议题

2015年图灵奖得主Whitfield Diffie聚焦Agent时代安全挑战,强调对智能体的限制(Confinement)在现有编程中仍不足。2024年图灵奖得主Andrew Barto以“重新发现强化学习”为题,指出强化学习与神经网络的计算研究从一开始便紧密交织,并警示奖励信号设计中的“反常实例化”风险。

智源研究院理事长黄铁军与之江实验室主任王坚围绕“总有人比时代早十年”展开对话,探讨中国AI范式演进、Agent时代新范式及人与AI关系。在“重构世界——中国大模型巅峰对话”圆桌中,王仲远与朱军、罗福莉、刘知远、安波等探讨超级模型能力演进、AI自进化、多模态与世界模型等议题。

青年人才与组织架构

大会宣布22岁北京大学青年学者、逆矩阵科技Physis创始人陈博远出任智源行为世界模型创新中心负责人。陈博远本科期间获ACL 2025最佳论文,在NeurIPS、ACL等顶会发表多篇论文,谷歌学术引用超两千次。其创办的逆矩阵科技专注通用世界基座模型,成立之初获超千万美元融资。

开源生态与产业影响

智源研究院自2018年成立以来,已发布开源模型超200个,全球总下载量累计超10亿次,孵化多家大模型与具身智能领域创新创业企业。本届大会展示从“悟道”到“悟界”的技术跃迁,构建通往物理AGI的完整技术路径。

2026年6月14日来源:综合整理