行业
银河通用发布全球首个人形机器人通用小脑AstraBrain-WBC 0.5,验证运动控制Scaling Law
银河通用机器人于近日正式发布AstraBrain-WBC 0.5,这是其银河星脑(AstraBrain)技术体系下,面向人形机器人全身实时运控的小脑基础模型。该模型基于约20亿帧(约2万小时)人类动作数据训练,模型参数规模达8040万,是全球首个达到GPT-1量级的人形机器人全身实时运控大模型。
数据规模与多样性
- 训练数据集为目前行业最大规模,涵盖AMASS、LAFAN1、Motion-X++、PHUMA、MotionMillion等开源数据集,并补充超1000小时自采数据。
- 数据覆盖舞蹈、运动、日常行为、工业操作、协作搬运等丰富场景,动作空间覆盖范围相比AMASS提升约4至5倍。
- 团队提出谐波运动嵌入(HME)方法,将数据聚类为约300个动作簇,实现多样性感知的均衡采样,避免常见动作淹没长尾动作。
架构创新与Scaling Law验证
- 首次采用GPT风格的因果Transformer架构,将全身控制重新定义为连续序列预测问题,结合384个动作专家组成的运动先验库,通过蒸馏训练融合为统一控制模型。
- 实验证明,随着数据规模从200万帧扩展至20亿帧,模型零样本跟踪误差持续下降,成功率从83.26%提升至92.58%,验证了运动控制领域的Scaling Law。
- 同等数据量下,Transformer架构的关键点位置误差(MPKPE)为43.25mm,优于TCN的56.15mm,领先幅度超30%。
核心能力与性能
- 全身协同控制:在29自由度机器人上实现手脚联动、重心切换等复杂动作。
- 高动态运动:零样本执行篮球、拳击、舞蹈、翻身起立等训练集中未出现的高动态动作。
- 毫秒级实时响应:经TensorRT和C++优化后,单张RTX 4090上推理延迟低至0.39毫秒,控制回路50Hz,速度较TWIST提升约5倍。
- 鲁棒性:在快速运动、重心变化、复杂接触切换等场景中保持稳定,模型成功率随数据规模提升。
开源与产业影响
- 论文、代码及模型已全面开源(论文地址:arxiv.org/abs/2606.03985,代码:github.com/GalaxyGeneralRobotics/Humanoid-GPT)。
- 作为运控基座模型,可高质量生成VLA操作数据,降低全身控制模型训练门槛。
- 支持实时全身遥操作与复杂动作跟踪,适用于应急救援、危险环境处置等场景。
- 开发者可基于模型快速生成舞蹈、演艺等创意动作内容,实现实时生成与部署。
对比与评价
- 在宇树G1机器人上的零样本测试中,AstraBrain-WBC 0.5在四段未见舞蹈动作上的关节位置误差均低于或持平GMT、TWIST、Any2Track等当前最强开源追踪器。
- 研究团队指出,该工作首次在人形机器人运控领域验证了类似GPT的Scaling Law,标志着机器人运动控制从“单技能训练”走向“运动基础模型”时代。
2026年6月19日来源:综合整理
相关资讯
SpaceX 以600亿美元收购Cursor母公司Anysphere,全股票交易预计2026年Q3完成
6月16日 · 综合整理
前阿里千问负责人林俊旸创立AI实验室,首轮估值20亿美元,腾讯红杉高榕入局
6月16日 · 综合整理
字节跳动AI业务财务数据曝光:豆包日收入不足百万,Seedance年化收入达20亿美元
6月17日 · 综合整理
微软CEO纳德拉提出“人力资本”与“Token资本”:企业需构建AI学习闭环,避免价值被少数模型攫取
6月17日 · 综合整理
Transformer 核心作者 Noam Shazeer 离开谷歌,加入 OpenAI
6月18日 · 综合整理
演语科技完成近3亿美元B+轮融资,ARR达3亿美元,创国内AI应用融资纪录
6月18日 · 综合整理