框架
小米发布 HarnessX:面向 AI 智能体的可组合、自适应、可进化运行框架
小米 Darwin Agent Team 于 2026 年 6 月在 arXiv 发表论文,提出 HarnessX——一款面向 AI 智能体的可组合、自适应、可演进运行框架(Harness)生成系统。HarnessX 旨在解决传统智能体框架手工搭建、架构耦合、无法与模型协同优化的痛点,通过三大核心模块实现自动化框架优化:
- 组件化组合架构:将 Harness 抽象为标准化处理器与八大生命周期钩子,划分九大优化维度(模型选择、上下文组装、记忆管理、工具生态、执行环境、评估与奖励、控制与安全、可观测性、训练桥接),依托类型约束实现组件自由插拔与安全复用。
- AEGIS 自适应演进引擎:将框架演进映射为符号空间强化学习,通过解析、规划、演化、评判四阶段流水线,针对性解决奖励欺骗、灾难性遗忘、探索不足三大问题,并采用变体隔离策略适配异构任务场景。
- 框架-模型协同进化机制:搭建共享轨迹缓冲区,结合跨框架 GRPO 算法同步优化框架与模型,突破单一优化路径的能力天花板。
实验在 GAIA、ALFWorld、WebShop、τ³-Bench、SWE-bench Verified 五大主流智能体基准上,搭配 Claude Sonnet 4.6、GPT-5.4、Qwen3.5-9B 三款不同能力的大模型进行评测。结果显示:
- HarnessX 平均带来 14.5% 的性能提升,最高达 44.0%,且模型基线越弱收益越显著;
- 框架与模型协同进化可在此基础上再增收 4.7%;
- 变体隔离策略有效避免性能退化,并减少约 18% 的 Token 消耗。
该研究证明,优化运行框架是模型缩放之外提升智能体能力的高效路径,整套方案兼顾自动化、稳定性与可审计性。论文后续将开源完整代码,为自进化智能体工程化提供新范式。
2026年6月19日来源:综合整理
相关资讯
清华团队提出OpenRath:以Session为核心的多智能体运行时框架
6月17日 · 综合整理
Kimi K2.7 Code 发布:代码与Agent能力提升,Token消耗降低30%
6月15日 · 综合整理
SpaceX 以600亿美元收购Cursor母公司Anysphere,全股票交易预计2026年Q3完成
6月16日 · 综合整理
前阿里千问负责人林俊旸创立AI实验室,首轮估值20亿美元,腾讯红杉高榕入局
6月16日 · 综合整理
字节跳动AI业务财务数据曝光:豆包日收入不足百万,Seedance年化收入达20亿美元
6月17日 · 综合整理
微软CEO纳德拉提出“人力资本”与“Token资本”:企业需构建AI学习闭环,避免价值被少数模型攫取
6月17日 · 综合整理
延伸阅读 · 相关教程
企业级 AI 智能体失效分析与安全加固:从故障根源到防御策略
系统剖析生产环境中智能体六大失效原因,并覆盖缓存碰撞、提示注入等前沿攻击的防御方法
多智能体系统性能优化:不改工作流也能继续涨性能
拓扑优化、蜂群协同与经济激励:三种前沿方法让固定工作流的多智能体系统性能持续提升
Agent 记忆系统深度解析:从 BudgetMem 到上下文压缩,让 Agent 学会按需分配
深入探讨 Agent 记忆系统的核心挑战与前沿方案,包括 BudgetMem 动态预算路由、上下文压缩技术以及 WorldMemArena 评估框架
提示词工程已死,Loop Engineering 来了:AI 编码智能体协作新范式
从手动提示到自动化循环,重新定义人与AI的协作方式