多智能体系统性能优化：不改工作流也能继续涨性能

拓扑优化、蜂群协同与经济激励：三种前沿方法让固定工作流的多智能体系统性能持续提升

高级约 25 分钟

多智能体系统性能优化：不改工作流也能继续涨性能

拓扑优化、蜂群协同与经济激励：三种前沿方法让固定工作流的多智能体系统性能持续提升

多智能体系统在真实部署中，工作流拓扑往往因安全、合规等原因固定不变。然而，固定拓扑并不意味着优化空间消失。本文深入介绍三种前沿方法：基于Bandit的Prompt优化框架MASPOB、蜂群可控协同工作流SwarmFlow，以及基于经济激励的EoM框架。它们分别从Prompt调优、编排与智能分离、去中心化市场机制三个角度，在不改变工作流的前提下显著提升系统性能。文章包含技术原理、实验数据与实战案例，并附FAQ。

multi-agent agent workflow n8n

引言：固定工作流下的优化困局

多智能体系统（MAS）在医疗诊断、金融审计、代码生成等复杂任务中展现出超越单模型的性能。然而，真实部署场景中，工作流拓扑往往经过专家设计、安全验证和合规审查，一旦上线便难以随意调整。例如，医院SOP或金融审计流程的任何结构调整都可能触发高代价的重新验证程序。

但工作流固定，不代表优化空间消失。真正还能动、也最直接影响系统表现的，变成了每个Agent的Prompt配置、协作编排方式以及智能体间的互动机制。本文将从三个前沿方向出发，探讨如何在不改变工作流的前提下，继续提升多智能体系统的性能：

MASPOB：基于Bandit的样本高效Prompt优化框架，在固定拓扑下通过智能搜索找到最优Prompt组合。

SwarmFlow：蜂群可控协同工作流，将编排逻辑从Agent临场判断中抽离，由系统稳定执行。

EoM（Economy of Minds）：利用经济激励让智能体自发形成专业化和协调，无需中央控制。

这三种方法分别从Prompt调优、编排与智能分离、去中心化市场机制三个角度切入，为固定工作流下的MAS优化提供了全新思路。

一、MASPOB：固定拓扑下的Prompt联合优化

1.1 问题形式化

在固定工作流拓扑中，各Agent的Prompt配置成为影响系统性能的关键变量。研究团队将问题形式化为一个有预算的组合黑盒优化问题：在最多评估T次的限制内，找到一组表现最好的Prompt组合，让整个系统在验证集上的效果最优。

该问题面临三大挑战：

评估代价高昂：每次评估需完整执行MAS流程，涉及多次LLM调用，可用评估次数极为有限。

拓扑诱导的耦合：上游Agent的Prompt变化会影响下游Agent的输入分布，各Agent的Prompt并非相互独立。

组合搜索空间爆炸：联合搜索空间为各Agent候选集的笛卡尔积，大小随Agent数量指数增长。

1.2 MASPOB算法核心组件

MASPOB（Multi-Agent System Prompt Optimization via Bandits）由三个核心组件构成：

拓扑感知的性能代理模型：将MAS工作流建模为有向无环图（DAG），以各Agent的Prompt嵌入为节点特征，采用图注意力网络（GAT）进行消息传递，学习能够感知拓扑结构的Prompt语义表示。GAT通过注意力加权聚合邻居信息来更新节点表示，最终经均值池化和MLP输出预测性能分数，作为Bandit框架中的利用信号。

基于Bandit的探索-利用权衡：将Prompt组合优化建模为Bandit问题，采用线性置信上界（LinUCB）构造采集函数，在倾向于高预测性能的同时，也对未充分探索的区域赋予更高的评分。

坐标上升搜索：为解决组合搜索空间的指数爆炸问题，采用坐标上升策略，将联合优化分解为对各Agent的逐一单变量优化。由于UCB评估仅需GNN前向推理而无需实际执行MAS，每轮坐标上升的计算开销可忽略不计。

1.3 实验结果

在HotpotQA、DROP、HumanEval、MBPP、GSM8K、MATH六个基准上，MASPOB在50次验证集评估预算下均取得最优结果，平均得分80.58%，较基线方法提升1.71%~12.02%。消融实验表明，去除GNN后平均性能下降2.31%，坐标上升策略在性能损失小于0.5%的前提下，运行时间减少98%以上。

二、SwarmFlow：蜂群可控协同工作流

2.1 痛点：临场调度的瓶颈

在多Agent协作中，通常有一个Leader Agent充当大脑，负责拆任务、建成员、分配工作、等结果。但任务一旦变长、变大，Leader的上下文很快被过程信息淹没，导致：

Leader变成瓶颈：大量精力消耗在流程管理上。

过程不稳定：同一个任务跑两次，可能走出两条不同路径。

执行不可靠：失败处理依赖Leader临场发挥。

2.2 核心思路：编排归系统，智能归Agent

SwarmFlow的解法是将“编排”和“智能”分开。谁先做、谁并行、谁把结果交给谁、什么时候汇总、失败如何处理——这些协作关系交给系统按程序稳定执行；而每个子任务具体怎么理解、怎么推理，才交给Agent。

具体地，SwarmFlow提供一组算子作为积木，覆盖四类需求：派生智能体、多智能体并发与流转、阶段切分与子流程复用、人机交互。关键算子包括：

parallel：并行执行，全部完成后统一汇总。

pipeline：流水线执行，多个条目各自独立逐级流过。

agents_session：有状态的智能体，在多轮协作中保留记忆。

human：人机节点，在执行中向人类要输入或审批。

budget：约束资源与额度消耗。

2.3 实战场景

场景一：金融分析。用户上传流程图，JiuwenSwarm基于该图直接生成SwarmFlow团队技能，包含对应的工作流执行脚本。用户提出分析目标后，工作流自动启动：先数据采集、清洗，然后从财务、行情等五个维度并行分析，最后交叉验证输出报告。

场景二：技术分享自动化。用户给出技术分享主题和目标读者，SwarmFlow自动组织多个阶段：搜索论文、整理素材、分析核心问题、生成邮件并发送。整个过程稳定可复用，避免每次临场指挥导致步骤遗漏。

场景三：200页PPT稳定产出。设计三阶段流程：阶段一规划章节主题和分工，阶段二10个章节并行生成PPT，阶段三合并汇总。固化后，每次执行结构统一、风格一致，且并行加速明显。

三、EoM：用经济激励让智能体自发协作

3.1 动机：去中心化的协调

主流多智能体系统依赖中央指挥官协调，但存在结构性硬伤：规划被卡在单一闸口，协调成本随规模线性增长。EoM的灵感来自哈耶克的经济学思想：价格本身就是信号，它把分散的信息聚合并传递出去，让每个人不需要掌握全局，就能各自做出协调一致的行动。

EoM的核心是设计一套经济激励，让智能体们自己学会协调、分工与合作，而不是手动设计协调机制。

3.2 核心机制

每个智能体由四样东西定义：唤醒条件、行动策略、固定出价、当前财富。系统通过两个过程运行：

拍卖：在每一步，所有智能体先判断唤醒条件，够资格的智能体中出价最高的赢得行动权。赢家根据策略采样动作，推动环境进入下一个状态，并可能拿到环境奖励。长期竞争会逼出专业化——只有那些在特定情境下持续做得好的智能体，才撑得住长期竞拍。

交易：每一步拍到行动权的智能体，把自己的出价付给上一步出手的那个；同时收下环境这一步给的奖励。这条规则实现了去中心化的信用分配：为后续高价值动作铺路的智能体持续积累财富，把系统带进死胡同的智能体不断失血。

适应：回合之间，种群按经济规律进化——交租、清退、注入新智能体。新智能体通过利用（变异成功者）或探索（从失败中学习）生成。

3.3 实验结果

在数学推理、加速器设计、金融研究、科学研究、分布式系统优化五个领域，EoM均超越完整功能的强智能体基线。例如数学推理场景，残缺种群准确率从15.9%提升到57.0%，反超完整基线的51.9%。消融实验表明，经济机制不是可有可无的实现细节，而是把“一堆残缺智能体”变成“自适应社会”的核心引擎。

四、三种方法的对比与选择

方法核心思想适用场景优点局限

MASPOB基于Bandit的Prompt联合优化固定拓扑，Agent数量中等不改变工作流，样本高效需要预定义候选Prompt集 SwarmFlow编排与智能分离，系统执行编排可提前确定的流程型任务稳定、可观测、可复用不适合高度动态的协作 EoM经济激励驱动自发协作开放、动态、需专业化的场景去中心化，鲁棒性强需要设计经济参数

实际项目中，可根据任务特点组合使用。例如，先用SwarmFlow固化稳定编排，再用MASPOB优化各Agent的Prompt，最后引入EoM的经济机制处理动态协作。

五、实践建议

评估固定拓扑的优化空间：如果工作流无法修改，优先考虑Prompt优化（MASPOB）或编排固化（SwarmFlow）。

从简单任务开始：先用SwarmFlow搭建可复用的工作流，再逐步引入经济机制处理复杂协作。

关注可观测性：SwarmFlow的可视化视图和EoM的财富追踪都能帮助理解系统行为。

迭代调参：MASPOB的评估预算、SwarmFlow的算子配置、EoM的租金和奖励参数都需要根据任务调整。

六、未来展望

多智能体系统的优化正从“设计更复杂的工作流”转向“在固定约束下更智能地调优”。MASPOB展示了Prompt优化的潜力，SwarmFlow强调了编排的确定性，EoM则证明了去中心化经济机制的有效性。未来，这三种方法可能融合：例如，用经济激励驱动Prompt的自动演化，或用SwarmFlow的算子实现EoM中的拍卖和交易逻辑。

FAQ

MASPOB需要多少评估预算才能有效？ 论文中在50次评估预算下即取得显著提升，实际应用中建议从20-50次开始尝试，根据任务复杂度调整。

SwarmFlow和传统工作流引擎（如n8n）有什么区别？ SwarmFlow专为多智能体设计，算子内置了Agent的唤醒、记忆、并发等语义，而传统工作流引擎更偏向通用任务编排。想深入了解可参考AI工作流编排相关教程。

EoM的经济参数如何设置？ 初始租金和奖励可参考论文中的默认值（租金=0.1，奖励=1.0），然后根据任务收敛速度和种群多样性进行调整。如果种群过早同质化，可降低租金或增加探索概率。

这三种方法可以组合使用吗？ 可以。例如，先用SwarmFlow固定编排，再用MASPOB优化各Agent的Prompt，最后用EoM的经济机制处理动态决策。但需注意组合后的复杂度，建议逐步引入。

固定工作流下，除了Prompt还有哪些优化方向？ 还可以优化Agent的模型选择、上下文窗口管理、记忆检索策略等。感兴趣可参考多智能体系统相关文章。

EoM中的智能体需要重新训练吗？ 不需要。所有智能体共用同一个冻结的大模型底座，差异完全来自角色设定的系统提示词和出价参数，是一种轻量级优化方法。

所属主题：AI Agent 与多智能体工作流与自动化

Getting Started

Learn how to get started with this application.

Learn more

Installation Guide

多智能体系统性能优化：不改工作流也能继续涨性能

引言：固定工作流下的优化困局

一、MASPOB：固定拓扑下的Prompt联合优化

1.1 问题形式化

1.2 MASPOB算法核心组件

1.3 实验结果

二、SwarmFlow：蜂群可控协同工作流

2.1 痛点：临场调度的瓶颈

2.2 核心思路：编排归系统，智能归Agent

2.3 实战场景

三、EoM：用经济激励让智能体自发协作

3.1 动机：去中心化的协调

3.2 核心机制

3.3 实验结果

四、三种方法的对比与选择

五、实践建议

六、未来展望

FAQ

Documentation

Getting Started

Learn more