EN

场景库

AI Agent 真实落地场景,从营销到编程,从研究到效率工具,附推荐工具组合和实现步骤

8

营销

27

编程

7

研究

15

效率

9

垂直行业

⭐⭐⭐
配置1小时,之后全自动

自动修复 GitHub Issues

将 Devin 或 SWE-agent 接入 GitHub,让 AI Agent 自动拉取 Issues、分析代码库、生成修复方案并提交 Pull Request,显著提升开发效率。

实现步骤

  1. 1.安装 SWE-agent 并配置 GitHub Token
  2. 2.设置触发规则(Label 为 "auto-fix" 的 Issues)
  3. 3.Agent 分析 Issue 和相关代码

推荐工具

DevinSWE-agentgithub
GitHubBug修复自动化
⭐⭐⭐
2小时配置

微服务监控告警 Agent

将 Agent 接入 Sentry + Kubernetes,让其实时监控服务健康状态:当检测到错误激增或 Pod 异常时,自动分析根因、定位问题代码并发送 Slack 告警,带出初步处理建议。

实现步骤

  1. 1.安装并配置 Sentry MCP 和 K8s MCP
  2. 2.设置监控阈值和触发条件
  3. 3.Agent 接收告警后自动分析堆栈跟踪

推荐工具

OpenHandssentrykubernetesslack
监控告警KubernetesSentry
⭐⭐⭐
2小时搭建,长期自动运行

AI 辅助代码审查:自动检测安全漏洞和性能问题

在 CI/CD 流水线中集成 AI 代码审查,每次 Pull Request 自动检测安全漏洞(SQL 注入、XSS、密钥泄露)、性能瓶颈、代码规范问题,并生成具体的修复建议。减少人工审查时间 60%,同时提升代码质量。

实现步骤

  1. 1.在 GitHub Actions 中配置 PR 触发工作流
  2. 2.提取 PR 的 diff 内容,格式化为结构化格式
  3. 3.用 Claude API 分析代码变更,检测安全/性能/规范问题

推荐工具

ClaudeGitHub Actionsgit
代码审查CI/CDGitHub Actions
⭐⭐⭐
2小时搭建基础框架

企业级AI Agent Harness工程化落地:从Demo到产线

本场景面向工程技术团队,解决AI编程从Demo到企业级生产系统落地时面临的AI失忆、上下文污染、代码质量不可控等工程化难题。核心方法是基于Claude Code构建五层记忆体系、Hooks质量门禁、动态工作流等Harness工程实践,通过结构化上下文、确定性验证和编排模式,让AI在百万行级代码库中稳定、可控、可校验地完成长周期任务。实测表明,同一模型通过Harness优化可在基准测试中从基线以下跃升至Top 5。

实现步骤

  1. 1.建立五层记忆体系:创建Enterprise级CLAUDE.md写入安全合规策略,Project级文件控制在200-300行记录团队规范,Rules级按路径条件化加载细分规范,Local级存放个人备忘并加入.gitignore。
  2. 2.配置上下文分诊机制:将候选信息分为P0-P3四个等级,仅将核心日志和历史工单句柄注入上下文,将Token消耗从18K压缩至2K,提升信噪比。
  3. 3.实现结构化输入与Stop Hook门禁:避免模糊Prompt,提供具体函数和行号;配置Stop Hook自动运行lint和单元测试,测试未通过则阻断提交并让AI自愈。

推荐工具

Claude CodeClaudeGitpnpm
harness-engineeringai-agentclaude-code
⭐⭐⭐
2小时搭建

Claude Code动态工作流与循环工程实战

利用Claude Code的动态工作流和循环工程模式,搭建自动化任务调度、子智能体编排、结果校验与持久化记忆体系,实现从手动提示到系统自主驱动的转变。通过JavaScript编写的动态工作流可现场定制,支持分类执行、扇出综合、对抗验证等六大模式,有效解决代理懒惰、自我偏好偏差和目标漂移问题。适用于代码重构、深度研究、简历筛选、故障排查等复杂任务,显著提升多步骤、高并行场景下的效率与质量。

实现步骤

  1. 1.在Claude Code中使用/loop指令或ultracode触发词创建动态工作流,系统将自动生成JavaScript编排框架。
  2. 2.定义任务目标并选择编排模式,如分类执行(Classify-and-act)或扇出综合(Fan-out-and-synthesize),Claude会现场生成子智能体协调方案。
  3. 3.利用Automations或/loop设置定时调度(如每5分钟),让循环自动发现任务、分配工作并校验结果。

推荐工具

Claude CodeOpenAI Codexn8n
dynamic-workflowloop-engineeringai-agents
⭐⭐⭐
2周搭建

企业级RAG 2.0系统构建与文档解析实战

本场景指导如何构建企业级RAG 2.0系统,重点解决大模型幻觉、知识新鲜度及数据安全问题。通过分层架构设计、混合检索(向量+全文+知识图谱)和文档解析(OCR、版面分析、表格识别)等关键技术,实现“搜得更全、排得更好、答得更准”。实践表明,结合本体约束与GraphRAG可提升召回准确率15-20%,文档解析前置处理能显著改善知识库质量。适用于工程制造、金融、法律等需要高精度知识问答的行业。

实现步骤

  1. 1.部署文档解析平台(如RAGFlow DeepDoc或PaddleOCR-VL),对PDF、扫描件、图纸等文档进行版面分析、表格还原和结构提取。
  2. 2.将解析后的结构化内容(Markdown/JSON)切片,构建向量索引(如Infinity)和全文索引(如Elasticsearch),并可选集成知识图谱。
  3. 3.设计离线入库流程:文档解析→切片→向量化→索引构建;在线问答流程:query改写→混合检索→重排序→LLM生成。

推荐工具

RAGFlowInfinityElasticsearchPaddleOCR-VLDifyLangChainGraphRAG
ragdocument-parsinghybrid-retrieval
⭐⭐⭐
2周搭建

AI Agent记忆系统选型与生产落地

本场景指导工程师如何为AI Agent选型和落地记忆系统,涵盖从RAG到Agentic AI的演进、关键架构决策,以及OpenAI Dreaming V3等前沿方案的评估标准。通过对比手动保存、后台整理和自动梦境合成三种记忆模式,帮助团队在延续上下文、偏好遵循和时效更新三个维度上提升准确率,实现高效、可扩展的Agent记忆底座。

实现步骤

  1. 1.评估Agent对记忆的需求:确定是否需要长期上下文、偏好遵循和时效更新,选择RAG、知识图谱或Dreaming等架构。
  2. 2.设计记忆存储方案:采用向量数据库(如Pinecone)或图数据库(如Neo4j)存储结构化与非结构化记忆。
  3. 3.实现记忆写入机制:通过用户显式指令或后台自动提取(如Dreaming V0/V3)将对话历史转化为持久记忆。

推荐工具

OpenAI ChatGPTPineconeNeo4jAWS
ai-agentmemory-systemrag
⭐⭐⭐
1-2周搭建

多智能体系统优化与协作工作流实战指南

本场景聚焦多智能体系统(MAS)的优化与协作,涵盖固定工作流下的Prompt联合优化(MASPOB)、基于经济激励的去中心化协调(EoM)、流式通信加速(StreamMA)、通用RL训练框架(UnityMAS-O)以及人机协作组织设计。适用于工程团队提升MAS性能、降低延迟、实现自动化分工。

实现步骤

  1. 1.评估当前MAS工作流是否固定,若固定则使用MASPOB基于Bandit算法联合优化各Agent的Prompt,在50次评估内提升性能。
  2. 2.若需去中心化协调,部署EoM框架,通过拍卖、交易和财富机制让Agent自动分工协作,无需中央控制器。
  3. 3.对链式或图式MAS,采用StreamMA流式通信,上游每步推理立即转发下游,实现流水线并行,降低延迟并提升准确性。

推荐工具

MASPOBEoMStreamMAUnityMAS-OMulticaClaudeGPT-4o-mini
multi-agentworkflow-optimizationreinforcement-learning
⭐⭐⭐
2小时搭建评估框架

Agent记忆系统选型与生产落地指南

本场景面向工程团队,提供从选型到生产落地的Agent记忆系统完整方案。基于行动-世界交互循环框架,对比长上下文、人工设计(RAG/外部记忆)、工具驱动三类记忆范式,通过WorldMemArena基准的四阶段诊断(写入、维护、检索、使用)定位记忆失效根源。帮助团队根据任务动态性、多模态需求和成本约束选择合适方案,并规避常见陷阱。

实现步骤

  1. 1.明确任务类型:区分终身演化(个人状态/任务状态动态变化)与智能体执行(基于真实观察与反馈生成记忆)两类场景。
  2. 2.选择记忆架构:根据任务动态性和多模态需求,从长上下文模型、RAG+外部记忆系统、工具驱动记忆三种范式中选型。
  3. 3.设计记忆生命周期:按写入、维护、检索、使用四阶段定义记忆管道,确保每阶段可观测、可诊断。

推荐工具

WorldMemArenaRAG外部记忆系统工具驱动记忆系统
agentmemorymultimodal
⭐⭐⭐
2-3天搭建

用本体驱动Agent可控执行

本场景介绍如何通过本体(Ontology)为AI Agent构建语义基础设施,实现行为约束、上下文管理和结果校验的可控执行。核心思路是将业务规则显式建模为可查询、可校验的结构,替代传统Prompt约束,使Agent在业务骨架内自主行动。适用于需要高可靠性和合规性的企业级Agent开发场景。

实现步骤

  1. 1.使用本体建模工具(如Protégé)定义业务实体、关系和规则,构建领域本体。
  2. 2.将本体集成到Agent框架中,作为行为约束和上下文检索的语义底座。
  3. 3.在Agent执行前,从本体中抽取与任务相关的语义子图,动态注入推理上下文。

推荐工具

ProtégéLangChainLlamaIndexNeo4j
ontologyagentharness
⭐⭐⭐
2小时搭建

用循环工程搭建AI自动化工作流

循环工程(Loop Engineering)是一种新型AI协作范式,通过设计自动化循环系统替代手动向智能体下发指令。工程师将“发现问题、执行、检查、记录、继续”链路封装成闭环,让AI自主迭代任务直至完成。本场景基于Codex或Claude Code,利用自动化调度、工作树、技能、连接器、子智能体和记忆模块,实现CI失败分类、依赖升级、issue转PR等重复性工作的自动化。适用于有强测试套件的工程团队,可显著降低人工轮询成本,但需注意token消耗和人工审核不可缺失。

实现步骤

  1. 1.确认任务是重复的、有自动校验手段、token预算充足、Agent能运行自己写的代码,且你愿意审查产出。
  2. 2.先手动运行一次任务流程,确保稳定,再沉淀为Skill文件记录项目背景、规范和已知坑点。
  3. 3.创建状态文件(如Markdown)记录任务进度、已完成项和待办事项,作为持久化记忆。

推荐工具

Claude CodeCodexGitGitHub ActionsMCP
loop-engineeringai-automationagent-workflow
⭐⭐⭐
2小时搭建

用Agent Harness框架搭建生产级AI智能体

Agent Harness是包裹LLM的完整软件基础设施,包括编排循环、工具、记忆、上下文管理、状态持久化、错误处理和安全护栏。本场景教你基于Agent Harness的八大支柱(个性、工作流、能力、对齐、约束、验证、视觉界面、协调),将无状态LLM转变为稳定、可控、可校验的生产级智能体。通过定义Persona、配置Workflow、集成Capability、设置Alignment和Restraint、添加Verification,以及部署Visual Interface和Coordination,实现企业级智能体的全生命周期管理。实践表明,仅优化Harness而不改模型,在TerminalBench 2.0上排名可从30名外跃升至第5。

实现步骤

  1. 1.定义智能体的Persona:设置身份简介、规则文件、记忆上下文和知识库,明确角色定位与知识边界。
  2. 2.配置Workflow:通过触发器、会话计划和决策日志,将复杂任务分解为自动化步骤流程。
  3. 3.集成Capability:添加斜杠命令、混合执行、嵌入向量和技能体系,构建功能工具箱。

推荐工具

LangChainClaude CodeOpenAI Agents SDKLangGraphn8n
agent-harnessllmai-agent
⭐⭐⭐
2-3天搭建

企业级RAG 2.0系统构建实战

基于RAGFlow和向量数据库Infinity,构建企业级RAG 2.0系统,解决大模型幻觉、知识更新慢和数据隐私问题。通过分层模块化架构,实现文档智能解析、混合检索、多级排序和知识增强生成,显著提升问答准确性和可解释性。适用于办公知识库、客服系统等场景。

实现步骤

  1. 1.部署RAGFlow开源框架,配置DeepDoc模块用于文档解析。
  2. 2.上传企业文档(PDF、Word等),利用OCR和布局识别提取结构化内容。
  3. 3.将解析后的文本切片,调用Embedding模型生成向量,存入向量数据库Infinity。

推荐工具

RAGFlowInfinityElasticsearchLangChain
ragenterpriseknowledge-base
⭐⭐⭐
2小时选型与原型搭建

Agent记忆系统选型与工程落地指南

本场景指导开发者如何为AI Agent选型并落地记忆系统,解决Agent缺乏长期与短期记忆、对话无连续性的问题。通过对比Mem0、Graphiti、Hermes等框架的存储设计,结合n8n或LangGraph等工具构建组件化记忆管理节点,实现记忆的存储、检索与维护。工程落地需考虑生产运维挑战,如记忆一致性、扩展性及成本控制。最终使Agent具备个性与连续性,提升交互智商与情商。

实现步骤

  1. 1.梳理Agent业务需求,明确需要长期记忆(持久化知识)还是短期记忆(会话上下文),以及记忆的粒度(如实体、关系、对话摘要)。
  2. 2.调研主流记忆框架:Mem0(简洁易用)、Graphiti(图谱关联)、Hermes(高效)、OpenClaw(灵活),根据存储设计(向量、图、键值)和扩展性选型。
  3. 3.使用n8n或LangGraph构建Agent记忆管理节点,将记忆存储与检索封装为可复用的组件,支持长期记忆的写入、更新和过期策略。

推荐工具

n8nLangGraphMem0GraphitiHermesOpenClaw
agentmemoryllm
⭐⭐⭐
90分钟直播学习

AI Agent落地:从代码生成到运维自愈

针对企业研发与运维中代码质量难控、老旧系统难重构、运维故障响应慢等痛点,结合深信服、平安人寿、中移九天的实战经验,采用AI编程工具、代码逆向萃取Agent和运维Agent,实现代码生成质量提升、老旧系统萃取准确率99.5%、故障自愈5分钟内完成。通过工程化约束、规则先行、小步快跑等方法,将AI能力转化为组织效能。

实现步骤

  1. 1.在AI编程中,通过AST解析和代码切片控制输入上下文,约束模型输出,并建立人工Review与双模型交叉复核机制。
  2. 2.针对老旧系统,先构建代码图谱,按分层分域切片,再逆向生成PRD、流程图和架构图,实现自动化重构。
  3. 3.运维场景中,采用“规则先行、模型辅助”策略,先固化专家规则,再引入大模型辅助诊断,确保建议可验证、可回滚。

推荐工具

CoStrictGitHub CopilotCursor
ai-agentcode-generationlegacy-system
⭐⭐⭐
1周内搭建

大模型成本治理与Token优化实战

针对企业大模型调用成本失控问题,本场景提供一套五层协同优化方案,包括上下文筛选、模型路由调度、系统自学习、任务架构设计等,可斩断高达88%的Token浪费。通过精细化的架构优化而非单纯模型选型,实现AI投入产出比大幅提升,适合已深度使用AI的工程团队。

实现步骤

  1. 1.分析当前Token消耗构成,区分用户输入、系统提示词、工具调用、上下文检索等各部分占比。
  2. 2.优化上下文检索层,使用精细化索引(如Glean)替代通用MCP工具,减少冗余信息加载。
  3. 3.实施多模型混合调度,将标准化任务分配给轻量化模型,仅核心差异化环节使用前沿大模型。

推荐工具

GleanClaudeMCP
cost-optimizationtoken-efficiencyllm-architecture
⭐⭐⭐
数小时至数天

用 Fable 5 设计自我校正循环

本场景基于 Anthropic 的 Claude Fable 5 模型,通过设计自我校正循环和跨会话记忆机制,提升 AI 在复杂工程任务中的自主迭代能力。实验表明,Fable 5 在参数高尔夫挑战赛中训练效率提升约 6 倍,核心指标优于 Opus 4.7;在持续学习基准中,Fable 5 的记忆验证覆盖率达 73%,远超其他模型。核心要点是使用独立评分子代理替代模型自我评判,并组合记忆流程实现持续学习。

实现步骤

  1. 1.设定明确的目标和评判标准,作为循环的反馈依据。
  2. 2.搭建带反馈的运行环境,让 Fable 5 在循环中接收反馈并自主修正。
  3. 3.使用独立评分子代理在隔离上下文窗口中完成打分核验,确保评判客观。

推荐工具

Claude Fable 5Claude 管理代理 (CMA)Claude CodeClaude API
self-correctionmemoryagent