场景库
AI Agent 真实落地场景,从营销到编程,从研究到效率工具,附推荐工具组合和实现步骤
8
营销
27
编程
7
研究
15
效率
9
垂直行业
自动修复 GitHub Issues
将 Devin 或 SWE-agent 接入 GitHub,让 AI Agent 自动拉取 Issues、分析代码库、生成修复方案并提交 Pull Request,显著提升开发效率。
实现步骤
- 1.安装 SWE-agent 并配置 GitHub Token
- 2.设置触发规则(Label 为 "auto-fix" 的 Issues)
- 3.Agent 分析 Issue 和相关代码
推荐工具
微服务监控告警 Agent
将 Agent 接入 Sentry + Kubernetes,让其实时监控服务健康状态:当检测到错误激增或 Pod 异常时,自动分析根因、定位问题代码并发送 Slack 告警,带出初步处理建议。
实现步骤
- 1.安装并配置 Sentry MCP 和 K8s MCP
- 2.设置监控阈值和触发条件
- 3.Agent 接收告警后自动分析堆栈跟踪
推荐工具
开发者必看:代码生成、调试与自动化的AI工具使用场景
了解开发者如何借助AI工具更快写出更好的代码。本文涵盖2025年软件开发中AI应用的顶级使用场景。 ## 直接回答 **2025年开发者最高价值AI使用场景Top 5**:① 代码自动补全与生成(节省40%编码时间)② Bug定位与修复建议 ③ 代码审查与重构 ④ 技术文档自动生成 ⑤ 测试用例生成。 ## 核心使用场景 ### 1. 代码生成与自动补全 **工具推荐**:GitHub Copilot / Cursor / Claude Code - 根据注释自动生成函数实现 - 实测:资深开发者使用Copilot后,编码速度提升55%(GitHub官方数据) ### 2. Bug调试与错误解析 **工具推荐**:Claude 3.5 Sonnet / ChatGPT-4o - 将报错信息和相关代码粘贴给AI,获得精准诊断 - 最佳Prompt:「这是我的错误信息:[error],这是相关代码:[code],请分析根本原因并提供修复方案」 ### 3. 代码重构与优化 **工具推荐**:Claude Code / Cursor - 识别代码异味,建议重构方案 ### 4. 技术文档自动生成 **工具推荐**:ChatGPT + GitHub Actions - 根据代码自动生成JSDoc/TypeDoc注释 ### 5. 测试用例生成 **工具推荐**:Claude / Copilot - 根据函数签名和实现自动生成单元测试 - 覆盖边界条件和异常情况 ## FAQ **Q:使用AI写的代码安全吗?** A:AI生成的代码需要人工审查,尤其是涉及安全(认证、加密、SQL查询)的部分。 **Q:AI会取代程序员吗?** A:AI目前更像一个超级助理——它能大幅提升有经验开发者的效率,但难以替代需要深度业务理解和系统设计能力的工作。 ## 相关资源 - 查看顶级AI编程工具:[aiskillnav.com/agents](https://aiskillnav.com/agents) - MCP服务器加速开发工作流:[aiskillnav.com/mcp](https://aiskillnav.com/mcp)
实现步骤
- 1.在IDE中安装AI编程插件(Cursor或Copilot)
- 2.为AI提供足够的上下文(项目说明、技术栈)
- 3.用自然语言描述需求,让AI生成代码框架
推荐工具
用 Claude + 向量数据库搭建企业私有知识库:员工问任何问题都能秒回
企业文档分散在 Confluence、飞书、本地文件夹,新员工上手慢、老员工找文档费时。本方案介绍用 Claude API + Chroma 向量数据库 + 简单 Python 脚本搭建私有知识库问答系统,无需专业工程师,4小时内可完成部署。
实现步骤
- 1.整理企业文档:从 Confluence/飞书导出 PDF/Markdown 文件
- 2.安装依赖:pip install chromadb langchain anthropic
- 3.编写文档加载脚本:读取文件、切分成 500-1000 字的 chunk、生成向量并存入 Chroma
推荐工具
用 Claude Code + MCP 自动化开发工作流:代码审查、文档生成、测试一条龙
通过 Claude Code 接入 GitHub MCP 和 filesystem MCP,实现:PR 自动代码审查(指出潜在问题 + 安全漏洞)、函数级文档自动生成、单元测试用例自动补全。一次配置,每次提交自动运行,将开发工作流提效 40% 以上。 ## 直接回答 **这个工作流能做什么?** - PR 提交后自动生成 Code Review 意见(格式化输出,有具体建议) - 新增函数自动生成 JSDoc / Python docstring 注释 - 根据函数签名和实现自动生成单元测试用例 - 检测潜在安全问题(SQL注入、XSS、hardcoded secret) ## 配置步骤 ### 第一步:在项目根目录创建 .mcp.json ```json { "mcpServers": { "github": { "command": "npx", "args": ["-y", "@modelcontextprotocol/server-github"], "env": { "GITHUB_TOKEN": "ghp_your_token" } }, "filesystem": { "command": "npx", "args": ["-y", "@modelcontextprotocol/server-filesystem", "./src"] } } } ``` ### 第二步:在 CLAUDE.md 定义 Code Review 规则 在项目根目录创建 CLAUDE.md,写入: ``` ## Code Review 规则 当我说 "review PR #[number]" 时,请: 1. 用 github MCP 获取 PR diff 2. 检查:安全性/性能/可读性/测试覆盖 3. 严重问题标 🔴,建议改进标 🟡,优化点标 🟢 ``` ### 第三步:自动生成测试用例 在 Claude Code 中输入: "为 src/utils/payment.ts 中所有 export 函数生成单元测试,使用 Vitest,覆盖正常路径、边界值和异常情况" Claude Code 会: 1. 读取源文件(filesystem MCP) 2. 分析函数签名和实现逻辑 3. 生成完整测试文件,写入 __tests__/payment.test.ts ## 实测数据 - Code Review:平均 40 秒/PR(含 3-8 条有效意见) - 文档生成:100 个函数约 2 分钟 - 测试生成:覆盖率从 35% 提升到 72%(AI 生成的测试需人工审核)
实现步骤
- 1.在项目根目录创建 .mcp.json,配置 GitHub MCP 和 filesystem MCP
- 2.创建 CLAUDE.md 定义 Code Review 规范和输出格式(🔴🟡🟢 分级)
- 3.在 Claude Code 中测试 "review PR #1" 验证工作流
推荐工具
AI 辅助代码审查:自动检测安全漏洞和性能问题
在 CI/CD 流水线中集成 AI 代码审查,每次 Pull Request 自动检测安全漏洞(SQL 注入、XSS、密钥泄露)、性能瓶颈、代码规范问题,并生成具体的修复建议。减少人工审查时间 60%,同时提升代码质量。
实现步骤
- 1.在 GitHub Actions 中配置 PR 触发工作流
- 2.提取 PR 的 diff 内容,格式化为结构化格式
- 3.用 Claude API 分析代码变更,检测安全/性能/规范问题
推荐工具
代码 Review + 测试用例自动生成
在 Cursor 中配置 GitHub MCP,让 AI 在代码提交时自动进行初步 Review,指出潜在问题,并为新增功能自动生成单元测试用例。
实现步骤
- 1.在 Cursor 中安装 GitHub MCP Server
- 2.设置代码 Review 提示词模板
- 3.触发自动 Review 并查看建议
推荐工具
数据库查询自动化(自然语言转 SQL)
通过 SQLite 或 PostgreSQL MCP,让非技术人员也能用自然语言查询数据库。"查询上周新增用户数量" → AI 自动生成并执行 SQL,返回结果。
实现步骤
- 1.配置数据库 MCP Server 连接到目标库
- 2.设置只读权限保障数据安全
- 3.编写系统提示词,描述数据库表结构
推荐工具
API 文档自动生成
将代码库接入 AI Agent,让其自动分析函数签名、注释和使用样例,生成标准化的 API 文档(OpenAPI/Swagger 格式),彻底告别手写文档。
实现步骤
- 1.配置 filesystem MCP 让 AI 读取代码库
- 2.让 AI 分析 Controller/Route 层代码
- 3.自动识别接口参数和返回值结构
推荐工具
企业级AI Agent Harness工程化落地:从Demo到产线
本场景面向工程技术团队,解决AI编程从Demo到企业级生产系统落地时面临的AI失忆、上下文污染、代码质量不可控等工程化难题。核心方法是基于Claude Code构建五层记忆体系、Hooks质量门禁、动态工作流等Harness工程实践,通过结构化上下文、确定性验证和编排模式,让AI在百万行级代码库中稳定、可控、可校验地完成长周期任务。实测表明,同一模型通过Harness优化可在基准测试中从基线以下跃升至Top 5。
实现步骤
- 1.建立五层记忆体系:创建Enterprise级CLAUDE.md写入安全合规策略,Project级文件控制在200-300行记录团队规范,Rules级按路径条件化加载细分规范,Local级存放个人备忘并加入.gitignore。
- 2.配置上下文分诊机制:将候选信息分为P0-P3四个等级,仅将核心日志和历史工单句柄注入上下文,将Token消耗从18K压缩至2K,提升信噪比。
- 3.实现结构化输入与Stop Hook门禁:避免模糊Prompt,提供具体函数和行号;配置Stop Hook自动运行lint和单元测试,测试未通过则阻断提交并让AI自愈。
推荐工具
Claude Code动态工作流与循环工程实战
利用Claude Code的动态工作流和循环工程模式,搭建自动化任务调度、子智能体编排、结果校验与持久化记忆体系,实现从手动提示到系统自主驱动的转变。通过JavaScript编写的动态工作流可现场定制,支持分类执行、扇出综合、对抗验证等六大模式,有效解决代理懒惰、自我偏好偏差和目标漂移问题。适用于代码重构、深度研究、简历筛选、故障排查等复杂任务,显著提升多步骤、高并行场景下的效率与质量。
实现步骤
- 1.在Claude Code中使用/loop指令或ultracode触发词创建动态工作流,系统将自动生成JavaScript编排框架。
- 2.定义任务目标并选择编排模式,如分类执行(Classify-and-act)或扇出综合(Fan-out-and-synthesize),Claude会现场生成子智能体协调方案。
- 3.利用Automations或/loop设置定时调度(如每5分钟),让循环自动发现任务、分配工作并校验结果。
推荐工具
企业级RAG 2.0系统构建与文档解析实战
本场景指导如何构建企业级RAG 2.0系统,重点解决大模型幻觉、知识新鲜度及数据安全问题。通过分层架构设计、混合检索(向量+全文+知识图谱)和文档解析(OCR、版面分析、表格识别)等关键技术,实现“搜得更全、排得更好、答得更准”。实践表明,结合本体约束与GraphRAG可提升召回准确率15-20%,文档解析前置处理能显著改善知识库质量。适用于工程制造、金融、法律等需要高精度知识问答的行业。
实现步骤
- 1.部署文档解析平台(如RAGFlow DeepDoc或PaddleOCR-VL),对PDF、扫描件、图纸等文档进行版面分析、表格还原和结构提取。
- 2.将解析后的结构化内容(Markdown/JSON)切片,构建向量索引(如Infinity)和全文索引(如Elasticsearch),并可选集成知识图谱。
- 3.设计离线入库流程:文档解析→切片→向量化→索引构建;在线问答流程:query改写→混合检索→重排序→LLM生成。
推荐工具
AI Agent记忆系统选型与生产落地
本场景指导工程师如何为AI Agent选型和落地记忆系统,涵盖从RAG到Agentic AI的演进、关键架构决策,以及OpenAI Dreaming V3等前沿方案的评估标准。通过对比手动保存、后台整理和自动梦境合成三种记忆模式,帮助团队在延续上下文、偏好遵循和时效更新三个维度上提升准确率,实现高效、可扩展的Agent记忆底座。
实现步骤
- 1.评估Agent对记忆的需求:确定是否需要长期上下文、偏好遵循和时效更新,选择RAG、知识图谱或Dreaming等架构。
- 2.设计记忆存储方案:采用向量数据库(如Pinecone)或图数据库(如Neo4j)存储结构化与非结构化记忆。
- 3.实现记忆写入机制:通过用户显式指令或后台自动提取(如Dreaming V0/V3)将对话历史转化为持久记忆。
推荐工具
多智能体系统优化与协作工作流实战指南
本场景聚焦多智能体系统(MAS)的优化与协作,涵盖固定工作流下的Prompt联合优化(MASPOB)、基于经济激励的去中心化协调(EoM)、流式通信加速(StreamMA)、通用RL训练框架(UnityMAS-O)以及人机协作组织设计。适用于工程团队提升MAS性能、降低延迟、实现自动化分工。
实现步骤
- 1.评估当前MAS工作流是否固定,若固定则使用MASPOB基于Bandit算法联合优化各Agent的Prompt,在50次评估内提升性能。
- 2.若需去中心化协调,部署EoM框架,通过拍卖、交易和财富机制让Agent自动分工协作,无需中央控制器。
- 3.对链式或图式MAS,采用StreamMA流式通信,上游每步推理立即转发下游,实现流水线并行,降低延迟并提升准确性。
推荐工具
用Claude Code复刻经典游戏并升级3D
使用Claude Code(Fable 5)和Codex,从零开始复刻经典游戏《坦克大战》和《超级玛丽》,并实现3D升级。整个过程无需编写代码或设计图片,只需用自然语言描述需求,AI自动完成游戏逻辑、贴图生成、3D渲染、测试验证等全部工作。效果:完整复刻经典玩法,3D版支持视角拖拽、旋转,贴图自动生成与切图,零人工干预。
实现步骤
- 1.打开Claude Code(Fable 5或Codex),输入一句话需求,例如‘用HTML和JS复刻经典坦克大战,包含前十关’。
- 2.等待AI自动编写代码、生成游戏逻辑、绘制像素风格画面,无需干预。
- 3.提出升级需求,例如‘将像素风格升级为3D,使用Three.js,支持视角旋转和缩放’。
推荐工具
Agent记忆系统选型与生产落地指南
本场景面向工程团队,提供从选型到生产落地的Agent记忆系统完整方案。基于行动-世界交互循环框架,对比长上下文、人工设计(RAG/外部记忆)、工具驱动三类记忆范式,通过WorldMemArena基准的四阶段诊断(写入、维护、检索、使用)定位记忆失效根源。帮助团队根据任务动态性、多模态需求和成本约束选择合适方案,并规避常见陷阱。
实现步骤
- 1.明确任务类型:区分终身演化(个人状态/任务状态动态变化)与智能体执行(基于真实观察与反馈生成记忆)两类场景。
- 2.选择记忆架构:根据任务动态性和多模态需求,从长上下文模型、RAG+外部记忆系统、工具驱动记忆三种范式中选型。
- 3.设计记忆生命周期:按写入、维护、检索、使用四阶段定义记忆管道,确保每阶段可观测、可诊断。
推荐工具
用本体驱动Agent可控执行
本场景介绍如何通过本体(Ontology)为AI Agent构建语义基础设施,实现行为约束、上下文管理和结果校验的可控执行。核心思路是将业务规则显式建模为可查询、可校验的结构,替代传统Prompt约束,使Agent在业务骨架内自主行动。适用于需要高可靠性和合规性的企业级Agent开发场景。
实现步骤
- 1.使用本体建模工具(如Protégé)定义业务实体、关系和规则,构建领域本体。
- 2.将本体集成到Agent框架中,作为行为约束和上下文检索的语义底座。
- 3.在Agent执行前,从本体中抽取与任务相关的语义子图,动态注入推理上下文。
推荐工具
企业AI智能体失效分析与自动化修复
本文介绍如何利用开源平台Opik构建AI智能体失效分析与自动化修复体系。Opik通过全链路追踪、内置编码智能体Ollie自动诊断故障并生成修复代码、自然语言测试套件将线上故障转为回归用例、以及智能体沙箱可视化调试,形成从故障发现到修复验证的闭环。该方案可替代传统人工调试,显著降低运维成本,提升智能体生产稳定性。
实现步骤
- 1.使用Opik装饰器(@opik.track)对智能体代码进行埋点,实现全链路运行监控,自动记录每次大模型调用、工具调用及耗时、Token消耗等数据。
- 2.当智能体出现故障时,利用Opik内置编码智能体Ollie分析运行跨度树,定位故障根因;在项目根目录执行opik connect开启代码修复模式,Ollie会生成代码修改差异文件(Diff),人工审批后自动应用修复。
- 3.使用Opik测试套件以自然语言编写测试断言(如“响应必须包含具体交易详情”),执行自动化测试,确保修复不影响原有功能。
推荐工具
用开源工具实现AI Agent自我修复与运维
本场景介绍如何利用开源平台Opik构建AI智能体的自我修复与运维闭环。Opik提供全链路追踪、内置编码智能体Ollie自动诊断并生成修复代码、自然语言测试套件以及智能体沙箱,实现从故障发现到修复验证的自动化。仅需人工审批修复方案,大幅降低运维成本。适用于生产环境下的AI智能体规模化运维。
实现步骤
- 1.通过装饰器@opik.track为智能体代码添加全链路追踪,自动记录每次调用、工具使用及耗时。
- 2.在项目根目录执行opik connect开启代码修复模式,Ollie智能体将自动分析故障轨迹并定位问题代码行。
- 3.审查Ollie生成的代码修改差异(Diff),确认后允许其应用修复并自动重测。
推荐工具
用循环工程搭建AI自动化工作流
循环工程(Loop Engineering)是一种新型AI协作范式,通过设计自动化循环系统替代手动向智能体下发指令。工程师将“发现问题、执行、检查、记录、继续”链路封装成闭环,让AI自主迭代任务直至完成。本场景基于Codex或Claude Code,利用自动化调度、工作树、技能、连接器、子智能体和记忆模块,实现CI失败分类、依赖升级、issue转PR等重复性工作的自动化。适用于有强测试套件的工程团队,可显著降低人工轮询成本,但需注意token消耗和人工审核不可缺失。
实现步骤
- 1.确认任务是重复的、有自动校验手段、token预算充足、Agent能运行自己写的代码,且你愿意审查产出。
- 2.先手动运行一次任务流程,确保稳定,再沉淀为Skill文件记录项目背景、规范和已知坑点。
- 3.创建状态文件(如Markdown)记录任务进度、已完成项和待办事项,作为持久化记忆。
推荐工具
用Agent Harness框架搭建生产级AI智能体
Agent Harness是包裹LLM的完整软件基础设施,包括编排循环、工具、记忆、上下文管理、状态持久化、错误处理和安全护栏。本场景教你基于Agent Harness的八大支柱(个性、工作流、能力、对齐、约束、验证、视觉界面、协调),将无状态LLM转变为稳定、可控、可校验的生产级智能体。通过定义Persona、配置Workflow、集成Capability、设置Alignment和Restraint、添加Verification,以及部署Visual Interface和Coordination,实现企业级智能体的全生命周期管理。实践表明,仅优化Harness而不改模型,在TerminalBench 2.0上排名可从30名外跃升至第5。
实现步骤
- 1.定义智能体的Persona:设置身份简介、规则文件、记忆上下文和知识库,明确角色定位与知识边界。
- 2.配置Workflow:通过触发器、会话计划和决策日志,将复杂任务分解为自动化步骤流程。
- 3.集成Capability:添加斜杠命令、混合执行、嵌入向量和技能体系,构建功能工具箱。
推荐工具
企业级RAG 2.0系统构建实战
基于RAGFlow和向量数据库Infinity,构建企业级RAG 2.0系统,解决大模型幻觉、知识更新慢和数据隐私问题。通过分层模块化架构,实现文档智能解析、混合检索、多级排序和知识增强生成,显著提升问答准确性和可解释性。适用于办公知识库、客服系统等场景。
实现步骤
- 1.部署RAGFlow开源框架,配置DeepDoc模块用于文档解析。
- 2.上传企业文档(PDF、Word等),利用OCR和布局识别提取结构化内容。
- 3.将解析后的文本切片,调用Embedding模型生成向量,存入向量数据库Infinity。
推荐工具
Agent记忆系统选型与工程落地指南
本场景指导开发者如何为AI Agent选型并落地记忆系统,解决Agent缺乏长期与短期记忆、对话无连续性的问题。通过对比Mem0、Graphiti、Hermes等框架的存储设计,结合n8n或LangGraph等工具构建组件化记忆管理节点,实现记忆的存储、检索与维护。工程落地需考虑生产运维挑战,如记忆一致性、扩展性及成本控制。最终使Agent具备个性与连续性,提升交互智商与情商。
实现步骤
- 1.梳理Agent业务需求,明确需要长期记忆(持久化知识)还是短期记忆(会话上下文),以及记忆的粒度(如实体、关系、对话摘要)。
- 2.调研主流记忆框架:Mem0(简洁易用)、Graphiti(图谱关联)、Hermes(高效)、OpenClaw(灵活),根据存储设计(向量、图、键值)和扩展性选型。
- 3.使用n8n或LangGraph构建Agent记忆管理节点,将记忆存储与检索封装为可复用的组件,支持长期记忆的写入、更新和过期策略。
推荐工具
AI Agent落地:从代码生成到运维自愈
针对企业研发与运维中代码质量难控、老旧系统难重构、运维故障响应慢等痛点,结合深信服、平安人寿、中移九天的实战经验,采用AI编程工具、代码逆向萃取Agent和运维Agent,实现代码生成质量提升、老旧系统萃取准确率99.5%、故障自愈5分钟内完成。通过工程化约束、规则先行、小步快跑等方法,将AI能力转化为组织效能。
实现步骤
- 1.在AI编程中,通过AST解析和代码切片控制输入上下文,约束模型输出,并建立人工Review与双模型交叉复核机制。
- 2.针对老旧系统,先构建代码图谱,按分层分域切片,再逆向生成PRD、流程图和架构图,实现自动化重构。
- 3.运维场景中,采用“规则先行、模型辅助”策略,先固化专家规则,再引入大模型辅助诊断,确保建议可验证、可回滚。
推荐工具
大模型成本治理与Token优化实战
针对企业大模型调用成本失控问题,本场景提供一套五层协同优化方案,包括上下文筛选、模型路由调度、系统自学习、任务架构设计等,可斩断高达88%的Token浪费。通过精细化的架构优化而非单纯模型选型,实现AI投入产出比大幅提升,适合已深度使用AI的工程团队。
实现步骤
- 1.分析当前Token消耗构成,区分用户输入、系统提示词、工具调用、上下文检索等各部分占比。
- 2.优化上下文检索层,使用精细化索引(如Glean)替代通用MCP工具,减少冗余信息加载。
- 3.实施多模型混合调度,将标准化任务分配给轻量化模型,仅核心差异化环节使用前沿大模型。
推荐工具
Vanna 2.0 Text-to-SQL智能体框架实战
本场景指导你使用Vanna 2.0搭建一个企业级Text-to-SQL智能体,实现自然语言查询数据库并自动生成图表与解读。Vanna 2.0采用Agentic RAG架构,支持多租户权限隔离、行级安全、流式输出,可对接主流数据库与LLM。通过本实战,业务人员无需SQL即可自助分析数据,SQL生成准确率达85%~91%,适合工程团队快速部署生产级AI数据分析平台。
实现步骤
- 1.安装Vanna 2.0:pip install vanna,确认版本为v2.0.2或更高。
- 2.配置数据库连接:在代码中设置数据库类型(如PostgreSQL、MySQL)和连接参数。
- 3.训练知识库:运行vanna.train(),传入DDL、文档或历史SQL,自动向量化存入ChromaDB。
推荐工具
用 Fable 5 设计自我校正循环
本场景基于 Anthropic 的 Claude Fable 5 模型,通过设计自我校正循环和跨会话记忆机制,提升 AI 在复杂工程任务中的自主迭代能力。实验表明,Fable 5 在参数高尔夫挑战赛中训练效率提升约 6 倍,核心指标优于 Opus 4.7;在持续学习基准中,Fable 5 的记忆验证覆盖率达 73%,远超其他模型。核心要点是使用独立评分子代理替代模型自我评判,并组合记忆流程实现持续学习。
实现步骤
- 1.设定明确的目标和评判标准,作为循环的反馈依据。
- 2.搭建带反馈的运行环境,让 Fable 5 在循环中接收反馈并自主修正。
- 3.使用独立评分子代理在隔离上下文窗口中完成打分核验,确保评判客观。
推荐工具