场景库

本场景面向工程技术团队，解决AI编程从Demo到企业级生产系统落地时面临的AI失忆、上下文污染、代码质量不可控等工程化难题。核心方法是基于Claude Code构建五层记忆体系、Hooks质量门禁、动态工作流等Harness工程实践，通过结构化上下文、确定性验证和编排模式，让AI在百万行级代码库中稳定、可控、可校验地完成长周期任务。实测表明，同一模型通过Harness优化可在基准测试中从基线以下跃升至Top 5。

实现步骤

1.建立五层记忆体系：创建Enterprise级CLAUDE.md写入安全合规策略，Project级文件控制在200-300行记录团队规范，Rules级按路径条件化加载细分规范，Local级存放个人备忘并加入.gitignore。
2.配置上下文分诊机制：将候选信息分为P0-P3四个等级，仅将核心日志和历史工单句柄注入上下文，将Token消耗从18K压缩至2K，提升信噪比。
3.实现结构化输入与Stop Hook门禁：避免模糊Prompt，提供具体函数和行号；配置Stop Hook自动运行lint和单元测试，测试未通过则阻断提交并让AI自愈。

推荐工具

Claude CodeClaudeGitpnpm

harness-engineeringai-agentclaude-code

⭐⭐⭐

2小时搭建

Claude Code动态工作流与循环工程实战

利用Claude Code的动态工作流和循环工程模式，搭建自动化任务调度、子智能体编排、结果校验与持久化记忆体系，实现从手动提示到系统自主驱动的转变。通过JavaScript编写的动态工作流可现场定制，支持分类执行、扇出综合、对抗验证等六大模式，有效解决代理懒惰、自我偏好偏差和目标漂移问题。适用于代码重构、深度研究、简历筛选、故障排查等复杂任务，显著提升多步骤、高并行场景下的效率与质量。

实现步骤

1.在Claude Code中使用/loop指令或ultracode触发词创建动态工作流，系统将自动生成JavaScript编排框架。
2.定义任务目标并选择编排模式，如分类执行（Classify-and-act）或扇出综合（Fan-out-and-synthesize），Claude会现场生成子智能体协调方案。
3.利用Automations或/loop设置定时调度（如每5分钟），让循环自动发现任务、分配工作并校验结果。

推荐工具

Claude CodeOpenAI Codexn8n

dynamic-workflowloop-engineeringai-agents

⭐⭐⭐

2周搭建

企业级RAG 2.0系统构建与文档解析实战

本场景指导如何构建企业级RAG 2.0系统，重点解决大模型幻觉、知识新鲜度及数据安全问题。通过分层架构设计、混合检索（向量+全文+知识图谱）和文档解析（OCR、版面分析、表格识别）等关键技术，实现“搜得更全、排得更好、答得更准”。实践表明，结合本体约束与GraphRAG可提升召回准确率15-20%，文档解析前置处理能显著改善知识库质量。适用于工程制造、金融、法律等需要高精度知识问答的行业。

实现步骤

1.部署文档解析平台（如RAGFlow DeepDoc或PaddleOCR-VL），对PDF、扫描件、图纸等文档进行版面分析、表格还原和结构提取。
2.将解析后的结构化内容（Markdown/JSON）切片，构建向量索引（如Infinity）和全文索引（如Elasticsearch），并可选集成知识图谱。
3.设计离线入库流程：文档解析→切片→向量化→索引构建；在线问答流程：query改写→混合检索→重排序→LLM生成。

ragdocument-parsinghybrid-retrieval

⭐⭐⭐

2周搭建

AI Agent记忆系统选型与生产落地

本场景指导工程师如何为AI Agent选型和落地记忆系统，涵盖从RAG到Agentic AI的演进、关键架构决策，以及OpenAI Dreaming V3等前沿方案的评估标准。通过对比手动保存、后台整理和自动梦境合成三种记忆模式，帮助团队在延续上下文、偏好遵循和时效更新三个维度上提升准确率，实现高效、可扩展的Agent记忆底座。

实现步骤

1.评估Agent对记忆的需求：确定是否需要长期上下文、偏好遵循和时效更新，选择RAG、知识图谱或Dreaming等架构。
2.设计记忆存储方案：采用向量数据库（如Pinecone）或图数据库（如Neo4j）存储结构化与非结构化记忆。
3.实现记忆写入机制：通过用户显式指令或后台自动提取（如Dreaming V0/V3）将对话历史转化为持久记忆。

推荐工具

OpenAI ChatGPTPineconeNeo4jAWS

ai-agentmemory-systemrag

⭐⭐⭐

1-2周搭建

多智能体系统优化与协作工作流实战指南

本场景聚焦多智能体系统（MAS）的优化与协作，涵盖固定工作流下的Prompt联合优化（MASPOB）、基于经济激励的去中心化协调（EoM）、流式通信加速（StreamMA）、通用RL训练框架（UnityMAS-O）以及人机协作组织设计。适用于工程团队提升MAS性能、降低延迟、实现自动化分工。

实现步骤

1.评估当前MAS工作流是否固定，若固定则使用MASPOB基于Bandit算法联合优化各Agent的Prompt，在50次评估内提升性能。
2.若需去中心化协调，部署EoM框架，通过拍卖、交易和财富机制让Agent自动分工协作，无需中央控制器。
3.对链式或图式MAS，采用StreamMA流式通信，上游每步推理立即转发下游，实现流水线并行，降低延迟并提升准确性。

multi-agentworkflow-optimizationreinforcement-learning

⭐⭐⭐

2小时搭建评估框架

Agent记忆系统选型与生产落地指南

本场景面向工程团队，提供从选型到生产落地的Agent记忆系统完整方案。基于行动-世界交互循环框架，对比长上下文、人工设计（RAG/外部记忆）、工具驱动三类记忆范式，通过WorldMemArena基准的四阶段诊断（写入、维护、检索、使用）定位记忆失效根源。帮助团队根据任务动态性、多模态需求和成本约束选择合适方案，并规避常见陷阱。

实现步骤

1.明确任务类型：区分终身演化（个人状态/任务状态动态变化）与智能体执行（基于真实观察与反馈生成记忆）两类场景。
2.选择记忆架构：根据任务动态性和多模态需求，从长上下文模型、RAG+外部记忆系统、工具驱动记忆三种范式中选型。
3.设计记忆生命周期：按写入、维护、检索、使用四阶段定义记忆管道，确保每阶段可观测、可诊断。

推荐工具

WorldMemArenaRAG外部记忆系统工具驱动记忆系统

agentmemorymultimodal

⭐⭐⭐

2-3天搭建

用本体驱动Agent可控执行

本场景介绍如何通过本体（Ontology）为AI Agent构建语义基础设施，实现行为约束、上下文管理和结果校验的可控执行。核心思路是将业务规则显式建模为可查询、可校验的结构，替代传统Prompt约束，使Agent在业务骨架内自主行动。适用于需要高可靠性和合规性的企业级Agent开发场景。

实现步骤

1.使用本体建模工具（如Protégé）定义业务实体、关系和规则，构建领域本体。
2.将本体集成到Agent框架中，作为行为约束和上下文检索的语义底座。
3.在Agent执行前，从本体中抽取与任务相关的语义子图，动态注入推理上下文。

推荐工具

ProtégéLangChainLlamaIndexNeo4j

ontologyagentharness

⭐⭐⭐

2小时搭建

用循环工程搭建AI自动化工作流

循环工程（Loop Engineering）是一种新型AI协作范式，通过设计自动化循环系统替代手动向智能体下发指令。工程师将“发现问题、执行、检查、记录、继续”链路封装成闭环，让AI自主迭代任务直至完成。本场景基于Codex或Claude Code，利用自动化调度、工作树、技能、连接器、子智能体和记忆模块，实现CI失败分类、依赖升级、issue转PR等重复性工作的自动化。适用于有强测试套件的工程团队，可显著降低人工轮询成本，但需注意token消耗和人工审核不可缺失。

实现步骤

1.确认任务是重复的、有自动校验手段、token预算充足、Agent能运行自己写的代码，且你愿意审查产出。
2.先手动运行一次任务流程，确保稳定，再沉淀为Skill文件记录项目背景、规范和已知坑点。
3.创建状态文件（如Markdown）记录任务进度、已完成项和待办事项，作为持久化记忆。

推荐工具

Claude CodeCodexGitGitHub ActionsMCP

loop-engineeringai-automationagent-workflow

⭐⭐⭐

2小时搭建

用Agent Harness框架搭建生产级AI智能体

Agent Harness是包裹LLM的完整软件基础设施，包括编排循环、工具、记忆、上下文管理、状态持久化、错误处理和安全护栏。本场景教你基于Agent Harness的八大支柱（个性、工作流、能力、对齐、约束、验证、视觉界面、协调），将无状态LLM转变为稳定、可控、可校验的生产级智能体。通过定义Persona、配置Workflow、集成Capability、设置Alignment和Restraint、添加Verification，以及部署Visual Interface和Coordination，实现企业级智能体的全生命周期管理。实践表明，仅优化Harness而不改模型，在TerminalBench 2.0上排名可从30名外跃升至第5。

实现步骤

1.定义智能体的Persona：设置身份简介、规则文件、记忆上下文和知识库，明确角色定位与知识边界。
2.配置Workflow：通过触发器、会话计划和决策日志，将复杂任务分解为自动化步骤流程。
3.集成Capability：添加斜杠命令、混合执行、嵌入向量和技能体系，构建功能工具箱。

agent-harnessllmai-agent

⭐⭐⭐

2-3天搭建

企业级RAG 2.0系统构建实战

基于RAGFlow和向量数据库Infinity，构建企业级RAG 2.0系统，解决大模型幻觉、知识更新慢和数据隐私问题。通过分层模块化架构，实现文档智能解析、混合检索、多级排序和知识增强生成，显著提升问答准确性和可解释性。适用于办公知识库、客服系统等场景。

实现步骤

1.部署RAGFlow开源框架，配置DeepDoc模块用于文档解析。
2.上传企业文档（PDF、Word等），利用OCR和布局识别提取结构化内容。
3.将解析后的文本切片，调用Embedding模型生成向量，存入向量数据库Infinity。

推荐工具

RAGFlowInfinityElasticsearchLangChain

ragenterpriseknowledge-base

⭐⭐⭐

2小时选型与原型搭建

Agent记忆系统选型与工程落地指南

本场景指导开发者如何为AI Agent选型并落地记忆系统，解决Agent缺乏长期与短期记忆、对话无连续性的问题。通过对比Mem0、Graphiti、Hermes等框架的存储设计，结合n8n或LangGraph等工具构建组件化记忆管理节点，实现记忆的存储、检索与维护。工程落地需考虑生产运维挑战，如记忆一致性、扩展性及成本控制。最终使Agent具备个性与连续性，提升交互智商与情商。

实现步骤

1.梳理Agent业务需求，明确需要长期记忆（持久化知识）还是短期记忆（会话上下文），以及记忆的粒度（如实体、关系、对话摘要）。
2.调研主流记忆框架：Mem0（简洁易用）、Graphiti（图谱关联）、Hermes（高效）、OpenClaw（灵活），根据存储设计（向量、图、键值）和扩展性选型。
3.使用n8n或LangGraph构建Agent记忆管理节点，将记忆存储与检索封装为可复用的组件，支持长期记忆的写入、更新和过期策略。

推荐工具

n8nLangGraphMem0GraphitiHermesOpenClaw

agentmemoryllm

⭐⭐⭐

90分钟直播学习

AI Agent落地：从代码生成到运维自愈

针对企业研发与运维中代码质量难控、老旧系统难重构、运维故障响应慢等痛点，结合深信服、平安人寿、中移九天的实战经验，采用AI编程工具、代码逆向萃取Agent和运维Agent，实现代码生成质量提升、老旧系统萃取准确率99.5%、故障自愈5分钟内完成。通过工程化约束、规则先行、小步快跑等方法，将AI能力转化为组织效能。

实现步骤

1.在AI编程中，通过AST解析和代码切片控制输入上下文，约束模型输出，并建立人工Review与双模型交叉复核机制。
2.针对老旧系统，先构建代码图谱，按分层分域切片，再逆向生成PRD、流程图和架构图，实现自动化重构。
3.运维场景中，采用“规则先行、模型辅助”策略，先固化专家规则，再引入大模型辅助诊断，确保建议可验证、可回滚。

推荐工具

CoStrictGitHub CopilotCursor

ai-agentcode-generationlegacy-system

⭐⭐⭐

1周内搭建

大模型成本治理与Token优化实战

针对企业大模型调用成本失控问题，本场景提供一套五层协同优化方案，包括上下文筛选、模型路由调度、系统自学习、任务架构设计等，可斩断高达88%的Token浪费。通过精细化的架构优化而非单纯模型选型，实现AI投入产出比大幅提升，适合已深度使用AI的工程团队。

实现步骤

1.分析当前Token消耗构成，区分用户输入、系统提示词、工具调用、上下文检索等各部分占比。
2.优化上下文检索层，使用精细化索引（如Glean）替代通用MCP工具，减少冗余信息加载。
3.实施多模型混合调度，将标准化任务分配给轻量化模型，仅核心差异化环节使用前沿大模型。

推荐工具

GleanClaudeMCP

cost-optimizationtoken-efficiencyllm-architecture

⭐⭐⭐

数小时至数天

用 Fable 5 设计自我校正循环

本场景基于 Anthropic 的 Claude Fable 5 模型，通过设计自我校正循环和跨会话记忆机制，提升 AI 在复杂工程任务中的自主迭代能力。实验表明，Fable 5 在参数高尔夫挑战赛中训练效率提升约 6 倍，核心指标优于 Opus 4.7；在持续学习基准中，Fable 5 的记忆验证覆盖率达 73%，远超其他模型。核心要点是使用独立评分子代理替代模型自我评判，并组合记忆流程实现持续学习。

实现步骤

1.设定明确的目标和评判标准，作为循环的反馈依据。
2.搭建带反馈的运行环境，让 Fable 5 在循环中接收反馈并自主修正。
3.使用独立评分子代理在隔离上下文窗口中完成打分核验，确保评判客观。

self-correctionmemoryagent

Getting Started

Learn how to get started with this application.

Learn more

Installation Guide

场景库

自动修复 GitHub Issues

微服务监控告警 Agent

AI 辅助代码审查：自动检测安全漏洞和性能问题

企业级AI Agent Harness工程化落地：从Demo到产线

Claude Code动态工作流与循环工程实战

企业级RAG 2.0系统构建与文档解析实战

AI Agent记忆系统选型与生产落地

多智能体系统优化与协作工作流实战指南

Agent记忆系统选型与生产落地指南

用本体驱动Agent可控执行

用循环工程搭建AI自动化工作流

用Agent Harness框架搭建生产级AI智能体

企业级RAG 2.0系统构建实战

Agent记忆系统选型与工程落地指南

AI Agent落地：从代码生成到运维自愈

大模型成本治理与Token优化实战

用 Fable 5 设计自我校正循环

Documentation

Getting Started

Learn more