企业级 RAG 2.0 系统构建指南：从检索增强到智能体融合

结合本体约束、分层策略与混合检索，构建高准确率、低幻觉的企业级 RAG 系统

进阶约 25 分钟

企业级 RAG 2.0 系统构建指南：从检索增强到智能体融合

结合本体约束、分层策略与混合检索，构建高准确率、低幻觉的企业级 RAG 系统

本文系统讲解企业级 RAG 2.0 系统的构建方法，涵盖核心技术架构、文档解析、混合检索、两阶段排序、本体约束融合以及 Agentic RAG 等关键环节。结合中国移动、悦点科技、趣丸科技等真实案例，深入剖析如何通过本体论与分层策略提升检索准确率、降低幻觉，并实现从被动问答到主动执行的演进。适合中级开发者学习企业级 RAG 工程实践。

rag evaluation security prompt-injection

引言

大模型在落地企业场景时面临三大核心挑战：幻觉问题（生成虚假信息）、知识新鲜度不足（训练数据截止日期限制）、数据安全与隐私风险。检索增强生成（RAG）通过引入外部知识库，将生成过程与检索系统结合，显著提升了回答的准确性与可解释性。然而，简单的“检索-拼接-生成”流水线在复杂业务中往往表现不佳：检索结果不全面、排序不精准、生成内容仍可能偏离业务规则。

为此，业界逐渐从基础 RAG 演进到 RAG 2.0——一种模块化、可编排的架构，融合了混合检索、多阶段排序、本体约束、Agent 自主推理等能力。本文将从核心技术架构出发，结合中国移动、悦点科技 Knora、趣丸科技等企业的实践，系统讲解如何构建高准确率、低幻觉的企业级 RAG 系统。

一、RAG 核心技术架构演进

1.1 从朴素 RAG 到模块化 RAG

传统的朴素 RAG 流程为：文档分块 → 向量化 → 检索 → 生成。这种架构存在明显局限：

检索前缺乏查询优化，长尾查询效果差；

检索后缺少精排，噪声直接进入生成器；

无法处理多轮对话中的指代消歧。

模块化 RAG 将流程拆解为可独立优化的组件，包括：

索引模块：文档解析、分块、向量化；

前处理模块：查询改写、假设文档生成（HyDE）；

检索模块：混合检索（向量 + 全文）；

后处理模块：重排序、过滤、知识校验；

生成模块：提示词组装、大模型生成。

1.2 企业级 RAG 系统架构分层

一个典型的企业级 RAG 系统包含三层：

算法组件层：OCR、表格识别、分词、向量模型等，与服务剥离开，支持热插拔；

流程构建层：离线入库（文档解析→分块→索引构建）和在线问答（查询改写→混合检索→排序→生成）；

用户配置层：知识库管理、模型选择、对话规则配置。

这种分层设计带来四大优势：功能模块化、水平可扩展、算法可插拔、低成本易维护。

二、搜得更全：检索阶段的优化实践

2.1 文档解析：RAG 的前置基石

企业文档格式多样（PDF、Word、扫描件），解析质量直接影响后续检索效果。核心要求是：内容不损失、结构保留。

Word 文档：自带版面结构，可直接进行语义分块；

PDF 文档：需进行版面分析、表格识别、阅读顺序还原。可基于开源工具如 RAGFlow 的 DeepDoc 模块进行二次开发。

分块策略需平衡粒度：

切分过短：检索准确但上下文丢失；

切分过长：内容混杂，噪声增加。

实践中常采用结构切分 + 长度切分两步法：先按标题、段落等逻辑结构划分，再对长段按 token 数（如 256-512）截断。

2.2 查询改写：多轮对话的上下文补全

在多轮对话中，用户常使用指代词（如“它”“这个”）或省略信息。需要将历史上下文融入当前查询，转化为独立的自包含问题。

常见方案：

基于规则模板（如拼接最近 N 轮对话）；

基于小模型（如 TPLinker）进行指代消歧与信息补全；

基于大模型直接改写。

2.3 混合检索：向量 + 全文的互补

检索方式优势劣势

向量检索语义理解、跨语言、泛化强对低频实体词不敏感全文检索（BM25）精确匹配、可解释、支持逻辑运算无法理解同义词

混合检索将两者结果融合，常用策略：

加权求和：分别检索后按权重合并；

RRF（倒数排序融合）：基于排名而非得分，避免不同模型得分不可比问题。

在向量模型选择上，可选用双模型互补，如 BGE-M3 与 BCE 组合，兼顾多语言与精确匹配。

三、排得更好：两阶段排序策略

检索阶段通常返回 Top-100 候选，但直接送入大模型会引入噪声。需要经过粗排 + 精排两级过滤：

粗排（RRF）：将向量检索和全文检索的结果按排名融合，选出 Top-20；

精排（交叉编码器）：使用更精细的相关性模型（如 BGE-Reranker）对 Top-20 重新打分，选出 Top-5。

此外，可加入知识过滤环节：根据业务规则（如权限、时效性）剔除不合规内容。

四、回答得更准：生成阶段的优化

4.1 提示词模板与知识排版

将检索到的知识块按逻辑顺序排版，与用户查询组装成结构化提示词。模板设计要点：

明确角色与任务；

给出知识来源的引用格式；

要求模型在无答案时明确拒绝。

4.2 本体约束：让大模型懂业务规则

纯 RAG 系统仍可能生成违反业务规范的回答。引入本体（Ontology）可提供稳定的语义约束与推理框架。

本体模型包含三类元素：

语义元素：实体、关系、事件及属性；

Action：可执行的行为（如“创建工单”）；

Logic：业务规则（如“金额超过 10 万需审批”）。

在生成阶段，认知引擎将本体约束注入提示词，并对生成结果进行校验：若违反硬约束则打回重推。

趣丸科技采用 “LLM + 本体约束”双引擎策略：

核心知识：本体 + 规则，准确率 > 85%；

一般知识：LLM + 本体约束，准确率 80-85%。

五、Agentic RAG：从被动问答到主动执行

5.1 企业级自主智能体架构

RAG 2.0 的更高阶形态是 Agentic RAG——智能体不仅能回答问题，还能调用工具、执行业务流程。

以悦点科技的 Knora Claw 为例，其架构分为三层：

本体层：定义实体、关系、Action、Logic；

认知引擎层：在智能体执行前注入领域知识，执行后校验结果；

智能体执行层：调用工具（如 API、数据库）完成任务。

5.2 基于 MCP + Skills 的工具调用

MCP（Model Context Protocol）提供标准化的工具接口，智能体可通过 CLI 或 API 调用预定义的 Skills（如“生成报告”“发送邮件”）。

在 LED 生产线场景中，Knora Claw 自动调用“质量追溯”“任务派发”等 Skills，根据预警数据生成改进报告，并向不同角色推送差异化任务，实现从问题发现到闭环执行的全自动化。

六、安全与评估：企业落地的关键保障

6.1 安全防护

企业级 RAG 需防范提示注入、数据泄露等风险。措施包括：

输入过滤：检测并拦截恶意指令；

权限控制：基于本体定义实体级、属性级访问权限；

输出审核：对生成内容进行合规性检查。

6.2 评估体系

建立多维度的评估指标：

检索质量：Recall@K、MRR；

生成质量：忠实度（Faithfulness）、答案相关度（Relevance）；

业务指标：工单处理效率、用户满意度。

七、总结

企业级 RAG 2.0 系统已从简单的检索-生成流水线演进为融合本体约束、多阶段排序、Agent 自主执行的复杂系统。核心要点包括：

文档解析是基石，需兼顾内容完整与结构保留；

混合检索 + 两阶段排序可显著提升召回准确率；

本体约束有效降低幻觉，确保业务合规；

Agentic RAG 实现从问答到执行的闭环。

未来，随着 MCP 等协议标准化，RAG 系统将更深度地与业务系统集成，成为企业智能化的核心基础设施。

FAQ

RAG 与微调相比有哪些优势？ RAG 无需重新训练模型，可实时更新知识库，具备可解释性和可观测性，且能有效降低幻觉。微调更适合模型风格适配或领域术语强化，但无法解决知识新鲜度问题。

如何选择混合检索中的权重？ 权重通常通过实验调优确定。常见做法是先用等权融合，再根据业务场景（如实体精确匹配需求高时提高全文检索权重）调整。也可使用 RRF 方法避免权重选择。

本体约束的构建成本高吗？ 传统手工构建本体成本较高，但现代工具（如 Knora 平台）支持自动本体构建，通过分层处理与置信度驱动，可将冷启动周期从数周压缩至小时级。

Agentic RAG 与普通 RAG 的核心区别是什么？ 普通 RAG 仅返回答案；Agentic RAG 能自主调用工具、执行业务流程，实现从分析到行动的闭环。例如，发现设备异常后自动创建维修工单并通知相关人员。

如何评估 RAG 系统的效果？ 建议从检索质量（Recall@K、MRR）、生成质量（忠实度、相关性）、业务指标（处理效率、用户满意度）三个维度综合评估。

所属主题：RAG 检索增强生成评估、测试与可观测 AI 安全与合规

Getting Started

Learn how to get started with this application.

Learn more

Installation Guide

企业级 RAG 2.0 系统构建指南：从检索增强到智能体融合

引言

一、RAG 核心技术架构演进

1.1 从朴素 RAG 到模块化 RAG

1.2 企业级 RAG 系统架构分层

二、搜得更全：检索阶段的优化实践

2.1 文档解析：RAG 的前置基石

2.2 查询改写：多轮对话的上下文补全

2.3 混合检索：向量 + 全文的互补

三、排得更好：两阶段排序策略

四、回答得更准：生成阶段的优化

4.1 提示词模板与知识排版

4.2 本体约束：让大模型懂业务规则

五、Agentic RAG：从被动问答到主动执行

5.1 企业级自主智能体架构

5.2 基于 MCP + Skills 的工具调用

六、安全与评估：企业落地的关键保障

6.1 安全防护

6.2 评估体系

七、总结

FAQ

Documentation

Getting Started

Learn more