Dify 搭建企业知识库实战:从零到可用的完整教程

不用写代码,30 分钟搭出一个能回答内部文档问题的 AI 助手

返回教程列表
进阶18 分钟

Dify 搭建企业知识库实战:从零到可用的完整教程

不用写代码,30 分钟搭出一个能回答内部文档问题的 AI 助手

Dify 是目前最简单的企业知识库搭建工具。本文从创建账号到正式上线,手把手教你用 Dify 搭建一个基于 RAG 的内部知识库问答系统——上传文档、配置模型、调试效果、接入应用,所有步骤配有真实场景说明。

DifyRAG知识库企业AILLMDify教程知识库搭建

Dify 搭建企业知识库实战教程

我第一次用 Dify 搭知识库是为了解决团队里的一个痛点:新员工入职后,总是在钉钉群里问一些"公司报销流程是什么""差旅政策是怎么规定的"这类问题,每次都要有人去翻 HR 文档再回答。

花了不到一个小时,把所有 HR 文档上传到 Dify,搭了一个简单的问答 Bot,之后这类问题全部自动解答了。这是我觉得 RAG 知识库真正有价值的第一个例子。

什么是 RAG 知识库?

不需要懂技术的解释:

把你的文档(PDF、Word、网页)上传进去,AI 在回答问题前会先搜索这些文档,找到相关内容后再组织答案——而不是凭空"想象"。这样 AI 的回答就有了依据,不会胡说。

Dify 就是帮你做这件事的工具,而且不需要写代码。


准备工作

账号:去 dify.ai 注册,有免费额度。如果要私有化部署,也可以下载开源版本自己搭。

文档准备

  • 支持 PDF、Word(.docx)、TXT、Markdown、HTML
  • 单文件建议不超过 50MB
  • 中文文档支持很好,不用担心语言问题
  • 选择模型

  • 免费额度内推荐用 Deepseek通义千问(国内,性价比高)
  • 如果不在意价格,Claude 3.5 Sonnet 效果最好
  • 用 OpenAI 需要自备 API Key

  • 第一步:创建知识库

  • 登录 Dify,左侧菜单点击「知识库」
  • 点击「创建知识库」→ 给它取个名字(比如"HR 政策文档")
  • 上传你的文档
  • 上传技巧

  • 可以一次上传多个文件
  • 建议把相关文档分主题放在同一个知识库
  • 不要把不相关的文档混在一起,会影响检索精度

  • 第二步:配置文档分块

    上传后,Dify 会问你怎么分割文档。这个设置很关键,很多人在这里选错了导致效果差。

    推荐配置(适合大多数场景)

    分块大小:500-800 个 token(对中文大概是 300-500 个汉字) 重叠长度:50 token(让相邻块有一点重叠,避免切断上下文)

    什么时候调整

  • 文档里有很多列表和表格 → 可以尝试更小的分块(300 token)
  • 文档是长篇叙述(如技术文档)→ 可以适当增大(1000 token)

  • 第三步:测试检索效果

    在知识库页面,有一个「召回测试」功能,一定要先用这个测试。

    输入你预计用户会问的问题,看看 AI 能检索到哪些相关段落。如果检索结果不理想,需要调整分块配置重新处理文档。


    第四步:创建应用

  • 左侧菜单点击「工作室」→「创建应用」
  • 选择「聊天助手」(最简单的形式)
  • 应用名称:比如"HR 小助手"
  • 在「上下文」那一栏,选择刚才创建的知识库
  • System Prompt 示例

    
    你是公司的 HR 助手,专门回答关于公司政策、报销流程、请假规定等问题。
    回答规则:
    
  • 只基于提供的文档内容回答,不要凭空猜测
  • 如果文档里没有相关信息,明确告知建议联系 HR 部门
  • 使用简洁友好的语言,避免官僚腔调

  • 第五步:调试和优化

    常见问题和解决方法

    问题 1:回答正确但太啰嗦 → 在 System Prompt 里加上:「回答要简洁,控制在 200 字以内」

    问题 2:找不到文档里的信息 → 把「召回 Top-K」从默认的 3 调高到 5-8

    问题 3:AI 回答了文档以外的内容 → 加强 System Prompt:「只能基于提供的知识库内容回答」

    问题 4:中文检索效果差 → Embedding 模型选择支持中文的(推荐 text-embedding-v2 或 BGE)


    第六步:发布和分享

    调试满意后,点击「发布」。Dify 提供多种接入方式:

  • 分享链接:直接发给团队成员用
  • 嵌入到网页:一段代码,粘贴到你的网站
  • API 接口:供开发者调用

  • 实际效果参考

  • 某 20 人团队用来管理产品文档,客服回答问题的准确率从 60% 提升到 88%
  • 某律所用来处理合同模板库,律师助理找模板的时间从平均 15 分钟降到 2 分钟
  • 某教育机构用来回答家长常见问题,人工客服工作量减少约 40%
  • 效果好不好,取决于文档质量和系统提示词的设计——这两个是决定性因素,工具本身退居其次。


    常见问题

    Q:Dify 免费版够用吗? A:个人学习和小团队试用够用。正式生产环境建议自托管开源版,或升级到付费版($59/月起)。

    Q:数据安全吗? A:Dify 是开源项目,可以私有化部署在自己的服务器上,数据完全自己控制。

    Q:和直接用 ChatGPT 问文档有什么区别? A:ChatGPT 处理长文档有上下文限制,而且每次都要重新上传。Dify 把文档处理成向量索引,检索速度快、可扩展、可以管理大量文档。

    👉 了解更多 AI 工作流方案 | 查看 RAG 知识库最佳实践

    相关工具

    DifyClaudeOpenAIDeepSeek