教程中心

AI Agent 从入门到实战：概念理解、MCP 使用、平台实操、工作流自动化

246

教程总数

入门教程

实操教程

按主题浏览

RAG 检索增强生成 AI Agent 与多智能体模型部署与生产化工作流与自动化 OpenAI 开发实战 Claude / Anthropic 开发 LangChain / LangGraph 模型微调与训练 Prompt 工程 MCP（Model Context Protocol）评估、测试与可观测 AI 安全与合规 API 与集成开发 AI 与世界杯

高级其他

使用 LoRA 微调大模型：2026 年开发者完全指南

通过实战示例和生产模式掌握 LoRA 微调大模型

LoRA 微调大模型完全指南（2026）：冻结基座、只训低秩适配器，单卡数小时完成；QLoRA 在 4bit 基座上训练适配器。含 PEFT 真实代码、何时该微调(vs 提示/RAG)、数据质量 > 数量的实战要点。

fine-tuninglora

11分钟

进阶其他

OpenAI 函数调用完全指南：2026 年开发者完整教程

通过实际示例和生产模式掌握 OpenAI 函数调用

OpenAI 函数/工具调用完全指南（2026）：使用 JSON Schema 定义工具 → 模型返回结构化调用 → 你执行并反馈结果。包含完整循环的真实代码、生产模式（验证/tool_choice/并行调用/strict）、与结构化输出的区别，以及如何驱动智能体。

openaifunction calling

11分钟

进阶其他

语义搜索实现：2026 年完整开发者指南

通过实际示例和生产模式掌握语义搜索实现

语义搜索实现完全指南（2026）：分块→嵌入→向量库存储→近邻检索→重排的完整管线，含真实代码、向量库选型(Chroma/Qdrant/pgvector/Pinecone)、分块/混合检索/重排/元数据过滤等质量杠杆。RAG 的检索底座。

semantic searchembeddings

10分钟

高级其他

AI 模型量化（GPTQ/AWQ）：2026 年开发者完全指南

通过实际示例和生产模式掌握 AI 模型量化（GPTQ/AWQ）

AI 模型量化（GPTQ/AWQ）完全指南（2026）：用更少比特存储权重以节省显存/提升速度。GPTQ vs AWQ 对比、bitsandbytes/GGUF、4bit 甜点位选择，以及“直接下载预量化权重 + vLLM/Ollama 部署”的实战路径。

quantizationgptq

10分钟

进阶其他

用 Server-Sent Events 实现 AI 流式响应：2026 开发者完全指南

通过实际示例和生产模式掌握基于 Server-Sent Events 的 AI 流式响应

用 SSE 实现 AI 流式响应（2026）：为什么用 SSE 而非 WebSocket、FastAPI 服务端 + 浏览器 EventSource 客户端真实代码、关闭代理缓冲/逐 token flush/断连取消等生产要点，以及 Next.js 用 Vercel AI SDK 的更简路径。

streamingsse

9分钟

高级其他

多向量RAG：2026年Weaviate实现指南

从零构建每个文档存储多种嵌入类型的RAG系统

多向量RAG：2026年完整实现概述多向量RAG是一种专注于为每个文档存储多种嵌入类型的专门检索模式。本指南将向您展示如何使用Weaviate构建一个生产就绪的系统。

ragmulti-vector

30分钟

高级其他

混合搜索RAG：2026年Elasticsearch实现指南

从零构建结合向量与关键词搜索、实现最大召回率的RAG系统

混合搜索RAG：2026年完整实现概述混合搜索RAG是一种专注于结合向量与关键词搜索以实现最大召回率的专门检索模式。本指南将展示如何使用Elasticsearch构建一个生产就绪的系统。

raghybrid-search

30分钟

高级其他

上下文压缩RAG：2026年Pinecone实现指南

从零构建一个压缩检索上下文以适应LLM窗口的RAG系统

上下文压缩RAG：2026年完整实现概述上下文压缩RAG是一种专门的检索模式，专注于压缩检索到的上下文以适应LLM窗口。本指南将教你如何使用Pinecone构建一个生产就绪的系统。

ragcontextual-compression

30分钟

高级其他

自查询RAG：2026年Qdrant实现指南

构建基于AI生成元数据过滤器的精确检索RAG系统

自查询RAG：2026年完整实现概述自查询RAG是一种专注于AI生成元数据过滤器以实现精确检索的专门检索模式。本指南将展示如何使用Qdrant构建生产级系统。

ragself-query

30分钟

高级其他

Graph RAG：基于Neo4j的实现指南（2026版）

从零构建用于多跳推理的知识图谱遍历RAG系统

Graph RAG：2026完整实现概述 Graph RAG是一种专注于知识图谱遍历以实现多跳推理的专用检索模式。本指南将展示如何使用Neo4j构建生产级系统。为什么选择Graph RAG

raggraph

30分钟

高级其他

父文档RAG：2026年Chroma实现指南

从零构建检索小片段并附带大父上下文的RAG系统

父文档RAG：2026年完整实现概述父文档RAG是一种专门的检索模式，专注于检索小片段并附带大父上下文。本指南展示如何使用Chroma构建生产级系统。

ragparent-document

30分钟

Getting Started

Learn how to get started with this application.

Learn more

Installation Guide

教程中心

按主题浏览

使用 LoRA 微调大模型：2026 年开发者完全指南

OpenAI 函数调用完全指南：2026 年开发者完整教程

语义搜索实现：2026 年完整开发者指南

AI 模型量化（GPTQ/AWQ）：2026 年开发者完全指南

用 Server-Sent Events 实现 AI 流式响应：2026 开发者完全指南

多向量RAG：2026年Weaviate实现指南

混合搜索RAG：2026年Elasticsearch实现指南

上下文压缩RAG：2026年Pinecone实现指南

自查询RAG：2026年Qdrant实现指南

Graph RAG：基于Neo4j的实现指南（2026版）

父文档RAG：2026年Chroma实现指南

Documentation

Getting Started

Learn more