教程中心
AI Agent 从入门到实战:概念理解、MCP 使用、平台实操、工作流自动化
1252
教程总数
234
入门教程
42
实操教程
按主题浏览
进阶其他
Streaming LLM Responses: Production Patterns
Implementing token streaming for real-time LLM output
LLM 流式响应生产模式(2026):用流式把感知延迟降到 ~100ms。SSE 传输、逐 token flush/关缓冲、断连取消、边流边累积存日志、中途错误与函数调用分片累积等真实模式,Next.js 用 Vercel AI SDK。
llmpatterns
9分钟进阶其他
LLM Fallback Chains: Production Patterns
Automatic fallback between LLM providers on failure
LLM 回退链生产模式(2026):主模型失败时自动跨提供商重试,保住可用性。含 LiteLLM 真实代码、按能力+成本排序、单次超时、只对瞬时错误重试、跨厂商而非同厂、配合负载均衡等设计要点。
llmpatterns
9分钟进阶其他
LLM Load Balancing: Production Patterns
Distributing LLM requests across multiple API keys
LLM 负载均衡生产模式(2026):跨多 key/区域分流以扩吞吐降延迟(与回退链互补)。轮询/最少繁忙/容量感知策略、LiteLLM Router 真实代码、配合回退+健康检查+熔断、尊重限流头与会话粘连。
llmpatterns
9分钟