场景库
AI Agent 真实落地场景,从营销到编程,从研究到效率工具,附推荐工具组合和实现步骤
8
营销
27
编程
7
研究
15
效率
9
垂直行业
⭐⭐⭐
2-3小时/批次专利文献批量分析
批量下载和分析竞争对手的专利文献,AI 提取技术方案要点、保护范围和申请趋势,帮助研发团队快速了解技术格局并规避专利风险。
实现步骤
- 1.确定目标专利范围和关键词
- 2.通过 fetch MCP 下载 USPTO/EPO 专利文档
- 3.Claude 分析专利权利要求书和技术方案
推荐工具
Claudefilesystemfetchbrave-search
专利分析知识产权R&D
⭐⭐⭐
1-2周搭建大模型后训练OPD实战:从原理到框架搭建
本文基于清华Rethinking OPD论文、各模型技术报告及LiteScale框架实践,系统讲解On-Policy Distillation的核心条件、底层机制与工程实现。你将学会如何判断老师模型是否适合蒸馏、如何避免训崩,并掌握一套可运行的异步OPD训练框架搭建方法,提升小模型在推理任务上的效果。
实现步骤
- 1.检查老师模型是否满足两个核心条件:思维模式兼容(初始重叠率高)且具备学生未有的新能力(如额外RL训练获得)。
- 2.若老师条件不足,优先选择同家族、经过额外RL训练的模型,或使用多教师OPD整合多个专家能力。
- 3.在现有RL框架中,将优势函数替换为教师与学生log ratio的reverse KL散度,实现单行代码接入OPD。
推荐工具
MegatronSGLangvLLMLiteScale
opdon-policy-distillationpost-training