217+
AI Agent
2300+
MCP Server
55
主流模型
94
落地场景
1286
实战教程
423
行业资讯
7 大功能模块,覆盖 AI Agent 使用的全部场景
精选全球 AI Skill 资源站,覆盖 ClaWHub、OpenClaw 等官方平台及社区聚合站,一键直达。
汇聚 Manus、Devin、OpenClaw、Dify 等全球顶级 AI Agent 工具,支持类型筛选和对比。
Model Context Protocol Server 精选导航,让 AI 连接文件、数据库、GitHub、Notion 等工具,20+ 实用 Server。
GPT-4o、Claude 3.5、DeepSeek-V3、Gemini 2.0 等主流模型横向对比,含能力评分、价格和 Benchmark 排行。
从"什么是 AI Agent"到实战操作,8 篇系统教程覆盖新手入门、MCP 使用、Dify 搭建、n8n 自动化。
15 个真实落地场景:营销自动化、自动修复 Bug、行业调研报告、邮件分类……附推荐工具组合和实现步骤。
追踪 AI Agent 赛道重大事件:Manus 被 Meta 收购、DeepSeek-R1 开源、MCP 诞生……完整时间线。
2024 年至今,行业里程碑时间线
MCP 协议诞生
AI Agent 接口标准化
DeepSeek-R1
开源推理,成本仅 3%
Manus 爆火
通用 Agent 元年到来
Meta 收购 Manus
巨头押注 Agent 赛道
大家都在搜的实战对比与上手指南,精选高热度内容
Dify vs 扣子(Coze) vs FastGPT 终极对比(2026):企业私有化选 Dify、国内渠道分发选扣子、中文知识库问答选 FastGPT。含 Docker 部署实操、API 调用示例、四大场景选型与常见坑。
完整的 LlamaIndex 2026 教程。涵盖 VectorStoreIndex、持久化 Qdrant 存储、聊天引擎、子问题分解、语义分块、元数据过滤和流式传输。
pgvector 教程(2026 年):在现有 PostgreSQL 上执行向量搜索——HNSW 与 IVFFlat 选择、操作符对齐、完整 Python 流水线、SQL 过滤与混合搜索(专用向量数据库的付费功能在此仅是一个查询)、内存估算及迁移阈值。
Claude Artifacts 与 ChatGPT Code Interpreter(2026):前者是浏览器端交互式渲染画布(UI 原型/可视化/可发布分享),后者是服务端 Python 沙箱(文件分析/数据处理)。如果任务是“构建交互式内容”,选前者;如果是“处理这个文件”,选后者。包含组合使用方案。
Zod vs Pydantic 用于 AI 输出验证(2026):TypeScript 栈使用 Zod(Vercel AI SDK),Python 栈使用 Pydantic(OpenAI SDK/Instructor)。LLM 输出是不可信输入——包含两个栈的实际代码、自修复重试、反幻觉语义验证以及跨栈 JSON Schema 同步。
Cloudflare AI Workers AI:2026年完全指南 概述 Cloudflare AI Workers AI为企业级AI应用提供边缘AI推理能力,实现零延迟。作为领先的云AI平台之一,它具备生产应用所需的可靠性、可扩展性和安全性。
OpenAI 函数/工具调用完全指南(2026):使用 JSON Schema 定义工具 → 模型返回结构化调用 → 你执行并反馈结果。包含完整循环的真实代码、生产模式(验证/tool_choice/并行调用/strict)、与结构化输出的区别,以及如何驱动智能体。
LangGraph 完全指南(2026):将智能体构建为状态机——State+reducer、条件边、检查点持久化(多轮记忆/崩溃恢复/时间旅行)、用于人工审批门控的中断、多智能体监督者模式。包含何时使用与何时不使用的诚实对比。
AI Agent 从入门到实战,手把手教你用好每个工具
GitHub Copilot 进阶 8 技(2026):内联 Chat 斜杠命令、仓库级 copilot-instructions.md(影响最大的杠杆)、#file/@workspace 上下文变量、Edits 多文件编辑、Agent 模式验收标准前置、补全隐藏操作、代码评审、CLI。
Dify vs 扣子(Coze) vs FastGPT 终极对比(2026):企业私有化选 Dify、国内渠道分发选扣子、中文知识库问答选 FastGPT。含 Docker 部署实操、API 调用示例、四大场景选型与常见坑。
Replit Agent 完整教程(2026):真实 Linux 环境里的对话式全栈助手——从一句话需求到公网 URL。含验收标准前置提示词、Agent vs Assistant 成本分工、Secrets/Checkpoint 工程习惯、与 Bolt/Cursor 的赛道划分。
OpenClaw 私人 AI 助手搭建(2026):自托管开源 Agent——Docker 启动、接云 API 或本地 Ollama(数据不出机器)。四类真正有用的任务(文件管家/本地知识问答/简报/轻自动化)+ 三条安全纪律(最小授权/危险动作确认/目录隔离)。
追踪 AI Agent 赛道最新动态与深度分析
AI 绘画公司 Midjourney 于 2025 年 5 月宣布成立 Midjourney Medical 部门,并发布一款名为 Midjourney Scanner 的全身超声波扫描仪。该设备将 50 万个微型声学换能器集成在浴池中,用户浸泡在温水中 60 秒即可完成全身扫描,生成精度达 0.5 毫米的 3D 人体全息模型,包含血管、骨骼、肌肉及实时血流信息。扫描速度比传统 MRI 快近 100 倍,且无辐射。 ## 技术原理 - **硬件**:扫描仪由约 50 万个微型换能器组成环形阵列,每个单元兼具扬声器和麦克风功能,每秒发出数百万次超声波并记录回波。 - **数据量**:每秒产生数 TB 数据,相当于 500 小时高清视频。 - **算力**:配备 21 台服务器,算力达 4 Petaflops,利用 Midjourney 的扩散模型算法将声波形变数据重建为高清人体结构。 - **AI 处理**:对原始图像进行语义分割,标注腹直肌、血管、骨骼等解剖结构,最终拼合成全身 3D 地图。 ## 落地路径 - **2027 年**:首家 Midjourney Spa 旗舰店在旧金山开业,用户可在泡澡、桑拿等放松过程中完成扫描,扫描结果作为身体成分图谱提供。 - **2028 年**:推出第三代扫描仪,采用定制芯片,提升成像质量和速度。 - **2031 年目标**:全球部署超过 5 万台扫描仪,实现每月 10 亿次扫描。 - **监管策略**:初期仅提供身体成分信息,逐步申请更高级别的诊断能力批准。 ## 影响与争议 - **医疗潜力**:Midjourney 声称,若早期影像干预大规模普及,可避免全球 30% 的死亡,削减 50% 的医疗成本。 - **行业反应**:消息引发硅谷震动,马斯克点赞。部分放射科医生认为,若能高保真捕捉实时生理变化,将颠覆血管及血流成像技术。 - **争议点**:设备尚未获得 FDA 等监管机构批准,诊断能力有限;大规模部署涉及隐私、数据安全及伦理问题。
2026年6月,谷歌DeepMind在48小时内连续失去两位重量级AI科学家。6月17日,Gemini联合负责人、Transformer论文作者Noam Shazeer宣布离职并加入OpenAI;6月19日,诺贝尔化学奖得主、AlphaFold之父John Jumper宣布转投Anthropic。 ## 事件背景 - **Noam Shazeer**:Transformer论文《Attention Is All You Need》作者之一。2021年离开谷歌创办Character.AI,2024年谷歌以约27亿美元将其与团队重新带回。不到两年后再次离职,加入OpenAI。OpenAI CEO Sam Altman称Shazeer是“从创立之初最想合作的人之一”。 - **John Jumper**:谷歌DeepMind资深研究员,2024年与Demis Hassabis共同获得诺贝尔化学奖。他领导的AlphaFold已预测超2亿种蛋白质结构,对生物学和药物研发影响深远。Jumper还是谷歌AI编程开发团队核心成员。 ## 离职原因分析 - **大公司病**:多位评论指出,谷歌内部官僚主义严重,计算资源内耗(如原Google Brain与DeepMind融合中的资源争夺),跨部门协同繁琐。Transformer作者之一Llion Jones曾表示“官僚体系让我感觉什么事都推进不了”。 - **战略分歧**:谷歌领导层对Scaling Law缺乏绝对信仰,曾将TPU算力卖给竞争对手Anthropic。谷歌试图面面俱到,缺乏初创公司“All in LLM”的专注度。 - **激励机制**:前员工指出,谷歌内部鼓励造新项目以获取晋升,导致产品重复(如多个AI编程工具),维护现有产品缺乏价值。 - **薪酬与期权**:OpenAI和Anthropi临近IPO,Pre-IPO股票期权对顶级人才吸引力巨大,成熟上市公司难以抗衡。 ## 影响与行业反应 - **对谷歌的打击**:Shazeer的离开使Gemini未来蒙上不确定性,有员工称“他救了Gemini”。Jumper的离职则加剧了谷歌在AI编程工具和AI for Science领域的竞争压力。分析师Gil Luria表示,前沿AI实验室愿意不惜代价招揽人才,OpenAI和Anthropic因更少官僚作风而占优。 - **Anthropic的布局**:Jumper加入Anthropic,标志着其从大语言模型向AI for Science领域扩展。此前Anthropic已收购生物AI公司Coefficient Bio,并推出Claude for Life Sciences。此举可能直接与谷歌旗下Isomorphic Labs竞争。 - **行业趋势**:硅谷风投SignalFire数据显示,Anthropic两年员工留存率高达80%。网友评论“过去的12个月完全属于Anthropic”,其团队已吸纳多位顶级人才。 ## 数据与现状 - 谷歌Gemini 3.5 Pro多次跳票,公开榜单显示Gemini 3.1 Pro得分约46分,落后于Anthropic的Claude Fable 5(64.9分)和中国开源模型GLM-5.2(51分)。 - 内部员工透露,团队对模型能力掉至“第三甚至第四”感到沮丧,并称“不能怪Noam离开,他不会是最后一个”。
AI 绘画公司 Midjourney 正式进军医疗领域,成立 Midjourney Medical 部门,并发布一款名为 Midjourney Scanner 的全身超声波扫描仪。该设备集成约 50 万个微型声学换能器,用户只需在金色温水中浸泡 60 秒,即可生成精度达亚毫米级的全身 3D 解剖模型,速度比传统 MRI 快近 100 倍。 ## 工作原理 扫描仪采用超声波回声定位技术,用户站上升降平台,以每秒 5 厘米的速度缓慢浸入水中。环形排列的 50 万个换能器(每个约沙粒大小)同时发出并接收超声波,每秒产生数 TB 数据(相当于 500 小时高清视频)。系统通过分析声波穿过不同组织(皮肤、脂肪、肌肉、骨骼)时的波形变化,反推出内部结构,再经 AI 语义分割标注具体解剖部位(如腹直肌、肠系膜血管等),最终合成完整 3D 地图。 ## 算力与硬件 为处理海量数据,扫描仪配备 21 台服务器,总算力达 4 Petaflops。Midjourney 利用其在图像生成领域的扩散模型算法,将声波数据“渲染”为高精度人体图像。水作为最佳声波导体,实现了无死角扫描。 ## 落地计划 Midjourney 不直接销售设备,而是通过开设“Midjourney Spa”提供体验服务。首家旗舰店计划于 2027 年在旧金山开业,用户可在泡澡、桑拿等放松过程中完成扫描。未来 12 个月将迭代硬件并建设内部研究型 Spa;2028 年推出第三代定制芯片扫描仪;长期目标是在 2031 年前全球部署 5 万台设备,实现每月 10 亿次扫描。 ## 监管与愿景 当前阶段,扫描仪仅提供身体成分图谱,后续将逐步申请更高级别的诊断能力批准。Midjourney 认为,大规模早期低成本扫描可帮助避免全球 30% 的死亡,并削减 50% 的医疗支出。马斯克已对此项目表示关注。
2026年4月,九章云极在2026全球智算科技峰会暨战略发布会上正式推出“AI工厂”战略,旨在通过标准化、工业化的方式解决大模型从研发到产业落地的工程鸿沟。该项目包含两大核心设施:训练工厂和Token工厂。训练工厂目标算力规模达10万P,通过强化学习等技术将通用大模型“冶炼”为金融、制造、政务等行业的专业模型;Token工厂目标日均产能10万亿Token,将专业模型封装为企业可调用、可计量的智能服务。九章云极还首创“一度算力”(DCU)计量单位(312 TFlops×小时),使算力采购像用电一样按度付费。AI工厂计划实现1000倍综合降本,孵化1000个高价值模型与应用。 ## 背景:从算力竞赛到工业化生产 截至2026年3月,中国日均Token调用量已突破140万亿,两年增长超千倍,但企业普遍面临“模型会回答但不会执行”的困境。通用大模型在聊天场景表现优异,但在复杂业务流程(如审批、质检)中频繁出错。九章云极创始人方磊指出,智能竞争的核心已从技术卓越转向生产力工业化,AI工厂正是为解决这一矛盾而生。 ## 关键细节:AI工厂的运转机制 AI工厂由四个关键环节构成闭环: - **投入侧**:首创“一度算力”(DCU),将异构GPU、NPU、网络、存储等资源统一折算为312 TFlops×小时,客户按度付费,实现算力采购标准化。 - **生产侧**:训练工厂通过五项工程能力(弹性算力、混合调度、网络优化、存储优化、多租户排队)和强化学习训练栈(支持PPO、DPO、GRPO等算法),将通用模型“冶炼”为专业模型。训练工厂已通过中国信通院标准评测,训练效率提升100%,GPU利用率提升50%。 - **封装侧**:Token工厂将专业模型封装为可调用、可计量、可运营的专业Token,分为消费级、专业级、前沿级三层,其中专业级Token面向金融风控、质量检测等场景,提供确定的ROI。 - **产出侧**:企业消费Token后回流业务数据,驱动模型持续迭代,形成“越用越强,越强越便宜”的飞轮。 ## 各方反应与数据 - **行业痛点**:传统企业AI建设周期长达6-12个月,需自建集群、运维团队,前期资本开支高昂。AI工厂模式下,企业可从训练或推理任意环节切入:大模型公司从训练工厂开始,行业客户从Token工厂直接调用服务,最快两周完成概念验证。 - **技术验证**:九章云极已率先通过中国信通院“大模型计算资源调度平台”标准评测,81项能力评估全覆盖。 - **市场数据**:截至2026年3月,中国日均Token调用量超140万亿,但亚马逊等企业发现Token用量激增并未带来效率提升,凸显专业Token的必要性。 ## 影响与展望 AI工厂的推出标志着智算云商业逻辑的转变:从单纯提供算力转向交付可量化的智能。九章云极定位在应用层上游,为ISV、集成商和企业提供底层智能生产与交付体系。若目标达成,10万P算力和10万亿Token日产能将大幅降低企业AI应用门槛,推动产业智能化加速。不过,强化学习的大规模工业化仍面临万卡集群稳定性、奖励函数自动化等工程挑战,九章云极的训练工厂能否持续兑现承诺,有待市场检验。
2026年6月19日,2024年诺贝尔化学奖得主、AlphaFold核心领导者John Jumper宣布离开效力近九年的谷歌DeepMind,加入AI公司Anthropic。此前两天,Transformer论文作者之一、Gemini联合负责人Noam Shazeer也离职加入OpenAI。谷歌在48小时内连续失去两位顶级AI科学家,引发行业震动。 ## 事件经过 John Jumper在X平台发文确认离职,称将先休整一段时间后正式加入Anthropic。他感谢DeepMind CEO Demis Hassabis在其博士毕业仅6个月时委以重任,领导AlphaFold团队。Hassabis随即回应,肯定两人九年的合作,称AlphaFold“改变了世界”。Anthropic证实Jumper即将加盟,但未披露具体职位。 ## 人才流失背景 Jumper的离职并非孤立事件。两天前,Noam Shazeer——Transformer论文核心作者、谷歌曾斥资约27亿美元从Character.AI请回的Gemini联合负责人——宣布加入OpenAI。过去一年,谷歌DeepMind还流失了AlphaGo/AlphaZero主导者David Silver(创业)、Gemini推理技术核心负责人等。据不完全统计,过去8年超过20位顶级研究者离开DeepMind/Brain。 ## 深层原因分析 多位业内人士指出,谷歌面临“大公司病”困境: - **组织官僚化**:内部计算资源争夺激烈,跨部门协同低效。Transformer作者之一Llion Jones曾表示“官僚体系让我感觉什么事都推进不了”。 - **战略分歧**:谷歌试图面面俱到,缺乏初创公司“All in LLM”的专注度。有报道称,谷歌曾将珍贵TPU算力租给竞争对手Anthropic。 - **激励机制**:内部鼓励造新产品而非维护现有产品,导致产品线混乱(如多个AI编程工具并行)。 - **薪酬竞争**:OpenAI和Anthropi临近IPO,Pre-IPO股票期权对顶级人才吸引力巨大。 ## 行业影响 Jumper加入Anthropic,标志着AI for Science赛道进入新阶段。Anthropic此前已斥资4亿美元收购生物AI公司Coefficient Bio,并推出Claude for Life Sciences。Jumper的加盟将补齐其AI+生物短板,与DeepMind旗下Isomorphic Labs形成直接竞争。 OpenAI同样在生命科学领域布局,今年4月发布生物医学推理模型GPT-Rosalind,并与多家药企合作。三家前沿AI实验室正将竞争焦点从语言模型扩展至生命科学。 ## 谷歌困境 谷歌模型竞争力下滑明显。在Artificial Analysis智能指数榜单上,其最强模型Gemini 3.1 Pro仅排名第五,落后于Anthropic、OpenAI及中国智谱AI。被寄予厚望的Gemini 3.5 Pro一再跳票,内部员工透露团队弥漫挫败感,有员工直言“不能怪Noam离开,他不会是最后一个”。
新浪微博团队近日开源了VibeThinker-3B,一个仅有30亿参数的密集推理模型,在数学竞赛和编程等可验证推理任务上表现惊人,性能直逼千亿甚至万亿参数的顶级模型。 ## 核心性能数据 - **AIME26**:得分94.3,结合测试时扩展策略CLR后提升至97.1。 - **IMO-AnswerBench**:单跑得分76.4,加CLR后达80.6,与DeepSeek V3.2(78.3,6710亿参数)、GLM-5(82.5,7440亿参数)、Kimi K2.5(81.8,1万亿参数)处于同一区间。 - **LiveCodeBench v6**:Pass@1达80.2。 - **LeetCode最新未公开周赛**:2026年4月25日至5月31日期间128道题首次提交通过123道,通过率96.1%。 - **IFEval**:93.4分。 ## 训练方法 VibeThinker-3B基于Qwen2.5-Coder-3B构建,采用升级版Spectrum-to-Signal后训练流程,包括: - **课程式两阶段SFT**:第一阶段覆盖数学、编程、STEM推理等通用能力;第二阶段聚焦高难度长跨度样本,使用多样性探索蒸馏保留多种有效解题路径。 - **多领域推理强化学习**:复用MGPO策略,依次在数学、编程、STEM任务上训练,使用单一64K长上下文窗口。 - **离线自蒸馏**:从RL检查点筛选高质量轨迹,基于学习潜力评分优先选择正确但模型尚未充分掌握的轨迹,蒸馏为统一学生模型。 - **指令强化学习**:提升模型对用户提示的可控性,对格式敏感和开放式指令分别采用规则验证器和评分奖励模型。 ## 参数压缩-覆盖假说 研究团队提出,不同能力对参数规模的依赖方式不同:可验证推理(如数学、编程)是高度可压缩的参数密集型能力,任务结构清晰、反馈信号可靠,小模型可逼近前沿;而开放域知识、通用对话等依赖大规模参数覆盖事实和概念。该假说认为小模型与大模型是互补关系,而非替代。 ## 开源与限制 模型已在Hugging Face、GitHub和ModelScope开源。官方明确指出,模型在需要通用知识的领域表现不佳,其优势集中在可验证推理任务上。
精选进阶实战与主题合集,覆盖 RAG、Agent 工程化、后训练等高价值方向