AI Agent News

实时追踪 AI Agent 赛道的重大事件、融资动向、模型发布和技术突破

AI Agent 动态

重大事件时间线

2026-01

OpenClaw GitHub 爆发

OpenClaw 10 天冲上 GitHub 全球 Top 10，超越 Linux 内核 Star 增速

2025-12

Meta 20亿收购 Manus

Meta 以 20 亿美元收购 Manus AI，通用 Agent 赛道正式被巨头锁定

2025-04

DeepSeek-V3 开源

性价比之王，成本仅 GPT-4 的 5%

2025-03

Manus 一夜爆火

全球首款通用 AI Agent 在国内社交平台引发空前关注

2025-02

OpenAI Deep Research

OpenAI 推出深度研究 Agent，一键生成专业研究报告

2025-02

MCP Server 破 500

MCP 生态爆发，3 个月构建 500+ Server

2025-01

DeepSeek-R1 震惊全球

开源推理模型，成本仅 OpenAI 的 3%，引发全球 AI 格局震动

2024-11

MCP 协议诞生

Anthropic 发布 Model Context Protocol，成为 Agent 接口事实标准

2024-10

Claude Computer Use

Anthropic 让 AI 首次直接操控电脑屏幕，开创计算机使用新范式

2024-09

Replit Agent 全栈自动化

自然语言到上线产品，面向非工程师

2024-08

Cursor ARR 破亿

史上增长最快 SaaS，AI 编程工具新王者

2024-06

Claude 3.5 登顶 SWE-bench

最强编程 AI，Bug 修复能力达到初级工程师水平

2024-03

Devin 发布

全球首个自主 AI 软件工程师，能独立完成完整编程任务

research2026年5月30日

AI 制药里程碑：首款完全由 AI 设计的分子药物通过 FDA III 期临床试验

Insilico Medicine 的 INS018_055 成为历史上第一款在整个药物发现过程中完全由 AI 设计的候选药物，并成功通过 FDA III 期临床试验，有望在 2026 年底获批上市。同期，Recursion Pharmaceuticals 和 Exscientia 的 AI 发现药物也进入临床后期。本文分析 AI 制药的技术突破，估算 AI 将如何改变万亿美元医药市场格局，以及投资者关注的 AI 制药标的。

Insilico Medicine

research2026年5月29日

AI 伦理困境 2026：偏见、歧视、幻觉问题如何影响真实用户

MIT、Stanford 联合发布的 2026 年 AI 伦理报告揭示：主流大模型在种族、性别相关任务中仍存在明显偏见，医疗诊断 AI 对有色人种的准确率低 23%，招聘 AI 对女性简历的评分系统性偏低 15%。本文梳理 AI 偏见的来源、现有缓解措施，以及用户在日常使用 AI 工具时如何识别和规避偏见风险。

Stanford HAI

research2025年9月19日

大模型幻觉问题研究进展：新技术使幻觉率降低60%

斯坦福大学和Anthropic联合发布幻觉缓解研究成果，结合检索增强、自我一致性检查和不确定性量化三种技术，在TruthfulQA基准上幻觉率从35%降至14%。研究发现：幻觉主要发生在模型"知识边界"附近；主动表达不确定性是可训练的能力；RAG配合引用追踪效果最佳。

Stanford AI Lab

research2025年9月14日

中国AI人才报告：算法工程师缺口超50万，薪资同比上涨35%

猎聘联合清华大学发布2025年中国AI人才报告。报告显示中国AI专业人才缺口已达50万以上，AI算法工程师平均薪资达35-60万/年（工作3-5年），同比增长35%。大模型方向人才尤为稀缺，顶尖大模型工程师年薪可达200-400万。高校AI专业招生规模扩大3倍，但与需求仍有较大差距。

猎聘

research2025年8月20日

AI能耗危机：2025年数据中心用电量将超过法国全国总用电量

IEA（国际能源署）报告预测2025年全球AI数据中心用电量将达到600TWh，约为法国全国用电量的1.2倍。大模型训练单次消耗的电量可为1000个家庭供电一年。主要AI公司纷纷承诺2030年前实现100%可再生能源，但短期内煤电需求仍将增加。AI芯片效率改善是关键解决路径。

IEA

research2025年8月17日

AI编程Agent突破SWE-bench 70%：软件工程正式进入半自动化时代

多家公司在SWE-bench Verified（真实GitHub issue修复）基准上取得重大突破：Claude 3.7 Sonnet达到62.3%，Devin 2.0达到67.5%，一家初创公司未具名agent达到71.8%。这意味着AI已能可靠完成超过60%的真实软件工程任务，标志着软件工程从"AI辅助"进入"AI主导特定任务"阶段。

SWE-bench

research2025年8月10日