AI Agent News

实时追踪 AI Agent 赛道的重大事件、融资动向、模型发布和技术突破

AI Agent 动态

最新行业资讯

实时追踪 AI Agent 赛道的重大事件、融资动向、模型发布和技术突破

重大事件时间线

2026-01

OpenClaw GitHub 爆发

OpenClaw 10 天冲上 GitHub 全球 Top 10,超越 Linux 内核 Star 增速

2025-12

Meta 20亿收购 Manus

Meta 以 20 亿美元收购 Manus AI,通用 Agent 赛道正式被巨头锁定

2025-04

DeepSeek-V3 开源

性价比之王,成本仅 GPT-4 的 5%

2025-03

Manus 一夜爆火

全球首款通用 AI Agent 在国内社交平台引发空前关注

2025-02

OpenAI Deep Research

OpenAI 推出深度研究 Agent,一键生成专业研究报告

2025-02

MCP Server 破 500

MCP 生态爆发,3 个月构建 500+ Server

2025-01

DeepSeek-R1 震惊全球

开源推理模型,成本仅 OpenAI 的 3%,引发全球 AI 格局震动

2024-11

MCP 协议诞生

Anthropic 发布 Model Context Protocol,成为 Agent 接口事实标准

2024-10

Claude Computer Use

Anthropic 让 AI 首次直接操控电脑屏幕,开创计算机使用新范式

2024-09

Replit Agent 全栈自动化

自然语言到上线产品,面向非工程师

2024-08

Cursor ARR 破亿

史上增长最快 SaaS,AI 编程工具新王者

2024-06

Claude 3.5 登顶 SWE-bench

最强编程 AI,Bug 修复能力达到初级工程师水平

2024-03

Devin 发布

全球首个自主 AI 软件工程师,能独立完成完整编程任务

research2026年5月30日

AI 制药里程碑:首款完全由 AI 设计的分子药物通过 FDA III 期临床试验

Insilico Medicine 的 INS018_055 成为历史上第一款在整个药物发现过程中完全由 AI 设计的候选药物,并成功通过 FDA III 期临床试验,有望在 2026 年底获批上市。同期,Recursion Pharmaceuticals 和 Exscientia 的 AI 发现药物也进入临床后期。本文分析 AI 制药的技术突破,估算 AI 将如何改变万亿美元医药市场格局,以及投资者关注的 AI 制药标的。

Insilico Medicine
research2026年5月29日

AI 伦理困境 2026:偏见、歧视、幻觉问题如何影响真实用户

MIT、Stanford 联合发布的 2026 年 AI 伦理报告揭示:主流大模型在种族、性别相关任务中仍存在明显偏见,医疗诊断 AI 对有色人种的准确率低 23%,招聘 AI 对女性简历的评分系统性偏低 15%。本文梳理 AI 偏见的来源、现有缓解措施,以及用户在日常使用 AI 工具时如何识别和规避偏见风险。

Stanford HAI
research2025年9月19日

大模型幻觉问题研究进展:新技术使幻觉率降低60%

斯坦福大学和Anthropic联合发布幻觉缓解研究成果,结合检索增强、自我一致性检查和不确定性量化三种技术,在TruthfulQA基准上幻觉率从35%降至14%。研究发现:幻觉主要发生在模型"知识边界"附近;主动表达不确定性是可训练的能力;RAG配合引用追踪效果最佳。

Stanford AI Lab
research2025年9月14日

中国AI人才报告:算法工程师缺口超50万,薪资同比上涨35%

猎聘联合清华大学发布2025年中国AI人才报告。报告显示中国AI专业人才缺口已达50万以上,AI算法工程师平均薪资达35-60万/年(工作3-5年),同比增长35%。大模型方向人才尤为稀缺,顶尖大模型工程师年薪可达200-400万。高校AI专业招生规模扩大3倍,但与需求仍有较大差距。

猎聘
research2025年8月20日

AI能耗危机:2025年数据中心用电量将超过法国全国总用电量

IEA(国际能源署)报告预测2025年全球AI数据中心用电量将达到600TWh,约为法国全国用电量的1.2倍。大模型训练单次消耗的电量可为1000个家庭供电一年。主要AI公司纷纷承诺2030年前实现100%可再生能源,但短期内煤电需求仍将增加。AI芯片效率改善是关键解决路径。

IEA
research2025年8月17日

AI编程Agent突破SWE-bench 70%:软件工程正式进入半自动化时代

多家公司在SWE-bench Verified(真实GitHub issue修复)基准上取得重大突破:Claude 3.7 Sonnet达到62.3%,Devin 2.0达到67.5%,一家初创公司未具名agent达到71.8%。这意味着AI已能可靠完成超过60%的真实软件工程任务,标志着软件工程从"AI辅助"进入"AI主导特定任务"阶段。

SWE-bench
research2025年8月10日

2030年AI预测报告:哪些工作消失,哪些工作出现,哪些无法被取代

麦肯锡全球研究院与AI Now研究所联合发布2030年AI就业影响报告。预测2030年前AI将使全球12%的工作发生重大变化,但同时创造新岗位(AI训练师、人机协作专家、AI审计师等)。数据处理和基础认知工作风险最高;创造力、情感智慧和复杂物理操作最难被取代。

McKinsey Global Institute
research2025年8月8日

Google DeepMind用Gemini 2.0发现3个数学领域新定理

Google DeepMind宣布其Gemini 2.0模型在数学家协助下,在组合数学和拓扑学领域发现了3个此前未知的定理,并提供了完整证明。这是AI首次真正意义上推进纯数学研究边界(不仅是验证已知定理),被《Nature》评为"AI科学发现的新里程碑"。

Google DeepMind
research2025年8月7日

Anthropic可解释性研究突破:首次直接读取Claude的"思想内容"

Anthropic研究团队发表论文,声称已能部分直接读取Claude大脑中的概念表示。通过稀疏自编码器分解中间激活,识别出"恐惧"、"感激"等情绪相关特征。这一突破对AI安全(验证模型真实目标)和AI福祉(理解AI是否有内心状态)具有重要意义。

Anthropic
1 / 2下一页