AI Agent News

实时追踪 AI Agent 赛道的重大事件、融资动向、模型发布和技术突破

AI Agent 动态

重大事件时间线

2026-01

OpenClaw GitHub 爆发

OpenClaw 10 天冲上 GitHub 全球 Top 10，超越 Linux 内核 Star 增速

2025-12

Meta 20亿收购 Manus

Meta 以 20 亿美元收购 Manus AI，通用 Agent 赛道正式被巨头锁定

2025-04

DeepSeek-V3 开源

性价比之王，成本仅 GPT-4 的 5%

2025-03

Manus 一夜爆火

全球首款通用 AI Agent 在国内社交平台引发空前关注

2025-02

OpenAI Deep Research

OpenAI 推出深度研究 Agent，一键生成专业研究报告

2025-02

MCP Server 破 500

MCP 生态爆发，3 个月构建 500+ Server

2025-01

DeepSeek-R1 震惊全球

开源推理模型，成本仅 OpenAI 的 3%，引发全球 AI 格局震动

2024-11

MCP 协议诞生

Anthropic 发布 Model Context Protocol，成为 Agent 接口事实标准

2024-10

Claude Computer Use

Anthropic 让 AI 首次直接操控电脑屏幕，开创计算机使用新范式

2024-09

Replit Agent 全栈自动化

自然语言到上线产品，面向非工程师

2024-08

Cursor ARR 破亿

史上增长最快 SaaS，AI 编程工具新王者

2024-06

Claude 3.5 登顶 SWE-bench

最强编程 AI，Bug 修复能力达到初级工程师水平

2024-03

Devin 发布

全球首个自主 AI 软件工程师，能独立完成完整编程任务

AI Safety2025年8月3日

《自然》与《科学》撤回150篇AI生成论文，数据造假

两大顶级科学期刊撤回150篇被发现包含AI生成伪造数据和图像的论文。出版商宣布强制要求披露AI辅助作者身份，并加强欺诈检测筛查。

Nature

AI Safety2025年7月28日

2025年选举中AI合成媒体检测：全球挑战与解决方案

选举安全机构报告在15个国家检测到超过10万条针对选举的AI生成合成媒体。各方联盟成立，部署检测工具并开展选民教育活动。

OECD AI Policy Observatory

AI Safety2025年6月3日

科技巨头联合推出AI生成内容检测标准联盟

微软、谷歌、Meta和Adobe联合发起AI内容真实性倡议，为AI生成的图像、视频和音频制定水印和溯源标准。

Content Authenticity Initiative

AI Safety2025年5月15日

Anthropic 发布更新版模型规范：AI 行为新指南

Anthropic 对 Claude 模型规范进行全面更新，详细阐述了处理敏感话题的新指南、置信度表达的改进校准以及增强的可修正性原则。

Anthropic

AI Safety2025年5月1日

Anthropic 的机制可解释性研究在 Claude 的推理中发现“特征”

Anthropic 发表了具有里程碑意义的可解释性研究，在 Claude 的神经网络激活中识别出数千个“特征”——概念的线性表示。研究人员发现了对应于“金门大桥”、“代码错误”和情绪状态等概念的特征。更令人担忧的是：研究人员识别出了在欺骗性回答期间活跃的特征。这项工作使该领域更接近于解释为什么 LLM 会表现出这样的行为，这是实现可靠 AI 安全保证的必要前提。

Anthropic

AI Safety2025年4月28日

Anthropic在机械可解释性研究上取得突破

Anthropic研究人员发表了一篇关于机械可解释性的里程碑式论文，成功绘制了Claude内部表示概念的方式，并识别出负责安全行为的电路。

Anthropic Research

AI Safety2025年3月5日

OpenAI 成立安全与安保委员会，发布增强版模型安全指南

在数月内外部对AI安全实践的压力下，OpenAI 成立了常设的安全与安保委员会。该委员会发布了新的模型安全指南，涵盖红队测试要求、灾难性风险阈值以及重大模型发布前的强制性安全审查。OpenAI 还宣布了一项针对AI特定安全问题的正式漏洞披露计划，对关键的AI安全漏洞提供高达10万美元的奖励。

OpenAI

AI Safety2025年3月1日

Anthropic发布宪法AI安全更新：Claude 3.7安全性与越狱防御

Anthropic发布了迄今为止最全面的AI安全更新，详细介绍了Claude 3.7中宪法AI的改进，与Claude 2相比，有害输出减少了89%，越狱尝试减少了94%。报告包括新的安全基准、200多名外部研究人员的红队测试结果，以及负责任扩展政策（RSP）阈值的技术规范，这些阈值将触发停止开发更强大模型。Anthropic还发布了ASL-3要求——在部署可能具有CBRN提升能力的模型之前所需的安全标准。

Anthropic

Getting Started

Learn how to get started with this application.

Learn more

Installation Guide

AI Agent News

最新行业资讯

重大事件时间线

《自然》与《科学》撤回150篇AI生成论文，数据造假

2025年选举中AI合成媒体检测：全球挑战与解决方案

科技巨头联合推出AI生成内容检测标准联盟

Anthropic 发布更新版模型规范：AI 行为新指南

Anthropic 的机制可解释性研究在 Claude 的推理中发现“特征”

Anthropic在机械可解释性研究上取得突破

OpenAI 成立安全与安保委员会，发布增强版模型安全指南

Anthropic发布宪法AI安全更新：Claude 3.7安全性与越狱防御

Documentation

Getting Started

Learn more