AI Agent News

实时追踪 AI Agent 赛道的重大事件、融资动向、模型发布和技术突破

AI Agent 动态

重大事件时间线

2026-01

OpenClaw GitHub 爆发

OpenClaw 10 天冲上 GitHub 全球 Top 10，超越 Linux 内核 Star 增速

2025-12

Meta 20亿收购 Manus

Meta 以 20 亿美元收购 Manus AI，通用 Agent 赛道正式被巨头锁定

2025-04

DeepSeek-V3 开源

性价比之王，成本仅 GPT-4 的 5%

2025-03

Manus 一夜爆火

全球首款通用 AI Agent 在国内社交平台引发空前关注

2025-02

OpenAI Deep Research

OpenAI 推出深度研究 Agent，一键生成专业研究报告

2025-02

MCP Server 破 500

MCP 生态爆发，3 个月构建 500+ Server

2025-01

DeepSeek-R1 震惊全球

开源推理模型，成本仅 OpenAI 的 3%，引发全球 AI 格局震动

2024-11

MCP 协议诞生

Anthropic 发布 Model Context Protocol，成为 Agent 接口事实标准

2024-10

Claude Computer Use

Anthropic 让 AI 首次直接操控电脑屏幕，开创计算机使用新范式

2024-09

Replit Agent 全栈自动化

自然语言到上线产品，面向非工程师

2024-08

Cursor ARR 破亿

史上增长最快 SaaS，AI 编程工具新王者

2024-06

Claude 3.5 登顶 SWE-bench

最强编程 AI，Bug 修复能力达到初级工程师水平

2024-03

Devin 发布

全球首个自主 AI 软件工程师，能独立完成完整编程任务

industry-news2025年8月11日

OpenAI完成400亿美元融资，估值达3000亿：AI独角兽迈入超级巨头时代

OpenAI宣布完成400亿美元新一轮融资，估值达3000亿美元，成为全球估值最高的私营科技公司。软银以150亿美元领投，微软追加100亿美元。融资将用于扩大算力基础设施、AGI研究和全球市场拓展。OpenAI收入预计2025年突破120亿美元，同比增长300%。

OpenAI

industry-news2025年8月9日

Figure 02机器人工厂部署：OpenAI加持的人形机器人开始正式"上班"

Figure AI宣布其Figure 02人形机器人已在BMW斯帕坦堡工厂正式投产，执行汽车零件组装任务。机器人使用OpenAI多模态模型理解工厂指令，通过视觉语言行动模型执行操作。初期效率为人类工人的30%，计划一年内提升至70%。Figure CEO表示2025年将部署100台机器人。

Figure AI

industry-news2025年6月27日

摩根大通AI交易系统每日处理万亿美元：AI如何重塑华尔街

摩根大通披露其AI驱动的交易系统已处理所有股权交易的70%，固收交易的40%。AI系统负责最优执行路径选择、流动性预测和交易成本分析。AI风控系统每天识别并拦截超过40亿美元的可疑交易。摩根大通AI研发投入已超过20亿美元/年。

JPMorgan Chase

industry-news2025年6月26日

Bloomberg发布AI金融分析平台：GPT-4驱动的财务数据解读

Bloomberg宣布推出Bloomberg AI，整合GPT-4技术提供自然语言财务数据查询、财报解读和市场分析能力。专业用户可以用自然语言直接查询Bloomberg终端数据，生成定制化分析报告。Bloomberg AI已在全球5000家金融机构开始试用。

Bloomberg

industry-news2025年5月25日

Cognition AI Devin 2.0：自主软件工程达到生产规模

Cognition AI 发布了其自主软件工程代理 Devin 2.0，能力显著提升。新版本处理完整的特性开发周期——从阅读需求到编写代码、运行测试、修复错误和提交 PR。在 50 多家企业的试点中，Devin 自主完成了 30-40% 的常规工程任务。新功能包括代码库索引（支持高达 100 万行代码的上下文）、多文件重构以及与 Jira、Slack 和 GitHub Actions 的集成。定价：每席位每月 500 美元，企业批量购买可享折扣。

Cognition AI

industry-news2025年5月22日

Anthropic发布Claude 3.7：最佳编程与科学推理模型

Anthropic发布了Claude 3.7，在编程基准测试（HumanEval: 95.2%，SWE-Bench: 49.5%）和科学推理上达到新SOTA。该模型具备改进的“扩展思考”模式，可处理复杂多步问题，保持200K上下文并提升中间精度，新增浏览器自动化的计算机使用能力。Anthropic的模型卡透明度报告显示，Claude 3.7在独立评估中幻觉率最低。现已通过Claude.ai和API提供，定价与Claude 3.5相同。

Anthropic

industry-news2025年5月22日

OpenAI发布GPT-5：推理与多模态能力的重大飞跃

OpenAI宣布推出其最强模型GPT-5，在MMLU（92%）、HumanEval（97%）和MATH（90%）上均取得新SOTA成绩。该模型支持原生多模态输入（文本、图像、音频、视频），拥有100万token上下文窗口，推理能力显著提升且幻觉率降低，并支持实时网页浏览。企业客户报告称，与GPT-4o相比，复杂任务完成度提升40-60%。API定价为每百万输入token 15美元，每百万输出token 60美元，企业用户可享批量折扣。

OpenAI

industry-news2025年5月21日

Apple Intelligence iOS 19新特性：端侧AI全面升级，隐私保护再加强

Apple在WWDC 2025宣布iOS 19 Apple Intelligence重大升级，新增端侧推理能力（支持30B参数模型）、跨App AI自动化、增强版Siri（支持多轮对话和屏幕内容理解）。私有云计算架构确保用户数据不离设备，差分隐私技术保护个性化学习数据。

Apple

industry-news2025年5月20日

2025年AI代码审查工具对比：CodeRabbit vs PR-Agent vs GitHub Copilot

采用AI代码审查的工程团队报告生产环境bug减少15-30%，审查周期加快40%。基于500个PR的对比：CodeRabbit在安全漏洞检测方面领先（78%）；Sourcegraph Cody凭借代码库上下文在逻辑错误检测上表现出色（58%）；PR-Agent误报率最低（12%），且是唯一开源、可自托管的选项。GitHub Copilot为已订阅Copilot（19美元/月）的GitHub优先团队提供最佳集成。对于20人工程团队，ROI通常为投入的5-10倍，源于生产bug减少和审查加速。

AISkillNav

Getting Started

Learn how to get started with this application.

Learn more

Installation Guide