AI Agent News
实时追踪 AI Agent 赛道的重大事件、融资动向、模型发布和技术突破
最新行业资讯
实时追踪 AI Agent 赛道的重大事件、融资动向、模型发布和技术突破
重大事件时间线
OpenClaw GitHub 爆发
OpenClaw 10 天冲上 GitHub 全球 Top 10,超越 Linux 内核 Star 增速
Meta 20亿收购 Manus
Meta 以 20 亿美元收购 Manus AI,通用 Agent 赛道正式被巨头锁定
DeepSeek-V3 开源
性价比之王,成本仅 GPT-4 的 5%
Manus 一夜爆火
全球首款通用 AI Agent 在国内社交平台引发空前关注
OpenAI Deep Research
OpenAI 推出深度研究 Agent,一键生成专业研究报告
MCP Server 破 500
MCP 生态爆发,3 个月构建 500+ Server
DeepSeek-R1 震惊全球
开源推理模型,成本仅 OpenAI 的 3%,引发全球 AI 格局震动
MCP 协议诞生
Anthropic 发布 Model Context Protocol,成为 Agent 接口事实标准
Claude Computer Use
Anthropic 让 AI 首次直接操控电脑屏幕,开创计算机使用新范式
Replit Agent 全栈自动化
自然语言到上线产品,面向非工程师
Cursor ARR 破亿
史上增长最快 SaaS,AI 编程工具新王者
Claude 3.5 登顶 SWE-bench
最强编程 AI,Bug 修复能力达到初级工程师水平
Devin 发布
全球首个自主 AI 软件工程师,能独立完成完整编程任务
Meta Llama 4 发布:原生多模态 + 长上下文,开源模型再次震惊 AI 圈
Meta 正式发布 Llama 4 系列,包括 Llama 4 Scout(170亿参数,16个专家 MoE)和 Llama 4 Maverick(400亿参数)。Llama 4 原生支持图像、视频、音频输入,上下文窗口达到 1000万 tokens,并在多个多模态基准上超越 Gemini 1.5 Pro。更重要的是,所有模型均可商用,Meta 宣布将在 WhatsApp 和 Instagram 中深度集成 Llama 4。开源社区在发布后 48 小时内已有超过 30 万次下载。
OpenAI 高级语音模式全面升级:实时视觉理解 + 情绪感知,比肩科幻电影中的 AI
OpenAI 宣布高级语音模式重大更新,新版本支持实时视觉理解(可以"看"用户屏幕或摄像头画面)、情绪感知(能感知用户说话时的情绪并调整回应方式),以及打断处理(自然对话流的打断和续接)。Plus 和 Pro 用户今日起陆续收到更新。部分测试用户表示"和它对话就像和一个真人朋友聊天,难以置信"。
DeepSeek V4 发布:开源模型再次挑战 GPT-5,单 API 成本不到竞品 1/10
DeepSeek 发布 V4 系列模型,在 MMLU-Pro、LiveCodeBench 等多项关键基准上与 GPT-5 和 Claude Opus 4.5 成绩持平,但 API 调用价格仅为竞品的 10% 以下。开源社区对此反应热烈,GitHub 首日获得超过 50K Star。国内外开发者迅速开始将应用从 OpenAI 迁移到 DeepSeek,引发 AI 模型市场新一轮价格战。
Gemini 2.5 Pro 登顶编程基准:击败 Claude 和 GPT-5 成为最强代码模型
Google DeepMind 最新数据显示,Gemini 2.5 Pro 在 SWE-bench Verified 编程任务基准上以 72.3% 的成绩超过 Claude Opus 4.5 和 GPT-5,成为目前最强的代码生成模型。Google 同时宣布 Gemini 2.5 Pro 将在 Google AI Studio 和 Vertex AI 上降价 30%,以吸引更多开发者迁移。
OpenAI GPT-5 Mini 性能评测:小模型,大能力,价格降 90%
OpenAI 推出 GPT-5 Mini,在 MMLU 和 HumanEval 等主流基准测试上,GPT-5 Mini 达到 GPT-4o 90% 的性能,但 API 调用成本降低了 90% 以上。对于大批量调用场景,这款模型可能成为 2026 年下半年的主流选择。各大开发者社区对其"足够好用"的反馈评价相当正面。