AI Agent News
实时追踪 AI Agent 赛道的重大事件、融资动向、模型发布和技术突破
最新行业资讯
实时追踪 AI Agent 赛道的重大事件、融资动向、模型发布和技术突破
重大事件时间线
OpenClaw GitHub 爆发
OpenClaw 10 天冲上 GitHub 全球 Top 10,超越 Linux 内核 Star 增速
Meta 20亿收购 Manus
Meta 以 20 亿美元收购 Manus AI,通用 Agent 赛道正式被巨头锁定
DeepSeek-V3 开源
性价比之王,成本仅 GPT-4 的 5%
Manus 一夜爆火
全球首款通用 AI Agent 在国内社交平台引发空前关注
OpenAI Deep Research
OpenAI 推出深度研究 Agent,一键生成专业研究报告
MCP Server 破 500
MCP 生态爆发,3 个月构建 500+ Server
DeepSeek-R1 震惊全球
开源推理模型,成本仅 OpenAI 的 3%,引发全球 AI 格局震动
MCP 协议诞生
Anthropic 发布 Model Context Protocol,成为 Agent 接口事实标准
Claude Computer Use
Anthropic 让 AI 首次直接操控电脑屏幕,开创计算机使用新范式
Replit Agent 全栈自动化
自然语言到上线产品,面向非工程师
Cursor ARR 破亿
史上增长最快 SaaS,AI 编程工具新王者
Claude 3.5 登顶 SWE-bench
最强编程 AI,Bug 修复能力达到初级工程师水平
Devin 发布
全球首个自主 AI 软件工程师,能独立完成完整编程任务
GPT-5 正式发布:OpenAI 的"最强模型"究竟强在哪里
OpenAI 正式发布 GPT-5,在推理、代码、多模态能力上全面超越 GPT-4o。GPT-5 引入了"持久记忆"和"多步骤推理"两大核心特性,能跨会话记住用户偏好,并自主规划完成复杂多步骤任务。本文对比 GPT-5 与 Claude Opus 4、Gemini 2.0 Ultra 的实测表现,分析哪类用户和任务受益最大,以及 API 定价变化对企业用户的影响。
Mistral Le Chat 免费版无限制使用:欧洲最强开源模型的 ChatGPT 挑战者
Mistral AI 宣布 Le Chat 免费版提供无限制使用(包括 Mistral Large 2),直接挑战 ChatGPT Free 和 Gemini 的市场地位。本文测评 Le Chat 的实际能力,分析它在代码、写作、推理方面的表现,以及为什么欧洲用户和注重隐私的企业值得重点关注。
xAI Grok 3 深度评测 2026:对比 ChatGPT、Gemini 的真实差距在哪里
xAI Grok 3 在 2026 年成为最受关注的 AI 模型之一,凭借超长上下文窗口和实时网络访问能力引发广泛关注。本文对 Grok 3 与 ChatGPT-4o、Gemini 2.0 Pro 进行 6 个核心维度的横向对比,分析实时信息获取、代码生成、多语言理解等方面的真实差距,帮你判断 Grok 3 是否值得订阅。
Google Gemini 2 Ultra 多模态突破:视频理解、实时翻译、AI 助手新标杆
Google Gemini 2 Ultra 在多模态能力上实现重大突破:长视频理解能力提升 5 倍,实时语音翻译延迟降至 200ms,与 Google Workspace 深度集成。本文分析 Gemini 2 Ultra 的核心技术升级,以及对 Google 生态系统和竞争格局的影响。
Anthropic Claude 4 Opus 发布:最强推理模型正式亮相,与 GPT-5 差距几何
Anthropic 于 2026 年发布 Claude 4 Opus,在数学推理、代码生成和长文档理解方面大幅超越前代。本文对比 Claude 4 Opus 与 GPT-5、Gemini 2.5 Pro 的基准测试数据,分析其在企业级应用中的优势,以及 Anthropic 的安全优先策略如何影响模型能力上限。
国产大模型 2026 战局:DeepSeek V3、Qwen3、文心 5.0 三强争霸
2026 年中国大模型市场进入新阶段。DeepSeek V3 的超高性价比、Qwen3 的多语言能力、文心 5.0 的企业服务,三个方向各自突破。本文深度比较三款旗舰模型的能力差异、适用场景,以及它们在全球 AI 竞赛中的定位。