AI Agent News
实时追踪 AI Agent 赛道的重大事件、融资动向、模型发布和技术突破
最新行业资讯
实时追踪 AI Agent 赛道的重大事件、融资动向、模型发布和技术突破
重大事件时间线
OpenClaw GitHub 爆发
OpenClaw 10 天冲上 GitHub 全球 Top 10,超越 Linux 内核 Star 增速
Meta 20亿收购 Manus
Meta 以 20 亿美元收购 Manus AI,通用 Agent 赛道正式被巨头锁定
DeepSeek-V3 开源
性价比之王,成本仅 GPT-4 的 5%
Manus 一夜爆火
全球首款通用 AI Agent 在国内社交平台引发空前关注
OpenAI Deep Research
OpenAI 推出深度研究 Agent,一键生成专业研究报告
MCP Server 破 500
MCP 生态爆发,3 个月构建 500+ Server
DeepSeek-R1 震惊全球
开源推理模型,成本仅 OpenAI 的 3%,引发全球 AI 格局震动
MCP 协议诞生
Anthropic 发布 Model Context Protocol,成为 Agent 接口事实标准
Claude Computer Use
Anthropic 让 AI 首次直接操控电脑屏幕,开创计算机使用新范式
Replit Agent 全栈自动化
自然语言到上线产品,面向非工程师
Cursor ARR 破亿
史上增长最快 SaaS,AI 编程工具新王者
Claude 3.5 登顶 SWE-bench
最强编程 AI,Bug 修复能力达到初级工程师水平
Devin 发布
全球首个自主 AI 软件工程师,能独立完成完整编程任务
Mistral发布Large 2:性能媲美GPT-4o,开源路线持续推进
Mistral AI发布Mistral Large 2(123B参数),在代码生成、多语言处理和指令跟随方面达到与GPT-4o相当的水平,同时保持Apache 2.0开源许可。支持32K上下文,多语言(80+种语言),代码专项优化。欧洲最大AI独角兽Mistral估值升至60亿欧元。
百度文心大模型5.0发布:原生多模态,推理能力追平GPT-4o
百度发布文心大模型5.0,在中文基准测试中全面超越GPT-4o,在多语言推理测试中达到同等水平。新增原生视频理解能力(支持2小时长视频分析)和增强的代码能力(在HumanEval上达到87.5%)。文心5.0已内置于百度搜索、文库和网盘,日活用户5000万。
DeepSeek R2发布:以1/10成本媲美GPT-o1,中国AI再创里程碑
DeepSeek发布R2推理模型,在AIME数学竞赛和Codeforces编程竞赛基准上与GPT-o1持平,但训练成本仅为其10%。模型完全开源,已获超过100,000次GitHub Star。R2的发布再次引发全球AI成本竞争讨论,OpenAI和Anthropic随即宣布降价。
Meta发布Llama 4系列:Scout和Maverick模型开源,性能对标GPT-4o
Meta AI发布Llama 4系列模型,包括Scout(17B激活参数)和Maverick(17B激活参数,128个专家MoE)。Maverick在多项基准上与GPT-4o持平,Scout主打低延迟推理。两款模型完全开源,支持商业使用,已集成到Llama.cpp、Ollama等本地推理框架。
Anthropic发布Claude 3.7 Sonnet:代码能力跃升,支持延伸思考
Anthropic发布Claude 3.7 Sonnet,在SWE-bench(软件工程基准)上取得62%的突破性成绩,超越所有现有模型。新增"延伸思考"模式(Extended Thinking),允许模型在回答前进行深度内部推理,在复杂数学和逻辑题上精度提升35%。