AI Agent News
实时追踪 AI Agent 赛道的重大事件、融资动向、模型发布和技术突破
最新行业资讯
实时追踪 AI Agent 赛道的重大事件、融资动向、模型发布和技术突破
重大事件时间线
OpenClaw GitHub 爆发
OpenClaw 10 天冲上 GitHub 全球 Top 10,超越 Linux 内核 Star 增速
Meta 20亿收购 Manus
Meta 以 20 亿美元收购 Manus AI,通用 Agent 赛道正式被巨头锁定
DeepSeek-V3 开源
性价比之王,成本仅 GPT-4 的 5%
Manus 一夜爆火
全球首款通用 AI Agent 在国内社交平台引发空前关注
OpenAI Deep Research
OpenAI 推出深度研究 Agent,一键生成专业研究报告
MCP Server 破 500
MCP 生态爆发,3 个月构建 500+ Server
DeepSeek-R1 震惊全球
开源推理模型,成本仅 OpenAI 的 3%,引发全球 AI 格局震动
MCP 协议诞生
Anthropic 发布 Model Context Protocol,成为 Agent 接口事实标准
Claude Computer Use
Anthropic 让 AI 首次直接操控电脑屏幕,开创计算机使用新范式
Replit Agent 全栈自动化
自然语言到上线产品,面向非工程师
Cursor ARR 破亿
史上增长最快 SaaS,AI 编程工具新王者
Claude 3.5 登顶 SWE-bench
最强编程 AI,Bug 修复能力达到初级工程师水平
Devin 发布
全球首个自主 AI 软件工程师,能独立完成完整编程任务
Anthropic 扩展 Claude 工具使用能力,助力企业自动化
Anthropic 宣布对 Claude 的工具使用能力进行重大升级:计算机操作功能现已达到生产就绪水平,可靠性显著提升;函数调用在复杂工作流中的准确率提高了 45%;新增 Salesforce、SAP 和 ServiceNow 的原生连接器,可自动化《财富》500 强企业的业务流程。此次发布还附带了详细的“最小足迹”安全架构文档,以解决企业对自主 AI 代理可能采取意外重大行动的担忧。
Slack AI 升级:深度工作摘要与跨频道智能
Salesforce 扩展了 Slack AI 功能,从根本上改变了企业工作空间的信息管理方式。新功能包括:每日摘要(AI 策划的个性化总结,涵盖你不在时发生的所有事情)、频道回顾(即时了解任何频道的最新动态)、线程摘要(一键理解冗长讨论)、基于语义和上下文的 AI 搜索,以及文件智能(无需打开即可询问 Slack 中共享文档的问题)。Slack AI 将向所有付费计划推出,附加费用为每位用户每月 10 美元。早期用户报告称,每天在信息管理上节省了 45 分钟。
Anthropic以1000亿美元估值融资40亿美元,成为第二大AI公司
Anthropic完成40亿美元融资,估值达1000亿美元,巩固其仅次于OpenAI的第二大AI公司地位。本轮融资由谷歌领投(其总投资额增至50亿美元),亚马逊、Spark Capital和General Catalyst参投。资金将用于加速Claude开发及下一代AI安全研究。Anthropic的Claude在AI助手企业市场份额已超30%,财富500强客户认为其在安全性和透明度上优于竞争对手。
AMD MI300X 与 Intel Gaudi 3 挑战 NVIDIA 在 AI 领域的 GPU 主导地位
AMD 和 Intel 正在显著突破 NVIDIA 在 AI 训练和推理硬件上的近乎垄断。AMD 的 MI300X GPU(192GB HBM3 内存,5.2 TB/s 带宽)正被 Microsoft Azure、Meta 和 Oracle Cloud 采用,作为大型语言模型推理的替代方案。Intel 的 Gaudi 3 在特定工作负载下以每 FLOP 成本降低 30% 提供有竞争力的训练性能。与此同时,国内超大规模企业正在加速开发定制 AI 芯片:Google TPU v5、Amazon Trainium 2、Microsoft Maia 2 和 Meta MTIA 2 都在加速生产。这种多元化正在减少云客户对 NVIDIA H100 可用性的依赖。
OpenAI 面向企业推出 o3 Pro:大规模高级推理
OpenAI 发布了其最先进的推理模型 o3 Pro,现可通过企业 API 和 ChatGPT Enterprise 使用。该模型在复杂推理任务上实现了突破性性能,包括科学研究、金融建模和多步骤代码生成。企业客户报告称,在金融分析和研究工作流程中,其推理能力有质的提升。该模型以高级定价提供,支持 128K 上下文窗口,并配备企业数据连接器,可基于专有业务数据进行接地推理。
Google NotebookLM 音频概览功能走红:从任何文档生成 AI 播客
Google NotebookLM 的“音频概览”功能可生成两位 AI 主持人围绕上传文档进行播客式对话,已成为病毒式传播的生产力工具。用户上传研究论文、商业报告或教科书后,即可获得一段 10-15 分钟的音频讨论,提炼关键见解。该功能上线以来已被使用超过 2000 万次,尤其受到偏好音频学习的学生、研究人员和商务人士的青睐。Google 已将 NotebookLM 扩展至支持 50 多种源文件和 29 种语言,并宣布推出集成企业数据与品牌定制功能的企业版。
Cohere Command R+ 瞄准受监管行业,提供私有部署方案
Cohere 发布了 Command R+,一个 1040 亿参数的检索增强生成模型,针对企业工作流进行了优化,特别关注需要本地或私有云部署的受监管行业。该模型支持 128K 上下文、10 种原生语言,并内置了带引用的 RAG 功能。目标市场包括金融服务公司、政府机构和医疗保健提供商。Cohere 报告称,在特定领域的 RAG 基准测试中准确率超过 95%,并提供私有云部署(AWS VPC、Azure Private Link、本地部署)。客户数据不会离开其环境——这是与 OpenAI 和 Anthropic 的关键区别。
Google DeepMind AlphaFold 3:全分子预测加速药物发现
Google DeepMind 发布了 AlphaFold 3,将其革命性的蛋白质结构预测扩展至所有生物分子:DNA、RNA、小分子(药物)及其相互作用。该模型以前所未有的精度预测潜在药物分子与靶蛋白的结合方式,有望将早期药物发现缩短数年。阿斯利康、礼来和 Recursion 等制药公司已在其研发管线中使用 AlphaFold 3。该结构数据库对学术研究免费开放,包含超过 2 亿个分子的预测结果。
OpenAI Realtime API 助力企业打造低延迟语音助手
OpenAI 的 Realtime API 现已全面可用,使开发者能够构建语音到语音的 AI 代理,平均延迟仅 320 毫秒——足以实现自然对话。该 API 支持在对话过程中进行函数调用,使 AI 语音代理能够一边自然说话,一边执行操作(如查询订单、预订、更新记录)。早期企业部署在客户服务中报告了 85% 的首次联系解决率,而之前的聊天机器人系统仅为 65%。定价:输入音频 $0.06/分钟,输出音频 $0.24/分钟。Twilio 和 Salesforce 已宣布原生集成。