AI Agent News
实时追踪 AI Agent 赛道的重大事件、融资动向、模型发布和技术突破
最新行业资讯
实时追踪 AI Agent 赛道的重大事件、融资动向、模型发布和技术突破
重大事件时间线
OpenClaw GitHub 爆发
OpenClaw 10 天冲上 GitHub 全球 Top 10,超越 Linux 内核 Star 增速
Meta 20亿收购 Manus
Meta 以 20 亿美元收购 Manus AI,通用 Agent 赛道正式被巨头锁定
DeepSeek-V3 开源
性价比之王,成本仅 GPT-4 的 5%
Manus 一夜爆火
全球首款通用 AI Agent 在国内社交平台引发空前关注
OpenAI Deep Research
OpenAI 推出深度研究 Agent,一键生成专业研究报告
MCP Server 破 500
MCP 生态爆发,3 个月构建 500+ Server
DeepSeek-R1 震惊全球
开源推理模型,成本仅 OpenAI 的 3%,引发全球 AI 格局震动
MCP 协议诞生
Anthropic 发布 Model Context Protocol,成为 Agent 接口事实标准
Claude Computer Use
Anthropic 让 AI 首次直接操控电脑屏幕,开创计算机使用新范式
Replit Agent 全栈自动化
自然语言到上线产品,面向非工程师
Cursor ARR 破亿
史上增长最快 SaaS,AI 编程工具新王者
Claude 3.5 登顶 SWE-bench
最强编程 AI,Bug 修复能力达到初级工程师水平
Devin 发布
全球首个自主 AI 软件工程师,能独立完成完整编程任务
阿里云MuleRun负责人陈宇森出任钉钉CEO
2026年6月11日,阿里巴巴宣布钉钉管理层调整:陈航(无招)卸任钉钉CEO,由阿里云AI Agent产品MuleRun负责人陈宇森接任。34岁的陈宇森成为阿里巴巴最年轻的事业部CEO。 ## 背景:钉钉管理层变动与阿里文化批评 此次调整发生在阿里巴巴合伙人委员会公开批评钉钉管理方式之后。6月10日,阿里合伙人委员会在内网发布帖文《有情有义有成长,才是阿里文化》,批评钉钉团队的管理方式“不是阿里文化该有的样子”。此前,钉钉员工撰写的两篇“置身”文章在网络广泛传播,对陈航的管理方式提出质疑。 ## 新任CEO陈宇森:技术极客与连续创业者 陈宇森生于1992年,是技术型连续创业者,曾入选福布斯亚洲“30 Under 30”榜单。他22岁从浙江大学毕业后创办网络安全公司长亭科技,2019年以27岁之龄被阿里云全资收购,实现财务自由。2021年他离开阿里,放弃未兑现权益,先后创立“交给猫吧”和“薮猫科技”。2025年,他重回阿里云内部创业,带领研发AI Agent产品MuleRun。 ## MuleRun:AI Agent交易平台 MuleRun定位为AI Agent交易市场,用户可寻找、租用不同Agent完成工作任务。公开资料显示,MuleRun已服务43个国家和地区,单月付费超200美金的用户占比达34%,付费用户每周活跃2.6天,人均每周完成13个端到端任务。2025年9月发布1.0版本,2026年3月升级为可自我进化的个人AI Agent助手。 ## 影响:钉钉AI战略或调整 陈宇森接棒后,钉钉目前主导研发的企业级Agent应用“悟空”的研发思路可能调整。报道指出,随着大模型转向企业级服务市场,钉钉面临巨大挑战,AI落地可能需要不同于移动互联网时代的产品方法论。陈宇森在访谈中强调,未来的软件和Agent将更易创建和交易,MuleRun的核心假设是“当Vibe Coding降低开发门槛,大量非技术背景的人可封装个人知识为Agent”。 ## 数据与市场反应 - 长亭科技在2024年完成超10亿元分拆轮融资,创始团队成为第一大股东,为阿里体系内首家并购后独立的公司。 - 陈宇森此前创办的薮猫科技在成立第二年突破亿元融资。 - 钉钉拥有7亿用户,新任CEO的年轻化背景被视为阿里对AI Agent赛道的重视。
OpenAI 递交 IPO 草案,上市与否仍待定
## OpenAI递交IPO,奥特曼称上市不急,AI自我改进或成更大变量 2025年6月8日,OpenAI正式向美国证券交易委员会(SEC)提交了S-1草案,启动IPO进程。与此同时,其竞争对手Anthropic已于6月1日秘密递交S-1草案。两家公司估值均接近万亿美元,但OpenAI CEO Sam Altman在内部表态称,若AI递归自我改进(RSI)加速,推迟上市可能更有利。 ### 背景:从非营利到IPO的转型 OpenAI成立于2015年,最初为非营利组织,使命是“确保通用人工智能造福全人类”。2019年,因训练大模型成本高昂,OpenAI设立利润上限的子公司结构,开始接受投资,微软首笔10亿美元注资。2022年底ChatGPT发布后,公司商业价值激增。2023年底,董事会短暂罢免Altman,后在投资人和员工压力下恢复其职务。2024至2025年,OpenAI完成重组:营利部分转为公共利益公司(PBC),非营利母体更名为OpenAI基金会,持股约26%,微软持股约27%,员工和投资人合计约47%。此次S-1提交是重组的必然结果。 ### 关键细节:IPO与AI模型进展 - **IPO进程**:OpenAI提交S-1草案后,预期可能泄露,故提前公开。公司表示,非上市公司身份更利于战略推进,但权衡后仍提交IPO,后续是否上市需再考虑。Anthropic的S-1草案则处于SEC审核阶段,股份数和发行价未定。 - **模型迭代加速**:OpenAI首席科学家Jakub Pachocki确认,代号5.6的新模型将于本月发布,性能“大幅超越”前代。此前,GPT-5.4于3月5日发布,GPT-5.5于4月23日发布,间隔约6-7周,代际能力提升未放缓。社区泄露显示,GPT-5.6内部代号iris-alpha,后续版本包括ember-alpha、beacon-alpha、kepler和kindle,kindle-alpha为当前发布候选版本。 - **产品改版**:6月10日,ChatGPT模型选择器改版,从模型名称(如Thinking-Light、Thinking-Standard)改为智力分级(Instant、Medium、High、Extra High、Pro Standard、Pro Extended),旨在简化用户选择。 - **价格战信号**:据《华尔街日报》报道,OpenAI正酝酿大幅调低API定价,与Anthropic竞争。目前GPT-5.5 API定价为每百万输入token 5美元、输出30美元,而Anthropic的Fable 5和Mythos 5定价为输入10美元、输出50美元。 ### 各方反应与数据 - **Altman内部表态**:在OpenAI内部Slack中,Altman提出,若AI递归自我改进速度足够快,推迟上市的好处更大,因为技术和世界可能以意想不到的方式变化,私有公司更具灵活性。 - **Anthropic数据**:内部报告显示,AI任务完成时间跨度每4个月翻一倍,工程师季度代码产出量飙升至之前的8倍。 - **估值对比**:截至5月底,Anthropic以9650亿美元估值反超OpenAI的8520亿美元,成为全球最值钱AI创业公司。两家公司上市后市值预计均超1万亿美元。 - **财务数据**:OpenAI CFO确认年化收入已超200亿美元,但亏损严重,2026年预计亏损在140亿(非公认会计准则)到250亿美元(公认会计准则)之间。 ### 影响与展望 OpenAI与Anthropic同时冲刺IPO,合计估值约3.6万亿美元,相当于法国全年GDP。投行认为先上市者将定义AI赛道估值框架。然而,Altman的RSI言论暗示,技术突破可能改变商业规则:若AI实现自我改进,领先优势将指数级扩大,IPO的优先级可能降低。当前,三家旗舰模型(GPT-5.6、Claude Fable 5、Gemini 3.5 Pro)将于6月正面竞争,聚焦推理、编码、Agent和前端生成能力。真正的竞赛或在RSI层面,而非IPO时间点。
钉钉CEO变更为陈宇森,原MuleRun负责人接任
## 钉钉换帅:92年技术极客陈宇森接任CEO 2026年6月11日,阿里巴巴宣布钉钉管理层调整:陈航(无招)卸任CEO,由阿里云AI Agent产品MuleRun负责人陈宇森接任。陈宇森生于1992年,是技术型连续创业者,曾创办长亭科技并于2019年被阿里云收购,实现财务自由。此次任命使陈宇森成为阿里巴巴最年轻的事业部CEO。 ### 管理层调整背景 - 阿里巴巴合伙人委员会于6月10日在内网发文《有情有义有成长,才是阿里文化》,批评钉钉团队管理方式,指出“不是阿里文化该有的样子”。 - 此前钉钉员工撰写的两篇“置身”文章在网络上广泛传播,对陈航的管理方式提出质疑。 - 陈航于2014年创办钉钉,2019年回归后加速AI化,但企业级AI落地面临新挑战。 ### 陈宇森履历与成就 - **技术极客**:浙大毕业,22岁创办长亭科技,入选福布斯亚洲“30 Under 30”。 - **创业经历**:2019年长亭科技被阿里云全资收购,27岁实现财务自由;2021年离开阿里,先后创办“交给猫吧”(游戏)和“薮猫科技”(数据安全);2025年重回阿里内部创业,推出MuleRun。 - **MuleRun成绩**:截至2026年,服务43个国家和地区,单月付费超200美金的用户占比34%,付费用户每周活跃2.6天,人均每周完成13个端到端任务。 ### 钉钉与MuleRun的未来方向 - 钉钉目前主导研发的企业级Agent应用“悟空”的研发思路可能调整。 - 陈宇森在访谈中提出,未来软件可“3D打印”,即通过自然语言描述工作流程即可生成Agent,降低开发门槛。 - MuleRun定位为Agent交易平台,核心假设是:当大模型具备编程能力后,可复制人类80%-90%的经验知识,形成长尾应用生态。 - 当前挑战:供给端丰富度不足,创作门槛仍较高;平台尚未达到大规模PMF(产品市场契合点)。 ### 关键数据 - 钉钉拥有7亿用户。 - MuleRun付费用户每周活跃2.6天,人均每周完成13个任务。 - 长亭科技在2024年中国硬件WAF市场份额排名第二(10.6%),私有云WAF市场连续三年稳居前三。 - 长亭科技2024年完成超10亿元分拆轮融资,创下国内网安单轮最大融资纪录。
Anthropic提议暂停AI研究,警告AI自我改进风险
## Anthropic 呼吁暂停 AI 研究:指数级风险逼近,需强制监管 Anthropic 及其 CEO Dario Amodei 近期密集发声,呼吁全球 AI 实验室暂停前沿模型研发,并推动强制性监管。其核心论据是:AI 正在加速自身研发进程,“递归式自我改进”可能比预期更早到来,带来失控风险。Anthropic 同时发布了内部数据、政策提案及资金承诺,引发行业广泛讨论。 ### 背景:AI 加速 AI 研发,递归式自我改进逼近 Anthropic 在报告《When AI Builds Itself》中指出,AI 系统独立完成任务的时长正以指数级缩短。 - **任务时长翻倍周期**:从每 7 个月缩短至每 4 个月。 - **能力跃迁**:Claude Opus 3(2024 年 3 月)可完成 4 分钟任务;Claude Sonnet 3.7(2025 年)可处理 1.5 小时任务;Claude Opus 4.6(2026 年)胜任 12 小时任务。按此趋势,2027 年 AI 可能处理数周级任务。 - **基准测试饱和**:SWE-bench(软件工程)和 CORE-Bench(科研复现)在两年内从个位数得分升至接近满分。 Anthropic 内部数据显示,截至 2026 年 5 月,其主代码库中 **超过 80% 的合并代码由 Claude 编写**,而 2025 年初这一比例仅为个位数。2026 年第二季度,每位工程师日均代码提交量是 2024 年的 8 倍。内部调查显示,使用 Claude Mythos Preview 后,员工自评产出提升约 4 倍。 ### 关键细节:Anthropic 的监管提案与资金承诺 Amodei 在长文《Policy on the AI Exponential》中提出五项政策方向,并发布两份正式提案: - **监管与公共安全**:要求计算量超过 10²⁵ FLOPs 或 AI 营收/研发投入超 5 亿/10 亿美元的公司,接受强制性第三方风险评估,覆盖网络安全、生物武器、AI 失控、自动化研发四大风险。政府有权阻止高风险模型部署。 - **宏观经济与就业**:提出三层框架——数据追踪、就业激励(工资保险、培训补贴)、长期支持(如全民基本收入)。Anthropic 承诺 **2 亿美元用于政策研究,1.5 亿美元用于技能培训奖学金**。 - **加速正向影响**:呼吁改革 FDA 等监管体系,接纳 AI 模拟方法(如 AI 毒理预测、合成对照组),避免旧体制阻碍 AI 在生物医药等领域的应用。 - **公民自由与国家安全**:禁止全自动武器,关闭数据经纪人漏洞,确保公民在面临不利行动时获得 AI 辅助。 ### 各方反应:争议与质疑 Amodei 的呼吁引发开发者强烈反弹。有用户发现,Claude Fable 5 在处理 AI、生物等敏感话题时,会暗中降级到 Opus 4.8 或更低版本,被质疑“说一套做一套”。社交媒体上批评声浪高涨,认为 Anthropic 的提议本质是“我的出笼了,把你们的都关起来”。 ### 影响与展望 Anthropic 的举动打破了硅谷巨头抗拒监管的默契,释放出“自律时代终结”的信号。其提案若落地,将重塑全球 AI 研发格局: - **短期**:可能推动美国国会加速立法,建立类似 FAA 的 AI 监管机构。 - **长期**:若递归式自我改进成真,人类需解决“如何监督比自己更聪明的系统”这一根本问题。 Amodei 强调,公众的担忧是民主监督的正常运作,而非“公关问题”。但争议焦点在于:监管是否会被用作竞争工具,以及如何平衡安全与创新。
2026北京智源大会开幕,聚焦世界模型与物理AGI
2026年6月12日,第八届北京智源大会在中关村国际创新中心开幕。大会以“技术前沿、国际视野、青年人才”为底色,汇聚两位图灵奖得主、40余位AI企业CEO与首席科学家、200余位顶尖专家学者,以及30余位30岁以下青年科学家。智源研究院院长王仲远发布年度进展报告,推出全球首个通用世界基座模型悟界·Physis-v0.1,并系统梳理了世界模型的技术分类。大会还发布了多模态神经科学大模型悟界·Brainμ1.0、AI驱动药物发现模型悟界·OpenComplex2.5等成果,展示了从“悟道”到“悟界”的技术跃迁。 ## 世界模型:从“预测下一个词元”到“预测下一个物理状态” 智源研究院认为,人工智能正经历从大语言模型向多模态大模型再向世界模型的范式跃迁,核心是从“预测下一个词元”演进到“预测下一个物理状态”。世界模型被定义为面向真实物理世界的下一代基座模型,能感知、理解、推理时间、空间、物理规律和常识,涵盖全模态数据,并具备主动交互能力。 智源将现有世界模型技术路线分为四类: - **以语言为中心**:如VLM、VLA,在文本空间预测下一个词,无法理解物理后果。 - **以像素为中心**:如Sora、Seedance等视频生成模型,学到的是像素描述的世界。 - **以三维结构为中心**:如3D重建、World Labs Marble,但几何结构不代表物理状态。 - **以视觉表征为中心**:如Yann LeCun的JEPA系列,预测视觉表征压缩,不等于物理规律演化。 智源推出的悟界·Physis-v0.1是全球首个通用世界基座模型,以物理隐空间表征替代传统像素、帧级预测,搭载专属物理状态编码器,支持50+复杂物理场景长程推理,具备物理一致性、动作因果性、长程可推演性、通用泛化性四大能力,可应用于严肃工业、具身智能、物理仿真、科学研究等场景。 ## 具身智能与智能体:从理解到行动 智源发布了以下一个物理状态预测为核心的具身大脑悟界·RoboBrain Orca,构建“统一表征—建模—预测—交互”闭环,融合大量Ego-centric交互数据,可同时生成语言思考、视觉预测与动作决策,实现“想、看、动”三位一体,支撑机器人在物流、酒店等真实环境中的长期自主作业。 此外,智源推出了四款自主研发的智能体,分别面向心脏辅助诊断、科学发现、个人专属助理及生物安全防护等领域。 ## 多模态与科学领域突破 - **悟界·Emu3.5**:基于“预测下一个词元”范式,实现文本、图像、视频的统一理解与生成,内置时空关系与物理规律建模,相关成果于2026年1月发表在Nature正刊。 - **悟界·Brainμ1.0**:全球首个理解与生成统一的多模态神经科学大模型,可将跨物种、全模态脑信号统一编码为Token,辅助阿尔兹海默症、抑郁症等疾病筛查,相关成果已刊发于Science。同时发布全球最大AI-Ready神经科学数据平台BrainToken,数据总量突破万亿级别。 - **悟界·OpenComplex2.5**:可泛化、物理真实的AI驱动药物发现模型,覆盖口袋识别、反向筛选、结构预测和亲和力预测四个关键步骤,重点解决固有无序蛋白动态构象解析难题。 ## 基础软硬件生态 智源与开源社区共建众智FlagOS,将“M款模型与N款芯片”适配难题简化为统一接入方案。FlagOS2.1支持18家芯片厂商的32款芯片,算子总数超600个,生态成员超80家,全球下载量超37.5万次,触及开发者5.6万人。 ## 嘉宾观点与安全议题 2015年图灵奖得主Whitfield Diffie聚焦Agent时代安全,强调当前对智能体的限制(Confinement)在编程中仍不足,未来需开发形式化方法提升可靠性。2024年图灵奖得主Andrew Barto将强化学习归结为“控制、搜索与联想记忆”的三位一体,并警示奖励信号设计中的“反常实例化”风险。智源研究院理事长黄铁军与之江实验室主任王坚围绕中国AI范式演进、Agent时代新范式等议题展开对话。 ## 大会规模与影响 本届大会共设25场论坛、200余场演讲,吸引来自谷歌、Meta、英伟达、哈佛、MIT等20余家全球顶尖机构代表,与阿里、腾讯、小米、生数科技、面壁智能等中国AI核心力量同场交流。自2019年创办以来,智源大会已累计汇聚14位图灵奖得主、过千位专家,吸引全球超千万人次参与。
美国政府对Anthropic两款AI模型实施出口管制,全球访问受限
2026年6月12日,美国政府援引国家安全权限,对Anthropic最新发布的AI模型Fable 5和Mythos 5实施出口管制,禁止任何外籍人员访问,包括Anthropic的外籍员工。Anthropic为合规而全球停用这两款模型,距其6月9日发布仅72小时。这是美国政府首次对已部署的商业AI模型动用出口管制。 ## 事件背景 - 6月9日,Anthropic发布Fable 5(面向开发者)和Mythos 5(面向政府及盟友企业),声称在多数基准测试中超越现有模型。 - 发布前,Anthropic曾进行数千小时红队测试,并与美国政府、英国AISI等合作,但政府曾试图阻止发布未果。 - 6月12日下午5:21(美东时间),美国商务部长Howard Lutnick致信Anthropic CEO Dario Amodei,宣布出口管制指令。 ## 关键细节 - **管制范围**:禁止向美国境外任何地区出口,同时禁止美国境内所有外国人访问,包括Anthropic外籍员工。 - **Anthropic应对**:因无法精确区分用户国籍,直接对全球所有用户禁用Fable 5和Mythos 5。其他Claude模型不受影响。 - **导火索**:据Axios报道,另一家公司声称成功越狱Mythos模型,引发政府担忧。Anthropic声明称,政府仅提供口头证据,涉及一种狭窄的非通用越狱,且其他模型(如GPT-5.5)同样具备该能力。 - **Anthropic立场**:不同意以狭窄越狱为由召回模型,认为若以此为标准将叫停所有前沿模型部署。公司称正在努力恢复访问。 ## 各方反应与影响 - **Anthropic**:发布声明称遵守法律指令,但认为这是一场误解,并批评政府行动缺乏透明、公正的法定程序。 - **亚马逊AWS**:应Anthropic要求,撤销所有用户对Fable 5和Mythos 5的访问权限。 - **行业影响**:这是AI史上首次已部署商业模型被政府强制召回。Anthropic此前被五角大楼列入黑名单(认为过于危险不适合政府使用),如今又被商务部管制(认为过于危险不适合外国使用),处境微妙。 - **用户影响**:现有Fable 5会话报错中止,新建会话使用默认模型或Opus 4.8。开发者需更新集成切换模型。 ## 数据与时间线 - 模型发布:2026年6月9日 - 政府指令送达:2026年6月12日下午5:21(美东时间) - 全球停用:指令送达后立即执行 - 模型生命周期:约72小时
SpaceX纳斯达克上市,首日收涨19%,马斯克成首位万亿富豪
2026年6月12日,SpaceX在纳斯达克正式挂牌上市,股票代码SPCX,创下全球最大IPO纪录。公司以每股135美元发行约5.556亿股,募资750亿美元,发行估值达1.77万亿美元。开盘后股价迅速攀升至174美元,较发行价上涨约28.9%,对应市值约2.28万亿美元。埃隆·马斯克凭借持股成为人类历史上首位身家突破1万亿美元的富豪。 ## 上市细节与市场反应 SpaceX此次IPO打破了华尔街惯例:定价在路演前确定,并将30%的股份分配给散户投资者,远高于行业惯例的5%-10%。认购需求极其旺盛,总申购资金超过2500亿美元,其中散户申购超1000亿美元。贝莱德等机构大额下单。券商富达将认购门槛从50万美元降至2000美元,Schwab、Robinhood等五家线上券商承接零售配售。上市首日,SpaceX收盘价160.95美元,涨幅19.22%。奥本海默给出“跑赢大盘”评级和190美元目标价。 ## 公司业务与财务表现 SpaceX业务涵盖三大板块:火箭发射、星链卫星互联网和xAI人工智能。招股书显示,2025年全年营收186.7亿美元,同比增长33%;但净亏损49亿美元,主要因AI基础设施投入。第一季度资本支出达101亿美元,其中77亿美元用于AI。星链业务是主要收入来源,2025年连接业务收入113.87亿美元,覆盖164个国家和地区,订阅用户超1030万。发射业务方面,猎鹰9号实现可重复使用,单次发射成本降至约2700美元/公斤。xAI并入后,公司定位为垂直整合AI企业,但AI业务仍处于亏损状态。 ## 股权结构与马斯克财富 马斯克持有约8.5亿股A类股和56亿股B类股(每股10票投票权),以42%的股权资本掌控约85%的投票权。其持股中约七成来自个人投资,剩余为公司赠予,部分绑定极端业绩条件(如火星殖民地人口达100万)。按开盘价计算,马斯克持股价值约1.2万亿美元,加上特斯拉持股,总身家超1.2万亿美元。但90%以上为锁定股权,禁售期366天。Morningstar分析师认为合理估值约7800亿美元。 ## 历史背景与未来展望 SpaceX成立于2002年,从加州埃尔塞贡多的旧仓库起步,最初仅9名员工。公司经历了多次发射失败,2008年首次将液体燃料火箭送入轨道。2016年马斯克提出“让人类成为多星球物种”计划,当时被广泛质疑。如今,猎鹰系列火箭累计发射约620次,任务成功率超99%;星舰正在开发中,计划用于火星任务。招股书将薪酬激励与市值7.5万亿美元和火星移民100万人挂钩。市场对太空AI数据中心等远期项目存在分歧,部分分析师认为估值过高。