AI Agent News
实时追踪 AI Agent 赛道的重大事件、融资动向、模型发布和技术突破
最新行业资讯
实时追踪 AI Agent 赛道的重大事件、融资动向、模型发布和技术突破
重大事件时间线
OpenClaw GitHub 爆发
OpenClaw 10 天冲上 GitHub 全球 Top 10,超越 Linux 内核 Star 增速
Meta 20亿收购 Manus
Meta 以 20 亿美元收购 Manus AI,通用 Agent 赛道正式被巨头锁定
DeepSeek-V3 开源
性价比之王,成本仅 GPT-4 的 5%
Manus 一夜爆火
全球首款通用 AI Agent 在国内社交平台引发空前关注
OpenAI Deep Research
OpenAI 推出深度研究 Agent,一键生成专业研究报告
MCP Server 破 500
MCP 生态爆发,3 个月构建 500+ Server
DeepSeek-R1 震惊全球
开源推理模型,成本仅 OpenAI 的 3%,引发全球 AI 格局震动
MCP 协议诞生
Anthropic 发布 Model Context Protocol,成为 Agent 接口事实标准
Claude Computer Use
Anthropic 让 AI 首次直接操控电脑屏幕,开创计算机使用新范式
Replit Agent 全栈自动化
自然语言到上线产品,面向非工程师
Cursor ARR 破亿
史上增长最快 SaaS,AI 编程工具新王者
Claude 3.5 登顶 SWE-bench
最强编程 AI,Bug 修复能力达到初级工程师水平
Devin 发布
全球首个自主 AI 软件工程师,能独立完成完整编程任务
重点关注
自动驾驶商业化 2026:Waymo 日均服务 5 万次,特斯拉 FSD 全球推进
Waymo 在 2026 年将服务城市扩展至旧金山、洛杉矶、凤凰城、奥斯丁四城,日均完成 5 万次无人出行服务,安全里程超过 1 亿英里。特斯拉 FSD V13 在美国全量推送,监管认可度显著提升。中国百度 Apollo Go 累计服务次数突破 1000 万次。本文分析自动驾驶商业化的真实进度,距离普通消费者真正能用上还有多远。
2026 年 AI 创业生态全景:100 家值得关注的 AI 新星企业
2026 年全球 AI 创业公司超过 5 万家,但真正具有颠覆性的不超过 200 家。本文梳理 AI Agent、具身智能、AI 医疗、AI 法律、AI 教育、AI 安全六大赛道中各 15-20 家最值得关注的初创公司,分析它们的核心技术壁垒、商业模式和融资情况,以及中国 AI 创业公司在全球生态中的定位和机会。
智谱AI市值突破万亿港元,GLM-5.2发布巩固技术领先地位
2026年6月22日,智谱AI(股票代码:XXXX)在港交所收盘报2410.000港元,总市值达1.07万亿港元,成为首家以AI原生身份在二级市场实现万亿市值的中国公司。自1月8日以116.20港元发行上市以来,股价累计涨幅接近20倍。 ## 员工造富效应 根据招股书,截至2025年6月末,公司总股本4.46亿股,452名员工通过持股平台持有51.2%股份,对应市值约1789亿港元,人均账面财富约4亿港元。创始团队中,首席科学家唐杰直接持股6.1%,市值约652亿港元;联合创始人李涓子持股0.76%,市值约81亿港元;董事长刘德兵持股0.21%,市值约22亿港元;CEO张鹏持股0.09%,市值约10亿港元;联合创始人许斌持股0.18%,市值约19亿港元。五位清华系创始人直接持股合计近800亿港元。 ## 技术突破:GLM-5.2发布 同日,智谱发布旗舰模型GLM-5.2,核心升级包括: - **1M上下文窗口**:采用IndexShare架构,每4层共享索引器,单token计算量降低2.9倍;优化MTP推测解码,接受长度提升20%。 - **基准测试表现**:在长时序软件工程基准FrontierSWE、PostTrainBench、SWE-Marathon中均为开源模型第一,仅小幅落后闭源Opus 4.8,全面超越GPT-5.5、Gemini 3.1 Pro;常规代码基准Terminal-Bench 2.1得分81.0(GLM-5.1为63.5),SWE-bench Pro得分62.1(GLM-5.1为58.4)。 - **网页设计能力**:在Design Arena单轮HTML设计榜单中超越Claude Fable 5、Opus系列等闭源模型,排名第一。模型参数744B,无视觉模块,百万Token输入/输出定价1.4/4.4美元,远低于Fable 5的10/50美元。 - **开源协议**:采用MIT许可证,权重开放,支持vLLM、SGLang等本地推理框架。 ## 市场与行业影响 摩根大通重申“增持”评级,认为智谱正复制Palantir路径,以政府和大企业合同构建AI基础设施护城河。GLM-5.2的发布进一步巩固了其技术领先地位,并证明开源模型可在多项基准上超越闭源方案,大幅降低AI开发门槛。
Anthropic发布Claude Code调教指南:七种自定义机制详解
Anthropic 官方博客发布了一份 Claude Code 调教指南,详细介绍了七种自定义机制,帮助开发者精确控制 AI 助手的行为。这七种机制包括 CLAUDE.md 文件、rules(规则)、skills(技能)、subagents(子代理)、hooks(钩子)、output styles(输出风格)和 append-system-prompt(追加系统提示)。指南从加载时机、上下文开销和执行权限三个维度进行了分类,并提供了具体的使用建议。 ## 七种机制概览 Anthropic 将七种机制整理成一张总览表,每种机制对应三个核心维度:指令何时进入上下文、长会话压缩后是否保留、权限大小。这些机制并非互斥,而是分工明确的工具箱。 - **CLAUDE.md**:放在项目根目录的 Markdown 文件,会话开始即加载并常驻。适合构建命令、目录布局、编码规范等全局性指令。建议控制在 200 行以内,并指定负责人审查变更。 - **rules**:放在 `.claude/rules/` 目录下,提供具体约束。与 CLAUDE.md 的主要区别在于路径控制能力,可通过 `paths` 字段限定加载时机,避免无关会话浪费 token。 - **skills**:放在 `.claude/skills/` 目录下,是文件夹形式的指令、脚本和资源集合。会话开始时只加载名称和描述,主体在调用时才加载。适合流程性指令,如部署工作流、代码审查流程。 - **subagents**:放在 `.claude/agents/` 目录下,定义用于特定副任务的隔离助手。主体在独立上下文窗口中运行,不会进入主对话。适合深度搜索、日志分析等可能塞满上下文的副任务。 - **hooks**:用户定义的命令、HTTP 端点或 LLM prompt,在生命周期事件触发时提供确定性控制。上下文开销低,配置在主上下文窗口之外。 - **output styles** 和 **append-system-prompt**:用于控制输出格式和追加系统提示,具体细节在指南中进一步阐述。 ## 选择机制的核心原则 Anthropic 强调,选择机制时需考虑三个问题:指令是否需要在长会话压缩后保留?是否值得为它支付常驻上下文的成本?是否需要确定性而非模型自主判断? - 对于常驻需求,使用 CLAUDE.md 或全局 rules。 - 对于路径限定需求,使用带 `paths` 的 rules 或子目录 CLAUDE.md。 - 对于流程性指令,使用 skills 而非 CLAUDE.md,以节省上下文。 - 对于隔离性副任务,使用 subagents 避免主对话被中间结果塞满。 - 对于确定性控制,使用 hooks 实现精确行为。 ## 实际应用建议 指南还提供了避坑建议: - CLAUDE.md 应保持精简,团队专属约定应挪到路径限定 rules 中,流程性内容挪到 skills 中。 - 在 monorepo 中,为每个团队目录配置子目录 CLAUDE.md,避免全局加载。 - 组织级标准可通过 MDM 或配置管理工具统一部署。 - 使用 subagents 时,支持最多五层嵌套,可编排几十到几百个后台 agent,适合大规模任务如依赖审计。 ## 其他动态 同日,Anthropic 还宣布 Claude Cowork 所有付费用户的使用限额翻倍(持续一个月),并发布了一本 23 页的产品指南,涵盖 7 个工作场景。Cowork 与聊天 AI 不同,它运行在桌面端,可本地文件读写、通过 MCP 连接外部服务,并支持子 Agent 并行处理。Anthropic 数据显示,律师是 Cowork 最活跃的用户群体之一,因其擅长合同审查、条款比对等重复性工作。
Claude Code之父删除IDE,转向“循环工程”:提示词未死,但范式已变
Claude Code的创建者Boris Cherny于2025年11月删除了自己的IDE,并在2026年6月2日的访谈中宣布不再编写提示词,转而专注于设计让AI自主运行的循环(loop)。随后,OpenAI的Peter Steinberger和Google的Addy Osmani分别呼应,Osmani将这一新范式命名为“循环工程”(Loop Engineering)。 ## 核心转变:从提示词工程到循环工程 过去两年,开发者与AI编程智能体的交互是回合制的:人写提示词、读回复、再写下一句。循环工程则要求开发者构建一套自动化系统,让AI自主发现任务、分配执行、检查进度并决定下一步。Osmani比喻为“从操作机床变为设计整条产线”。 ## 循环工程的关键组件 Osmani在博客中列出了循环的六大组件: - **自动化(Automations)**:定时触发,自动发现和分诊任务。 - **隔离工作区(Worktrees)**:使用git worktree防止多个智能体冲突。 - **技能(Skills)**:将项目惯例写入SKILL.md,避免智能体重复学习。 - **连接器(Connectors)**:基于MCP协议,让智能体访问issue、数据库、Slack等。 - **子智能体(Sub-agents)**:分离代码编写与审查,避免自我评价偏差。 - **记忆(Memory)**:用Markdown文件记录进度,确保连续性。 ## 实践案例:Boris的“蜂巢”系统 开发者@Av1dlive根据Boris的公开访谈,重建了名为“蜂巢”(THE HIVE)的三层系统: - **第一层**:本地循环(/loop),最小1分钟一次,会话级。 - **第二层**:云端例程(Routines),最小1小时一次,关机后仍运行。 - **第三层**:集群(/batch),并行运行数百个子智能体,互不干扰。 组合使用时,云端例程发现任务并写入文件,本地循环读取并执行,大任务则拉起集群。结果每周被蒸馏更新到CLAUDE.md,使智能体持续进化。 ## 提示词并未消亡 循环工程并未淘汰提示词,而是将其嵌入循环中。Claude Code的/loop和/goal命令以及Codex的/goal和Automations,都要求开发者编写提示词作为循环的指令。提示词从一次性输入变为可复用的循环组件,其价值反而提升。 ## 挑战与争议 循环工程面临三大挑战: 1. **成本**:多智能体并行消耗大量token,Steinberger自嘲拥有“无限token”是OpenAI员工福利。 2. **失控**:Anthropic指出循环易出现偷懒、自夸、漂移等问题,需分离“制造者”与“检查者”。 3. **质疑**:部分开发者认为循环工程本质是ReAct、AutoGPT等旧概念的包装,并非全新范式。 ## 行业影响 Codex与Claude Code在循环组件上高度趋同,竞争焦点转向如何让用户更便捷地编写循环。循环工程被视为AI编程范式迁移的中心,可能标志着编辑器时代的落幕。
百度开源Unlimited-OCR:常数KV cache实现长文档端到端解析,OmniDocBench刷新SOTA
百度近日开源Unlimited-OCR模型,总参数量3B(激活500M),在OmniDocBench v1.6上以93.92%的综合得分刷新端到端OCR SOTA。该模型核心创新是参考滑动窗口注意力(R-SWA),将解码器KV cache从线性增长压缩为常数,使得单次前向推理可转录数十页文档,且延迟和显存占用不随输出长度增加。 ## 技术核心:R-SWA与DeepEncoder - **R-SWA机制**:每个生成token同时关注全部参考token(视觉token和提示词)以及最近输出的128个token,视觉token不参与状态更新,避免特征退化。KV cache大小恒定为参考段长度加滑动窗口宽度,不随序列增长。 - **DeepEncoder**:沿用DeepSeek-OCR的编码器,将1024×1024 PDF图像压缩为256个视觉token(16倍压缩),支持Base(固定分辨率)和Gundam(动态分辨率)两种模式。 - **模型架构**:3B总参MoE,500M激活参数,所有注意力层替换为R-SWA。基于DeepSeek-OCR checkpoint续训4000步,使用200万OCR样本(单页:多页=9:1),多页样本随机生成2-50页,序列长度32K。 ## 性能表现:全面SOTA - **OmniDocBench v1.5**:总分93.23%,较DeepSeek-OCR(87.01%)提升6.22个百分点。文本编辑距离从0.073降至0.038,公式CDM从83.37升至92.61,表格TEDS从84.97升至90.93,阅读顺序编辑距离从0.086降至0.045。 - **OmniDocBench v1.6**:总分93.92%,端到端SOTA。 - **长文档测试**:20页文档编辑距离0.0572,40+页编辑距离0.1069(Distinct-35达96.90%)。团队指出40+页错误主要源于DeepEncoder多页模式分辨率限制,而非R-SWA问题。 - **效率**:OmniDocBench上TPS达5580(DeepSeek-OCR为4951),输出6144 token时TPS为7847(DeepSeek-OCR为5822),优势随输出长度扩大。 ## 开源与影响 - 模型权重和代码已开源至GitHub和HuggingFace。 - R-SWA被设计为通用解码方案,可应用于ASR、翻译等长输出任务,团队计划下一步迁移验证。 - 论文技术总监署名“YY”,业界推测为前DeepSeek OCR核心作者魏浩然(已离职),其曾主导GOT-OCR2.0和DeepSeek-OCR系列。 - 百度PaddleOCR的产业基础与前沿研究结合,有望推动OCR从单页识别向整本书理解演进。
Midjourney 推出浴池全身扫描仪:60 秒生成亚毫米级 3D 人体模型
AI 绘画公司 Midjourney 于 2025 年 5 月宣布成立 Midjourney Medical 部门,并发布一款名为 Midjourney Scanner 的全身超声波扫描仪。该设备将 50 万个微型声学换能器集成在浴池中,用户浸泡在温水中 60 秒即可完成全身扫描,生成精度达 0.5 毫米的 3D 人体全息模型,包含血管、骨骼、肌肉及实时血流信息。扫描速度比传统 MRI 快近 100 倍,且无辐射。 ## 技术原理 - **硬件**:扫描仪由约 50 万个微型换能器组成环形阵列,每个单元兼具扬声器和麦克风功能,每秒发出数百万次超声波并记录回波。 - **数据量**:每秒产生数 TB 数据,相当于 500 小时高清视频。 - **算力**:配备 21 台服务器,算力达 4 Petaflops,利用 Midjourney 的扩散模型算法将声波形变数据重建为高清人体结构。 - **AI 处理**:对原始图像进行语义分割,标注腹直肌、血管、骨骼等解剖结构,最终拼合成全身 3D 地图。 ## 落地路径 - **2027 年**:首家 Midjourney Spa 旗舰店在旧金山开业,用户可在泡澡、桑拿等放松过程中完成扫描,扫描结果作为身体成分图谱提供。 - **2028 年**:推出第三代扫描仪,采用定制芯片,提升成像质量和速度。 - **2031 年目标**:全球部署超过 5 万台扫描仪,实现每月 10 亿次扫描。 - **监管策略**:初期仅提供身体成分信息,逐步申请更高级别的诊断能力批准。 ## 影响与争议 - **医疗潜力**:Midjourney 声称,若早期影像干预大规模普及,可避免全球 30% 的死亡,削减 50% 的医疗成本。 - **行业反应**:消息引发硅谷震动,马斯克点赞。部分放射科医生认为,若能高保真捕捉实时生理变化,将颠覆血管及血流成像技术。 - **争议点**:设备尚未获得 FDA 等监管机构批准,诊断能力有限;大规模部署涉及隐私、数据安全及伦理问题。
谷歌48小时内连失两位AI核心科学家:Noam Shazeer与John Jumper分别加盟OpenAI和Anthropic
2026年6月,谷歌DeepMind在48小时内连续失去两位重量级AI科学家。6月17日,Gemini联合负责人、Transformer论文作者Noam Shazeer宣布离职并加入OpenAI;6月19日,诺贝尔化学奖得主、AlphaFold之父John Jumper宣布转投Anthropic。 ## 事件背景 - **Noam Shazeer**:Transformer论文《Attention Is All You Need》作者之一。2021年离开谷歌创办Character.AI,2024年谷歌以约27亿美元将其与团队重新带回。不到两年后再次离职,加入OpenAI。OpenAI CEO Sam Altman称Shazeer是“从创立之初最想合作的人之一”。 - **John Jumper**:谷歌DeepMind资深研究员,2024年与Demis Hassabis共同获得诺贝尔化学奖。他领导的AlphaFold已预测超2亿种蛋白质结构,对生物学和药物研发影响深远。Jumper还是谷歌AI编程开发团队核心成员。 ## 离职原因分析 - **大公司病**:多位评论指出,谷歌内部官僚主义严重,计算资源内耗(如原Google Brain与DeepMind融合中的资源争夺),跨部门协同繁琐。Transformer作者之一Llion Jones曾表示“官僚体系让我感觉什么事都推进不了”。 - **战略分歧**:谷歌领导层对Scaling Law缺乏绝对信仰,曾将TPU算力卖给竞争对手Anthropic。谷歌试图面面俱到,缺乏初创公司“All in LLM”的专注度。 - **激励机制**:前员工指出,谷歌内部鼓励造新项目以获取晋升,导致产品重复(如多个AI编程工具),维护现有产品缺乏价值。 - **薪酬与期权**:OpenAI和Anthropi临近IPO,Pre-IPO股票期权对顶级人才吸引力巨大,成熟上市公司难以抗衡。 ## 影响与行业反应 - **对谷歌的打击**:Shazeer的离开使Gemini未来蒙上不确定性,有员工称“他救了Gemini”。Jumper的离职则加剧了谷歌在AI编程工具和AI for Science领域的竞争压力。分析师Gil Luria表示,前沿AI实验室愿意不惜代价招揽人才,OpenAI和Anthropic因更少官僚作风而占优。 - **Anthropic的布局**:Jumper加入Anthropic,标志着其从大语言模型向AI for Science领域扩展。此前Anthropic已收购生物AI公司Coefficient Bio,并推出Claude for Life Sciences。此举可能直接与谷歌旗下Isomorphic Labs竞争。 - **行业趋势**:硅谷风投SignalFire数据显示,Anthropic两年员工留存率高达80%。网友评论“过去的12个月完全属于Anthropic”,其团队已吸纳多位顶级人才。 ## 数据与现状 - 谷歌Gemini 3.5 Pro多次跳票,公开榜单显示Gemini 3.1 Pro得分约46分,落后于Anthropic的Claude Fable 5(64.9分)和中国开源模型GLM-5.2(51分)。 - 内部员工透露,团队对模型能力掉至“第三甚至第四”感到沮丧,并称“不能怪Noam离开,他不会是最后一个”。
Midjourney 发布全身超声波扫描浴缸,60秒生成亚毫米级3D身体地图
AI 绘画公司 Midjourney 正式进军医疗领域,成立 Midjourney Medical 部门,并发布一款名为 Midjourney Scanner 的全身超声波扫描仪。该设备集成约 50 万个微型声学换能器,用户只需在金色温水中浸泡 60 秒,即可生成精度达亚毫米级的全身 3D 解剖模型,速度比传统 MRI 快近 100 倍。 ## 工作原理 扫描仪采用超声波回声定位技术,用户站上升降平台,以每秒 5 厘米的速度缓慢浸入水中。环形排列的 50 万个换能器(每个约沙粒大小)同时发出并接收超声波,每秒产生数 TB 数据(相当于 500 小时高清视频)。系统通过分析声波穿过不同组织(皮肤、脂肪、肌肉、骨骼)时的波形变化,反推出内部结构,再经 AI 语义分割标注具体解剖部位(如腹直肌、肠系膜血管等),最终合成完整 3D 地图。 ## 算力与硬件 为处理海量数据,扫描仪配备 21 台服务器,总算力达 4 Petaflops。Midjourney 利用其在图像生成领域的扩散模型算法,将声波数据“渲染”为高精度人体图像。水作为最佳声波导体,实现了无死角扫描。 ## 落地计划 Midjourney 不直接销售设备,而是通过开设“Midjourney Spa”提供体验服务。首家旗舰店计划于 2027 年在旧金山开业,用户可在泡澡、桑拿等放松过程中完成扫描。未来 12 个月将迭代硬件并建设内部研究型 Spa;2028 年推出第三代定制芯片扫描仪;长期目标是在 2031 年前全球部署 5 万台设备,实现每月 10 亿次扫描。 ## 监管与愿景 当前阶段,扫描仪仅提供身体成分图谱,后续将逐步申请更高级别的诊断能力批准。Midjourney 认为,大规模早期低成本扫描可帮助避免全球 30% 的死亡,并削减 50% 的医疗支出。马斯克已对此项目表示关注。
北京AI工厂项目启动:目标10万P算力与10万亿Token日产能
2026年4月,九章云极在2026全球智算科技峰会暨战略发布会上正式推出“AI工厂”战略,旨在通过标准化、工业化的方式解决大模型从研发到产业落地的工程鸿沟。该项目包含两大核心设施:训练工厂和Token工厂。训练工厂目标算力规模达10万P,通过强化学习等技术将通用大模型“冶炼”为金融、制造、政务等行业的专业模型;Token工厂目标日均产能10万亿Token,将专业模型封装为企业可调用、可计量的智能服务。九章云极还首创“一度算力”(DCU)计量单位(312 TFlops×小时),使算力采购像用电一样按度付费。AI工厂计划实现1000倍综合降本,孵化1000个高价值模型与应用。 ## 背景:从算力竞赛到工业化生产 截至2026年3月,中国日均Token调用量已突破140万亿,两年增长超千倍,但企业普遍面临“模型会回答但不会执行”的困境。通用大模型在聊天场景表现优异,但在复杂业务流程(如审批、质检)中频繁出错。九章云极创始人方磊指出,智能竞争的核心已从技术卓越转向生产力工业化,AI工厂正是为解决这一矛盾而生。 ## 关键细节:AI工厂的运转机制 AI工厂由四个关键环节构成闭环: - **投入侧**:首创“一度算力”(DCU),将异构GPU、NPU、网络、存储等资源统一折算为312 TFlops×小时,客户按度付费,实现算力采购标准化。 - **生产侧**:训练工厂通过五项工程能力(弹性算力、混合调度、网络优化、存储优化、多租户排队)和强化学习训练栈(支持PPO、DPO、GRPO等算法),将通用模型“冶炼”为专业模型。训练工厂已通过中国信通院标准评测,训练效率提升100%,GPU利用率提升50%。 - **封装侧**:Token工厂将专业模型封装为可调用、可计量、可运营的专业Token,分为消费级、专业级、前沿级三层,其中专业级Token面向金融风控、质量检测等场景,提供确定的ROI。 - **产出侧**:企业消费Token后回流业务数据,驱动模型持续迭代,形成“越用越强,越强越便宜”的飞轮。 ## 各方反应与数据 - **行业痛点**:传统企业AI建设周期长达6-12个月,需自建集群、运维团队,前期资本开支高昂。AI工厂模式下,企业可从训练或推理任意环节切入:大模型公司从训练工厂开始,行业客户从Token工厂直接调用服务,最快两周完成概念验证。 - **技术验证**:九章云极已率先通过中国信通院“大模型计算资源调度平台”标准评测,81项能力评估全覆盖。 - **市场数据**:截至2026年3月,中国日均Token调用量超140万亿,但亚马逊等企业发现Token用量激增并未带来效率提升,凸显专业Token的必要性。 ## 影响与展望 AI工厂的推出标志着智算云商业逻辑的转变:从单纯提供算力转向交付可量化的智能。九章云极定位在应用层上游,为ISV、集成商和企业提供底层智能生产与交付体系。若目标达成,10万P算力和10万亿Token日产能将大幅降低企业AI应用门槛,推动产业智能化加速。不过,强化学习的大规模工业化仍面临万卡集群稳定性、奖励函数自动化等工程挑战,九章云极的训练工厂能否持续兑现承诺,有待市场检验。
诺奖得主John Jumper离职谷歌DeepMind,加入Anthropic
2026年6月19日,2024年诺贝尔化学奖得主、AlphaFold核心领导者John Jumper宣布离开效力近九年的谷歌DeepMind,加入AI公司Anthropic。此前两天,Transformer论文作者之一、Gemini联合负责人Noam Shazeer也离职加入OpenAI。谷歌在48小时内连续失去两位顶级AI科学家,引发行业震动。 ## 事件经过 John Jumper在X平台发文确认离职,称将先休整一段时间后正式加入Anthropic。他感谢DeepMind CEO Demis Hassabis在其博士毕业仅6个月时委以重任,领导AlphaFold团队。Hassabis随即回应,肯定两人九年的合作,称AlphaFold“改变了世界”。Anthropic证实Jumper即将加盟,但未披露具体职位。 ## 人才流失背景 Jumper的离职并非孤立事件。两天前,Noam Shazeer——Transformer论文核心作者、谷歌曾斥资约27亿美元从Character.AI请回的Gemini联合负责人——宣布加入OpenAI。过去一年,谷歌DeepMind还流失了AlphaGo/AlphaZero主导者David Silver(创业)、Gemini推理技术核心负责人等。据不完全统计,过去8年超过20位顶级研究者离开DeepMind/Brain。 ## 深层原因分析 多位业内人士指出,谷歌面临“大公司病”困境: - **组织官僚化**:内部计算资源争夺激烈,跨部门协同低效。Transformer作者之一Llion Jones曾表示“官僚体系让我感觉什么事都推进不了”。 - **战略分歧**:谷歌试图面面俱到,缺乏初创公司“All in LLM”的专注度。有报道称,谷歌曾将珍贵TPU算力租给竞争对手Anthropic。 - **激励机制**:内部鼓励造新产品而非维护现有产品,导致产品线混乱(如多个AI编程工具并行)。 - **薪酬竞争**:OpenAI和Anthropi临近IPO,Pre-IPO股票期权对顶级人才吸引力巨大。 ## 行业影响 Jumper加入Anthropic,标志着AI for Science赛道进入新阶段。Anthropic此前已斥资4亿美元收购生物AI公司Coefficient Bio,并推出Claude for Life Sciences。Jumper的加盟将补齐其AI+生物短板,与DeepMind旗下Isomorphic Labs形成直接竞争。 OpenAI同样在生命科学领域布局,今年4月发布生物医学推理模型GPT-Rosalind,并与多家药企合作。三家前沿AI实验室正将竞争焦点从语言模型扩展至生命科学。 ## 谷歌困境 谷歌模型竞争力下滑明显。在Artificial Analysis智能指数榜单上,其最强模型Gemini 3.1 Pro仅排名第五,落后于Anthropic、OpenAI及中国智谱AI。被寄予厚望的Gemini 3.5 Pro一再跳票,内部员工透露团队弥漫挫败感,有员工直言“不能怪Noam离开,他不会是最后一个”。